(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211345545.7
(22)申请日 2022.10.31
(71)申请人 河北省科 学院应用数 学研究所
地址 050081 河北省石家庄市友谊南大街
46号1号楼
(72)发明人 孙晓晔 成彬 王程 杨文焕
邵云霞
(74)专利代理 机构 河北国维致远知识产权代理
有限公司 13137
专利代理师 秦春芳
(51)Int.Cl.
G06F 40/205(2020.01)
G06F 40/103(2020.01)
G06F 40/30(2020.01)
G06N 5/02(2006.01)G06F 16/2458(2019.01)
(54)发明名称
病案首页编码 检测及确定方法、 装置及电子
设备
(57)摘要
本申请提供一种病案首页编码检测及确定
方法、 装置及电子设备。 该方法包括: 对国际疾病
分类中所有标准编码对应的疾病描述进行实体
关系抽取; 根据多个历史病案首页中各原始编码
的数量确定常用编码; 对常用编码对应的原始诊
断名称进行规范化处理, 对所有规范诊断名称进
行实体关系抽取, 基于上述实体关系抽取结果构
建知识图谱; 将知识图谱注入训练好的预测模型
中, 得到目标预测模型; 基于目标预测模型对各
待检测诊断名称进行预测, 得到各待检测诊断名
称对应的多个候选编码; 根据各待检测诊断名称
对应的待检测编码和对应的多个候选编码确定
各待检测诊断名称对应的最终编码 。 本申请能够
全面、 快速地检测 和修正病案首页的编码错 误。
权利要求书2页 说明书11页 附图3页
CN 115510845 A
2022.12.23
CN 115510845 A
1.一种病案首页编码检测及确定方法, 其特 征在于, 包括:
对国际疾病分类中所有标准编码对应的疾病 描述进行实体关系抽取, 得到多个第 一三
元组, 根据所述多个第一 三元组和对应的标准编码构建初始知识图谱;
获取多个历史病案首页中的多个原始诊断名称和对应的原始编码, 根据 各原始编码的
数量确定常用编码; 对所述常用编码对应的原始诊断名称进行规范化处理, 得到规范诊断
名称, 对所有规范诊断名称进 行实体关系抽取, 得到多个第二三元组, 基于所述多个第二三
元组和所述初始知识图谱得到知识图谱;
将所述知识图谱注入训练好的预测模型中, 得到目标 预测模型;
获取待检测病案首页中的多个待检测诊断名称和对应的待检测编码; 基于所述目标预
测模型对各待检测诊断名称进行预测, 得到各待检测诊断名称对应的多个候选编码; 根据
各待检测诊断名称对应的待检测编码和对应的所述多个候选编码确定各待检测诊断名称
对应的最终编码。
2.根据权利要求1所述的病案首页编码检测及确定方法, 其特征在于, 所述根据 各原始
编码的数量确定常用编码, 包括:
确定各原 始编码的数量和各原 始编码对应的科室; 每 个所述科室对应预设科室阈值;
若所述原始编码的数量大于该原始编码对应的预设科室阈值, 则确定该原始编码为常
用编码。
3.根据权利要求1所述的病案首页编码检测及确定方法, 其特征在于, 所述对所述常用
编码对应的原始诊断名称进行规范化处理, 得到规范诊断名称, 对所有规范诊断名称进行
实体关系抽取, 得到多个第二 三元组, 包括:
对所述常用编码对应的原 始诊断名称进行规范化处 理, 得到规范诊断名称;
对所述规范诊断名称进行去重处 理;
对去重处 理后的所有规范诊断名称进行语义分析处 理;
对语义分析处 理后的所有规范诊断名称进行实体关系抽取, 得到多个第二 三元组。
4.根据权利要求1所述的病案首页编码检测及确定方法, 其特征在于, 所述将所述知识
图谱注入训练好的预测模型中, 得到目标 预测模型, 包括:
基于TransE算法计算得到所述知识图谱中三元组对应的实体向量;
将所述实体向量嵌入训练好的预测模型中, 得到目标 预测模型。
5.根据权利要求1所述的病案首页编码检测及确定方法, 其特征在于, 所述基于所述目
标预测模型对各待检测诊断名称进行预测, 得到各待检测诊断名称对应的多个候选编码,
包括:
对各待检测诊断名称进行规范化处 理, 得到各规范待检测诊断名称;
基于所述目标预测模型对各规范待检测诊断名称进行预测, 得到各规范待检测诊断名
称对应的多个候选编码。
6.根据权利要求5所述的病案首页编码检测及确定方法, 其特征在于, 所述根据 各待检
测诊断名称对应的待检测编码和对应的所述多个候选编码确定各待检测诊断名称对应的
最终编码, 包括:
对每个所述规范待检测诊断名称, 执 行下述步骤:
基于所述国际疾病分类对规范待检测诊断名称进行检索, 若检索到对应的初始编码,权 利 要 求 书 1/2 页
2
CN 115510845 A
2则将所述初始编码作为 最终编码;
若未检索到对应的初始编码, 则执 行下述步骤:
判断规范待检测诊断名称对应的待检测编码与对应的多个候选编码的任一候选编码
是否一致;
若是, 则确定所述对应的待检测编码为 最终编码;
若否, 则基于国际疾病分类判断所述对应的待检测编码是否与 所述对应的多个候选编
码中的任一 候选编码存在上 下位关系, 若是, 则取 该任一候选编码作为 最终编码。
7.根据权利要求1至6任一项所述的病案首页编码检测及确定方法, 其特征在于, 所述
方法还包括:
根据预设的所述标准编码的优先级标识, 确定待检测病案首页中各待检测诊断名称对
应的最终编码的优先级;
确定优先级最高的最终编码对应的待检测诊断名称为主 要诊断。
8.一种病案首页编码检测及确定装置, 其特 征在于, 包括:
第一构建模块, 用于对国际疾病分类中所有标准编码对应的疾病 描述进行实体关系抽
取, 得到多个第一 三元组, 根据所述多个第一 三元组和对应的标准编码构建初始知识图谱;
第二构建模块, 用于获取多个历史病案首页中的多个原始诊断名称和对应的原始编
码, 根据各原始编码的数量确定常用编码; 对所述常用编码对应的原始诊断名称进行规范
化处理, 得到规范诊断名称, 对所有规范诊断名称进行实体关系抽取, 得到多个第二三元
组, 基于所述多个第二 三元组和所述初始知识图谱得到知识图谱;
第一确定模块, 用于将所述知识图谱注入训练好的预测模型中, 得到目标 预测模型;
第二确定模块, 用于获取待检测病案首页中的多个待检测诊断名称和对应的待检测编
码; 基于所述 目标预测模型对各待检测诊断名称进行预测, 得到各待检测诊断名称对应的
多个候选编 码; 根据各待检测诊断名称对应的待检测 编码和对应的所述多个候选编 码确定
各待检测诊断名称对应的最终编码。
9.一种电子设备, 包括存储器和 处理器, 所述存储器中存储有可在所述处理器上运行
的计算机程序, 其特征在于, 所述处理器执行所述计算机程序时实现如权利要求1至7任一
项所述的病案首页编码检测及确定方法。
10.一种计算机可读存储介质, 所述计算机可读存储介质存储有计算机程序, 其特征在
于, 所述计算机程序被处理器执行时实现如权利要求 1至7任一项 所述的病案首页编 码检测
及确定方法。权 利 要 求 书 2/2 页
3
CN 115510845 A
3
专利 病案首页编码检测及确定方法、装置及电子设备
文档预览
中文文档
17 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:33:24上传分享