全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210354283.4 (22)申请日 2022.04.06 (71)申请人 北京航空航天大 学 地址 100191 北京市海淀区学院路37号 (72)发明人 吴文峻 辛治旻 汪群博 庄予彰  (74)专利代理 机构 北京永创新实专利事务所 11121 专利代理师 易卜 (51)Int.Cl. G06F 16/35(2019.01) G06F 16/36(2019.01) G06F 40/242(2020.01) G06F 40/295(2020.01) G06N 3/04(2006.01) G06N 3/08(2006.01)G16H 50/70(2018.01) (54)发明名称 一种基于患者症状描述文本的疾病分类智 能服务方法 (57)摘要 本发明提出一种基于患者症状描述文本的 疾病分类智 能服务方法, 属于人工智 能领域, 具 体为: 首先, 从现有数据中根据患者症状的描述 语句提取实体, 并标注类型, 作为样本存储到图 形数据库; 然后, 通过生成器, 生成各样本同类型 的新样本并标注, 针对每个新样本, 利用检查器 判断出可用样本加入已标注数据集; 接着依次构 建实体识别微服务, 输入实际患者的症状描述文 本, 输出实体的识别结果; 构建疾病查询微服务, 在图形数据库中查询与实体的识别结果相关的 疾病并排序, 作为候选疾病结果输出; 最后, 构建 用户交互微服务, 将实体识别结果, 候选疾病结 果以及历史健康数据一起打包返给患者; 本发明 降低了运维 成本, 方便后续更新和完 善数据。 权利要求书1页 说明书7页 附图3页 CN 114676258 A 2022.06.28 CN 114676258 A 1.一种基于患者症状描述文本的疾病分类智能服 务方法, 其特 征在于, 具体步骤如下: 首先, 从已有的医疗领域相关数据中提取患者症状的描述语句, 并从语句中提取实体, 标注各实体 类型, 将语句和实体 类型标注结果组成样本, 存 储到NoSQL图形数据库; 然后, 将各样本分别通过生成器, 生成新的样本, 并对应生成新语句以及语句中各实体 的类型标注; 针对样本S生 成的每个新样 本S', 使用包含 可用性规则的检查器逐个计算两者 的最小编辑距离, 得到各新样本的分数, 降序排列后选择 前K个新样本加入已标注数据集; K值根据实际实验数据获取; 接着、 构建实体识别微服务, 利用标注数据集进行训练后, 将实际患 者的症状描述文本 输入实体识别微 服务, 输出实体的识别结果; 构建疾病查询微服务, 根据实际患者的实体识别结果, 在NoSQL图形数据库中查询与实 体相关的疾病并排序, 作为 候选疾病结果输出; 最后、 构建用户交互微服务, 将患者的实体识别结果, 候选疾病结果, 并上患者的历史 健康数据打包返给患者。 2.如权利要求1所述的一种基于患者症状描述文本的疾病分类智能服务方法, 其特征 在于, 所述实体包括医院、 科室、 疾病、 症状和药品; 样本S=<X,Y>; 即样本包括语句X、 和各 实体类型标注结果Y 。 3.如权利要求1所述的一种基于患者症状描述文本的疾病分类智能服务方法, 其特征 在于, 所述生成器是根据原样本中各实体的类型标注, 进行词语替换, 自动生成同等类型的 新样本。 4.如权利要求1所述的一种基于患者症状描述文本的疾病分类智能服务方法, 其特征 在于, 所述实体识别微 服务包括构造AC自动机和搭建Bi LSTM+CRF模型架构作为深度模型; AC自动机使用NoSQL图形数据库的所有实体构造Trie树, 进一步在Trie树上构建失配 指针; 对经过预处理的患者的中文症状描述文本进行关键词匹配, 找到语句中出现的医疗 实体识别结果, 即实体位置、 名称和类型; 深度模型依次包括第一层嵌入层, 将患者输入的实 际描述文本转换成词向量矩阵; 第 二层BiLSTM层, 接收嵌入层输入的词向量矩阵, 通过前向LSTM和反向LSTM得到的两组输出 进行拼接, 然后依次经过dropout层、 ReLU层和omit层, 最终得到输出的特征向量; 第三层 CRF层, 接收BiLSTM层输出的特征向量, 使用CRF模型得到患者输入的实际描述文本中每个 字的实体 类型标注, 进而得到医疗实体识别结果; 最后, 通过实体识别微服务接口, 将AC自动机和深度模型分别得到的实体识别结果合 并; 对识别结果相同的直接合并; 对于识别结果有冲突的, 按照深度模型的置信度进行判 断, 当深度模型 的置信度大于等于阈值, 则 保留深度模型 的结果; 当置信度低于阈值, 则 保 留AC自动机的结果, 作为 最终结果。 5.如权利要求1所述的一种基于患者症状描述文本的疾病分类智能服务方法, 其特征 在于, 所述 候选疾病结果具体获取 过程如下: 首先, 输入实体识别结果, 使用SQ L查询语句在N oSQL图形数据库中进行查询; 然后, 分别提取查询结果中各实体相关疾病对应的症状描述语句结果, 逐一与实 际患 者输入的症状描述文本计算相似度; 最后、 按相似度由高到低顺序依次返回候选疾病名称。权 利 要 求 书 1/1 页 2 CN 114676258 A 2一种基于患者症状描述文本的疾病分类智能服务方 法 技术领域 [0001]本发明涉及人工智能领域, 具体涉及一种基于患者症状描述文本的疾病分类智能 服务方法。 背景技术 [0002]随着我国人口老龄化程度的加剧, 越来越多的人更加 关注自己的健康情况; 但是 我国医疗资源配置并不均衡, 许多病人为了确定自己所患的疾病通常需要花费很大的代 价。 [0003]目前医生大多是通过询问病人所具有的临床症状表现, 并结合专业知识、 临床经 验和医疗器械诊断来判定病人可能患有的疾病; 当所挂科室的医生不擅长临床症状所属的 领域会导致病 人需要重新挂其它 科室或医院的号。 因此, 根据症状描述文本来自动化地推 断病人所患疾病, 可以帮助患者判断选择就诊医院或科室, 极大提高治疗 疾病的效率。 [0004]自动问诊系统将医疗领域知识和计算机科学技术结合, 为患者进行疾病诊断。 为 了实现疾病的自动诊断, 需要利用计算机将疾病和症状进行数据化规范化处理, 同时也需 要挖掘分析症状与疾病的关系, 并利用计算机语言 建模与表达 。 [0005]知识图谱已经成功计算机科学的一个重要分支, 在自然语言处理、 信息检索、 数据 挖掘、 人工智能和大 数据等领域具有重要的应用, 并且得到 了研究者的广泛认同。 [0006]知识图谱使用节点代表实体与概念, 边代表节点间的关系, 进而表示知识之间的 逻辑关系。 利用疾病 数据集构建医疗领域知识图谱, 可以形式化的描述疾病与症状之间存 在的关系, 在医疗领域知识图谱中上层的症状表达了疾病之间的共性, 下层的症状表达了 疾病之间的差异性。 [0007]医生将各类疾病信息在大脑中归纳、 分类、 思考和判断来得到最终结果, 这是一种 心理过程, 与 “人工智能 ”类似, 也属于 “黑箱”过程。 近期, 已有很多方法试图用深度神经网 络描述这一过程。 然而, 训练深度神经网络模型需要 大量的标注数据, 需要耗费大量时间和 人力。 [0008]一种新思路是在实际应用中逐渐积累数据, 模型逐步迭代升级, 又因为模型与知 识图谱、 数据集的耦合度高, 迭代的部署和运行成本高, 阻碍 了其在实际中的应用。 发明内容 [0009]本发明公开了一种基于患者症状描述文本的疾病分类智能服务方法, 基于微服务 框架, 结合AC自动机和深度模型进 行医疗实体识别, 引入 数据增强机制, 实现了面向自然语 言疾病智能识别方法的有效实施, 提高了识别结果准确率, 减少了标注数据需求量, 有效降 低了部署和运行的成本, 对其在集群平台的部署应用有重要意 义。 [0010]所述基于患者症状描述文本的疾病分类智能服 务方法, 分以下步骤: [0011]步骤一、 从已有的医疗领域相关数据中提取患者症状的描述语句, 并从语句中提 取实体, 标注各实体 类型, 将语句和实体 类型标注结果组成样本, 存 储到NoSQL图形数据库;说 明 书 1/7 页 3 CN 114676258 A 3

.PDF文档 专利 一种基于患者症状描述文本的疾病分类智能服务方法

文档预览
中文文档 12 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于患者症状描述文本的疾病分类智能服务方法 第 1 页 专利 一种基于患者症状描述文本的疾病分类智能服务方法 第 2 页 专利 一种基于患者症状描述文本的疾病分类智能服务方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 08:52:25上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。