全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210947675.1 (22)申请日 2022.08.09 (71)申请人 北京至真互联网技 术有限公司 地址 102200 北京市昌平区回龙观镇龙域 中街1号院1号楼7层1单 元709、 707 (72)发明人 代黎明 张冬冬 杨洋  (74)专利代理 机构 北京高沃 律师事务所 1 1569 专利代理师 万慧华 (51)Int.Cl. G16H 50/20(2018.01) G16H 10/60(2018.01) G06F 16/36(2019.01) G06F 40/295(2020.01) (54)发明名称 一种糖尿病视网膜病变 辅助筛查系统 (57)摘要 本发明公开一种糖尿病视网膜病变辅助筛 查系统, 涉及数据处理技术领域, 系统包括: 数据 处理模块用于对患者病历数据依次进行文本标 准化处理和文本抽取处理, 以得到多元结构化数 据组; 知识图谱构建模块用于构建糖尿病视网膜 病变规则知识图谱; 病变确定模块用于将多元结 构化数据组与糖尿病视网膜病变规则知识图谱 中的多组案例信息分别进行相似度计算, 以确定 最大数据相似值; 结果确定模块用于: 当最大数 据相似值小于设定阈值时, 对多元结构化数据组 进行标记; 当最大数据相似值大于或等于设定阈 值时, 将最大数据相似值对应的案例信息确定为 筛查结果。 本发 明能够根据病历信息高效精准地 实现对糖 尿病视网膜病变的筛查。 权利要求书2页 说明书13页 附图3页 CN 115312186 A 2022.11.08 CN 115312186 A 1.一种糖尿病视网膜病变辅助筛查系统, 其特 征在于, 所述系统包括: 数据处理模块, 用于对患者病历数据依次进行文本标准化处理和文本抽取处理, 以得 到多元结构化数据 组; 所述患者病历数据包括患者症状体征、 现病史、 既往病史、 实验室检 查结果和影像学检查结果; 所述多元结构化数据组包括与所述患者病历数据对应的文字实 体、 不同文字实体之间的文字关系以及所述文字实体对应的文字属性; 知识图谱构建模块, 用于构建糖尿病视网膜病变规则知识图谱; 所述糖尿病视网膜病 变规则知识图谱包括多组案例 信息; 每组所述案例 信息包括病变名称、 病变症状体征、 病变 的实验室检查数据、 病变的影 像学检查数据、 治疗药品和食 谱护理; 病变确定模块, 分别与所述数据处理模块和所述知识图谱构建模块连接, 用于将所述 多元结构化数据组与所述糖尿病视网膜病变规则知识图谱中的多组案例信息分别进行相 似度计算, 以确定最大 数据相似值; 结果确定模块, 与所述病变确定模块连接, 用于: 判断所述 最大数据相似值是否小于设定阈值; 当所述最大数据相似值小于设定阈值时, 对所述多元 结构化数据组进行 标记; 当所述最大数据相似值大于或等于设定 阈值时, 将所述最大数据相似值对应的案例信 息确定为筛查结果。 2.根据权利要求1所述的糖尿病视网膜病变辅助筛查系统, 其特征在于, 所述数据处理 模块, 具体包括: 标准化统一子模块, 用于根据预设数据库对所述患者病历数据进行词映射和词义消 歧, 以得到标准文本数据组; 文本提取子模块, 用于将所述标准文本数据组输入至 中文命名实体识别混合模型中进 行文本提取, 以得到多元结构化数据 组; 所述中文命名实体识别 混合模型是采用训练集对 深度学习BiLSTM ‑CRF模型进行训练得到的; 所述深度学习BiLSTM ‑CRF模型包括依次连接的 BiLSTM层和CRF层; 所述训练集包括多个样 本数据; 每个所述样 本数据包括历史患者病历数 据和标签信息; 所述标签信息为所述历史患者病历数据对应的词向量; 所述词向量包括文 字实体向量、 文字属性向量和文字关系向量。 3.根据权利要求2所述的糖尿病视网膜病变辅助筛查系统, 其特征在于, 在中文命名实 体识别混合模型的训练方面, 所述文本提取子模块具体包括: 训练集获取 单元, 用于获取多个样本数据; 模型训练单元, 用于将多个样本数据输入至深度学习BiLSTM ‑CRF模型进行训练, 以得 到最优的深度学习BiLSTM ‑CRF模型; 所述最优的深度学习BiLSTM ‑CRF模型为中文命名实体 识别混合模 型; 其中, 所述BiLSTM层用于对 所述历史患者病历数据进行双向编码, 计算所述 历史患者病历数据中的文字实体、 文字关系和文字属 性被标注为标签信息的概率, 以得到 所述历史患者病历数据对应的预测标签组; 所述CRF层用于对所述预测标签组添加约束条 件, 以得到最优预测标签组; 所述 最优预测标签组为所述多元 结构化数据组。 4.根据权利要求2所述的糖尿病视网膜病变辅助筛查系统, 其特征在于, 在训练集的构 建方面, 所述文本提取子模块还 包括: 初始数据获取 单元, 用于获取多个历史患者病历数据; 分词单元, 用于基于jieba分词库, 对每个所述历史患者病历数据进行字符划分, 以得权 利 要 求 书 1/2 页 2 CN 115312186 A 2到分词文本; 标注单元, 用于采用BIO标注法对所述分词文本进行标注, 以得到标注文本; 所述标注 文本包括文字实体、 文字关系和文字属性; 词嵌入单 元, 用于采用w ord2vec方法将所述标注文本转换为词向量。 5.根据权利要求1所述的糖尿病视网膜病变辅助筛查系统, 其特征在于, 所述病变确定 模块, 具体包括: 相似度计算子模块, 用于根据公式 计算数据相似值; 其中, Sim(V1,V2)表示第一实体V1与第二实体V2的数据相 似值; 所述第一实体V1为多元 结构化数据组, 所述第二实体V2为糖尿病视网膜病变规则知识图谱中的任一组案例信息; Vn1表示第一实体的文 字属性向量, Vn2表示第二实体的文 字属性向量; Vγ1表示第一实体的文 字关系向量, Vγ2表示第二实体的文字关系向量; γ表示文字属性向量与文字关系向量的权 值分配; 其中, C1和C2均表示变量, 当C1为Vn1时, C2为Vn2; 当C1为Vγ1时, C2为Vγ2; i表示自变量常 数, C表示矢量的维度; 最大值确定 子模块, 用于根据多个数据相似值确定出最大 数据相似值。 6.根据权利要求1所述的糖尿病视网膜病变辅助筛查系统, 其特征在于, 所述糖尿病视 网膜病变辅助筛查系统, 还 包括: 案例新增模块, 用于获取标记的所述多元结构化数据组对应的案例信息, 并将标记的 所述多元 结构化数据组对应的案例信息存 储至所述糖尿病视网膜病变规则知识图谱。 7.根据权利要求1所述的糖尿病视网膜病变辅助筛查系统, 其特征在于, 所述知识图谱 构建模块, 具体包括: 数据采集模块, 用于从第三方 数据库中采集多组案例信息; 知识图谱构建模块, 用于根据所述案例信息建立SPO三元组, 并依据多个所述SPO三元 组构建糖尿病视网膜病变规则知识图谱。 8.根据权利要求1所述的糖尿病视网膜病变辅助筛查系统, 其特征在于, 所述糖尿病视 网膜病变辅助筛查系统, 还 包括: 文本链接模块, 分别与所述数据处理模块和所述知识图谱构建模块连接, 用于对所述 多元结构化数据组和所述糖尿病视网膜病变规则知识图谱中的案例信息进 行实体链接, 以 实现所述多元 结构化数据组与任一所述案例信息的关联映射。权 利 要 求 书 2/2 页 3 CN 115312186 A 3

.PDF文档 专利 一种糖尿病视网膜病变辅助筛查系统

文档预览
中文文档 19 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种糖尿病视网膜病变辅助筛查系统 第 1 页 专利 一种糖尿病视网膜病变辅助筛查系统 第 2 页 专利 一种糖尿病视网膜病变辅助筛查系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-17 23:40:40上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。