全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 20221041409 9.4 (22)申请日 2022.04.19 (71)申请人 同方知网数字出版技 术股份有限公 司 地址 100192 北京市海淀区西小口路6 6号 东升科技园B2 楼 申请人 同方知网 (北京) 技 术有限公司 (72)发明人 杨永秀 段飞虎 印东敏 吕强  宿鹏 张敏敏 顾君 张宏伟  (74)专利代理 机构 北京天奇智新知识产权代理 有限公司 1 1340 专利代理师 陈新胜 (51)Int.Cl. G06F 16/36(2019.01) G06F 16/31(2019.01)G06F 40/242(2020.01) G06F 40/216(2020.01) G06N 3/04(2006.01) (54)发明名称 一种面向知识图谱构建的人物简历解析方 法 (57)摘要 本发明公开了一种面向知识图谱构建的人 物简历解析方法, 包括获取不同领域的人物简历 数据; 搭建面向知识图谱构建的人物简历信息提 取模型; 构建人物在不同领域职务表; 利用词典 及模型对简历信息进行识别; 根据信息标注结果 以搭建人物知识 图所需的数据结构为导向对人 物信息进行聚合。 本发明面向人物知识图谱的构 建, 设计一套非结构化人物简历文本自动解析方 法, 能够快速将简历文本解析成构建人物图谱所 需的格式。 权利要求书2页 说明书6页 附图2页 CN 114780744 A 2022.07.22 CN 114780744 A 1.一种面向知识图谱构建的人物简 历解析方法, 其特 征在于, 包括 A、 获取不同领域的人物简 历数据; B、 构建适用于人物知识图谱搭建的简 历信息提取模型; C、 构建人物在不同领域职务表; D、 利用词典及模型对简 历信息进行识别; E、 以搭建人物图谱所需数据结构为 导向对简 历信息进行聚合。 2.如权利要求1所述的面向知识图谱构建的人物简历解析方法, 其特征在于, 所述B中 通过BILSTM+CRF对简历文本进行序列标注, 通过标签之间的匹配得到简历中的单粒度信 息。 3.如权利要求2所述的面向知识图谱构建的人物简历解析方法, 其特征在于, 具体包 括: 对于给定一条非结构化文本序列: X=(X1,X2,X3...Xn)         (1) 假设其所对应的标签序列即网络 输出的目标序列为: y=(y1,y2,y3...yn)          (2) 则双向LSTM层的输出分值由以下公式得 出: 其中, A代表转移分数矩阵, P代表双向LSTM层输出的分数矩阵; 对于给定的文本序列X, 整个网络得到的目标序列y的概 率为: 其中, YX代表句子X的所有可能标签序列, 在训练过程中使得正确序列的对数概率最大 化: 最后根据式(6)进行解码得到最终的预测标签: 4.如权利要求1所述的面向知识图谱构建的人物简历解析方法, 其特征在于, 所述C 中, 针对不同领域简 历建立领域职务表具体包括: 从领域机构职位表中提取文中字段, 去掉英文并按照换 行符切分得到职位列表; 对职位列表数据进行清洗, 并通过构建的领域人物信 息识别模型识别职位列表中包含 的组织机构名称, 提取组织机构名称后的文字作为 新的职务信息; 对职位列表进行扩充, 通过历年领域职位表提取相应职位, 加入职位列表, 并对职位列 表进行去重存 储。 5.如权利要求1所述的面向知识图谱构建的人物简历解析方法, 其特征在于, 所述E具权 利 要 求 书 1/2 页 2 CN 114780744 A 2体包括: E1提取人物知识图谱构建所需的任务基本信息; E2提取人物知识图谱构建所需的人物个人相关经历信息 。 6.如权利要求5所述的面向知识图谱构建的人物简历解析方法, 其特征在于, 所述E1中 以第一个学习或工作经历相关时间之前的句子作为基本信息句, 提取姓名、 性别、 出生时 间、 籍贯及民族基本信息用以充实人物 节点的相关属性。 7.如权利要求5所述的面向知识图谱构建的人物简历解析方法, 其特征在于, 所述E2具 体包括: 以句号、 分号、 换行符对简历进行分句, 对于每一个句子, 若句内有多个时间信息, 则以 工作时间或学习时间为标志, 对简历进 行子句分割; 若没有或只有一个时间信息, 则该句不 再分割子句; 在每子句内以工作单位及学习单位 为标志作为 一段基本信息共享 块内的时间信息; 若某块内没有时间信息, 则认为该 段个人经历为现阶段 经历。权 利 要 求 书 2/2 页 3 CN 114780744 A 3

.PDF文档 专利 一种面向知识图谱构建的人物简历解析方法

文档预览
中文文档 11 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种面向知识图谱构建的人物简历解析方法 第 1 页 专利 一种面向知识图谱构建的人物简历解析方法 第 2 页 专利 一种面向知识图谱构建的人物简历解析方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 08:55:39上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。