(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111644033.6
(22)申请日 2021.12.2 9
(71)申请人 北京百度网讯科技有限公司
地址 100085 北京市海淀区上地十街10号
百度大厦2层
(72)发明人 苏昱涵 秦川 申大忠 赵洪科
宋欣 祝恒书
(74)专利代理 机构 北京英赛 嘉华知识产权代理
有限责任公司 1 1204
代理人 王达佐 马晓亚
(51)Int.Cl.
G06F 40/284(2020.01)
G06N 3/08(2006.01)
G06Q 10/06(2012.01)
(54)发明名称
用于处理技能信息的方法、 模 型训练方法及
装置
(57)摘要
本公开提供了用于处理技能信息的方法、 模
型训练方法及装置, 涉及人工智 能技术领域, 具
体为机器学习技术领域。 具体实现方案为: 获取
待考察信息; 基于待考察信息和预先训练完成的
技能词生成模型, 确定至少一个技能词; 输出至
少一个技能词。 本实现方式可以基于技能词进行
技能信息的考 察, 能够提高技能考 察精准度。
权利要求书3页 说明书10页 附图4页
CN 114330333 A
2022.04.12
CN 114330333 A
1.一种用于处 理技能信息的方法, 包括:
获取待考 察信息;
基于所述待考 察信息和预 先训练完成的技能词生成模型, 确定 至少一个技能词;
输出所述至少一个技能词。
2.根据权利要求1所述的方法, 其中, 所述待考察信 息包括待考察岗位信 息和待考察对
象信息。
3.根据权利要求1所述的方法, 其中, 所述输出 所述至少一个技能词, 包括:
基于所述至少一个技能词和 招聘对象信息, 确定目标招聘对象;
向所述目标招聘对象发送所述至少一个技 能词, 以使所述目标招聘对象基于所述至少
一个技能词对待考 察对象进行技能考 察。
4.一种模型训练方法, 包括:
获取样本待考 察信息和考 察结果标注数据;
基于预设的技能词图、 所述样本待考 察信息和待训练模型, 确定 至少一个样本技能词;
基于所述至少一个样本技能词和所述考察结果标注数据, 对所述待训练模型进行训
练, 得到训练完成的技能词生成模型。
5.根据权利要求 4所述的方法, 还 包括:
基于所述样本待考 察信息和所述 考察结果标注数据, 确定所述 技能词图。
6.根据权利要求5所述的方法, 其中, 所述基于所述样本待考察信息, 确定所述技能词
图, 包括:
从所述样本待考 察信息和所述 考察结果标注数据中, 确定各个候选技能词;
基于所述各个候选技能词、 所述样本待考察信息和所述考察结果标注数据, 确定所述
各个候选技能词之间的连接信息;
基于所述各个候选技能词和所述各个候选技能词之间的连接信息, 确定所述技能词
图。
7.根据权利要求6所述的方法, 其中, 所述基于所述各个候选技能词、 所述样本待考察
信息和所述 考察结果标注数据, 确定所述各个候选技能词之间的连接信息, 包括:
基于所述样本待考 察信息和所述 考察结果标注数据, 确定 至少一组样本数据元组;
对于每组样本数据元组, 确定该样本数据元组中的候选技能词之间的连接信息;
基于各组样本数据元组中候选技能词之间的连接信 息, 确定所述各个候选技 能词之间
的连接信息 。
8.根据权利要求4所述的方法, 其中, 所述样本待考察信 息包括待考察岗位样本信 息和
待考察对象样本信息 。
9.根据权利要求4所述的方法, 其中, 所述基于预设的技能词图、 所述样本待考察信息
和待训练模型, 确定 至少一个样本技能词, 包括:
将所述预设的技能词图和所述样本待考 察信息输入所述待训练模型;
基于所述预设的技能词图, 确定标签表征信息;
基于所述预设的技能词图和所述样本待考 察信息, 确定主题 表征信息;
基于所述标签表征信息和所述主题 表征信息, 确定所述至少一个样本技能词。
10.一种用于处 理技能信息的装置, 包括:权 利 要 求 书 1/3 页
2
CN 114330333 A
2信息获取 单元, 被配置成获取待考 察信息;
技能词确定单元, 被配置成基于所述待考察信息和预先训练完成的技能词生成模型,
确定至少一个技能词;
技能词输出 单元, 被配置成输出 所述至少一个技能词。
11.根据权利要求10所述的装置, 其中, 所述待考察信 息包括待考察岗位信 息和待考察
对象信息 。
12.根据权利要求10所述的装置, 其中, 所述 技能词输出 单元进一步被配置成:
基于所述至少一个技能词和 招聘对象信息, 确定目标招聘对象;
向所述目标招聘对象发送所述至少一个技 能词, 以使所述目标招聘对象基于所述至少
一个技能词对待考 察对象进行技能考 察。
13.一种模型训练装置, 包括:
样本获取 单元, 被配置成获取样本待考 察信息和考 察结果标注数据;
样本技能词确定单元, 被配置成基于预设的技能词图、 所述样本待考察信息和待训练
模型, 确定 至少一个样本技能词;
模型训练单元, 被配置成基于所述至少一个样本技能词和所述考察结果标注数据, 对
所述待训练模型进行训练, 得到训练完成的技能词生成模型。
14.根据权利要求13所述的装置, 还 包括:
技能词图确定单元, 被配置成基于所述样本待考察信息和所述考察结果标注数据, 确
定所述技能词图。
15.根据权利要求14所述的装置, 其中, 所述 技能词图确定单 元进一步被配置成:
从所述样本待考 察信息和所述 考察结果标注数据中, 确定各个候选技能词;
基于所述各个候选技能词、 所述样本待考察信息和所述考察结果标注数据, 确定所述
各个候选技能词之间的连接信息;
基于所述各个候选技能词和所述各个候选技能词之间的连接信息, 确定所述技能词
图。
16.根据权利要求15所述的装置, 其中, 所述 技能词图确定单 元进一步被配置成:
基于所述样本待考 察信息和所述 考察结果标注数据, 确定 至少一组样本数据元组;
对于每组样本数据元组, 确定该样本数据元组中的候选技能词之间的连接信息;
基于各组样本数据元组中候选技能词之间的连接信 息, 确定所述各个候选技 能词之间
的连接信息 。
17.根据权利要求13所述的装置, 其中, 所述样本待考察信 息包括待考察岗位样本信 息
和待考察对象样本信息 。
18.根据权利要求13所述的装置, 其中, 所述样本技能词确定单 元进一步被配置成:
将所述预设的技能词图和所述样本待考 察信息输入所述待训练模型;
基于所述预设的技能词图, 确定标签表征信息;
基于所述预设的技能词图和所述样本待考 察信息, 确定主题 表征信息;
基于所述标签表征信息和所述主题 表征信息, 确定所述至少一个样本技能词。
19.一种电子设备, 包括:
至少一个处 理器; 以及权 利 要 求 书 2/3 页
3
CN 114330333 A
3
专利 用于处理技能信息的方法、模型训练方法及装置
安全报告 >
其他 >
文档预览
中文文档
18 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-19 03:56:44上传分享