全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210182912.X (22)申请日 2022.02.25 (71)申请人 北京大学 地址 100871 北京市海淀区颐和园路5号 (72)发明人 孙艳春 景翔 黄罡 尹航  (74)专利代理 机构 北京润泽恒知识产权代理有 限公司 1 1319 专利代理师 苟冬梅 (51)Int.Cl. G06F 16/332(2019.01) G06F 16/36(2019.01) G06F 16/33(2019.01) (54)发明名称 一种面向初学者的API自适应推荐 方法与系 统 (57)摘要 本申请提供一种面向初学者的API自适应推 荐方法, 属于API技术领域。 包括: 解析API文档, 得到多个API元素以及多个API元素之间的第一 关联关系; 基于多个API元素以及多个API元素之 间的关联关系, 构建具有多类API实体的初始知 识图谱; 每类API实体均具有多个相互连接的API 实体; 获取多个SO讨论帖; 在初始知 识图谱中, 构 建每个SO讨论帖与对应的目标API实体 之间的第 二关联关系, 得到目标知识图谱; 将目标知识图 谱上的多个API实体, 聚类为不同的API实体组, 以构建不同的学习入口。 使用本申请提供的自适 应推荐方法, 可以为初学者推荐所需的学习入 口。 权利要求书3页 说明书25页 附图6页 CN 114661872 A 2022.06.24 CN 114661872 A 1.一种面向初学者的API自适应 推荐方法, 其特 征在于, 所述方法包括: 解析API文档, 得到多个API元 素以及多个API元 素之间的第一关联关系; 基于多个API元素以及多个API元素之间的关联关系, 构建具有多类API实体的初始知 识图谱, 每类API实体用于描述一种API; 每类API实体均具有多个相互连接的API实体, API 实体之间相连接的边表征所述第一关联关系, 所述第一关联关系至少包括继承关系、 包含 关系、 实现关系; 获取多个SO讨论帖, 每个SO讨论帖中包括至少一个API实体指称, 所述API实体指称为 所述SO讨论帖中讨论的API元 素; 在初始知识图谱中, 构建所述每个SO讨论帖与对应的目标API实体之间的第二关联关 系, 得到目标知识图谱; 对所述目标知识图谱上的多个API实体进行聚类, 得到不同的API实体组, 以构建为不 同主题的学习入口。 2.根据权利要求1所述的方法, 其特征在于, 构建所述每个SO讨论帖与对应的目标API 实体之间的第二关联关系, 包括: 从所述SO讨论帖中提取 出API实体指称; 将所述API实体指称分别与所述每类API实体中的多个API实体的API限定名进行一次 匹配, 得到与所述API实体指称所匹配的多个第一候选API实体, 所述API限定名为所述API 实体的命名; 将所述API实体指称分别与多个第一候选API实体进行二次匹配, 得到与所述API实体 指称匹配的目标API实体; 建立所述API实体指称所在的SO讨论帖与所述目标API实体之间的第二关联关系。 3.根据权利要求2所述的方法, 其特征在于, 从所述SO讨论帖中提取出API实体指称包 括: 对所述SO讨论帖进行 预处理, 得到句子的集 合; 对所述句子的集 合进行处 理, 得到词汇序列; 在所述词汇序列中, 使用API命名实体识别模型标记所述API实体指称所对应的词汇, 作为提取出的API实体指称。 4.根据权利要求2所述的方法, 其特征在于, 将所述API实体指称分别与多个第一候选 API实体进行二次匹配, 得到与所述API实体指称匹配的目标API实体, 包括: 对所述第一 候选API实体的API限定名进行抽取, 分别得到多个短限定名; 从所述多个短限定名中, 确定被所述API实体指称所包含的短限定名, 以作为目标短限 定名; 将所述API实体指称分别与所述目标短限定名所表征的第一候选API实体进行匹配, 得 到所述目标API实体。 5.根据权利要求4所述的方法, 其特征在于, 将所述API实体指称分别与所述目标短限 定名所表征的第一 候选API实体进行匹配, 得到所述目标API实体, 包括: 采用语义匹配模型, 将所述API实体指称的上下文文本, 分别与所述目标短限定名所表 征的多个第一 候选API实体的描述文本进行语义匹配; 将语义匹配度高于预设匹配度的第一 候选API实体, 作为所述目标API实体。权 利 要 求 书 1/3 页 2 CN 114661872 A 26.根据权利要求1所述的方法, 其特征在于, 将所述目标知识图谱上的多个API实体聚 类为不同的API实体组, 以构建不同的学习入口, 包括: 基于所述目标知识图谱, 获取在同一篇SO讨论帖中被讨论超过预设次数的两个API实 体; 将所述两个API实体添加至S O社区知识图谱中, 并建立所述两个API实体之间 的第三关 联关系; 基于Louvain算法, 对所述SO社区知识图谱中每两个所述API实体之间的第三关联关系 进行分析, 以将多个API实体聚类为不同的API实体组, 其中, 每个所述API实体组中包括多 个两两之间具有所述第三关联关系的API实体; 将每个不同的API实体组, 构建为 不同API的学习入口。 7.根据权利要求1所述的方法, 其特 征在于, 所述方法还 包括: 在所述目标知识图谱中, 建立所述API实体与对应的第一领域术语之间的第 四关联关 系, 所述第一领域 术语来源于所述API文档; 建立所述第 一领域术语与第 二领域术语之间的第五关联关系, 所述第 二领域术语来源 于维基百 科; 从用户输入的查询文本中, 提取 出待查询领域 术语; 将与所述待查询领域术语匹配的多个第一领域术语所关联的第二候选API实体, 以及 与所述待查询领域术语匹配的多个第二领域术语所关联的第三候选API 实体, 作为候选API 列表; 将所述待查询领域术语与所述候选API列表中的所有API实体进行语义匹配, 得到所有 API实体的排列顺序; 在所述排列顺序中, 推荐位于首位的API实体。 8.根据权利要求7 所述的方法, 其特 征在于, 得到所述 排列顺序之后, 所述方法还 包括: 从用户输入的查询文本中, 提取 出待查询API限定名; 在所述目标知识图谱中, 查询与所述待查询API限定名匹配的API限定名; 将与所述待查询API限定名匹配的API限定名关联的API实体, 置于所述排列顺序的首 位; 推荐所述置 于排列顺序首位的API限定名所表征的API实体。 9.一种面向初学者的API自适应 推荐系统, 其特 征在于, 所述系统包括: 解析模块, 用于解析API文档, 得到多个API元素以及多个API元素之间的第一关联关 系; 初始知识图谱构建模块, 用于基于多个API元素以及多个API元素之间的关联关系, 构 建具有多类API实体的初始知识图谱, 每类API实体用于描述一种API; 每类API实体均具有 多个相互连接的API实体, API实体之间相连接的边表征所述第一关联关系, 所述第一关联 关系至少包括继承关系 、 包含关系、 实现关系; 获取模块, 用于获取多个SO讨论帖, 每个SO讨论帖中包括至少一个API实体指称, 所述 API实体指称为所述SO讨论帖中讨论的API元 素; 目标知识图谱构建模块, 用于在初始知识图谱中, 构建所述每个SO讨论帖与对应的目 标API实体之间的第二关联关系, 得到目标知识图谱;权 利 要 求 书 2/3 页 3 CN 114661872 A 3

.PDF文档 专利 一种面向初学者的API自适应推荐方法与系统

文档预览
中文文档 35 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共35页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种面向初学者的API自适应推荐方法与系统 第 1 页 专利 一种面向初学者的API自适应推荐方法与系统 第 2 页 专利 一种面向初学者的API自适应推荐方法与系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 08:55:34上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。