全网唯一标准王
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111308076.7 (22)申请日 2021.11.05 (71)申请人 江西软云科技股份有限公司 地址 330000 江西省南昌市高新 技术产业 开发区京东大道698号浙江大学国家 大学科技园C区3楼 (72)发明人 赵聪 单志广 黄希理  (74)专利代理 机构 南昌旭瑞知识产权代理事务 所(普通合伙) 36150 代理人 彭琰 (51)Int.Cl. G06F 40/284(2020.01) G06F 40/289(2020.01) G06F 16/335(2019.01) G06N 20/00(2019.01) (54)发明名称 一种词组推荐方法、 系统、 存 储介质及设备 (57)摘要 本发明提供一种词组推荐方法、 系统、 存储 介质及设备, 方法包括: 获取已输入文本的文本 信息, 将文本信息词组分割为多个文本词组; 获 取当前输入的字母信息, 查询并获取符合字母信 息的多个预词组; 通过计算每一预词组与文本词 组的词向量 关联度, 并将关联度计算后的预词组 按相关度高低进行词组排序, 将词组排序后的预 词组进行词组推荐。 上述词组推荐方法、 系统、 存 储介质及设备, 通过获取并拆分已输入的文本信 息得到多个文本词组, 根据多个预词组与多个文 本词组进行关联, 通过计算每一预词组与文本词 组的词向量 关联度, 再将关联度计算后的预词组 按相关度高低进行词组排序, 将词组排序后的预 词组进行词组推荐, 得到推荐结果, 提高了用户 的输入效率。 权利要求书2页 说明书8页 附图3页 CN 114239564 A 2022.03.25 CN 114239564 A 1.一种词组推荐方法, 其特 征在于, 所述方法包括: 获取已输入文本的文本信 息, 通过预训练 的词组分割模型将所述文本信 息划分后得到 词组集合, 所述词组集合包括多个文本词组, 根据所述文本信息, 识别当前已输入文本的页 面环境; 获取当前输入的字母信 息, 根据所述字母信 息查询并获取符合所述字母信 息的词组选 项, 根据所述页面环境筛选所述词组选项, 使得筛选后的词组选项符合所述页面环境的环 境特征, 所述筛 选后的词组选项包括多个预词组; 通过预训练的词向量模型计算每一所述预词组与 所述文本词组 的词向量关联度, 并将 关联度计算后的预词组按相关度高低进行词组排序, 将词组排序后的预词组进行词组推 荐。 2.根据权利要求1所述的词组推荐方法, 其特征在于, 所述获取已输入文本的文本信 息, 通过预训练的词组分割模型将所述文本信息划分后得到词组集 合的步骤之前包括: 获取已公开的新闻信息及语料库; 基于深度学习模型 结合所述 新闻信息及所述语料库训练得到词组分割模型。 3.根据权利要求1所述的词组推荐方法, 其特征在于, 所述将词组排序后的预词组进行 词组推荐的步骤 包括: 将词组排序后的预词组按预定推荐数量进行词组推荐。 4.根据权利要求1所述的词组推荐方法, 其特征在于, 所述获取当前输入的字母信息, 根据所述字母信息查询并获取符合所述字母信息的词组选项的步骤 包括: 获取当前输入的字母信息; 将所述字母信息转换成多个与所述字母信息对应的拼音信息; 根据所述 拼音信息查询并获取与所述 拼音信息相对应的词组选项。 5.根据权利要求1所述的词组推荐方法, 其特征在于, 所述通过预训练 的词向量模型计 算每一所述预词组与所述文本词组的词向量关联度的步骤 包括: 当存在与文本词组相同的预词组时, 所述与文本词组相同的预词组的词向量关联度的 值最低, 所述预词组的相关度最高。 6.根据权利要求1所述的词组推荐方法, 其特征在于, 所述将词组排序后的预词组进行 词组推荐的步骤之后包括: 当使用者选定某一推荐词组时, 被选定后的推荐词组存入至所述词组集合中并更新所 述词组集 合内的文本词组。 7.根据权利要求1所述的词组推荐方法, 其特征在于, 所述将关联度计算后的预词组按 相关度高低进行词组排序, 将词组排序后的预词组进行词组推荐的步骤 包括: 当存在多个所述预词组的相关度一样时, 获取相关度一样的预词组的使用频率, 将所 述相关度一样的预词组根据使用频率的大小进行频率排序、 并根据频率排序后的结果进 行 词组推荐。 8.一种词组推荐系统, 其特 征在于, 所述系统包括: 第一获取模块, 用于获取已输入文本的文本信息, 并将所述文本信息按短语划分规则 划分后得到词组集合, 所述词组集合包括多个文本词组, 根据所述文本信息, 识别当前已输 入文本的页面环境;权 利 要 求 书 1/2 页 2 CN 114239564 A 2第二获取模块, 用于获取当前输入的字母信息, 根据所述字母信息查询并获取符合所 述字母信息的词组选项, 根据所述页面环境筛选所述词组选项, 使得筛选后的词组选项符 合所述页面环境的环境特 征, 所述筛 选后的词组选项包括多个预词组; 推荐模块, 用于通过预训练 的词向量模型计算每一所述预词组与所述文本词组 的词向 量关联度, 并将关联度计算后的预词组按相关度高低进行词组排序, 将词组排序后的预词 组进行词组推荐。 9.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 该程序被处理器执 行时实现如权利要求1-7任一所述的词组推荐方法。 10.一种数据处理设备, 包括存储器、 处理器以及存储在存储器上并可在处理器上运行 的计算机程序, 其特征在于, 所述处理器执行所述程序时实现如权利要求1-7任一所述的 词组推荐方法。权 利 要 求 书 2/2 页 3 CN 114239564 A 3

.PDF文档 专利 一种词组推荐方法、系统、存储介质及设备

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种词组推荐方法、系统、存储介质及设备 第 1 页 专利 一种词组推荐方法、系统、存储介质及设备 第 2 页 专利 一种词组推荐方法、系统、存储介质及设备 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 19:00:59上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。