全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210398278.3 (22)申请日 2022.04.15 (71)申请人 江苏名通信息科技有限公司 地址 212000 江苏省镇江市京口区苗家湾 路259号云时代中心 2#楼二单 元4楼 (72)发明人 梁斌 秦谦  (51)Int.Cl. G06F 40/30(2020.01) G06F 16/36(2019.01) (54)发明名称 一种基于知识图谱的语义识别系统 (57)摘要 本发明公开了一种基于知识图谱的语义识 别系统, 属于语义识别领域, 用于解决语句进行 语义识别时没有进行初步筛选和无法知晓语句 的正确语义的问题, 包括数据初筛模块、 特征提 取模块和映射识别模块, 所述数据初筛模块用于 对待译语句进行初步筛选, 工作得到初筛通过信 号或初筛不通过信号反馈至服务器, 所述特征提 取模块用于对初筛通过待译语句进行特征提取, 依据待译语句中每个字 符的笔画数, 并按照字 符 的输入顺序建立待译语句的特征码并反馈至服 务器, 映射识别模块结合特征码将待译语句进行 映射识别, 工作得到语句语义 或语义浏览页将发 送至服务器, 本发明对语句进行初步筛选并识别 得到正确语句的语义。 权利要求书2页 说明书7页 附图1页 CN 114818726 A 2022.07.29 CN 114818726 A 1.一种基于知识图谱的语义识别系统, 其特征在于, 包括数据采集模块、 敏感字库、 数 据初筛模块、 特征提取模块、 映射识别模块、 数据库、 数据更新模块、 用户终端以及服务器, 所述服务器连接有数据库和敏感字库, 所述数据库与映射识别模块数据连接, 所述敏感字 库与数据初筛模块数据连接, 数据库和敏感字库是基于知识图谱进行构建的, 敏感字库中 存储有若干个敏感字, 数据库存 储有若干个预设语句的语句词义以及对应的识别码; 所述用户终端用于使用人员输入待译语句, 并将待译语句 发送至服务器; 所述数据采 集模块用于采集待译语句的语句信息, 并将待译语句的语句信息发送至服务器, 所述服务 器将待译语句的语句 信息发送至数据初筛模块, 所述数据初筛模块用于对待译语句进 行初 步筛选, 工作得到初筛通过信号或初筛不通过信号反馈至服务器, 若服务器接 收到初筛通 过信号, 则将对应待译语句的语句信息发送至特征提取模块; 若服务器接 收到初筛不通过 信号, 则将对应待 译语句进行剔除并反馈 至重新输入信号至用户终端; 所述服务器将初筛通过的待译语句的语句信 息发送至特征提取模块, 所述特征提取模 块用于对初筛通过待译语句进行特征提取, 依据待译语句中每个字符的笔画数, 并按照字 符的输入顺序建立待译语句的特征码并反馈至服务器, 所述服务器将待译语句的特征码发 送至映射识别模块, 映射识别模块结合特征码将待译语句进行映射识别, 工作得到语句语 义或语义浏览页将发送至服务器, 所述服务器将待译语句的语句语义或语义浏览页反馈至 相应的用户终端。 2.根据权利要求1所述的一种基于知识图谱的语义识别系统, 其特征在于, 语句信 息包 括待译语句的字符数以及每 个字符的笔画数。 3.根据权利要求2所述的一种基于知识图谱的语义识别系统, 其特征在于, 所述数据初 筛模块用于对待 译语句进行初步筛 选, 工作过程具体如下: 步骤一: 将待 译语句标记为u, u=1, 2, ……, z, z为正整数; 步骤二: 获取待译语句中的每个字符, 统计待译语句中每个字符的笔画数, 并将笔画数 标记为BHui, i =1, 2,……, x, x为正整数; 步骤三: 获取敏感库中的敏感字, 统计敏感字的笔画数得到敏感笔画BHo, o=1, 2,……, v, v为正整数, o代 表敏感库中敏感字的编号; 步骤四: 若BHui =BHo, 则将敏感字设定为字符对应的待定敏感字; 若BHui≠BHo, 则不进行任何操作; 步骤五: 将待 译语句中每 个字符与对应的待定敏感字进行 形体比对; 步骤六: 若 待译语句中每 个字符均不 为敏感字, 则生成初筛通过信号; 若待译语句中任意字符为敏感字, 则生成初筛不 通过信号; 所述数据初筛模块将初筛通过信号或初筛不通过信号反馈至服务器, 若服务器接收到 初筛通过信号, 则将对应待 译语句的语句信息发送至特 征提取模块。 4.根据权利要求3所述的一种基于知识图谱的语义识别系统, 其特征在于, 形体比对具 体如下: 将待译语句中每个字符置于深色纸张中, 而后将带有对应待定敏感字的浅色纸张堆叠 放置在深色纸张之上, 若字符与待定敏感字相重叠, 则判定待译语句中字 符为敏感字, 初筛 不通过, 反之初筛通过。 5.根据权利要求3所述的一种基于知识图谱的语义识别系统, 其特征在于, 所述映射识权 利 要 求 书 1/2 页 2 CN 114818726 A 2别模块的工作过程具体如下: 步骤S1: 获取 数据库中存 储的若干个预设语句的语句词义及对应的识别码; 步骤S2: 待 译语句的特 征码遍历比对数据库中的若干个识别码; 步骤S3: 若比对成功, 则将识别码标定为映射识别码; 若比对失败, 则继续比对直至遍历完成; 步骤S4: 依据映射识别码得到数据库中对应的预设语句; 步骤S5: 若预设语句映射得到对应的一个语句语义, 则将对应的语句语义反馈至服务 器; 若预设语句映射得到对应的一个或者多个 语句语义, 则进入下一 步骤; 步骤S6: 统计语句语义的浏览次数, 按照浏览次数由多到少的规则多个语句语义进行 排布生成语义浏览页。 6.根据权利要求1所述的一种基于知识图谱的语义识别系统, 其特征在于, 系统还包括 数据更新模块, 所述数据采集模块用于采集数据库中预设语句对应语句 语义的使用信息, 并将使用信息发送至服 务器; 所述服务器将使用信 息发送至数据 更新模块, 所述数据 更新模块用于对数据库中预设 语句的语句语义进行 数据更新, 生成数据更新信号或数据正常信号反馈 至服务器; 若服务器接收到数据正常信号, 则不进行任何操作, 若服务器接收到数据 更新信号, 则 生成更新指令加载至数据库, 所述数据库接收到更新指令后用于对指 定的预设语句的语句 语义进行 更新。 7.根据权利要求6所述的一种基于知识图谱的语义识别系统, 其特征在于, 使用信 息包 括浏览次数、 浏览时间以及对应的浏览时长、 下 载次数、 上一次更新时间。 8.根据权利要求6所述的一种基于知识图谱的语义识别系统, 其特征在于, 所述数据 更 新模块的数据更新过程具体如下: 步骤SS1: 将数据库中预设语句对应的语句语义标记为p, p=1, 2, ……, n, n为正整数; 步骤SS2: 获取语句语义上一 次的更新 时间, 利用服务器当前时间减去上一次的更新时 间得到语句语义的更新间隔时长, 若 更新间隔时长大于等于时间阈值, 则进入下一步骤, 反 之则不进行任何操作; 步骤SS3: 获取语句语义的浏览次数以及对应的浏览时长, 每次的浏览时长相加求和得 到语句语义的浏览总时长TLp; 步骤SS4: 获取语句语义的下 载次数, 并将下 载次数标记为XCp; 步骤SS5: 通过公式GXp=1/(TLp+XCp)计算得到语句语义的更新 值GXp; 步骤SS6: 若更新 值小于更新阈值, 则生成数据更新信号, 反 之则生成数据正常信号。权 利 要 求 书 2/2 页 3 CN 114818726 A 3

.PDF文档 专利 一种基于知识图谱的语义识别系统

文档预览
中文文档 11 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于知识图谱的语义识别系统 第 1 页 专利 一种基于知识图谱的语义识别系统 第 2 页 专利 一种基于知识图谱的语义识别系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 08:53:13上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。