说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210771475.5 (22)申请日 2022.06.30 (71)申请人 清华大学 地址 100084 北京市海淀区双清路3 0号清 华大学清华园北京 100084-82信箱 (72)发明人 孙东红 刘武 时子威 黄永峰  (74)专利代理 机构 北京路浩知识产权代理有限 公司 11002 专利代理师 赵娜 (51)Int.Cl. G06N 5/02(2006.01) G06F 16/36(2019.01) G06F 16/35(2019.01) G06F 40/211(2020.01) G06F 40/268(2020.01)G06N 3/04(2006.01) (54)发明名称 一种基于知识图谱的智慧城市知识本体库 构建方法和装置 (57)摘要 本发明涉及一种基于知识图谱的智慧城市 知识本体库构建方法和装置, 包括: 确定智慧城 市的关键概念和关系规则; 基于关键概念和关系 规则, 参考知识图谱本体层构建模式, 构建智慧 城市知识本体库框架; 采用人工交互方式从智慧 城市网络评论数据中挖掘目标关键概念; 利用目 标关键概念, 对智慧城市知识本体库框架进行扩 充, 得到智慧城市知 识本体库; 其中, 关键概念至 少包括事件、 实体、 事件属性和实体属性四者的 描述性概念; 关系规则表征关键概念之间的依存 关系。 本发 明所构建的智慧城市知识本体库实现 了智慧城市领域本体知 识条目的大幅扩充, 为后 续智慧城市网络民调情感知识图谱的构建提供 了更具针对性、 细粒度更高的知识 支撑。 权利要求书3页 说明书15页 附图3页 CN 115204393 A 2022.10.18 CN 115204393 A 1.一种基于知识图谱的智慧城市知识本体库构建方法, 其特 征在于, 所述方法包括: 确定智慧城市的关键概念和关系规则; 基于所述关键概念和所述关系规则, 参考知识图谱本体层构建模式, 构建智慧城市知 识本体库框架; 采用人工交 互方式从预 先收集的智慧城市网络 评论数据中挖掘目标关键概念; 利用目标关键概念, 对所述智慧城市知识本体库框架进行扩充, 得到智慧城市知识本 体库; 其中, 所述关键概念至少包括事 件、 实体、 事 件属性和实体属性四者的描述 性概念; 所述关系规则表征 所述关键概念之间的依存关系。 2.根据权利要求1所述的基于知识图谱的智慧城市知识本体库构建方法, 其特征在于, 所述基于所述关键概念和所述关系规则, 参考知识图谱本体层构建模式, 构建智慧城市知 识本体库框架, 包括: 以所述关键概念为本体, 以所述关系规则为本体之间的关系, 建立所述智慧城市知识 本体库框架; 所述利用目标关键概念, 对所述智慧城市知识本体库框架进行扩充, 得到智慧城市知 识本体库, 包括: 分析得到表征所述目标关键概念与所述智慧城市知识本体库框架中关键概念之间依 存关系的关系规则; 基于所述目标关键概念和分析得到的关系规则, 扩充所述智慧城市知识本体库框架, 得到所述智慧城市知识本体库。 3.根据权利要求1所述的基于知识图谱的智慧城市知识本体库构建方法, 其特征在于, 所述智慧城市网络评论数据至少包括: 智慧城市项目合作方收集的网络评论和从网站上爬 取的网民来信; 其中, 从所述网站上爬取网民来信的过程, 包括: 定时利用网络 爬虫向所述网站发送网民来信编号列表请求; 在收到所述网站反馈的网民来信编号列表的情况下, 将所述网民来信编 号列表与已缓 存网民来信编号列表进行对比, 得到未缓存网民来信编号; 向所述网站请求并缓存所述未缓存 网民来信编 号对应的来信内容, 并更新已缓存 网民 来信编号列表。 4.根据权利要求1所述的基于知识图谱的智慧城市知识本体库构建方法, 其特征在于, 所述从预先收集的智慧城市网络评论数据中挖掘目标关键概念之前, 还包括: 滤除所述智 慧城市网络 评论数据中无效的文本数据; 所述无效的文本数据的识别过程, 包括: 对于所述智慧城市网络评论数据中每一个文本数据, 判断所述文本数据的词语量是否 小于预设词语量; 若是, 确定所述文本数据是否存在特殊词集 合中的词语; 若否, 对所述文本数据进行分句, 按照辨别规则确定所述文本数据中每一个句子片段 是否无效; 在所述文本数据存在特殊词集合中的词语或者所述文本数据中句子片段均无效的情权 利 要 求 书 1/3 页 2 CN 115204393 A 2况下, 认定所述文本数据为无效的文本数据; 其中, 所述 辨别规则至少包括以下一种: 当句子片段包 含无效词集 合中的词语时, 句子片段 无效; 当句子片段同时出现无效词对集 合内任一词语对中的两个词语时, 句子片段 无效。 5.根据权利要求1或4所述的基于知识图谱的智慧城市知识本体库构建方法, 其特征在 于, 所述采用人工交互方式从预先收集的智慧城市网络评论数据中挖掘目标关键概念, 包 括: 利用智慧城市网络评论领域分类模型, 对所述智慧城市网络评论数据中的文本数据进 行领域分类; 将属于同一个领域的文本数据写入同一文件中; 对每一个文件进行依存句法关系分析和词性分析, 得到每一个文件对应领域下的候选 关键概念; 将所有领域下的候选关键概念及其对应的文本数据交 由人工筛查, 并将人工筛查后得 到的关键概念作为目标关键概念。 6.根据权利要求5所述的基于知识图谱的智慧城市知识本体库构建方法, 其特征在于, 所述智慧城市网络评论领域分类模 型包括BertTokenizer网络结构、 BERT网络结构、 二维卷 积神经网络结构和全连接层, 是以智慧城市 网络评论文本数据及其对应的领域标记为样本 训练的; 所述利用智慧城市网络评论领域分类模型, 对所述智慧城市网络评论数据中的文本数 据进行领域分类, 包括: 利用BertTokenizer网络结构, 将输入的文本数据的文本序列转 化为token序列; 利用BERT网络结构, 将所述to ken序列编码为词嵌入向量; 利用二维卷积神经网络结构, 对所述词嵌入向量进行卷积操作, 得到所述输入的文本 数据的文本特 征; 通过激活函数激活所述输入的文本数据的文本特征, 得到所述输入的文本数据激活后 的文本特 征; 利用全连接层处理所述输入的文本数据激活后的文本特征, 得到所述输入的文本数据 对应的领域。 7.根据权利要求5所述的基于知识图谱的智慧城市知识本体库构建方法, 其特征在于, 所述对每一个文件进 行依存句法关系分析和词性分析, 得到每一个文件对应领域下的候选 关键概念, 包括: 针对每一个文件, 对所述文件进行依存句法关系分析, 确定所述文件中的定中关系和 核心关系; 对所述定 中关系中的评价对象和所述核心关系中的核心词进行词性分析, 并筛选出名 词类的评价对象和核心词; 以在文件中出现频次由高到低的顺序对筛 选出的评价对象和核心词进行排序; 舍弃排序序列中频次低于预设频次的评价对象或核心词, 得到所述文件对应领域下的 候选关键概念。 8.根据权利要求5所述的基于知识图谱的智慧城市知识本体库构建方法, 其特征在于,权 利 要 求 书 2/3 页 3 CN 115204393 A 3

.PDF文档 专利 一种基于知识图谱的智慧城市知识本体库构建方法和装置

文档预览
中文文档 22 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于知识图谱的智慧城市知识本体库构建方法和装置 第 1 页 专利 一种基于知识图谱的智慧城市知识本体库构建方法和装置 第 2 页 专利 一种基于知识图谱的智慧城市知识本体库构建方法和装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 10:53:59上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。