全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211166227.4 (22)申请日 2022.09.21 (71)申请人 中国科学院地理科 学与资源研究所 地址 100101 北京市朝阳区大屯路甲1 1号 (72)发明人 郑景云 张学珍 关旭源  (74)专利代理 机构 北京中创云知识产权代理事 务所(普通 合伙) 11837 专利代理师 赵琳 (51)Int.Cl. G06F 40/151(2020.01) G06F 40/166(2020.01) G06F 40/284(2020.01) G06F 40/216(2020.01) G06F 16/31(2019.01) G06F 16/35(2019.01) (54)发明名称 古气候重建数据处 理方法及装置 (57)摘要 本申请实施例公开了一种古气候重建数据 处理方法及装置, 古气候重建数据处理方法包 括: 接收古气候重建文本数据; 对所述古气候重 建文本数据进行预处理, 将自然语 言数据转换为 数学语言数据; 将所述数学语言数据以预设的结 构映射存入 数据库。 本申请实施例的方法能够促 进古气候重建数据的利用。 权利要求书2页 说明书8页 附图2页 CN 115544971 A 2022.12.30 CN 115544971 A 1.一种气候数据处 理方法, 其特 征在于, 包括: 接收古气候重建文本数据; 对所述古气候重建文本数据进行 预处理, 将自然语言数据转换为数 学语言数据; 将所述数 学语言数据输入训练好的模型, 以预设的结构映射存 入数据库。 2.根据权利要求1所述的方法, 其特 征在于, 对所述历史气候数据进行 预处理, 包括: 对每一古气候重建文本数据, 删除其中的标点符号、 数字和英文字母; 采用python的jieba模块, 进行中文分词处理, 并根据停用词表去除文本中无意义的停 用词; 生成不含语句结构和虚词的词汇 表格。 3.根据权利要求2所述的方法, 其特征在于, 对模型训练包括: 对预处理后的历史气候 数据进行文本 向量化, 生成一个二维词 频矩阵, 所述矩阵的每行代表一篇古气候重建文本 数据, 每列代 表某个单词或词语在不同古气候重建文本数据中的词频。 4.根据权利要求3所述的方法, 其特征在于, 所述词频的计算使用TF ‑IDF方法, 计算公 式如下: TF为词频, IDF为逆文本频率指数。 5.根据权利要求 4所述的方法, 其特 征在于, 所述方法还 包括: 用三层贝叶斯 概率模型对所述 二维词频矩阵进行处 理。 6.根据权利要求5所述的方法, 其特征在于, 用三层贝叶斯概率模型对所述二维词频矩 阵进行处 理, 包括: 步骤1、 设定待分类主题个数n, 迭代次数为s; 步骤2、 计算类间散度矩阵和类内散度: S1=∑N(ui‑u)(ui‑u)T S2=∑∑(x‑ui)(x‑ui)T 步骤3、 计算s1‑1s2的特征值{λ1, λ2, ..., λd}, 以及对应的特征向量Q=[ω1, ω2, ..., ωd]; 取出大小前((s ‑1)s‑k)/s个特征值对应的特征向量, 构成主题选择矩阵W, 其中k的值 为归纳出的古气候重建文献的种类数量; 投影数据: Y=XW; 步骤4、 循环进行步骤2和步骤3共s次, 直到生成的投影矩阵Y=[y1, y2,…, yk]的列数为 k, 每个列向量表示已分类的主题和对应的主题词概 率。 7.根据权利要求6所述的方法, 其特 征在于, 所述方法还 包括: 对于已经分类的主题, 根据提前建立的历史气候文献分类字典进行匹配, 统计和记录 相应主题的数量, 并结合狄利克雷分布计算文本主题的后验概率, 取最大值对应的主题为 文本主题。 8.一种气候历史数据处 理装置, 其特 征在于, 包括: 数据接收模块, 其用于 接收古气候重建文本数据;权 利 要 求 书 1/2 页 2 CN 115544971 A 2预处理模块, 其用于对所述古气候重建文本数据进行预处理, 将自然语言数据转换为 数学语言数据; 存储模块, 其用训练好的模型对所述数学语言数据进行处理, 将所述数学语言数据以 预设的结构映射存 入数据库。 9.一种计算机可读存储介质, 其上存储有计算机程序, 该程序被处理器执行时实现权 利要求1‑7任一项所述的方法。 10.一种电子设备, 包括存储器、 处理器以及存储在所述存储器中并可在所述处理器上 运行的计算机程序, 所述处理器执行所述计算机程序时实现权利要求1 ‑7中任一项所述的 方法。权 利 要 求 书 2/2 页 3 CN 115544971 A 3

.PDF文档 专利 古气候重建数据处理方法及装置

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 古气候重建数据处理方法及装置 第 1 页 专利 古气候重建数据处理方法及装置 第 2 页 专利 古气候重建数据处理方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 02:13:39上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。