全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210966117.X (22)申请日 2022.08.12 (71)申请人 南方电网深圳数字电网研究院有限 公司 地址 518053 广东省深圳市南 山区沙河街 道高发社区侨香路智慧广场D栋501、 502、 601、 602 (72)发明人 李亚松 尹旗 赵敏全 曹梁  陈影君  (74)专利代理 机构 广州三环 专利商标代理有限 公司 44202 专利代理师 江银会 (51)Int.Cl. G06F 16/11(2019.01) G06F 16/16(2019.01)G06F 40/205(2020.01) G06F 40/216(2020.01) G06F 40/30(2020.01) G06F 40/151(2020.01) (54)发明名称 一种文件解析方法及装置 (57)摘要 本发明公开了一种文件解析方法及装置, 该 方法包括: 获取待解析的第一原始文件, 并判断 第一原始文件 是否属于第一预设格式类型; 当判 断出第一原始文件属于第一预设格式类型时, 对 第一原始文件进行预处理, 得到第一原始文件对 应的预设格式文件; 提取预设格式文件的特征信 息, 并对特征信息进行预设字段匹配操作得到目 标匹配结果; 根据目标匹配结果执行填充操作, 将第一原始文件转化成目标文件。 可见, 本发明 能够提供一种文件解析方法, 提高了文件解析的 效率, 大大降低文件解析过程中的人力成本和时 间成本, 自动读取文件内容按照预设格式展示、 同时可以更新相关信息, 大幅降低了信息读取过 程中的失误率, 缩短了文件专递过程中的时间周 期。 权利要求书2页 说明书11页 附图5页 CN 115203131 A 2022.10.18 CN 115203131 A 1.一种文件解析 方法, 其特 征在于, 所述方法包括: 获取待解析的第一原 始文件, 并判断所述第一原 始文件是否属于第一预设格式类型; 当判断出所述第 一原始文件属于所述第 一预设格式类型时, 对所述第 一原始文件进行 预处理, 得到所述第一原 始文件对应的预设格式文件; 提取所述预设格式文件的特征信 息, 并对所述特征信 息进行预设字段匹配操作 得到目 标匹配结果; 根据所述目标匹配结果执 行填充操作, 将所述第一原 始文件转 化成目标文件。 2.根据权利要求1所述的文件解析 方法, 其特 征在于, 所述方法还 包括: 判断预定义文件路径中是否存在可配置文件, 其中, 所述可配置文件用于获取所述第 一预设格式类型以及所述预设字段中的一种或多种组合信息; 当判断出所述预定义文件路径中存在所述可配置文件时, 将所述可配置文件进行解 析, 以得到所述第一预设格式类型以及所述预设字段中的一种或多种组合信息 。 3.根据权利要求2所述的文件解析方法, 其特征在于, 所述对所述第 一原始文件进行预 处理, 得到所述第一原 始文件对应的预设格式文件, 包括: 通过预先确定的系统接口, 将所述第一原始文件对应的压缩数据流转化成目标数据 流; 根据所述目标 数据流的信息, 创建所述目标 数据流对应的文本构造器; 通过所述文本构造器, 将所述目标 数据流转化成预设格式文件。 4.根据权利要求2或3所述的文件解析方法, 其特征在于, 所述提取所述预设格式文件 的特征信息, 并对所述特 征信息进行 预设字段匹配操作得到目标匹配结果, 包括: 通过预设的语义解析模型, 提取所述预设格式文件中的特征信息, 其中所述特征信息 包括至少一种子特 征信息; 对于任一所述子特征信息, 对该子特征信息进行预设字段匹配操作, 得到该子特征信 息对应的所有字段匹配结果; 从所有所述字段匹配结果中筛选出匹配度最高的字段匹配结果作为该子特征信息对 应的目标字段匹配结果; 将所有所述子特征信息对应的所有所述目标字段匹配结果确定为所述特征信息的目 标匹配结果。 5.根据权利要求4所述的文件解析方法, 其特征在于, 所述对于任一所述子特征信息, 对该子特征信息进行预设字段匹配操作, 得到该子特征信息对应的所有字段匹配结果, 包 括: 对于任一所述子特征信 息, 确定该子特征信 息对应的评价维度以及每一所述评价维度 对应的权重值, 所述评价维度包括领域信息、 场景信息、 特征信息类型中的一种或多种组 合; 根据预设字段信息, 对该 特征信息进行字段匹配操作; 根据所有所述评价维度, 计算每一所述子特征信 息对应的所有所述预设字段的匹配度 信息; 将所有所述匹配度信息确定为该子特 征信息对应的所有字段匹配结果。 6.根据权利要求5所述的文件解析方法, 其特征在于, 所述根据 所述目标匹配结果执行权 利 要 求 书 1/2 页 2 CN 115203131 A 2填充操作, 将所述第一原 始文件转 化成目标文件之后, 所述方法还 包括: 判断是否 接收到所述目标文件 对应的展示命令; 当判断出接收到所述目标文件对应的所述展示命令时, 从所述展示命令 中解析出展示 元素; 根据所述目标文件以及所述展示元素, 从所述目标文件中确定出需要展示的目标展示 内容; 对所述目标展示内容进行展示操作。 7.根据权利要求6所述的文件解析方法, 其特征在于, 所述根据 所述目标匹配结果执行 填充操作, 将所述第一原 始文件转 化成目标文件之后, 所述方法还 包括: 判断是否接收到第 二原始文件, 所述第 二原始文件用于与所述第 一原始文件进行融合 以更新所述目标文件的文件; 当判断出接收到所述第 二原始文件时, 判断所述第 二原始文件与所述第 一原始文件是 否属于相匹配的格式类型文件; 当判断结果为是时, 对所述第二原始文件执行解析操作, 得到所述第二原始文件对应 的目标解析文件; 将所述目标解析文件以及所述目标文件进行内容融合, 更新所述目标文件中的内容。 8.一种文件解析装置, 其特 征在于, 所述装置包括: 判断模块, 用于获取待解析的第一原始文件, 并判断所述第一原始文件是否属于第一 预设格式类型; 预处理模块, 用于当判断出所述第一原始文件属于所述第一预设格式类型时, 对所述 第一原始文件进行 预处理, 得到所述第一原 始文件对应的预设格式文件; 匹配模块, 用于提取所述预设格式文件的特征信息, 并对所述特征信息进行预设字段 匹配操作得到目标匹配结果; 转化模块, 用于根据所述目标匹配结果执行填充操作, 将所述第一原始文件转化成目 标文件。 9.一种文件解析装置, 其特 征在于, 所述装置包括: 存储有可执行程序代码的存 储器; 与所述存 储器耦合的处 理器; 所述处理器调用所述存储器中存储的所述可执行程序代码, 执行如权利要求1 ‑7任一 项所述的文件解析 方法。 10.一种计算机存储介质, 其特征在于, 所述计算机存储介质存储有计算机指令, 所述 计算机指令被调用时用于执 行如权利要求1 ‑7任一项所述的文件解析 方法。权 利 要 求 书 2/2 页 3 CN 115203131 A 3

PDF文档 专利 一种文件解析方法及装置

文档预览
中文文档 19 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种文件解析方法及装置 第 1 页 专利 一种文件解析方法及装置 第 2 页 专利 一种文件解析方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:14:12上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。