全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211132031.3 (22)申请日 2022.09.16 (71)申请人 建信金融科技有限责任公司 地址 200120 上海市浦东 新区自由贸易试 验区银城路9 9号12层、 15层 (72)发明人 樊雨送  (74)专利代理 机构 北京润平知识产权代理有限 公司 11283 专利代理师 李红 (51)Int.Cl. G06F 16/25(2019.01) (54)发明名称 对账文件导入方法、 装置、 存储介质及处理 器 (57)摘要 本申请实施例提供一种对账文件导入 方法、 装置、 存储介质及处理器, 涉及计算机技术领域。 对账文件导入方法包括: 获取机构对账文件; 解 析预定义的对 账格式描述文件, 得到对账对象列 表; 采用自然语 言文本解析方式预处理所述机构 对账文件, 得到不同的对账语料; 将所述对账语 料与所述对 账对象列表中的对账对象进行匹配, 将得到的对 账数据导入中心数据库。 上述对账文 件导入方法定义了对账格式描 述文件, 对账过程 均基于对账格式描述文件, 对账数据处理均围绕 对账格式描述文件, 简化了数据处理过程, 采用 自然语言文本匹配方式进行对账文件 预处理, 处 理后的对账 预料匹配过程简单不 易出错。 权利要求书3页 说明书12页 附图2页 CN 115470278 A 2022.12.13 CN 115470278 A 1.一种基于自然语言文本匹配的对账文件导入方法, 其特征在于, 所述对账文件导入 方法包括: 获取机构对账文件; 解析预定义的对账格式描述文件, 得到对账对象列表; 采用自然语言文本解析 方式预处 理所述机构对账文件, 得到不同的对账语料; 将所述对账语料与 所述对账对象列表中的对账对象进行匹配, 将得到的对账数据导入 中心数据库。 2.根据权利要求1所述的基于自然语言文本匹配的对账文件导入方法, 其特征在于, 所 述对账格式描述文件 包括: 各字段对应的字段名、 各字段对应的变量名以及各字段对应的字段类型; 各字段对应 的字段名、 各字段对应的变量名以及各字段对应的字段类型一 一对应。 3.根据权利要求2所述的基于自然语言文本匹配的对账文件导入方法, 其特征在于, 所 述对账格式描述文件采用自然语言定义各字段对应的字段名, 采用占位符描述各字段对应 的字段类型。 4.根据权利要求2所述的基于自然语言文本匹配的对账文件导入方法, 其特征在于, 解 析预定义的对账格式描述文件, 得到对账对象列表, 包括: 将所述对账格式描述文件划分为汇总行和明细行; 遍历所述对账格式描述文件, 将对账格式描述文件划分为 不同的字段; 从汇总行的不同字段中依次获取字段名作为对账对象, 根据获取顺序及获取的对账对 象构建汇总行对账对象列表; 从明细行的不同字段中依次获取字段名作为对账对象, 根据获取顺序及获取的对账对 象构建明细行对账对象列表。 5.根据权利要求4所述的基于自然语言文本匹配的对账文件导入方法, 其特征在于, 所 述采用自然语言文本解析 方式预处 理所述机构对账文件, 得到不同的对账语料, 包括: 对所述机构对账文件进行解析并划分为汇总行和多个明细行; 依据字段名称对所述汇总行和多个明细行分别进行分词处理, 得到使用不同字段表示 的汇总行和多个使用不同字段表示的明细行作为对账语料。 6.根据权利要求5所述的基于自然语言文本匹配的对账文件导入方法, 其特征在于, 所 述将所述对账语料与所述对账对象列 表中的对账对象进行匹配, 将得到的对账数据导入中 心数据库, 包括: 将汇总行的对账语料与汇总行对账对象列表中的对账对象进行匹配; 在匹配成功的情况下, 根据汇总行对账对象列表中的对账对象对应的字段类型对汇总 行的对账语料进行类型转换; 在类型转换成功的情况下, 将汇总行的对账语料逐一赋值给汇总行对账对象列表中的 对账对象; 将任一明细行的对账语料与明细行对账对象列表中的对账对象进行匹配; 在匹配成功的情况下, 根据明细行对账对象列表中的对账对象对应的字段类型对该明 细行的对账语料进行类型转换; 在类型转换成功的情况下, 将该明细行的对账语料逐一赋值给明细行对账对象列表中权 利 要 求 书 1/3 页 2 CN 115470278 A 2的对账对 象, 并将该明细行 的赋值结果保存在链表中; 逐一对其他明细行 的对账语料进行 匹配和赋值处 理; 将链表存储在中心数据库中。 7.根据权利要求6所述的基于自然语言文本匹配的对账文件导入方法, 其特征在于, 所 述将汇总行的对账语料与汇总行对账对象列表中的对账对象进行匹配, 包括: 将汇总行的对账语料对应的字段名称依次与汇总行对账对象列表中的对账对象进行 匹配, 若全部一 致, 则匹配成功; 所述将任一明细行的对账语料与明细行对账对象列表中的对账对象进行匹配, 包括: 将任一明细行的对账语料对应的名称依次与明细行对账对象列表中的对账对象进行 匹配, 若全部一 致, 则匹配成功。 8.根据权利要求7所述的基于自然语言文本匹配的对账文件导入方法, 其特征在于, 所 述方法还 包括: 检查汇总行总笔 数与链表中对象个数 是否相等, 若不相等, 则生成报警提 示; 检查汇总行总金额与链表中各对象的金额加总之和是否相等, 若不相等, 则生成报警 提示。 9.一种基于自然语言文本匹配的对账文件导入装置, 其特征在于, 所述对账文件导入 装置包括: 获取单元, 用于获取机构对账文件; 解析单元, 用于解析 预定义的对账格式描述文件, 得到对账对象列表; 处理单元, 用于采用自然语言文本解析方式预处理所述机构对账文件, 得到不同的对 账语料; 对账导入单元, 用于将所述对账语料与所述对账对象列表中的对账对象进行匹配, 将 得到的对账 数据导入中心数据库。 10.根据权利要求9所述的基于自然语言文本匹配的对账文件导入装置, 其特征在于, 所述解析单元包括: 拆分模块, 用于将所述对账格式描述文件划分为汇总行和明细行; 以及遍历所述对账 格式描述文件, 将对账格式描述文件划分为 不同的字段; 对账对象列表构建模块, 用于从汇总行的不同字段中依次获取字段名作为对账对象, 构建汇总 行对账对 象列表; 以及从明细行 的不同字段中依 次获取字段名作为对账对 象, 构 建明细行对账对象列表。 11.根据权利要求9所述的基于自然语言文本匹配的对账文件导入装置, 其特征在于, 所述对账导入单 元包括: 汇总行对账导入模块, 用于将汇总行的对账语料与汇总行对账对象列表中的对账对象 进行匹配, 在 匹配成功的情况下, 根据汇总 行对账对 象列表中的对账对 象对应的字段类型 对汇总行的对账语料进行类型转换, 在类型转换成功的情况下, 将汇总 行的对账语料逐一 赋值给汇总行对账对象列表中的对账对象; 明细行对账导入模块, 用于将任一明细行的对账语料与明细行对账对象列表中的对账 对象进行匹配, 在匹配成功的情况下, 根据明细行对账对 象列表中的对账对 象对应的字段 类型对该明细行 的对账语料进行类型转换, 在类型转换成功的情况下, 将该明细行 的对账权 利 要 求 书 2/3 页 3 CN 115470278 A 3

.PDF文档 专利 对账文件导入方法、装置、存储介质及处理器

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 对账文件导入方法、装置、存储介质及处理器 第 1 页 专利 对账文件导入方法、装置、存储介质及处理器 第 2 页 专利 对账文件导入方法、装置、存储介质及处理器 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:03:10上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。