全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 20221098762 9.4 (22)申请日 2022.08.17 (71)申请人 天元大数据信用管理有限公司 地址 250100 山东省济南市高新区浪潮路 1036号浪潮科技园S01楼 23层 (72)发明人 王小聪 杨宝华 崔乐乐  (74)专利代理 机构 济南信达专利事务所有限公 司 37100 专利代理师 孙园园 (51)Int.Cl. G06F 16/215(2019.01) G06F 16/23(2019.01) G06F 16/25(2019.01) G06F 16/27(2019.01) G06Q 10/06(2012.01)G06Q 40/02(2012.01) (54)发明名称 金融信贷领域的数据治理方法及系统 (57)摘要 本发明公开了金融信贷领域的数据治理方 法及系统, 属于金融信贷风控技术领域, 本发明 要解决的技术问题为 以往金融信贷领域数据治 理中难以保证数据质量和复杂算法共存, 采用的 技术方案为: 该方法是先接入多源异构数据, 通 过数据标准化治理形成标准库, 通过主题建模形 成主题库, 并在主题库的基础上, 通过业务规则、 数据挖掘机数据建模形成应用层, 应用层板包括 指标库、 样 本库、 特征库和标签库; 主题库各层通 过数据同步的方式实现数据实时更新; 具体如 下: 获取并融合多源异构数据; 加工处理多源异 构数据; 建 设企业征信库; 建 设征信指标库。 权利要求书3页 说明书11页 附图2页 CN 115422173 A 2022.12.02 CN 115422173 A 1.一种金融信贷领域的数据治理方法, 其特征在于, 该方法是先接入多源异构数据, 通 过数据标准化治理形成标准库, 通过主题建模形成主题库, 并在主题库的基础上, 通过业务 规则、 数据挖掘机数据建模 形成应用层, 应用层板包括指标库、 样本库、 特征库和标签库; 主 题库各层通过 数据同步的方式实现数据实时更新; 具体如下: 获取并融合多源异构数据; 加工处理多源异构数据; 建设企业征信库; 建设征信指标库。 2.根据权利要求1所述的金融信贷领域的数据治理方法, 其特征在于, 获取并融合多源 异构数据的方式具体如下: 数据平台对接模式: 通过智能公共数据平台与公共数据平台对接, 实现相关部门的企 业基本信息、 不动产抵押信息、 股权出质信息、 股权冻结信息、 股权变更信息、 著名商标信 息、 个体注销信息、 单位住房公积金账户基本信息、 个人公积金账户信息、 婚姻登记信息、 单 位缴费信息、 养老单位参保信息、 医疗单位参保信息、 医疗账户余额、 税务黑名单、 纳税等 级、 失信人员名单、 裁判文 书及企业招投标信息数据的共享; 应用集成模式: 通过各接入部门的前置机, 并部署源共享交换平台前端适配器以及数 据交换平台接入终端需要的消息和 服务中间件适配器, 实现消息中间件、 应用集成中间件 及Web服务应用集成的数据 交换共享模式, 使得各数据源单位通过应用集成的方式将数据 提交至数据交换平台; 数据复制模式: 直联数据源系统的交换前置机与数据交换平台, 通过在前置机上部署 前置交换数据库, 利用基于数据库同步中间件的数据批量同步及复制实现数据的批量交 换; 在线数据导入模式: 针对无数据库存储, 通过文本整理保存数据的采集点; 对符合数据 交换平台数据采集标准要求的数据文件, 使用在线 数据导入的方式; 同时, 数据交换平台提 供在线数据采集表单, 参建单位在线访问填写及提交, 数据上传到数据交换平台后, 经过比 对校验检查 合格后, 加载到基础信息数据库中。 3.根据权利要求1所述的金融信贷领域的数据治理方法, 其特征在于, 加工处理多源异 构数据具体如下: 数据标准规范制定: 制定统一的数据标准规范对入库的多源数据进行规范化数据治 理; 治理加工: 通过相关的数据治理工具对多源数据进行治理加工, 实时接口数据通过内 存进行处理, 并结合批流处理模式对数据进 行数据加工处理、 数据标准化处理、 指标计算以 及轻特征挖掘; 数据融合: 多源数据通过横 纵向数据融合, 汇聚到统一的企业征信数据库中, 加工处理 成市场主体信息、 法定代表人信息、 经营异常名录信息、 严重违法失信企业名单信息、 行政 处罚公示信息、 股权变更公示信息及行政许 可公示信息的与企业征信相关的表。 4.根据权利要求3所述的金融信贷领域的数据治理方法, 其特征在于, 数据标准规范制 定是结合数据治理全链条, 具体包括基础数据规范、 数据集成规范、 数据建模规范、 数据治 理规范以及数据服 务规范制定数据标准 规范;权 利 要 求 书 1/3 页 2 CN 115422173 A 2其中, 基础数据规范包括元数据管理规范、 数据质量管理规范、 第三方部门数据源规范 以及系统生成数据规范; 数据集成规范包括数据源接口规范、 数据加工处理规范以及数据交换标准规范的数据 集成规范, 从数据源端的治理规范由各业 务系统单独制定; 数据建模规范包括数据库模型规范、 数据库设计规范、 数据库、 表编码规范以及SQL开 发规范; 数据治理规范包括数据采集管理规范、 数据加工管理规范、 数据存储管理规范、 数据知 识管理规范以及数据安全管理规范; 数据服务规范包括数据资源服 务规范、 数据计算 服务规范以及数据共享 服务规范。 5.根据权利要求3所述的金融信贷领域的数据治理方法, 其特征在于, 治理加工具体如 下: 数据规范化: 根据实际数据情况进行数据治理规范, 具体包括去噪、 去重以及字段规范 命名; 数据标准化: 按照国标及金融行业标准, 制定数据标准字典, 对表名、 字段名及表与字 段编码以及取值的进行规范, 并按照数据标准字典开发自动化脚本; 按照制 定标准对数据 标准化后, 进行数据清洗过程, 针对数据 空值及数据不一致的问题根据具体业务需求运用 相应的策略进行解决; 数据加工与测试: 根据数据标准化规则, 完成脚本加工与测试, 测试通过后, 部署至服 务器上, 完成数据的自动跑批加工过程。 6.根据权利要求3所述的金融信贷领域的数据治理方法, 其特征在于, 数据融合具体如 下: 各业务系统数据集成到企业征信库中后, 针对应用场景业务需求, 通过初筛规则脚本 跑批的方式对数据表及字段进行初步筛 选, 剔除没有业 务价值的表及字段; 对有业务价值, 表及数据存在缺失, 按照相应流 程反馈至源业务系统, 进行 数据共享; 对于共享的库表数据, 进行 数据的完整性、 准确性、 时效性及一 致性评估; 对于未达到数据质量评估阈值的数据, 按照相应流程反馈至源业务系统, 进行数据共 享。 7.根据权利要求1所述的金融信贷领域的数据治理方法, 其特征在于, 建设企业征信库 具体如下: 数仓主题设计, 具体如下: 金融服务贷款业务主题库设计: 金融服务贷款业务主题库设计实现贷款业务相关数据 库设计, 金融服务贷款业务主题库包括支撑信贷建模政务数据库、 贷款需求数据库、 贷款产 品数据库、 贷款 业务流程数据库、 贷款成果数据库、 贷款 监督数据库及贷款评价数据库; 金融服务保险业务主题库设计: 金融服务保险业务主题库设计实现保险业务相关数据 库设计, 金融服务保险业务主题库包括保险需求数据库、 保险产品数据库、 保险业务流程数 据库、 保险成果数据库、 保险监 督数据库及保险评价数据库; 金融服务股权融资业务主题库设计: 股权融资业务主题库实现对股权融资、 企业股权 融资项目和企业上市的相关业 务数据库的设计; 金融服务事项办理业务主题库设计: 金融服务事项办理业务主题库设计实现 “我要办”权 利 要 求 书 2/3 页 3 CN 115422173 A 3

PDF文档 专利 金融信贷领域的数据治理方法及系统

文档预览
中文文档 17 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 金融信贷领域的数据治理方法及系统 第 1 页 专利 金融信贷领域的数据治理方法及系统 第 2 页 专利 金融信贷领域的数据治理方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-07 12:40:07上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。