(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211311742.7
(22)申请日 2022.10.25
(71)申请人 西安交通大 学
地址 710048 陕西省西安市碑林区咸宁西
路28号
(72)发明人 郑庆华 武乐飞 师斌 王凯
董博 赵锐 赵子涵
(74)专利代理 机构 西安通大专利代理有限责任
公司 6120 0
专利代理师 闵岳峰
(51)Int.Cl.
G06Q 40/00(2012.01)
G06V 30/19(2022.01)
G06V 30/412(2022.01)
G06N 3/04(2006.01)
(54)发明名称
一种面向复杂税务数据系统的介区域识别
方法
(57)摘要
本发明公开了一种面向复杂动态网络的层
次划分和介区域识别方法, 包括: 首先, 通过 “静
态快照构建 ‑动态时序嵌入 ”两阶段的方法, 将复
杂数据系统转化为语义等价的, 包含对象、 关系、
属性和时序等要素的复杂动态网络; 其次, 基于
系统科学中绝热消去原理, 识别所关注的子系统
随动态网络演化的主导因素, 在此基础上构建边
界尺度的假设空间; 再次, 基于频繁子图挖掘算
法, 挖掘各边界尺度的子图实例中的Motif; 最
后, 基于二进制向量编码构建各边界尺度的相关
度矩阵, 再基于条件概率对边界尺度层级耦合关
系建模, 辨识子图模式层级耦合, 通过置信度阈
值判定两假设空间之间是否存在 介区域。
权利要求书5页 说明书11页 附图2页
CN 115496570 A
2022.12.20
CN 115496570 A
1.一种面向复杂税务数据系统的介区域识别方法, 其特 征在于, 包括以下步骤:
S101.静态快照构建 ‑动态时序嵌入; 首先, 针对复杂 税务数据系统时空多层次、 非线性
的特点, 基于时序编码嵌入的非线性动态网络模 型, 通过“静态快照 构建‑动态时序嵌入 ”两
阶段的方法, 将复杂数据系统转化为语义等价的, 包含对象、 关系、 属性和时序要素的复杂
动态网络;
S102.基于绝热消去的动态网络演化主导因素识别; 基于系统科学中绝热消去原理, 识
别所关注的子系统随动态网络演化的主导因素, 在此基础上构建边界尺度的假设空间;
S103.边界尺度子图模式挖掘; 基于频繁子图挖掘算法, 挖掘各边界尺度的子图实例中
的基序Motif;
S104.子图模式层级耦合辨识; 基于二进制向量编码构建各边界尺度的相关度矩阵, 再
基于条件概率对边界尺度层级耦合关系建模, 辨识子图模式的层级耦合, 通过置信度阈值
判定两假设空间之间是否存在 介区域。
2.根据权利要求1所述的一种面向复杂税务数据系统 的介区域识别方法, 其特征在于,
该方法具体包括以下实现步骤:
1)静态网络快照构建
为实现将复杂数据系统转化为语义等价的, 包含对象、 关系、 属性和时序要素的复杂动
态网络, 首先进行静态网络快照的构建, 获取动态网络在时间上的有序图集, 即 复杂数据系
统在不同时刻的快照集 合;
2)动态时序嵌入
为了在获得动态网络演化模式的同时, 最大程度保留网络结构信息, 对动态网络进行
时序编码嵌入;
3)识别动态网络演化的主导因素
系统从无序到有序或从低序到 高序的变化过程称为 “相变”, 系统在相变处 的内部参量
分为慢弛豫变量和快弛豫变量, 慢弛豫变量的数目少但衰减速度慢, 它 是决定系统相 变的
根本变量; 快弛豫变量数目相对较多但衰减速度较快, 它服从于慢弛豫变量, 对系统的相变
起到辅助作用; 慢弛豫变量在系统演化过程中从无到有地变化, 并通过对其它快弛豫变量
的支配或役使作用, 主宰着系统整体演化的过程, 指示出新结构的形成, 反映新结构的有序
程度, 就是序参 量, 亦即系统演化的主导因素;
基于系统科学中的绝热消去原理, 识别所关注的子系统随动态网络演化的主导因素
DF, 在DF的引导下构建边界尺度假设空间;
4)边界尺度子图模式挖掘
基于频繁子图挖掘算法, 挖掘各边界尺度子图实例中的基序Motif, 基于图模式匹配获
取动态网络中各节点在Motif下的向量编码, 该向量编码用以指示是否匹配相应的Motif;
5)子图模式层级 耦合辨识
基于步骤4)中的向量编码, 构建各边界尺度间的相关度矩阵W∈Rn*n, 基于条件概率对
边界尺度间层级耦合关系建模, 得到概率形式的相关度矩阵, 最后判定两边界尺度间是否
满足层级 耦合关系, 进 而识别两边界尺度间是否存在 介区域。
3.根据权利要求2所述的一种面向复杂税务数据系统 的介区域识别方法, 其特征在于,
步骤1)中, 静态网络快照构建具体包括以下步骤:权 利 要 求 书 1/5 页
2
CN 115496570 A
2Step1.复杂税务数据系统的网络表示
为了描述复杂税务数据系统结构, 根据税 务数据系统的特点对系统的网络进行定义; Gt
=(Vt,Et)表示t时刻的网络拓扑图, Vt与Et分别表示该时刻构成网络的对象集合和对象间
关系的集 合;
Step2.复杂税务网络快照构建
定义动态网络模型G={G1,G2,…,GT}, 是时间上的有序图集, 由复杂税务网络在不同时
刻的静态快照组成, 并随着时序的变化, 网络结构不断调整; 其中Gt=(Vt,Et)表示t时刻网
络拓扑图, 对应的概要图为Gs=(Vs,Es,Le,Ws,Atts), 这里, Vs=V1∪V2∪…∪VT; Es=E1∪E2
∪…∪ET; Le表示与边集Es的对应的标签集合, 用以反映不同时刻下网络结构的变化, 其元
素le是维度为T的仅包含0或1的向量, 当le中位置t为1时, 表示边e属于第t时刻的网络Gt=
(Vt,Et), 反之, 边e不属于该时刻的网络; Ws表示对象间关系的权重; Atts是对象的属 性, 每
个元素atte均是一个多维矩阵, 存储对象的属性特征, 如
其中n为属
性空间的维度。
4.根据权利要求3所述的一种面向复杂税务数据系统 的介区域识别方法, 其特征在于,
步骤1)的Step1中, 复杂税务数据系统是由具有不同属性的对象和关系在时序非线性作用
下形成的整体; 税务数据系统中的对象属于异构数据, 包括 企业、 法人、 自然 人、 税务机 关和
工商机关。
5.根据权利要求3所述的一种面向复杂税务数据系统 的介区域识别方法, 其特征在于,
步骤2)中, 动态时序嵌入具体包括以下步骤:
Step1.数据预处 理
根据步骤1)中复杂税务数据系统的网络定义, 对数据进行预处理, 将数据处理为带有
时序标记的元组:
其中, A表示网络节点的邻接矩阵, X表示节点特 征矩阵, A tt表示属性特 征矩阵;
Step2.时间步内网络结构特 征提取
基于GAT获取时间步内的网络结构特征, 在某一时刻t获取网络的静态快照, 表示为
Step1中的元组形式输入到一个两层的GAT单元, 通过权重学习, 获取时刻t的网络结构特征
向量H, 即H为:
其中,
是l层的特征向量, Wt(l)是l层
的投影矩阵,
是l层的注意力矩阵;
Step3.时间步间的网络演化时序嵌入
通过更新时间步间 的模型权重信息, 实现网络演化的时序嵌入, 基于Transformer神经
网络模型, 将Step2中的模型权重矩阵Wt(l)看作动态系统的输出, 然后基于Transformer的
时序建模能力, 根据t ‑1以及之前时刻的输入得到当前时刻的输出, 更新公式为:
权 利 要 求 书 2/5 页
3
CN 115496570 A
3
专利 一种面向复杂税务数据系统的介区域识别方法
安全报告 >
其他 >
文档预览
中文文档
19 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 思考人生 于 2024-02-24 08:58:04上传分享