全网唯一标准王
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111362361.7 (22)申请日 2021.11.17 (71)申请人 北京交通大 学 地址 100044 北京市海淀区西直门外上园 村3号 (72)发明人 王楠 张大林 刘娟  (74)专利代理 机构 北京市商 泰律师事务所 11255 代理人 黄晓军 (51)Int.Cl. G06Q 40/02(2012.01) G06N 20/00(2019.01) (54)发明名称 一种基于联邦学习的风险权重融合的异常 检测方法 (57)摘要 本发明提供了一种基于联邦学习的风险权 重融合的异常检测方法。 该方法包括: 将参与联 邦学习的各银行机构视为客户端, 各个客户端分 别建立机器学习模型, 在每轮迭代中, 各个客户 端的机器学习模型利用本地数据样本集迭代训 练后, 提取参数更新信息和本轮次训练的风险权 重信息, 并上传至中央服务器; 中央服务器将接 收到的所有参数更新信息融合各客户端的风险 权重信息进行安全聚合后, 下发联合模 型参数更 新信息给各个客户端, 各个客户端根据接收的联 合模型更新信息进行本地的机器学习模型的参 数更新。 本发 明通过风险权值聚合的方式强化提 取相应参与方的优势特征, 在金融欺诈识别等异 常检测领域, 对于异常数据检测的准确率和召回 率进行提升 。 权利要求书3页 说明书10页 附图1页 CN 114358912 A 2022.04.15 CN 114358912 A 1.一种基于联邦学习的风险权 重融合的异常检测方法, 其特 征在于, 包括: 将参与联邦学习的各银行机构视为客户端, 各个客户端分别建立相同结构的机器学习 模型, 各个机器学习模型的初始参数由中央参数服 务器下发; 在每轮迭代中, 各个客户端的机器学习模型利用本地数据样本集迭代训练后, 提取参 数更新信息和本轮次训练的风险权重信息, 将参数更新信息和风险权重信息上传至中央服 务器; 所述中央服务器将接收到的所有参数更新信息融合各客户端的风险权重信息进行安 全聚合后, 下发联合模型参数更新信息给各个客户端, 各个客户端根据接 收的联合模型更 新信息进 行本地的机器学习模型的参数更新, 每个客户端分别利用自己的机器学习模型进 行本地数据的异常检测。 2.根据权利要求1所述的方法, 其特征在于, 所述的将参与 联邦学习的各银行机构视为 客户端, 各个客户端分别 建立相同结构的机器学习模型, 各个机器学习模型 的初始参数 由 中央参数服 务器下发, 包括: 设固定一组各本地的银行机构做为联邦学习的参与者, 将各银行机构视为客户端, 各 个客户端分别 建立自己的机器学习模型, 各个机器学习模型 的结构相同, 由中央参数服务 器下发的初始化参数相同, 训练中各客户端 借助中央参数服务器进行参数信息安全聚合与 同步, 每个客户端独立利用自己的机器学习模型进行本地数据的异常检测, 所有客户端的 机器学习模型 经过通信迭代形成中央联合异常检测模型。 3.根据权利要求1所述的方法, 其特征在于, 所述的在每轮迭代中, 各个客户端的机器 学习模型利用本地数据样本集迭代训练后, 提取参数更新信息和本轮次训练的风险权重信 息, 将参数 更新信息和风险权 重信息上传至中央服 务器, 包括: 设固定C家银行参与联合模型训练, 每个银行机构都有一个本地的数据样本集, 第c个 银行机构的数据样本集 为Dc: 是特征向量, 是标签, nc表示参与联邦学习的第c个银行机构的数据 集的大小, C为 银行机构的总数; 在每一轮训练迭代t=1,2, …中, 每家银行机构在基于自己数据样本集上进行机器学 习模型训练, 计算本轮训练的参数 更新信息 计算本轮训练的风险权 重信息: 模型准确 率 和针对欺诈严重程度的权 重调节策略sc, 将 和sc上传至中央参数服 务器。 4.根据权利要求3所述的方法, 其特征在于, 所述的每家银行机构在基于自己数据样本 集上进行机器学习模型训练, 计算本轮训练的参数更新信息 计算本轮训练的风险权 重信息: 模型准确率 和针对欺诈严重程度的权重调节策略sc, 将 和sc上传至中 央参数服 务器进行安全聚合, 包括: 1): 代表第c家银 行机构第t轮训练中获得的参数 更新信息, 具体 计算公式如下: 权 利 要 求 书 1/3 页 2 CN 114358912 A 2其中, wt‑1代表上一轮次联合模型参数, 代表本轮次第c家银行进行本地机器学习模 型训练迭代生成的新的模型参数, 各客户端端本地完成多次迭代, 代表完成整个联合训 练轮次迭代的所有梯度更新之后的参数; 针对每次梯度 下降训练过程, 本地机器学习 模型参数根据 数据样本集上测试的损失按 照学习速率 η进行梯度更新, 具体 计算公式如下: 代表第c家银行本地数据集训练时模型的平均损失对当前参数 的梯 度, 损失值Lc(xc,yc; wt)由每个数据样本的损失在该银行数据集所有样本上求均值而得, 具 体计算公式如下: 其中, l(xi,yi; wt)代表单个样本的损失, Dc代表第c家银行的数据集样本空间, nc代表第 c家银行的数据集样本数量; 2)计算模型准确率 模型准确率 代表某家银行该轮次训练所得本地机器学习模型预测正确数量所占 样本总量的比例, 具体 计算公式如下: 代表模型正确预测出的欺诈样本数量, 代表模型错误预测为欺诈样本的数量, 代表模型正确预测出的良性样本数量, 代表模型错 误预测为良性样本的数量; 计算各客户端本地数据集欺诈严重程度数值sc: 各银行机构计算本地数据集欺诈样本严重程度数值为S(s1,s2……sC), 欺诈严重程度 参数sC与数据集大小、 数据集包 含的欺诈样本比例和欺诈金额 正相关; 设共C家银行机构参与联邦训练, 则在中央参数服务器聚合参数梯度信息时, 第c家银 行机构的本地机器学习模型的更新代入欺诈程度权 重值的计算方法如下: 公式(6)中, 分子sc代表第c家银行数据集的欺诈严重级别, 分母 代表所有参与联 邦训练的银 行数据集的欺诈级别总和, rc为第c家银 行数据集的欺诈严重程度权值; 3)各客户端每轮次训练后中央参数服务器计算融合风险权重信息的各客户端的机器 学习模型 更新信息, 即: 公式(7)中, 代表第c家银行机构该轮次训练的风险权重, 融合后面 的本地机器学权 利 要 求 书 2/3 页 3 CN 114358912 A 3

.PDF文档 专利 一种基于联邦学习的风险权重融合的异常检测方法

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于联邦学习的风险权重融合的异常检测方法 第 1 页 专利 一种基于联邦学习的风险权重融合的异常检测方法 第 2 页 专利 一种基于联邦学习的风险权重融合的异常检测方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 18:59:52上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。