(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111386337.7
(22)申请日 2021.11.22
(71)申请人 中国农业银行股份有限公司陕西省
分行
地址 710075 陕西省西安市高新区唐延路
31号
(72)发明人 杜婧 杨青 王斌 李应炜 何宁
袁渊 高媛 陈若雅 杜沛
(74)专利代理 机构 西安维赛恩专利代理事务所
(普通合伙) 61257
代理人 刘春
(51)Int.Cl.
G06Q 10/04(2012.01)
G06Q 40/02(2012.01)
G06N 3/04(2006.01)G06N 3/08(2006.01)
(54)发明名称
一种基于深度学习的客户流失预测方法
(57)摘要
本发明公开了一种基于深度学习的客户流
失预测方法, 包括: 步骤1: 获取银行客户的个人
信息数据; 步骤2: 利用生成式对抗填补网络模
型, 对步骤1中获取的个人信息数据进行缺失值
填补, 再对填补后的个人信息数据进行最大 ‑最
小归一化处理; 步骤3: 搭建MSDCNN ‑LSTM预测模
型, 步骤4: 训练MSDCNN ‑LSTM预测模型; 步骤5: 将
客户数据输入到经步骤4训练好的MSDCNN ‑LSTM
预测模型, 得到待测客户的流失概率。 其解决了
传统机器学习方法在预测大数据下银行客户流
失概率时效率低的问题。
权利要求书1页 说明书6页 附图2页
CN 114066075 A
2022.02.18
CN 114066075 A
1.一种基于深度学习的客户流失预测方法, 其特 征在于, 包括:
步骤1: 获取银行客户的个人信息数据; 所述真实个人信息数据包括客户编号、 信用评
分、 地方区域特征、 性别、 年龄、 开户时长、 存款余额、 平均资产增量、 持有金融产品数量、 负
债额度、 活跃度评分、 现金平均流入流出比;
步骤2: 利用生成式对抗填补网络模型, 对步骤1中获取的个人信息数据进行缺失值填
补, 再对填补后的个人信息数据进行最大 ‑最小归一 化处理;
步骤3: 搭建MSDCNN ‑LSTM预测模型, 所述MSDCNN ‑LSTM预测模型由三层MSCNN和两层
LSTM拼接而成;
步骤4: 训练MS DCNN‑LSTM预测模型;
步骤5: 将客户数据输入到经步骤4训练好的MSDCNN ‑LSTM预测模型, 得到待测客户的流
失概率。
2.如权利要求1所述的一种基于深度 学习的客户流失预测方法, 其特征在于, 所述步骤
1中, 对获取的个人信息数据进行缺失值填补的方法为: 利用生成式对抗填补 网络模型, 生
成与所述真实个人信息数据集分布规律相符的时间序列数据, 通过判别生成个人信息数据
与真实个人信息数据的差别, 根据偏差训练生成器, 如此交替直至判别器无法判别生成数
据与真实数据的差别。
3.如权利要求1或2所述的一种基于深度学习的客户流失预测方法, 其特征在于, 所述
步骤2中, 对填补后的个人信息数据最大 ‑最小归一化处理的具体方法为: 假设所述个人信
息数据为X=[X1,X2,...,Xi,...,Xn]∈Rm×n, 其中, m为数据特征个数, n为客户个数, Xi为第i
个客户对应m个特 征值, 即Xi=[xi,1,xi,2,...,xi,j,...,xi,m]∈Rm×1,
其中, xi,j为第i个客户对应的第j个特 征值;
每个值经过最大‑最小归一 化处理, 表示为:
式中,
表示归一化处理后的数据,
和
分别表示第j个特征值的最小值和最大
值。权 利 要 求 书 1/1 页
2
CN 114066075 A
2一种基于深度学习的客户流失 预测方法
技术领域
[0001]本发明属于银行数据管理技术领域, 具体涉及一种基于深度学习的客户流失 预
测方法。
背景技术
[0002]随着社会经济 的快速发展, 银行行业日趋成熟, 行业竞争愈演愈烈。 一定量 的客
户流失会给银行带来巨大损失, 客户流失的成本远低于挖掘一位新客户, 如 何减少客户的
流失以及及时的挽回客户将 变得尤为关键。 随着人工智能的迅猛 发 展, 将人工智能技术应
用到银行行业的客户分析中, 可以有效降低银 行行业的运 营成本, 提升客户的保持率。
[0003]目前大部分研究中使用的都是传统的机器学习方法, 需要对数据进行大量的 预
处理工作, 特别是在特征工程上需要花费大量的时间和精力, 随着客户数量的 爆炸式增
长, 传统机器学习方法已经 无法满足大 数据下的银 行客户的分析需求。
发明内容
[0004]本发明的目的是提供一种基于深度学习的客户流失预测方法, 以解决传统机 器
学习方法在预测大 数据下银行客户流失概 率时效率低的问题。
[0005]本发明采用以下技 术方案: 一种基于深度学习的客户流失预测方法, 包括:
[0006]步骤1: 获取银行客户的个人信息数据; 所述真实个人信息数据包括客户编 号、 信
用评分、 地方区域特征、 性别、 年龄、 开户时长、 存款余额、 平均资产增 量、 持有金融产品数
量、 负债额度、 活跃度评分、 现金平均流入流出比;
[0007]步骤2: 利用生成式对抗填补网络模型, 对步骤1中获取的个人信息数据进 行缺失
值填补, 再对填补后的个人信息数据进行最大 ‑最小归一 化处理;
[0008]步骤3: 搭建MSD CNN‑LSTM预测模型, 所述MSD CNN‑LSTM预测模 型 由三层MS CNN和两
层LSTM拼接而成;
[0009]步骤4: 训练MS DCNN‑LSTM预测模型;
[0010]步骤5: 将客户数据输入到经步骤4训练好的MSDCNN ‑LSTM预测模型, 得到待测客
户的流失概 率。
[0011]进一步的, 步骤1中, 对获取的个人信息数据进行缺失值填补的方法为: 利 用生成
式对抗填补网络模型, 生成与所述真实个人信息数据集分布 规律相符的时 间序列数据, 通
过判别生成个人信息数据与真实个人信息数据的差别, 根据偏差 训练生成器, 如此 交替直
至判别器无法判别生成数据与真实数据的差别。
[0012]进一步的, 步骤2中, 对填补后的个人信息数据最大 ‑最小归一化 处理的具 体方法
为: 假设所述个人信息 数据为X=[X1,X2,...,Xi,...,Xn]∈Rm×n, 其中, m为数据特 征个数, n
为客户个数, Xi为第i个客户对应m个特 征值, 即 Xi=[xi,1,xi,2,...,xi,j,...,xi,m]∈Rm×1,
[0013]其中, xi,j为第i个客户对应的第j个特 征值;
[0014]每个值经过最大‑最小归一 化处理, 表示为:说 明 书 1/6 页
3
CN 114066075 A
3
专利 一种基于深度学习的客户流失预测方法
文档预览
中文文档
10 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-19 03:16:20上传分享