(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210390229.5
(22)申请日 2022.04.14
(71)申请人 中国联合网络通信集团有限公司
地址 100033 北京市西城区金融大街21号
(72)发明人 朱峰炜 沈治廷 黄恒杰 谭杰
李家明 王健 王楷波
(74)专利代理 机构 北京同立钧成知识产权代理
有限公司 1 1205
专利代理师 王军振 臧建明
(51)Int.Cl.
G06F 16/23(2019.01)
G06F 16/2458(2019.01)
G06K 9/62(2022.01)
G06Q 50/30(2012.01)
(54)发明名称
数据处理策略的确定方法、 装置和设备
(57)摘要
本申请提供一种数据处理策略的确定方法、
装置和设备。 该方法包括: 通过根据获取到的数
据, 构建第一数据集合, 第一数据集合中包括至
少一项与 问题来源相关的数据, 或者, 包括至少
一项与问题来源相关的数据和至少一项与异常
表现相关的数据; 分别确定第一数据库中预先存
储的多个第二数据集合中的元素与第一数据集
合中的元素之间的相似度, 任一第二数据集合中
包括至少一项与问题来源相关的数据, 以及至少
一项与异常表现相关的数据; 根据预先存储的各
第二数据集合与处理策略之间的对应 关系, 以及
相似度, 确定第一数据集合对应的目标处理策
略。 通过该方法能够自动确定出数据处理策略,
提高确定效率。
权利要求书3页 说明书14页 附图3页
CN 114756560 A
2022.07.15
CN 114756560 A
1.一种数据处 理策略的确定方法, 其特 征在于, 包括:
根据获取到的数据, 构建第一数据集合, 所述第一数据集合中包括至少一项与问题来
源相关的数据, 或者, 包括至少一项与问题来源相关的数据和至少一项与异常表现相关的
数据, 所述与问题 来源相关的数据包括如下数据中的一种或者多种: 用户账单数据、 用户订
购的业务数据, 所述与异常表现相关的数据包括如下数据中的一种或者多种: 通信异常数
据、 资费异常数据、 用户资料异常变更;
分别确定第一数据库中预先存储的多个第二数据集合中的元素与所述第一数据集合
中的元素之间的相似度, 任一所述第二数据集合中包括至少一项与问题来源相关的数据,
以及至少一项与异常表现相关的数据;
根据预先存储的各所述第二数据集合与处理策略之间的对应关系, 以及所述相似度,
确定所述第一数据集 合对应的目标处 理策略。
2.根据权利要求1所述的方法, 其特征在于, 所述根据获取到的数据, 构建第一数据集
合, 包括:
获取第一预设时长 内, 与第二数据库中预先存储的任一所述第 二数据对应的至少一个
第三数据, 所述第二数据为所述与问题来源相关的数据, 或者, 所述与异常表现相关的数
据;
根据各所述第三数据的取值, 确定所述至少一个第三数据中是否存在异常数据, 若存
在, 则将所述异常数据作为元 素构建所述第一数据集 合。
3.根据权利要求2所述的方法, 其特征在于, 所述分别确定第 一数据库中预先存储的多
个第二数据集 合中的元 素与所述第一数据集 合中的元 素之间的相似度, 包括:
确定预先存储的各第二数据集合中的所述与问题来源相关的数据与所述第一数据集
合中的所述与问题来源相关的数据之间的第一相似度;
确定预先存储的各第二数据集合中的所述与异常表现相关的数据与所述第一数据集
合中中的所述与异常表现相关的数据之间的第二相似度;
相应的, 所述根据预先存储的各所述第二数据集合与处理策略之间的对应关系, 以及
所述相似度, 确定所述第一数据集 合对应的目标处 理策略, 包括:
根据预先存储的各所述第 二数据集合与处理策略之间的对应关系, 以及各所述第 一相
似度和各 所述第二相似度, 确定所述第一数据集 合对应的目标处 理策略。
4.根据权利要求3所述的方法, 其特征在于, 所述根据预先存储的各所述第 二数据集合
与处理策略之间的对应关系, 以及各所述第一相似度和各所述第二相似度, 确定所述第一
数据集合对应的目标处 理策略, 包括:
将各所述第 一相似度和各所述第 二相似度分别与第 一预设阈值进行比较, 并将第 一相
似度大于或者等于所述第一预设阈值时所对应的第二数据集合, 或者, 第二相似度大于或
者等于所述第一预设阈值时所对应的第二数据集 合, 确定为第一预选数据集 合;
统计所述第一预选数据集 合的数量;
若所述第一预选数据集合的数量大于或者等于第 二预设阈值, 则从所述第 一预选数据
集合中确定出 所述目标 数据集合;
根据预先存储的各所述目标数据集合与处理策略之间的对应关系, 确定所述第 一数据
集合对应的目标处 理策略。权 利 要 求 书 1/3 页
2
CN 114756560 A
25.根据权利要求4所述的方法, 其特征在于, 所述从所述第 一预选数据集合中确定出目
标数据集合, 包括:
将所述第一相似度大于或者等于第三预设阈值, 或者, 所述第二相似度大于或者等于
第三预设阈值的第一预选数据集 合, 确定为第二预选数据集 合;
统计所述第二预选数据集 合的数量;
若所述第一预选数据集合的数量大于或者等于第四预设阈值, 则将所述第 二预选数据
集合确定为所述目标 数据集合。
6.根据权利要求4或5所述的方法, 其特征在于, 所述根据预先存储的各所述目标数据
集合与处理策略之间的对应关系, 确定所述第一数据集 合对应的目标处 理策略, 包括:
根据预先存储的各所述目标数据集合与处理策略之间的对应关系, 确定各所述处理策
略出现的频次;
将出现频次最高的所述处 理策略, 确定为所述第一数据集 合对应的目标处 理策略。
7.根据权利要求3 ‑5中任一项所述的方法, 其特 征在于, 还 包括:
获取至少一个第三数据集合, 所述第三数据集合为在第二预设时长内, 所对应的目标
处理策略未发生变化的第一数据集 合;
根据各所述第 三数据集合中的元素, 确定任一所述第 三数据集合对应的支持度和置信
度;
将所述支持度 大于或者等于第五预设阈值, 且所述置信度 大于或者等于第六预设阈值
的第三数据集 合, 确定为第四数据集 合;
根据所述第四数据集 合中的元 素, 更新所述第二数据库。
8.根据权利要求7所述的方法, 其特征在于, 所述根据所述第 四数据集合中的元素, 更
新所述第二数据库, 包括:
针对任一所述第四数据集 合:
根据所述第四数据集合中的元素与 各所述第 二数据集合中的元素, 确定所述第四数据
集合包括的第三子集 合与各所述第二数据集 合之间的第三相似度;
根据所述第四数据集合中的元素与 各所述第 二数据集合中的元素, 确定所述第四数据
集合包括的第四子集 合与各所述第二数据集 合之间的第四相似度;
将仅存在所述第三相似度大于或者等于第七预设阈值的第 四数据集合, 或者, 仅存在
所述第四相似度大于或者 等于第七预设阈值的第四数据集 合, 确定为 风险数据集 合;
根据所述 风险数据集 合中的元 素, 更新所述第二数据库。
9.根据权利要求8所述的方法, 其特征在于, 所述根据所述风险数据集合中的元素, 更
新所述第二数据库, 包括:
获取第三预设时长内所生成的新的第三数据集 合;
针对所述风险数据集合中的第 一元素, 确定所述新的第 三数据集合是否存在所述第 一
元素;
若存在所述第一元 素, 则将所述第一元 素补入所述第二数据库。
10.根据权利要求1所述的方法, 其特征在于, 所述根据获取到数据, 构建第一数据集
合, 包括:
根据获取到的用户输入的数据中与 预设的元素类型一致的数据, 构建所述第 一数据集权 利 要 求 书 2/3 页
3
CN 114756560 A
3
专利 数据处理策略的确定方法、装置和设备
安全报告 >
其他 >
文档预览
中文文档
21 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 思考人生 于 2024-02-24 08:49:59上传分享