(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202210626910.5
(22)申请日 2022.06.06
(65)同一申请的已公布的文献号
申请公布号 CN 114708047 A
(43)申请公布日 2022.07.05
(73)专利权人 上海荣数信息技 术有限公司
地址 201210 上海市浦东 新区中科路69 9号
惠生大厦C 栋10层
(72)发明人 李璇 孙祥 刘阳 康森 胡新月
(74)专利代理 机构 上海市汇业 律师事务所
31325
专利代理师 王函
(51)Int.Cl.
G06F 17/00(2019.01)
G06Q 30/02(2012.01)G06F 16/36(2019.01)
G06F 40/30(2020.01)
G06K 9/62(2022.01)
G10L 15/22(2006.01)
G10L 15/26(2006.01)
(56)对比文件
CN 113779217 A,2021.12.10
CN 112131358 A,2020.12.25
CN 113051405 A,2021.0 6.29
审查员 李平
(54)发明名称
一种基于知识图谱的外呼策略运营方法与
系统
(57)摘要
本发明公开了一种基于知识图谱的外呼策
略运营方法与系统, 方法包含以下步骤: 获取语
料信息并进行处理得到语义节点, 其中, 所述语
义节点涉及多场景多业务; 获取业务办理流程信
息并进行处理得到话术节点, 其中, 所述话术节
点涉及多场景多业务; 根据所述语义节点与所述
话术节点构建基于知识图谱的外呼策略数据; 获
取对话数据并处理得到用户意图数据; 根据所述
用户意图数据从所述外呼策略数据中得到相应
的外呼策略, 进行外呼; 系统包含语料信息处理
模块、 业务办理流程信息处理模块、 外呼策略构
建模块、 外呼模块。
权利要求书3页 说明书12页 附图4页
CN 114708047 B
2022.09.09
CN 114708047 B
1.一种基于知识图谱的外呼策略运营 方法, 其特 征在于, 包 含以下步骤:
获取语料信 息并进行处理得到语义节点, 其中, 所述语义节点涉及多场景多业务; 所述
语料信息为用户问题的文本信息; 所述语义节点为用户提出 的某一类相似的问题的归类;
所述语料信息进行数据 清洗、 高频问题分析、 特征向量生 成、 聚类算法处理得到所述语义节
点; 所述高频问题分析的过程为对所述数据 清洗后形成的词组文本信息进 行高频关键词提
取得到高频问题数据;
获取业务办理流程信息并进行处理得到话术节点, 其中, 所述话术节点涉及多场景多
业务; 针对不同的语义节点设置不同的话术节点; 根据获取 的所述业务办理流程信息中业
务办理流 程图的业 务场景外呼任务进行处 理得到所述 话术节点;
根据所述语义节点与 所述话术节点构建基于知识图谱的外呼策略数据; 所述外呼策略
数据包含依据知识图谱的场景实体创建的外呼场景、 依据知识图谱的语义实体类创建用户
话术、 依据知识图谱的策略实体创建的外呼策略、 创建的相似问实体类、 创建的话术实体
类;
获取对话数据并处理得到用户意图数据; 所述对话数据为人工外呼的对话信息; 所述
用户意图数据为用户的话 术意图分析 数据;
根据所述用户意图数据从所述外呼策略数据中得到相应的外呼策略, 进行外呼; 根据
所述用户意图数据中当前的场景节点与用户语义节点来确定策略节点, 依据所述策略节点
从所述外呼策略数据中得到相应的外呼策略, 进行外呼; 所述场景节点 为一个业务类型;
所述根据所述用户意图数据从所述外呼策略数据中得到相应的外呼策略, 进行外呼,
还包含以下步骤: 当所述用户意图数据从所述外呼策略数据中未得到相 应的外呼策略时,
则获取所述用户意图数据中的对话场景属性, 当所述对话场景属性满足在当前的对话场景
中, 则依据分类算法模型将所述用户意图数据进行外呼场景 数据更换;
根据更换后的所述用户意图数据从所述外呼策略数据中得到相应的外呼策略, 进行外
呼;
所述分类算法模型获取 所述用户意图数据并更 换外呼场景 数据的方法包 含以下步骤:
将所述词组文本信息中的语料按业 务分类并贴上业 务标签构建数据集;
利用bert算法中文预训练模型将所述用户意图数据转换为特 征矩阵;
对所述bert算法中文预训练模型上做fine ‑tune算法微调, 进行分类算法得到外呼场
景数据并进行 更换。
2.如权利要求1所述的一种基于知识图谱的外呼策略运营方法, 其特征在于, 所述数据
清洗的过程 为对所述语料信息通过ASR转 义后去除标点、 分词后形成词组文本信息;
所述特征向量生成的过程为依据bert算法中文向量模型对所述词组文本信息进行特
征向量的提取并生成词向量;
所述聚类算法处理的过程为将所述词向量输入至聚类算法Kmeans中并反复实验得到
轮廓系数数据, 选取所述轮廓系 数数据中最大值对应的K值作为聚类中心个数, 总 结K个所
述聚类中心的话 术, 得出用户的所述语义节点。
3.一种基于知识图谱的外呼策略运营系统, 其特征在于, 包含语料信 息处理模块、 业务
办理流程信息处 理模块、 外呼策略构建模块、 外呼模块;
所述语料信息处理模块用于获取语料信息并进行处理得到语义节点, 其中, 所述语义权 利 要 求 书 1/3 页
2
CN 114708047 B
2节点涉及多场景多业务; 所述语料信息为用户问题的文本信息; 所述语义节点为用户提出
的某一类相似的问题的归类; 所述语料信息处理模块内置有数据清洗模块、 高频问题分析
模块、 特征向量生成模块、 聚类算法处理模块; 所述高频问题分析模块用于对所述数据清洗
模块形成的词组文本信息进行高频关键词提取 得到高频问题数据;
所述业务办理流程信息处理模块用于获取业务办理流程信息并进行处理得到话术节
点, 其中, 所述话术节点涉及多场景多业务; 针对不同的语义节点设置不同的话术节点; 根
据获取的所述业务办理流程信息中业务办理流程图的业务场景外呼任务进行处理得到所
述话术节点;
所述外呼策略构建模块获取所述语义节点与所述话术节点并构建基于知识图谱的外
呼策略数据; 所述外呼策略数据包含依据知识图谱的场景实体创建的外呼场景、 依据知识
图谱的语义实体类创建用户话术、 依据知识图谱的策略实体创建的外呼策略、 创建的相似
问实体类、 创建的话 术实体类;
所述外呼模块用于获取对话数据并处理得到用户意图数据, 并根据所述用户意图数据
从所述外呼策略数据中得到相应的外呼策略, 进行外呼, 所述对话数据为人工外呼的对话
信息; 所述用户意图数据为用户的话术意图分析数据; 根据所述用户意图数据中当前 的场
景节点与用户语义节 点来确定策略节点, 依据所述策略节点从所述外呼策略数据中得到相
应的外呼策略, 进行外呼; 所述场景节点 为一个业务类型;
该系统还 包含分类算法模型模块;
所述外呼模块处理时从所述外呼策略数据中未得到所述用户意图数据相应的外呼策
略时则获取所述用户意图数据中的对话场景属性, 当所述对话场景属性满足在当前的对话
场景中, 则生成传输 至所述分类算法模型模块的反馈数据;
所述分类算法模型模块依据所述反馈数据获取所述用户意图数据并更换外呼场景数
据;
根据更换后的所述用户意图数据从所述外呼策略数据中得到相应的外呼策略, 进行外
呼;
所述分类算法模型模块依据所述反馈数据获取所述用户意图数据并更换外呼场景数
据的方法包 含以下步骤:
将所述词组文本信息中的语料按业 务分类并贴上业 务标签构建数据集;
利用bert算法中文预训练模型将所述用户意图数据转换为特 征矩阵;
对所述bert算法中文预训练模型上做fine ‑tune算法微调, 进行分类算法得到外呼场
景数据并进行 更换。
4.如权利要求3所述的一种基于知识图谱的外呼策略运营系统, 其特 征在于,
所述数据清洗模块用于对所述语料信息通过ASR转义后去除标点、 分词后形成词组文
本信息;
所述特征向量生成模块用于依据bert算法中文向量模型对所述词组文本信息进行特
征向量的提取并生成词向量;
所述聚类算法处理模块用于将所述词向量输入至聚类算法Kmeans中并反复实验得到
轮廓系数数据, 选取所述轮廓系 数数据中最大值对应的K值作为聚类中心个数, 总 结K个所
述聚类中心的话 术, 得出用户的所述语义节点。权 利 要 求 书 2/3 页
3
CN 114708047 B
3
专利 一种基于知识图谱的外呼策略运营方法与系统
文档预览
中文文档
20 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 10:53:52上传分享