全网唯一标准王
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111355053.1 (22)申请日 2021.11.16 (71)申请人 北京圣承方略咨询有限公司 地址 100000 北京市朝阳区创远路3 6号院1 号楼4层401室 (72)发明人 张胜  (74)专利代理 机构 湖南楚墨知识产权代理有限 公司 43268 代理人 李纯斌 (51)Int.Cl. G06F 16/9535(2019.01) G06K 9/62(2022.01) G06N 3/02(2006.01) G06N 20/00(2019.01) (54)发明名称 一种基于算法模型的线索智能匹配方法 (57)摘要 本发明涉及信息处理领域, 具体而言, 涉及 一种基于算法模 型的线索智能匹配方法, 包括如 下步骤: S1: 获取线索信息; S2: 主机厂自身填充 完善线索内容; S3: 通过第三方数据进一步填充 完善线索内容; S4: 数据预处理; S5: 特征工程; S6: 模型训练与优化, 本发明主要解决了主机厂 在营销过程中, 对已有线索由人工匹配到模型自 动匹配的转变, 解决了线索匹配过程中的粗放式 线索派发, 降低了人为干预, 提高了分配精度。 权利要求书2页 说明书5页 附图1页 CN 114048382 A 2022.02.15 CN 114048382 A 1.一种基于算法模型的线索智能匹配方法, 其特 征在于, 包括如下步骤: S1: 获取线索信息; S2: 主机厂自身填充完 善线索内容; S3: 通过第三方 数据进一 步填充完善线索内容; S4: 数据预处 理; S5: 特征工程; S6: 模型训练与优化。 2.根据权利要求1所述的一种基于算法模型的线索智能匹配方法, 其特征在于, 所述步 骤S1中, 获取线索信息: 在一种可能的实施方式中, 原始线索信息是最基础, 也是最重要的 数据源, 主机厂 商通过不同渠道获取线索, 是其后期营销方案施行的基础。 3.根据权利要求1所述的一种基于算法模型的线索智能匹配方法, 其特征在于, 所述步 骤S2中, 在 主机厂自身填充完善线索内容中, 主机厂在长期运营工作中, 积累了大量的用户 信息, 经过结构化处理之后, 该部分信息可填充进用户画像, 在该营销场景中, 可利用该部 分数据, 对线索进行内容 填充, 方便后期的计算。 4.根据权利要求1所述的一种基于算法模型的线索智能匹配方法, 其特征在于, 所述步 骤S3中, 通过第三方数据进一步填充完善线索内容: 由于主机厂自身拥有的数据多为已购 车群体的信息, 该部 分数据在新线索预测场景中有 先天不足, 所以需要引入新的数据源, 来 对线索信息进 行内容补充, 在此, 我们选择了第三方数据, 线索经过多 方数据进 行内容填充 之后, 基本可满足模型训练的要求。 5.根据权利要求1所述的一种基于算法模型的线索智能匹配方法, 其特征在于, 所述步 骤S4中, 数据预处理: 数据预处理的目的是排除数据有效特征信息外的冗余数据和干扰数 据。 对数据源数据进行 数据预处 理的方式包括但不限于以下处 理过程: a、 针对空间信息, 进行 经纬度转换处 理; b、 针对链接信息, 进行删除处 理; c、 针对新闻资 讯类APP、 主题信息等, 进行删除处 理; d、 针对用户名、 用户昵称, 进行删除处 理; e、 针对非结构化数据, 进行格式化加工处 理; f、 针对特殊符号, 进行删除处 理; g、 针对表情符号, 进行正则表达式匹配, 替换为表达式对应的标准数据; h、 一般字段进行缺失值 填充, 原则上填充后的数据分布与填充前应保持不变。 6.根据权利要求1所述的一种基于算法模型的线索智能匹配方法, 其特征在于, 特征工 程: 特征工程的目的是从原始数据中产生能够被用于建模的数据的过程, 可以起到包括但 不限于以下作用: 第一: 使模型更容易被解释, 例 如对年龄, 收入进行数据分箱(binning), 可得到对应的 年龄段和收入层级; 第二: 减少数据冗余并降低数据维度, 例如主成分分析(PCA), 由于所在城市, 职业等类 别型特征的种类太多, OneHot编码之后, 形成的矩阵过于庞大且稀疏, 此时需要对原始的编 码结果进行降维处 理; 第三:重新缩放变量, 例如标准化或归一化, 当特征表示为精准的数字型数据时, 可以权 利 要 求 书 1/2 页 2 CN 114048382 A 2进行标准化或归一化处理, 处理之后的数据可理解为数据在所属字段中的分布状态, 解决 了不同数据间量纲不同, 难以同时计算的问题; 第四: 捕获更复杂的关系, 例如神经网络, 神经网络是今年来新兴的一种数据计算方 式, 计算功能强大, 原理相对简单, 如果经典机器学习模型不能满足业务要求, 可考虑使用 神经网络模型。 7.根据权利要求1所述的一种基于算法模型的线索智能匹配方法, 其特征在于, 在步骤 S6中, 模型训练与优化: 获取历史样本线索唯一 ID, 补充样本线索内容; 基于样本线索在主机厂数据库中的状态, 以及主机厂和第三方补充内容之后的数据, 进行数据预处理与特征工程, 完成之后的数据构成了待训练的样本数据, 将样本数据输入 待训练的线索智能匹配模型进行训练, 其中训练过程包括: 在一层模型中, 将每一个样本数据 所对应的信 息输入至待训练 的门店智能匹配模型模 型中, 输出每一个样本线索与每 个4S店相对应的匹配分值; 基于线索智能匹配模型模型输出的每一个样本线索与每个4S店相对应的匹配分值, 确 定样本线索最匹配的两个4S店; 基于确定出的每一个样本线索最匹配的两个4S店, 确定本次训练的准确率, 精确率, 召 回率, AUC; 判断本次训练的准确率, 精确率, 召回率, AUC是否满足业 务场景需求; 在二层模型中, 将每一个样本数据 所对应的信 息输入至待训练 的线索智能匹配模型模 型中, 输出每一个样本线索与每 个销售人员相对应的匹配分值; 基于线索智能匹配模型模型输出的每一个样本线索与每个销售人员相对应的匹配分 值, 确定样本线索最匹配的两个销售人员; 基于确定出的每一个样本线索最匹配的两个销售人员, 确定本次训练的准确率, 精确 率, 召回率, AUC; 判断本次训练的准确率, 精确率, 召回率, AUC是否满足业 务场景需求。 确定线索智能匹配模型模型训练完成。权 利 要 求 书 2/2 页 3 CN 114048382 A 3

.PDF文档 专利 一种基于算法模型的线索智能匹配方法

文档预览
中文文档 9 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共9页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于算法模型的线索智能匹配方法 第 1 页 专利 一种基于算法模型的线索智能匹配方法 第 2 页 专利 一种基于算法模型的线索智能匹配方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 18:59:51上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。