全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 20221014615 0.8 (22)申请日 2022.02.17 (71)申请人 北京工业大 学 地址 100124 北京市朝阳区平乐园10 0号 (72)发明人 何泾沙 洪睿 朱娜斐 魏巍  陈燕博 宋国正  (74)专利代理 机构 北京汇信合知识产权代理有 限公司 1 1335 专利代理师 王维新 (51)Int.Cl. G06F 16/33(2019.01) G06F 16/35(2019.01) G06F 16/36(2019.01) G06K 9/62(2022.01) G06N 3/04(2006.01)G06N 3/08(2006.01) G06F 16/951(2019.01) G06F 40/216(2020.01) G06F 40/242(2020.01) G06F 40/289(2020.01) (54)发明名称 一种基于购物评论的人格特质分析方法及 系统 (57)摘要 本发明公开了一种基于购物评论的人格特 质分析方法及系统, 方法包括: 获取评论数据构 建评论样本数据集, 并进行分词及标注, 得到实 验数据集; 将实验数据集向量化后输入LSTM网络 模型, 得到情感倾向; 通过SC ‑LIWC词典提取的关 键词计算与每个人格维度的皮尔逊相关系数; 将 实验数据集的特征结合皮尔逊相关系数和情感 倾向, 输入以KNN、 NB和SVM共同构建的人格特质 分析融合模 型进行训练; 针对所需分析的评论数 据进行文本 特征及情感特征提取, 通过LSTM网络 模型得到情感倾向量化值, 并输入 人格特质分析 融合模型, 输出多标签的人格特质属性。 通过本 发明的技术方案, 实现了对评论数据的情感倾向 量化及人格特质分类, 为个性推荐提供支持。 权利要求书3页 说明书10页 附图4页 CN 114519091 A 2022.05.20 CN 114519091 A 1.一种基于购物评论的人格特质分析 方法, 其特 征在于, 包括: 获取电商平台的购物评论数据进行 预处理, 构建评论样本数据集; 针对所述评论样本数据集进行分词处 理及词性标注, 得到实验数据集; 对所述实验数据集进行句子级别和文本级别的向量化处理, 并将向量化矩阵输入LSTM 网络模型, 并经 过softmax层得到 评价对象所属句子的情感倾向; 通过SC‑LIWC词典对所述实验数据集进行关键词提取, 并计算每个关键词与大五人格 的每个人格维度的皮尔逊相关系数; 对所述实验数据集进行特征提取, 并结合所述皮尔逊相关系数和评价对象所属句子的 情感倾向, 构成输入矩阵; 基于大五人格的每个维度, 以K ‑近邻模型、 朴素贝叶斯模型和支持向量机模型共 同构 建二分类的人格特质分析融合模型; 将所述输入矩阵输入所述人格特质分析融合模型, 并通过K ‑折交叉验证方法对所述人 格特质分析融合模型进行训练; 针对所需分析的有 效评论数据进行文本特征提取, 并采用预构建的商品级别情感词库 进行情感特 征提取; 对提取得到 的所述文本特征进行向量化并作为LSTM网络模型的输入, 利用softmax层 得到情感倾向量 化值; 将所述文本特征、 所述情感特征和所述情感倾向量化值进行结合, 并进行向量化后输 入训练完成的所述人格特质分析融合模型, 以输出 结果作为多标签的人格特质属性。 2.根据权利要求1所述的基于购物评论的人格特质分析方法, 其特征在于, 所述商品级 别情感词库的构建方法包括: 根据所述评论样本数据集提取得到商品属性特征, 并通过余弦相似度获取评价对象, 构建评价对象库; 根据所述评价对象库对所述实验数据集进行关键词提取, 获取评价对象; 以所述评价对象为主关联点, 基于位置特征提取所述评价对象的评价词语, 构建评价 对象‑评价词语二元组; 将评价对象所属句子的情感倾向与所述评价对象 ‑评价词语二元组相结合, 判断相对 应的情感倾向, 综合得到商品级别情感词库。 3.根据权利要求1所述的基于购物评论的人格特质分析方法, 其特征在于, 所述将所述 输入矩阵输入所述人格特质分析融合模型并通过K ‑折交叉验证方法对所述人格特质分析 融合模型进行训练的具体过程包括: 将所述输入矩阵分别输入针对大五人格五个维度的所述K ‑近邻模型、 所述朴素贝叶斯 模型和所述支持向量机模型, 并分别通过 K‑折交叉验证方法分别对各模型进行训练。 4.根据权利要求1所述的基于购物评论的人格特质分析方法, 其特征在于, 所述对提取 得到的所述文本特征进行向量化并作为LSTM网络模型的输入, 利用softmax层得到情感倾 向量化值的具体过程包括: 利用word2vec对所述文本特征进行句子级别和文本级别的向量化处理, 并将向量化的 矩阵作为所述 LSTM网络模型的输入; 所述LSTM网络模型对所述文本特征对应的每个句子进行训练与预测, 所述softmax层权 利 要 求 书 1/3 页 2 CN 114519091 A 2的softmax激活函数将所述LSTM网络模 型的预测结果转化为0 ‑1之间的得分数值, 作为所述 情感倾向量 化值。 5.根据权利要求1所述的基于购物评论的人格特质分析方法, 其特征在于, 所述获取电 商平台的购物评论数据进行 预处理的具体过程包括: 通过爬虫技 术爬取不同电商平台的购物评论数据; 针对每一类商品的购物评论数据进行去重处 理; 对去重处 理后的购物评论数据进行 预处理, 筛选出具有明显特 征的数据集。 6.一种基于购物评论的人格特质分析系统, 其特征在于, 应用 如权利要求1至5中任一 项所述的基于购物评论的人格特质分析 方法, 包括: 样本数据构建模块, 用于获取电商平台的购物评论数据进行预处理, 构建评论样本数 据集; 实验数据获取模块, 用于针对所述评论样本数据集进行分词处理及词性标注, 得到实 验数据集; 情感倾向确定模块, 用于对所述实验数据集进行句子级别和文本级别的向量化处理, 并将向量 化矩阵输入LSTM网络模型, 并经 过softmax层得到 评价对象所属句子的情感倾向; 人格维度关联模块, 用于通过SC ‑LIWC词典对所述实验数据集进行关键词提取, 并计算 每个关键词与大五人格的每 个人格维度的皮尔逊相关系数; 输入数据整合模块, 用于对所述实验数据集进行特征提取, 并结合所述皮尔逊相关系 数和评价对象所属句子的情感倾向, 构成输入矩阵; 融合模型构建模块, 用于基于大五人格的每个维度, 以K ‑近邻模型、 朴素贝叶斯模型和 支持向量机模型共同构建二分类的人格特质分析融合模型; 融合模型训练模块, 用于将所述输入矩阵输入所述人格特质分析融合模型, 并通过K ‑ 折交叉验证方法对所述人格特质分析融合模型进行训练; 评论特征提取模块, 用于针对所需分析的有效评论数据进行文本特征提取, 并采用预 构建的商品级别情感词库进行情感特 征提取; 评论情感量化模块, 用于对提取得到的所述文本特征进行向量化并作为LSTM网络模型 的输入, 利用softmax层得到情感倾向量 化值; 评论人格分类模块, 用于将所述文本特征、 所述情感特征和所述情感倾向量化值进行 结合, 并进行向量化后输入训练完成的所述人格特质分析融合模型, 以输出结果作为多标 签的人格特质属性。 7.根据权利要求6所述的基于购物评论的人格特质分析系统, 其特征在于, 还包括情感 词库构建模块, 具体用于: 根据所述评论样本数据集提取得到商品属性特征, 并通过余弦相似度获取评价对象, 构建评价对象库; 根据所述评价对象库对所述实验数据集进行关键词提取, 获取评价对象; 以所述评价对象为主关联点, 基于位置特征提取所述评价对象的评价词语, 构建评价 对象‑评价词语二元组; 将评价对象所属句子的情感倾向与所述评价对象 ‑评价词语二元组相结合, 判断相对 应的情感倾向, 综合得到商品级别情感词库。权 利 要 求 书 2/3 页 3 CN 114519091 A 3

.PDF文档 专利 一种基于购物评论的人格特质分析方法及系统

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于购物评论的人格特质分析方法及系统 第 1 页 专利 一种基于购物评论的人格特质分析方法及系统 第 2 页 专利 一种基于购物评论的人格特质分析方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 08:53:34上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。