(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210993188.9
(22)申请日 2022.08.18
(71)申请人 西安交通大 学
地址 710049 陕西省西安市碑林区咸宁西
路28号
(72)发明人 孙新宇 张延 王嘉寅 潘磊
(74)专利代理 机构 西安通大专利代理有限责任
公司 6120 0
专利代理师 姚咏华
(51)Int.Cl.
G06F 16/31(2019.01)
G06F 16/35(2019.01)
G06F 16/335(2019.01)
G06F 17/10(2006.01)
G06F 17/18(2006.01)
(54)发明名称
去除在线评论呈现顺序对评论帮助性干扰
的纠偏方法及应用
(57)摘要
本发明公开了一种去除在线评论呈现顺序
对评论帮助性干扰的纠偏方法及应用, 通过构建
包括呈现顺序和评论帮助性的面板数据集, 并进
行赋值; 进行多期横截面数据收集并对相同评论
进行评论关联; 计算评论的新增投票, 形成面板
数据集; 计算评论留存率和顺序稳定率; 判断评
论留存率和顺序稳定率是否满足要求; 计算评论
呈现顺序的系数; 根据顺序偏误的影响作用大
小, 对评论帮助性进行误差纠正。 本发明适用于
在线平台对评论帮助性分析的改进, 通过分析呈
现顺序的信息, 定量的刻画 了来自浏览者的评论
帮助性存在的系统偏误, 通过偏误纠正有效的识
别出高质量评论, 从而降低消费者的信息过 载。
权利要求书2页 说明书6页 附图1页
CN 115248840 A
2022.10.28
CN 115248840 A
1.一种去除在线评论呈现顺序对评论帮助性干扰的纠偏方法, 其特 征在于, 包括:
构建包括评论呈现顺序和评论帮助性的面板数据集;
分别设定 评论收集窗口和评论收集间隔, 对评论收集窗口和评论收集间隔赋值;
进行多期横截面数据收集;
对相邻两期横截面数据的相同评论进行评论关联;
根据获得的相邻两期的评论关联关系, 计算评论的新增投票, 形成面板数据集;
利用面板数据集计算评论留存率和顺序稳定率;
判断评论留存率和顺序稳定率是否满足要求, 如果不满足要求, 则重新对收集间隔和
收集窗口赋值; 否则计算评论呈现顺序的系数;
对获得的面板数据集, 计算评论呈现顺序的系数;
利用评论呈现顺序系数调整评论帮助性, 得到纠偏后的评论帮助性。
2.根据权利要求1所述的一种去除在线评论呈现顺序对评论帮助性干扰的纠偏方法,
其特征在于, 对评论收集窗口和评论收集间隔赋值, 第一次赋初始值根据工程分析 的要求
预设; 若上一次得到的评论留存率不满足要求, 则扩大收集窗口; 若 上一次得到的顺序稳定
率不满足要求, 则缩小收集间隔; 收集窗口的扩大量和收集间隔的缩小量根据工程分析 的
要求预设。
3.根据权利要求1所述的一种去除在线评论呈现顺序对评论帮助性干扰的纠偏方法,
其特征在于, 横截面数据收集包含三个维度: 产品、 评论和期数; 收集的数据包含四个类型:
总投票数、 呈现顺序、 评论文本和控制变量; 数据收集的总期数根据工程分析要求预设; 控
制变量包 含的变量 根据工程分析要求预设。
4.根据权利要求1所述的一种去除在线评论呈现顺序对评论帮助性干扰的纠偏方法,
其特征在于, 相邻两期评论关联是指对相邻两期的评论集基于评论文本进行相同评论识
别。
5.根据权利要求1所述的一种去除在线评论呈现顺序对评论帮助性干扰的纠偏方法,
其特征在于, 计算评论的新增投票yijt, 根据下式计算形成面板数据集Ω:
yijt=votesij(t+1)‑votesijt
面板数据集Ω中每一条观测值包括:
{yijt,orderijt,votesijt,textijt,controlsijt}, 其中t=1,2,. ..T‑1;
其中, votesijt是产品j的评论i截止第t期收到的总投票数, 为序数变量; or derijt是产
品j的评论i在第t期的呈现顺序, 为序数变 量; textij是产品j的评 论i的评论文本内容, 为字
符串变量; co ntrolsijt是产品j的评论 i在第t期的控制变量。
6.根据权利要求1所述的一种去除在线评论呈现顺序对评论帮助性干扰的纠偏方法,
其特征在于, 计算评论留存率和顺序稳定率, 采用下式计算:
评论留存率:
其中, N为面板数据集Ω中的观测值总数, M为 面板数据集Ω中的评论个数;
顺序稳定率:
权 利 要 求 书 1/2 页
2
CN 115248840 A
2其中, Nstable为面板数据集Ω中相邻两期orderijt未发生变化的观测值数量, N2,3,...T ‑1为
面板数据集Ω中t∈{2,3,. ..T‑1}的观测值数量。
7.根据权利要求1所述的一种去除在线评论呈现顺序对评论帮助性干扰的纠偏方法,
其特征在于, 对评论留存率和顺序稳定率的要求为大于给定阈值, 评论留存率和顺序稳定
率的给定阈值 根据工程分析的要求预设。
8.根据权利要求5所述的一种去除在线评论呈现顺序对评论帮助性干扰的纠偏方法,
其特征在于, 对获得的面板数据集Ω, 使用最小二乘法回归计算评论呈现顺序的系数:
yijt=α0+α1×ln(orderijt)+β×controlsijt+ μj+νt+ εijt
其中, α0为回归的常数项, α1为取自然对数后的评论呈现顺序的系数, β 为控制变量的系
数, μj为产品的固定效应, νt为期数的固定效应, εijt为回归的特异性 误差项。
9.根据权利要求8所述的一种去除在线评论呈现顺序对评论帮助性干扰的纠偏方法,
其特征在于, 评论帮助性纠偏, 采用下式计算:
adjustedhelpful nessijt=yijt‑α1×ln(orderijt)。
10.一种权利要求1 ‑9任一种方法在电子商务在线平台 中应用。权 利 要 求 书 2/2 页
3
CN 115248840 A
3
专利 去除在线评论呈现顺序对评论帮助性干扰的纠偏方法及应用
文档预览
中文文档
10 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 02:13:38上传分享