(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202210495869.2
(22)申请日 2022.05.09
(65)同一申请的已公布的文献号
申请公布号 CN 114581207 A
(43)申请公布日 2022.06.03
(73)专利权人 农夫铺子发展集团有限公司
地址 464000 河南省信阳市农夫铺子数字
经济产业园
(72)发明人 袁道红
(74)专利代理 机构 成都鱼爪智云知识产权代理
有限公司 513 08
专利代理师 陈雄飞
(51)Int.Cl.
G06Q 30/06(2012.01)
G06V 10/22(2022.01)
G06V 20/62(2022.01)
G06V 10/762(2022.01)
G06K 9/62(2022.01)(56)对比文件
CN 114443898 A,202 2.05.06
CN 110297935 A,2019.10.01
CN 105046277 A,2015.1 1.11
CN 10968580 6 A,2019.04.26
CN 114241484 A,202 2.03.25
CN 114139042 A,202 2.03.04
CN 112329810 A,2021.02.0 5
CN 110992141 A,2020.04.10
CN 112347295 A,2021.02.09
US 2021118020 A1,2021.04.2 2
CN 10476 5891 A,2015.07.08
薛晓璇.基 于大数据聚类的用户画像提取与
智能推送系统. 《电子设计 工程》 .202 2,第30卷
(第2期),
亢沛沛.Andro id平台中基于LBS的视频个性
化推送系统的设计与实现. 《中国优秀硕士学位
论文全文数据库信息科技 辑》 .2020,
审查员 雷志威
(54)发明名称
一种面向电商平台的商品图像大数据精准
推送方法及系统
(57)摘要
本发明公开了一种面向电商平台的商品图
像大数据精 准推送方法及系统, 涉及数据处理技
术领域。 该方法包括: 采用多尺度信噪比检测方
法和显著性区域信噪比检测方法确定低质量图
像; 对目标用户的已消费商品图像和待识别商品
图像进行多尺度优化处理并对词汇进行识别, 得
到并将高频词汇和目标词汇进行匹配, 确定非目
标商品图像; 基于正样本和负样 本采用谱聚类方
法对待识别商品图像进行聚类处理, 确定待识别
商品图像为目标推送图像或非目标推送图像。 本
发明利用多尺度信噪比检测和显著性区域信 噪
比检测的方法对低质量商品图像进行排除, 利用
基于OCR技术的高频词汇匹配方法和谱聚类方法
对待识别商品图像进行检测, 为用户提供精准商品图像推荐。
权利要求书3页 说明书9页 附图4页
CN 114581207 B
2022.09.13
CN 114581207 B
1.一种面向电商平台的商品图像大 数据精准推送方法, 其特 征在于, 包括以下步骤:
获取并采用多尺度信噪比检测方法和显著性区域信噪比检测方法对电商平台的商品
图像数据集中的商品图像进 行检测, 以确定商品图像数据集中的低质量图像; 包括: 获取并
对电商平台的商品图像数据集中的任意一副商品图像进行多尺度重 建, 以得到多个尺度下
的商品图像; 检测并根据各个尺度下 的商品图像的峰值信噪比确定低质量图像; 获取并对
电商平台的商品图像数据集中的任意一副商品图像进 行显著性检测, 以得到商品显著性区
域图像; 检测并根据商品显著性区域图像的峰值信噪比确定低质量图像;
对商品图像数据集中的低质量图像进行标记, 并建立非推荐商品图像数据集和待推荐
商品图像数据集;
获取并对目标用户的已消费商品图像进行多尺度优化处 理, 以得到优化图像;
利用OCR识别技术对优化图像中的词 汇进行识别, 得到 并统计高频词 汇; 包括: 利用OCR
技术对优化图像中的词汇进行识别, 以得到词汇识别结果; 统计词汇识别结果中的各个词
汇出现的次数, 生成各个词汇的统计结果; 判断各个词汇的统计结果是否超出预置的高频
次数阈值, 如果是, 则将对应词汇标注为高频词汇;
获取并对电商平台中的待推荐商品图像数据集中的待识别商品图像进行多尺度优化
处理, 以得到待匹配商品优化图像;
利用OCR识别技 术对待匹配商品优化图像中的词汇进行识别, 以得到对应的目标词汇;
将目标词汇与高频词汇进行匹配, 生成并根据匹配结果确定非目标商品图像;
获取并将目标用户的已消费商 品图像作为正样本, 获取并将电商平台的待推荐商品图
像数据集中的目标用户未消费图像作为负 样本;
基于正样本和负样本采用谱聚类方法对待推荐商品图像数据集中的待识别商品图像
进行聚类处 理, 以得到聚类结果;
根据聚类结果确定待识别商品图像为目标推送图像或非 目标推送图像, 并将目标推送
图像推送给目标用户。
2.根据权利要求1所述的一种面向电商平台的商品图像大数据精准推送方法, 其特征
在于, 所述检测并根据各个尺度下的商品图像的峰值信噪比确定低质量图像的方法包括以
下步骤:
计算各个尺度下的商品图像的峰值信噪比, 以得到多个尺度下的图像峰值信噪比;
判断各个尺度 下的图像峰值信噪比是否小于预置的峰值信噪比阈值, 若至少一个尺度
下的图像峰值信噪比小于峰值信噪比阈值, 则将该商品图像确定为低质量图像。
3.根据权利要求1所述的一种面向电商平台的商品图像大数据精准推送方法, 其特征
在于, 所述根据聚类结果确定待识别商品图像为 目标推送图像或非目标推送图像, 并将目
标推送图像 推送给目标用户的方法包括以下步骤:
根据聚类结果中的与正样本聚为 一类信息将待识别商品图像确定为目标推送图像;
根据聚类结果中的与负 样本聚为 一类信息将待识别商品图像确定为非目标推送图像;
统计并基于电商平台的待推荐商品图像数据集中的目标推送图像建立商品图像推送
数据集, 并将商品图像 推送数据集中的图像 推送给目标用户。
4.根据权利要求1所述的一种面向电商平台的商品图像大数据精准推送方法, 其特征
在于, 所述获取并对目标用户的 已消费商品图像进行多尺度优化处理, 以得到优化图像的权 利 要 求 书 1/3 页
2
CN 114581207 B
2方法包括以下步骤:
获取并对目标用户的已消费商 品图像进行多个尺度的高斯模糊处理, 以得到多个尺度
下的已消费商品模糊图像;
分别将各个尺度下的已消费商品模糊图像与对应的已消费商品图像进行细节差异对
比, 以得到多个细节信息;
将多个细节信息加权 到对应的已消费商品图像中, 以得到优化图像。
5.根据权利要求1所述的一种面向电商平台的商品图像大数据精准推送方法, 其特征
在于, 所述OCR识别技 术包括CTPN文本检测方法、 Segl ink模型和EAST算法其中一种或多种。
6.一种面向电商平台的商品图像大数据精准推送系统, 其特征在于, 包括低质量确定
模块、 标记模块、 消费图像处理模块、 第一识别模块、 待识别处理模块、 第二识别模块、 词汇
匹配模块、 样本 选定模块、 图像聚类模块以及目标推送模块, 其中:
低质量确定模块, 用于获取并采用多尺度信噪比检测方法和显著性区域信噪比检测方
法对电商平台的商品图像数据集中的商品图像进 行检测, 以确定商品图像数据集中的低质
量图像; 包括: 获取并对电商平台的商品图像数据集中的任意一副商品图像进行多尺度重
建, 以得到多个尺度下 的商品图像; 检测并根据各个尺度下 的商品图像的峰值信噪比确定
低质量图像; 获取并对电商平台的商品图像数据集中的任意一副商品图像进行显著性检
测, 以得到商品显著性区域图像; 检测并根据商品显著性区域图像的峰值信噪比确定低质
量图像;
标记模块, 用于对商品图像数据集中的低质量图像进行标记, 并建立非推荐商品图像
数据集和待推荐 商品图像数据集;
消费图像处理模块, 用于获取并对目标用户的已消费商品图像进行多尺度优化处理,
以得到优化图像;
第一识别模块, 用于利用OCR识别技术对优化图像中的词 汇进行识别, 得到并统计 高频
词汇; 包括: 利用OCR技术对优化图像中的词汇进 行识别, 以得到词汇识别结果; 统计词汇识
别结果中的各个词汇出现的次数, 生成各个词汇的统计结果; 判断各个词汇的统计结果是
否超出预置的高频次数阈值, 如果是, 则将对应词汇标注为高频词汇;
待识别处理模块, 用于获取并对电商平台中的待推荐商品图像数据集中的待识别商品
图像进行多尺度优化处 理, 以得到待匹配商品优化图像;
第二识别模块, 用于利用OCR识别技术对待匹配商品优化图像 中的词汇进行识别, 以得
到对应的目标词汇;
词汇匹配模块, 用于将目标词汇与高频词汇进行匹配, 生成并根据匹配结果确定非目
标商品图像;
样本选定模块, 用于获取并将目标用户的已消费商品图像作为正样本, 获取并将电商
平台的待推荐 商品图像数据集中的目标用户未消费图像作为负 样本;
图像聚类模块, 用于基于正样本和负样本采用谱聚类方法对待推荐商品图像数据集中
的待识别商品图像进行聚类处 理, 以得到聚类结果;
目标推送模块, 用于根据聚类结果确定待识别商品图像为目标推送图像或非 目标推送
图像, 并将目标推送图像 推送给目标用户。
7.一种电子设备, 其特 征在于, 包括:权 利 要 求 书 2/3 页
3
CN 114581207 B
3
专利 一种面向电商平台的商品图像大数据精准推送方法及系统
文档预览
中文文档
17 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 14:34:34上传分享