(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211256078.0
(22)申请日 2022.10.13
(71)申请人 深圳市凯盛浩科技有限公司
地址 518000 广东省深圳市宝安区新 安街
道兴东社区71区新 东兴商务中心620
(72)发明人 容保邦 吴水娟 莫学宇 郑成文
(74)专利代理 机构 深圳市中科创为专利代理有
限公司 4 4384
专利代理师 尹益群 杨春
(51)Int.Cl.
G06F 16/9535(2019.01)
G06F 16/958(2019.01)
G06K 9/62(2022.01)
H04L 67/55(2022.01)
(54)发明名称
一种基于大数据的个性化内容推送和交互
系统及方法
(57)摘要
本发明提出了一种基于大数据的个性化内
容推送和交互系统及方法。 所述个性化内容推送
和交互方法, 包括: 通过注册信息获取目标用户,
并对所述目标用户进行分类, 获得不同类别的目
标用户群组; 针对所述目标用户群组进行实时监
控, 获取所述目标用户群所浏览视频对应的文字
信息; 提取所述文字信息的一个或多个关键词,
并利用所述一个或多个关键词获取视频内容评
估指标值; 当所述视频内容评估指标值超过预设
阈值时, 进行相同视频内容推送并提供信息交互
界面, 所述系统包括与所述方法步骤对应的模
块。
权利要求书4页 说明书11页 附图1页
CN 115544364 A
2022.12.30
CN 115544364 A
1.一种基于大数据的个性化内容推送和交互方法, 其特征在于, 所述个性化内容推送
和交互方法, 包括:
通过注册信息获取目标用户, 并对所述目标用户进行分类, 获得不同类别的目标用户
群组;
针对所述目标用户群组进行实时监控, 获取所述目标用户群所浏 览视频对应的文字信
息;
提取所述文字信 息的一个或多个关键词, 并利用所述一个或多个关键词获取视频内容
评估指标值;
当所述视频内容评估指标值超过预设阈值 时, 进行相同视频内容推送并提供信 息交互
界面。
2.根据权利要求1所述个性化内容推送和交互方法, 其特征在于, 通过登录信 息获取目
标用户, 并对所述目标用户进行分类, 获得不同类别的目标用户群组, 包括:
在目标用户进行系统注册过程中提供视频内容类别选项, 并实时获取目标用户所勾选
的视频内容类别;
根据所述目标用户所勾选的视频内容类别对目标用户进行分类, 获得不同类别的目标
用户群组。
3.根据权利要求1所述个性化内容推送和交互方法, 其特征在于, 针对所述目标用户群
组进行实时监控, 获取 所述目标用户群所浏览视频对应的文字信息, 包括:
实时监控所述目标用户群中的每个目标用户的视频浏览页面, 获得每个视频浏 览的时
间长度;
将每个视频浏览的时间长度与预设的时间长度阈值进行比较, 当所述 时间长度阈值超
过预设的时间长度阈值时, 将视频浏览的时间长度超过预设的时间长度阈值的视频作为目
标视频;
提取所述目标视频页面的文本文字信 息和视频包含的音频信 息, 并将所述音频信 息转
化为文本文字信息;
将所述目标视频页面的文本文字信息和所述音频信息转化生成的文本文字信息合并
为与所述视频对应的文字信息 。
4.根据权利要求3所述个性化内容推送和交互方法, 其特征在于, 所述 时间长度阈值的
设置过程包括:
提取目标用户在系统注 册过程中输入的年龄信息;
根据时间长度阈值设置模型结合目标用户的年龄信 息, 获取每个目标用户的时间长度
阈值, 其中, 所述时间长度阈值设置模型如下:权 利 要 求 书 1/4 页
2
CN 115544364 A
2其中, T表示每个目标用户的时间长度阈值; n表示视频浏览时间超过预设的基准浏览
时间的视频浏览个数; Ti表示第i个视频浏览时间超过预设的基准浏览时间的视频浏览时
长; T0表示预设的基准浏览时间, 且, T0的取值范围为5s ‑8s; Tp表示每个目标用户的视频浏
览总个数对应的视频浏览平均时间; S表示用户的年龄 。
5.根据权利要求1所述个性化内容推送和交互方法, 其特征在于, 提取所述文字信 息的
一个或多个关键词, 并利用所述 一个或多个关键词获取视频内容评估指标值, 包括:
提取所述目标用户所浏 览视频对应的文字信 息, 从所述文字信 息中识别提取所述文字
信息内容所包 含的关键词, 并将所述关键词导入与所述目标用户对应的关键词数据库;
提取所述关键词数据库中每 个关键词的数量, 获取关键词数量信息;
利用内容评估指标模型结合关键词数量信息获取与所述关键词对应的视频内容评估
指标值; 其中, 所述内容评估指标模型如下:
其中, Q表示视 频内容评估指标值; G表示 关键词总数量; Gi表示每个关键词在第i个 单位
时间内出现的数量; f0表示预设的单位时间内关键词出现的频率基准值, 并且, 单位时间为
24h, f0的取值范围为0.1 ‑0.05; fi表示每个关键词在第i个单位时间内出现的实际频率; Δ
f0表示频率补偿量; f表示每 个单位时间内出现所有关键词对应的总的关键词出现频率。
6.一种基于大数据的个性化内容推送和交互系统, 其特征在于, 所述个性化内容推送
和交互系统, 包括:
分类模块, 用于通过注册信息获取目标用户, 并对所述目标用户进行分类, 获得不同类
别的目标用户群组;
文字信息获取模块, 用于针对所述目标用户群组进行实时监控, 获取所述目标用户群
所浏览视频对应的文字信息;
关键词提取模块, 用于提取所述文字信息的一个或多个关键词, 并利用所述一个或多权 利 要 求 书 2/4 页
3
CN 115544364 A
3
专利 一种基于大数据的个性化内容推送和交互系统及方法
安全报告 >
其他 >
文档预览
中文文档
17 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 00:09:56上传分享