全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210879288.9 (22)申请日 2022.07.25 (71)申请人 广州市盛望信息科技有限公司 地址 510660 广东省广州市天河区渔兴东 街三巷7号20 3房 (72)发明人 廖秋平  (74)专利代理 机构 北京中索 知识产权代理有限 公司 11640 专利代理师 刘洁 (51)Int.Cl. G06F 16/9535(2019.01) G06F 16/9536(2019.01) G06K 9/62(2022.01) (54)发明名称 一种海量数字信息的推荐方法 (57)摘要 本发明公开一种海量数字信息的推荐 方法, 涉及数据信息识别技术领域, 解决的问题是数据 信息推荐, 采用的方法是包括以下步骤: 步骤一、 提供动态信息表征; 步骤二、 自适应过滤原始数 字信息; 步骤三、 向用户呈现推荐信息; 步骤四、 接收来自用户的反馈; 步骤五、 通过自适应信息 处理算法能够在动态数据信息中不断地自适应 过滤原始数字信息, 通过推荐方法提高了数据信 息应用能力, 提高数据数据处理效率。 本发明能 够动态想用户推荐不同的数据信息, 并对推荐的 数据信息进行分类、 计算和诊断, 能够将不同的 数据信息通过函数计算的方法提高推荐效率, 大 大提高了信息识别能力。 权利要求书3页 说明书8页 附图2页 CN 115098788 A 2022.09.23 CN 115098788 A 1.一种海量数字信息的推荐方法, 其特 征在于: 包括以下步骤: 步骤一、 提供动态信息表征; 本步骤用于 输入海量的数字信息, 通过 特征模板提供动态信息特 征; 步骤二、 自适应过 滤原始数字信息; 本步骤用于自适应筛选出向社区及用户推荐未处理 的原始数字信 息; 根据信 息过滤装 置所包括的提取装置可以与网络层耦合并从网络层接收数据流, 提取装置可以从数据流中 识别和提取原 始数字信息; 步骤三、 向用户呈现推荐信息; 本步骤用于其具有编码在其中的多个配置文件, 向用户传达推荐的原始数字信息; 所 述的配置文件包括自适应内容配置文件和自适应协作配置文件, 通过响应于动态信息表征 自适应过 滤原始数字信息, 从而产生推荐信息; 步骤四、 接收来自用户的反馈; 通过通讯装置用于接收来自用户的反馈, 响应于所提出 的原始数字信息; 步骤五、 自适应信 息处理算法; 通过术语频率 ‑逆文档频率加权方法与最小描述长度方 法对反馈的数字信息处理, 以及更新响应动态信息表征, 自适应信息处理算法包括响应于 自适应可信度的原始数字信息可信度过滤、 响应于用户反馈更新可信度表、 以及响应于用 户反馈表。 2.根据权利要求1所述的一种 海量数字信 息的推荐方法, 其特征在于: 特征模板包括第 一特征信息模块、 第二特征信息模块和 转换模块, 其中第一特征信息模块和第二特征信息 模块通过转换模块分别实现格式信息转换和协 议转换, 所述第一特征信息模块提取数字信 息的格式, 所述第二特 征信息模块 提取数据信息的协议。 3.根据权利要求1所述的一种 海量数字信 息的推荐方法, 其特征在于: 自适应过滤原始 数字信息方法包括: (S21) 通过网络层输出 数据信息流, (S22) 通过提取装置与网络层耦合并从网络层接收数据流; (S23) 通过通信装置将提取装置自适应地过滤原始数字信 息传送给用户的数据信息转 化为推荐信息 。 4.根据权利要求3所述的一种海量数字信息的推荐方法, 其特征在于: 信息过滤方法 为: 将提取装置与网络层耦合并从网络层接收数据流, 提取装置从数据流中识别和提取原 始数字信息; 设置数据信息通讯协议, 将原始数据信息通过数据信息通讯协议选择不同的 频段, 以过滤所设置频 段内的数据信息 。 5.根据权利要求1所述的一种 海量数字信 息的推荐方法, 其特征在于: 推荐信 息产生的 方法为 算法模型。 6.根据权利要求5所述的一种海量数字信息的推荐方法, 其特征在于:  算法 模型的工作方法为: (1) 设置聚类个数为 , 将 值随机取值 , 通过K‑means计算每个 值与权 利 要 求 书 1/3 页 2 CN 115098788 A 2推荐信息 之间的距离; (2) 值变化趋势计算公式为:  (1) (3) 根据步骤的 (1) 的结果, 确定 值变化率变化最快的区间, 表示变化趋势, 表示第 个推荐值距离聚类中心之间的距离, 则确定 值的范围:  (2) (4) 根据2分法缩小区间, 最终求得 值; (5) 当推荐信息处于公式 (2) 中的范围内时, 则将信息推荐出去, 当推荐信息不处于公 式 (2) 中的范围内时, 则不将信息推荐出去。 7.根据权利要求1所述的一种 海量数字信 息的推荐方法, 其特征在于: 自适应信 息处理 算法包括以下步骤: 步骤1: 采用术语频率 –逆文档频率; 将每个原始数字信息处理为标准化向量, 该向量的长度在20000到100000个令牌之间; 假设令牌 在数字信息文档 中出现的次数越多, 越与 的主题相关; 其次, 在所有 数字信息文档 中出现的次数越多, 对文档 的区分越差; 对于给定的文档, 这两个项 可以通过将 乘以每个令牌的 的倒数来组合为权重, 则文件 中用于令牌 的权重 为: (3) 公式 (3) 中, 表示权重, 表示所有数字信息文档集; 步骤2: 将每个类别中的数字信息转换为 向量, 归一化为单位长度, 然后平均 以获得该类别的原型向量; 步骤3: 采用最小 描述长度; 最小化整个数据集的描述长度, 用于测量预测用户推荐信息数据集的质量和成 本, 规则函数为: (4) 公式 (4) 中, 表示用户推荐信息数据集质量, 表示所有推荐信息数据, 表示 所有推荐信息数据的概率函数, 表示所有用户推荐信息数据集质量的概率函数,权 利 要 求 书 2/3 页 3 CN 115098788 A 3

.PDF文档 专利 一种海量数字信息的推荐方法

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种海量数字信息的推荐方法 第 1 页 专利 一种海量数字信息的推荐方法 第 2 页 专利 一种海量数字信息的推荐方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:34:09上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。