专利 一种海量数字信息的推荐方法

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210879288.9 (22)申请日 2022.07.25 (71)申请人广州市盛望信息科技有限公司地址 510660 广东省广州市天河区渔兴东街三巷7号20 3房 (72)发明人廖秋平　 (74)专利代理机构北京中索知识产权代理有限公司 11640 专利代理师刘洁 (51)Int.Cl. G06F 16/9535(2019.01) G06F 16/9536(2019.01) G06K 9/62(2022.01) (54)发明名称一种海量数字信息的推荐方法 (57)摘要本发明公开一种海量数字信息的推荐方法，涉及数据信息识别技术领域，解决的问题是数据信息推荐，采用的方法是包括以下步骤：步骤一、提供动态信息表征；步骤二、自适应过滤原始数字信息；步骤三、向用户呈现推荐信息；步骤四、接收来自用户的反馈；步骤五、通过自适应信息处理算法能够在动态数据信息中不断地自适应过滤原始数字信息，通过推荐方法提高了数据信息应用能力，提高数据数据处理效率。本发明能够动态想用户推荐不同的数据信息，并对推荐的数据信息进行分类、计算和诊断，能够将不同的数据信息通过函数计算的方法提高推荐效率，大大提高了信息识别能力。权利要求书3页说明书8页附图2页 CN 115098788 A 2022.09.23 CN 115098788 A 1.一种海量数字信息的推荐方法，其特征在于：包括以下步骤：步骤一、提供动态信息表征；本步骤用于输入海量的数字信息，通过特征模板提供动态信息特征；步骤二、自适应过滤原始数字信息；本步骤用于自适应筛选出向社区及用户推荐未处理的原始数字信息；根据信息过滤装置所包括的提取装置可以与网络层耦合并从网络层接收数据流，提取装置可以从数据流中识别和提取原始数字信息；步骤三、向用户呈现推荐信息；本步骤用于其具有编码在其中的多个配置文件，向用户传达推荐的原始数字信息；所述的配置文件包括自适应内容配置文件和自适应协作配置文件，通过响应于动态信息表征自适应过滤原始数字信息，从而产生推荐信息；步骤四、接收来自用户的反馈；通过通讯装置用于接收来自用户的反馈，响应于所提出的原始数字信息；步骤五、自适应信息处理算法；通过术语频率 ‑逆文档频率加权方法与最小描述长度方法对反馈的数字信息处理，以及更新响应动态信息表征，自适应信息处理算法包括响应于自适应可信度的原始数字信息可信度过滤、响应于用户反馈更新可信度表、以及响应于用户反馈表。 2.根据权利要求1所述的一种海量数字信息的推荐方法，其特征在于：特征模板包括第一特征信息模块、第二特征信息模块和转换模块，其中第一特征信息模块和第二特征信息模块通过转换模块分别实现格式信息转换和协议转换，所述第一特征信息模块提取数字信息的格式，所述第二特征信息模块提取数据信息的协议。 3.根据权利要求1所述的一种海量数字信息的推荐方法，其特征在于：自适应过滤原始数字信息方法包括：（S21）通过网络层输出数据信息流，（S22）通过提取装置与网络层耦合并从网络层接收数据流；（S23）通过通信装置将提取装置自适应地过滤原始数字信息传送给用户的数据信息转化为推荐信息。 4.根据权利要求3所述的一种海量数字信息的推荐方法，其特征在于：信息过滤方法为：将提取装置与网络层耦合并从网络层接收数据流，提取装置从数据流中识别和提取原始数字信息；设置数据信息通讯协议，将原始数据信息通过数据信息通讯协议选择不同的频段，以过滤所设置频段内的数据信息。 5.根据权利要求1所述的一种海量数字信息的推荐方法，其特征在于：推荐信息产生的方法为算法模型。 6.根据权利要求5所述的一种海量数字信息的推荐方法，其特征在于：算法模型的工作方法为：（1）设置聚类个数为，将值随机取值，通过K‑means计算每个值与权　利　要　求　书 1/3 页 2 CN 115098788 A 2推荐信息之间的距离；（2）值变化趋势计算公式为：（1）（3）根据步骤的（1）的结果，确定值变化率变化最快的区间，表示变化趋势，表示第个推荐值距离聚类中心之间的距离，则确定值的范围：（2）（4）根据2分法缩小区间，最终求得值；（5）当推荐信息处于公式（2）中的范围内时，则将信息推荐出去，当推荐信息不处于公式（2）中的范围内时，则不将信息推荐出去。 7.根据权利要求1所述的一种海量数字信息的推荐方法，其特征在于：自适应信息处理算法包括以下步骤：步骤1：采用术语频率 –逆文档频率；将每个原始数字信息处理为标准化向量，该向量的长度在20000到100000个令牌之间；假设令牌在数字信息文档中出现的次数越多，越与的主题相关；其次，在所有数字信息文档中出现的次数越多，对文档的区分越差；对于给定的文档，这两个项可以通过将乘以每个令牌的的倒数来组合为权重，则文件中用于令牌的权重为：（3）公式（3）中，表示权重，表示所有数字信息文档集；步骤2：将每个类别中的数字信息转换为向量，归一化为单位长度，然后平均以获得该类别的原型向量；步骤3：采用最小描述长度；最小化整个数据集的描述长度，用于测量预测用户推荐信息数据集的质量和成本，规则函数为：（4）公式（4）中，表示用户推荐信息数据集质量，表示所有推荐信息数据，表示所有推荐信息数据的概率函数，表示所有用户推荐信息数据集质量的概率函数，权　利　要　求　书 2/3 页 3 CN 115098788 A 3

专利 一种海量数字信息的推荐方法

专利一种海量数字信息的推荐方法