全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111536270.0 (22)申请日 2021.12.15 (71)申请人 三盟科技股份有限公司 地址 510000 广东省广州市越秀区太和岗 路10-16号2号楼3 02房 (72)发明人 钟晓迪 汪凡 孙佳 罗龙  韩高强 陈国镇  (74)专利代理 机构 广州三环 专利商标代理有限 公司 44202 专利代理师 曹万菊 (51)Int.Cl. G06Q 10/04(2012.01) G06Q 10/06(2012.01) G06Q 50/20(2012.01) G06K 9/62(2022.01) (54)发明名称 校园学生社区检测方法、 系统、 计算机及介 质 (57)摘要 本发明公开了一种校园学生社区检测方法, 包括获取校园学生生活数据; 对 所述校园学生生 活数据进行预处理, 进而获得学生交友图网络; 根据所述学生交友图网络构建交友广泛度指标、 社交亲密度指标以及社交地位指标并计算各个 指标的结果, 并根据所述结果对 学生的交友广泛 度、 社交亲密度以及社交地位进行多维度统计的 社交评价; 根据ISLA和GCN算法构建初始校园学 生社区预测模 型; 根据所述学生交友图网络对初 始校园学生社区预测模型进行训练。 本发明还公 开了一种校园学生社区检测系统、 计算机设备及 可读存储介质。 采用本发明, 能够解决现有方法 中缺乏多源异构数据进行整合的问题, 避免了事 先指定社区数量的问题, 从而提高社区划分精 度。 权利要求书2页 说明书11页 附图4页 CN 114492924 A 2022.05.13 CN 114492924 A 1.一种校园学生社区检测方法, 其特 征在于, 包括: 获取校园学生 生活数据; 对所述校园学生 生活数据进行 预处理, 进而获得学生交友图网络; 根据所述学生交友图网络构建交友广泛度指标、 社交亲密度指标以及社交地位指标并 计算各个指标 的结果, 并根据所述结果对学生的交友广泛度、 社交亲密度以及社交地位进 行多维度统计的社交评价; 根据ISLA和GCN 算法构建初始校园学生社区预测模型; 根据所述学生交友图网络对初始校园学生社区预测模型进行训练, 以获得最终校园学 生社区预测模型; 根据所述 最终校园学生社区预测模型对学生的校园学生社区进行 预测。 2.如权利要求1所述的校园学生社区检测方法, 其特征在于, 所述获取校园学生生活数 据的步骤 包括: 根据Spark引擎, 从Hive 数据库中获取 校园学生 生活数据。 3.如权利要求1所述的校园学生社区检测方法, 其特征在于, 所述对所述校园学生生活 数据进行 预处理, 进而获得学生交友图网络的步骤 包括: 使用spark的弹性分布式数据集RDD对校园学生生活数据进行预处理计算, 以获得表示 学生行动轨 迹的时间序列数据和学生的类别属性数据; 根据基于时间的循环去重算法对表示学生行动轨迹的时间序列 数据进行去重处理, 以 获得去重后的该地点的连续时间下的学生集合, 进而通过设定的筛选阈值进 行筛选以获得 学生交友情况 数据; 对学生的类别属性数据进行哑变量转换后与所述学生交友情况数据进行融合, 进而获 得学生交友图网络 。 4.如权利要求1所述的校园学生社区检测方法, 其特征在于, 所述根据ISLA和GCN算法 构建初始校园学生社区预测模型的步骤 包括: 根据ISLA算法, 在原有图密度公式基础上根据加权网络, 构建改良的图密度公式为: 其中, M为图网络的边权之和, N 为节点数; 根据改良后的ISLA算法计算社区个数; 根据GCN算法构建原始校园学生社区预测模型, 并将计算出的社区个数输入所述原始 校园学生社区预测模型, 以获得初始校园学生社区预测模型。 5.一种校园学生社区检测系统, 其特征在于, 用于实现权利要求1~5任一所述的校园 学生社区检测方法, 包括: 数据获取模块, 用于获取 校园学生 生活数据; 数据预处理模块, 用于对所述校园学生生活数据进行预处理, 进而获得学生交友 图网 络; 社交评价模块, 用于根据所述学生交友 图网络构建交友广泛度指标、 社交亲密度指标 以及社交地位指标并计算各个指标的结果, 并根据所述结果对学生的交友广泛度、 社交亲 密度以及社交地 位进行多维度统计的社交评价; 模型构建模块, 用于根据ISLA和GCN 算法构建初始校园学生社区预测模型;权 利 要 求 书 1/2 页 2 CN 114492924 A 2模型训练模块, 用于根据所述学生交友图网络对初始校园学生社区预测模型进行训 练, 以获得最终校园学生社区预测模型; 社区预测模块, 用于根据所述最终校园学生社区预测模型对学生的校园学生社区进行 预测。 6.如权利要求5所述的校园学生社区检测系统, 其特 征在于, 所述数据获取模块用于: 根据Spark引擎, 从Hive 数据库中获取 校园学生 生活数据。 7.如权利要求5所述的校园学生社区检测系统, 其特征在于, 所述数据预处理模块包 括: 预处理单元, 用于使用spark的弹性分布式数据 集RDD对校园学生生活数据进行预处理 计算, 以获得表示学生行动轨 迹的时间序列数据和学生的类别属性数据; 学生交友情况数据生成单元, 用于根据基于时间的循环去重算法对表示学生行动轨迹 的时间序列数据进行去重处理, 以获得去重后的该地点的连续时间下 的学生集合, 进而通 过设定的筛 选阈值进行筛 选以获得 学生交友情况 数据; 学生交友图网络生成单元, 用于对学生的类别属性数据进行哑变量转换后与 所述学生 交友情况 数据进行融合, 进 而获得学生交友图网络 。 8.如权利要求5所述的校园学生社区检测系统, 其特 征在于, 所述模型构建模块包括: ISLA算法改良单元, 用于根据 ISLA算法, 在原有图密度公式基础上根据加权 网络, 构建 改良的图密度公式为: 其中, M为图网络的边权之和, N 为节点数; 社区个数计算单 元, 用于根据改良后的ISLA算法计算社区个数; 模型构建单元, 用于根据GCN算法构建原始校园学生社区预测模型, 并将计算出的社区 个数输入所述原 始校园学生社区预测模型, 以获得初始校园学生社区预测模型。 9.一种计算机设备, 包括存储器、 处理器及存储在存储器上并可在处理器上运行的计 算机程序, 其特征在于, 所述处理器执行所述计算机程序时实现权利要求1至4中任一所述 方法的步骤。 10.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机程序 被处理器执行时实现权利要求1至4中任一所述方法的步骤。权 利 要 求 书 2/2 页 3 CN 114492924 A 3

.PDF文档 专利 校园学生社区检测方法、系统、计算机及介质

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 校园学生社区检测方法、系统、计算机及介质 第 1 页 专利 校园学生社区检测方法、系统、计算机及介质 第 2 页 专利 校园学生社区检测方法、系统、计算机及介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 23:44:14上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。