(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210510531.X
(22)申请日 2022.05.11
(71)申请人 腾讯科技 (深圳) 有限公司
地址 518057 广东省深圳市南 山区高新区
科技中一路腾讯大厦3 5层
(72)发明人 李蓝青 曾梁
(74)专利代理 机构 北京市柳沈 律师事务所
11105
专利代理师 王娟
(51)Int.Cl.
G06F 16/901(2019.01)
G06F 16/906(2019.01)
G06F 16/23(2019.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
处理图数据的方法
(57)摘要
本公开涉及人工智能服务领域, 更具体地涉
及一种处理图数据的方法、 一种包括图对比学习
模型的装置、 电子设备及计算机可读存储介质。
例如, 所述图数据为类别不平衡分布的图数据。
所述处理图数据的方法包括: 基于具有多个节点
的图数据, 对 图对比学习模型进行迭代地更新,
基于经过迭代更新后的 图对比学习模 型, 确定所
述多个节点中的至少一个节点对应节点数据或
所述图数据对应的图隐藏数据, 其中, 在每次迭
代中, 获取本次迭代对应的节点集合; 基于所述
节点集合, 更新所述图对比学习模型; 基于更新
后的图对比学习模型, 确定所述节 点集合中每个
节点对应的节 点数据; 以及基于所述节点集合中
每个节点对应的节点数据, 从所述节 点集合中采
样部分节点作为下一次迭代对应的节点 集合。
权利要求书3页 说明书17页 附图10页
CN 115114483 A
2022.09.27
CN 115114483 A
1.一种处 理图数据的方法, 包括:
基于具有 多个节点的图数据, 对图对比学习模型进行迭代地更新,
基于经过迭代更新后的图对比学习 模型, 确定所述多个节点中的至少一个节点对应节
点数据或所述图数据对应的图隐藏数据,
其中, 在每次迭代中,
获取本次迭代对应的节点 集合;
基于所述节点 集合, 更新所述图对比学习模型;
基于更新后的图对比学习模型, 确定所述节点 集合中每个节点对应的节点数据; 以及
基于所述节点集合中每个节点对应的节点数据, 从所述节点集合中采样部分节点作为
下一次迭代对应的节点 集合。
2.如权利要求1所述的方法, 其中, 所述基于所述节点集合中每个节点对应的节点数
据, 从所述节点 集合中采样部分节点作为下一次迭代对应的节点 集合包括:
基于所述节点集合中每个节点对应的节点数据, 预测所述每个节点对应的类别标签作
为所述节点对应的伪标签, 其中, 具有相同的伪标签的节点组成所述伪标签对应节点组; 以
及
从各个伪标签对应的节点组中分别采样部分节点作为下一次迭代对应的节点集合中
的元素。
3.如权利要求2所述的方法, 其中, 所述图对比学习模型包括图神经网络模型, 所述预
测所述每 个节点对应的类别标签作为所述节点对应的伪标签包括:
基于所述节点 集合中每个节点对应的节点数据, 确定所述图数据对应的多个视图;
基于所述图数据对应的多个视图, 更新所述图神经网络模型; 以及
利用所述图神经网络模型预测所述每个节点对应的类别标签作为所述节点对应的伪
标签。
4.如权利要求3所述的方法, 其中, 所述图数据对应的多个视 图包括嵌入空间视 图, 所
述利用图神经网络模型预测所述每个节点对应的类别标签作为所述节点对应的伪标签还
包括:
在所述图数据对应的嵌入空间视图中, 对本次迭代对应的节点集合进行聚类以得到聚
类信息; 以及
基于所述聚类信息, 确定所述节点 集合中的至少一个节点对应的伪标签。
5.如权利要求2所述的方法, 其中, 所述从各个伪标签对应的节点组中分别采样部分节
点作为下一次迭代对应的节点 集合中的元 素包括:
基于迭代次数, 确定 本次迭代中各个伪标签对应的节点组对应的降采样率; 以及
基于所述本次迭代中各个伪标签对应的节点组对应的降采样率, 从各个伪标签对应的
节点组中分别采样部分节点作为下一次迭代对应的节点 集合中的元 素。
6.如权利要求5所述的方法, 其中, 所述从各个伪标签对应的节点组中分别采样部分节
点作为下一次迭代对应的节点 集合中的元 素包括:
基于所述各个伪标签对应的节点组中的各个节点对应的中心性信 息, 确定所述节点被
采样的概 率, 以及
基于所述节点被采样的概率, 确定所述节点是否作为下一 次迭代对应的节点集合中的权 利 要 求 书 1/3 页
2
CN 115114483 A
2元素。
7.如权利要求1所述的方法, 其中, 所述基于所述节点集合更新所述图对比学习 模型包
括:
基于所述节点 集合, 针对所述图数据生成图表示向量或节点表示向量; 以及
基于图表示向量或节点表示向量, 计算损失函数的梯度用于更新图对比学习模型。
8.如权利要求7所述的方法, 其中, 所述图对比学习模型包括图神经网络模型, 所述针
对所述图数据生成图表示向量或节点表示向量包括:
基于所述节点集合, 对所述图数据进行多种图增强操作, 以生成图数据对应的多个视
图; 以及
利用所述图神经网络模型, 生成所述多个视图对应的图表示向量或节点表示向量。
9.如权利要求7 所述的方法, 其中,
在所述节点集合中存在相似的两个节点的情况下, 所述图对比损失函数的值正相关于
所述相似的两个节点之间的相似度或距离; 以及
在所述节点集合中存在相异的两个节点的情况下, 所述图对比损失函数的值负相关于
所述相异的两个节点之间的相似度或距离 。
10.如权利要求7所述的方法, 其中, 所述图对比损失函数正相关于不同节点间的相关
性矩阵。
11.一种处 理图数据的装置, 包括:
更新模块, 被 配置为基于包括多个节点的图数据, 对图对比学习模型进行迭代地更新,
推理模块, 被配置为基于经过迭代更新后的图对比学习模型, 确定所述多个节点中的
至少一个节点对应节点数据或所述图数据对应的图隐藏数据,
其中, 在每次迭代中,
获取本次迭代对应的节点 集合;
基于所述节点 集合, 更新所述图对比学习模型;
基于更新后的图对比学习模型, 确定所述节点 集合中每个节点对应的节点数据; 以及
基于所述节点集合中每个节点对应的节点数据, 从所述节点集合中采样部分节点作为
下一次迭代对应的节点 集合。
12.一种处 理图数据的方法, 包括:
基于具有多个节点的图数据, 对图对比学习模型进行迭代地更新, 其中所述多个节点
具有类别不平衡分布;
其中, 在每次迭代中,
对所述多个节点进行分类以确定节点的类别; 以及
根据节点的类别进行类别平衡的采样以更新所述图对比学习模型。
13.一种处 理图数据的装置, 包括:
处理模块, 被配置为基于具有多个节点的图数据, 对图对比学习 模型进行迭代地更新,
其中所述多个节点具有类别不平衡分布;
其中, 在每次迭代中,
对所述多个节点进行分类以确定节点的类别; 以及
根据节点的类别进行类别平衡的采样以更新所述图对比学习模型。权 利 要 求 书 2/3 页
3
CN 115114483 A
3
专利 处理图数据的方法
安全报告 >
其他 >
文档预览
中文文档
31 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共31页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 思考人生 于 2024-02-24 08:49:48上传分享