(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202210392590.1
(22)申请日 2022.04.15
(65)同一申请的已公布的文献号
申请公布号 CN 114491085 A
(43)申请公布日 2022.05.13
(73)专利权人 支付宝 (杭州) 信息技 术有限公司
地址 310000 浙江省杭州市西湖区西溪路
556号8层B段801-1 1
(72)发明人 易鹏
(74)专利代理 机构 成都七星天知识产权代理有
限公司 5125 3
专利代理师 袁春晓
(51)Int.Cl.
G06F 16/36(2019.01)
G06F 16/33(2019.01)
G06F 16/31(2019.01)
(56)对比文件
CN 109086 391 A,2018.12.25CN 113239186 A,2021.08.10
CN 113220835 A,2021.08.0 6
CN 114328905 A,2022.04.12
CN 111460047 A,2020.07.28
CN 111241301 A,2020.0 6.05
CN 114282011 A,2022.04.05
CN 113486187 A,2021.10.08
CN 110619055 A,2019.12.27
CN 113961528 A,202 2.01.21
CN 113434737 A,2021.09.24
CN 110472068 A,2019.1 1.19
CN 110795562 A,2020.02.14
US 2018232458 A1,2018.08.16
朱国丞.“基于大数据平台的知识图谱 存储
访问系统的设计与实现 ”. 《万方数据知识服 务平
台》 .2019,
Dawei Wang et al. .“Graph Compres sion
Storage Based o n Spatial Cluster Entity
Optimizati on”. 《IEEE Access》 .2020,
审查员 郭明亮
(54)发明名称
一种图数据存储方法和分布式图数据计算
方法
(57)摘要
本说明书涉及数据处理领域, 特别涉及一种
图数据存储 方法和分布式图数据计算方法。 图数
据包括节 点和边, 其中节点包括实体节点以及非
实体节点; 该图数据存储方法包括: 基于图数据
获取第一表和第二表; 获取多个实体节点组各自
对应的第一子表和第二子表; 以及, 将所述各实
体节点组对应的第一子表和第二子表分发到多
个计算单元以进行分布式存储。 该分布式图数据
计算方法中, 所述图数据按照上述图数据存储 方
法分布式存储于多个计算单元上, 可以由其中一
个计算单元执行。
权利要求书3页 说明书11页 附图7页
CN 114491085 B
2022.08.09
CN 114491085 B
1.一种图数据存储方法, 所述图数据包括节点和边, 其中节点包括实体节点以及非实
体节点; 该 方法包括:
基于图数据获取第一表和第 二表; 其中, 第一表包括各实体节点的记录, 每条实体节点
的记录包括与该实体节点关联的非实体节点的信息, 第二表包括多个节点对的信息, 每个
节点对包括一个非实体节点以及与之关联的一个实体节点;
获取多个实体节点组各自对应的第一子表和第二子表; 其中, 所述多个实体节点组为
对各实体节点进 行划分得到的多个分组; 实体节 点组对应的第一子表包括该实体节点组中
各实体节点在所述第一表中对应的记录, 其对应的第二子表包括所述第二表中包含该实体
节点组中各实体节点的节点对的信息;
将所述各实体节点组对应的第一子表和第二子表分发到多个计算单元以进行分布式
存储。
2.如权利要求1所述的方法, 其中: 同一个实体节点组对应的第 一子表和第 二子表存储
于同一计算单 元。
3.如权利要求1所述的方法, 其中, 所述获取多个实体节点组各自对应的第 一子表和第
二子表, 包括:
将各实体节点 等数量的划分到多个实体节点组;
对于每个实体节点组: 从所述第一表中提取该实体节点组中各实体节点对应的记录,
得到该实体节点组对应的第一子表; 从所述第二表中提取包含该实体节点组中各实体节点
的节点对的信息, 得到该实体节点组对应的第二子表。
4.如权利要求1所述的方法, 其中, 所述获取多个实体节点组各自对应的第 一子表和第
二子表, 包括:
将第二表划分, 得到多个第 二子表; 其中, 包含同一实体节点的节点对的信息被划分到
同一第二子表中;
对于每个第 二子表, 从所述第 一表中提取该第 二子表对应的实体节点组中各实体节点
对应的记录, 得到对应的第一子表。
5.如权利要求 4所述的方法, 其中, 各第二子表包 含的节点对的信息的数量均衡。
6.如权利要求1所述的方法, 第二子表中的节点对的信息按照非 实体节点有序存 储。
7.如权利要求6所述的方法, 第二子表中的节点对的信息按照非实体节点的类型分区
存储, 且在每 个分区中节点对的信息按照非 实体节点的名称或标识有序存 储。
8.如权利要求1所述的方法, 所述节点对的信息包括其非实体节点和实体节点的名称
或标识, 以及两者之间的关系类型。
9.一种图数据存储系统, 所述图数据包括节点和边, 其中节点包括实体节点以及非实
体节点; 该系统包括:
表获取模块, 用于基于图数据获取第 一表和第 二表; 其中, 第一表包括各实体节点的记
录, 每条实体节点的记录包括与该实体节点关联的非实体节点的信息, 第二表包括多个节
点对的信息, 每 个节点对 包括一个非实体节点以及与之关联的一个实体节点;
分组模块, 用于获取多个实体节点组各自对应的第 一子表和第二子表; 其中, 所述多个
实体节点组为对各实体节点进 行划分得到的多个分组; 实体节点组对应的第一子表包括该
实体节点组中各实体节点在所述第一表中对应的记录, 其对应的第二子表包括所述第二表权 利 要 求 书 1/3 页
2
CN 114491085 B
2中包含该实体节点组中各实体节点的节点对的信息;
分发模块, 用于将所述各实体节点组对应的第 一子表和第 二子表分发到多个计算单元
以进行分布式存 储。
10.一种图数据存储装置, 包括至少一个存储介质和至少一个处理器, 所述至少一个存
储介质用于存储计算机指 令; 所述至少一个处理器用于执行所述计算机指 令以实现如权利
要求1‑8中任一项所述方法。
11.一种分布式图数据计算方法, 所述图数据按照如权利要求1 ‑8中任一项所述的方法
分布式存 储于多个 计算单元上; 该方法由其中一个 计算单元执行, 包括:
从本地的第一子表中确定属于第一类型的第一 起始实体节点及其记录;
从第一起始实体节点的记录中确定待匹配的非 实体节点;
在本地的第 二子表中确定包含所述待 匹配的非实体节点的节点对, 进而将这些节点对
中的第二类型的实体节点作为第一目标实体节点。
12.如权利要求1 1所述的方法, 还 包括:
将所述第一 起始实体节点及其记录中的待匹配的非 实体节点发送给其 他计算单 元。
13.如权利要求1 1或12所述的方法, 还 包括:
接收其他计算单 元发送的第二 起始实体节点及其记录中的待匹配的非 实体节点;
在本地的第 二子表中确定包含所述待 匹配的非实体节点的节点对, 进而将这些节点对
中的第二类型的实体节点作为第二目标实体节点。
14.如权利要求13所述的方法, 还 包括:
基于各计算单元确定的节点对, 确定多个实体节点对, 所述实体节点对包括具有相同
待匹配的非 实体节点的第一类型的实体节点和第二类型的实体节点。
15.如权利要求14所述的方法, 所述第一类型为门店, 第二类型为消费券, 待匹配的非
实体节点的类型包括城市、 业务领域中的一种或多种; 所述方法还包括: 将实体节点对中的
第一类型的实体节点与第二类型的实体节点绑定;
或者, 所述第一类型为商家, 第二类型为用户, 待匹配的非实体节点的类型包括城市、
商品属性中的一种或多种; 所述方法还包括: 将实体节点对中的第一类型 的实体节点推荐
给第二类型的实体节点。
16.一种分布式图数据计算系统, 所述图数据按照如权利要求1 ‑8中任一项所述的方法
分布式存 储于多个 计算单元上; 该系统布置 于其中一个 计算单元上, 包括:
第一起始节点确定模块, 用于从本地的第 一子表中确定属于第 一类型的第 一起始实体
节点及其记录;
非实体节点确定模块, 用于从第一 起始实体节点的记录中确定待匹配的非 实体节点;
第一目标实体节点确定模块, 用于在本地的第 二子表中确定包含所述待 匹配的非实体
节点的节点对, 进 而将这些节点对中的第二类型的实体节点作为第一目标实体节点。
17.一种分布式 图数据计算装置, 包括至少一个存储介质和至少一个处理器, 所述至少
一个存储介质用于存储计算机指令; 所述至少一个处理器用于执行所述计算机指 令以实现
如权利要求1 1‑15中任一项所述方法。
18.一种分布式 图数据存储装置, 存储有图数据的第 一子表和第 二子表, 所述图数据包
括节点和边, 其中节点包括实体节点以及非 实体节点; 其中,权 利 要 求 书 2/3 页
3
CN 114491085 B
3
专利 一种图数据存储方法和分布式图数据计算方法
文档预览
中文文档
22 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 08:51:37上传分享