(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210626216.3
(22)申请日 2022.06.02
(71)申请人 度小满科技 (北京) 有限公司
地址 100085 北京市海淀区西北旺路10号
院西区4号楼6层6 06
(72)发明人 韩哲 蒋嘉琦 陈鑫 吴浩然
李亚朋
(74)专利代理 机构 北京知帆远景知识产权代理
有限公司 1 1890
专利代理师 刘岩磊
(51)Int.Cl.
G06F 16/215(2019.01)
G06F 21/62(2013.01)
(54)发明名称
目标集合的确定方法、 装置、 终端及存储介
质
(57)摘要
本申请公开了一种目标集合的确定方法、 装
置、 终端及存储介质, 包括: 接收第一数据源和第
二数据源; 分别基于第一数据源和第二数据源,
确定第一组合列和第二组合列; 利用协商交互方
式对第一组合列、 第二组合列进行分析, 确定分
隔符; 基于第一组合列、 第二组合列和分隔符, 确
定第一组合列对应的第一索引号集合和第二组
合列对应的第二索引号集合, 以通过第一索引号
集合和第二索引号集合得到目标集合。 本发明灵
活选取多列数据进行组合, 得到多列数据对应的
组合列, 无需手动将组合列中的多列数据转换成
单列数据, 即可得到目标集合, 用户可 以根据需
求灵活选 择和自由组合列数据以形成组合列, 便
捷高效地实现不同组合列的求交操作。
权利要求书3页 说明书12页 附图7页
CN 115048367 A
2022.09.13
CN 115048367 A
1.一种目标集 合的确定方法, 其特 征在于, 包括:
接收第一数据源和第二数据源;
分别基于所述第 一数据源和所述第 二数据源, 确定第 一组合列和第二组合列, 其中, 所
述组合列是由多列数据组合形成;
利用协商交 互方式对所述第一组合列、 所述第二组合列进行分析, 确定分隔符;
基于所述第一组合列、 所述第二组合列和所述分隔符, 确定所述第一组合列对应的第
一索引号集合和所述第二组合列对应的第二索引号集合, 以通过所述第一索引号集合和所
述第二索引号 集合得到目标集 合。
2.如权利要求1所述目标集合的确定方法, 其特征在于, 所述分别基于所述第 一数据源
和所述第二数据源, 确定第一组合列和第二组合列, 包括:
分别基于所述第一数据源和所述第二数据源, 生成第一数据表和第二数据表;
分别从所述第 一数据表和所述第 二数据表中选取预设数量的列 数据, 得到预设数量的
第一列数据和预设数量的第二列数据;
分别将所述预设数量的第 一列数据和所述预设数量的第 二列数据进行组合, 得到所述
第一组合列和第二组合列。
3.如权利要求1所述目标集合的确定方法, 其特征在于, 所述第 一数据源由第 一客户端
发送, 所述第二数据源由第二 客户端发送;
所述利用协商交互方式对所述第 一组合列、 所述第 二组合列进行分析, 确定分隔符, 包
括:
在所述第一客户端为协商发起方的情况下, 基于所述第一组合列和所述第二组合列,
确定所述分隔符;
在所述第二客户端为协商发起方的情况下, 基于所述第一组合列和所述第二组合列,
确定所述分隔符。
4.如权利要求3所述目标集合的确定方法, 其特征在于, 所述在所述第 一客户端为协商
发起方的情况 下, 基于所述第一组合列和所述第二组合列, 确定所述分隔符, 包括:
分别基于所述第一组合列和所述第二组合列, 确定第一字符差集和第二字符差集;
若所述第一字符差集或第二字符差集任一差集为空的情况下, 获取当前时间戳, 并基
于所述当前时间戳, 确定所述分隔符, 其中, 所述分隔符是对 所述当前时间戳依次进 行字符
串转换、 hash操作和字符串截取 得到;
若所述第一字符差集和所述第 二字符差集均不为空 的情况下, 从所述第 一字符差集中
选取任一字符作为目标字符;
若所述第二字符差集中存在所述目标字符, 将所述目标字符作为所述分隔符。
5.如权利要求 4所述目标集 合的确定方法, 其特 征在于, 还 包括:
若所述第二字符差集中不存在所述目标字符, 将所述第二客户端作为协商发起方, 并
从所述第二字符差集中选取任一字符作为所述目标字符;
若所述第一字符差集中存在所述目标字符, 将所述目标字符作为所述分隔符;
若所述第一字符差集中不存在所述目标字符, 重复执行所述从所述第 一字符差集中选
取任一字符作为目标字符的步骤。
6.如权利要求4所述目标集合的确定方法, 其特征在于, 所述在所述第 二客户端为协商权 利 要 求 书 1/3 页
2
CN 115048367 A
2发起方的情况 下, 基于所述第一组合列和所述第二组合列, 确定所述分隔符, 包括:
若所述第一字符差集或第二字符差集任一差集为空的情况下, 获取当前时间戳, 并基
于所述当前时间戳, 确定所述分隔符, 其中, 所述分隔符是对 所述当前时间戳依次进 行字符
串转换、 hash操作和字符串截取 得到;
若所述第一字符差集和所述第 二字符差集均不为空 的情况下, 从所述第 二字符差集中
选取任一字符作为目标字符;
若所述第一字符差集中存在所述目标字符, 将所述目标字符作为所述分隔符。
7.如权利要求6所述目标集 合的确定方法, 其特 征在于, 还 包括:
若所述第一字符差集中不存在所述目标字符, 将所述第一客户端作为协商发起方, 并
从所述第一字符差集中选取任一字符作为所述目标字符;
若所述第二字符差集中存在所述目标字符, 将所述目标字符作为所述分隔符;
若所述第二字符差集中不存在所述目标字符, 重复执行所述从所述第 二字符差集中选
取任一字符作为目标字符的步骤。
8.如权利要求4或6所述目标集合的确定方法, 其特征在于, 所述分别基于所述第一组
合列和所述第二组合列, 确定第一字符差集和第二字符差集, 包括:
统计所述第 一组合列中的所有字符以形成第 一字符集, 并将预设字符集与 所述第一字
符集作差, 得到第一字符差集;
统计所述第 二组合列中的所有字符以形成第 二字符集, 并将所述预设字符集与所述第
二字符集作差, 得到第二字符差集。
9.如权利要求8所述目标集合的确定方法, 其特征在于, 所述基于所述第一组合列、 所
述第二组合列和所述分隔符, 确定所述第一组合列对应的第一索引号集合和所述第二组合
列对应的第二索引号 集合, 包括:
对所述第一组合列、 所述第二组合列和所述分隔符进行预处理, 得到所述第一组合列
对应的第一组合数据和所述第一组合数据对应的第三索引号集合, 以及所述第二组合列对
应的第二组合数据和所述第二组合数据对应的第四索引号 集合;
将所述第一组合数据和所述第 二组合数据进行求交运算, 并结合所述第 三索引号集合
和所述第四索引号集合, 得到所述第一组合列对应的第一索引号集合和所述第二组合列对
应的第二索引号 集合。
10.一种目标集 合的确定装置, 其特 征在于, 包括:
数据接收模块, 用于 接收第一数据源和第二数据源;
组合列确定模块, 用于分别基于所述第一数据源和所述第二数据源, 确定第一组合列
和第二组合列, 其中, 所述组合列是由多列数据组合形成;
分隔符确定模块, 用于利用协商交互方式对所述第一组合列、 所述第二组合列进行分
析, 确定分隔符;
目标集合确定模块, 用于基于所述第 一组合列、 所述第 二组合列和所述分隔符, 确定所
述第一组合列对应的第一索引号集合和所述第二组合列对应的第二索引号集合, 以通过所
述第一索引号 集合和所述第二索引号 集合得到目标集 合。
11.一种终端, 包括存储器、 处理器以及存储在所述存储器中并可在所述处理器上运行
的计算机程序, 其特征在于, 所述处理器执行所述计算机程序时实现如权利要求1至9中任权 利 要 求 书 2/3 页
3
CN 115048367 A
3
专利 目标集合的确定方法、装置、终端及存储介质
安全报告 >
其他 >
文档预览
中文文档
23 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共23页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 思考人生 于 2024-02-07 20:38:51上传分享