全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210989988.3 (22)申请日 2022.08.18 (71)申请人 深圳市城市交通 规划设计 研究中心 股份有限公司 地址 518131 广东省深圳市龙华区民治街 道龙塘社区星河传奇花园三期商厦1 栋C座1210 (72)发明人 张晓春 杜军 黎曦 刘星  (74)专利代理 机构 哈尔滨市伟晨专利代理事务 所(普通合伙) 23209 专利代理师 韩立岩 (51)Int.Cl. G06F 16/9537(2019.01) G06F 16/9535(2019.01) (54)发明名称 一种基于多源数据的时空伴随者及同职住 人员搜索方法 (57)摘要 一种基于多源数据的时空伴随者及同职住 人员搜索方法, 属于计算机技术领域。 为提高时 空伴随者及同职住人员搜索轨迹的准确性、 精细 化人员活动轨迹。 本发明通过个体基础信息获取 模块、 活动信息融合模块、 居住地及工作地识别 模块、 时空伴随者搜索模块、 同职住者搜索模块 实现时空伴随者及同职住人员搜索个体基础信 息获取模块提取场所码扫码数据、 电子哨兵扫码 数据、 新冠病毒检测数据、 社区网格人口登记数 据、 社保个人信息数据、 教育局师生登记数据中 的个人实名信息, 获得个人基础信息数据; 活动 信息融合模块融和包含活动信息的数据, 并基于 手机信令数据对活动信息进行补充、 修正, 进行 居住地及工作地识别, 时空伴随者搜索, 同职住 者搜索。 权利要求书4页 说明书15页 附图3页 CN 115062244 A 2022.09.16 CN 115062244 A 1.一种基于多源数据的时空伴随者及同职住人员搜索方法, 其特征在于: 通过个体基 础信息获取模块、 活动信息融合模块、 居住地及工作地识别模块、 时空伴 随者搜索模块、 同 职住者搜索模块实现时空伴随者及同职住人员搜索, 包括如下步骤: S1、 个体基础信息获取: 个体基础信 息获取模块提取场所码扫码数据、 电子哨兵扫码数 据、 新冠病毒检测数据、 社区网格人 口登记数据、 社保个人信息数据、 教育局师生登记数据 中的个人实名信息, 获得个人基础信息数据; S2、 活动信息融合: 活动信息融合模块融和场所码扫码数据、 电子哨兵扫码数据、 新冠 病毒检测数据、 地铁刷卡数据、 公交刷卡数据、 网约车订单数据、 共享单车订单数据包含活 动信息的数据, 并基于手机信令数据对活动信息进行补充、 修 正, 获得个 体活动融合数据; S3、 居住地及工作地识别: 居住地及工作地识别 模块基于步骤S1、 步骤S2获取的数据进 行居住地及工作地识别; S4、 时空伴随者搜索: 时空伴随者搜索模块基于步骤S1、 步骤S2 获取的数据进行时空伴 随者搜索; S5、 同职住者搜索: 同职住者搜索模块基于步骤S1、 步骤S2、 步骤S3获取的数据进行同 职住者搜索。 2.根据权利要求1所述的一种基于多源数据的时空伴随者及同职住人员搜索方法, 其 特征在于: 步骤S1的具体实现方法包括如下步骤: S1.1、 个人信息提取: 提取场所码扫码数据、 电子哨兵扫码数据、 新冠病毒检测数据、 社 区网格人口登记数据、 社保个人信息数据、 教育局师生登记数据中的人员证件类型、 证件号 码、 姓名、 性别、 出生日期信息, 通过 组合证件类型和证件号码形成人员编号, 基于个人实名 信息人员赋予唯一标识人员编号; S1.2、 个人信息去重: 当个体信息重复时以场所码扫码数据、 电子哨兵扫码数据中个体 最新的扫码数据为 准, 删除重复个人信息; S1.3、 正确性验证: 对于场所码扫码数据和电子哨兵扫码数据以外的输入数据, 对其中 的人员证件号码进行正确性校验; S1.4、 验证通过的数据为个人基础信息数据。 3.根据权利要求2所述的一种基于多源数据的时空伴随者及同职住人员搜索方法, 其 特征在于: 步骤S2的具体实现方法包括如下步骤: S2.1、 匹配人员实名信息: 场所码扫码数据、 电子哨兵扫码数据、 新冠病毒检测数据中 具有符合个体基础信息获取模块输出数据的信息, 通过个体基础信息获取模块生成人员编 号的方式得到人员编号; 公交刷卡数据、 地铁刷卡数据、 网约车订单数据、 共享单车订单数据、 手机信令数据与 个体基础信息获取模块输出 数据关联获得 人员编号; S2.2、 场所信息标准化对场所信息进行清洗及标准化以符合输出数据格式, 包括对异 常值、 空值、 特殊字符处 理: S2.3、 公交及地铁班次匹配: 将公交刷卡数据和 公交车辆到站数据关联进行公交班次 匹配; 将地铁刷卡数据、 地铁车辆 到站数据关联进行地铁班次匹配; S2.4、 活动信息融合: 对于静态场所活动数据, 在场所信息标准化后按照 输出数据格 式 融合活动信息; 对于出行活动数据, 将数据拆分处理为静态场所 ‑车辆‑静态场所的形式融权 利 要 求 书 1/4 页 2 CN 115062244 A 2合活动信息; S2.5、 公交出行下车站点计算: 设公交刷卡数据为 , 当下一条活动数据 来源为公交 刷卡数据且上车站点为 中公交车辆的直达站点时, 将 上车站点作为 下车站点, 若非 直达站点则计 算距离 上车站点最近的 中公交车辆直达站点作为下车站点; 当下一条活 动数据 来源类型非公交刷卡数据且非手机信令数据 时, 计算 场所周围 公交车辆直 达的最近公交站点作为下车站点; 当下一条活动 数据来源为非公交刷卡数据活动数据 , 且与 之间存在场所类型为手机信令基站的活动数据 时, 计算与 场所距离大于设定 阈值 且最晚一条 场所周围 中公交车辆直达的最近公交站点作为下 车站点; S2.6、 出行活动数据解析拆分: 对公交出行、 地铁出行、 网约车出行、 共享单车出行进行 解析及拆分, 拆分为站点 ‑车辆‑站点的形式, 并删除拆分的出行活动数据中的掺杂的手机 信令数据; S2.7、 场所映射计算: 计算 不同数据中相同场所间的对应关系; S2. 8、 活动去重: 基于场所映射中的对应关系对活动信息进行去重, 采用以下逻辑: 当场所码扫码数据与电子哨兵扫码数据重复时, 保留场所码扫码数据信息; 当场所码数据与网约车订单 数据重复时, 保留网约车订单 数据信息; 当场所码数据与新冠病毒检测信息重复时, 保留场所码扫码时间作为活动开始时间, 其他信息则采用新冠病毒检测信息; 当场所码扫码数据与地铁刷卡数据重复时, 保留场所码扫码时间作为活动开始时间, 其他信息则采用轨道刷卡数据信息; 当电子哨兵数据、 公交刷卡数据重复时, 采用公交刷卡数据; S2.9、 活动信息的补充及修正: 对S2.8活动去重后的数据进行信令数据补充, 基于活动 数据来源为手机信令数据的活动数据, 对活动信息进 行修正, 得到个体活动融合数据, 具体 为计算每条静态场所活动数据 场所与下一条非手机信令数据来源的活动数据 场所之 间的距离及开始时间差, 若距离值小于设定阈值 且时间差小于设定阈值 , 则删除 与 之间的手机信令数据, 结束时间采用 的开始时间; 否则, 每隔时间间隔 保留一 条手机信令数据, 保留的手机信令数据结束时间为该数据产生时间加 , 其余结束时间空 缺的活动数据采用下一条活动记录的开始时间为结束时间。 4.根据权利要求3所述的一种基于多源数据的时空伴随者及同职住人员搜索方法, 其 特征在于: 步骤S2.2的具体实现方法包括如下步骤: S2.2.1、 对于场所码扫码数据: 包含组织机构编号及名称、 检测点编号及名称、 组织机 构类型、 组织机构地址、 经纬度信息: 通过连接组织机构编号和检测点编号形成场所编号, 通过连接组织机构名称和检测点名称形成场所名称, 场所地址及经纬度沿用原场所信息; 若场所名称包含可识别公交车辆的关键字, 则场所类型为公交车辆, 场所地址及经纬 度置空; 若场所名称包含可识别地铁站点、 高铁站点的关键字, 则场所类型为交通枢纽类 型, 其余场所类型沿用原场所类型; S2.2.2、 对于电子哨兵扫码数据: 包含电子哨兵设备编号、 卡口名称、 卡口类型、 卡口地权 利 要 求 书 2/4 页 3 CN 115062244 A 3

.PDF文档 专利 一种基于多源数据的时空伴随者及同职住人员搜索方法

文档预览
中文文档 23 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共23页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于多源数据的时空伴随者及同职住人员搜索方法 第 1 页 专利 一种基于多源数据的时空伴随者及同职住人员搜索方法 第 2 页 专利 一种基于多源数据的时空伴随者及同职住人员搜索方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:32:57上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。