全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210928411.1 (22)申请日 2022.08.03 (71)申请人 北京交通大 学 地址 100044 北京市海淀区西直门外上园 村3号 (72)发明人 周子涵 车啸平 曲晨鑫  (74)专利代理 机构 北京市商 泰律师事务所 11255 专利代理师 邹芳德 (51)Int.Cl. G06K 9/62(2022.01) G06Q 50/26(2012.01) (54)发明名称 跨城市兴趣点分布数据迁移预测方法及系 统 (57)摘要 本发明提供一种跨城市兴趣点分布数据迁 移预测方法及系统, 属于目标识别技术领域, 获 取城市POI分布数据; 对获取的城市POI分布数据 进行网格化处理, 将各POI维度数量作为网格的 特征, 形成城市网格化POI数据集, 即城市的特征 矩阵; 基于城市网格化POI数据集, 使用K ‑means 聚类方法进行聚类, 得到城市POI 分布聚类结果; 基于城市POI分布聚类结果, 选择与目标城市同 类别下的城市作为源城市, 利用预先训练好的迁 移预测模型进行迁移学习预测, 得到目标城市的 兴趣点分布结果。 本发明使用城市聚类, 从相似 度判别角度, 即从源头上解决问题, 配合基于样 本的迁移技 术, 获得了更准确的预测结果。 权利要求书1页 说明书10页 附图2页 CN 115422993 A 2022.12.02 CN 115422993 A 1.一种跨城市 兴趣点分布数据迁移预测方法, 其特 征在于, 包括: 获取城市POI分布数据; 对获取的城市POI分布数据进行网格化处理, 将各POI维度数量作为网格的特征, 形成 城市网格化POI数据集, 即城市的特 征矩阵; 基于城市网格化POI数据集, 使用K ‑means聚类方法进行聚类, 得到城市P OI分布聚类结 果; 基于城市POI分布聚类结果, 选择与目标城市同类别下的城市作为源城市, 利用预先训 练好的迁移预测模型进行迁移学习预测, 得到目标城市的兴趣点分布结果。 2.根据权利要求1所述的跨城市兴趣点分布数据迁移预测方法, 其特征在于, 所述迁移 预测模型进行训练 时, 使用目标城市POI数据进 行训练, 并使用对源城市POI数据进行预测, 得到源城市POI数据预测结果; 设定一个阈值, 根据源城市POI数据预测结果, 选择样 本加权 残差小于设定阈值的子集作为 最终源城市数据集, 再进行Tr AdaBoost算法过程。 3.根据权利要求2所述的跨城市兴趣点分布数据迁移预测方法, 其特征在于, TrAdaBoost模型使用CART决策树模型作为基学习器。 4.根据权利要求3所述的跨城市兴趣点分布数据迁移预测方法, 其特征在于, 所述迁移 预测模型训练使用的损失函数为: 其中, Nt表示目标城市数据的数量, 表示目标城市第i组数据的预测值, yi表示目标城 市第i组数据的真实值, Nc表示数据热度分类 类别的个数, wi表示数据样本的权 重。 5.一种跨城市 兴趣点分布数据迁移预测系统, 其特 征在于, 包括: 获取模块, 用于获取城市POI分布数据; 处理模块, 用于对获取的城市POI分布数据进行网格化处理, 将各POI维度数量作为网 格的特征, 形成城市网格化POI数据集, 即城市的特 征矩阵; 聚类模块, 用于基于城市网格化P OI数据集, 使用K ‑means聚类方法进行 聚类, 得到城市 POI分布聚类结果; 预测模块, 用于基于城市POI分布聚类结果, 选择与目标城市同类别下的城市作为源城 市, 利用预 先训练好的迁移预测模型进行迁移学习预测, 得到目标城市的兴趣点分布结果。 6.一种非暂态计算机可读存储介质, 其特征在于, 所述非暂态计算机可读存储介质用 于存储计算机指 令, 所述计算机指 令被处理器执行时, 实现如权利要求 1‑4任一项所述的跨 城市兴趣点分布数据迁移预测方法。 7.一种计算机程序产品, 其特征在于, 包括计算机程序, 所述计算机程序当在一个或多 个处理器上运行时, 用于实现如权利要求1 ‑4任一项所述的跨城市兴趣点分布数据迁移预 测方法。 8.一种电子设备, 其特征在于, 包括: 处理器、 存储器以及计算机程序; 其中, 处理器与 存储器连接, 计算机程序被存储在 存储器中, 当电子 设备运行时, 所述处理器执行所述存储 器存储的计算机程序, 以使电子设备执行实现如权利要求1 ‑4任一项所述的跨城市兴趣点 分布数据迁移预测方法的指令 。权 利 要 求 书 1/1 页 2 CN 115422993 A 2跨城市兴趣点分布数据迁移预测方 法及系统 技术领域 [0001]本发明涉及目标识别技术领域, 具体涉及 一种跨城市兴趣点分布数据迁移预测方 法及系统。 背景技术 [0002]近些年学者们针对跨城市的分布等非时序数据迁移学习进行了大量研究, 取得了 一些成果。 Wei等人(2016)提出一种FLORAL迁移方法, 该方法基于城市多模态数据实现域之 间的知识迁移。 Wang等人(2018)首次将城市迁移学习应用于城市时空数据预测, 以人流数 据为例来验证预测结果的准确性。 Guo(2018)等人基于推荐算法, 通过目标酒店以及所有酒 店的数据结合来为目标酒店在目标城市的选址实现推荐。 Wang等人(2019)提出CoTrans模 型, 通过从出租车轨迹中所学知识进行迁移, 从而通过私家车轨迹判断其是否是没有营运 资格的“黑车”。 Li等人(2020)通过重采样和深度神经网络解决了数据泊松分布不均的问 题。 针对共享单车区域分布预测问题, 有基于联合因子分解和卷积神经网络的预测模型 CoFa‑GeoConv。 模型主要包含两个核心步骤: 1)采用因子分解算法同时作用在原城市和目 标城市的特征 空间, 进行特征降维, 得到原始特征的 隐变量表达; 2)将城市 网格以及网格邻 居的隐特征表达作为卷积神经网络的输入, 在 源城市基于已知的单车分布数据进 行模型训 练, 在目标城市应用过程中, 依次预测目标城市每个区域的单车数量, 进而计算目标城市整 体的单车分布情况。 [0003]上述针对城市非时序数据的研究侧重点各有不同, 但也存在亟待解决的问题: 在 开展城市迁移学习的研究时, 都关注于解决知识的差异性问题, 而忽略其源头的问题—— 对城市相似性的考 量。 发明内容 [0004]本发明的目的在于提供一种跨城市兴趣点分布数据 迁移预测方法及系统, 以解决 上述背景技 术中存在的至少一项技 术问题。 [0005]为了实现上述目的, 本发明采取了如下技 术方案: [0006]一方面, 本发明提供一种跨城市 兴趣点分布数据迁移预测方法, 包括: [0007]获取城市POI分布数据; [0008]对获取的城市POI分布数据进行网格化处理, 将各POI维度数量作为网格的特征, 形成城市网格化POI数据集, 即城市的特 征矩阵; [0009]基于城市网格化POI数据集, 使用K ‑means聚类方法进行聚类, 得到城市POI分布聚 类结果; [0010]基于城市POI分布聚类结果, 选择与目标城市同类别下的城市作为源城市, 利用预 先训练好的迁移预测模型进行迁移学习预测, 得到目标城市的兴趣点分布结果。 [0011]优选的, 所述迁移预测模型进行训练时, 使用目标城市POI数据进行训练, 并使用 对源城市POI数据进行预测, 得到源城市POI数据预测结果; 设定一个阈值, 根据源城市POI说 明 书 1/10 页 3 CN 115422993 A 3

PDF文档 专利 跨城市兴趣点分布数据迁移预测方法及系统

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 跨城市兴趣点分布数据迁移预测方法及系统 第 1 页 专利 跨城市兴趣点分布数据迁移预测方法及系统 第 2 页 专利 跨城市兴趣点分布数据迁移预测方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 00:41:40上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。