全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210846797.1 (22)申请日 2022.07.06 (71)申请人 苏州市测绘院有限责任公司 地址 215000 江苏省苏州市十全街747号 (72)发明人 徐益峰 程宝银 龚维生 邵晓明  周剑  (74)专利代理 机构 天津创信方达专利代理事务 所(普通合伙) 12247 专利代理师 李京京 (51)Int.Cl. G06F 16/28(2019.01) G06F 16/25(2019.01) G06F 16/23(2019.01) G06F 16/215(2019.01) G06F 16/29(2019.01) (54)发明名称 一种城市独立 坐标系多 源数据转换方法 (57)摘要 本发明公开了一种城市独立坐标系多源数 据转换方法, 具体涉及数据转换方法技术领域, 包括步骤一、 城市独立坐标系检测点的选取和排 设数据采集设备; 步骤二、 对获取的数据进行抽 取定义及分类; 步骤三、 数据清洗模块; 步骤四、 数据集成模块; 步骤五、 数据转换模块; 步骤六、 数据更新模块; 步骤七、 日志管理模块。 本发明通 过在数据转换前对数据进行二次清洗, 缩小了数 据的体量, 增大了数据的价值, 建立分类模型的 训练集使得多源 数据可快速进行分类, 且提高了 分类的准确性, 且兼容性强, 可适应当下数据多 元化的发展 进度。 权利要求书2页 说明书6页 附图1页 CN 115374224 A 2022.11.22 CN 115374224 A 1.一种城市独立 坐标系多源数据转换 方法, 其特 征在于: 包括以下 具体步骤: 步骤一、 城市独立 坐标系检测点的选取和排设数据采集设备; 步骤二、 对获取的数据进行抽取定义及分类; 步骤三、 数据清洗模块; 步骤四、 数据集成模块; 步骤五、 数据转换模块; 步骤六、 数据更新模块; 步骤七、 日志管理模块。 2.根据权利要求1所述的一种 城市独立坐标系 多源数据转换方法, 其特征在于: 在步骤 一中, 城市独立 坐标系检测点选取的步骤如下: S1、 使用BIGEMAP卫星地图查看所要下载的城市图像经纬度所在的范围, 对该 区域图像 进行编辑, 输入起止经纬度, 套合矢量数据, 得到该城市区域的整体图像; S2、 选择6度带, 每间隔经度6度为 一个划分区域, 该区域设置为 一个检测点; S3、 在每个检测点设置数据采集设备,将数据采集设备接入物联网, 数据采集设备通过 监控、 测量和发送数据至中央处 理系统。 3.根据权利要求1所述的一种 城市独立坐标系 多源数据转换方法, 其特征在于: 在步骤 二中, 对所需数据源的数据进 行抽取和集成, 从中提取出数据的实体和关系, 经过关联和聚 合之后采用统一定义的结构来存储这些数据, 对获取的数据进行抽取定义和整合的具体步 骤如下: S1、 预先定义的数据类或概念集的分类模型; S2、 从已知的数据集中选取一部分数据作为建立分类模型的训练集, 而把剩余的部分 作为检验集, 通常会从已知数据集中选取2/3的数据项作为训练集, 1/3的数据项作为检验 集; S3、 需要使用S1中建立的模型对检验集数据元组进行分类, 从而评估分类模型的预测 准确率, 分类器的准确率是分类器在给定测试数据集上正确分类的检验元组所占的百分 比, 如果认为分类器的准确 率是可以接受的, 则使用该分类器对类别标记未知的数据元组 进行分类。 4.根据权利要求1所述的一种 城市独立坐标系 多源数据转换方法, 其特征在于: 在步骤 三中, 数据 清洗模块对不符合要求的数据进 行纠正, 不符合要求的数据由不完整的数据、 错 误的数据以及冗余的数据三大类组成, 数据清理模块还 包括对数据一 致性的检查; 对于不完整的数据这一类数据, 数据清洗模块按缺失的内容分别写入不同Excel文件 向中央处 理系统系统提交, 补全后才写入数据仓库; 对于错误的数据, 数据清洗模块通过预先写入的SQL语句的方式找出来, 然后系统自动 修正写入数据仓库; 对于冗余的数据, 数据清洗模块将所有字段导出来发送至中央处理系统等待确认, 若 系统给出删除指令, 再进行删除操作。 5.根据权利要求1所述的一种 城市独立坐标系 多源数据转换方法, 其特征在于: 在步骤 四中, 数据集成模块将零散的数据与实体之间建立联系, 进而相互匹配集成, 即数据封装, 数据封装的过程中涉及到冗余问题, 若数据集成模块检测到一个属性可以从其他属性中推权 利 要 求 书 1/2 页 2 CN 115374224 A 2演出来, 则将该属性删除。 6.根据权利要求1所述的一种 城市独立坐标系 多源数据转换方法, 其特征在于: 在步骤 五中, 数据转换将集成后的采用K ‑means聚类方法进行转换, 具体转换步骤如下: S1、 把数据分为 N类, 在N类中随机 选取K个数据, 作为每一类的中心点; S2、 计算剩下N ‑K个样本点到每个聚类中心的距离, 对于每一个样本点, 将它归到和他 距离最近的聚类中心所属的类; S3、 重新计算每个聚类中心的位置: 步骤S2中得到的结果是N个点都有自己所属的类, 将每一个 类内的所有点取平均值, 计算出新的聚类中心; S4、 重复步骤S2和S3的操作, 直到所有的聚类中心不再改变。 7.根据权利要求1所述的一种 城市独立坐标系 多源数据转换方法, 其特征在于: 在步骤 六中, 数据更新模块采用分布式计算方式, 把一组计算机通过网络相互连接组成分散系统, 然后接收和处理的大量数据分散成多个部分, 交由分散系统内的计算机组同时计算, 最后 将这些计算结果 合并, 得到最终的结果。 8.根据权利要求1所述的一种 城市独立坐标系 多源数据转换方法, 其特征在于: 在步骤 七中, 日志管理模块分为执行日志和错误日志, 执行日志每执行一步的记录, 每次运行每一 步骤的起始时间, 影响了多少行数据, 以流水账形式备份, 当某个模块出错的时候写入错误 日志, 记录每次出错的时间、 出错的模块以及出错的信息 。权 利 要 求 书 2/2 页 3 CN 115374224 A 3

PDF文档 专利 一种城市独立坐标系多源数据转换方法

文档预览
中文文档 10 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种城市独立坐标系多源数据转换方法 第 1 页 专利 一种城市独立坐标系多源数据转换方法 第 2 页 专利 一种城市独立坐标系多源数据转换方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-07 12:40:14上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。