(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210756115.8
(22)申请日 2022.06.29
(71)申请人 新疆元宇宙人工智能科技有限公司
地址 830000 新疆维吾尔自治区乌鲁 木齐
市新市区通安南路1999号阳光恒昌万
象天地综合办公 1-2栋106室
(72)发明人 谭久林 杨志芳 李小龙
(74)专利代理 机构 北京中索 知识产权代理有限
公司 11640
专利代理师 隋晓勇
(51)Int.Cl.
G06N 20/00(2019.01)
G06N 3/10(2006.01)
G06N 3/08(2006.01)
G06N 3/04(2006.01)G06F 16/2455(2019.01)
G06F 16/28(2019.01)
G06F 16/22(2019.01)
G06F 16/21(2019.01)
(54)发明名称
一种基于元宇宙数据标记的AI模型生产方
法及系统
(57)摘要
本发明提供一种基于元宇宙数据标记的AI
模型生产方法及系统, 所述方法包括以下步骤:
MetaDataLabeler后端服务使用FastAPI, AI模型
训练服务使用Tensorflow; 前端操作页面使用
Reac, 页面效果渲染使用umi; 引入项目管理 式工
作流程; 增加数据集版本管理; 导入数据集, 并进
行编辑、 删除, 创建新的数据集版本; 找到对优化
AI模型最有利的数据; 根据需求调整训练参数来
训练AI模型。 本发明基于MetaDataLabeler极大
提高了数据标注、 标签管理、 模型训练效率, 使得
数据不必频繁地导入、 导出, 并实现初始模型与
已标注的数据在同一个平台按配置或既定的规
则自动化训练, 能够不断提高模型精度。
权利要求书2页 说明书13页 附图3页
CN 115169578 A
2022.10.11
CN 115169578 A
1.一种基于元宇宙数据标记的AI模型生产方法, 其特 征在于, 包括以下步骤:
S1、 在元宇宙数据标记平台MetaDataLabeler的后端服务使用FastAPI作为后 端接口框
架, 在MetaDataLabeler的AI模型训练服务使用Tensorflow作为算法模型迭代训练的基础
框架;
S2、 在MetaDataLabeler的前端操作页面使用React作为浏览器前端页面主要框架, 使
用umi作为页面效果 渲染主要框架;
S3、 在MetaDataLabeler引入项目管理式工作流程, 将AI模型研发项目切分为多个关键
模块, 每个所述关键模块对应一个任务, 通过 标准化的生产方式实现AI模型品控;
S4、 对MetaDataLabeler增加数据集版本管理, 自动生成数据 集版本并记录每次对数据
集的操作, 将M etaDataLabeler无缝对接标注工 具LabelFree; 在MetaDataLabeler平台中添
加、 删除以及编辑项目和项目信息, 设置迭代所需要的数据集和AI模型信息;
S5、 导入准备好的所述数据集, 对数据集进行编辑、 删除, 在所述数据集上创建新的数
据集版本, 版本号按时间递增; 在 多个所述数据集中找到对优化A I模型最有利的数据; 通过
自选数据集和/或标签, 并根据需求调整训练参数来训练AI模型。
2.根据权利要求1所述的基于元宇宙数据 标记的AI模型生产 方法, 其特征在于, 所述S6
步骤之后还包括: 将训练完成的AI模型的数据通过MetaDataLabeler平台后端服务的
FastAPI作为后端接口框架、 MySQL8.0作为数据存储, Redi s作为数据缓存, ClickHouse作为
数据分析 结果存储。
3.根据权利要求1所述的基于元宇宙数据 标记的AI模型生产 方法, 其特征在于, 所述S1
步骤的所述MetaDataLabeler的后端服 务采用的方法包括:
使用关系型数据库MySQL8.0作为数据存储服务, 使用非关系类型数据库Redis作为数
据缓存服务, 使用列式存储数据库ClickHouse作为数据分析结果存储服务; 其中, 所述
Redis作为数据缓存服务的方法包括: 将待存储数据以Key ‑Value的形式来进行存储, 数据
保存在内存中; 所述Cl ickHouse作为数据分析 结果存储服务的写入速度为5 0‑200M/S。
4.根据权利要求1所述的基于元宇宙数据 标记的AI模型生产 方法, 其特征在于, 所述S3
步骤的所述 通过标准化的生产方式实现AI模型品控的方法包括:
所述任务之间具备前后依赖关系形成研发流程, 只有流程前方的任务完成后, 流程后
方的任务才能被启动; 当一个模型研发项目被创建后, 即能看到页面上方的任务迭代流程
指引, 清晰说明当前步骤与下一 步骤, 仅需按照指引点击鼠标操作。
5.根据权利要求1所述的基于元宇宙数据 标记的AI模型生产 方法, 其特征在于, 所述S4
步骤的所述自动生成数据集版本并记录每次对数据集的操作的方法包括:
将数据归入包括训练集、 挖掘集、 测试集的数据集, 并对所述数据集的更新进行版本控
制; 将所述数据集和AI模型的一 一对应关系记录下来。
6.根据权利要求1所述的基于元宇宙数据 标记的AI模型生产 方法, 其特征在于, 所述S4
步骤的所述标注工具LabelFre e的标注方法包括:
支持大量标注步骤快捷键操作; 提供一键标注服务; 支持多人协作完成同一标注任务,
并实现任务自动分发。
7.一种基于元宇宙数据 标记的AI模型生产系统, 其特征在于, 执行权利要求1 ‑6任一项
所述的基于元宇宙数据标记的AI模型生产方法, 包括:权 利 要 求 书 1/2 页
2
CN 115169578 A
2服务框架模块: 用于在元宇宙数据标记平台MetaDataLabeler的后端服务使用FastAPI
作为后端接口框架, 在MetaDataLabeler的AI模型训练服务使用Tensorflow作为算法模型
迭代训练的基础框架;
页面框架模块: 在MetaDataLabeler的前端操作页面使用React作为浏览器前端页面主
要框架, 使用umi作为页面效果 渲染主要框架;
项目管理模块: 用于在MetaDataLabeler引入项目管理式工作流程, 将AI模型研发项目
切分为多个关键模块, 每个所述关键模块对应一个任务, 通过标准化的生产方式实现AI模
型品控;
数据集管理模块: 对MetaDataLabeler增加数据 集版本管理, 自动生成数据 集版本并记
录每次对数据集的操作, 将MetaDataLabeler无缝对接标注工具LabelFree; 在
MetaDataLabeler平台中添加、 删除以及编辑项目和项目信息, 设置迭代所需要的数据集和
AI模型信息;
训练AI模型模块: 用于导入准备好的所述数据集, 对数据集进行编辑、 删除, 在所述数
据集上创建新的数据集版本, 版本号按时间递增; 在多个所述数据集中找到对优化AI模型
最有利的数据; 通过自选数据集和/或标签, 并根据需求调整训练参数来训练AI模型。
8.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述程序被处理器
执行时实现权利要求1 ‑6任一项所述的基于元宇宙数据标记的AI模型生产方法, 以及权利
要求7所述的基于元宇宙数据标记的AI模型生产系统。
9.一种计算机设备, 所述计算机设备包括存储器、 处理器及存储在存储器上并可在处
理器上运行的计算机程序, 其特征在于, 所述处理器执行所述程序时实现如权利要求 1‑6任
一项所述的基于元宇宙数据标记的AI模型生产方法, 以及权利要求7所述的基于元宇宙数
据标记的AI模型生产系统。权 利 要 求 书 2/2 页
3
CN 115169578 A
3
专利 一种基于元宇宙数据标记的AI模型生产方法及系统
安全报告 >
其他 >
文档预览
中文文档
19 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 00:09:38上传分享