说明:收录25万 73个行业的国家标准 支持批量下载
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211280357.0 (22)申请日 2022.10.19 (71)申请人 上海机器人产业 技术研究院有限公 司 地址 200063 上海市普陀区武宁路5 09号18 楼 (72)发明人 占华程 吕雯怡 王国鹏 刘杰 吴东旭 (74)专利代理 机构 上海璀汇知识产权代理事务 所(普通合伙) 31367 专利代理师 王文颖 (51)Int.Cl. G06K 9/62(2022.01) (54)发明名称 深度学习误识别数据统计分析方法 (57)摘要 本发明涉及一种深度学习误识别数据统计 分析方法, 结合训练样本和分类预测结果, 将分 类结果和真实标签一致的概率和样本出现概率 相结合作为 分类效果的评估。 对现有分类器的分 类效果做出精确评判, 进一步指导分类器模型训 练。 可以评估分类器整体的分类效果, 还可给出 每一个类别的分类效果, 对于指导训练模型具有 很大的意 义。 权利要求书1页 说明书4页 CN 115470868 A 2022.12.13 CN 115470868 A 1.一种深度学习误识别数据统计分析 方法, 其特 征在于, 具体包括如下步骤: 1)数据采集: 采集所有类别真实样本的总数x、 被识别分类出的样本数y、 第i个类别的 真实样本数量xi、 第i个类别的被预测出样本数量 数yi、 第i个类别的样本中被 正确预测的样 本数量、 训练总样本数w和类别总数n; 2)计算第i个类别的分类效率R(xi|yi): 为第i个类别进行正确分类的概率P(yi|ai)与样 本被预测为此类别的概 率P(yi)之差R(xi|yi)=P(yi|ai)‑P(yi); 3)第i个类别样本分类效果的评估值R'(xi|yi)为第i个类别的分类效率R(xi|yi)与第i 个类别真实样本在总样本中的出现概 率P(xi)之和, 即R'(xi|yi)=R(xi|yi)+P(xi); 4)重复步骤3) ‑4), 计算所有类别类别样本分类效果的评估值; 5)计算分类器整体的分类 效果评估值R'(x|y): R'(x|y)为分类结果和真实标签一致的 概率P(y|x)减去预测样本出现概率P(y)与真实样本出现概率P(x)之差, 即R'(x|y)=P(y| x)‑[P(y)‑P(x)]。 2.根据权利要求1所述深度学习误识别数据统计分析方法, 其特征在于, 所述样本被预 测为i类别的概 率 3.根据权利要求1所述深度学习误识别数据统计分析方法, 其特征在于, 所述分类结果 和真实标签一 致的概率 4.一种多分类任务分类器训练方法, 其特征在于, 在保证分类器整体的分类效果评估 值R'(x|y)的前提下, 通过调节关注类别样本分类效果的评估值R'(xi|yi)进行训练。 5.一种多分类任务分类器训练方法, 其特征在于, 将分类器整体的分类效果评估值R' (x|y)作为 一损失函数加入训练中。权 利 要 求 书 1/1 页 2 CN 115470868 A 2深度学习误识别数据统 计分析方 法 技术领域 [0001]本发明涉及 一种数据识别评估技术, 特别涉及一种深度学习误识别数据统计分析 方法。 背景技术 [0002]在深度学习领域, 分类任务是将样本分成两个类别以上的问题。 由于模型的局限 性, 所以对分类结果的好坏判别显得尤为重要, 选择正确的评价指标能够帮助提升模型 的 准确度。 [0003]目前基于混淆矩阵的常用评价指标有: 准确度、 Kapp a系数和F1值; 以三阶混淆矩 阵为例。 [0004] [0005]准确率的定义是 预测正确的结果占总样本的百分比, 其公式如下: [0006] [0007]A、 B、 C分别代表3种类别被正确分类的样本数, W是样本总数; 当各类样本数不均衡 时, 通过准确率 不能够很好的评估分类的好坏。 [0008]F1值是以每个类别为基础进行定义 的, 包括两个部分: 准确率P和召回率 R, 两者 的调和平均数即是 F1值, 其计算公式如下: [0009] [0010]β 是调节系数, 通常根据实际场景量化β 值, 但是F1值无法给出单个类别的分类评 估结果。 [0011]Kappa系数是统计学中的概念, 其计算公式为: [0012] [0013] [0014]其中P0是准确度, rowi和coli分别代表第i个类别的真实样本个数和分类预测的样 本个数。 Kappa系数仍然不能给出单个类别分类结果的准确率评估, 同时, 这种等级划分的说 明 书 1/4 页 3 CN 115470868 A 3
专利 深度学习误识别数据统计分析方法
文档预览
中文文档
6 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共6页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 07:43:59
上传分享
举报
下载
原文档
(408.5 KB)
分享
友情链接
GB-T 25645-2010 信息技术 中文Linux服务器操作系统技术要求.pdf
GB-T 38596-2020 催化剂生产废水中重金属含量的测定.pdf
GB-Z 20985-2007 信息安全技术 信息安全事件管理指南.pdf
AQ-T 3046-2013 化工企业定量风险评价导则.pdf
GB-T 1456-2021 夹层结构弯曲性能试验方法.pdf
GB-T 4023-2015 半导体器件 分立器件和集成电路 第2部分:整流二极管.pdf
DB14-T 2984—2024 电子政务外网 接入规范 山西省.pdf
GB-T 37972-2019 信息安全技术 云计算服务运行监管框架.pdf
GB 21347-2023 工业硅和镁单位产品能源消耗限额.pdf
ISO IEC 2382-37 022 Information technology — Vocabulary — Part 37 Biometrics.pdf
奇安信 安全内生从框架开始.pdf
安全村文集 第1辑 .pdf
成本分析.xls
GB-T 31206-2014 机械产品绿色设计 导则.pdf
GB-T 31496-2015 - ISO 27003-2010 信息技术 安全技术 信息安全管理体系实施指南 .pdf
GB-T 43624-2023 湿地术语.pdf
T-CEC 642—2022 电力5G通信模组通用技术要求.pdf
GB-T 21393-2008 公路运输能源消耗统计及分析方法.pdf
DB3201-T 1125-2022 党政机关单位大型固定资产设施设备运维服务管理规范 南京市.pdf
TY-T3901-2019 滑雪模拟机通用安全要求和试验方法.pdf
1
/
3
6
评价文档
赞助2.5元 点击下载(408.5 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。