(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210396136.3 (22)申请日 2022.04.15 (71)申请人 江苏和瑞智能科技股份有限公司 地址 210000 江苏省南京市 鼓楼区新模范 马路5号南京工业大学科技创新楼 B108 (72)发明人 张振华 魏程凯 周游 周岳  张凡 郭孔诚 朱倩  (74)专利代理 机构 北京太兆天元知识产权代理 有限责任公司 1 1108 专利代理师 张洪年 (51)Int.Cl. G06F 16/23(2019.01) G06F 16/2457(2019.01) G06F 16/2458(2019.01)G06V 10/774(2022.01) G16H 70/40(2018.01) G06N 20/00(2019.01) (54)发明名称 样本库动态更新中采集样本的推荐方法 (57)摘要 本发明涉及人工智能领域, 特别是涉及智能 识别技术领域, 更为具体地说是涉及样本库动态 更新中采集样本的推荐 方法, 通过对识别结果进 行筛选、 分析, 从而逆向生成样本库中需要更新 的样本推荐, 并且根据不同的情况生成不同的推 荐级别。 进而可以指导运维人员合理安排样本库 的更新, 保证识别系统的有效运行, 减轻运维强 度, 降低运维 成本。 权利要求书2页 说明书5页 CN 114817282 A 2022.07.29 CN 114817282 A 1.样本库动态更新中采集样本的推荐方法, 其特 征在于, 包括以下步骤: S1: 将设定时间区间内所有识别任务的识别结果按照任务完成时间建立时间序列队 列; S2: 将新入库的识别对象作为一档更新推荐, 同时将这些新入库的识别对象对应的识 别结果从S1所建立的时间序列队列中剔除; S3: 将已知的不依赖样本库识别的识别对象从S1的队列中剔除; S4: 将经过修整的剩余的识别结果的时间序列队列作为备选更新队列, 并为该备选更 新队列中所有备选更新识别对象的每一个样本建立 一个空队列; S5: 以某一备选更新识别对象为目标, 遍历S4中的备选更新队列, 当出现该目标时, 同 时记录识别时间, 和该次识别的目标图片及对应样本的识别结果, 并将识别结果k标以识别 时间t标为序记录在S4中所建立的该目标的空队列中, 其中识别结果k标包括两个值, 分别为m 和g, 当该识别结果 为命中时, 标记为g, 当该识别结果 为未命中时, 标记为m; S6: 经过S5处理后, S4中建立的各个备选更新识别对象的空队列被识别结果k标以时间 t标为序填充, 形成各个备选更新识别对象的识别统计队列; S7: 选取识别统计队列中相对稳定的窗口期作为滑动窗口的起始段, 向后滑动该滑动 窗口, 直至当前; S8: 分别计算各滑动窗口中k标值为m的占比, 并按照如下 方式生成推荐结果: M1: 如果m的占比呈 上升趋势, 并且已经趋 于稳定, 则输出二档更新推荐; M2: 如果m的占比呈 上升趋势, 并且仍处于上升阶段, 则输出三档更新推荐; M3: 如果m的占比没有明显的上升 趋势, 则不输出 更新推荐; S9: 系统维护人员根据更新推荐数据, 按照一档更新推荐—二档更新推荐—三档更新 推荐的更新优先推荐顺序更新推荐出的备选更新识别对象; 其中S2和S3的次序可调换。 2.根据权利要求1所述的样本库动态更新中采集样本的推荐方法, 其特征在于, 步骤S2 中将新入库的识别对象作为更新 一档推荐的方法包括以下步骤: K1: 将设定时间区间内所有识别任务中针对不同识别对象的识别结果按照任务完成时 间建立时间序列队列; K2: 提取该时间序列队列中出现的所有识别对象, 并为每一个识别对象建立一个空队 列; K3: 以每一个识别对象为目标, 遍历K1中所建立的时间序列队列, 当出现该目标时, 同 时记录识别时间以及对应的识别 结果, 并将识别 结果D标以识别时间T标为序, 记录在K2所建 立的空队列中, 其中D标的值包括两个, 分别为 1和‑1, 当该识别结果为命中时, 标记为1, 当该 识别结果 为未命中时, 标记为 ‑1; K4: 当全部识别结果均被归集后, 形成了以识别时间为序的各识别对象的识别结果队 列; K5: 遍历K4 中识别结果队列, 当某一识别 对象中的识别结果从起始端开始均 为‑1时, 该 识别对象被 推选出来, 并作为更新 一档推荐; 当S2与S3的顺序调换后, S2中新入库的识别 对象作为更新一档推荐的步骤可与 其他样 本推荐的方法步骤合并完成, 此时为了标记方便, 将标记方式做同一 化处理。权 利 要 求 书 1/2 页 2 CN 114817282 A 23.根据权利要求1所述的样本库动态更新中采集样本的推荐方法, 其特征在于, 步骤S2 中将新入库的识别对 象作为更新一档推荐的方法为人工将已知的新入库的识别对 象作为 更新一档推荐。 4.根据权利要求1所述的样本库动态更新中采集样本的推荐方法, 其特征在于, 步骤S2 中将新入库的识别对 象作为更新一档推荐的方法是将识别任务中所有的识别对 象与样本 库中已建立的识别对象名称进行比对, 并且将比对未匹配的识别对象作为更新 一档推荐。 5.根据权利要求1所述的样本库动态更新中采集样本的推荐方法, 其特征在于, 当识别 对象为药品时, 所述已知的不依赖样本库识别的识别对象为必须由人工审核的药品。 6.根据权利要求1所述的样本库动态更新中采集样本的推荐方法, 其特征在于, 所述滑 动窗口的宽度采用自适应的方式根据各备选更新识别对象的识别统计队列的特征, 通过机 器学习获得或者 通过人工经验设置 。 7.根据权利要求1所述的样本库动态更新中采集样本的推荐方法, 其特征在于, 在步骤 S5中将该次识别的目标图片与其对应样本的匹配方法是通过相似度比对进行匹配, 当相似 度达到设定的阈值时, 认为匹配; 当相似度低于设定的阈值时, 认为无法匹配到某一样本, 此时将该次识别的目标图片的识别结果标记给对应识别对象的样本库中所有的样本 。权 利 要 求 书 2/2 页 3 CN 114817282 A 3

.PDF文档 专利 样本库动态更新中采集样本的推荐方法

安全报告 > 其他 > 文档预览
中文文档 8 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共8页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 样本库动态更新中采集样本的推荐方法 第 1 页 专利 样本库动态更新中采集样本的推荐方法 第 2 页 专利 样本库动态更新中采集样本的推荐方法 第 3 页
下载文档到电脑,方便使用
本文档由 思考人生2024-02-24 08:49:59上传分享
给文档打分
您好可以输入 255 个字符
网站域名是多少( 答案:github5.com )
评论列表
  • 暂时还没有评论,期待您的金玉良言
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。