全网唯一标准王
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111667134.5 (22)申请日 2021.12.31 (71)申请人 广东泰迪智能科技股份有限公司 地址 510520 广东省广州市高新 技术产业 开发区开泰大道3 6号1栋212房 (72)发明人 张良均 徐圣兵 施兴 赵云龙  王宏刚 王振友 张敏 刘名军  张尚佳 周东平 杨惠  (74)专利代理 机构 南京普睿益思知识产权代理 事务所(普通 合伙) 32475 代理人 张丽丽 (51)Int.Cl. G06K 9/62(2022.01) (54)发明名称 一种面向模式识别的模糊标注方法 (57)摘要 本发明涉及数据处理技术领域, 且公开了一 种面向模式识别的模糊标注方法, 包括以下步 骤: S1: 定义概念, 定义标注模式、 弱标准模式、 专 家偏好系数、 强约束模式、 无约束模式的概念; S2: 给定标准模式、 待标注样本, 标注专家, 在无 约束模式下专家标注阶段中, 在处理实际模式评 判问题时, 给定的标准模式里强标准模式、 弱标 准模式均可能存在; S3: 标注部分样本的隶属度 标签, 构建隶属度矩阵。 本发明能够充分考虑了 弱标准模式下, 约束条件对算法结果的影响, 有 效利用类别标注中隐藏的专家偏好信息, 并利用 专家偏好信息进行未标注样本标注预估, 提高专 家标注隶属度标签的利用率。 权利要求书2页 说明书5页 附图1页 CN 114330574 A 2022.04.12 CN 114330574 A 1.一种面向模式识别的模糊标注方法, 其特 征在于, 包括以下步骤: S1: 定义概念, 定义标注模式、 弱标准模式、 专家偏好系数、 强约束模式、 无约束模式的 概念; S2: 给定标准模式、 待标注样本, 标注专家, 在无约束模式下专家标注阶段中, 在处理实 际模式评判问题时, 给定的标准模式里强标准模式、 弱标准模式均可能存在, 采用无约束模 式进行样本隶属度 标注, 即专 家标注结果无需满足求和不大于1的约束条件; 模式评判存在给定的标准模式 集合为 此标准模式可以用提取已 建立数据库等方法得到, 从样本集X中选定少量个样本XL={x1,x2,...,xn}作为标注样本 集, 其余样本XU=X‑XL为未标注样本集, 与xj具有相同类型的特征。 标注专家包含专家偏 好系数ρ; S3: 标注部分样本的隶属度标签, 构建隶属度矩阵, 在无约束模式下专家标注阶段中, 专家凭借自身的经验知识或实验观测结果, 得到样本xj与模式集V0隶属度标签 其中μ·j(V0)表示样本xj与模式V0的理论隶 属度, 而 表示将理论隶属度μ·j(V0)与专家偏好系数ρ结合得到的专家标注隶属 度, 表示专家标注的隶属度属于先验信息, 根据专家标注的隶属度 建立隶属度矩阵 其中NA为空缺项, 代 表未标注样本XU的隶属度; S4: 分组隶属度 标签, 预估专家偏好系数, 在家偏好系数预估与未标注隶属度缺失值填 补阶段, 对于专家 标注的隶属度标签 然后对隶属度区间进行分组, 统计各组所包 含的隶属度标签频数, 选择频数最大 的组作为预估专家偏好系 数的主要研究对 象, 设选择 的组为S, 对应的隶属度标签为 将按公式计算 的作为专家偏好系数的预 估值 S5: 填补隶属度矩阵, 在家偏好系数预估与未标注隶属度缺失值填补阶段, 以专家偏好 系数预估值 作为未标注样本的隶属度预估值, 并 进行隶属度矩阵 的缺失值填 补, 得到填补后的隶属度矩阵 2.根据权利要求1所述的一种面向模式识别的模糊标注方法, 其特征在于, 所述S1中在 模式评判场景中, 给定了多个具有类簇代表性的样本, 作为专家对样本标注隶属度时的参权 利 要 求 书 1/2 页 2 CN 114330574 A 2考标准, 这些给定的具有类簇代表性的样本为标准模式, 这些标准模式可 由已建立的标准 数据库中提取得到, 标准模式能在一定程度上反应其所代表类簇的特征, 若标准模式具有 很强的类簇代表性, 模式之 间相对独立且存在较大差异, 则定义其为强标准模式, 若标准模 式具有较弱的类别代表性, 模式之间可存在重合或特征 的部分特征, 则定义其为弱标准模 式。 3.根据权利要求2所述的一种面向模式识别的模糊标注方法, 其特征在于, 所述S1中专 家在为样本标注隶属度标签时, 标注隶属度的结果不仅受样本与标准模式的相似度影响, 还受专家自身标注偏好习惯的影响, 把专 家标注时的偏好习惯定义 为专家偏好系数。 4.根据权利要求3所述的一种面向模式识别的模糊标注方法, 其特征在于, 所述S1中专 家对样本标注隶属度的过程, 是建立在标准模式为强标准模式的假设条件上进行 的, 需要 满足同一样本对所有的标注模式的隶属度之和 不大于1的约束条件, 所以定义满足同一样 本对所有的专家模式的隶属度之和 不大于1的约束条件的情况为强约束模式, 定义不满足 同一样本对所有的专 家模式的隶属度之和不大于1的约束条件为无约束模式。 5.根据权利要求1所述的一种面向模式识别的模糊标注方法, 其特征在于, 所述S4中计 算公式为 其中 为组S中, 共有 个标注样本xj的隶属度, 为第j个 样本xj在组S中的隶属度所包 含的标准模式数。权 利 要 求 书 2/2 页 3 CN 114330574 A 3

.PDF文档 专利 一种面向模式识别的模糊标注方法

文档预览
中文文档 9 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共9页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种面向模式识别的模糊标注方法 第 1 页 专利 一种面向模式识别的模糊标注方法 第 2 页 专利 一种面向模式识别的模糊标注方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 22:44:17上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。