全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111679584.6 (22)申请日 2021.12.31 (71)申请人 安徽云磬科技产业发展 有限公司 地址 230088 安徽省合肥市蜀山区高新区 国际智能语音产业园A1栋科研楼7楼 (72)发明人 刘胜军 王俊杰 陈圣兵 张琛  郭法滨 王家俊  (74)专利代理 机构 合肥市上嘉专利代理事务所 (普通合伙) 34125 专利代理师 郭华俊 (51)Int.Cl. G10L 25/03(2013.01) G10L 25/18(2013.01) G10L 25/51(2013.01) G06K 9/62(2022.01) (54)发明名称 基于密度聚类的采用声音识别设备生命周 期的方法及系统 (57)摘要 本发明公开了一种基于密度聚类的采用声 音识别设备生命周期的方法及系统, 包括声音信 号采集步骤、 数据预处理步骤、 特征提取步骤、 构 造KD树步骤、 聚类算法模型训练步骤、 模糊匹配 识别生命周期步骤; 根据聚类结果获取待检设备 所处的生命周期。 本发明是基于声音信息来判断 设备的生命周期, 具有非接触、 不停机、 不受遮挡 物与光线影 响等优点。 本发明采用密度聚类的方 式, 自动识别设备的生命周期个数, 可 以克服固 定周期数灵活性 不足的问题。 权利要求书2页 说明书7页 附图6页 CN 114530163 A 2022.05.24 CN 114530163 A 1.基于密度聚类的采用声 音识别设备生命周期的方法, 其特 征是, 包括如下步骤: 步骤1: 声音信号采集步骤; 获取设备运行的声音信 息, 对声音信息进行初步处理, 获得 待检设备运行的原 始声音数据集; 步骤2: 预处 理步骤; 对原 始声音数据集进行去噪、 分帧、 加窗处 理; 步骤3: 特征提取步骤; 从步骤2中处理后的原始声音数据集中, 提取时域、 频域和时频 域特征, 得到以特 征值向量组成的标准样本集; 步骤4: 构造KD树 步骤; 构造KD树, 将步骤2中的标准样本空间划分为 l个不同的区域; 步骤5: 聚类模型训练步骤; 结合KD树快速搜索算法和密度聚类算法, 对标准样本集进 行聚类, 获取聚类模型并训练该聚类算法模型, 获取训练后的聚类模型; 步骤6: 模糊匹配识别生命周期步骤; 获取待检设备运行的实时声音信息并对该实时声 音信息进行预处理和特征提取, 输入至步骤5中训练后的聚类模型; 利用步骤5中训练后的 聚类模型进行模糊匹配, 识别待检设备的生命周期。 2.根据权利要求1所述的基于密度聚类的采用声音识别设备生命周期的方法, 其特征 是, 所述步骤1中: 对声音信息进 行初步处理, 包括但 不限于一致性检查和缺 失值、 异常值处 理。 3.根据权利要求1所述的基于密度聚类的采用声音识别设备生命周期的方法, 其特征 是, 所述步骤3中: 将样本数据进 行特征提取后, 原始声音 数据集的声音模拟信号, 转化为无 量纲的纯 数值特征信息。 4.根据权利要求1所述的基于密度聚类的采用声音识别设备生命周期的方法, 其特征 是, 所述步骤4包括如下步骤: 步骤41: 构造根节点, 确定切分超平面, 将 样本空间切分为两个子区域; 步骤42: 重复切分样本空间; 步骤43: 重 复步骤41和步骤42, 直到两个子区域没有实例, 或分区数达到l时停止, 形成 KD树的区域划分。 构造KD树, 将标准样本空间划分为l个不同的区域包括以上3个步骤41 ‑43。 以下通过一 个简单的例子说明该构造KD树的过程。 例如, 对于有二十个元素的集合Q{(35,1),(26,15),(17,22),(4,23),(26,4),(12,3), (22,8),(26,36),(10,30),(19,2),(5,23),(26,25),(23,16),(10,19),(6,2),(25,23), (4,26),(2 2,10),(7,12),(2 2,4)}, 其KD树及其区域划分如图3和图4。 5.根据权利要求1所述的基于密度聚类的采用声音识别设备生命周期的方法, 其特征 是, 所述步骤5中, 对标准样本集进行聚类包括如下步骤: 步骤51: 初始化步骤; 将核心对象集H、 类别集C和噪声集N置为空集, 将未访问集T置为 所有输入样本; 步骤52: 在未访问集T中, 随机选一个样本Xi, 利用KD树计算样本Xi以eps为半径的邻域 内样本个数n; 步骤53: 判断n是否大于预设的密度阈值; 若是, 则将样本Xi放入核心对象集H; 若不是, 则将样本Xi放入噪声集 N, 返回执 行步骤52; 步骤54: 建立一个新类Cj, 类集为Cj; 新建候选集S, 候选集S初始 元素为步骤53产生的核 心对象Xi;权 利 要 求 书 1/2 页 2 CN 114530163 A 2步骤55: 从候选集S中任取一个样本Xp; 步骤56: 若候选集S非空, 则返回步骤5 5执行; 步骤57: 将Cj加入类别集C; 步骤58: 若未访问集T非空, 则返回步骤52执 行 步骤59: 输出类别集C={C1, C2,…, Ck}。 6.根据权利要求5所述的一种基于密度聚类的采用声音识别设备生命周期的方法, 其 特征是, 所述步骤52中, 利用KD树计算Xi以eps为半径的邻域内样本个数n 的过程包括如下 步骤: 步骤521: 二叉树搜索步骤; 先从根点开始查找KD树, 依次到达节点K1,K2,…,Km, Km为最 后到达的节点, 在Km区域计算距离小于eps的样本点; m为节点总个数; 步骤522: 回溯查找步骤; 依次向上一级回溯Km‑1,Km‑2,…,K1, 判断在该父节点的其它 子节点空间中是否有eps邻域内样本, 以Km节点为圆心, 以eps为半径画圆, 判断该圆和层的 区域分隔超平面交割, 若相交则计算其它子节 点空间是否有 eps邻域内样 本, 再回溯到上一 级父节点; 若不想交, 则直接回溯到上一级父节点。 7.一种基于密度聚类的采用声音识别设备生命周期的方法的系统, 其特征是, 包括声 音信号采集模块、 预处理模块、 特征提取模块、 KD树构造模块、 构造KD树模块、 模糊模式匹配 模块和生命周期识别模块; 所述声音信号采集模块, 用于获取设备运行的声音信息, 对声音信 息进行初步处理, 获 得待检设备运行的原 始声音数据集; 所述预处 理模块, 用于对原 始声音数据集进行去噪、 分帧、 加窗处 理; 所述特征提取模块, 用于从上述处理后的原始声音数据集中, 提取时域、 频域和时频域 特征, 得到以特 征值向量组成的标准样本集; 所述构造KD树模块, 用于构造KD树, 将所述标准样本集样本空间划分为l个不同的区 域; 所述聚类模型训练模块, 用于结合KD树快速搜索算法和密度聚类算法, 对标准样本集 进行快速聚类, 获取聚类模型; 所述模糊匹配模块, 用于获取待检设备运行的实时声音信 息并对该实时声音信 息进行 预处理和特征提取, 输入至上述训练后的聚类模型; 利用上述训练后的聚类模型进行模糊 模式匹配, 利用实时声 音信息识别待检设备的生命周期; 上述生命周期识别模块, 用于根据生命周期类别获取待检设备 所处的生命周期。 8.一种电子设备, 其特征在于, 包括: 至少一个处理器以及与 所述至少一个处理器通信 连接的存储器; 其中, 所述存储器存储有 可被所述至少一个处理器执行的指 令, 所述指 令被 所述至少一个处理器执行, 以使 所述至少一个处理器能够执行如权利要求 1至6中任一项 所 述的基于密度聚类的采用声 音识别设备生命周期的方法。 9.一种计算机可读存储介质, 存储有计算机程序, 其特征在于, 所述计算机程序被处理 器执行时实现权利要求1至6中任一项所述的基于密度聚类的采用声音识别 设备生命周期 的方法。权 利 要 求 书 2/2 页 3 CN 114530163 A 3

.PDF文档 专利 基于密度聚类的采用声音识别设备生命周期的方法及系统

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于密度聚类的采用声音识别设备生命周期的方法及系统 第 1 页 专利 基于密度聚类的采用声音识别设备生命周期的方法及系统 第 2 页 专利 基于密度聚类的采用声音识别设备生命周期的方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 22:44:53上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。