(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111679584.6
(22)申请日 2021.12.31
(71)申请人 安徽云磬科技产业发展 有限公司
地址 230088 安徽省合肥市蜀山区高新区
国际智能语音产业园A1栋科研楼7楼
(72)发明人 刘胜军 王俊杰 陈圣兵 张琛
郭法滨 王家俊
(74)专利代理 机构 合肥市上嘉专利代理事务所
(普通合伙) 34125
专利代理师 郭华俊
(51)Int.Cl.
G10L 25/03(2013.01)
G10L 25/18(2013.01)
G10L 25/51(2013.01)
G06K 9/62(2022.01)
(54)发明名称
基于密度聚类的采用声音识别设备生命周
期的方法及系统
(57)摘要
本发明公开了一种基于密度聚类的采用声
音识别设备生命周期的方法及系统, 包括声音信
号采集步骤、 数据预处理步骤、 特征提取步骤、 构
造KD树步骤、 聚类算法模型训练步骤、 模糊匹配
识别生命周期步骤; 根据聚类结果获取待检设备
所处的生命周期。 本发明是基于声音信息来判断
设备的生命周期, 具有非接触、 不停机、 不受遮挡
物与光线影 响等优点。 本发明采用密度聚类的方
式, 自动识别设备的生命周期个数, 可 以克服固
定周期数灵活性 不足的问题。
权利要求书2页 说明书7页 附图6页
CN 114530163 A
2022.05.24
CN 114530163 A
1.基于密度聚类的采用声 音识别设备生命周期的方法, 其特 征是, 包括如下步骤:
步骤1: 声音信号采集步骤; 获取设备运行的声音信 息, 对声音信息进行初步处理, 获得
待检设备运行的原 始声音数据集;
步骤2: 预处 理步骤; 对原 始声音数据集进行去噪、 分帧、 加窗处 理;
步骤3: 特征提取步骤; 从步骤2中处理后的原始声音数据集中, 提取时域、 频域和时频
域特征, 得到以特 征值向量组成的标准样本集;
步骤4: 构造KD树 步骤; 构造KD树, 将步骤2中的标准样本空间划分为 l个不同的区域;
步骤5: 聚类模型训练步骤; 结合KD树快速搜索算法和密度聚类算法, 对标准样本集进
行聚类, 获取聚类模型并训练该聚类算法模型, 获取训练后的聚类模型;
步骤6: 模糊匹配识别生命周期步骤; 获取待检设备运行的实时声音信息并对该实时声
音信息进行预处理和特征提取, 输入至步骤5中训练后的聚类模型; 利用步骤5中训练后的
聚类模型进行模糊匹配, 识别待检设备的生命周期。
2.根据权利要求1所述的基于密度聚类的采用声音识别设备生命周期的方法, 其特征
是, 所述步骤1中: 对声音信息进 行初步处理, 包括但 不限于一致性检查和缺 失值、 异常值处
理。
3.根据权利要求1所述的基于密度聚类的采用声音识别设备生命周期的方法, 其特征
是, 所述步骤3中: 将样本数据进 行特征提取后, 原始声音 数据集的声音模拟信号, 转化为无
量纲的纯 数值特征信息。
4.根据权利要求1所述的基于密度聚类的采用声音识别设备生命周期的方法, 其特征
是, 所述步骤4包括如下步骤:
步骤41: 构造根节点, 确定切分超平面, 将 样本空间切分为两个子区域;
步骤42: 重复切分样本空间;
步骤43: 重 复步骤41和步骤42, 直到两个子区域没有实例, 或分区数达到l时停止, 形成
KD树的区域划分。
构造KD树, 将标准样本空间划分为l个不同的区域包括以上3个步骤41 ‑43。 以下通过一
个简单的例子说明该构造KD树的过程。
例如, 对于有二十个元素的集合Q{(35,1),(26,15),(17,22),(4,23),(26,4),(12,3),
(22,8),(26,36),(10,30),(19,2),(5,23),(26,25),(23,16),(10,19),(6,2),(25,23),
(4,26),(2 2,10),(7,12),(2 2,4)}, 其KD树及其区域划分如图3和图4。
5.根据权利要求1所述的基于密度聚类的采用声音识别设备生命周期的方法, 其特征
是, 所述步骤5中, 对标准样本集进行聚类包括如下步骤:
步骤51: 初始化步骤; 将核心对象集H、 类别集C和噪声集N置为空集, 将未访问集T置为
所有输入样本;
步骤52: 在未访问集T中, 随机选一个样本Xi, 利用KD树计算样本Xi以eps为半径的邻域
内样本个数n;
步骤53: 判断n是否大于预设的密度阈值; 若是, 则将样本Xi放入核心对象集H; 若不是,
则将样本Xi放入噪声集 N, 返回执 行步骤52;
步骤54: 建立一个新类Cj, 类集为Cj; 新建候选集S, 候选集S初始 元素为步骤53产生的核
心对象Xi;权 利 要 求 书 1/2 页
2
CN 114530163 A
2步骤55: 从候选集S中任取一个样本Xp;
步骤56: 若候选集S非空, 则返回步骤5 5执行;
步骤57: 将Cj加入类别集C;
步骤58: 若未访问集T非空, 则返回步骤52执 行
步骤59: 输出类别集C={C1, C2,…, Ck}。
6.根据权利要求5所述的一种基于密度聚类的采用声音识别设备生命周期的方法, 其
特征是, 所述步骤52中, 利用KD树计算Xi以eps为半径的邻域内样本个数n 的过程包括如下
步骤:
步骤521: 二叉树搜索步骤; 先从根点开始查找KD树, 依次到达节点K1,K2,…,Km, Km为最
后到达的节点, 在Km区域计算距离小于eps的样本点; m为节点总个数;
步骤522: 回溯查找步骤; 依次向上一级回溯Km‑1,Km‑2,…,K1, 判断在该父节点的其它
子节点空间中是否有eps邻域内样本, 以Km节点为圆心, 以eps为半径画圆, 判断该圆和层的
区域分隔超平面交割, 若相交则计算其它子节 点空间是否有 eps邻域内样 本, 再回溯到上一
级父节点; 若不想交, 则直接回溯到上一级父节点。
7.一种基于密度聚类的采用声音识别设备生命周期的方法的系统, 其特征是, 包括声
音信号采集模块、 预处理模块、 特征提取模块、 KD树构造模块、 构造KD树模块、 模糊模式匹配
模块和生命周期识别模块;
所述声音信号采集模块, 用于获取设备运行的声音信息, 对声音信 息进行初步处理, 获
得待检设备运行的原 始声音数据集;
所述预处 理模块, 用于对原 始声音数据集进行去噪、 分帧、 加窗处 理;
所述特征提取模块, 用于从上述处理后的原始声音数据集中, 提取时域、 频域和时频域
特征, 得到以特 征值向量组成的标准样本集;
所述构造KD树模块, 用于构造KD树, 将所述标准样本集样本空间划分为l个不同的区
域;
所述聚类模型训练模块, 用于结合KD树快速搜索算法和密度聚类算法, 对标准样本集
进行快速聚类, 获取聚类模型;
所述模糊匹配模块, 用于获取待检设备运行的实时声音信 息并对该实时声音信 息进行
预处理和特征提取, 输入至上述训练后的聚类模型; 利用上述训练后的聚类模型进行模糊
模式匹配, 利用实时声 音信息识别待检设备的生命周期;
上述生命周期识别模块, 用于根据生命周期类别获取待检设备 所处的生命周期。
8.一种电子设备, 其特征在于, 包括: 至少一个处理器以及与 所述至少一个处理器通信
连接的存储器; 其中, 所述存储器存储有 可被所述至少一个处理器执行的指 令, 所述指 令被
所述至少一个处理器执行, 以使 所述至少一个处理器能够执行如权利要求 1至6中任一项 所
述的基于密度聚类的采用声 音识别设备生命周期的方法。
9.一种计算机可读存储介质, 存储有计算机程序, 其特征在于, 所述计算机程序被处理
器执行时实现权利要求1至6中任一项所述的基于密度聚类的采用声音识别 设备生命周期
的方法。权 利 要 求 书 2/2 页
3
CN 114530163 A
3
专利 基于密度聚类的采用声音识别设备生命周期的方法及系统
文档预览
中文文档
16 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 22:44:53上传分享