专利基于密度聚类的采用声音识别设备生命周期的方法及系统

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202111679584.6 (22)申请日 2021.12.31 (71)申请人安徽云磬科技产业发展有限公司地址 230088 安徽省合肥市蜀山区高新区国际智能语音产业园A1栋科研楼7楼 (72)发明人刘胜军　王俊杰　陈圣兵　张琛　郭法滨　王家俊　 (74)专利代理机构合肥市上嘉专利代理事务所 (普通合伙) 34125 专利代理师郭华俊 (51)Int.Cl. G10L 25/03(2013.01) G10L 25/18(2013.01) G10L 25/51(2013.01) G06K 9/62(2022.01) (54)发明名称基于密度聚类的采用声音识别设备生命周期的方法及系统 (57)摘要本发明公开了一种基于密度聚类的采用声音识别设备生命周期的方法及系统，包括声音信号采集步骤、数据预处理步骤、特征提取步骤、构造KD树步骤、聚类算法模型训练步骤、模糊匹配识别生命周期步骤；根据聚类结果获取待检设备所处的生命周期。本发明是基于声音信息来判断设备的生命周期，具有非接触、不停机、不受遮挡物与光线影响等优点。本发明采用密度聚类的方式，自动识别设备的生命周期个数，可以克服固定周期数灵活性不足的问题。权利要求书2页说明书7页附图6页 CN 114530163 A 2022.05.24 CN 114530163 A 1.基于密度聚类的采用声音识别设备生命周期的方法，其特征是，包括如下步骤：步骤1：声音信号采集步骤；获取设备运行的声音信息，对声音信息进行初步处理，获得待检设备运行的原始声音数据集；步骤2：预处理步骤；对原始声音数据集进行去噪、分帧、加窗处理；步骤3：特征提取步骤；从步骤2中处理后的原始声音数据集中，提取时域、频域和时频域特征，得到以特征值向量组成的标准样本集；步骤4：构造KD树步骤；构造KD树，将步骤2中的标准样本空间划分为 l个不同的区域；步骤5：聚类模型训练步骤；结合KD树快速搜索算法和密度聚类算法，对标准样本集进行聚类，获取聚类模型并训练该聚类算法模型，获取训练后的聚类模型；步骤6：模糊匹配识别生命周期步骤；获取待检设备运行的实时声音信息并对该实时声音信息进行预处理和特征提取，输入至步骤5中训练后的聚类模型；利用步骤5中训练后的聚类模型进行模糊匹配，识别待检设备的生命周期。 2.根据权利要求1所述的基于密度聚类的采用声音识别设备生命周期的方法，其特征是，所述步骤1中：对声音信息进行初步处理，包括但不限于一致性检查和缺失值、异常值处理。 3.根据权利要求1所述的基于密度聚类的采用声音识别设备生命周期的方法，其特征是，所述步骤3中：将样本数据进行特征提取后，原始声音数据集的声音模拟信号，转化为无量纲的纯数值特征信息。 4.根据权利要求1所述的基于密度聚类的采用声音识别设备生命周期的方法，其特征是，所述步骤4包括如下步骤：步骤41：构造根节点，确定切分超平面，将样本空间切分为两个子区域；步骤42：重复切分样本空间；步骤43：重复步骤41和步骤42，直到两个子区域没有实例，或分区数达到l时停止，形成 KD树的区域划分。构造KD树，将标准样本空间划分为l个不同的区域包括以上3个步骤41 ‑43。以下通过一个简单的例子说明该构造KD树的过程。例如，对于有二十个元素的集合Q{(35,1),(26,15),(17,22),(4,23),(26,4),(12,3), (22,8),(26,36),(10,30),(19,2),(5,23),(26,25),(23,16),(10,19),(6,2),(25,23), (4,26),(2 2,10),(7,12),(2 2,4)}，其KD树及其区域划分如图3和图4。 5.根据权利要求1所述的基于密度聚类的采用声音识别设备生命周期的方法，其特征是，所述步骤5中，对标准样本集进行聚类包括如下步骤：步骤51：初始化步骤；将核心对象集H、类别集C和噪声集N置为空集，将未访问集T置为所有输入样本；步骤52：在未访问集T中，随机选一个样本Xi，利用KD树计算样本Xi以eps为半径的邻域内样本个数n；步骤53：判断n是否大于预设的密度阈值；若是，则将样本Xi放入核心对象集H；若不是，则将样本Xi放入噪声集 N，返回执行步骤52；步骤54：建立一个新类Cj，类集为Cj；新建候选集S，候选集S初始元素为步骤53产生的核心对象Xi；权　利　要　求　书 1/2 页 2 CN 114530163 A 2步骤55：从候选集S中任取一个样本Xp；步骤56：若候选集S非空，则返回步骤5 5执行；步骤57：将Cj加入类别集C；步骤58：若未访问集T非空，则返回步骤52执行步骤59：输出类别集C＝{C1， C2，…， Ck}。 6.根据权利要求5所述的一种基于密度聚类的采用声音识别设备生命周期的方法，其特征是，所述步骤52中，利用KD树计算Xi以eps为半径的邻域内样本个数n 的过程包括如下步骤：步骤521：二叉树搜索步骤；先从根点开始查找KD树，依次到达节点K1,K2,…,Km， Km为最后到达的节点，在Km区域计算距离小于eps的样本点； m为节点总个数；步骤522：回溯查找步骤；依次向上一级回溯Km‑1,Km‑2,…,K1，判断在该父节点的其它子节点空间中是否有eps邻域内样本，以Km节点为圆心，以eps为半径画圆，判断该圆和层的区域分隔超平面交割，若相交则计算其它子节点空间是否有 eps邻域内样本，再回溯到上一级父节点；若不想交，则直接回溯到上一级父节点。 7.一种基于密度聚类的采用声音识别设备生命周期的方法的系统，其特征是，包括声音信号采集模块、预处理模块、特征提取模块、 KD树构造模块、构造KD树模块、模糊模式匹配模块和生命周期识别模块；所述声音信号采集模块，用于获取设备运行的声音信息，对声音信息进行初步处理，获得待检设备运行的原始声音数据集；所述预处理模块，用于对原始声音数据集进行去噪、分帧、加窗处理；所述特征提取模块，用于从上述处理后的原始声音数据集中，提取时域、频域和时频域特征，得到以特征值向量组成的标准样本集；所述构造KD树模块，用于构造KD树，将所述标准样本集样本空间划分为l个不同的区域；所述聚类模型训练模块，用于结合KD树快速搜索算法和密度聚类算法，对标准样本集进行快速聚类，获取聚类模型；所述模糊匹配模块，用于获取待检设备运行的实时声音信息并对该实时声音信息进行预处理和特征提取，输入至上述训练后的聚类模型；利用上述训练后的聚类模型进行模糊模式匹配，利用实时声音信息识别待检设备的生命周期；上述生命周期识别模块，用于根据生命周期类别获取待检设备所处的生命周期。 8.一种电子设备，其特征在于，包括：至少一个处理器以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行如权利要求 1至6中任一项所述的基于密度聚类的采用声音识别设备生命周期的方法。 9.一种计算机可读存储介质，存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的基于密度聚类的采用声音识别设备生命周期的方法。权　利　要　求　书 2/2 页 3 CN 114530163 A 3

专利 基于密度聚类的采用声音识别设备生命周期的方法及系统

专利基于密度聚类的采用声音识别设备生命周期的方法及系统