全网唯一标准王
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111491592.8 (22)申请日 2021.12.08 (71)申请人 北京卫星环境工程研究所 地址 100094 北京市海淀区友谊路104 号 (72)发明人 刘业楠 赵瑜馨 向树红 田东波  杨武霖 王思展 王璐 郭佳丽  刘宇明  (74)专利代理 机构 北京志霖恒远知识产权代理 事务所(普通 合伙) 11435 代理人 郭栋梁 (51)Int.Cl. G06F 30/27(2020.01) G06F 30/15(2020.01) G06F 40/284(2020.01) G06F 40/289(2020.01)G06N 20/10(2019.01) (54)发明名称 一种基于在轨异常信息的航天器异常关联 性模型训练方法 (57)摘要 本发明公开了一种基于在轨异常信息的航 天器异常关联性模型训练方法, 基于在轨异常描 述信息的航天器异常关联性模型构建方法, 包括 (1)、 构建在轨异常描 述信息的信息库; (2)、 生成 多空间环境因素与航天器异常信息的关联性模 型; 4)模型训练; 其中, 对于模型训练, 采用k折方 式, 设定常数k、 n, 其中k>n>1, 通过将时间区间 [0, T]分成k份, 任选其中n份作为训练集, 其余作 为测试集; 其次, 通过训练及测试集的结果可 以 获得选定模型的正确率、 AUC、 F 1分数等量化指标 以及模型的参数。 本发明旨在 有效的利用航天器 异常描述信息, 构建能够自动生成的更灵活和普 适的关联性模 型, 为航天器在轨空间环境安全和 可靠工作提供了相应的保障和地 面管理参 考。 权利要求书2页 说明书7页 附图2页 CN 114330103 A 2022.04.12 CN 114330103 A 1.一种基于在轨异常信息的航天器异常关联性模型训练方法, 其特征在于: 基于在轨 异常描述信息的航天器异常 关联性模型构建方法, 包括 (1)、 构建在轨异常描述信息的信息库; (2)、 生成多空间环境因素与航天器异常信息的关联性模型; 在步骤(2)中, 生成关联性模型包括: 1)环境与异常融合数据库构建; 2)因果模型构建; 3)关联性模型构建; 4)模型训练; 其中, 对于模型训练, 采用k折方式, 设定常数k、 n, 其 中k>n>1, 通过将时间 区间[0, T]分成k份, 任选其中n份作为训练集, 其余作为测试集; 其次, 通过训练及测试集的 结果可以获得选 定模型的正确率、 AUC、 F1分数等 量化指标以及模型的参数。 2.根据权利要求1所述的基于在轨异常信息的航天器关联性模型训练方法, 其特征在 于: 在步骤(1)中, 构建在轨异常描述信息的信息库包括: 1)文本预处 理; 2)特征词集合降维; 3)现象及单机归类; 4)重复前面3个步骤。 3.根据权利要求2所述的基于在轨异常信息的航天器关联性模型训练方法, 其特征在 于: 文本预处 理包括: 专有名词替换、 分词及去停用词; 文本预处理前需要准备航天器在轨异常描述信 息文本集以及专有名词词表, 之后进行 专有名词替换, 即将所有文档中具有相同含义词语对照词表进行替换, 形成具有统一命名 规则的航天器异常描述文本集; 然后进行分词处理, 首先考虑专有名词词表中的词语, 不对其进行划分, 再基于Jiaba 分词技术将文本处 理为以词语或词组为 最小单位的特 征词集合; 最后进行去停用词, 基于上一 步的特征词集合, 去除标点、 数字、 英文以及虚词。 4.根据权利要求3所述的基于在轨异常信息的航天器关联性模型训练方法, 其特征在 于: 特征词集合降维包括: 候选特 征词TF‑IDF值降维和主成分 分析降维; 候选特征词TF ‑IDF值降维对于某一特定文档和特定的词t, 词t的TF ‑IDF公式表示如 下: Vtgidf(t,di)=ftf(t,di)×fidf(t,di); 主成分分析降维使用PCA数据降维算法, 其通过线性变换将高维的原始特征数据变换 为一组各维度线性无关的向量表示, 同时尽可能保留数据的方差 。 5.根据权利要求4所述的基于在轨异常信息的航天器关联性模型训练方法, 其特征在 于: 现象及单机归类包括: 对照词表判别、 人工校正及提取现象词表; 首先, 对照之前构建的单机名称词表, 判断其是否为单机特征词, 若不在词 表中则认为 其为现象特 征词; 其次, 将所有现象特征词进行人工校正, 剔除不重要的特征词, 对分词判断错误的进行 人工修正; 最后, 将修正后的特征词作为现象词表, 加入专有名词词表, 再一 次进行文本分词及降 维处理。 6.根据权利要求1所述的基于在轨异常信息的航天器关联性模型训练方法, 其特征在 于: 环境与异常融合数据库构建包括: 空间环境融合数据库构建和环境与异常数据库融合;权 利 要 求 书 1/2 页 2 CN 114330103 A 2首先, 选择与航天器异常数据库对应时间区间的连续环境因素作为多种环境因素构建 空间环境融合数据库; 其次, 基于统一时间标志 的插值及标准化处理方法, 对异常数据库和环境数据库进行 合并。 7.根据权利要求1所述的基于在轨异常信息的航天器关联性模型训练方法, 其特征在 于: 因果模 型构建包括: 类 Granger因果时滞值计算、 基于时滞值的因子筛选及p值检验及类 Granger因果模型构建; 首先, 取合适的时间特征值δt, 将t0时刻的空间环境数据延展至[t0 ‑δt,t0]区间, 并进 行标准化处理使其满足取值区间为[0, 1]; 之后, 基于皮尔森相关系数、 t检验、 AIC、 BIC等指标, 计算合并数据库中任意两个因子X 和Y间的类Granger因果时滞值; 最后, 遍历上述数据库各项因子并将因果结果构建类Granger因果有向图。 8.根据权利要求1所述的基于在轨异常信息的航天器关联性模型训练方法, 其特征在 于: 关联性模型构建包括: 原因节点的提取及筛 选及基于 机器学习模型的关联性模型构建; 首先, 从航天器异常数据库中选择具体异常因子, 提取所有因子的全部原因Xi(i∈ 1..N), 并提取其对应的时滞值ti; 提取时可以同时查看这N个节点间自身的相关关系, 若其 中存在有相关因果关系的情况, 则裁 剪掉p值较高或时滞值较大的那一个; 随后, 构建关联性模型, 模型可采用广义线性相关模型、 随机森林模型、 极端树模型等 机器学习模型作为基础模型进行构建, 模型的关系构建为 之后, 进行初步训练抽样70%数据进行因子筛选, 通过p值或贡献权重筛选掉较弱关联 性的因子且确保方差达到最优, 初步得到未训练的空间环境因素与典型航天器异常的关联 性模型。 9.根据权利要求8所述的模型训练对于模型训练方法, 其特征在于: 1)采用k折方式创 建训练集和测试集, 对于异常数据较少的情况, 可以分别将有异常数据(即{Y|Y>0})与无异 常数据(即{Y|Y=0})分别取不同的n值n1与n0, 且k>n1>n0>1来确保训练集的均衡性, 2)选 择指标及模型进行模型测试, 通过训练及测试集的结果可以获得选定模型的正确率、 AUC、 F1分数等量化指标以及 模型的参数, 当结果较好(例如正确率大于0.8)时可以接受该模 型, 否则可以更换其他机器学习模型进行测试, 最终, 获得空间环境与航天器异常现象的关联 性模型。权 利 要 求 书 2/2 页 3 CN 114330103 A 3

.PDF文档 专利 一种基于在轨异常信息的航天器异常关联性模型训练方法

文档预览
中文文档 12 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于在轨异常信息的航天器异常关联性模型训练方法 第 1 页 专利 一种基于在轨异常信息的航天器异常关联性模型训练方法 第 2 页 专利 一种基于在轨异常信息的航天器异常关联性模型训练方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 22:25:30上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。