全网唯一标准王
(19)国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 202211009713.5 (22)申请日 2022.08.23 (65)同一申请的已公布的文献号 申请公布号 CN 115129896 A (43)申请公布日 2022.09.30 (73)专利权人 南京众智维信息科技有限公司 地址 211300 江苏省南京市高淳区龙井路3 号 (72)发明人 车洵 孙捷 胡牧 梁小川  刘志顺 金奎  (74)专利代理 机构 南京知识律师事务所 32 207 专利代理师 张苏沛 (51)Int.Cl. G06F 16/36(2019.01) G06F 40/211(2020.01)G06N 3/04(2006.01) G06N 3/08(2006.01) (56)对比文件 CN 112084790 A,2020.12.15 WO 2022135121 A1,202 2.06.30 审查员 李雪晴 (54)发明名称 基于对比学习的网络安全应急响应知识图 谱关系提取方法 (57)摘要 本发明公开了基于对比学习的网络安全应 急响应知识图谱关系提取方法, 包括以下步骤: 准备一个网络安全应急响应文本集合, 其中包含 若干个网络安全应急响应句子, 每个句子分别包 含两个实体和一个实体关系; 对每个网络安全应 急响应句子进行标记处理, 然后将其输入连接编 码器和解码器中, 得到一个初步的预测关系向 量; 通过生成若干个负样本,生成对应的负样本 关系向量; 通过生成一个正样本,生成该正样本 关系向量; 在训练的过程中不断优化初步的预测 关系向量, 让其和负样本关系向量之间的距离变 远, 让其和正样本关系向量之间的距离变近, 得 到准确的预测关系向量, 然后再将预测关系向量 输入预训练好的关系分类器中得到所预测的关 系。 权利要求书3页 说明书10页 附图1页 CN 115129896 B 2022.12.13 CN 115129896 B 1.一种基于对比学习的网络安全应急响应知识图谱关系提取方法, 其特征在于, 包括 以下步骤: S1: 准备一个网络安全应急响应文本集合, 其中包含若干个网络安全应急响应句子, 每 个句子分别包 含两个实体和一个实体关系; S2: 对每个网络安全应急响应句子进行标记处理, 然后将其输入连接编码器和解码器 中, 得到一个初步的预测关系向量; S3: 通过生成若干个负样本, 然后将负样本输入连接编码器和解码器 中, 生成对应的负 样本关系向量; S4: 通过生成一个正样本, 然后将该正样本输入连接编码器和解码器 中, 生成该正样本 关系向量; S5: 在训练的过程中不断优化初步的预测关系向量, 让其和负样本关系向量之间的距 离变远, 让其和正样本 关系向量之 间的距离变近, 得到准确的预测关系向量, 然后再将预测 关系向量输入预训练好的关系分类 器中得到所 预测的关系; 所述S1还 包括以下步骤: 准备一个网络安全应急响应文本集合W, 其中包括若干个网络安全应急响应句子, 每个 句子分别包含两个实体e1和e2, 对于句子S0, 先对该句子S0进行标记, 得到该句子的表示 {CLS, T1...Te...Tf...Tu...Tm...Tn, SPE}, n表示标记的总数, 其 中[CLS]表示开始标志, 其 包含了整个句子的信息, [SPE]表示结束的标志, e和f表示e1开始和结束标志的位置, u和m 表示e2开始和结束标志的位置; 所述S2包括以下步骤: 将标记后的句子发送到连接编码器中, 获取该句子的实体表示, 连接编码器输出的向 量为{A0, Ae...Af, Au...Am, Am+1}, 其中A0为[CLS]的输出, Am+1为[SPE]的输出, 并用下面两个 公式表示获得两个实体的向量: Ae1=BN(FC(MeanPo ol(Ae, ..., Af)))+c Ae2=BN(FC(MeanPo ol(Au, ..., Am)))+c 其中c是一个超参数, MeanPool表示平均池化操作, FC表示一个全连接操作, BN表示一 个正则化 函数; 然后将Ae1, Ae2, A0, Am+1输入到解码器中得到初步的网络安全应急响应关系向量V+, 表达 式为: 其中W和b1, b2为学习的参数, 代表矢量串联; 所述S3中的负 样本包括: 随机负 样本、 关系实例负 样本和遮蔽负 样本; 所述S3还包括以下步骤: 对于句子S0, 挑选若干个和句子S0均不相关的句子作为随机负 样本S1, 即随机选出三个和网络安全不相关的数据库, 然后从每个数据库 中随机选出一个 句子, 三个数据库 选出三个句子组成随机负样本S1, 再对这三个句子进行标记, 标记后输入 到连接编码器和解码器中, 生成相应的随机负 样本向量, 表示 为: 然后取生成的这 三个向量的平均值作为对比学习中随机负 样本向量 表达式为:权 利 要 求 书 1/3 页 2 CN 115129896 B 2和V+之间的距离为 表达式为: 对 和V+之间的距离 进行最大化; 所述S3还包 括以下步骤: 随机的掩盖住句子S0中的几个标记, 即随机将 若干个标记 变为 0, 以生成遮蔽负样本S2, 对遮蔽负样本S2进行标记, 标记后将其输入 到连接编码器和解码器 中, 生成相应的遮蔽负 样本向量 和V+之间的距离为 表达式为: 对 和V+之间的距离 进行最大化。 2.根据权利要求1所述的方法, 其特征在于, 所述S3还包括以下步骤: 将句子中的代表 实例的标记和代表关系的标记随机 的用其他标记代替, 以生成关系 实例负样本S3, 对关系 实例负样本S3进行标记, 标记后输入到连接编码器和解码器中, 生成相应 的关系实例负样 本向量 当若干个句子不包含直接指示关系词的标记时, 使用随机替换句子中的一定百 分比的标记作为 替代方法, 和V+之间的距离 表达式为: 对 和V+之间的距离 进行最大化。 3.根据权利要求2所述的方法, 其特 征在于, 所述S4还 包括以下步骤: 从训练的数据库中用一个和句子S0拥有相同关系, 但两个句子的实体不相同的正样本 S4, 对S4进行标记, 标记后将其输入到连接编码器和解码器中, 得到一个正样本向量 和V+之间的距离为 表达式为: 对 和V+之间的距离 进行最小化。 4.根据权利要求3所述的方法, 其特 征在于, 所述S5还 包括步骤: 将正样本的距离与三个负 样本的距离作为 一对计算进行比较, 表达式为: 其中i=1, 2, 3, γ是一个超参数, 其用于让正样本和负样本之间的距离差有缓冲的空 间, 此时将第一个任务的目标表示 为:权 利 要 求 书 2/3 页 3 CN 115129896 B 3

.PDF文档 专利 基于对比学习的网络安全应急响应知识图谱关系提取方法

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于对比学习的网络安全应急响应知识图谱关系提取方法 第 1 页 专利 基于对比学习的网络安全应急响应知识图谱关系提取方法 第 2 页 专利 基于对比学习的网络安全应急响应知识图谱关系提取方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-17 23:42:30上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。