全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210969051.X (22)申请日 2022.08.12 (71)申请人 中国电信股份有限公司 地址 100033 北京市西城区金融大街31号 (72)发明人 熊子晗 陈军 陈大北 郭雪松  (74)专利代理 机构 北京律智知识产权代理有限 公司 11438 专利代理师 王辉 (51)Int.Cl. G06V 30/19(2022.01) G06V 30/18(2022.01) G06V 10/82(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06K 9/62(2022.01)G06F 40/216(2020.01) G06F 40/30(2020.01) (54)发明名称 邮件检测方法及装置、 电子设备 (57)摘要 本公开实施例是关于一种邮件检测方法及 装置、 电子设备, 涉及网络安全技术领域, 该方法 包括: 将待处理邮件中的目标文本进行转化, 得 到邮件特征图像; 将所述邮件特征图像进行图像 增强操作, 以获取增强的邮件特征图像; 对所述 增强的邮件 特征图像进行特征提取, 获取输出头 特征向量; 对 所述输出头特征向量进行拟合获取 分类预测值, 并根据所述分类预测值以及分类阈 值的对比结果确定所述待处理邮件是否为异常 邮件。 本公开能够在保护用户隐私的基础上准确 识别异常邮件。 权利要求书2页 说明书12页 附图6页 CN 115424278 A 2022.12.02 CN 115424278 A 1.一种邮件检测方法, 其特 征在于, 包括: 将待处理邮件中的目标文本进行转 化, 得到邮件特 征图像; 将所述邮件特 征图像进行图像增强操作, 以获取增强的邮件特 征图像; 对所述增强的邮件特 征图像进行 特征提取, 获取输出头特 征向量; 对所述输出头特征向量进行拟合获取分类预测值, 并根据 所述分类预测值以及 分类阈 值的对比结果确定所述待处 理邮件是否为异常邮件。 2.根据权利要求1所述的邮件检测方法, 其特征在于, 所述将待处理邮件中的目标文本 进行转化, 得到邮件特 征图像, 包括: 对目标文本进行分词操作 得到多个分词, 并获取每个分词的特征向量以及每个分词的 权重; 确定各特征向量对应的哈希编码值序列; 结合所述哈希编码值序列中, 每个哈希编码值的每一位和所述分词对应的特征向量的 权重生成签名结果; 对所述签名结果进行图像像素描点操作确定像素点的坐标以及灰度值, 以生成所述邮 件特征图像。 3.根据权利要求2所述的邮件检测方法, 其特征在于, 所述确定各特征向量对应的哈希 编码值序列, 包括: 随机初始化多个哈希函数, 通过多个哈希函数确定各特征向量对应的哈希编码值序 列。 4.根据权利要求2所述的邮件检测方法, 其特征在于, 所述结合所述哈希编码值序列 中, 每个哈希编码值的每一 位和所述分词对应的特 征向量的权 重生成签名结果, 包括: 根据每一 位的数值与所述权 重进行逻辑操作, 生成新的哈希编码值序列; 对新的哈希编码值序列进行列加操作得到新的哈希向量; 按位判断新的哈希向量中的二进制数值, 以计算签名结果。 5.根据权利要求2所述的邮件检测方法, 其特征在于, 所述对所述签名结果进行图像像 素描点操作确定每个分词对应的像素点的坐标以及灰度值, 以生成所述邮件特征图像, 包 括: 将签名结果拆分为第一数值和第二数值; 按位判断第一数值和第二数值与阈值 参数的对比结果, 以得到第三数值和第四数值; 将第三数值和第四数值转换为十进制数值以确定坐标, 并将所述坐标处 的像素点的灰 度值增加预设值, 直至 达到目标值 为止, 以生成邮件特 征图像。 6.根据权利要求1所述的邮件检测方法, 其特征在于, 所述将所述邮件特征图像进行图 像增强操作, 以获取增强的邮件特 征图像, 包括: 对所述邮件特 征图像进行像素反转, 通过互补灰度值代替所述灰度值; 对所述像素点的互补灰度值进行归一 化处理, 以增强所述邮件特 征图像。 7.根据权利要求1所述的邮件检测方法, 其特征在于, 所述对所述增强的邮件特征图像 进行特征提取, 获取输出头特 征向量, 包括: 对所述增强的邮件特征图像通过多阶段模型进行特征提取获取深度特征, 并对所述深 度特征进行解码, 获取解码后的特 征向量作为输出头特 征向量;权 利 要 求 书 1/2 页 2 CN 115424278 A 2其中, 所述多阶段模型通过多个目标模型串联得到, 所述目标模型包括窗口多头注意 层和移位窗口多头自注意层。 8.根据权利要求7所述的邮件检测方法, 其特征在于, 所述对所述增强的邮件特征图像 通过多阶段模型进行 特征提取和解码, 获取解码后的特 征向量作为输出头特 征向量, 包括: 将所述增强的邮件特征图像进行区域划分, 并对划分结果通过第 一阶段模型中的线性 嵌入层和目标模型进行 特征提取, 以获取初始特 征; 通过第二阶段模型中的目标模型对所述初始特 征进行深度特 征提取, 获取深度特 征; 通过第三阶段模型中的目标模型对所述深度 特征进行解码操作, 获取解码后的特征向 量作为输出头特 征向量。 9.一种邮件检测装置, 其特 征在于, 包括: 文本转化模块, 用于将待处 理邮件中的目标文本进行转 化, 得到邮件特 征图像; 图像增强模块, 用于将所述 邮件特征图像进行图像增强操作, 以获取增强的所述 邮件 特征图像; 特征获取模块, 用于对所述增强的邮件特 征图像进行 特征提取, 获取输出头特 征向量; 邮件识别模块, 用于对所述输出头特征向量进行拟合获取分类预测值, 并根据所述分 类预测值以及分类阈值的对比结果确定所述待处 理邮件是否为异常邮件。 10.一种电子设备, 其特 征在于, 包括: 处理器; 以及 存储器, 用于存 储所述处 理器的可 执行指令; 其中, 所述处理器配置为经由执行所述可执行指令来执行权利要求1至8中任一项所述 的邮件检测方法。权 利 要 求 书 2/2 页 3 CN 115424278 A 3

PDF文档 专利 邮件检测方法及装置、电子设备

文档预览
中文文档 21 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 邮件检测方法及装置、电子设备 第 1 页 专利 邮件检测方法及装置、电子设备 第 2 页 专利 邮件检测方法及装置、电子设备 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:14:12上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。