全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211198710.0 (22)申请日 2022.09.29 (71)申请人 深圳顶匠科技有限公司 地址 518066 广东省深圳市南 山区前海深 港合作区南山街道兴海 大道3040号前 海世茂金融 中心二期20 05 (72)发明人 不公告发明人   (74)专利代理 机构 广州三环 专利商标代理有限 公司 44202 专利代理师 江银会 (51)Int.Cl. G06F 40/58(2020.01) G06F 40/186(2020.01) G06F 40/151(2020.01) G06N 20/00(2019.01) (54)发明名称 汽车维修资料的语言智能翻译方法及装置 (57)摘要 本发明公开了一种汽车维修资料的语言智 能翻译方法及装置, 该方法包括: 通过训练好的 源语言编码模 型, 对分割处理后的每个源语言对 象进行编码, 得到每个源语言对象对应的源语言 编码; 根据确定出的所有源语言对象对应的所有 目标语言语料对齐模板, 对源语言编码序列进行 编码译码, 得到源语言编码序列对应的目标语言 译码序列, 并对源语言编码序列对应的目标语言 译码序列进行译码译文转换, 得到源语 言编码序 列对应的目标语言译文序列。 可见, 实施本发明 能够将源语言智能化地转换成目标语 言, 无需花 费大量时间进行逐一转换, 有利于提高对源语言 的翻译效率, 进而有利于依据翻译后的汽车维修 资料对汽车进行快速维修, 从而使得汽车维修工 作能够顺利进行。 权利要求书4页 说明书20页 附图5页 CN 115526188 A 2022.12.27 CN 115526188 A 1.一种汽车维修资料的语言智能翻译方法, 其特 征在于, 所述方法包括: 对需要翻译成 目标语言的源语言语句进行分割处理, 得到所述源语言语句对应的源语 言序列; 所述源语言序列包括按照预设顺序排列的至少一个源语言对 象, 所述源语言对 象 为源语言字或者源语言词; 通过预先训练出的源语言编码模型, 对每个所述源语言对象执行编码操作, 得到每个 所述源语言对象对应的源语言编码, 作为所述源语言序列对应的源语言编码序列; 根据每个所述源语言对象对应的源语言编码, 从预设的目标语言语料对齐库中确定出 每个所述源语言对象对应的多个目标语言语料对齐模板; 每个所述目标语言语料对齐模板 包括多个参照源语言对象以及每个所述参照源语言对象对应的参照目标语言对象, 且每个 所述参照源语言对象与对应的参照目标语言对象之间存在预设位置关系; 根据所有所述源语言对象对应的所有所述目标语言语料对齐模板, 对所述源语言序列 对应的源语言编码序列执行编 码译码操作, 得到所述源语言编 码序列对应的目标语言译码 序列, 并对所述源语言编码序列对应的目标语言译码序列进行译码译文转换, 得到所述源 语言编码序列对应的目标语言译 文序列。 2.根据权利要求1所述的汽车维修资料的语言智能翻译方法, 其特征在于, 在所述根据 每个所述源语言对象对应的源语言编 码, 从预设的目标语言语料对齐库中确定出每个所述 源语言对象对应的多个目标语言语料对齐模板之前, 所述方法还 包括: 根据每个所述源语言对象对应的源语言编码, 从预设的目标语言译文编码标签库中匹 配出每个所述源语言对象对应的目标语言译文编码标签网格; 所述目标语言译文编 码标签 网格包括与对应的源语言对象相匹配的多个目标语言译 文编码标签; 其中, 所述根据每个所述源语言对象对应的源语言编码, 从预设的目标语言语料对齐 库中确定出每 个所述源语言对象对应的多个目标语言语料对齐模板, 包括: 根据每个所述源语言对象对应的源语言编码, 从预设的目标语言语料对齐库中匹配出 每个所述源语言对象对应的多个待定目标语言语料对齐模板; 对于每一所述源语言对象, 根据所述源语言对象对应的目标语言译文编码标签网格, 从所述源语言对象对应的所有 所述待定目标语言语料对齐模板中, 确定出与对应的目标语 言译文编码标签网格中任一所述目标语言译文编码相匹配的所有待定目标语言语料对齐 模板, 作为所述源语言对象对应的所有目标语言语料对齐模板 。 3.根据权利要求1或2所述的汽车维修资料的语言智能翻译方法, 其特征在于, 所述根 据所有所述源语言对象对应的所有所述目标语言语料对齐模板, 对所述源语言序列对应的 源语言编码序列执行编码译码操作, 得到所述源语言编码序列对应的目标语言译码序列, 包括: 根据所述源语言序列对应的源语言编码序列的序列内容以及每个所述源语言对象对 应的每个所述目标语言语料对齐模板中的模板内容, 确定每个所述目标语言语料对齐模板 中所有所述参照源语言对象对应的参照目标语言对象的对象位置, 作为每个所述目标语言 语料对齐模板中所有所述 参照源语言对象对应的重组位置; 对于每个所述目标语言语料对齐模板 中每个所述参照源语言对象, 根据 该参照源语言 对象对应的重组位置, 确定与该参照源语言对象对应的重组位置相匹配的所述参照目标语 言对象的多个译码的统计量;权 利 要 求 书 1/4 页 2 CN 115526188 A 2根据与该参照源语言对象对应的重组位置相匹配的所述参照目标语言对象的每个所 述译码的统计量, 从所有所述译码中确定出所述统计量大于等于预设统计量阈值的译码, 作为与该参照源语言对象对应的重组位置相匹配的所述 参照目标语言对象的目标译码; 根据确定出的每个所述目标语言语料对齐模板中每个所述参照源语言对象对应的重 组位置中的目标译码以及预设的译码贡献值计算 公式, 计算每个所述目标语言语料对齐模 板中所有所述 参照源语言对象对应的目标译码贡献值; 从所有所述目标语言语料对齐模板中确定出所述目标译码贡献值大于等于预设贡献 值阈值的目标语言输出重组模板, 并根据所述目标语言输出重组模板中每个所述参照源语 言对象对应的重组位置中的目标译码, 确定所述源语言编码序列对应的目标语言译码序 列。 4.根据权利要求3所述的汽车维修资料的语言智能翻译方法, 其特征在于, 所述根据 所 述源语言序列对应的源语言编码序列的序列内容以及每个所述源语言对 象对应的每个所 述目标语言语料对齐模板中的模板内容, 确定每个所述目标语言语料对齐模板中所有 所述 参照源语言对象对应的参照目标语言对象的对象位置, 作为每个所述目标语言语料对齐模 板中所有所述 参照源语言对象对应的重组位置, 包括: 根据所述源语言序列对应的源语言编码序列的序列内容以及每个所述源语言对象对 应的每个所述目标语言语料对齐模板中的模板内容, 计算所述源语言序列对应的源语言编 码序列与每个所述 目标语言语料对齐模板之间的关联度; 所述关联度越大, 表示所述源语 言序列对应的源语言编码序列的序列内容与该目标语言语料对齐模板的模板内容越相似; 根据所述源语言序列对应的源语言编码序列与每个所述目标语言语料对齐模板之间 的关联度的大小情况, 确定每 个所述目标语言语料对齐模板的重组顺序; 根据每个所述目标语言语料对齐模板的重组顺序、 每个所述目标语言语料对齐模板中 每个所述参照源语言对象与对应的参照目标语言对 象之间的预设位置关系以及所述源语 言序列对应的源语言编 码序列中每个所述源语言对象的对象位置, 依次地确定出每个所述 目标语言语料对齐模板中所有 所述参照源语言对象对应的参照目标语言对象的对象位置, 作为每个所述目标语言语料对齐模板中所有所述 参照源语言对象对应的重组位置 。 5.根据权利要求1或2所述的汽车维修资料的语言智能翻译方法, 其特征在于, 在所述 对需要翻译成目标语言的源语言语句进行分割处理, 得到所述源语言语句对应的源语言序 列之前, 所述方法还 包括: 对用于训练的目标训练样本集合中的源语言训练样本集合以及所述源语言训练样本 集合对应的目标语言训练样本集合进 行分割处理, 得到所述源语言训练样本集合对应的第 一列表以及所述目标语言训练样本集合对应的第二列 表; 所述第一列表及所述第二列表均 包括对应的若干个训练样本对象, 所述训练样本对象为训练样本 字或者训练样本词; 通过所述第一列表以及所述第二列表, 对预设的待训练语言模型 执行多次训练操作; 在每次所述训练操作的过程中, 根据所述第一列表以及所述第二列表, 生成所述源语 言训练样本集合对应的第一词组组合序列以及所述目标语言训练样本集合对应的第二词 组组合序列, 并根据所述第一词组组合序列以及所述第二词组组合序列, 更新上一次所述 训练操作对应的第一词组组合序列的编码贡献值及对应的第二词组组合序列的编码贡献 值。权 利 要 求 书 2/4 页 3 CN 115526188 A 3

.PDF文档 专利 汽车维修资料的语言智能翻译方法及装置

文档预览
中文文档 30 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共30页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 汽车维修资料的语言智能翻译方法及装置 第 1 页 专利 汽车维修资料的语言智能翻译方法及装置 第 2 页 专利 汽车维修资料的语言智能翻译方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 12:13:46上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。