专利一种基于深度学习的选择题干扰项自动化生成方法及模型

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210369952.5 (22)申请日 2022.04.08 (71)申请人清华大学深圳国际研究生院地址 518055 广东省深圳市南山区西丽街道深圳大学城清华校区A栋二楼 (72)发明人郑海涛　李明超　刘浩壮　江勇　夏树涛　肖喜　 (74)专利代理机构深圳新创友知识产权代理有限公司 4 4223 专利代理师徐罗艳 (51)Int.Cl. G06F 40/205(2020.01) G06F 40/30(2020.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称一种基于深度学习的选择题干扰项自动化生成方法及模型 (57)摘要本发明公开了一种基于深度学习的选择题干扰项自动化生成方法及模型，模型包括：答案编码器，用于对选择题的答案进行编码，以获得答案表示向量；文章编码器，用于对文章和问题进行联合编码，以获得文章表示向量；上下文推理注意力机制模块，连接于答案编码器和文章编码器，用于合并文章上下文向量和答案上下文向量，以进行上下文推理，生成编码器最终上下文向量；文章上下文向量是由文章表示向量经文章注意力机制而获得，答案上下文向量是由答案表示向量经答案注意力机制而获得；干扰项解码器，连接于答案编码器以利用答案编码器的输出进行解码器初始化，以及连接于上下文推理注意力机制模块以对所述编码器最终上下文向量进行解码，生成干扰项。权利要求书2页说明书7页附图2页 CN 114861627 A 2022.08.05 CN 114861627 A 1.一种基于深度学习的选择题干扰项自动化生成模型，用于为阅读理解的选择题生成干扰项，其特征在于，包括：答案编码器，用于对选择题的答案进行编码，以获得答案表示向量；文章编码器，用于对文章和问题进行联合编码，以获得文章表示向量；上下文推理注意力机制模块，连接于所述答案编码器和所述文章编码器，用于合并文章上下文向量和答案上下文向量，以进行上下文推理，生成编码器最终上下文向量；其中，所述文章上下文向量是由所述文章表示向量经文章注意力机制而获得，所述答案上下文向量是由所述答案表示向量经答案注意力机制而获得；干扰项解码器，连接于所述答案编码器以利用所述答案编码器的输出进行解码器初始化，以及，连接于所述上下文推理注意力机制模块以对所述编码器最终上下文向量进行解码，生成干扰项。 2.如权利要求1所述的基于深度学习的选择题干扰项自动化生成模型，其特征在于，所述文章编码器对文章和问题进行联合编码，包括：利用词向量查找表将文章文本转换为文章词嵌入向量；提取问题文本中的关键词，进行关键词标记，并生成问题关键词标记向量；将所述问题关键词标记向量与所述文章词嵌入向量进行拼接，并对拼接获得的向量利用双向LSTM网络进行编码。 3.如权利要求2所述的基于深度学习的选择题干扰项自动化生成模型，其特征在于，还包括：利用门控自注意力机制对所述文章词嵌入向量进行信息聚合。 4.如权利要求2所述的基于深度学习的选择题干扰项自动化生成模型，其特征在于，问题文本中的关键词是同时出现在问题和文章中的单词。 5.如权利要求1所述的基于深度学习的选择题干扰项自动化生成模型，其特征在于，所述答案编码器对选择题的答案进行编码，包括：先利用词向量查找表将答案文本转换为答案词嵌入向量，然后使用双向LSTM网络对所述答案词嵌入向量进行编码，以获得所述答案表示向量。 6.如权利要求1所述的基于深度学习的选择题干扰项自动化生成模型，其特征在于，所述上下文推理注意力机制模块包括：连接于所述答案编码器输出端的答案注意力机制模块和连接于所述文章编码器输出端的文章注意力机制模块；所述答案注意力机制模块的输出和所述文章注意力机制模块的输出通过门控进行融合，以进行所述上下文推理。 7.如权利要求6所述的基于深度学习的选择题干扰项自动化生成模型，其特征在于，还包括：在所述文章注意力机制模块的输出端使用复制机制，通过注意力得分来确定生成的单词是从生成词表中选择还是从原文词表中选择。 8.如权利要求7所述的基于深度学习的选择题干扰项自动化生成模型，其特征在于，还包括：最终概率分布计算模块，用于根据干扰项解码器生成单词的生成得分和复制机制的复制得分计算在单词表中所有单词上的概率分布，之后取最大概率值的单词作为生成的单词。 9.一种基于深度学习的选择题干扰项自动化生成方法，用于为阅读理解的选择题生成干扰项，其特征在于，利用权利要求 1‑8任一项所述的基于深度学习的选择题干扰项自动化权　利　要　求　书 1/2 页 2 CN 114861627 A 2生成模型来实现；该方法包括：训练阶段，训练集有对应好的<文章，问题，答案，干扰项>，其中<文章，问题，答案>为源文本，作为模型的输入； <干扰项>为目标文本，作为深度学习优化的目标，使用教师强制策略进行模型训练；使用阶段，利用文章、问题和答案作为输入文本，利用训练好的所述模型生成干扰项。 10.如权利要求9所述的基于深度学习的选择题干扰项自动化生成方法，其特征在于，在使用阶段，将输入文本的起始符作为第一个字符输入到解码器中，使用集束搜索进行解码，最终获得干扰项文本。权　利　要　求　书 2/2 页 3 CN 114861627 A 3

专利 一种基于深度学习的选择题干扰项自动化生成方法及模型

专利一种基于深度学习的选择题干扰项自动化生成方法及模型