全网唯一标准王
文库搜索
切换导航
文件分类
频道
文件分类
批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111277389.0 (22)申请日 2021.10.2 9 (71)申请人 深圳证券信息有限公司 地址 518000 广东省深圳市福田区红荔西 路203栋606室 (72)发明人 毛瑞彬 朱菁 潘斌强 杨雯雯 刘金香 孙德旺 武李爱 张俊 杨建明 张大千 (74)专利代理 机构 北京集佳知识产权代理有限 公司 11227 代理人 王学强 (51)Int.Cl. G06F 40/186(2020.01) G06F 40/284(2020.01) G06F 40/242(2020.01)G06F 16/35(2019.01) G06N 3/08(2006.01) G06N 20/00(2019.01) (54)发明名称 一种问询函 生成方法、 系统及其装置 (57)摘要 本申请实施例公开了一种问询函生成方法、 系统及其装置, 用于针对发行方招股书中的异常 审核点生成问询函, 辅助人工撰写, 节省人力和 时间。 本申请实施例方法包括: 获取目标生成模 型, 所述目标生成模型由历史问询函和历史招股 书对初始生成模 型进行机器学习训练得到, 所述 目标生成模型中保存有用于生成目标问询函的 规则字典, 所述历史问询函与所述历史招股书具 有对应关系, 且 所述历史问询函根据所述历史招 股书生成, 所述规则字典通过对历史问询函和历 史招股书进行机器学习并结合人工经验得到; 获 取目标招股书的文本向量; 将所述目标招股书的 文本向量输入 所述目标生 成模型, 所述目标生成 模型根据所述规则字典输出所述目标招股书对 应的目标问询函。 权利要求书3页 说明书12页 附图3页 CN 113901778 A 2022.01.07 CN 113901778 A 1.一种问询函 生成方法, 其特 征在于, 包括: 获取目标生成模型, 所述目标生成模型由历史问询函和历史招股书对初始生成模型进 行机器学习训练得到, 所述 目标生成模型中保存有用于生成目标问询函的规则字典, 所述 历史问询函与所述历史招股书具有对应关系, 且所述历史问询函根据所述历史招股书生 成, 所述规则字典通过对历史问询函和历史招股书 进行机器学习并结合人工经验得到; 获取目标招股书的文本向量; 将所述目标招股书的文本向量输入所述目标生成模型, 所述目标生成模型根据 所述规 则字典输出 所述目标招股书对应的目标问询函。 2.根据权利要求1所述的问询函生成方法, 其特征在于, 在所述获取目标生成模型之 前, 所述方法还 包括: 获取所述历史问询函和所述历史招股书, 并运用文本向量算法获取所述历史问询函和 所述历史招股书的文本向量; 将所述历史问询函和所述历史招股书的文本向量作为训练样本输入所述初始预测模 型, 使用所述训练样本对所述初始生成模型进行机器学习训练得到所述 目标生成模型, 所 述目标生成模型中保存有所述 规则字典。 3.根据权利要求1所述的问询函生成方法, 其特征在于, 所述规则 字典通过对历史问询 函和历史招股书 进行机器学习并结合人工经验得到包括: 运用分类算法将所述历史问询函分解为问询背景段落和问询问题段落, 并识别所述问 询问题段落中包含的细分问题, 其中, 一个审核要点对应至少一个所述问询背景段落和至 少一个所述问询问题段落, 同一所述审核要点对应的所述问询背 景段落和所述问询问题 段 落具有关联关系; 确定所述细分问题对应的审核要点, 其中, 一个所述审核要点对应至少一个所述细分 问题, 并形成表示所述审核 要点和所述细分问题的对应关系的第一目录; 获取所述细分问题中包 含的关键词, 将所述关键词作为所述细分问题的问询方向; 对每个所述审核要点对应的所述细 分问题按照问询方向分别进行聚类, 得到表示所述 审核要点、 所述问询方向和所述细分问题的对应关系的第二目录, 其中, 一个所述审核要点 对应至少一个所述问询方向, 一个所述问询方向对应至少一个所述细分问题; 将所述细分问题输入至神经网络算法模型生成问题模板, 并得到表示所述审核要点、 所述问询方向和所述问题模板的对应关系的第三 目录, 其中, 一个所述审核要点对应至少 一个所述问询方向, 一个所述问询方向对应至少一个所述问题模板; 根据所述细分问题确定所述审核要点的触发条件, 得到表示所述审核要点、 所述问询 方向、 所述问题模板和所述触发条件的对应关系的第四目录, 所述触发条件用来判断是否 要对所述审核 要点进行问询; 对所述问询背景段落和所述历史招股书进行机器学习获得用于生成所述问询背景段 落的摘要改写规则; 所述规则字典包括所述第四目录和所述摘要改写规则。 4.根据权利要求3所述的问询函生成方法, 其特征在于, 所述获取所述细 分问题中包含 的关键词, 将所述关键词作为所述细分问题的问询方向包括: 对所述细 分问题进行基于词的粒度的分词匹配得到预处理分词集合, 运用文本向量算权 利 要 求 书 1/3 页 2 CN 113901778 A 2法和文本分类算法对所述预处 理分词集 合进行处 理得到关键词种子词库; 对所述关键词种子词库进行基于人工经验的近义词 词典进行扩充得到关键词 词库; 或者对所述关键词种子词库运用文本向量算法计算词语的相似度对所述关键词种子 词库进行扩充, 得到所述关键词 词库; 根据所述关键词词库获取所述细分 问题中包含的关键词, 将所述关键词作为所述细 分 问题的问询方向。 5.根据权利要求3所述的问询函生成方法, 其特征在于, 所述将所述细 分问题输入至神 经网络算法模型生成问题模板包括: 运用文本向量算法获取所述细 分问题的文本向量, 将所述细分 问题的文本向量作为训 练样本输入初始文本识别模型进行机器学习训练, 得到目标文本识别模型, 所述 目标文本 识别模型中保存有所述细分问题中的实体文本、 属性文本和 属性值文本的识别方法; 将所述细分问题中的所述实体文本、 所述属性文本和所述属性值文本替换为占位符, 得到所述问题模板 。 6.根据权利要求5所述的问询函生成方法, 其特征在于, 所述根据 所述细分问题确定所 述审核要点的触发条件 包括: 所述审核要点的触发条件分为规则模式和内容模式两种类型, 所述规则模式的触发条 件包括: 根据所述细分 问题的所述属性值预设所述属性值阈值, 若所述历史招股书中的所述属 性值不满足所述属性值阈值, 则确定触发所述审核要点, 其中, 所述历史问询函中的所述细 分问题中的所述属 性值与所述历史招股书中对应的所述审核要点的所述属 性值具有对应 关系; 所述内容模式的触发条件 包括: 通过将所述历史问询函和所述历史招股书作为训练样本进行机器学习训练得到用于 判断是否存在异常审核 要点的二分类模型; 当所述目标招股书输入所述二分类模型得到存在异常审核要点的结论 时, 则确定触发 所述审核 要点。 7.根据权利要求3所述的问询函生成方法, 其特征在于, 所述对所述问询背景段落和所 述历史招股书 进行机器学习获得用于生成所述问询背景 段落的摘要改写规则包括: 将所述问询背景段落和所述历史招股书作为训练样本进行机器学习训练, 得到所述问 询背景段落与所述历史招股书中 内容的对应关系; 根据所述对应关系确定用于生成所述问询背景段落的摘要改写规则, 所述摘要改写规 则用于将所述历史招股书中与所述问询背景段落具有对应关系的文本段落进行摘要 改写 生成所述问询背景 段落。 8.一种问询函 生成系统, 其特 征在于, 包括: 获取单元, 用于获取目标生成模型, 所述目标生成模型由历史问询函和历史招股书对 初始生成模型进 行机器学习训练得到, 所述目标生成模型中保存有用于生成目标问询函的 规则字典, 所述历史问询函与所述历史招股书具有对应关系, 且所述历史问询函根据所述 历史招股书生成, 所述规则字典通过对历史问询函和历史招股书进行机器学习并结合人工 经验得到;权 利 要 求 书 2/3 页 3 CN 113901778 A 3
专利 一种问询函生成方法、系统及其装置
文档预览
中文文档
19 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 人生无常 于
2024-03-18 19:01:05
上传分享
举报
下载
原文档
(553.6 KB)
分享
友情链接
ISO IEC TS 17021-7 2014 Conformity assessment — Requirements for bodies providin.pdf
ISO 13640 2018 Buildings and civil engineering works Sealants Specifications for test substrates.pdf
ISO 5-4 2009 Photography and graphic technology — Density measurements — Part 4 Geometric conditions for reflection density.pdf
ISO TR 20520 2018 Traditional Chinese medicine — Infection control for acupuncture t.pdf
ISO 6898 1984 Open front mechanical power presses — Capacity ratings and dimensions.pdf
ISO 1839:1980 Tea - Sampling.pdf
ISO IEC 14496-33 2019 Information technology — Coding of audio-visual objects — Part 33 Internet video coding.pdf
ISO 8733 1997 Parallel pins with internal thread of unhardened steel and austenitic stainless steel.pdf
ISO 17266 2018 Cinematography — Multichannel analogue and digital photographic sound and control records on 35 mm motion-picture prints and negatives, and digital sound-control records on.pdf
ISO IEC 7816-8 2021 Identification cards — Integrated circuit cards — Part 8 Commands and mechanisms for security operations.pdf
GB-T 28772-2012 内燃机油分类.pdf
GB-T 17626.1-2006 电磁兼容 试验和测量技术 抗扰度试验总论.pdf
GB-T 20703-2006 船舶电气装置 取暖和烹调电器.pdf
GB-T 39352-2020 空间数据与信息传输系统 邻近空间链路协议 数据链路层.pdf
GB-T 27025-2019 检测和校准实验室能力的通用要求.pdf
GB 11555-2009 汽车风窗玻璃除霜和除雾系统的性能和试验方法.pdf
GB-T 32424-2015 系统与软件工程 用户文档的设计者和开发者要求.pdf
GB-T 23602-2009 钛及钛合金表面除鳞和清洁方法.pdf
GB-T 2793-1995 胶粘剂不挥发物含量的测定.pdf
GB-T 40374-2021 硬质合金化学分析方法 铅量和镉量的测定 火焰原子吸收光谱法和电感耦合等离子体原子发射光谱法.pdf
1
/
3
19
评价文档
赞助2元 点击下载(553.6 KB)
回到顶部
×
微信扫码支付
2
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。