全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210343943.9 (22)申请日 2022.04.02 (71)申请人 筏渡 (上海) 科技有限公司 地址 200090 上海市杨 浦区长阳路1687号 东1223幢 (A楼) 三层A3 07 (72)发明人 夏敏 李云健 易丛文 徐文丞  (74)专利代理 机构 北京亿腾知识产权代理事务 所(普通合伙) 11309 专利代理师 陈霁 周良玉 (51)Int.Cl. G06F 16/2455(2019.01) G06F 16/25(2019.01) G06F 16/36(2019.01) G06F 40/186(2020.01) (54)发明名称 一种针对结构化数值型数据生成文本的方 法及装置 (57)摘要 本发明提供一种针对结构化数值型数据生 成文本的方法, 包括: 获取结构化数值数据, 该结 构化数值数据为半导体制造相关的数值序列; 基 于预设的规则模板, 为数值序列匹配对应的描述 文本, 该描述文本描述了数值序列对应的异常信 息。 本发明提供的针对结构化数值型数据生成文 本的方法, 将结构化数值型数据转化为更易于识 别的文本 数据, 更好的揭示了半导体制造过程中 的异常现象。 权利要求书2页 说明书8页 附图2页 CN 114637782 A 2022.06.17 CN 114637782 A 1.一种针对结构化数值型 数据生成文本的方法, 其特 征在于, 包括: 获取结构化数值数据, 所述结构化数值数据为半导体制造相关的数值序列; 基于预设的规则模板, 为所述数值序列匹配对应的描述文本, 所述描述文本描述了所 述数值序列对应的异常信息 。 2.根据权利要求1所述的方法, 其特 征在于, 还 包括: 基于所述数值序列的分布特 征, 确定所述数值序列中的异常数据 序列段; 所述基于预设的规则模板, 为所述数值序列匹配对应的描述文本, 包括: 基于预设的规则模板, 为所述异常数据 序列段匹配对应的描述文本 。 3.根据权利要求2所述的方法, 其特征在于, 所述预设的规则模板包括多个异常判断条 件和各个异常判断条件 对应的异常现象描述; 所述基于预设的规则模板, 为所述异常数据 序列段匹配对应的描述文本, 包括: 在所述多个异常判断条件中, 确定所述异常数据 序列段所符合的目标异常判断条件; 获取所述目标异常判断条件 对应的异常现象描述, 作为所述描述文本 。 4.根据权利要求2或3所述的方法, 其特征在于, 所述数值序列包括多个异常数据序列 段; 所述方法还 包括: 获取所述多个异常数据 序列段在所述数值序列中的位置区间; 将第一异常数据序列段和第 二异常数据序列 段进行合并处理, 得到第 三异常数据序列 段, 所述第一异常数据 序列段和第二异常数据 序列段的位置区间存在重 叠; 基于所述第 一异常数据序列段的描述文本和第 二异常数据序列段的描述文本, 确定所 述第三异常数据 序列段的描述文本 。 5.根据权利要求4所述的方法, 其特征在于, 所述基于所述第 一异常数据序列段的描述 文本和第二异常数据 序列段的描述文本, 确定所述第三异常数据 序列段的描述文本, 包括: 若所述第一异常数据序列 段的描述文本和第 二异常数据序列 段的描述文本相同, 则将 其确定为所述第三异常数据 序列段的描述文本; 若所述第一异常数据序列 段的描述文本和第 二异常数据序列 段的描述文本不同, 根据 预设规则确定重叠部分的异常数据序列段以所述第一异常数据序列段 的描述文本描述或 第二异常数据 序列段的描述文本进行描述。 6.根据权利要求1 ‑5任一项所述的方法, 其特征在于, 所述基于预设的规则模板, 为所 述数值序列匹配对应的描述文本, 之前还 包括: 对所述数值序列进行 预处理。 7.根据权利要求6所述的方法, 其特征在于, 所述对所述数值序列进行预处理, 包括以 下中的一项或多 项: 对所述数值序列进行清洗处理, 以去除其中大于或等于第 一预设阈值的数值和小于或 等于第二预设阈值的数值, 其中, 所述第一预设阈值大于所述第二预设阈值; 对所述数值序列进行 标准化处理。 8.根据权利要求1 ‑7任一项所述的方法, 还 包括: 基于所述描述文本, 进行知识抽取, 用于形成与半导体制造相关的目标知识图谱。 9.一种针对结构化数值型 数据生成文本的装置, 其特 征在于, 包括:权 利 要 求 书 1/2 页 2 CN 114637782 A 2获取模块, 被配置为, 获取结构化数值数据, 所述结构化数值数据为半导体制造相关的 数值序列; 匹配模块, 被配置为, 基于预设的规则模板, 为所述数值序列匹配对应的描述文本, 所 述描述文本描述了所述数值序列对应的异常信息 。 10.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 当所述计算机程 序在计算机中执 行时, 令计算机执 行权利要求1 ‑8中任一项的所述的方法。权 利 要 求 书 2/2 页 3 CN 114637782 A 3

.PDF文档 专利 一种针对结构化数值型数据生成文本的方法及装置

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种针对结构化数值型数据生成文本的方法及装置 第 1 页 专利 一种针对结构化数值型数据生成文本的方法及装置 第 2 页 专利 一种针对结构化数值型数据生成文本的方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 08:55:28上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。