| 电信知识图谱建设 与应用实践 华为-孙伟健 目录 CONTENT 通过本次交流,传递的信息: 01 02 电信知识图谱背景&目标 向学术界传递图谱价值应用场景、问题、对技术发展的期望和实践 • 以问题图谱实践为例展开 &NLP技术的要求 • 03 1、电信知识图谱的价值、应用场景与目标,对知识图谱 LANTU电信知识图谱技术引擎 2、问题图谱,“知识推理+数据学习” 双驱动的、典型的、 系统化的知识图谱落地方案,以及仍然未解决的问题 • 3、逐步构建、完善的LANTU电信知识图谱技术引擎 | 背景:工程师+网络,维护客户网络长期稳定、可靠,守住ICT网络护城河 除了电信产品的研发,华为有大量的工程师在帮助运营商客户不断提升网路性能,确保网络稳定、可靠: 经验知识 电信网络  案例、方案、指导书  网络维护说明  特性描述  预警与整改  故障处理指南 … 工程师对经 验、知识的 沉淀与复用 *电信网络示意图片来源于网络 网络 规划 网络 建设 网络 维护 网络 优化 网络 运营 华为全球xxx个国家和地区xxxx张(xxx张5G)网络的经验知识, (规划、建设、运维、优化知识) 解决经验、知识浪费、未积累、难复用问题 愿景:专家经验数字化,网络技术知识数据化、平台化 双循环:工程师能力在知识平台“伴飞”下逐渐提升,平台能力在使用中逐步增强 保证华为网络质量xxx 动网0问题(变更0风险,配置0错误), 故障0等待,xxx 目标:90%场景实现“3个1” 1分钟 找到完成工作所需的知识体系;1小时 完成工作所需的知识资源准备;1天 获得完成工作所需的求助或问题答案 技术:以知识图谱为代表的认知智能技术是攻克领域经验数字化难题关键 AI发展的学界与行业共识 数据采集、识别与结构 化的过程 领域经验数字化本质是解决知识的结构化与计算问题 数据逻辑关系理解基础上的分析、判 断与决策过程 复杂问题理解: 领域概念解释 概念图谱链接 概念图谱链接 认知智能的核心是知识智能,知识智能在大数据时代的代 表是知识图谱技术 *引用自肖仰华老师PPT 认知智能典型事件: • 2012年Google提出知识图谱概念,并发布570亿实体的大规模知识图谱 • … • 2018年提出认知图谱,用于解决开域多跳阅读理解问答 • 2020年~:知识+数据双驱动解决认知推理和逻辑表达 根因判断&推理 问题图谱自动构建 因此,认知智能(知识图谱)的领域化与突破是核心关键 + 现网故障日 志数据 节奏:典型知识应用导向,分阶段、分节奏建设&应用电信领域知识图谱 2021 阶段三:逻辑推理与决策分析类方案设计指导应用 2020 - 2019 - 阶段二:异常检测与根因推荐类问题处理辅助应用 阶段一:智能搜索与机器问答类知识获取智能应用 点对点 知识搜索与咨询 解决当前资料查不到、问题答非所问、搜 索给一篇长文的问题 关键词搜索 Ctrl-F搜索, 分词及权重 优化,精准 定位 知识助手 语义搜索 高级的、偏 口语的语义 检索,包含 统计 简单推理 逻辑、比较、 定量、是否、 符合句等 封闭域问答 xx知识搜索与问答业务 问题处理辅助 多对多 xxx 点对多 解决专家人工归纳案例输出问题处理案例集、 以及专家维护问题处理逻辑思维导图的问题, 做到智能自动化 问题处理案例集 xxx 方案设计指导 问题处理指导 xxx xx设计方案 xxx 智能编辑辅助 xx设计方案 xxx 可视化决策支持 Xx 方案设计、评审、执行 根因推荐 故障定位分析 Xx 问题处理业务 方案图谱(多模图谱) 问题图谱(事件图谱) 电信概念图谱 产品图谱(实体图谱) 知识图谱应用系统方案(知识图谱是个系统工程) 原始语料(基于算法定规范) 结构化知识(构图平台) 知识应用及运营(工具系统) 事实类、过程类等知识建模标准、 规范与工具软件 实体图谱、事件图谱、词图、故障树、 问答对、内容模型… 知识搜索、机器问答、问题助手等 挑战:复杂专业问题的机器理解与领域知识的深层结构化自动关联 领域知识专业且成体系 领域用户问题专业而复杂 项目交付活动 交付流程 通 用 搜 索 领 域 搜 索 售前 准备 网络 设计 3900系列 基站 产品 文档.hdx 文档/网页 小区计划上5G,UBBPg2是否仍能支持,它是否需要改造? 发货 准备 安装 部署 AAU391x 系列培训文 档.pptx 室分站RRU参数配置问 题导致小区建立正常但 无信号.html 章节/胶片 RRU参 数配置 AAU3910 安装过程 事件 操作步骤: 将中间挡板上 的支撑杆重新插入原位 置……旋转90度为止。 近端观察BBU及RRU设 备面板指示灯……问题可 能的原因是多方面的 实体 认知 AAU AAU3910 有源天线处理单元 问题理解 验收 转维 BBU 领 域 搜 索 RRU 安装场景  非结构化、多模态语料的广度、深度抽取与关联:以交付流程知识体系的填 充为例,需要在体系框架的指导下,完成多模态文档、片段、事件、实体的抽取,结 合领域认识,通过语义合并、共指等完成上述知识单元的关联,形成满足知识精准获 取的知识库/图谱。 需要更强大的信息抽取与关联能力 通 用 搜 索 符号理解 意图 识别 指代 消歧 实体 链指 5G制 式 UBBPg2 基带处理 板 是否能 支持 答案类型 查询 推理 结果 呈现 技术 指标 是否要 改造 深层语义 哪些基带板支持 NSA演进? 支持NSA演进的 基带板是否包括 UBBPg2? UBBPg2的技术指 标? 复杂查询 支持NSA演进: TN/LMN TN/LMN基带板: UBBPg2/UBBPg 3… 最大小区数 最大用户数 ... 深层推理 UBBPg2可以支持 演进到5G 需要达到以下指 标:……  用户问题的表面、背后含义的理解:以典型的场景化产品知识问答为例,用 户期望给出什么样式的答案?什么是小区?5G?UBBPg2?什么叫仍能支持?背后 的逻辑是什么?改造背后的深层含义又是什么? 需要更强大的问题理解与推理能力 目录 CONTENT 通过本次交流,传递的信息: 01 02 电信知识图谱背景&目标 向学术界传递图谱价值应用场景、问题、对技术发展的期望和实践 • 以问题图谱实践为例展开 &NLP技术的要求 • 03 1、电信知识图谱的价值、应用场景与目标,对知识图谱 LANTU电信知识图谱技术引擎 2、问题图谱,“知识推理+数据学习” 双驱动的、典型的、 系统化的知识图谱落地方案,以及仍然未解决的问题 • 3、逐步构建、完善的LANTU电信知识图谱技术引擎 | 问题处理业务背景与目标 一线 应用 比例 二线 x% -> xx% 三线 xx% ->xx% xx% -> xxx% 能力前移 x.4 天 xx.9 天 处理 时长 xx.6 天 减少问题处理时长 (xx、xx、xxx) 定位 准确率 xxx 80% To BE xxx TEminator 60% xxx 40% (开发态) 问题图谱 AS IS 故障树 0% xxx xxx xxx 场景 … xxx 业务目标:缩短问题单E2E时长  能力前移  知识的工具化 并 不断提升工具能力 问题处理业务:重经验知识依赖、特别需要知识固化为工具,积累传承 首先要能读懂术语,干扰因素排除, 对真实问题的解读还原 现象 对根因干扰因素的排除,已知经验与知 识的积累和匹配 根因 UL comp后SgNB Scg add SR未恶化、SCG PSCELL Change(NR add success rate 站间切换)恶化,目标站点传输资源不可用导致 恶化 切换请求被拒 需掌握 Scg add SR未恶化、SCG PSCELL Change(NR站间切换)恶化, 5G网络技 目标站点传输资源不可用导致切换请求被拒。 专业技能基本要求 术知识 是:澄清接入流程没问题,分析出切换流程有问题,要能读懂协议 具备故障 现有积累的故障树经验中 处理经验 存在148个根因可能性 流程信令交互49条 单线程下载50Mbps,多线程800+Mbps,需要 lampsite问题FTP 下载速率低 分析单线程速率低的原因。核心网侧已经初步分 析,结论是服务器来水不足。现场复测问题,未 再复现。一线已初步与客户交流,怀疑还是服务 器问题 *从现网问题单中随机抽取2个问题,在领域中这些问题难度中等偏简单 问题处理领域特点:以人为本/经验传承 问题图谱方案的学术源头:RCA(Root Cause Aanlysis) Stage1: Manual generation Stage2: Assisted generation Stage3: Automated generation 系统知识+领域知识+观测数据的RCA模型构 建,涉及多模,多算法Ensemble Survey on Models and Techniques for Root-Cause Analysis 构图,让算法读懂专业领域语言,能力逐步提升中 大量尝试:semantic parsing,自动机,事件抽取, 简单任务“一样好”, 复杂抽取任务“一样差” 当前:≈40%自动抽取 能力 + 人工构图 自动化构图两条途径: 1)抽取算法提升。 方向在哪? 典型无法抽取的样例:表面上是句句之间存在时序嵌 套、专业术语、习惯性缩写的难度问题,背后本质是算法 (模型)缺乏通信协议背景知识 2)知识源头规范。 如何落地? 问题:纯数据驱动、深度学习的研究方法遇到了天花板 纯数据驱动的研究路线: 模型有时看起来很傻:  跨源融合问题(跨篇章、多源融合等) L3~:  篇章事件等其他复杂知识 场景1:语义匹配  样本1:UCIU未配置场景时钟无法锁定 ||| 基站时钟无法锁定,上报ALM-26260告警 ||| 1 样本2:解决IPPM概率性出现丢包率过高的问题 ||| 执行MML命令DSP CABMFRINFO ||| 0 样本3:NR小区速率掉坑 ||| 5g小区吞吐率低 ||| 1 ... ? 学界(部分我们) TeleBERT语义匹配模型 较基线BERT模型准确率22%↑ 但,学到的可能不是知识!! … 我

pdf文档 华为 电信知识图谱建设与应用实践

安全文档 > 网络安全 > 文档预览
中文文档 26 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共26页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
华为 电信知识图谱建设与应用实践 第 1 页 华为 电信知识图谱建设与应用实践 第 2 页 华为 电信知识图谱建设与应用实践 第 3 页
下载文档到电脑,方便使用
本文档由 路人甲2022-08-13 07:06:49上传分享
给文档打分
您好可以输入 255 个字符
网站域名是多少( 答案:github5.com )
评论列表
  • 暂时还没有评论,期待您的金玉良言
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。