中国电力科学研究院有限公司 人工智能应用研究所 谈元鹏 2022年03月12日 目录 CONTENTS 01. 人工智能应用所简介 02. 电力知识工程的背景、内核及发展历程 03. 电力领域知识表示与图谱构建 04. 电力领域知识图谱的应用实践 05. 电力领域知识图谱的未来挑战 基本情况-职能定位 人工智能应用研究所(人工智能所)成立于2018年,是国家电网有 限公司唯一人工智能应用技术的重要研究和支撑机构,聚焦电力领域智 能感知、大数据、智能平台、智能认知和智能应用五大研究方向,全面 支撑电力人工智能应用类技术的科研攻关和推广应用。 服务公司发展 挖掘应用场景 制定解决方案 落实战略部署 攻关核心技术 推动成果转化 基本情况-组织机构 下设智能感知研究室、大数据应用研究室、平台技术研究室、智能认知研究室、和智能技术应用研究 室5个专业研究室,以及综合管理办公室1个管理部门。截至2020年底,人工智能所拥有员工近70人,平 均年龄32.7岁,硕士及以上学历占比100%、博士占比34%。 智能感知 研究室 人工智能 所 综合管理办 公室 智能技术 应用研究室 大数据应用 研究室 平台技术研 究室 智能认知 研究室 平均年龄33岁 34%博士比例 100%硕士及以上学历 5 基本情况-学术生态 承担了中国电机工程学会人工智能专委会、中电联人工智能标准化技术委员会、IEEE PES人工智能分委会、 中国人工智能学会智慧能源专委会,以及中国人工智能产业发展联盟(AIIA)挂靠工作。建立了各类电力人工智 能科研平台,打造电力人工智能学术生态。 学术组织 科研平台 能源互联网全模仿真中心 智能传感联合实验室 电力人工智能展示体验中心 6 基本情况-学术生态 电力系统作为一种资产庞杂、知识密集的电能生产与消费系统,支撑着多种能源的转换、互联、传输、交互, 涉及发、输、变、配、用等多个领域的系统性知识体系。近年来,随着我国能源互联网企业建设进程的逐步推进, 电力领域知识体系愈发呈现出开放式、扁平化、边界模糊化的发展趋势,进一步加剧了电力系统智能认知的复杂 性。亟待引入知识图谱这一新兴知识工程技术,以结构化方式刻画电力系统中的概念、实体、事件及其间的关系, 推动电力人工智能有序发展。然而,电力领域知识图谱作为一个复杂的因果网络,其中的设备、人员、单位、事 件、动作都是普遍关联的。这导致在知识图谱中沿着任意一个实体开展语义推理分析均容易超出预想的知识边界。 对此,行业专家与学者普遍认为:知识图谱在知识集中、应用简单的应用场景中更加易于成功,而智能客服、智 能推荐等领域的应用成功实例也在一定程度上归功于其知识体系相对封闭。 因而,领域知识图谱在电力系统中成功应用的一大前决条件是能对于电力领域知识的需求细化、闭合,即能 找到一个有限的知识子集支撑电力领域的特定应用需求。 8 基本情况-学术生态 在过去的三十余年间,电力公司围绕着调度、运检、营销、基建和物资等各业务部门所提报的业务需求,集 中力量开发了数量众多的应用系统,旨在实现由数据到知识、由感知到认知的提升。得益于利用知识采集工具的 开放式结构,其中大量应用系统为了解决电力系统中的科学和工程问题引入了知识工程技术,特别是对专家系统 框架显示出了越发强烈的兴趣。然而,传统信息化工程产物仍处于对电力数据和知识的简单应用,缺乏对知识体 系的全面把握,缺乏对电力业务的认知推理,其粗犷式建设模式不再完全适应我国电力公司的发展需求。对内知 识得不到贯通应用,对外难以形成辅业公司与外部行业主动支撑,使我国电力公司面临着互联网转型的困难。为 了辅助我国电力公司打破知识孤岛,实现业务协同和数据贯通,支撑电网业务与新兴业务发展,专家学者近年来 在电力调度、电力运检、电力营销等诸多领域提出了基于领域知识图谱这一新兴认知方法的技术路线和应用案例。 9 基本情况-学术生态 在电力调度方面,专家学者的主流工作仍集中于对自动语音识别( Automatic Speech Recognition, ASR)、 自然语言处理(Natural Language Processing, NLP)和DKG技术的组合应用。例如,闪鑫等人提出基于人工智 能的调度控制系统框架,并对基于知识图谱的智能辅助决策与语音助手开展研究;周帆等人基于多源电力调度模 型知识构建调度领域知识图谱,进而实现图谱内本体相关问题的自然语言理解与查询语句拼接;刘广一等人利用 图数据库对配电网拓扑进行存储,提出“电网一张图”运营指挥系统的平台结构;乔骥等人基于DKG技术实现了 故障信息解析判别、智能辅助决策以及多维度人机交互,验证了数据与知识双驱动的电网拓扑数据分析研究在业 务中落地应用的可行性;高泽璞等人整合多个低压配电网信息系统中的数据,挖掘各数据之间的关系并构建出低 压配电网拓扑结构,实现了对低压配电网信息系统中的户变关系的辨识。 10 基本情况-学术生态 在电力运检方面,由于近三年内电力巡检影像分析等人工智能应用的兴起为DKG的研究应用打下了良好的基 础。专家学者以电力设备为核心,领域知识图谱相关研究工作在细分业务点上相对深入。例如,张敏杰等人基于 语义网、知识图谱、自然语言处理等技术,提出基于知识图谱的技术框架,以支撑变压器智能管理;赵振兵等人 利用螺栓螺母之间的关联组成栓母对,采用深度学习与先验知识结合的方法建立栓母对知识图谱,用以指导栓母 对缺陷分类;刘梓权等人利用设备缺陷记录语料构建电力设备缺陷知识图谱,提出利用图搜索进行电力设备缺陷检 索的方法;Tang等人提出面对多源异类电力设备数据的设备缺陷知识图谱构建方法,改进图搜索以展示检索结果 的期望信息;杨强等人则采用领域知识图谱整合展示电力设备全寿命周期数据,揭示设备实体与业务对象实体之 间的关系;汤亚宸等人利用领域知识图谱进行规则推理,实现涉及设备、厂家、站/线、公司、质量事件的高效分 析查询。此外,赵振兵等人提出建立具有一定普适性且专业性较强的知识图谱,提升输电线路关键部件视觉检测 的能力,是通过DKG实现跨媒体数据在知识层有机互补的创新提议。 11 基本情况-学术生态 在电力营销方面,专家学者的研究工作暂时与其他行业客服的主流技术路线基本一致,基于ASR、NLP与 DKG的技术组合实现电力客服业务中智能检索、智能问答、主动外呼能力的整体提升。例如,饶竹一等人提出了 基于知识图谱的电力客服知识库构建、检索方法,设计形成智能客服系统技术方案;Cheng等人结合电力客服的 业务需求,提出了集成客户本体、数据本体以及推理引擎的三级电力客服知识图谱架构;梁林森等人则针对地方 特色开展了智能95598支撑技术研究;谭刚等人针对基KG问答系统中存在的中文问题表达模糊等问题,提出融合 领域特征知识图谱的电网客服问答系统,实现了以较低的响应延迟提供高准确率的回答。然而,就总体而言,电 力营销领域中的DKG应用数据来源相对封闭,未能凸显互联网化运营理念;认知推理能力有待进一步增强,亟待 引入情感分析、多轮对话等技术并使之固化形成业务能力。 12 电力领域知识表示 由于电力领域知识广泛来源于传统的电力知识工程系统、专家经验知识库等结构化数据与电力标准、制度、 法律、法规以及专家、技术人员的经验等半/非结构化数据,涉及多个业务领域,因而其知识也可按照复用程度的 差异划分为通用知识和专用知识两大部分。其中,例如部分电力设备的名称、电压等级、容量以及单位组织架构 等信息在客服、调度、运检、安质等多个业务领域均有需求,我们称之为电力领域通用知识;而对于例如客服领 域中的用户名称、电费、电价等信息相对专用,在调度、运检、安质等业务领域涉及概率很小,甚至完全不会出 现,我们将之认定为电力领域专用知识。值得一提的是,电力领域通用知识与专用知识之间的界限往往是模糊的, 实际操作时需要根据实际业务进行统计分析以判定通用、专用知识之间的边界。 图3-1 电力领域知识表示示意图 14 电力领域图谱构建-本体构建 领域知识图谱的本体构建方法主要包括由知识驱动的自顶向下(Top-down)式、由数据驱动的自底向上 ( Bottom-up)式以及两者的组合方式。其中,自顶向下式是指通过业务专家人工编制或利用已有的结构化知 识库获取电力领域知识本体的结构信息,进而将知识本体加入到知识库;自底向上式则是指从开放非结构化数据 中提取实体、概念、关系、属性、属性值等信息,选取置信度高的对象作为候选,分析归纳成底层结构信息,逐 层向上最终形成知识本体并加入到知识库。 电力领域数据来源广泛,传统电力知识工程系统、专家经验知识库等结构化数据现有的数据模式,可直接用 来指导知识图谱本体的自顶向下的构建。同时,电力领域实际业务中所产生的各类数据以及专家、技术人员的主 观经验等半/非结构化的数据也蕴含了丰富的电力领域行业知识,为确保知识图谱本体的完备性,利用信息提取技 术对此类数据中的电力知识加以识别,并对识别的结果进行归纳抽象,最终将抽象出的概念映射或补充到电力领 域知识图谱本体中,从而实现本体自底向上的构建。自顶向下、自底向上结合的本体构建方式,既能够传承固化 电力领域现有数据库中的相关经验知识,又能实现对新知识的发现,故在实际构建电力领域知识图谱本体时,通 常采取两种方式相结合的方法。 15 领域知识图谱应用架构 在电力领域知识图谱构建中,我们发现知识图谱作为一种语义网络,在电力大数据的赋能下诚然已经能够解 决许多实际问题;但单纯依靠知识图谱技术并不能完全响应我国能源互联网的数据特征与发展趋势,难以表达电 力系统中涉及到的丰富语义,充分利用现有知识工程资源,因而并不能将其视为一剂包治百病的“万能药”。 一方面,在调度、运检、安质等业务领域中存在着丰富的if-then规则信息,不易利用领域知识图谱表达。特 别是对于if A and B then C等并发事件规则,其条件部分的原子表达式之间的关系可以出现部分极为复杂的情况, 利用领域知识图谱难以表达。同时,电力行业公司中存在大量的if-then规则信息乃至其他知识表示规则下的信息 已经在过往的信息化工程建设中被维护在了专家知识系统中,亦或已经突破了知识图谱技术的原有范围。若能利 用领域知识图谱辅助与引导对专家知识系统中知识元进行合理“利旧”,对新生知识元进行基于Seq2Seq等数据 驱动算法模型的“求新”,将有助于人们短、平、快的解决更多的实际问题。 17 领域知识图谱应用架构 另一方面,能源互联网的数据特征及其互联网化的发展趋势,注定其中的数据、知识将逐步区别于传统电网 数据,呈现出显著的动态、隐形、主观等特性。知识图谱技术侧重于表达实体、概念之间的语义关联,而上述语 义关联大多是静态
国家电网 谈元鹏 电力领域知识图谱技术进展与应用实践
文档预览
中文文档
31 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共31页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 路人甲 于 2022-08-13 07:08:22上传分享