欢迎来到云栖网

免费注册

爱分析·中国知识图谱应用趋势报告

云栖网 2020-11-12 14:30 来源:财讯网

爱分析·中国知识图谱应用趋势报告

特别鸣谢(按拼音排序)

爱分析·中国知识图谱应用趋势报告

报告摘要

面向业务场景,知识图谱应用趋势分析

·知识图谱面向业务场景,强调行业知识与知识图谱的结合,实现在业务场景中的落地应用;

·知识图谱的核心优势体现在对于实体、属性等客观世界事物的关联关系分析,尤其是隐性关系识别,可应用于辅助决策;

·基于知识图谱构建的领域知识库应用,有效沉淀行业知识,赋能多业务场景;

·注重行业知识图谱和关系挖掘,是人工智能在行业中更深层的落地应用。

最佳实践案例,对于知识图谱构建有重要指导意义

·知识图谱已经在垂直领域内有一定的成功应用案例,本报告总结在金融行业、医疗与医药行业、政府与公共服务行业以及能源与工业行业中六个应用场景的最佳实践案例;

·最佳实践案例对于知识图谱落地有重要的指导意义,企业可根据同行业内最佳实践案例制定符合自身业务需求的知识图谱解决方案,实现快速落地、及时应用。

从感知智能到认知智能,知识图谱是关键一步

·认知智能时代的到来,是在感知智能之上,提高了AI的理解分析能力。知识图谱起到重要的支撑作用。在认知智能阶段,机器能够通过知识图谱挖掘隐性关系,洞察难以发现的关系和逻辑,用于最终的业务决策。

目录

一.知识图谱技术概览

二.知识图谱应用分析与落地挑战

三.知识图谱最佳实践案例

四.知识图谱未来展望

结语

关于爱分析

法律声明

1.知识图谱技术概览

1.1知识图谱概述

1.1.1知识图谱定义

知识图谱即KnowledgeGraph,以结构化的方式描述客观世界中实体、概念、事件以及之间的关系。其中,实体是指客观世界的具体事物;概念是指人类对于客观事物的概念化描述表示;事件是指发生在客观世界的活动,而关系则指实体、概念、事件之间客观存在的关联。

知识图谱技术是指在建立知识图谱中使用的技术,是融合认知计算、知识表示与推理、信息检索与抽取、自然语言处理与语义Web、数据挖掘与机器学习等技术的交叉研究。知识图谱技术包括知识表示、知识图谱构建和知识图谱应用三方面的研究内容:

知识表示研究客观世界知识的建模,以方便机器识别和理解,既要考虑知识的表示与存储,又要考虑知识的使用和计算;

知识图谱构建解决如何建立计算机算法从客观世界或者互联网的各种数据资源中获取客观世界的知识,主要研究使用何种数据和方法抽取何种知识;

知识图谱应用主要研究如何利用知识图谱建立基于知识的智能服务系统,更好地解决实际应用问题。

1.1.2知识图谱发展历程

谷歌于2012年正式提出知识图谱(KnowledgeGraph)概念,并应用在智能搜索领域。知识图谱(KnowledgeGraph)本质是以图的形式表现实体(概念、事物、人)及其关系的知识库,可看作有向图结构的网络。目前,知识图谱技术已在智能搜索、智能问答、网络分析、决策辅助、推荐系统等领域广泛应用。

通过知识图谱的发展历程可以看出,知识图谱是知识工程不断发展衍生出的新一代知识工程技术。2012年谷歌知识图谱项目之后,知识图谱技术快速发展,目前已形成在多垂直领域的行业应用。

爱分析·中国知识图谱应用趋势报告

1.1.3知识图谱的构建体系

知识图谱构建过程主要分为自顶向下(top-down)与自底向上(bOTTom-up)两种方式。两种方式的主要区别在于,在构建的过程中是否先定义本体与数据模式。目前,大多数知识图谱采用自底向上的方式进行构建。

在知识图谱的构建过程中,存在几项关键步骤,即知识抽取、知识表示、知识融合、知识推理、知识存储以及知识图谱应用等。

其中,知识抽取与知识融合环节是知识图谱构建的基础。通过客户数据库或公开网络获取到多源异构数据具有冗余、噪声、不确定性等特征,前期的数据清洗工作并不能实际解决这些问题,需要对相关数据抽取后进行融合操作并对质量进行评估,以便及时知识更新,保证知识图谱的准确性。同时,已有知识构建数据模型形成数据规范作用于知识表示的过程可以及时对数据模型进行修订,保证数据模型针对特定数据的实时性与有效性。

知识图谱的前期构建过程即知识抽取与知识融合,各厂商在技术层面大致趋同,更多的是基于人力与时间的投入。知识图谱发展至今,决定应用效果的更多是应用模型,即特定应用场景下相对应的应用模型。

爱分析·中国知识图谱应用趋势报告

1.1.4知识图谱应用特性

爱分析·中国知识图谱应用趋势报告

知识图谱技术源于语义网络,经过半个世纪的发展,融合本体论、群体智能使得知识图谱又形成自身特点。在实际业务应用中,知识图谱技术有以下特征:

可视化:知识图谱作为图类型知识库,本身具备可视化特性。知识图谱可以将多实体间的关系通过图形的方式进行显示。目前,通过知识图谱技术分析展示实体间关联关系已在多领域有广泛的应用;

准确性:知识图谱构建的语义网络中具有多种语义关系,多角度挖掘信息,保证相关信息的准确性;

关联分析:知识图谱本身具备“边”的概念,强调实体间的关联与属性。在实际业务场景中,利用知识图谱技术能快速有效地发现无关实体间的隐性关联关系。目前,关联分析在金融行业的营销与风控,政府与公共服务行业智能刑侦、智能经侦、治安管理、政务数字化等多领域有广泛应用;

爱分析·中国知识图谱应用趋势报告

拓展性:知识图谱本身的构建方式决定其本身具有良好的拓展性,当形成某细分领域知识图谱后可在此领域内快速拓展。同时,不同领域间知识图谱也有一定的拓展性,本身知识抽取与知识融合阶段对领域业务知识依赖有限,决定知识图谱领域内应用效果的关键因素是上层业务模型;

可解释性:弥补机器学习的不足,知识图谱本身与人类认知类似,通过实体、关系、属性去认知世界,同时知识图谱目前均为大规模知识库,语义丰富,将搜索问题与答案相连接,提供解释性的来源;

知识学习:通过推理、标注、纠错等具有反馈能力的学习机制,快速积累沉淀行业知识,形成领域知识库,降低行业经验的依赖性。

2.知识图谱应用分析与落地挑战

2.1知识图谱应用分析

知识图谱可为多领域客户在数据管理、关联分析、营销与风控、反欺诈等应用场景提供技术赋能。知识图谱技术为用户提供了一种更为有效的方式表达、组织、管理以及利用多源、异构、动态的数据。通过对于各领域内应用场景的分析,可以看出目前知识图谱应用场景的共性特点:

图谱的核心优势体现在对于实体、属性等客观世界事物的关联关系分析,包括显性关系与隐性关系识别。基于知识图谱此项特性,银行营销与风控、公安刑侦等较多业务场景都有应用。也是目前知识图谱技术应用最为广泛的功能点。构建实体关系网络,察觉实体关系,并发现信息(包括:风险消息、商机线索、关系事件)的传导路径,也会在其他行业中逐渐获得广泛应用;同时,关系网络的搭建结合目前数据可视化(二维以及三维展示)的技术,将会更好地给用户呈现实体关系网络;

爱分析·中国知识图谱应用趋势报告

领域知识库的应用也在各行业内广泛推广,相较于传统知识工程,利用知识图谱技术搭建领域知识库的实际应用效果更好;由于传统知识工程知识相对分散,关联性低,要求使用者对于知识应用的匹配度较高,同时无法延伸知识的应用场景,所以传统知识工程往往应用效果一般。在搭建领域知识库的过程中,知识图谱实现了知识的建模、抽取、融合、存储、应用,同时将相关知识进行关联,达到智能化的知识应用水平;

爱分析·中国知识图谱应用趋势报告

自然语言处理(NLP)技术与知识图谱技术之间存在较大交叉,面对复杂语义,可以利用知识图谱技术与自然语言处理相结合的应用,更好的服务与长文本处理;传统自然语言处理对于短文本有较好的处理效果,但面对长文本,尤其前后具备逻辑关系的语言,往往处理较差。知识图谱技术的应用解决长文本与长语句处理问题,使得智能客服、机器翻译、文本处理等应用有长足的发展。

爱分析·中国知识图谱应用趋势报告

2.2知识图谱落地应用场景

爱分析基于对国内知识图谱厂商的调研,准确定义了23个知识图谱技术的应用场景,涵盖金融、政府与公共服务、电信、医疗与医药、零售、能源与工业等六大行业。本报告应用场景只选取具有较强行业属性的应用场景进行研究分析,并没有穷举知识图谱所有应用场景。

知识图谱应用场景地图如下图所示:

爱分析·中国知识图谱应用趋势报告

2.3知识图谱各场景应用分析

通过知识图谱应用场景地图可以看出,目前在六大行业中,金融行业以及政府与公共服务行业知识图谱落地场景较多,其中主要以金融行业内的营销与风控场景和公共安全行业的业务场景居多。本章节将结合各行业具体落地场景分析目前知识图谱的应用现状。

2.3.1金融行业知识图谱应用场景分析

(1)金融行业营销与风控业务场景应用分析:

在对公业务的激烈竞争中,银行需要增强对企业关联关系网中产生的商机事件的洞察能力,及时抓住营销窗口期;

随着宏观经济环境不确定性的增加,银行需要增强对企业关联关系网中传导的行业景气度波动、重大负面事件等风险事件的洞察能力,建立重大风险事件快速响应和应急处置机制,及时发现潜在风险,提高风险监测与预警能力;

知识图谱可以为银行对公业务实现跨行业和跨企业的关系网络的构建,重塑对公业务营销与风控的过程,提升风险管理和营销管理的效率,特别是在反洗钱、反欺诈、舆情风控等环节中,知识图谱可以起到关键作用;

国内银行目前正在积极进行线上零售转型,大力发展个贷、微贷业务,需要增强对零售客户的数据洞察能力,挖掘客户的真实需求,实现千人千面,从而实现精准触达;

伴随着业务的发展,背后隐藏的风险也日益凸显,“薅羊毛”、亲友集中借贷、“垒大户“等问题频发,因此,贷前审查和贷后管理中对于客户之间关联关系的识别非常重要;

通过构建关联图谱,打通零售业务场景下客户从申请到贷后的全流程数据,建立零售客户全业务周期画像、客户关系画像,可以使银行在缩短营销周期、降低营销成本的同时确保风险可控。

(2)金融行业构建金融领域知识库业务场景应用分析:

金融机构内部在业务运行过程中累积了大量的知识与经验,这些知识与经验存在于领域专家脑中或技术文档中,难以得到有效利用,很多金融机构尝试使用知识管理系统,但知识管理系统中的知识与知识之间存在信息孤岛,没有建立知识之间的联系,知识的管理维护、更新升级等也都存在问题;基于知识图谱,可以有效将知识与业务进行关联,有效管理知识体系的同时更好地赋能业务;

在将知识图谱技术应用于营销、风控等业务环节的过程中,本质上是建立了营销领域和风控领域的知识库,随着知识图谱技术在金融行业的渗透,金融机构开始想要打造全公司级别的知识库或知识中台,将全公司的数据进行关联,满足不同业务部门的需求,更好的推动业务运行。

(3)金融行业在智能客服业务场景应用分析:

随着人工客服成本的逐年上涨,客服机器人在金融领域已经开始广泛使用,但在金融领域使用的客服机器人不同于一般的聊天机器人,对回答准确率的要求较高,现阶段,客服机器人只能作为人工客服的辅助和补充,主要应用在人工客服人手不足或是对服务质量要求不高的场景上;

金融机构对客服机器人的智能化水平要求不断增加,需要客服机器人对问题中模糊的部分通过上下文对话的关联进行意图识别,给客户带来更好的服务体验;

基于知识图谱技术的客服机器人,可以理解用户意图,实现上下文交互的对话流程。

2.3.2政府与公共服务行业知识图谱应用场景分析

(1)公共安全行业刑侦、经侦、反恐、治安管理等业务应用分析:

目前公共安全行业的智能化应用主要停留在感知智能,强调前端数据的采集以及后端视频解析能力,认知智能的应用推广有限,导致公安数据信息规模庞大、数据复杂。办案人员需要将海量数据快速抽取成知识,发现有用信息;

违法犯罪活动本身具备隐蔽性、团伙性等特征,在技术高速发展的背景下,又呈现出网络化、智能化、复杂化等新特征,增加了公安人员的办案难度。面对当前的公安业务新挑战,公安部门推动公安系统智能化改造,打破系统原有信息孤岛,挖掘潜在隐藏信息,分析关联关系,形成知识网络,通过技术手段支撑“人、事、地、物、组织”等刑侦关键要素;

案件的核心是“人”,在经济犯罪过程中,关键人员一定会留痕于关系网络,但关键在于,面对错综复杂的海量数据,经侦部门需要梳理脉络,利用知识图谱,形成人员、企业等要素的关系网络,搜寻关键线索,挖掘深层次信息;

由于暴恐事件具有团伙性、隐蔽性以及线上与线下关联性等特征,公安机关需对重点人员布控,基于知识图谱利用车辆与人员轨迹、同行人等数据建立风险预测模型,发掘隐性重点人员,形成团伙关系网络,通过团伙聚集度、活跃度、危险度等多维度信息对团伙进行布控设防;

治安事件发生具有突然性,当团伙发生案件时,若不能现场及时抓捕,后期可通过涉案人员关系图谱发掘潜在嫌疑人;针对有一定犯罪企图的重点人员,利用智能手段,建立重点人员预警模型,并通过关系图谱与轨迹信息,及时发现违法活动,阻止治安事件发生。

(2)交通行业业务场景应用分析:

面对城市交通拥堵问题,利用知识图谱技术,将前端感知设备采集数据形成人、车、道理的大交通关系图谱,通过交通业务模型,利用路口信号灯实时调度城市交通系统;

针对突发情况导致的道路无法通行,交通部门需要快速响应进行路径规划,合理指挥车辆规避风险路段,将影响降到最小。将时空概念引入,利用动态知识图谱技术,更快速的进行道路规划;

电警、卡口、人脸抓拍摄像机的广泛应用使得交通大数据中具有海量车牌与人脸照片,通过知识图谱技术可以快速构建人、车关系图谱,交管部门可以快速检索居民与同行人的轨迹信息。

(3)政务数字化业务场景应用分析:

在政务数字化的建设过程中,政府各部门主导建立业务系统,导致系统之间形成“信息孤岛”,不能有效的统一调度。采用知识图谱等新兴技术,平台将部门壁垒与信息孤岛现象打破,形成统一的数据标准规范服务业务应用;

目前各级政府部门已形成海量数据资源池,但真正能服务于业务的数据应用却较少。采用知识图谱技术,平台将各部门数据抽取融合形成知识,搭建政务领域知识中台,为上层各业务部门工作提供知识支持;

政府对于社会的宏观调控需要多维数据支撑,需要挖掘社会关键要素之间的隐性关系,辅助政府部门决断。知识图谱技术具有较强的关联关系分析能力,通过社会要素的关联分析与模型推算,在宏观调控、社会管控、政策实施、灾害防控等多方面为政府决策提供数据支撑。

2.3.3医疗与医药行业知识图谱应用场景分析

(1)药企业务场景应用分析:

从药物研发到临床试验再到上市推广,医学翻译贯穿于药企的整个业务生命周期中,医疗的特殊性使得药企对医学翻译的专业性提出极高的要求;

基于知识图谱的机器翻译,通过构建专业领域的知识体系,可以极大提高医学翻译的专业性和准确性,使翻译结果更加符合医学逻辑,保证翻译质量;

“4+7”带量采购使得跨国药企面临药价下调的压力,产品的覆盖力度和频率下降,亟需快速挖掘新市场以及提高对原有覆盖客户的精准营销;在医药营销“合规”的背景下,“带金销售”的医药代表模式走不通,数字化营销成为药企实现合规、高效、低成本的营销手段;

药企通过搭建自己的知识体系平台或问答平台,构建产品知识图谱、疾病知识图谱、用药知识图谱等,可以精准地为医生推送其感兴趣的内容,帮助医生正确用药、正确做治疗,提高医生对药企产品的认可度。

(2)医院业务场景应用分析:

患者去医院就诊时,经常会遇到“知症不知病”、“知病不知科”的问题,现有的导诊方式一般为人工导诊或基于关键词的导诊系统,导诊的效率和效果有待提升;为患者提供精准的智能导诊服务,不仅可以为患者快速找到合适的科室和合适的医生,减少患者就诊时间,同时可以缓解医务人员工作压力、促进医疗资源合理配置;

基于知识图谱的智能导诊系统,借助知识图谱的推理能力,患者只需描述症状或疾病,就可以为患者提供智能导诊服务,匹配科室和医生,缓解医院导诊服务的压力,提高医院的智能化管理水平。

2.3.4能源与工业行业知识图谱应用场景分析

国内工业水平发展参差不齐,长期的行业不景气导致企业信息化发展较慢,目前大部分企业数据粗放式管理,可用性与易用性较差,难以形成知识积累。随着竞争加剧,以电力、石化、工业、水务为代表的资源密集型企业加速向技术密集型与数字密集型企业转型,提高企业数字化能力;

面对能源与工业行业的业务挑战,企业需求将数据形成知识,创建支持上层业务应用的领域知识库,在辅助业务应用的同时进行相应的知识积累。员工可通过知识库快速获取知识,降低培训与研发成本。

2.3.5电信行业知识图谱应用场景分析

市场已经趋近于饱和的电信行业,提高服务质量是运营商争取客户的重要举措。由于人工客服的培训流程较长且人员流动性较强,建立运营商领域知识库是快速提高客服人员服务质量的有效方法。客服人员通过检索知识库获取知识,快速、准确地回答客户问题;

5G时代的到来,运营商更注重下沉市场。但对下沉市场的运营需要大量资源投入。建立运营商领域知识库,一线工作人员可以通过检索知识库的方式快速获取知识;

运营商利用知识图谱技术通过对购买人的关联关系图谱分析,可以快速获取潜在客户群体,发掘隐性商机。

2.3.6零售行业知识图谱应用场景分析

在零售数字化的进程中,零售商获取了大量消费者、商品以及门店的数据,但数据的价值在于发现三者的关联关系。通过知识图谱技术,零售商构建商品知识图谱,以商品为核心,发掘三者的隐性关系,辅助商品营销;

门店选址时,品牌商要高效、准确的选择新区域内最佳位置。通过大量的门店数据,基于知识图谱技术,可快速构建门店领域知识库,帮助企业根据产品类型快速发现区域内的空白市场点位,辅助决策人完成门店选址工作。

2.4知识图谱的落地关键举措及挑战

2.4.1知识图谱落地的关键步骤

由1.1.3节可以看出,知识图谱的关键步骤包括知识抽取、知识融合、知识推理、知识存储与知识应用等关键五步。其中,知识抽取与知识融合环节共同完成知识构建,在知识构建的构建的过程,从海量数据中抽取概念、实体、关系和属性,并进行消歧、对齐和融合。

爱分析·中国知识图谱应用趋势报告

知识抽取:面对海量的数据源,在构建知识图谱的过程中,需要自动化的技术抽取可用的知识单元,其中知识单元包含实体、属性与关系三个要素。并通过不断形成的知识单元,形成知识表达,为上层的构建提供基础能力;

可以看出,知识抽取即可拆分为实体抽取、关系抽取以及属性抽取的技术。其中由于属性抽取主要针对实体可以看成是实体与属性值之间的关系抽取问题,所以属性抽取技术可以借鉴使用关系抽取技术的相关思想。实体抽取也可认为是命名实体的学习与识别,即从原始的语料中自动识别出命名实体;

实体是知识图谱中的最基本元素,其抽取的完整性、准确率、召回率等将直接影响到知识库的质量。因此,实体抽取是知识抽取中最为基础与关键的一步。

爱分析·中国知识图谱应用趋势报告

知识融合:知识融合是针对于知识质量问题,进行高层次的知识组织,使来自不同知识源的知识在同一框架规范下进行异构数据整合、消歧、加工、推理验证、更新等步骤,达到数据、经验以及人的思想的融合,形成高质量的知识库;

知识融合技术主要包括实体对齐、知识加工、知识更新。其中实体对齐也称为实体匹配或实体解析,主要是用于消除异构数据中的实体冲突、指代不明等问题。在通过实体对齐后,已形成知识的雏形,但未形成知识体系,需要通过知识加工进行构建。知识更新主要作用于知识体系,进行不断的迭代更新,拓展知识。