扫二维码与商务沟通
我们在微信上24小时期待你的声音
解答本文疑问/技术咨询/运营咨询/技术建议/互联网交流
一、知识图谱的本质与起源
知识图谱,顾名思义,是将知识与图谱相结合的一种存储与表达方式。其中,“知识”指的是人们在长期实践中积累的认识和经验,“图谱”则是一种强调链接和关系的存储结构。知识图谱的提出,旨在更好地存储和表达知识,以便机器能够更有效地理解和运用这些知识。
早在1960年代,知识图谱的前身——语义网络就已经被提出,并主要应用于自然语言理解领域。随着人工智能技术的不断发展,知识图谱逐渐成为一项重要的技术项目,并被广泛应用于各种场景中。
二、图谱作为知识存储方式的优势
为什么选择图谱作为存储知识的方式,而不是传统的数据库呢?这主要得益于图谱的两大优势:
首先,图谱的存储结构相对简单。它采用“三元组”的形式来存储知识,即头实体、关系和尾实体。这种结构能够清晰地表示出实体之间的关系,并且几乎所有的符号型知识都可以用这种结构进行存储。
其次,图谱注重链接的存储方式,能够串联起不同领域的知识,从而挖掘出其中隐藏的价值。在万物互联的时代背景下,图谱的这种特性显得尤为重要。
三、知识图谱有什么用?
目前知识图谱应用主要有两个大方向:
1. 辅助语言理解
知识图谱在辅助语言理解方面起的作用有:
实体消歧:对文中提到的多义词进行精准判断,如上文提到的苹果案例。
指代消解:对文中的代词做出解释,如他和它。
其中代表性的应用如下:
(1)搜索
传统搜索只提供对网页的搜索(红框部分),图谱提供了对事物本身的描述,让结果更直观,更符合查询的语义。
(2)问答
垂直领域的问答系统会涉及到许多专业知识面的问题,举个保险行业的例子:
比如当客户问到:“xx保险能不能保障脊髓灰质炎?”
知识图谱可以通过结合保险领域知识与医疗知识进行推理,从而给出精准答案。
知识推理简化示意图
2. 辅助大数据分析
图谱可以结合各类领域的知识,打造领域型的知识图谱,目前在大数据分析方面,工业落地主要应用如下:
(1)推荐
知识图谱中包含了丰富的关联性,可以为推荐系统提供部分信息来源;比如常见的推荐有电影推荐、音乐推荐。
加入图谱推荐的好处主要是可解释性强,能基于设定好的推荐路径进行精准推送。
比如小丁喜欢听《艾米莉》,《艾米莉》的乐队是回春丹,那么同个乐队的歌可以作为推荐。
(2)风控
图结构能非常好的与SNA(社交网络分析)理论相结合,对团伙欺诈这类型的风险能起到非常好的挖掘作用;如洗钱行为可以综合多笔交易、企业信息等看是否出现资金汇集等。
图的优势在于能跨多度计算,能挖出埋藏较深度的风险关系,比起传统的侦察手段对团伙作案的风险能摸查得更全面。
四、无图谱,不AI?
这句话在现阶段,大家当pr稿理解就好了,事实上很多的AI落地应用,并没有用到知识图谱,知识图谱本身也存在着相当多的局限。
1. 工业落地视角
至少在目前阶段,许多项目中知识图谱的平替方案有很多,比如风控场景,通过传统的数据分析也能抓出许多问题案件;问答场景,搭建简单的问答知识库比直接建立知识图谱效率更高,投入更小。
究其原因还是在于这项技术需要非常大的资源投入,需要大量的具有丰富业务知识的专家,图算法专家等。
实际的工业落地项目中,几乎有70%的时间投入在图谱数据的获取、清洗、结构化上,而像知识框架的建设、图应用只占了不到30%的时间。
2. 技术视角
上文提到,知识图谱的三元组形式能表示几乎所有的符号型知识,即能被很好表达的显性知识,但现实中存在着很多知识是隐性的,比如一项技能,弹钢琴光知道乐理但没有熟练的指法也不行。
且知识图谱对于数据的结构化程度要求十分之高,但现实中大部分业务数据是非结构化的,如何将非结构化数据转为结构化,而这是一道还没有被解决的业界难题,是NLP的瓶颈。
结语
对每项新技术,我们应看到技术未来的发展空间,同时也要看到技术在当下的局限性。
保持对技术的理解、思考与反思,才能将技术真正落地。
我们在微信上24小时期待你的声音
解答本文疑问/技术咨询/运营咨询/技术建议/互联网交流