知识图谱相关的知识和技术一览

写于 2019-01-27 | 分类于 编程

整理一下知识图谱相关的知识和技术,方便学习和理解

知识图谱的基本理解

  • 从学术角度来下定义,知识图谱本质上是语义网络(Semantic Network)的知识库。从实际应用的角度出发其实可以简单地把知识图谱理解成多关系图(Multi-relational Graph)。

知识图谱构建周期

  • 整个构建过程大致可以分为这几个部分:知识图谱设计、图谱数据获取、图谱数据融合、图谱数据存储、知识图谱推理、知识图谱应用

知识图谱设计

常见问题

    1. 需要哪些实体、关系和属性? 2. 哪些属性可以做为实体,哪些实体可以作为属性? 3. 哪些信息不需要放在知识图谱中?

      设计原则

  • BAEF原则:业务原则、分析原则、效率原则、冗余原则

图谱数据获取

数据来源

  • 优先从内部现有结构化数据中获取,其次整理内部零散的非结构化数据,最后使用爬虫获取网络上公开数据进行解析

    知识提取

  • 实体抽取、属性抽取、关系抽取

图谱数据融合

为何需要

  • 知识来源和存储形式不同

    重点难点

  • 实体对齐(主要是用于消除异构数据中实体冲突、指向不明等不一致性问题)
  • 实体销歧(专门用于解决同名实体产生歧义问题的技术)
  • 共指消解(主要用于解决多个指称项对应于同一实体对象的问题)

知识图谱存储

简要介绍

  • 知识图谱主要有两种存储方式:一种是基于RDF的存储;另一种是基于图数据库的存储。

    Neo4j[官网地址]

  • Neo4j是图形数据库的领导者 ,在整个图存储领域里占据着重要的地位

    Jena[官网地址]

  • Jena在RDF领域里目前最为流行的存储框架

知识图谱推理

何为推理

  • 知识推理是指从知识库中已有的实体关系数据出发,经过计算机推理,建立实体间的新关联,从而扩展和丰富知识网络。

    常用推理方法

  • 基于符号逻辑的推理(主要包括一阶谓词逻辑、描述逻辑以及基于规则的推理)
  • 基于图的推理(主要是基于神经网络模型或Path Ranking算法)
  • 基于统计推理的方法(基于归纳逻辑程序ILP的方法,基于关联规则挖掘ARM的方法,利用三元组主语或谓语所连接属性的统计分布以预测实例的类型)

知识图谱应用

##知识图谱相关资源

相关资源库