知识图谱相关的知识和技术一览
写于 2019-01-27 | 分类于 编程
整理一下知识图谱相关的知识和技术,方便学习和理解
知识图谱的基本理解
- 从学术角度来下定义,知识图谱本质上是语义网络(Semantic Network)的知识库。从实际应用的角度出发其实可以简单地把知识图谱理解成多关系图(Multi-relational Graph)。
知识图谱构建周期
- 整个构建过程大致可以分为这几个部分:知识图谱设计、图谱数据获取、图谱数据融合、图谱数据存储、知识图谱推理、知识图谱应用
知识图谱设计
常见问题
-
- 需要哪些实体、关系和属性? 2. 哪些属性可以做为实体,哪些实体可以作为属性? 3. 哪些信息不需要放在知识图谱中?
设计原则
- 需要哪些实体、关系和属性? 2. 哪些属性可以做为实体,哪些实体可以作为属性? 3. 哪些信息不需要放在知识图谱中?
- BAEF原则:业务原则、分析原则、效率原则、冗余原则
图谱数据获取
数据来源
- 优先从内部现有结构化数据中获取,其次整理内部零散的非结构化数据,最后使用爬虫获取网络上公开数据进行解析
知识提取
- 实体抽取、属性抽取、关系抽取
图谱数据融合
为何需要
- 知识来源和存储形式不同
重点难点
- 实体对齐(主要是用于消除异构数据中实体冲突、指向不明等不一致性问题)
- 实体销歧(专门用于解决同名实体产生歧义问题的技术)
- 共指消解(主要用于解决多个指称项对应于同一实体对象的问题)
知识图谱存储
简要介绍
- 知识图谱主要有两种存储方式:一种是基于RDF的存储;另一种是基于图数据库的存储。
Neo4j[官网地址]
- Neo4j是图形数据库的领导者 ,在整个图存储领域里占据着重要的地位
Jena[官网地址]
- Jena在RDF领域里目前最为流行的存储框架
知识图谱推理
何为推理
- 知识推理是指从知识库中已有的实体关系数据出发,经过计算机推理,建立实体间的新关联,从而扩展和丰富知识网络。
常用推理方法
- 基于符号逻辑的推理(主要包括一阶谓词逻辑、描述逻辑以及基于规则的推理)
- 基于图的推理(主要是基于神经网络模型或Path Ranking算法)
- 基于统计推理的方法(基于归纳逻辑程序ILP的方法,基于关联规则挖掘ARM的方法,利用三元组主语或谓语所连接属性的统计分布以预测实例的类型)
知识图谱应用
- 知识图谱主要应用于问答、搜索、推荐等系统中。目前已广泛应用在金融、医疗、电商等商业领域。
信息检索
- 美团餐饮娱乐知识图谱——美团大脑揭秘
- 大众点评搜索基于知识图谱的深度学习排序实践
- 告诉你一个搜索服务优化方案:基于RDF的知识图谱管理
金融风控
- 知识图谱在股权投资领域的尝试
- 智能金融系统的构建
- 知识图谱在风控的应用
智能问答
- 基于知识图谱的淘宝线上客服系统开发
- 基于数据与知识库的多轮次对话系统开发
- 【深度】基于知识图谱的问答系统浅析
推荐系统
- 知识图谱在旅游领域有哪些应用?携程度假团队这样回答
- 为电商而生的知识图谱,如何感应用户需求?
- 构建 LinkedIn 知识图谱
##知识图谱相关资源