知识图谱(knowledge graph)
本文严重参考了:知识图谱技术原理介绍 by 王昊奋
知识图谱:机器大脑中的知识库
知识图谱旨在描述真实世界中存在的各种实体或概念。其中,每个实体或概念用一个全局唯一确定的ID(标识符, identifier)来标识。每个属性-值对(attribute-value pair,又称AVP)用来刻画实体的内在特性,而关系(relation)用来连接两个实体,刻画它们之间的关联。
存储方式
- RDF(Resource Description Framework, 资源描述框架)
- 图数据库(graph database) 例如 neo4j, 这种存储方式现在比较流行,添加新的数据源较为方便
知识表示
知识表示代表模型:TransE
对事实(head, relation, tail),将relation看做head到tail的翻译
存在的问题:无法解决一对多,多对一和多对多的情形
关系路径的表示和建模 -
知识图谱的嵌入(knowledge graph embedding)
即将实体和关系投影到连续的向量空间中去
- TransG: A Generative Mixture Model for Knowledge Graph Embedding
知识图谱构建
- 数据来源:百科、freebase 知识、垂直站点的结构化数据、半结构化/非结构化数据挖掘(包括搜索日志)
构建过程
从异构数据源抽取构建知识图谱所需的各种候选实体(概念)及其属性关联,形成了一个个孤立的抽取图谱(ExtractionGraphs)。为了形成一个真正的知识图谱,还需要将这些信息孤岛集成在一起
前面说过,实体要有全局唯一标识,这需要实体对齐。 不一致性的处理
- 维护更新
Holographic Embeddings of Knowledge Graphs by Maximilian Nickel, et al., 2015
题目非常炫酷:知识图谱的全息嵌入。y
知识图谱挖掘
构建好知识图谱之后,就能进行基于知识图谱的挖掘了。
关系抽取
知识推理 针对属性的,比如,通过出生年月得到年龄
针对关系的,比如,爸爸的爸爸是爷爷
相关实体挖掘
实体排序
知识图谱实践
知识图谱在智能搜索、反欺诈、异常检测等领域的应用
Linked Data - Connect Distributed Data across the Web
该项目旨在构建一张计算机能理解的语义数据网络
Google Knowledge Graph
百度知心
搜狗知立方
wikidata
产品化细节
上翻后引导
直接答案满足