语义网络,语义网,链接数据和知识图谱一、语义网络(Semantic Network)语义网络是由Quillian于上世纪60年代提出的知识表达模式,用相互连接的节点和边来表示知识。节点表示对象、概念,边表示节点之间的关系。优点:容易理解和展示。相关概念容易聚类。缺点:节点和边的值没有标准,完全由用户自己定义。多源数据融合比较困难,因为没有标准。无法区分概念节点和对象节点。无法对节点和边的标签(即schema层)进行定义。语义网络虽然能够直观地表达语义和语义关系,但由于缺乏统一标准,难以应用于实践。RDF的提出解决了部分问题,通过制定统一标准,为多源数据的融合提供了便利,并对is-a关系进行了定义。然而,如何区分概念和对象(即定义Class和Object/Instance/Entity)的问题仍然存在,RDFS/OWL的提出进一步解决了这一问题。相关项目:WordNet:英语的词汇库,将英语单词划分为同义词集合,用不同的语义关系将这些集合关联起来。BabelNet:多语言的词汇库,通过自动把维基百科链接到WordNet上构建起来。HowNet(知网):中文语义词典,构建了一个包含概念之间以及概念所具有的属性之间的关系的常识知识库。二、语义网(Semantic Web)和链接数据(Linked Data)语义网和链接数据是万维网之父Tim Berners Lee分别在1998年和2006年提出的。它们都是指W3C制定的用于描述和关联万维网数据的一系列技术标准,即语义网技术栈。语义网:官方名称,学者使用最多的术语。旨在使网络上的数据变得机器可读,通过更丰富的方式表达数据背后的含义,并希望这些数据相互链接,组成一个庞大的信息网络。链接数据:强调在不同的数据集间创建链接。提出了发布数据的四个原则,并根据数据集的开放程度将其划分为1到5星五个层次。倾向于使用RDF和SPARQL(RDF查询语言)技术,对于Schema层的技术(如RDFS或OWL)则较少使用。链接数据是最接近知识图谱的一个概念,从某种角度说,知识图谱是对链接数据概念的进一步包装。三、知识图谱(Knowledge Graph)知识图谱是由本体(Ontology)作为Schema层,和RDF数据模型兼容的结构化数据集。本体:哲学名词,AI研究人员于上个世纪70年代引入计算机领域。Tom Gruber把本体定义为“概念和关系的形式化描述”,分别指实体的类层次和关系层次。RDF数据模型:用于表示知识图谱中的数据。知识图谱中的节点由IRI唯一标志,都是某个类的一个实例,每一条边都表示一个关系。关系也称为属性,分为对象属性和数据属性。知识图谱强调有一个本体层来定义实体的类型和实体之间的关系,数据质量要求比较高且容易访问,能够提供面向终端用户的信息服务(如查询、问答等)。链接数据和知识图谱的主要区别在于:链接数据更强调不同RDF数据集(知识图谱)的相互链接。知识图谱不一定要链接到外部的知识图谱,更强调有一个本体层来定义实体的类型和实体之间的关系。四、总结语义网络、语义网、链接数据和知识图谱都是与知识表示和关联相关的概念。语义网络是最早的知识表示模式,但缺乏统一标准;语义网是官方名称,旨在使网络数据机器可读;链接数据强调数据集间的链接;知识图谱则是对链接数据概念的进一步包装,强调本体层的定义和高质量的数据。这些概念和技术在知识图谱的发展过程中起到了重要作用。



































