一、定义

语义web,是计算机业和互联网业对网络下一阶段发展所作出的术语化定义,其基本含义即基于网络建立任何微小数据的连接,这种连接不仅仅局限于网页。这样一来,任何微小的数据都可以与其他信息进行“沟通”。
语义网,它的核心是:通过给万维网上的文档 (如:标准通用标记语言下的一个应用HTML)添加能够被计算机所理解的语义“元数据”,从而使整个互联网成为一个通用的信息交换媒介。

二、用途

万维网之父蒂姆·贝纳斯-李(Tim Berners-Lee)称,使用“语义网”的用户将可应用远远强于现有网络中任何东西的功能。他表示,在“语义网”中,用户可将两个毫不相干的东西连接在一起,比如说银行报帐单和日历。用户可以将银行报帐单拖到日历上,也可以将日历拖到银行报帐单上,这样就可以知道何时应当进行支付。他指出,“语义网”将呈现给人们的是一个所有数据“无缝”式连接的网络。在“语义网”技术破土而出之后,目前人们对Facebook和MySpace等社交网站的“痴迷”终将被“无所不连”的网络所取代。

三、体系结构

语义Web的实现依赖于三大关键技术:XML、RDF和Ontology。

下图描述了语义Web的七层体系结构:
自描述
文档
数据
数据
规则
信任
证明
逻辑
本体
RDF+RDF Schema
XML+NS+XML Schema 名称空间
Unicode
URI

第一层:Unicode和URI。
Unicode是一个字符集,这个字符集中所有字符都用两个字节表示,可以表示65536个字符,基本上包括了世界上所有语言的字符。数据格式采用Unicode的好处就是它支持世界上所有主要语言的混合,并且可以同时进行检索。URI(Uniform Resource Identifier),即统一资源定位符,用于唯一标识网络上的一个概念或资源。在语义Web体系结构中,该层是整个语义Web的基础,其中Unicode负责处理资源的编码,URI负责资源的标识。

第二层:XML+NS+xmlschema。
XML是一个精简的SGML,它综合了SGML的丰富功能与HTML的易用性,它允许用户在文档中加入任意的结构,而无需说明这些结构的含意。NS(Name Space)即命名空间,由URI索引确定,目的是为了避免不同的应用使用同样的字符描述不同的事物。XML Schema是DTD(Document Data Type)的替代品,它本身采用XML语法,但比DTD更加灵活,提供更多的数据类型,能更好地为有效的XML文档服务并提供数据校验机制。正是由于XML灵活的结构性、由URI索引的NS而带来的数据可确定性以及XML Schema所提供的多种数据类型及检验机制,使其成为语义Web体系结构的重要组成部分。该层负责从语法上表示数据的内容和结构,通过使用标准的语言将网络信息的表现形式、数据结构和内容分离。

第三层:RDF+rdfschema。
RDF是一种描述WWW上的信息资源的一种语言,其目标是建立一种供多种元数据标准共存的框架。该框架能充分利用各种元数据的优势,进行基于Web 的数据交换和再利用。RDF解决的是如何采用XML标准语法无二义性地描述资源对象的问题,使得所描述的资源的元数据信息成为机器可理解的信息。如果把XML看作为一种标准化的元数据语法规范的话,那么RDF就可以看作为一种标准化的元数据语义描述规范。Rdfschema使用一种机器可以理解的体系来定义描述资源的词汇,其目的是提供词汇嵌入的机制或框架,在该框架下多种词汇可以集成在一起实现对Web资源的描述。

第四层:Ontology vocabulary。
该层是在RDF(S)基础上定义的概念及其关系的抽象描述,用于描述应用领域的知识,描述各类资源及资源之间的关系,实现对词汇表的扩展。在这一层,用户不仅可以定义概念而且可以定义概念之间丰富的关系。

第五至七层:Logic、Proof、Trust。
Logic负责提供公理和推理规则,而Logic一旦建立,便可以通过逻辑推理对资源、资源之间的关系以及推理结果进行验证,证明其有效性。通过Proof交换以及数字签名,建立一定的信任关系,从而证明语义Web输出的可靠性以及其是否符合用户的要求。

四、语义Web的应用

语义Web提供各种依靠语义的自动化服务,如天气预报服务、航班信息服务、在线航班预定服务、数据库查询服务、目录查询服务、数字图书馆查询服务、搜索和分类服务、B2C交易服务、B2B交易服务等。
互联网信息发布与搜索:通过对内容的标注与分析从而克服了关键词查询的歧义性,提高了查询的精度。Stanford大学语义web研究组研制的查询语言DBQ是一个比较有影响的系统,它是基于DAML的。另一个基于DAML的语义web信息检索系统是美国Maryland设计的HOWLIR系统,它采用DAML-JESSDB-一个基于DAML的推理系统-作为推理引擎。此外,基于语义web的文档检索与知识管理也是当前研究的一个热点。

五、所用技术

目前的各种万维网技术都有可能被应用于语义网(在语义环球网的意义上),例如:
DOM 文档对象模型, 一组访问XML和HTML 文档组成部分的标准接口.
XPath、XLink、XPointer
XInclude XML fragment XML查询语言 XHTML
XML Schema,资源描述框架(外语缩写:RDF)
XSL,XSLT Extensible Stylesheet Language
可缩放矢量图形(外语缩写:SVG)
同步多媒体集成语言(外语缩写:SMIL)
SOAP
文档类型定义(外语缩写:DTD)
微格式
元数据概念.