关联数据入门小白适用
2022-04-21 17:05:41 0 举报
AI智能生成
关联数据入门知识汇总
作者其他创作
大纲/内容
设想每一个资源都有一个独立的网址,都有一个唯一的标识,所有这些“资源”之间的关系都能从其标识所指引的地址里找到详尽的说明。这将是一个有序的世界
起源
它希望在现有的万维网基础上建立一个映射所有自然、社会和精神世界的数据网络。通过对大千世界万事万物及其相互之间关系进行机器可读的描述,使互联网进化为一个富含语义的、互联互通的知识海洋,从而使任何人都能够在更大范围内、准确、高效、可靠地查找、分享、利用这些相互关联的信息和知识。
关联数据是在万维网上发布任何“资源”的一种方式。
语义万维网
定义者
任何有URI标识的东西
定义
用以表达任何信息,通常以某种编码的文件形式而存在。
信息资源
用以指代大千世界中的各类实体对象\u0082可以是自然界、人类社会以及人类意识所创造的精神世界(概念、观念、抽象实体等)的所有对象。
非信息资源
外延
资源
从技术上看
在计算机领域,关联数据描述了一种发布结构化数据的方法,使得数据能够相互连接起来,便于更好的使用。
维基百科
关联数据是国际互联网协会(W3C)推荐的一种规范,用来发布和连接各类数据信息和知识。
中文核心期刊
W3C
这些数据具有一定的关系,计算机能够理解并处理这些数据的关系。知道一部分数据就可以访问整个数据。
可以看成是语义万维网的一种简化实现。
个人理解
什么是关联数据
2006年7月提出
蒂姆.伯纳斯-李(Tim Berners-Lee)
创建初衷
创始人
有助于知识保存、知识共享以及智慧服务。
是数字图书馆进行信息资源发布和服务的核心技术之一。
用来发布和联接各类数据、信息和知识\u0082
一、提供“可信网络”的语义要素。
二、作为跨网域数据整合的通用 API。
从目前研究开发项目看
有效地提高了数据的可查找性和可重用性
功能
目的
在发布一个领域的数据之前,我们需要确定要发布的资源是什么。任何事物,只要认为是有意义的,有被引用必要的,都可以称之为资源。
确定资源
任何一个资源都用一个 HTTP URI(Uniform Resource Identifiers)来标识。之所有要用 HTTP URI 来标识,是希望数据能够通过 HTTP 协议访问,真正实现基于Web的访问。
资源标识
文档 Web 主要通过 HTML 格式来表示。
数据 Web 的数据主要通过 RDF格式来表示。
图片主要通过JPG格式来表示。
资源可以有多种描述,例如 HTML,XML,RDF 以及 JPEG。
资源描述
基本原则
使用 URI 作为任何事物的标识名称,不仅是标识文档;
使用 HTTP URI\u0082使任何人都可以参引 (dereference)这一全局唯一的名称;
当有人访问名称时,以 RDF 形式提供有用的信息;
尽可能提供链接,指向其他的 URI以使人们发现更多的相关信息。
属性概括
“空白节点”没有全局 ID 的本地资源(没有定义命名域的 URI\u0082如ISBN,DOI)
要求关联数据的RDF文件尽可能不使用“空白节点”。
“文字”指一个字串值(可以有类型以及语言属性)
少使用普通“文字”
要求 RDF 文件包含有用信息以及尽可能多的 URI
主要是指图书馆、网站、信息提供商之类的机构组织常被称为“信息中介”。
主要用户
将数据发布为面向网络的关联数据仓储。
关联数据仓储系统
不同仓储的整合应用和互操作
关联数据服务系统
二者兼有的系统
目前关联数据应用系统的开发
如果资源库不提供一定的开放接口,关联数据就无计可施。
无法对封闭系统中的资源进行整合。
缺点/局限性
HTTP 是服务器操作的指令\u0082规定了遇到各种请求(如 GET/PUT /POST/DELETE)服务器如何响应怎么处理;
HTTP
本来作为在这个文件宇宙中定位具体的文件而用的,后来演变成兼具名称作用,从而连同 URN 一起,统一作为 URI 的子类。
URL
HTML是存储在服务器端的网页文件\u0082将根据请求传送给浏览器
HTML
建立在 Web 技术之上
示意图
实现
关联数据(Linked data)
0 条评论
回复 删除
下一页