1. Evolución de la web 2. Web semántica 3. Linked data 4 ...
-
Upload
khangminh22 -
Category
Documents
-
view
0 -
download
0
Transcript of 1. Evolución de la web 2. Web semántica 3. Linked data 4 ...
1
Tema 2: Linked Data
Pedro P. Alarcón Cavero [email protected]
Curso 2014/15
Máster en Ciencias y Tecnologías de la Información Escuela Universitaria de Informática Universidad Politécnica de Madrid
Asignatura: Gestión de Datos, Información y Servicios en Innovación
Contenido
1. Evolución de la web 2. Web semántica 3. Linked data 4. Publicación de Linked Data en la
web
2014 © Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 2
2
Evolución de la Web
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 3
Evolución de la Web
� Web 1.0 ◦ Tim Berners-Lee ◦ Presentación de datos ◦ Modelo catedral � Contenido más bien estático � Pocos productores de contenidos � Muchos consumidores ◦ Conceptos � HTML (HyperText Markup Language) � HTTP (HyperText Transfer Protocol) � URL (Uniform Resource Locator) � www (World Wide Web)
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 4
3
Evolución de la Web
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 5
� Página html típica: ◦ Formato del
contenido ◦ Hiperenlaces
� El contenido semántico es accesible a las personas pero no a los ordenadores (software)
Evolución de la Web
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 6
href
Fácil: Los ordenadores presentan la información
Complicado: Las personas interpretan y enlazan (navegan)
Ideal: Por qué no hacer que los ordenadores faciliten el trabajo
4
Evolución de la Web
� Web 2.0 ◦ Modelo bazar � Dinamismo, participación social
◦ Aplicaciones � Servicios web � Redes sociales y comunidades virtuales � Productores-consumidores de contenidos � Organización social de la información � Sindicación � Captchas y crowdsourcing � Mash-ups
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 7
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 8
Evolución de la Web Web 2.0 – twitter Redes sociales
5
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 9
Evolución de la Web Web 2.0 - wikipedia Productores-consumidores
Evolución de la Web Web 2.0 – Folksonomías
� Clasificación colectiva de la información, su implementación más popular son los tags o etiquetas
� Ejemplo: etiquetas más populares (11870.com)
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 10
Organizadores
6
Evolución de la Web Web 2.0 - captchas � Pruebas para determinar si el usuario es o no humano ◦ Completely Automated Public Turing test to tell Computers and
Humans Apart ◦ Evitan que robots (spamboots) puedan utilizar ciertos servicios
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 11
ow.ly
Evolución de la Web Web 2.0 - crowdsourcing ◦ Crowdsourcing � Externalizar tareas para ser realizadas por muchas personas � Ejemplo: evaluar un sitio o servicio web, google+, etc.
◦ Crowdsourcing y captchas � Utilizar mano de obra barata o involuntaria
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 12
Fuente: http://www.captcha.net/
� Usuarios de sitios web para validar cierto tipo de textos
7
Evolución de la Web Web 2.0 - crowdsourcing
� Juegos/entretenimientos ◦ Discriminar humanos de máquinas ◦ Obtener conocimiento, inteligencia
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 13
http://www.gwap.com/gwap/features/gender_test/
Evolución de la Web Web 2.0 – mash-ups
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 14
8
Evolución de la Web � Las folksonomías permiten clasificar colectivamente la
información en la web 2.0, mediante etiquetas, pero dado el gran volumen de datos generados en la web, sirven de poco si no se les consigue asignar significado y jerarquía.
� Asumida la revolución de los sistemas de publicación de contenidos como weblogs y wikis en la web 2.0, la atención se desplaza ahora, desde la información hacía la meta-información.
� Se trata de dar respuesta al enunciado: -“Algo peor que no tener información disponible es tener mucha información y no saber qué hacer con ella.”
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 15
(Eugenio Rodríguez Nieto, “Web 1.0, Web 2.0 y Web 3.0”)
Evolución de la Web Web 3.0 � Web 1.0 - Personas conectándose a la Web, consultando
páginas, estáticas o dinámicas, de portales de Internet.
� Web 2.0 - Personas conectándose a personas -redes sociales, wikis, colaboración, foros- con la posibilidad de compartir e intercambiar información.
� Web 3.0 - Aplicaciones Web conectándose a aplicaciones Web, convirtiendo la red en una Base de Datos (Data Web), en la que los contenidos son accesibles e interpretables, con formatos estandarizados, por dichas aplicaciones.
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 16
9
Evolución de la Web Web 3.0
� De la comunicación entre personas a la comunicación entre ordenadores
� De la locura de las masas a la sabiduría de las multitudes
� Posicionamiento más natural, por relevancia y no por valores de ranking
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 17
Evolución de la Web Web 3.0
� Nunca hemos tenido tanto poder para crear y acceder a la información ni tan poco para consolidarla y convertirla en conocimiento.
� La web de hoy es sobre documentos, la web semántica es sobre cosas” (Internet de las cosas, Internet de las personas).
� Evolución de la web 2.0 a la web 3.0, de la información al conocimiento.
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 18
10
Evolución de la Web Web 3.0
� Enlazar cosas, datos, no solo páginas, enlazarlo todo
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 19
La internet de las cosas: frente al grafo social centrado en los documentos propuesto por la web 2.0, entre personas, el Grafo Global Gigante (GGG)
propuesto por Tim Berners-‐Lee sitúa la importancia de la web en las cosas, en los contenidos, independientemente de la fuente
Fuente: Dolors Reig Hernández , “Web 3.0: la tercera década de la web”, 2009
Contenido
1. Evolución de la web 2. Web semántica 3. Linked data 4. Publicación de Linked Data en la web
2014 © Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 20
11
2. Web semántica � La Web Semántica es una extensión de la web actual
en la que se da a la información un significado bien definido, permitiendo a los ordenadores y personas trabajar en cooperación (extraído de Tim Berners-Lee et al., The Semantic Web, 2001)
� Está basada en la idea de tener en la web datos bien definidos y enlazados, de tal forma que puedan ser utilizados por máquinas para la automatización, integración y reutilización de datos entre diferentes aplicaciones, y no solo con el propósito de visualización.
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 21
Web semántica
� Un lugar donde las máquinas pueden leer las páginas web al igual que los seres humanos
� Un lugar donde los motores de búsqueda y agentes software pueden encontrar mejor lo que buscan
� La web como un medio universal para disponer de datos, información y conocimiento y facilitar su intercambio
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 22
12
Web semántica � Aplicaciones ◦ Información � DBpedia � FOAF (Friend of a Friend) � RSS (Reallly Simple Syndication) � Buscadores ◦ Administraciones públicas ◦ Cultura � Museos � Espectáculos ◦ Turismo ◦ Innovación en empresas ◦ Etc.
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 23
Contenido
1. Evolución de la web 2. Web semántica 3. Linked data 4. Publicación de Linked Data en la web
2014 © Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 24
13
3. Linked Data � Problema: ◦ La web está llena de documentos ◦ Nosotros no siempre estamos interesados en
documentos � Estamos interesados en cosas (THINGS) � Estas COSAS pueden estar en documentos
� Las Bases de Datos Relacionales están llenas de COSAS
◦ Nosotros podemos leer documentos HTML representados en un navegador y encontrar lo que estamos buscando � Esto es complicado para el software � Los ordenadores tienen que adivinar, no tienen nuestra
capacidad para encontrar las cosas
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 25
Linked Data
� Solución
◦ Pasar de una web de documentos
◦ A una Web de Datos o Cosas
◦ ¿Por qué? � Ejemplo:
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 26
Presidentes de equipos de futbol españoles de primera división que
estudiaron en la UPM
14
Linked Data
� Web de documentos enlazados (web 1.0) ◦ Enlaza documentos ◦ Diseñado para humanos
2014 © Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 27
Fuente: Tom Heath, Talis, 2009
Linked Data
� Silos de datos en la Web ◦ Generan documentos independientes
2014 © Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 28
Fuente: Tom Heath, Talis, 2009
Islas de Datos
15
Linked Data
� Web de datos enlazados ◦ Enlaza “cosas” (o descripciones de cosas), no documentos ◦ Orientado a las máquinas, no a las personas
2014 © Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 29
Fuente: Tom Heath, Talis, 2009
Base de Datos Global
Linked Data
� Base de datos “global”
2014 © Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 30
Datos en la Web
Expuestos como RDF
Enlazados con otros datos
16
Linked Data
Serie de buenas prácticas para … publicar
compartir conectar
… datos, información y conocimiento en la Web
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 31
Datos en la Web expuestos como RDF y enlazados con otros datos
Linked Data
Estas buenas prácticas las expuso Tim Berners-Lee en TED2009
en base a 4 principios
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 32
17
Linked Data Principios
1. Utilizar URIs para identificar cosas 2. Utilizar el protocolo HTTP para
acceder a las cosas (con URIs) 3. Ofrecer información útil en esas
direcciones usando los estándares (RDF, SPARQL)
4. Incluir enlaces en RDF a otras URIs, de forma que se puedan descubrir más cosas relacionadas
� http://www.w3.org/DesignIssues/LinkedData.html
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 33
Linked Data Propiedades
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 34
� Espacio de datos distribuido y global construido en base a un conjunto de estándares sencillos ◦ RDF, URIs, HTTP
� Entidades conectadas por enlaces ◦ Grafo de datos global que expande las fuentes de datos ◦ Permite el descubrimiento de nuevas fuentes de datos en
tun-time
� Facilita la coexistencia de datos ◦ Cualquiera puede publicar datos en la Web de Linked Data ◦ Cualquiera puede expresar su punto de vista personal de las cosas
18
Linked Data Linked Open Data
� Un esfuerzo comunitario para
◦ Publicar los datasets existentes y con licencias abiertas como Linked Data en la Web
◦
◦ Enlazar cosas (datos) entre distintos recursos (fuentes de datos)
◦
◦ Desarrollar clientes que consuman Linked Data desde la Web
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 35
Linked Data Linked Open Data
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 36
19
Linked Data Linked Open Data
� Tipo de información emergente � Linking Open Data: Data Sets
2014 © Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 37
Linked Data Linked Open Data
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 38
20
Linked Data Crecimiento
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 39
Christian Bizer: Evolving the Web into a Global Data Space, 2011)
2011 295 31.634.213.703
Linked Data Aplicaciones � Linked Data Browsers ◦ Tabulator Browser (MIT, USA) ◦ Marbles (FU Berlin, DE) ◦ OpenLink RDF Browser (OpenLink, UK) ◦ Zitgist RDF Browser (Zitgist, USA) ◦ Disco Hyperdata Browser (FU Berlin, DE) ◦ Fenfire (DERI, Irland)
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 40
21
Linked Data Aplicaciones
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 41
Linked Data Aplicaciones
� Motores de búsqueda ◦ Falcons (IWS, China) ◦ Sig.ma (DERI, Ireland) ◦ Swoogle (UMBC, USA) ◦ VisiNav (DERI, Ireland) ◦ Watson (Open University, UK)
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 42
22
Linked Data Aplicaciones
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 43
Contenido
1. Evolución de la web 2. Web semántica 3. Linked data 4. Publicación de Linked Data
en la web
2014 © Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 44
23
4. Publicación de Linked Data � Web vs. Web de Datos ◦ Web � Navegadores HTML � Navegación entre diferentes páginas HTML � Links HTML
◦ Web de Datos � Navegadores Linked Data
� Interpretan y muestran los datos contenidos en los RDF � Navegadores HTML solo muestran RDF como código, o permiten
descargar los ficheros pero sin visualizarlos
� Navegación entre diferentes fuentes de datos RDF entrelazadas � Links RDF � Motores de búsqueda potentes, similares a los de los SGBDRs
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 45
Publicación de Linked Data
� Modelo de datos RDF ◦ Recurso � Representado por un conjunto de tripletas
◦ Tripleta � Estructura
� Sujeto Predicado Objeto Pedro tiene la dirección de email [email protected]
◦ RDF es útil para la red de datos y para integración
de datos 2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 46
Recurso Valor
Recurso Recurso
propiedad
propiedad o relación
24
Publicación de Linked Data
� Tipo de elementos ◦ Tripletas literal � Valor literal como un string, número o fecha � Para describir propiedades o recursos del sujeto ◦ Links RDF � Representan enlaces tipados entre dos recursos � El predicado define el tipo de link � El objeto puede contener enlaces a otras URIs, definiendo una
web (red) de datos
� Representado por un grafo dirigido y etiquetado � Serializable en varios formatos ◦ RDF/XML, RDFa, N3, Turtle, JSON, etc.
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 47
Publicación de Linked Data
� Red global de datos enlazados ◦ Internet de datos en vez de documentos, una “Base
de datos universal” ◦ Permite encontrar el resultado preciso, no como
las búsquedas en google ◦ Facilidad para enlazar (agregar) más datos en la web
de datos
◦ Permite navegar por los datos ◦ Accesible a sistemas software
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 48
25
Modelo de Datos RDF
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 49
RDF links
Prefixes rc: <http://richard.cyganiak.de/foaf.rdf#> rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> foaf: <http://xmlns.com/foaf/0.1/> dbpedia: <http://dbpedia.org/resource/> dp: <http://dbpedia.org/property/> skos: <http://www.w3.org/2004/02/skos/core#>
rc: cygri foaf: Person
dbpedia: Berlin
Richard Cyganiak
rdf:type
foaf:name
foaf:based_near
http://www4.wiwiss.fu-berlin.de/bizer/pub/linkeddatatutorial/
Modelo de Datos RDF
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 50
rc: cygri foaf: Person
dbpedia: Berlin
Richard Cyganiak
rdf:type
foaf:name
foaf:based_near
dbpedia: Berlin
db: Cities_in_Germany
skos:subject
3.405.259 db:population
Prefixes rc: <http://richard.cyganiak.de/foaf.rdf#> rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> foaf: <http://xmlns.com/foaf/0.1/> dbpedia: <http://dbpedia.org/resource/> dp: <http://dbpedia.org/property/> skos: <http://www.w3.org/2004/02/skos/core#> http://www4.wiwiss.fu-berlin.de/bizer/pub/linkeddatatutorial/
RDF links
26
Modelo de Datos RDF
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 51
rc: cygri foaf: Person
dbpedia: Berlin
Richard Cyganiak
rdf:type
foaf:name
foaf:based_near
db: Cities_in_Germany
skos:subject
3.405.259 db:population
Prefixes rc: <http://richard.cyganiak.de/foaf.rdf#> rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> foaf: <http://xmlns.com/foaf/0.1/> dbpedia: <http://dbpedia.org/resource/> dp: <http://dbpedia.org/property/> skos: <http://www.w3.org/2004/02/skos/core#> http://www4.wiwiss.fu-berlin.de/bizer/pub/linkeddatatutorial/
RDF links
Publicación de Linked Data
� Principios de Linked Data
1. Utilizar URIs para identificar cosas 2. Utilizar el protocolo HTTP para acceder a las
cosas (con URIs) 3. Ofrecer información útil en esas direcciones
usando los estándares (RDF, SPARQL) 4. Incluir enlaces en RDF a otras URIs, de forma que
se puedan descubrir más cosas relacionadas
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 52
27
(1) Utilizar URIs para identificar cosas � Uniform Resource Identifiers � Identificar objetos del mundo real y conceptos
abstractos ◦ No sólo documentos web y contenido digital ◦ Personas, lugares, coches, etc. ◦ Conceptos para expresar conocimiento
� Ejemplo ◦ http://www.eui.upm.es/srv-oei/profes/pac/foaf.rdf#me � Identifica la persona
◦ http://www.eui.upm.es/srv.oei/profes/pac/foaf.rdf � Identifica un documento RDF
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 53
(2) Elección de URIs
� Utilizar HTTP URIs para que la gente o software pueda encontrar esos nombres ◦ Ejemplo � http://www.eui.upm.es/srv-oei/profes/pac/foaf.rdf#me � http://www.eui.upm.es/srv.oei/profes/pac/foaf.rdf
� Mantener las URIs estables y persistentes, evitando cambios futuros
� Mejor utilizar nemotécnicos o abreviaturas � http://dbpedia.org/resource/Berlin � http://www4.wiwiss.fu-berlin.de:2020/demos/dbpedia/cgi-bin/resources.php?id=Berlin
� Si es posible, utilizar algún tipo de clave principal en las URIs, para asegurar la unicidad
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 54
28
(3) Proporcionar información útil � HTML ◦ Para proporcionar información útil en la web en forma
de documentos � RDF ◦ Para proporcionar información útil en la web en forma
de datos � Diferentes formas de serializar datos RDF ◦ RDF/XML ◦ N3 ◦ RDFa ◦ Turtle
� Vocabularios para representar la información
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 55
Formatos
� XML/RDF
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 56
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:tut="http://interaccion2009.org/tutorialWebSem#"> <tut:Libro rdf:about="http://interaccion2009.org/tutorialWebSem#libro1605660663"> <tut:isbn>1605660663</tut:isbn> <tut:titulo>Semantic Web for Business: Cases and Applications</tut:titulo> <tut:autor>3</tut:autor> </tut:Libro> <tut:Libro rdf:about="http://interaccion2009.org/tutorialWebSem#libro0470396792"> <tut:isbn>0470396792</tut:isbn> <tut:titulo>Semantic Web For Dummies</tut:titulo> <tut:autor>4</tut:autor> </tut:Libro> <tut:Libro rdf:about="http://interaccion2009.org/tutorialWebSem#libro0596527349"> <tut:isbn>0596527349</tut:isbn> <tut:titulo>Information Architecture for the World Wide Web: Designing Large-Scale Web Sites</tut:titulo> <tut:autor>5</tut:autor> </tut:Libro> </rdf:RDF>
29
Formatos
� N3
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 57
@prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> . @prefix tut: <http://interaccion2009.org/tutorialWebSem#> . tut:libro1605660663 a tut:Libro ;
tut:isbn "1605660663" ; tut:titulo "Semantic Web for Business: Cases and Applications" ; tut:autor "3" .
tut:libro0470396792 a tut:Libro ;
tut:isbn "0470396792" ; tut:titulo "Semantic Web For Dummies" ; tut:autor "4" .
tut:libro0596527349 a tut:Libro ;
tut:isbn "0596527349" ; tut:titulo "Information Architecture for the World Wide Web: Designing Large-Scale Web Sites" ; tut:autor "5" .
Formatos
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 58
<div> My name is Bob Smith, but people call me Smithy. Here is my home page: <a href="http://www.example.com">www.example.com</a>. I live in Albuquerque, NM and work as an engineer at ACME Corp. My friends: <a href="http://darryl-blog.example.com">Darryl</a>, <a href="http://edna-blog.example.com">Edna</a> </div>
<div xmlns:v="http://rdf.data-vocabulary.org/#" typeof="v:Person"> My name is <span property="v:name">Bob Smith</span>, but people call me <span property="v:nickname">Smithy</span>. Here is my homepage: <a href="http://www.example.com" rel="v:url">www.example.com</a>. I live in <span rel="v:address"> <span typeof="v:Address"> <span property="v:locality">Albuquerque</span>, <span property="v:region">NM</span> </span></span> and work as an <span property="v:title">engineer</span> at <span property="v:affiliation">ACME Corp</span>. My friends: <a href="http://darryl-blog.example.com" rel="v:friend">Darryl</a>, <a href="http://edna-blog.example.com" rel="v:friend">Edna</a> </div>
HTML
RDFa (RDF dentro de
HTML)
30
Formatos
� Conversores ◦ http://rhizomik.net/rdf123 � de hoja de cálculo (cvs) a RDF/XML
◦ http://simile.mit.edu/babel/
◦ http://rhizomik.net/html/redefer/rdf2html-form/ � RDF a HTML + RDFa
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 59
Vocabularios
� Representan esquemas de ontologías � Crear los vocabularios propios utilizando ◦ RDF Vocabulary Description Language (RDF
Schema) � Vocabularios de poco peso
◦ Web Ontological Language (OWL) � Altamente expresivos y con capacidad de inferencia
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 60
31
Vocabularios � Reutilizar términos ya definidos para representar la
información � Friend-of-a-Friend (FOAF), para describir personas � Dublin Core (DC), define atributos generales de metadatos � Semantically-Interlinked Online Communities (SIOC), vocabulario
para representar comunidades online � Description of a Project (DOAP), para describir proyectos � Simple Knowledge Organization System (SKOS), para representar
taxonomías y conocimiento poco estructurado � Music Ontology, para describir artistas, álbumes y canciones � Review Vocabulary, para representar revisiones � Creative Commons (CC), para describir términos de licencias
◦ Lista de vocabularios conocidos � http://www.w3.org/wiki/TaskForces/CommunityProjects/LinkingOpenData/CommonVocabularies
� Definir nuevos términos/vocabularios con RDF Schema y OWL
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 61
Vocabularios FOAF
� FOAF (Friend-of-A-Friend) ◦ Descripciones RDF publicadas como datos entrelazados en
la Web, formando una red de personas ◦ Describen personas, grupos, documentos, etc. ◦ Proyecto Foaf-project (http://www.foaf-project.org) ◦ FOAF Vocabulary Specification 0.98 � http://xmlns.com/foaf/spec/
◦ Forma de describirse a uno mismo � Nombre, email, web, personas conocidas, etc.
◦ FOAF-a-matic � Aplicación simple Javascript que permite crear un descripción FOAF � http://www.ldodds.com/foaf/foaf-a-matic
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 62
32
Vocabularios FOAF � FOAF Core ◦ Clases y propiedades
para describir a personas o grupos
� Social Web
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 63
http://xmlns.com/foaf/spec/
Vocabularios FOAF
� Propiedades
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 64
Propiedad Descripción
foaf:name the (complete) name of the Person
foaf:title the title of the Person, e.g. Mr, Mrs, Dr, etc
foaf:firstName the person’s "first name"
foaf:surname the person’s surname or family name
foaf:nick the person’s nick name
foaf:mbox the person’s mail box
foaf:schoolHomepage the home page of the persons school
foaf:workplaceHomepage the home page of the persons place of work
foaf:workInfoHomepage a page describing what the person does at their place of work
foaf:phone the persons phone number, specified as a fully qualified international phone number, using the tel: URL scheme
foaf:homepage the persons homepage, see also Using foaf:weblog in your FOAF file
foaf:weblog the persons weblog
33
Vocabularios FOAF � Publicar datos FOAF ◦ Crear el fichero FOAF ◦ Preferible llamar al fichero “foaf.rdf”, para ser localizado por buscadores
como google ◦ Subirlo a una ubicación pública (página web)
� Unirse a la comunidad FOAF ◦ Etiqueta link en página HTML
<link rel="meta" type="application/rdf+xml" title="FOAF" href="foaf.rdf" /> ◦ Referencias desde un “Amigo”
� Incluir el namespace de RDF Schema <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#" xmlns:foaf="http://xmlns.com/foaf/0.1/">
� Referenciar a la persona mediante seeAlso <rdfs:seeAlso rdf:resource="http://wwdireccionweb/foaf.rdf"/>
◦ Tablones de anuncios de FOAF � Ejemplo: http://www.ldodds.com/foaf/bulletin-board.html
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 65
Vocabularios FOAF - Ejemplo
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 66
<?xml version="1.0"?> <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:rdfs=http://www.w3.org/2000/01/rdf-schema# xmlns:foaf="http://xmlns.com/foaf/0.1/"> <foaf:PersonalProfileDocument rdf:about=""> <foaf:maker rdf:resource="#me"/> <foaf:primaryTopic rdf:resource="#me"/> </foaf:PersonalProfileDocument> <foaf:Person rdf:ID="me"> <foaf:name>Pedro P. Alarcón</foaf:name> <foaf:mbox>mailto:[email protected]</foaf:mbox> <foaf:homepage rdf:resource="http://www.eui.upm.es"/> <foaf:phone rdf:resource="tel:+34 913365083"/> <foaf:based_near rdf:resource="dbpedia:Madrid"/> <foaf:knows> <foaf:Person> <foaf:name>Angel Arroyo</foaf:name> <foaf:mbox>mailto:[email protected]</foaf:mbox> <rdfs:seeAlso rdf:resource="http://www.eui.upm.es"/> </foaf:Person> </foaf:knows> </foaf:Person> </rdf:RDF>
34
Vocabularios FOAF - Ejemplo
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 67
Grafo obtenido con el validador de RDF: http://www.w3.org/RDF/Validator/direct
Vocabularios FOAF - Ejemplo
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 68
Grafo obtenido con el validador de RDF: http://www.w3.org/RDF/Validator/direct
35
4) Incluir links a otras cosas
� En función del dominio � Utilizar predicados para enlazar cosas: ◦ foaf:knows ◦ foaf:based_near ◦ foaf:homepage ◦ owl:sameAs ◦ …
� Encontrar links e incluirlos ◦ Manualmente ◦ Semi-atomáticamente
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 69
Búsqueda de links
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 70
36
Arquitectura de Publicación de LD
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 71
Linked Data en la Web
RDB to RDF Wrapper (ej. D2R)
CMS con salida RDFa (ej. Drupal)
Wrapper personalizado Linked Data
Interface Linked Data (ej. Pubby)
Servidor Web (ej. Apache)
Datos estructurados Texto
Convertidor a RDF (csv,
xml, excel, ...)
BD Relacional
Fuente de Datos (API)
Reposito- rio RDF
Ficheros RDF
Extractor de entidades (ej. Calais)
1. Preparación de datos
2. Almacenamiento de datos
3. Publicación de datos
Tipo de datos
Basado en “Linked Data: Evolving the Web into a Global Data Space” , Health & Bizer
Ficheros Estáticos RDF
� Cantidades pequeñas de datos (ficheros FOAF) � Se utiliza el tipo de serialización más habitual: RDF/
XML � Ficheros con extensión .rdf � Accesibles desde el servidor web ◦ http://www.eui.upm.es/srvoei/personal/pac/foaf.rdf
◦ http://www.eui.upm.es/srvoei/personal/pac/foaf.rdf#me
� Dejar el RDF accesible desde la página HTML ◦ <link rel="alternate" type="application/rdf+xml" href="company.rdf">
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 72
37
RDFa
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 73
Enlaces a otras URIs
schema.org
RDFa
� RDF embebido en HTML � Es útil cuando se tienen plantillas de páginas HTML � Drupal 7 lo incluye en las páginas web que genera
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 74
…………………. Interesés en investigación: <br> <span rel="foaf:interest"> <ul> <li><a href="http://dbpedia.org/resource/Database" property="dcterms:title">Database</a>, <li><a href="http://dbpedia.org/resource/Linked_Data" property="dcterms:title">Linked Data</a>, etc. </ul> </span> ………………….
38
Datos Estructurados (RDB)
� La Web como triturador de datos
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 75
Datos Estructurados
(RDB)
Datos No Estructurados
Figura de Martin Hepp, extraido de “Relational Databases to RDF”, Juan F. Sequeda
Integración de Datos
� Muchos de los datos publicados en web están a su vez almacenados en BD relacionales
� Las empresas almacenan la información en bases de datos muchas veces heterogéneas
� La integración de BD relacionales es complicada ◦ Fusión de compañías, datos legados, etc. ◦ Necesario un buen conocimiento de los esquemas ◦ No se utilizan identificadores globales únicos ◦ No se pueden crear claves foráneas que relacionen “mi base
de datos con la tuya”
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 76
39
Integración de Datos
� RDF como formato común para la integración de datos ◦ Herramientas RDB2RDF (Relational Database to RDF) ◦ Integración de diferentes tipos de fuentes de datos ◦ Especificaciones del w3c
http://www.w3.org/standards/techs/rdf#w3c_all � R2RML: RDB to RDF Mapping Language � A Direct Mapping of Relational Data to RDF � R2RML and Direct Mapping Test Cases � Use Cases and Requirements for Mapping Relational Databases to RDF
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 77
El mercado de la integración de datos es muy potente à oportunidad de negocio
RDB2RDF
� Facilidad de RDF para integrar ◦ RDF representa grafos ◦ Integrar dos grafos diferentes � Añadir arcos a los nodos o combinar nodos
� Situaciones reales ◦ Integrar varias RDB ◦ Utilizar datos RDF sobre una RDB ◦ Insertar en una RDB datos que no satisfacen el
esquema de la base de datos
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 78
40
RDB2RDF Integrar varias RDB
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 79
id Name City
10 Bluth Co. Austin
11 Zevo Toys Dallas
Acme_Clients id Name City
29 Zevo Toys Dallas
30 Initech Austin
Foobar_Clients
http://db1/client10
http://db1/client11
Bluth Co.
Zevo Toys
Austin
Dallas
ex:city
ex:city
ex:name
ex:name
http://db2/client29
http://db2/client30
Zevo Toys
Initech
Dallas
Austin
ex:city
ex:city
ex:name
ex:name
Relational Databases to RDF”, Juan F. Sequeda
RDB2RDF Integrar varias RDB
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 80
id Name City
10 Bluth Co. Austin
11 Zevo Toys Dallas
Acme_Clients id Name City
29 Zevo Toys Dallas
30 Initech Austin
Foobar_Clients
http://db1/client10
http://db1/client11
Bluth Co.
Zevo Toys
Austin
Dallas
ex:city
ex:city
ex:name
ex:name
http://db2/client30
Initech Austin
ex:city ex:name
Relational Databases to RDF”, Juan F. Sequeda
41
RDB2RDF Visión Global
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 81
Relational Databases to RDF”, Juan F. Sequeda
RDB2RDF Ejemplo
ID city state
18 Cambridge MA
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 82
CREATE TABLE Addresses ( ID INT, city CHAR(10), state CHAR(2), PRIMARY KEY(ID) ); CREATE TABLE People ( ID INT, fname CHAR(10), a ddr INT, PRIMARY KEY(ID), FOREIGN KEY(addr) REFERENCES Addresses(ID) ); INSERT INTO Addresses (ID, city, state) VALUES (18, 'Cambridge', 'MA'); INSERT INTO People (ID, fname, addr) VALUES (7, 'Bob', 18); INSERT INTO People (ID, fname, addr) VALUES (8, 'Sue', NULL)
ID fname dir
7 Bob 18
8 Sue NULL
People
Addresses
Esquema RDB
Tuplas a tripletas
Identificador de tupla
atributo
Valor de atributo
Sujeto
Predicado
Objeto
URI Nombre tabla +
Valor clave principal
42
RDB2RDF Ejemplo
ID city state
18 Cambridge MA
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 83
CREATE TABLE Addresses ( ID INT, city CHAR(10), state CHAR(2), PRIMARY KEY(ID) ); CREATE TABLE People ( ID INT, fname CHAR(10), a ddr INT, PRIMARY KEY(ID), FOREIGN KEY(addr) REFERENCES Addresses(ID) ); INSERT INTO Addresses (ID, city, state) VALUES (18, 'Cambridge', 'MA'); INSERT INTO People (ID, fname, addr) VALUES (7, 'Bob', 18); INSERT INTO People (ID, fname, addr) VALUES (8, 'Sue', NULL)
@base <http://foo.example/DB/> @prefix xsd: <http://www.w3.org/2001/XMLSchema#> . <People/ID-7> rdf:type <People> . <People/ID-7> <People#ID> 7 . <People/ID-7> <People#fname> "Bob" . <People/ID-7> <People#addr> 18 . <People/ID-7> <People#ref-addr> <Addresses/ID-18> . <People/ID-8> rdf:type <People> . <People/ID-8> <People#ID> 8 . <People/ID-8> <People#fname> "Sue" . <Addresses/ID-18> rdf:type <Addresses> . <Addresses/ID-18> <Addresses#ID> 18 . <Addresses/ID-18> <Addresses#city> "Cambridge" . <Addresses/ID-18> <Addresses#state> "MA" .
ID fname dir
7 Bob 18
8 Sue NULL
People Addresses
RDB RDF
¿Valores nulos?
RDB2RDF Ejemplo 1
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 84
ID city state
18 Cambridge MA
ID fname dir
7 Bob 18
8 Sue NULL
People Addresses
http://../People/id=7 http://../Addresses/id=18
MA
Cambridge
Bob
People#fname
People#address Addresses#city
Addresses#state
Ex:People Ex:Addresses People#address
rdf:type rdf:type
String
String Addresses#city
Addresses#state String
People#fname
RDFS/OWL
RDF
43
RDB2RDF Ejemplo 1
� ¿Cómo consultar los datos RDF? ◦ SPARQL ◦ Ejemplo � Obtener las personas de Cambridge
PREFIX cli: <http://../People#>PREFIX a: <http://../Addresses#>
SELECT ?nameWHERE{?person cli:fname ? name .?person cli:address ?addr .
?addr a:city “Cambridge”.}
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 85
RDB2RDF � SPARQL Federation
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 86
RDB
RDB2RDF
RDB
RDB2RDF
RDB
RDB2RDF
SELECT ?a WHERE{ … }
Relational Databases to RDF”, Juan F. Sequeda
44
RDB2RDF
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 87
RDB
SPARQL
RDF
SQL
Resultados SQL
Resultados SPARQL
Mapping
Basado en: “Relational Databases to RDF”, Juan F. Sequeda
Dificultad en mantener la consistencia
RDB2RDF Sistemas
� Sistemas/herramientas RDF
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 88
Tool D2R Server http://www4.wiwiss.fu-berlin.de/bizer/d2rq/
Virtuoso RDF Views http://virtuoso.openlinksw.com/dataspace/dav/wiki/Main/VOSSQLRDF
Triplify http://triplify.org/Overview
SquirrelRDF http://jena.sourceforge.net/SquirrelRDF/
R2O http://mayor2.dia.fi.upm.es/oeg-upm/index.php/en/downloads/9-r2o-odempaster
Spyder http://www.revelytix.com/content/spyder
Ultrawrap http://ribs.csres.utexas.edu/ultrawrap/
45
RDB2RDF Estado actual � El W3C RDB2RDF Working Group estándares: ◦ R2RML: RDB to RDF Mapping Language ◦ A Direct Mapping of Relational Data to RDF
� Los sistemas Spyder and Ultrawrap siguen el estándar en elaboración
� Los benchmarks realizados hasta el momento para medir el rendimiento de sistemas RDB2RDF con SGBDRs muestran que los RDB2RDF son todavía lentos y necesitan más optimización ◦ El rendimiento de Ultrawrap es casi comparable a sistemas
SQL
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 89
Herramientas de modelado y transformación a RDF Estudios sobre restricciones de modelos de datos a RDF como claves, nulos, etc. Benchmarks RDF y RDB
Publicando Linked Data � De bases de datos relacionales a Linked Data ◦ D2RQ ◦ Triplify ◦ Virtuoso ◦ Ultrawrap ◦ …
� Repositorios RDF nativos ◦ Sesame ◦ Jena ◦ Owlim ◦ Talis Platform
� Gestores de contenidos tipo Drupal 7 � RDFa � Foaf en HTML
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 90
46
BD Relacionales a Linked Data � D2RQ ◦ http://d2rq.org ◦ Open Source software and published under the Apache license ◦ System for accessing relational databases as virtual, read-only RDF
graphs. It offers RDF-based access to the content of relational databases without having to replicate it into an RDF store � query a non-RDF database using SPARQL � access the content of the database as Linked Data over the Web � create custom dumps of the database in RDF formats for loading
into an RDF store � access information in a non-RDF database using the Apache Jena
API
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 91
BD Relacionales a Linked Data
� Triplify ◦ http://triplify.org ◦ GNU Lesser General Public License ◦ Based on the definition of relational database queries for a specific
Web application in order to retrieve valuable information and to convert the results of these queries into RDF, JSON and Linked Data
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 92
47
BD Relacionales a Linked Data � Virtuoso Universal Server ◦ http://virtuoso.openlinksw.com ◦ Open source edition ◦ Multi-model data server for data management, access, and
integration. ◦ Covers the following areas: � Relational Data Management � RDF Data Management � XML Data Management � Free Text Content Management & Full Text Indexing � Document Web Server � Linked Data Server � Web Application Server � Web Services Deployment (SOAP or REST)
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 93
BD Relacionales a Linked Data
� Ultrawrap ◦ http://www.capsenta.com ◦ Comercial
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 94
SPARQL execution as fast as SQL Customizable mapping through a GUI
and SQL Supports W3C's R2RML and Direct
Mapping Automatic Translation of Relational
Data to RDF Automatic Translation of SQL Schema
to OWL Integrated Linked Data and SPARQL
end point
48
Repositorios RDF nativos
� Sesame ◦ http://www.openrdf.org ◦ BSD-style license ◦ De-facto standard framework for processing RDF data ◦ Includes parsers, storage solutions (RDF databases a.ka.
triplestores), reasoning and querying, using the SPARQL query language ◦ Offers a flexible and easy to use Java API that can be
connected to all leading RDF storage solutions ◦ Supports all main stream RDF file formats, including RDF/
XML, Turtle, N-Triples, TriG and TriX
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 95
Repositorios RDF nativos
� Jena ◦ http://jena.apache.org ◦ A free and open source Java framework for building
semantic web and Linked Data applications ◦ RDF � RDF API: create and read RDF graphs. � ARQ: a SPARQL engine that supports remote federated queries
◦ Triple Store � TDB: triple store persistence
� Fuseki: to expose triples as a SPARQL end-point accessible over HTTP
◦ OWL � Ontology API: adding extra semantics to your RDF data � Inference API: to configure inference rules or use OWL and RDFS reasoners
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 96
49
Repositorios RDF nativos
� Owlim ◦ http://www.ontotext.com/owlim ◦ Family of semantic repositories, or RDF database
management systems � native RDF engines, implemented in Java � delivering full performance through both Sesame and Jena � robust support for the semantics of RDFS y OWL � best scalability, loading and query evaluation performance
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 97
Publicando Linked Data � Almacenamiento de tripletas ◦ OpenLink Virtuoso
� http://virtuoso.openlinksw.com
◦ 4Store � http://4store.org
◦ Apache Jena TDB � http://jena.apache.org
◦ AllegroGraph � http://www.franz.com/agraph/allegrograph/
� Librerías para manejar RDF ◦ Java: Jena / Sesame ◦ Python: RDFlib ◦ Ruby: RDF.rb ◦ C/C++: Redland
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 98
50
Publicando Linked Data
� Navegadores Linked Data ◦ Permiten explorar Linked Data y navegar entre conceptos ◦ Ejemplo: Tabulator � http://www.w3.org/2005/ajar/tab � Extensión del navegador Firefox
� Buscadores Linked Data ◦ Buscan datos entre datasets Linked Data ◦ Ejemplos: � Sindice: http://sindice.com
� Watson...
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 99
Publicando Linked Data
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 100
Búsqueda por url Sparql Enviar Analizar estructura de datos Análisis (estadísticas)
51
Publicando Linked Data
� Open Refine ◦ Ex-Google Refine (since 2012) ◦ Free, open source ◦ Powerful tool for working with messy data, cleaning it,
transforming it from one format into another, extending it with web services, and linking it to databases like Freebase ◦ Freebase: � Large collaborative knowledge base, on-line collection of
structured data � RDF endpoint (data is available for commercial and non-
commercial use) � MQL (Metaweb Query Language) analogous to Sparql-Rdf
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 101
Publicando Linked Data � Repositorios RDF nativos
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 102 “Publishing Linked Data”, Juan F. Sequeda
Comerciales Oracle Garlik – 4store Systap – BigData Ontotext – BigOwlim Openlink – Virtuoso Franz – AllegroGraph Ontobroker - Ontoprise …
Open Source Jena Sesame Mulgara …
Linked Data en Cloud
Kasabi (Talis) beta.kasabi.com
Dydra dydra.com
…
Pubby Linked Data frontend para SPARQL endpoints http://www4.wiwiss.fu-berlin.de/pubby/
52
Publicando Linked Data � Linked Data Testing ◦ Vapour Linked Data Validator
� http://idi.fundacionctic.org/vapour ◦ RDF:Alerts
� http://swse.deri.org/RDFAlerts/ ◦ Sindice Inspector
� http://inspector.sindice.com/ ◦ cURL
� http://richard.cyganiak.de/blog/2007/02/debugging-semantic-web-sites-with-curl/
◦ Firefox Plugins � Live HTTP Headers
https://addons.mozilla.org/af/firefox/addon/live-http-headers/ � Modify Headers
https://addons.mozilla.org/af/firefox/addon/modify-headers/ ◦ Linked Data browsers
� http://browse.semanticweb.org/
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 103
“Publishing Linked Data”, Juan F. Sequeda
Publicando Linked Data
� La web se transforma en una gran Base de datos “global”
� ¿Cómo consultar estos datos? ◦ SPARQL � Recomendación del W3C � http://www.w3.org/TR/rdf-sparql-query/
2014 © Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 104
Datos en la Web
Expuestos como RDF
Enlazados con otros datos
53
Publicando Linked Data � SPARQL endpoints ◦ Servicio REST (GET, POST, PUT) ◦ Proporciona acceso a conjuntos de datos LD ◦ El dataset LD ofrece el servicio de procesamiento SPARQL ◦ Ejemplos � Dbpedia
� http://dbpedia.org/sparql � UK Government
� http://data.gov.uk/sparql � USA Government
� http://semantic.data.gov/sparql � Musicbrainz
� http://dbtune.org/musicbrainz/sparql
◦ Interfaz web: SNORQL
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 105
Publicando Linked Data � dbpedia ◦ Explorador SparQL ◦ http://dbpedia.org/sparql/
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 106
54
Publicando Linked Data � Snorql ◦ Explorador SparQL ◦ http://data.semanticweb.org/snorql/
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 107
Publicando Linked Data
� No confundir
� Linked Data (Datos enlazados)
� Open Data (Datos abiertos)
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 108
55
Publicando Linked Data Linked Open Data
� Abierto, enlazado... pero no es usable � Se necesitan: ◦ Sistemas usables que utilicen los datos vinculados ◦ Formas sencillas para búsquedas complejas (es
necesario conocer la estructura para extraer todo el potencial informativo) � SPARQL Endpoint ◦ Ayuda sobre cómo se puede buscar, qué se puede
encontrar ◦ Explotación gráfica y navegabilidad de los datos
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 109
“Linked Data y Patrimonio Cultural”. Francisca Hernández
Referencias utilizadas � “Oportunidades de la Web de Datos (Linked Data) en España” Oscar Corcho,
José Manuel Gómez, Asunción Gómez, Ontology Engineer Group, Facultad Informática UPM
� “Publishing Linked Data”, Juan F. Sequeda. Semantic Technology Conference, June 2011
� “Relational Databases to RDF”, Juan F. Sequeda. Oportunidades de la web de datos (Linked Data) en España, Cursos de verano UPM 2011.
� “http://www.w3.org/2001/sw/rdb2rdf/,” W3C � “Linked Data: Evolving the Web into a Global Data Space”, Heath & Bizer � “Linked Data in Use”, Guillermo Álvaro Rey. Oportunidades de la web de
datos (Linked Data) en España, Cursos de verano UPM 2011. � Tom Heath, Talis, 2009 � “Web 3.0: la tercera década de la web”, Dolors Reig Hernández , 2009 � “Web 1.0, Web 2.0 y Web 3.0”, Eugenio Rodríguez Nieto, � “Linked Data y Patrimonio Cultural”. Francisca Hernández. Oportunidades de
la web de datos (Linked Data) en España, Cursos de verano UPM 2011. � http://www.cambridgesemantics.com/semantic-university
2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 110