1. Evolución de la web 2. Web semántica 3. Linked data 4 ...

55
1 Tema 2: Linked Data Pedro P. Alarcón Cavero [email protected] Curso 2014/15 Máster en Ciencias y Tecnologías de la Información Escuela Universitaria de Informática Universidad Politécnica de Madrid Asignatura: Gestión de Datos, Información y Servicios en Innovación Contenido 1. Evolución de la web 2. Web semántica 3. Linked data 4. Publicación de Linked Data en la web 2014 © Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 2

Transcript of 1. Evolución de la web 2. Web semántica 3. Linked data 4 ...

1

Tema 2: Linked Data

Pedro P. Alarcón Cavero [email protected]

Curso 2014/15

Máster en Ciencias y Tecnologías de la Información Escuela Universitaria de Informática Universidad Politécnica de Madrid

Asignatura: Gestión de Datos, Información y Servicios en Innovación

Contenido

1.  Evolución de la web 2.  Web semántica 3.  Linked data 4.  Publicación de Linked Data en la

web

2014 © Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 2

2

Evolución de la Web

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 3

Evolución de la Web

� Web 1.0 ◦  Tim Berners-Lee ◦  Presentación de datos ◦ Modelo catedral �  Contenido más bien estático �  Pocos productores de contenidos �  Muchos consumidores ◦  Conceptos �  HTML (HyperText Markup Language) �  HTTP (HyperText Transfer Protocol) �  URL (Uniform Resource Locator) �  www (World Wide Web)

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 4

3

Evolución de la Web

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 5

�  Página html típica: ◦  Formato del

contenido ◦  Hiperenlaces

�  El contenido semántico es accesible a las personas pero no a los ordenadores (software)

Evolución de la Web

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 6

href

  Fácil: Los ordenadores presentan la información

  Complicado: Las personas interpretan y enlazan (navegan)

  Ideal: Por qué no hacer que los ordenadores faciliten el trabajo

4

Evolución de la Web

� Web 2.0 ◦ Modelo bazar �  Dinamismo, participación social

◦ Aplicaciones �  Servicios web �  Redes sociales y comunidades virtuales �  Productores-consumidores de contenidos �  Organización social de la información �  Sindicación �  Captchas y crowdsourcing �  Mash-ups

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 7

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 8

Evolución de la Web Web 2.0 – twitter Redes sociales

5

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 9

Evolución de la Web Web 2.0 - wikipedia Productores-consumidores

Evolución de la Web Web 2.0 – Folksonomías

�  Clasificación colectiva de la información, su implementación más popular son los tags o etiquetas

�  Ejemplo: etiquetas más populares (11870.com)

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 10

Organizadores

6

Evolución de la Web Web 2.0 - captchas �  Pruebas para determinar si el usuario es o no humano ◦  Completely Automated Public Turing test to tell Computers and

Humans Apart ◦  Evitan que robots (spamboots) puedan utilizar ciertos servicios

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 11

ow.ly

Evolución de la Web Web 2.0 - crowdsourcing ◦ Crowdsourcing �  Externalizar tareas para ser realizadas por muchas personas �  Ejemplo: evaluar un sitio o servicio web, google+, etc.

◦ Crowdsourcing y captchas �  Utilizar mano de obra barata o involuntaria

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 12

Fuente: http://www.captcha.net/

� Usuarios de sitios web para validar cierto tipo de textos

7

Evolución de la Web Web 2.0 - crowdsourcing

�  Juegos/entretenimientos ◦  Discriminar humanos de máquinas ◦  Obtener conocimiento, inteligencia

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 13

http://www.gwap.com/gwap/features/gender_test/

Evolución de la Web Web 2.0 – mash-ups

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 14

8

Evolución de la Web �  Las folksonomías permiten clasificar colectivamente la

información en la web 2.0, mediante etiquetas, pero dado el gran volumen de datos generados en la web, sirven de poco si no se les consigue asignar significado y jerarquía.

�  Asumida la revolución de los sistemas de publicación de contenidos como weblogs y wikis en la web 2.0, la atención se desplaza ahora, desde la información hacía la meta-información.

�  Se trata de dar respuesta al enunciado: -“Algo peor que no tener información disponible es tener mucha información y no saber qué hacer con ella.”

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 15

(Eugenio Rodríguez Nieto, “Web 1.0, Web 2.0 y Web 3.0”)

Evolución de la Web Web 3.0 �  Web 1.0 - Personas conectándose a la Web, consultando

páginas, estáticas o dinámicas, de portales de Internet.

�  Web 2.0 - Personas conectándose a personas -redes sociales, wikis, colaboración, foros- con la posibilidad de compartir e intercambiar información.

�  Web 3.0 - Aplicaciones Web conectándose a aplicaciones Web, convirtiendo la red en una Base de Datos (Data Web), en la que los contenidos son accesibles e interpretables, con formatos estandarizados, por dichas aplicaciones.

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 16

9

Evolución de la Web Web 3.0

� De la comunicación entre personas a la comunicación entre ordenadores

� De la locura de las masas a la sabiduría de las multitudes

� Posicionamiento más natural, por relevancia y no por valores de ranking

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 17

Evolución de la Web Web 3.0

�  Nunca hemos tenido tanto poder para crear y acceder a la información ni tan poco para consolidarla y convertirla en conocimiento.

�  La web de hoy es sobre documentos, la web semántica es sobre cosas” (Internet de las cosas, Internet de las personas).

�  Evolución de la web 2.0 a la web 3.0, de la información al conocimiento.

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 18

10

Evolución de la Web Web 3.0

�  Enlazar cosas, datos, no solo páginas, enlazarlo todo

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 19

La  internet  de  las  cosas:  frente  al  grafo  social  centrado  en  los  documentos  propuesto  por  la  web  2.0,  entre  personas,  el  Grafo  Global  Gigante  (GGG)  

propuesto  por  Tim  Berners-­‐Lee  sitúa  la  importancia  de  la  web  en  las  cosas,  en  los  contenidos,  independientemente  de  la  fuente

Fuente: Dolors Reig Hernández , “Web  3.0:  la  tercera  década  de  la  web”,  2009

Contenido

1.  Evolución de la web 2.  Web semántica 3.  Linked data 4.  Publicación de Linked Data en la web

2014 © Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 20

11

2. Web semántica �  La Web Semántica es una extensión de la web actual

en la que se da a la información un significado bien definido, permitiendo a los ordenadores y personas trabajar en cooperación (extraído de Tim Berners-Lee et al., The Semantic Web, 2001)

�  Está basada en la idea de tener en la web datos bien definidos y enlazados, de tal forma que puedan ser utilizados por máquinas para la automatización, integración y reutilización de datos entre diferentes aplicaciones, y no solo con el propósito de visualización.

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 21

Web semántica

�  Un lugar donde las máquinas pueden leer las páginas web al igual que los seres humanos

�  Un lugar donde los motores de búsqueda y agentes software pueden encontrar mejor lo que buscan

�  La web como un medio universal para disponer de datos, información y conocimiento y facilitar su intercambio

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 22

12

Web semántica � Aplicaciones ◦  Información �  DBpedia �  FOAF (Friend of a Friend) �  RSS (Reallly Simple Syndication) �  Buscadores ◦  Administraciones públicas ◦  Cultura �  Museos �  Espectáculos ◦  Turismo ◦  Innovación en empresas ◦  Etc.

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 23

Contenido

1.  Evolución de la web 2.  Web semántica 3.  Linked data 4.  Publicación de Linked Data en la web

2014 © Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 24

13

3. Linked Data �  Problema: ◦  La web está llena de documentos ◦ Nosotros no siempre estamos interesados en

documentos �  Estamos interesados en cosas (THINGS) �  Estas COSAS pueden estar en documentos

�  Las Bases de Datos Relacionales están llenas de COSAS

◦ Nosotros podemos leer documentos HTML representados en un navegador y encontrar lo que estamos buscando �  Esto es complicado para el software �  Los ordenadores tienen que adivinar, no tienen nuestra

capacidad para encontrar las cosas

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 25

Linked Data

�  Solución

◦  Pasar de una web de documentos

◦ A una Web de Datos o Cosas

◦  ¿Por qué? �  Ejemplo:

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 26

Presidentes de equipos de futbol españoles de primera división que

estudiaron en la UPM

14

Linked Data

�  Web de documentos enlazados (web 1.0) ◦  Enlaza documentos ◦  Diseñado para humanos

2014 © Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 27

Fuente: Tom Heath, Talis, 2009

Linked Data

�  Silos de datos en la Web ◦  Generan documentos independientes

2014 © Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 28

Fuente: Tom Heath, Talis, 2009

Islas de Datos

15

Linked Data

�  Web de datos enlazados ◦  Enlaza “cosas” (o descripciones de cosas), no documentos ◦  Orientado a las máquinas, no a las personas

2014 © Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 29

Fuente: Tom Heath, Talis, 2009

Base de Datos Global

Linked Data

� Base de datos “global”

2014 © Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 30

Datos en la Web

Expuestos como RDF

Enlazados con otros datos

16

Linked Data

Serie de buenas prácticas para … publicar

compartir conectar

… datos, información y conocimiento en la Web

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 31

Datos en la Web expuestos como RDF y enlazados con otros datos

Linked Data

Estas buenas prácticas las expuso Tim Berners-Lee en TED2009

en base a 4 principios

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 32

17

Linked Data Principios

1.  Utilizar URIs para identificar cosas 2.  Utilizar el protocolo HTTP para

acceder a las cosas (con URIs) 3.  Ofrecer información útil en esas

direcciones usando los estándares (RDF, SPARQL)

4.  Incluir enlaces en RDF a otras URIs, de forma que se puedan descubrir más cosas relacionadas

�  http://www.w3.org/DesignIssues/LinkedData.html

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 33

Linked Data Propiedades

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 34

�  Espacio de datos distribuido y global construido en base a un conjunto de estándares sencillos ◦  RDF, URIs, HTTP

�  Entidades conectadas por enlaces ◦  Grafo de datos global que expande las fuentes de datos ◦  Permite el descubrimiento de nuevas fuentes de datos en

tun-time

�  Facilita la coexistencia de datos ◦  Cualquiera puede publicar datos en la Web de Linked Data ◦  Cualquiera puede expresar su punto de vista personal de las cosas

18

Linked Data Linked Open Data

� Un esfuerzo comunitario para

◦  Publicar los datasets existentes y con licencias abiertas como Linked Data en la Web

◦ 

◦  Enlazar cosas (datos) entre distintos recursos (fuentes de datos)

◦ 

◦ Desarrollar clientes que consuman Linked Data desde la Web

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 35

Linked Data Linked Open Data

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 36

19

Linked Data Linked Open Data

�  Tipo de información emergente �  Linking Open Data: Data Sets

2014 © Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 37

Linked Data Linked Open Data

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 38

20

Linked Data Crecimiento

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 39

Christian Bizer: Evolving the Web into a Global Data Space, 2011)

2011 295 31.634.213.703

Linked Data Aplicaciones �  Linked Data Browsers ◦  Tabulator Browser (MIT, USA) ◦  Marbles (FU Berlin, DE) ◦  OpenLink RDF Browser (OpenLink, UK) ◦  Zitgist RDF Browser (Zitgist, USA) ◦  Disco Hyperdata Browser (FU Berlin, DE) ◦  Fenfire (DERI, Irland)

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 40

21

Linked Data Aplicaciones

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 41

Linked Data Aplicaciones

� Motores de búsqueda ◦  Falcons (IWS, China) ◦  Sig.ma (DERI, Ireland) ◦  Swoogle (UMBC, USA) ◦ VisiNav (DERI, Ireland) ◦ Watson (Open University, UK)

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 42

22

Linked Data Aplicaciones

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 43

Contenido

1.  Evolución de la web 2.  Web semántica 3.  Linked data 4. Publicación de Linked Data

en la web

2014 © Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 44

23

4. Publicación de Linked Data � Web vs. Web de Datos ◦ Web �  Navegadores HTML �  Navegación entre diferentes páginas HTML �  Links HTML

◦ Web de Datos �  Navegadores Linked Data

�  Interpretan y muestran los datos contenidos en los RDF � Navegadores HTML solo muestran RDF como código, o permiten

descargar los ficheros pero sin visualizarlos

�  Navegación entre diferentes fuentes de datos RDF entrelazadas �  Links RDF �  Motores de búsqueda potentes, similares a los de los SGBDRs

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 45

Publicación de Linked Data

� Modelo de datos RDF ◦  Recurso �  Representado por un conjunto de tripletas

◦  Tripleta �  Estructura

�  Sujeto Predicado Objeto Pedro tiene la dirección de email [email protected]

◦  RDF es útil para la red de datos y para integración

de datos 2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 46

Recurso Valor

Recurso Recurso

propiedad

propiedad o relación

24

Publicación de Linked Data

�  Tipo de elementos ◦  Tripletas literal �  Valor literal como un string, número o fecha �  Para describir propiedades o recursos del sujeto ◦  Links RDF �  Representan enlaces tipados entre dos recursos �  El predicado define el tipo de link �  El objeto puede contener enlaces a otras URIs, definiendo una

web (red) de datos

�  Representado por un grafo dirigido y etiquetado �  Serializable en varios formatos ◦  RDF/XML, RDFa, N3, Turtle, JSON, etc.

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 47

Publicación de Linked Data

� Red global de datos enlazados ◦  Internet de datos en vez de documentos, una “Base

de datos universal” ◦  Permite encontrar el resultado preciso, no como

las búsquedas en google ◦  Facilidad para enlazar (agregar) más datos en la web

de datos

◦  Permite navegar por los datos ◦ Accesible a sistemas software

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 48

25

Modelo de Datos RDF

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 49

RDF links

Prefixes rc: <http://richard.cyganiak.de/foaf.rdf#> rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> foaf: <http://xmlns.com/foaf/0.1/> dbpedia: <http://dbpedia.org/resource/> dp: <http://dbpedia.org/property/> skos: <http://www.w3.org/2004/02/skos/core#>

rc: cygri foaf: Person

dbpedia: Berlin

Richard Cyganiak

rdf:type

foaf:name

foaf:based_near

http://www4.wiwiss.fu-berlin.de/bizer/pub/linkeddatatutorial/

Modelo de Datos RDF

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 50

rc: cygri foaf: Person

dbpedia: Berlin

Richard Cyganiak

rdf:type

foaf:name

foaf:based_near

dbpedia: Berlin

db: Cities_in_Germany

skos:subject

3.405.259 db:population

Prefixes rc: <http://richard.cyganiak.de/foaf.rdf#> rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> foaf: <http://xmlns.com/foaf/0.1/> dbpedia: <http://dbpedia.org/resource/> dp: <http://dbpedia.org/property/> skos: <http://www.w3.org/2004/02/skos/core#> http://www4.wiwiss.fu-berlin.de/bizer/pub/linkeddatatutorial/

RDF links

26

Modelo de Datos RDF

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 51

rc: cygri foaf: Person

dbpedia: Berlin

Richard Cyganiak

rdf:type

foaf:name

foaf:based_near

db: Cities_in_Germany

skos:subject

3.405.259 db:population

Prefixes rc: <http://richard.cyganiak.de/foaf.rdf#> rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> foaf: <http://xmlns.com/foaf/0.1/> dbpedia: <http://dbpedia.org/resource/> dp: <http://dbpedia.org/property/> skos: <http://www.w3.org/2004/02/skos/core#> http://www4.wiwiss.fu-berlin.de/bizer/pub/linkeddatatutorial/

RDF links

Publicación de Linked Data

�  Principios de Linked Data

1.  Utilizar URIs para identificar cosas 2.  Utilizar el protocolo HTTP para acceder a las

cosas (con URIs) 3.  Ofrecer información útil en esas direcciones

usando los estándares (RDF, SPARQL) 4.  Incluir enlaces en RDF a otras URIs, de forma que

se puedan descubrir más cosas relacionadas

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 52

27

(1) Utilizar URIs para identificar cosas � Uniform Resource Identifiers �  Identificar objetos del mundo real y conceptos

abstractos ◦ No sólo documentos web y contenido digital ◦  Personas, lugares, coches, etc. ◦  Conceptos para expresar conocimiento

�  Ejemplo ◦  http://www.eui.upm.es/srv-oei/profes/pac/foaf.rdf#me �  Identifica la persona

◦  http://www.eui.upm.es/srv.oei/profes/pac/foaf.rdf �  Identifica un documento RDF

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 53

(2) Elección de URIs

�  Utilizar HTTP URIs para que la gente o software pueda encontrar esos nombres ◦  Ejemplo �  http://www.eui.upm.es/srv-oei/profes/pac/foaf.rdf#me �  http://www.eui.upm.es/srv.oei/profes/pac/foaf.rdf

�  Mantener las URIs estables y persistentes, evitando cambios futuros

�  Mejor utilizar nemotécnicos o abreviaturas �  http://dbpedia.org/resource/Berlin �  http://www4.wiwiss.fu-berlin.de:2020/demos/dbpedia/cgi-bin/resources.php?id=Berlin

�  Si es posible, utilizar algún tipo de clave principal en las URIs, para asegurar la unicidad

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 54

28

(3) Proporcionar información útil � HTML ◦  Para proporcionar información útil en la web en forma

de documentos �  RDF ◦  Para proporcionar información útil en la web en forma

de datos � Diferentes formas de serializar datos RDF ◦  RDF/XML ◦ N3 ◦  RDFa ◦  Turtle

�  Vocabularios para representar la información

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 55

Formatos

� XML/RDF

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 56

<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:tut="http://interaccion2009.org/tutorialWebSem#"> <tut:Libro rdf:about="http://interaccion2009.org/tutorialWebSem#libro1605660663"> <tut:isbn>1605660663</tut:isbn> <tut:titulo>Semantic Web for Business: Cases and Applications</tut:titulo> <tut:autor>3</tut:autor> </tut:Libro> <tut:Libro rdf:about="http://interaccion2009.org/tutorialWebSem#libro0470396792"> <tut:isbn>0470396792</tut:isbn> <tut:titulo>Semantic Web For Dummies</tut:titulo> <tut:autor>4</tut:autor> </tut:Libro> <tut:Libro rdf:about="http://interaccion2009.org/tutorialWebSem#libro0596527349"> <tut:isbn>0596527349</tut:isbn> <tut:titulo>Information Architecture for the World Wide Web: Designing Large-Scale Web Sites</tut:titulo> <tut:autor>5</tut:autor> </tut:Libro> </rdf:RDF>

29

Formatos

� N3

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 57

@prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> . @prefix tut: <http://interaccion2009.org/tutorialWebSem#> . tut:libro1605660663 a tut:Libro ;

tut:isbn "1605660663" ; tut:titulo "Semantic Web for Business: Cases and Applications" ; tut:autor "3" .

tut:libro0470396792 a tut:Libro ;

tut:isbn "0470396792" ; tut:titulo "Semantic Web For Dummies" ; tut:autor "4" .

tut:libro0596527349 a tut:Libro ;

tut:isbn "0596527349" ; tut:titulo "Information Architecture for the World Wide Web: Designing Large-Scale Web Sites" ; tut:autor "5" .

Formatos

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 58

<div> My name is Bob Smith, but people call me Smithy. Here is my home page: <a href="http://www.example.com">www.example.com</a>. I live in Albuquerque, NM and work as an engineer at ACME Corp. My friends: <a href="http://darryl-blog.example.com">Darryl</a>, <a href="http://edna-blog.example.com">Edna</a> </div>

<div xmlns:v="http://rdf.data-vocabulary.org/#" typeof="v:Person"> My name is <span property="v:name">Bob Smith</span>, but people call me <span property="v:nickname">Smithy</span>. Here is my homepage: <a href="http://www.example.com" rel="v:url">www.example.com</a>. I live in <span rel="v:address"> <span typeof="v:Address"> <span property="v:locality">Albuquerque</span>, <span property="v:region">NM</span> </span></span> and work as an <span property="v:title">engineer</span> at <span property="v:affiliation">ACME Corp</span>. My friends: <a href="http://darryl-blog.example.com" rel="v:friend">Darryl</a>, <a href="http://edna-blog.example.com" rel="v:friend">Edna</a> </div>

HTML

RDFa (RDF dentro de

HTML)

30

Formatos

� Conversores ◦  http://rhizomik.net/rdf123 �  de hoja de cálculo (cvs) a RDF/XML

◦  http://simile.mit.edu/babel/

◦  http://rhizomik.net/html/redefer/rdf2html-form/ �  RDF a HTML + RDFa

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 59

Vocabularios

� Representan esquemas de ontologías � Crear los vocabularios propios utilizando ◦ RDF Vocabulary Description Language (RDF

Schema) �  Vocabularios de poco peso

◦ Web Ontological Language (OWL) �  Altamente expresivos y con capacidad de inferencia

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 60

31

Vocabularios �  Reutilizar términos ya definidos para representar la

información �  Friend-of-a-Friend (FOAF), para describir personas �  Dublin Core (DC), define atributos generales de metadatos �  Semantically-Interlinked Online Communities (SIOC), vocabulario

para representar comunidades online �  Description of a Project (DOAP), para describir proyectos �  Simple Knowledge Organization System (SKOS), para representar

taxonomías y conocimiento poco estructurado �  Music Ontology, para describir artistas, álbumes y canciones �  Review Vocabulary, para representar revisiones �  Creative Commons (CC), para describir términos de licencias

◦  Lista de vocabularios conocidos �  http://www.w3.org/wiki/TaskForces/CommunityProjects/LinkingOpenData/CommonVocabularies

�  Definir nuevos términos/vocabularios con RDF Schema y OWL

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 61

Vocabularios FOAF

�  FOAF (Friend-of-A-Friend) ◦  Descripciones RDF publicadas como datos entrelazados en

la Web, formando una red de personas ◦  Describen personas, grupos, documentos, etc. ◦  Proyecto Foaf-project (http://www.foaf-project.org) ◦  FOAF Vocabulary Specification 0.98 �  http://xmlns.com/foaf/spec/

◦  Forma de describirse a uno mismo �  Nombre, email, web, personas conocidas, etc.

◦  FOAF-a-matic �  Aplicación simple Javascript que permite crear un descripción FOAF �  http://www.ldodds.com/foaf/foaf-a-matic

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 62

32

Vocabularios FOAF �  FOAF Core ◦  Clases y propiedades

para describir a personas o grupos

�  Social Web

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 63

http://xmlns.com/foaf/spec/

Vocabularios FOAF

� Propiedades

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 64

Propiedad Descripción

foaf:name the (complete) name of the Person

foaf:title the title of the Person, e.g. Mr, Mrs, Dr, etc

foaf:firstName the person’s "first name"

foaf:surname the person’s surname or family name

foaf:nick the person’s nick name

foaf:mbox the person’s mail box

foaf:schoolHomepage the home page of the persons school

foaf:workplaceHomepage the home page of the persons place of work

foaf:workInfoHomepage a page describing what the person does at their place of work

foaf:phone the persons phone number, specified as a fully qualified international phone number, using the tel: URL scheme

foaf:homepage the persons homepage, see also Using foaf:weblog in your FOAF file

foaf:weblog the persons weblog

33

Vocabularios FOAF �  Publicar datos FOAF ◦  Crear el fichero FOAF ◦  Preferible llamar al fichero “foaf.rdf”, para ser localizado por buscadores

como google ◦  Subirlo a una ubicación pública (página web)

�  Unirse a la comunidad FOAF ◦  Etiqueta link en página HTML

<link rel="meta" type="application/rdf+xml" title="FOAF" href="foaf.rdf" /> ◦  Referencias desde un “Amigo”

�  Incluir el namespace de RDF Schema <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#" xmlns:foaf="http://xmlns.com/foaf/0.1/">

�  Referenciar a la persona mediante seeAlso <rdfs:seeAlso rdf:resource="http://wwdireccionweb/foaf.rdf"/>

◦  Tablones de anuncios de FOAF �  Ejemplo: http://www.ldodds.com/foaf/bulletin-board.html

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 65

Vocabularios FOAF - Ejemplo

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 66

<?xml version="1.0"?> <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:rdfs=http://www.w3.org/2000/01/rdf-schema# xmlns:foaf="http://xmlns.com/foaf/0.1/"> <foaf:PersonalProfileDocument rdf:about=""> <foaf:maker rdf:resource="#me"/> <foaf:primaryTopic rdf:resource="#me"/> </foaf:PersonalProfileDocument> <foaf:Person rdf:ID="me"> <foaf:name>Pedro P. Alarcón</foaf:name> <foaf:mbox>mailto:[email protected]</foaf:mbox> <foaf:homepage rdf:resource="http://www.eui.upm.es"/> <foaf:phone rdf:resource="tel:+34 913365083"/> <foaf:based_near rdf:resource="dbpedia:Madrid"/> <foaf:knows> <foaf:Person> <foaf:name>Angel Arroyo</foaf:name> <foaf:mbox>mailto:[email protected]</foaf:mbox> <rdfs:seeAlso rdf:resource="http://www.eui.upm.es"/> </foaf:Person> </foaf:knows> </foaf:Person> </rdf:RDF>

34

Vocabularios FOAF - Ejemplo

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 67

Grafo obtenido con el validador de RDF: http://www.w3.org/RDF/Validator/direct

Vocabularios FOAF - Ejemplo

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 68

Grafo obtenido con el validador de RDF: http://www.w3.org/RDF/Validator/direct

35

4) Incluir links a otras cosas

� En función del dominio � Utilizar predicados para enlazar cosas: ◦  foaf:knows ◦  foaf:based_near ◦  foaf:homepage ◦  owl:sameAs ◦ …

� Encontrar links e incluirlos ◦ Manualmente ◦  Semi-atomáticamente

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 69

Búsqueda de links

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 70

36

Arquitectura de Publicación de LD

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 71

Linked Data en la Web

RDB to RDF Wrapper (ej. D2R)

CMS con salida RDFa (ej. Drupal)

Wrapper personalizado Linked Data

Interface Linked Data (ej. Pubby)

Servidor Web (ej. Apache)

Datos estructurados Texto

Convertidor a RDF (csv,

xml, excel, ...)

BD Relacional

Fuente de Datos (API)

Reposito- rio RDF

Ficheros RDF

Extractor de entidades (ej. Calais)

1. Preparación de datos

2. Almacenamiento de datos

3. Publicación de datos

Tipo de datos

Basado en “Linked Data: Evolving the Web into a Global Data Space” , Health & Bizer

Ficheros Estáticos RDF

�  Cantidades pequeñas de datos (ficheros FOAF) �  Se utiliza el tipo de serialización más habitual: RDF/

XML �  Ficheros con extensión .rdf �  Accesibles desde el servidor web ◦  http://www.eui.upm.es/srvoei/personal/pac/foaf.rdf

◦  http://www.eui.upm.es/srvoei/personal/pac/foaf.rdf#me

�  Dejar el RDF accesible desde la página HTML ◦  <link rel="alternate" type="application/rdf+xml" href="company.rdf">

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 72

37

RDFa

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 73

Enlaces a otras URIs

schema.org

RDFa

�  RDF embebido en HTML �  Es útil cuando se tienen plantillas de páginas HTML �  Drupal 7 lo incluye en las páginas web que genera

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 74

…………………. Interesés en investigación: <br> <span rel="foaf:interest"> <ul> <li><a href="http://dbpedia.org/resource/Database" property="dcterms:title">Database</a>, <li><a href="http://dbpedia.org/resource/Linked_Data" property="dcterms:title">Linked Data</a>, etc. </ul> </span> ………………….

38

Datos Estructurados (RDB)

� La Web como triturador de datos

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 75

Datos Estructurados

(RDB)

Datos No Estructurados

Figura de Martin Hepp, extraido de “Relational Databases to RDF”, Juan F. Sequeda

Integración de Datos

�  Muchos de los datos publicados en web están a su vez almacenados en BD relacionales

�  Las empresas almacenan la información en bases de datos muchas veces heterogéneas

�  La integración de BD relacionales es complicada ◦  Fusión de compañías, datos legados, etc. ◦  Necesario un buen conocimiento de los esquemas ◦  No se utilizan identificadores globales únicos ◦  No se pueden crear claves foráneas que relacionen “mi base

de datos con la tuya”

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 76

39

Integración de Datos

�  RDF como formato común para la integración de datos ◦  Herramientas RDB2RDF (Relational Database to RDF) ◦  Integración de diferentes tipos de fuentes de datos ◦  Especificaciones del w3c

http://www.w3.org/standards/techs/rdf#w3c_all �  R2RML: RDB to RDF Mapping Language �  A Direct Mapping of Relational Data to RDF �  R2RML and Direct Mapping Test Cases �  Use Cases and Requirements for Mapping Relational Databases to RDF

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 77

El mercado de la integración de datos es muy potente à oportunidad de negocio

RDB2RDF

�  Facilidad de RDF para integrar ◦ RDF representa grafos ◦  Integrar dos grafos diferentes �  Añadir arcos a los nodos o combinar nodos

�  Situaciones reales ◦  Integrar varias RDB ◦ Utilizar datos RDF sobre una RDB ◦  Insertar en una RDB datos que no satisfacen el

esquema de la base de datos

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 78

40

RDB2RDF Integrar varias RDB

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 79

id Name City

10 Bluth Co. Austin

11 Zevo Toys Dallas

Acme_Clients id Name City

29 Zevo Toys Dallas

30 Initech Austin

Foobar_Clients

http://db1/client10

http://db1/client11

Bluth Co.

Zevo Toys

Austin

Dallas

ex:city

ex:city

ex:name

ex:name

http://db2/client29

http://db2/client30

Zevo Toys

Initech

Dallas

Austin

ex:city

ex:city

ex:name

ex:name

Relational Databases to RDF”, Juan F. Sequeda

RDB2RDF Integrar varias RDB

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 80

id Name City

10 Bluth Co. Austin

11 Zevo Toys Dallas

Acme_Clients id Name City

29 Zevo Toys Dallas

30 Initech Austin

Foobar_Clients

http://db1/client10

http://db1/client11

Bluth Co.

Zevo Toys

Austin

Dallas

ex:city

ex:city

ex:name

ex:name

http://db2/client30

Initech Austin

ex:city ex:name

Relational Databases to RDF”, Juan F. Sequeda

41

RDB2RDF Visión Global

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 81

Relational Databases to RDF”, Juan F. Sequeda

RDB2RDF Ejemplo

ID city state

18 Cambridge MA

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 82

CREATE TABLE Addresses ( ID INT, city CHAR(10), state CHAR(2), PRIMARY KEY(ID) ); CREATE TABLE People ( ID INT, fname CHAR(10), a ddr INT, PRIMARY KEY(ID), FOREIGN KEY(addr) REFERENCES Addresses(ID) ); INSERT INTO Addresses (ID, city, state) VALUES (18, 'Cambridge', 'MA'); INSERT INTO People (ID, fname, addr) VALUES (7, 'Bob', 18); INSERT INTO People (ID, fname, addr) VALUES (8, 'Sue', NULL)

ID fname dir

7 Bob 18

8 Sue NULL

People

Addresses

Esquema RDB

Tuplas a tripletas

Identificador de tupla

atributo

Valor de atributo

Sujeto

Predicado

Objeto

URI Nombre tabla +

Valor clave principal

42

RDB2RDF Ejemplo

ID city state

18 Cambridge MA

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 83

CREATE TABLE Addresses ( ID INT, city CHAR(10), state CHAR(2), PRIMARY KEY(ID) ); CREATE TABLE People ( ID INT, fname CHAR(10), a ddr INT, PRIMARY KEY(ID), FOREIGN KEY(addr) REFERENCES Addresses(ID) ); INSERT INTO Addresses (ID, city, state) VALUES (18, 'Cambridge', 'MA'); INSERT INTO People (ID, fname, addr) VALUES (7, 'Bob', 18); INSERT INTO People (ID, fname, addr) VALUES (8, 'Sue', NULL)

@base <http://foo.example/DB/> @prefix xsd: <http://www.w3.org/2001/XMLSchema#> . <People/ID-7> rdf:type <People> . <People/ID-7> <People#ID> 7 . <People/ID-7> <People#fname> "Bob" . <People/ID-7> <People#addr> 18 . <People/ID-7> <People#ref-addr> <Addresses/ID-18> . <People/ID-8> rdf:type <People> . <People/ID-8> <People#ID> 8 . <People/ID-8> <People#fname> "Sue" . <Addresses/ID-18> rdf:type <Addresses> . <Addresses/ID-18> <Addresses#ID> 18 . <Addresses/ID-18> <Addresses#city> "Cambridge" . <Addresses/ID-18> <Addresses#state> "MA" .

ID fname dir

7 Bob 18

8 Sue NULL

People Addresses

RDB RDF

¿Valores nulos?

RDB2RDF Ejemplo 1

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 84

ID city state

18 Cambridge MA

ID fname dir

7 Bob 18

8 Sue NULL

People Addresses

http://../People/id=7 http://../Addresses/id=18

MA

Cambridge

Bob

People#fname

People#address Addresses#city

Addresses#state

Ex:People Ex:Addresses People#address

rdf:type rdf:type

String

String Addresses#city

Addresses#state String

People#fname

RDFS/OWL

RDF

43

RDB2RDF Ejemplo 1

�  ¿Cómo consultar los datos RDF? ◦  SPARQL ◦  Ejemplo �  Obtener las personas de Cambridge

PREFIX cli: <http://../People#>PREFIX a: <http://../Addresses#>

SELECT ?nameWHERE{?person cli:fname ? name .?person cli:address ?addr .

?addr a:city “Cambridge”.}

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 85

RDB2RDF �  SPARQL Federation

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 86

RDB

RDB2RDF

RDB

RDB2RDF

RDB

RDB2RDF

SELECT ?a WHERE{ … }

Relational Databases to RDF”, Juan F. Sequeda

44

RDB2RDF

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 87

RDB

SPARQL

RDF

SQL

Resultados SQL

Resultados SPARQL

Mapping

Basado en: “Relational Databases to RDF”, Juan F. Sequeda

Dificultad en mantener la consistencia

RDB2RDF Sistemas

�  Sistemas/herramientas RDF

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 88

Tool D2R Server http://www4.wiwiss.fu-berlin.de/bizer/d2rq/

Virtuoso RDF Views http://virtuoso.openlinksw.com/dataspace/dav/wiki/Main/VOSSQLRDF

Triplify http://triplify.org/Overview

SquirrelRDF http://jena.sourceforge.net/SquirrelRDF/

R2O http://mayor2.dia.fi.upm.es/oeg-upm/index.php/en/downloads/9-r2o-odempaster

Spyder http://www.revelytix.com/content/spyder

Ultrawrap http://ribs.csres.utexas.edu/ultrawrap/

45

RDB2RDF Estado actual �  El W3C RDB2RDF Working Group estándares: ◦  R2RML: RDB to RDF Mapping Language ◦  A Direct Mapping of Relational Data to RDF

�  Los sistemas Spyder and Ultrawrap siguen el estándar en elaboración

�  Los benchmarks realizados hasta el momento para medir el rendimiento de sistemas RDB2RDF con SGBDRs muestran que los RDB2RDF son todavía lentos y necesitan más optimización ◦  El rendimiento de Ultrawrap es casi comparable a sistemas

SQL

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 89

  Herramientas de modelado y transformación a RDF   Estudios sobre restricciones de modelos de datos a RDF como claves, nulos, etc.   Benchmarks RDF y RDB

Publicando Linked Data �  De bases de datos relacionales a Linked Data ◦  D2RQ ◦  Triplify ◦  Virtuoso ◦  Ultrawrap ◦  …

�  Repositorios RDF nativos ◦  Sesame ◦  Jena ◦  Owlim ◦  Talis Platform

�  Gestores de contenidos tipo Drupal 7 �  RDFa �  Foaf en HTML

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 90

46

BD Relacionales a Linked Data �  D2RQ ◦  http://d2rq.org ◦  Open Source software and published under the Apache license ◦  System for accessing relational databases as virtual, read-only RDF

graphs. It offers RDF-based access to the content of relational databases without having to replicate it into an RDF store �  query a non-RDF database using SPARQL �  access the content of the database as Linked Data over the Web �  create custom dumps of the database in RDF formats for loading

into an RDF store �  access information in a non-RDF database using the Apache Jena

API

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 91

BD Relacionales a Linked Data

�  Triplify ◦  http://triplify.org ◦  GNU Lesser General Public License ◦  Based on the definition of relational database queries for a specific

Web application in order to retrieve valuable information and to convert the results of these queries into RDF, JSON and Linked Data

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 92

47

BD Relacionales a Linked Data �  Virtuoso Universal Server ◦  http://virtuoso.openlinksw.com ◦  Open source edition ◦  Multi-model data server for data management, access, and

integration. ◦  Covers the following areas: �  Relational Data Management �  RDF Data Management �  XML Data Management �  Free Text Content Management & Full Text Indexing �  Document Web Server �  Linked Data Server �  Web Application Server �  Web Services Deployment (SOAP or REST)

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 93

BD Relacionales a Linked Data

� Ultrawrap ◦  http://www.capsenta.com ◦  Comercial

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 94

  SPARQL execution as fast as SQL   Customizable mapping through a GUI

and SQL   Supports W3C's R2RML and Direct

Mapping   Automatic Translation of Relational

Data to RDF   Automatic Translation of SQL Schema

to OWL   Integrated Linked Data and SPARQL

end point

48

Repositorios RDF nativos

�  Sesame ◦  http://www.openrdf.org ◦  BSD-style license ◦  De-facto standard framework for processing RDF data ◦  Includes parsers, storage solutions (RDF databases a.ka.

triplestores), reasoning and querying, using the SPARQL query language ◦  Offers a flexible and easy to use Java API that can be

connected to all leading RDF storage solutions ◦  Supports all main stream RDF file formats, including RDF/

XML, Turtle, N-Triples, TriG and TriX

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 95

Repositorios RDF nativos

�  Jena ◦  http://jena.apache.org ◦  A free and open source Java framework for building

semantic web and Linked Data applications ◦  RDF �  RDF API: create and read RDF graphs. �  ARQ: a SPARQL engine that supports remote federated queries

◦  Triple Store �  TDB: triple store persistence

�  Fuseki: to expose triples as a SPARQL end-point accessible over HTTP

◦  OWL �  Ontology API: adding extra semantics to your RDF data �  Inference API: to configure inference rules or use OWL and RDFS reasoners

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 96

49

Repositorios RDF nativos

� Owlim ◦  http://www.ontotext.com/owlim ◦  Family of semantic repositories, or RDF database

management systems �  native RDF engines, implemented in Java �  delivering full performance through both Sesame and Jena �  robust support for the semantics of RDFS y OWL �  best scalability, loading and query evaluation performance

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 97

Publicando Linked Data �  Almacenamiento de tripletas ◦  OpenLink Virtuoso

�  http://virtuoso.openlinksw.com

◦  4Store �  http://4store.org

◦  Apache Jena TDB �  http://jena.apache.org

◦  AllegroGraph �  http://www.franz.com/agraph/allegrograph/

�  Librerías para manejar RDF ◦  Java: Jena / Sesame ◦  Python: RDFlib ◦  Ruby: RDF.rb ◦  C/C++: Redland

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 98

50

Publicando Linked Data

�  Navegadores Linked Data ◦  Permiten explorar Linked Data y navegar entre conceptos ◦  Ejemplo: Tabulator �  http://www.w3.org/2005/ajar/tab �  Extensión del navegador Firefox

�  Buscadores Linked Data ◦  Buscan datos entre datasets Linked Data ◦  Ejemplos: �  Sindice: http://sindice.com

�  Watson...

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 99

Publicando Linked Data

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 100

  Búsqueda por url   Sparql   Enviar   Analizar estructura de datos   Análisis (estadísticas)

51

Publicando Linked Data

� Open Refine ◦  Ex-Google Refine (since 2012) ◦  Free, open source ◦  Powerful tool for working with messy data, cleaning it,

transforming it from one format into another, extending it with web services, and linking it to databases like Freebase ◦  Freebase: �  Large collaborative knowledge base, on-line collection of

structured data �  RDF endpoint (data is available for commercial and non-

commercial use) �  MQL (Metaweb Query Language) analogous to Sparql-Rdf

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 101

Publicando Linked Data �  Repositorios RDF nativos

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 102 “Publishing Linked Data”, Juan F. Sequeda

Comerciales Oracle Garlik – 4store Systap – BigData Ontotext – BigOwlim Openlink – Virtuoso Franz – AllegroGraph Ontobroker - Ontoprise …

Open Source Jena Sesame Mulgara …

Linked Data en Cloud

Kasabi (Talis) beta.kasabi.com

Dydra dydra.com

Pubby Linked Data frontend para SPARQL endpoints http://www4.wiwiss.fu-berlin.de/pubby/

52

Publicando Linked Data �  Linked Data Testing ◦  Vapour Linked Data Validator

�  http://idi.fundacionctic.org/vapour ◦  RDF:Alerts

�  http://swse.deri.org/RDFAlerts/ ◦  Sindice Inspector

�  http://inspector.sindice.com/ ◦  cURL

�  http://richard.cyganiak.de/blog/2007/02/debugging-semantic-web-sites-with-curl/

◦  Firefox Plugins �  Live HTTP Headers

https://addons.mozilla.org/af/firefox/addon/live-http-headers/ �  Modify Headers

https://addons.mozilla.org/af/firefox/addon/modify-headers/ ◦  Linked Data browsers

�  http://browse.semanticweb.org/

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 103

“Publishing Linked Data”, Juan F. Sequeda

Publicando Linked Data

�  La web se transforma en una gran Base de datos “global”

�  ¿Cómo consultar estos datos? ◦  SPARQL �  Recomendación del W3C �  http://www.w3.org/TR/rdf-sparql-query/

2014 © Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 104

Datos en la Web

Expuestos como RDF

Enlazados con otros datos

53

Publicando Linked Data �  SPARQL endpoints ◦  Servicio REST (GET, POST, PUT) ◦  Proporciona acceso a conjuntos de datos LD ◦  El dataset LD ofrece el servicio de procesamiento SPARQL ◦  Ejemplos �  Dbpedia

�  http://dbpedia.org/sparql �  UK Government

�  http://data.gov.uk/sparql �  USA Government

�  http://semantic.data.gov/sparql �  Musicbrainz

�  http://dbtune.org/musicbrainz/sparql

◦  Interfaz web: SNORQL

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 105

Publicando Linked Data �  dbpedia ◦  Explorador SparQL ◦  http://dbpedia.org/sparql/

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 106

54

Publicando Linked Data �  Snorql ◦  Explorador SparQL ◦  http://data.semanticweb.org/snorql/

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 107

Publicando Linked Data

� No confundir

� Linked Data (Datos enlazados)

� Open Data (Datos abiertos)

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 108

55

Publicando Linked Data Linked Open Data

� Abierto, enlazado... pero no es usable �  Se necesitan: ◦  Sistemas usables que utilicen los datos vinculados ◦  Formas sencillas para búsquedas complejas (es

necesario conocer la estructura para extraer todo el potencial informativo) �  SPARQL Endpoint ◦  Ayuda sobre cómo se puede buscar, qué se puede

encontrar ◦  Explotación gráfica y navegabilidad de los datos

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 109

“Linked Data y Patrimonio Cultural”. Francisca Hernández

Referencias utilizadas �  “Oportunidades de la Web de Datos (Linked Data) en España” Oscar Corcho,

José Manuel Gómez, Asunción Gómez, Ontology Engineer Group, Facultad Informática UPM

�  “Publishing Linked Data”, Juan F. Sequeda. Semantic Technology Conference, June 2011

�  “Relational Databases to RDF”, Juan F. Sequeda. Oportunidades de la web de datos (Linked Data) en España, Cursos de verano UPM 2011.

�  “http://www.w3.org/2001/sw/rdb2rdf/,” W3C �  “Linked Data: Evolving the Web into a Global Data Space”, Heath & Bizer �  “Linked Data in Use”, Guillermo Álvaro Rey. Oportunidades de la web de

datos (Linked Data) en España, Cursos de verano UPM 2011. �  Tom Heath, Talis, 2009 �  “Web 3.0: la tercera década de la web”, Dolors Reig Hernández , 2009 �  “Web 1.0, Web 2.0 y Web 3.0”, Eugenio Rodríguez Nieto, �  “Linked Data y Patrimonio Cultural”. Francisca Hernández. Oportunidades de

la web de datos (Linked Data) en España, Cursos de verano UPM 2011. �  http://www.cambridgesemantics.com/semantic-university

2014 ©Pedro P. Alarcón Gestión de Datos, Información y Servicios en Innovación 110