Open Data turismo
Transcript of Open Data turismo
tourGUNE Journal of Tourism and Human Mobility, issue 1, year 2013
1
Open Data en turismo
Serna, Ainhoaα
; Gerrikagoitia, Jon Kepaβ
; Murua, Idoiaγ; López-de-Ipiña, Diego
δ
α Mondragon Unibertsitatea, Goiru kalea 2, 20500 Arrasate-Mondragón, Spain
β Competence Research Centre in Tourism, CICtourGUNE, Mikeletegi Pasealekua 71, Donostia - San Sebastián
20009, Spain
γ TECNALIA, Parque Tecnológico de Bizkaia, Ibaizabal Bidea, Edificio 202, Zamudio 48170, Spain
δ Deusto Institute of Technology, DeustoTech, University of Deusto, 48007 Bilbao, Spain
Resumen
La gestión eficiente de los datos y la
información es fundamental para la
economía global. Con la apertura de datos
desde el gobierno se presenta una
oportunidad única para explotarlos
reutilizándolos y vinculándolos a la nube
de datos Linked Open Data. Esta
investigación analiza los múltiples datasets
publicados en Open Data por el Gobierno
Vasco, de vital interés en el dominio
turístico.
Palabras clave: Open Data, Open
Government Data, Linked Open Data, Open
Data Euskadi, Economía de Datos
Abstract
The efficient management of data and
information is critical to the global
economy. The opening of data from the
government presents a unique opportunity
to exploit in terms of reusing and linking to
the Linked Open Data Cloud. This research
analyzes the multiple Open Data datasets
published by the Basque Government
which are really interesting in the tourism
domain.
Keywords: Open Data, Open Government
Data, Linked Open Data, Open Data
Euskadi, Data Economy
1. Economía de datos en turismo
El primer pilar de la gestión de destinos es
la capa de datos. La situación actual en
Euskadi nos presenta un escenario con un
número importante de activos en forma de
datos públicos. En este sentido se propone
dar impulso a iniciativas como ODE1 (Open
Data Euskadi) y aprovechar recursos
públicos [Chun et al, 2010; Marcos-Martín
and Soriano-Maldonado, 2011; Ramírez-
Alujas, 2011] como el Observatorio Turístico
de Euskadi o el EUSTAT. La apertura y
enriquecimiento de los diferentes orígenes
de datos, que recogen información sobre
recursos del destino, datos del sector
[Serna et al., 2013; Larrinaga et al., 2013] y
huella digital de los visitantes en forma de
opiniones y tracking espacio-temporal
conforma la piedra angular de la gestión de
destinos basada en el conocimiento.
La gestión eficiente del ODE convertido a
LOD2 (Linked Open Data) [Bizer, 2007; Bizer
et al., 2008; Bizer et al, 2009; Heath and
Bizer, 2011; Ermilov and Auer, 2013] y
metadatos en los campos de la
administración pública y la industria es
Serna et al.
tourGUNE Journal of Tourism and Human Mobility, issue 1, year 2013
2
clave [Ding et al., 2010a; 2010b]. Con una
combinación de métodos y tecnologías de
software social, las organizaciones pueden
beneficiarse y alcanzar una ventaja
competitiva.
La mayoría de los sistemas de hoy tratan
con grandes cantidades de información. Sin
embargo, aunque las capacidades
computacionales sean grandes, la mayor
parte de la complejidad con la que se está
luchando es causada sobre todo por
deficiencias estructurales. En lugar de ser
fáciles de encontrar los datos y de
enlazarlos con otros, aún permanecen
ocultos. Linked Data, con su claro enfoque
en la gestión de metadatos de alta calidad
es clave para superar este problema [Iqbal
and Hausenblas, 2013; Costa et al, 2013]. El
valor de los datos aumenta cada vez que
están siendo reutilizados y vinculados a
otros recursos. La reutilización de los datos
sólo se puede desencadenar
proporcionando la información adecuada
acerca de la información disponible.
La gestión eficiente de los datos y la
información es fundamental para la
economía mundial/global. En particular,
teniendo en cuenta el explosivo crecimiento
de los datos generados por el usuario UGC
(User Generated Content), en redes sociales,
de viajeros, blogs, etc. El intercambio de
conocimientos y datos puede asegurar una
toma de decisiones mejor y la gestión de
estos datos, puede asegurar un mayor
desarrollo de proyectos de gran alcance y
promover mecanismos de financiación
efectivos para el turismo.
Hoy en día, Open Government Data3 (OGD)
[Robinson et al., 2009; Huijboom and Van
den Broek, 2011] se está convirtiendo en un
importante movimiento en el intercambio
de conocimientos. El movimiento OGD tiene
el poder para impulsar una mayor
transparencia [Lathrop and Ruma, 2010],
para permitir la colaboración entre los
stakeholders, y por último, pero no menos
importante para impulsar nuevas
actividades económicas.
La tecnología actual que permite e impulsa
el OGD se conoce como Linked Open Data
(LOD).
Actualmente, Internet hace disponible la
riqueza del conocimiento humano para
cualquier persona en cualquier lugar. Desde
la perspectiva del turismo, esto hace que
Internet sea de las herramientas más
potentes de capacidad de creación. El
desafío es cómo clasificar y utilizar
eficazmente el creciente volumen de
información disponible.
Linked Open Data (LOD) es un movimiento
creciente de organizaciones para hacer que
los datos de las mismas estén disponibles
en un formato legible por máquinas
(machine-readable). Se trata de una
integración a gran escala de datos y
razonamiento sobre los mismos, gracias al
empleo de RDF como lenguaje de formateo,
des-referenciando URIs para su
identificación y empleando el protocolo
HTTP para acceder a esos datos. Para que
estos datos sean entendibles por las
máquinas (y por tanto ser procesados),
aparecen las ontologías, que dan sentido a
los datos y que representan el conocimiento
del dominio al que pertenecen los datos.
Esto permite a los usuarios, crear y
combinar conjuntos de datos y hacer sus
propias interpretaciones de los datos
disponibles en formatos de fácil proceso y
consumo [LombardiI, 2013; Mitchell, 2013].
La gestión eficiente del LOD y metadatos en
los campos de la administración pública y la
industria es clave. La progresiva adopción
de los principios de LOD nos permitirá
progresar desde la web de documentos
actual a la web de datos (Web of Data)
futura, donde tanto los usuarios finales
como agentes software que los representan
Serna et al.
tourGUNE Journal of Tourism and Human Mobility, issue 1, year 2013
3
puedan explotar por igual los datos en la
Web.
Se pretende destacar las potencialidades y
beneficios del LOD, identificando los data
sets públicos linkados en el Linking Open
Data cloud diagram (CLOD) así como los
publicados en Open Data Euskadi, de
interés para el dominio del turismo.
En el siguiente apartado se describe en
profundidad el movimiento Open
Government y Open Government Data.
Posteriormente en el apartado 3 se muestra
la clasificación de los data sets en Linked
Open Data y a continuación se detalla el
proyecto Open Data Euskadi haciendo un
exhaustivo examen de los posibles data sets
de interés para el dominio del turismo. Por
último en el apartado 5, se exponen las
conclusiones y líneas futuras.
2. Open Government y Open
(Government) Data
Cuando hablamos de Open Government,
nos referimos a un movimiento que fue
iniciado por ‘The Memorandum on
Transparency and Open Government’4 (La
Directiva de Transparencia), un memorando
firmado por el presidente de EE.UU. Barack
Obama, poco después de su toma de
posesión en enero del 2009. La idea básica
de Open Government es el establecimiento
de una moderna cooperación entre los
políticos, la administración pública, la
industria y los ciudadanos al permitir una
mayor transparencia, democracia,
participación y colaboración.
En los países europeos, el concepto Open
Government se ve a menudo como un
compañero natural del concepto e-
government2.
El consorcio del Open Government se puso
en marcha el 20 de septiembre, del 2011,
cuando los ocho gobiernos fundadores
(Brasil, Indonesia, México, Noruega,
Filipinas, Sudáfrica, Reino Unido [Sheridan
et al., 2010], Estados Unidos) aprobaron
una declaración de gobierno abierto (OG),
anunciando sus planes de acción y
acogieron con satisfacción el compromiso
de 38 gobiernos a unirse a la asociación.
En septiembre de 2011, hubo 46
compromisos de gobiernos nacionales para
un gobierno abierto en todo el mundo.
Algunas de las características más
importantes para un Open Government son:
el libre acceso a la información y la
posibilidad de utilizar y reutilizar
libremente esta información (por ejemplo,
datos, contenidos, etc.) Después de todo,
sin información no es posible establecer
una cultura de colaboración y participación
entre las partes interesadas. Por lo tanto, el
OGD se ve a menudo como un aspecto
crucial de OG.
OGD es un movimiento mundial para abrir
los datos de la administración pública/ el
gobierno, la información y el contenido
tanto para humanos como para ser legible
por las máquinas (machine-readable)
usando formatos no propietarios para la
reutilización de la sociedad civil, la
economía, los medios de comunicación y el
sector académico, así como por los políticos
y administradores públicos.
Esto se aplicaría únicamente a los datos y la
información producida o por encargo de las
entidades del gobierno o controladas por el
gobierno y no está relacionado a los datos
de las personas.
Ser abierto (open) significa la reducción de
barreras para asegurar la más amplia re-
utilización posible, por cualquier persona.
Con OGD, ha entrado en vigor un nuevo
paradigma para la publicación de los datos
del gobierno que invita a todos a ver,
disponer y gestionar.
El término frecuentemente usado de Open
Data [Auer et al, 2007] se refiere a los datos
e información más allá de las instituciones
gubernamentales e incluye a otros grupos
Serna et al.
tourGUNE Journal of Tourism and Human Mobility, issue 1, year 2013
4
de interés relevantes, tales como,
empresas/industria, ciudadanos, las ONL
(organización sin ánimo de lucro) y las ONG
(organización no gubernamental), ciencia o
educación.
Algunas de las instituciones más conocidas
en la actualidad que realizan actividades de
open data incluyen el Banco Mundial5, las
Naciones Unidas6, REEEP7, the New York
Times8, The Guardian9 y Open Knowledge
Foundation (OKFN)10.
En 2007, 30 defensores de OG se reunieron
en Sebastopol, California, EE.UU. para
desarrollar un conjunto de principios10 OGD,
dónde se destacó por qué OGD es esencial
para la democracia. En 2010, the Sunlight
Foundation11 lo amplió a 10 principios.
Aunque estos principios no son ni
inamovibles, ni jurídicamente vinculantes,
son considerados ampliamente por la
comunidad mundial de OGD como una guía
general sobre el tema.
Government Data se consideran open si los
datos se hacen públicos de una manera que
cumpla con los siguientes principios:
1. Los datos deben estar completos
Todos los datos se ponen a disposición del
público. El término datos se refiere a la
información almacenada electrónicamente
o grabaciones, incluyendo pero no limitado
a los documentos, bases de datos,
transcripciones y grabaciones
audio/visuales. Los datos públicos son datos
que no están sujetos a las limitaciones
vigentes de privacidad, seguridad o
privilegio, que se rige por otras leyes.
2. Los datos deben ser básicos, primarios
Los datos se publican como se recogen en la
fuente, con el nivel de granularidad más
fina posible, y no en las formas agregadas o
modificadas.
3. Los datos deben ser oportunos
Los datos están disponibles tan
rápidamente como sea necesario para
preservar el valor de los datos.
4. Los datos deben ser accesibles.
Los datos están disponibles para la gama
más amplia de usuarios para la más amplia
gama de propósitos.
5. Los datos deben ser procesables por
máquina
Los datos se estructuran de manera que
puedan ser procesados en una forma
automatizada.
6. El acceso debe ser no discriminatorio
Los datos están disponibles a cualquier
persona, sin necesidad de registro.
7. Los formatos de datos deben ser ‘no
propietarios’
Los datos están disponibles en un formato
sobre el que ninguna entidad tiene un
control exclusivo.
8. Los datos deben ser de licencia libre
Los datos no están sujeto a derechos de
autor copyright, patentes, marcas
registradas, etc.
El cumplimiento de estos principios debe
ser revisado a través de los medios
siguientes:
- Se debe designar una persona de
contacto para responder a la gente
que trate de utilizar los datos, o
- Se debe designar una persona de
contacto para responder a quejas
sobre violaciones de los principios,
o
- Un tribunal administrativo o judicial
debe tener la jurisdicción para
revisar si la agencia ha aplicado
estos principios apropiadamente.
Los dos principios añadidos por the Sunlight
Foundation son los siguientes:
9. Permanencia
La permanencia se refiere a la capacidad de
encontrar información a lo largo del tiempo,
perdurable.
10. Los costos de uso
Uno de los mayores obstáculos para el
acceso a la información disponible
Serna et al.
tourGUNE Journal of Tourism and Human Mobility, issue 1, year 2013
5
públicamente es el coste impuesto a los
ciudadanos para el acceso - incluso cuando
el costo es de mínimos.
Se ha reconocido que el movimiento de la
OGD en todo el mundo se originó en
Australia, Nueva Zelanda, Europa y América
del Norte, pero hoy en día también existe
un fuerte compromiso OGD de actividad en
Asia, América del Sur y África. Por ejemplo,
Kenia, comenzó con el primer portal12 de
datos de África en julio de 2011.
La Comisión Europea (CE) también ha
puesto el asunto como un tema principal de
su agenda y está impulsando activamente el
OGD en Europa. Neelie Krose, Vice-
Presidenta de la Comisión Europea
responsable de la Agenda Digital, ha
declarado su firme compromiso con la OGD
a través del anuncio de un portal de datos
de la CE a principios de 2012 y por un
portal de datos que actúe como un único
punto de acceso para todos los portales
europeos de datos nacionales para el año
2013. Open Data es una parte importante
de ambos la Agenda Digital para Europa13 y
el Plan de Acción europeo de e-
government14 del 2011-2015. En diciembre
del 2011, la CE, además, anunció su
estrategia de Open Data para Europa:
Turning Government Data into Gold15.
Los actuales países líderes en las iniciativas
y actividades nacionales de Open Data son
sin duda los gobiernos de los Estados
Unidos de America16 y Australia17, los países
escandinavos y el gobierno del Reino
Unido18.
Todos estos países tienen un compromiso
político alto tanto con Open data como con
los portales centrales de Open Data y
además todos éstos tienen una comunidad
fuerte de Open Data. Estos países
innovadores y las personas detrás de ellos
pueden ser considerados como los pioneros
de la OGD.
Dos recursos muy buenos sobre el
movimiento de la OGD en todo el mundo
son los siguientes:
- SWC mapa mundial de las iniciativas de
Open Data, actividades y portales19.
- OKFN lista completa de los catálogos de
datos realizada por expertos de todo el
mundo20.
En esta línea, uno de los proyectos
pioneros, más activos y conocidos es el
desarrollado por el Gobierno del País Vasco,
el Open Data Euskadi, parte integrante de
su iniciativa de Gobierno Abierto, Irekia.
Open Data Euskadi cuenta con cientos de
conjuntos de datos de gran utilidad, que
incluyen una extensa colección de datos
asociados al turismo desempeñando un
papel fundamental en el enriquecimiento
de los datos.
Es el portal de acceso a los datos públicos
del Gobierno Vasco en formato reutilizable.
Entre sus objetivos destacan el generar
valor y riqueza. Obteniendo productos
derivados de los datos por parte de
terceros. También el generar transparencia.
Reutilizando los datos para analizar y
evaluar la gestión pública. Por último,
facilitar la interoperabilidad entre
administraciones. Creando servicios que
utilicen datos de diferentes
administraciones. En la Figura 1, se aprecia
el mapa mundial de las iniciativas de Open
Data y la iniciativa Open Data Euskadi.
Serna et al.
tourGUNE Journal of Tourism and Human Mobility, issue 1, year 2013
6
Figura 1: Mapa mundial de las iniciativas de Open Data
3. Linked Open Data: clasificación de los
data sets
En LOD los data sets [Umbrich et al., 2010]
se clasifican en los siguientes ámbitos
temáticos: geográficos, gobierno, medios
de comunicación, bibliotecas, ciencias de la
vida, comercio, el contenido generado por
el usuario y conjuntos de datos entre
dominios (cross-domain). La Tabla 1, da
una visión general del número de tripletas
actualmente, así como el número de
enlaces RDF por dominio. Los datos son
extraídos del documento ‘State of the LOD
Cloud’21, dicho documento recoge el
resumen de las estadísticas sobre los
conjuntos de datos que se catalogan
dentro del LOD Cloud Data Catalog de
CKAN.
Tabla 1:
Estado de la nube Linked Open Data
Dominio Nº datasets Tripletas % Out-Links %
Media 25 1,841,852,061 5.82 50,440,705 10.01
Geographic 31 6,145,532,484 19.43 35,812,328 7.11
Government 49 13,315,009,400 42.09 19,343,519 3.84
Publications 87 2,950,720,693 9.33 139,925,218 27.76
Cross-domain 41 4,184,635,715 13.23 63,183,065 12.54
Life sciences 41 3,036,336,004 9.60 191,844,090 38.06
User-generated content 20 134,127,413 0.42 3,449,143 0.68
Total 295 31,634,213,770 503,998,829
Como se puede apreciar en la Tabla 1, el
número de datos (volumen de tripletas) en
el dominio geográfico y en medios de
comunicación así como cross-domain es
muy significativo.
Es importante remarcar que a pesar de que
las publicaciones tengan un mayor número
de data sets que el resto de dominios, son
los datos gubernamentales, los que
disponen de mayor número de tripletas.
Esto puede deberse al movimiento Open
Government Data, donde la premisa básica
es la apertura de datos de propiedad
pública e información de las instituciones
gubernamentales.
Todos estos datos (una vez identificados
cuales serían los más significativos en el
ámbito de turismo), se pueden reutilizar,
ya que estos datos están publicados en el
modelo de datos RDF. Se pueden consumir
y enlazar los datos de Linked Data con los
datos de que se dispone en ODE (Open
Serna et al.
tourGUNE Journal of Tourism and Human Mobility, issue 1, year 2013
7
Data Euskadi), tras una previa y correcta
adecuación y transformación a RDF de los
datos de ODE.
4. Open Data Euskadi
El proyecto Open Data Euskadi (ODE) es un
proyecto influenciado por las iniciativas
pioneras de apertura de los datos
públicos22. ODE es una iniciativa
enmarcada dentro de la política de
Gobierno Abierto de Euskadi.
Es el resultado del compromiso del
Gobierno Vasco a exponer los datos
públicos que obran en su poder de forma
reutilizable, con el fin de que terceros
puedan crear servicios derivados de los
mismos.
Como consecuencia, los conjuntos de datos
expuestos se ofrecen bajo licencias de
propiedad abiertas, que permiten su
redistribución, reutilización y
aprovechamiento con fines comerciales.
Los objetivos del Gobierno Vasco eran
incorporarse a la corriente de apertura de
datos desde el gobierno (comentada en el
apartado previo), priorizar los ámbitos que
la Comisión Europea establecía e ir
facilitando la reutilización. Este último en
su parte final proponía el paso a la Web
Semántica aunque no lo implementaron.
4.1. Clasificación de los data sets de
ODE
En su primera formulación, el portal sale
con las siguientes áreas de datos:
geográficos, meteorológicos, estadísticos,
turísticos, procedimientos administrativos.
El objetivo de ODE es crecer en el número
de data sets a medida que los
Departamentos del Gobierno Vasco vayan
liberando datos en formato reutilizable.
Así, a fecha de hoy, el catálogo de datos de
ODE por tipo de dato23 está compuesto
por: Ayudas, Subvenciones y Becas,
Contrataciones Administrativas, Otros
Procedimientos Administrativos, Datos
lingüísticos, Datos geográficos,
Localizaciones, Eventos, Informes y
estudios, Recursos turísticos, Datos
meteorológicos, Noticias y notas de
prensa, Registros, Recursos humanos,
Otros: calendarios laborales, transporte
público, puestos/cargos/sueldos en el GV,
incidencias tráfico, presupuestos
generales, elecciones/referéndums
municipales/ juntas/ parlamento/
constitución/ congreso/ parlamento
europeo/ OTAN, procedimientos
electrónicos.
Si se quiere tener una visión de los datos
por temática se puede acceder al catálogo
de datos de ODE filtrando por tema y se
obtendría está clasificación:
Actividades económicas, Administración
Pública, Asuntos Sociales, Cultura, Euskera,
Educación, Medio Ambiente, Justicia,
Meteorología, Ocio y Turismo, Salud,
Seguridad e Interior, Transporte y
movilidad, Trabajo y Empleo, Urbanismo y
territorio, Vivienda.
También se pueden obtener los datos
filtrando por formato de dato, por
enumerar algunos estarían: API(XML), XML,
CSV, XLS, RSS, txt, etc.
Además, proporciona datos estadísticos
procedentes del Eustat (Instituto
Estadístico del País Vasco).
4.2. Identificación de data sets de ODE
para el turismo
Hoy por hoy, para el área de turismo
existen conjuntos de datos publicados por
el Gobierno Vasco, pero no son fácilmente
consumibles. Dentro de la Información
turística disponible en Open Data Euskadi
se encuentran los siguientes data sets:
- Alojamientos turísticos
- Restaurantes, sidrerías y bodegas
- Gastronomía
- Recursos de transporte y movilidad
Serna et al.
tourGUNE Journal of Tourism and Human Mobility, issue 1, year 2013
8
- Patrimonio y recursos culturales de
Euskadi
- Recursos turísticos para los negocios
- Recursos de ocio
- Recursos deportivos
- Zonas de compras
- Destinos turísticos
- Espacios naturales
- Oficinas de turismo
- Destinos turísticos de Euskadi
- Oficinas de información Juvenil de
Euskadi
Como fase previa, antes de publicarse y
poder ser explotados y consumidos, se
llevará a cabo un proceso de
transformación de los datos relativos al
caso de uso de turismo. Este proceso
conlleva:
- La transformación de los datos
primarios relativos a Open Data Euskadi
a Open Linked Data Euskadi.
- La adecuación y transformación de los
datos del proyecto eGIStour24 a RDF,
para enlazarse con los data sets
relevantes de LOD.
Por otro lado, el acceso a cualquier
funcionalidad de la infraestructura de
euskadi.net está encapsulado en un API
Java que permite:
- Gestionar la taxonomía de etiquetas de
catalogación común de euskadi.net.
- Trabajar con contenidos y versiones
idiomáticas: crear, borrar, modificar,
aprobar, catalogar, etc.
- Trabajar con portales o sitios web: sus
páginas y áreas visuales.
- Publicar contenidos, páginas de portal,
etc.
- Indexar en uno o varios motores de
búsqueda cualquier contenido o página
de portal.
- Buscar contenidos o páginas de portal.
Los diferentes APIs (contenidos, portal,
publicador, buscador, etiquetas de
catalogación, etc.) abstraen al
programador de la lógica de negocio
implementada en los núcleos de la
infraestructura que es donde realmente
reside la ‘inteligencia’ del sistema.
A continuación se detallan los data sets
considerados interesantes en esta
investigación.
4.2.1. Meteorología
Este data set, recoge tanto las lecturas de
meteorología diarias, así como las
predicciones semanales, la frecuencia de
actualización es en tiempo real y el
formato de los datos es XML. En este
sentido, tanto las predicciones como los
históricos pueden ser de gran importancia
para esta investigación. A continuación se
detallan las áreas de actuación
Históricos: A menudo, la movilidad humana
se ve afectada por factores humanos,
físicos y externos. Tanto los factores
humanos, como los físicos, son aquellos
que están implícitos en el destino o el
propio visitante, como puede ser la edad
del mismo o la orografía del destino entre
otros. Pero tal y como se ha especificado
anteriormente, la movilidad en ocasiones
se ve afectada por factores externos, como
puede ser la meteorología. En este sentido,
se aprecia importante, el poder usar este
data set para realizar estudios más en
profundidad de la movilidad de los
visitantes en el destino, y detectar hasta
qué punto las variaciones meteorológicas
afectan en la movilidad o no. Cabe
destacar, que el destino de Euskadi a
menudo se caracteriza por su climatología,
por esta razón, detectar la movilidad de los
visitantes en función del estado
meteorológico puede ser clave para
generar nuevas directrices válidas para la
gestión del destino.
Predicciones: Varios estudios, determinan
que la movilidad de las personas es un
fenómeno estacional. Es decir, la movilidad
Serna et al.
tourGUNE Journal of Tourism and Human Mobility, issue 1, year 2013
9
de las personas se ve determinada por la
estación del año en la que se encuentran, y
en definitiva por el estado meteorológico
del destino. El uso de este data set, puede
ser gran ayuda para ofrecer servicios
avanzados en movilidad al visitante. Hay
que tener en cuenta, que los visitantes del
futuro completaran su movilidad en
entornos conectados, por esta razón, se
pueden crear una serie de servicios en
movilidad y tiempo real, que por ejemplo
ofrezcan una serie de alternativas de visita
en función de la climatología prevista.
Por otra parte, ODE cuenta con la
predicción marítima de la costa vasca. En
este data set pueden encontrarse, además
de los datos históricos desde el año 2011,
predicciones acerca de acerca de la
temperatura del agua, visibilidad, pleamar
y bajamar.
4.2.2. Incidencias del tráfico en tiempo
real de la CAV
Detalle de las incidencias de las carreteras
de la Comunidad Autónoma de Euskadi
actualizadas en tiempo real. Los datos se
encuentran en formato XML y se detalla el
tipo de incidencia y su causa, la carretera y
el punto kilométrico en el que ocurre, el
sentido del carril afectado, además del
nivel de la misma.
La estructura del fichero XML
proporcionado se representa a
continuación en la figura 2.
Figura 2: Estructura de datos de Incidencias
Serna et al.
tourGUNE Journal of Tourism and Human Mobility, issue 1, year 2013
10
4.2.3. Recursos de transporte y movilidad
de Euskadi
Datos sobre los recursos de transporte y
movilidad de Euskadi: aeropuertos,
estaciones, puertos, aparcamientos,
autopistas, etc. La frecuencia de
actualización es anual.
ODE proporciona un API para realizar
búsquedas y acceder a sus datos. Este API,
se ofrece de dos formas:
- Un API programático en Java.
- Un API pseudo-REST, basado en
codificar los resultados de búsqueda
mediante una URL.
En ambos casos, ODE proporciona un
manual donde se explica cómo emplear
estas APIs.
4.2.4. Red de transporte público de
Euskadi: horarios, paradas, tiempo, coste y
otros datos para planificar rutas
Este conjunto de datos contiene diferentes
formas de acceder a los datos sobre la red
de transporte público de la Comunidad
Autónoma Vasca: horarios, paradas,
tiempo, coste y diversa información para
planificar rutas en cualquier medio de
transporte (uno o varios interconectados):
metro, tranvía, buses urbanos e
interurbanos, trenes de cercanías y larga
distancia, barcas, ferries, funicular, puente
colgante, ascensor. El portal Moveuskadi se
nutre de estos datos que aquí se exponen.
Para acceder a los datos se requiere
completar un formulario donde se informa
del uso que se hará de los mismos y se
acepta la licencia de reutilización de
Moveuskadi, con el objetivo de evitar su
distribución en formato original. Una vez
enviado el formulario recibes una URL para
descargar los ficheros GTFS cada vez que lo
necesitas de forma ilimitada. En el caso de
la API los datos que se entregan están en
formato XML.
4.2.5. Tráfico, aparcamientos y autobuses
de Bilbao
Aunque este data set no está incluido
oficialmente en el catálogo de datos de
ODE, se trata de un data set público y
gratuito ofrecido por el ayuntamiento de
Bilbao sobre información de la ciudad, y
que por tanto, se ha considerado
interesante.
El ayuntamiento de Bilbao participa, junto
con otras ciudades europeas (Florencia,
Múnich, Praga, Viena, Reading y Bilbao), en
el proyecto europeo Co-Cities 25. En dicho
proyecto, han desarrollado una plataforma
o conjunto de servicios Web que permiten
acceder de forma abierta y gratuita a la
fuente de datos de tráfico, autobuses y
aparcamientos de Bilbao, para generar
nuevas aplicaciones o servicios. Los
servicios Web están desarrollados con el
protocolo estándar WFS (Web Feature
Service) para acceso a información geo-
localizada.
La documentación de los servicios web se
encuentra en los siguientes entregables de
proyectos anteriores a Co-Cities y en los
que se ha basado el desarrollo:
- donde se describe el modelo de
datos Entregable D6 del proyecto
europeo eMotion26,
- Entregable ‘D3.2.1 Specification
document of In-Time server,
interfaces and protocols’ del
proyecto europeo In-Time27.
Existe una URL del CAI (Commonly Agreed
Interface) de Bilbao para acceder a estos
servicios28.
A través de esta URL y empleando los
parámetros indicados en la
documentación, se puede obtener
información de Bilbao sobre:
- Aparcamiento estático (actualización
una vez al día)
- Aparcamiento dinámico
(actualización cada 5 minutos)
Serna et al.
tourGUNE Journal of Tourism and Human Mobility, issue 1, year 2013
11
- Transporte público estático -
autobuses (actualización una vez al
día)
- Transporte público dinámico -
autobuses (actualización cada 5
minutos)
- Tráfico
4.2.6. Agenda de actividades y eventos
culturales que se realizan en la CAV
Este dataset contiene todas las actividades
que se publican en el portal Kulturklik29.
Para acceder a este dataset, ODE dispone
de una API HTTP a través de la cual se
pueden consultar los eventos publicados
para un rango concreto de fechas, el
lenguaje de los mismos, etc. La
documentación30 disponible para dicha API
es muy clara, con la única restricción de
que únicamente se pueden hacer 50
llamadas al día desde la misma dirección
IP.
5. Contenidos generados por usuarios
La ejecución de aplicaciones móviles por
los ciudadanos y visitantes puede generar
nuevos datos que enriquezcan los
conjuntos de datos ya asociados a una
zona turística. Sin embargo, la calidad de
los datos generados por los usuarios debe
ser evaluada y calificada antes de
integrarse con tales datasets. Por tanto, es
necesario promocionar aquella
información válida y confiable y
decrementar o descartar aquella
información de bajo valor o calidad. Para
este propósito, el W3C ha creado el
modelo de datos PROV [W3C, 2013] que
pretende regular el intercambio de
información sobre la procedencia de los
datos en la web. Se trata de una
especificación para expresar registros RDF
que contienen descripciones de entidades
y actividades implicadas en la producción o
influyendo un objeto dado. La procedencia
puede ser usada para muchos propósitos,
como comprender cómo los datos fueron
recogidos de modo que puedan ser usados
de un modo razonable, determinando su
propiedad y derechos sobre un objeto,
haciendo juicios sobre la información para
determinar si puede ser confiable o no,
verificando que el proceso y pasos
seguidos para obtener resultados son
compatibles con los requisitos establecidos
[Groth and Gil, 2011].
Por otro lado, la computación humana
[Bozzon et al, 2013] permite beneficiarse
de la inteligencia humana para ejecutar
tareas que de otro modo sería difícil de
conseguir por una máquina. Se pueden
utilizar diferentes técnicas para incentivar
la participación de usuarios. Por ejemplo,
juegos con un propósito (GWAP) [von-Ahn,
2006] para alentar a la gente a participar
en la computación humana a través de
incentivos de entretenimiento. Los juegos
móviles con un propósito han sido ya
utilizados para anotar y enriquecer datos
urbanos. Por ejemplo, UrbanMatch [Celino
et al, 2012a] valida enlaces entre puntos de
interés y sus fotos, mientras que
Urbanopoly [Celino et al, 2012b] añade y
valida hechos del tipo Valor-Característica-
Valor.
Como puede apreciarse, existe un gran
potencial en la generación de contenidos
generados por los usuarios, siempre que la
trazabilidad de su procedencia como
medida de asegurar su calidad es aplicada.
El objetivo final es que los datos
contribuidos por los usuarios sirvan para
enriquecer y complementar datos abiertos
enlazados, y no para adulterar o corromper
los ya existentes.
6. Conclusiones y Líneas Futuras
Para entender la visión del World Wide
Web Consortium (W3C)31 de una nueva
web de datos, hay que imaginar que la web
Serna et al.
tourGUNE Journal of Tourism and Human Mobility, issue 1, year 2013
12
es como una base de datos gigante
mundial. Si quisiéramos construir una
nueva aplicación que muestre la
correspondencia entre el crecimiento
económico, el consumo de energías
renovables, las tasas de mortalidad y el
gasto público en educación y además se
quisiera mejorar la experiencia del usuario
con mecanismos como la navegación por
facetas… todo esto se puede hacer ya, hoy
en día, pero probablemente nadie lo hará.
Ya que actualmente las medidas de
integración de información de diferentes
fuentes, así como los data mash-ups,
suponen demasiado tiempo y es muy
costoso.
Principalmente son dos factores los que
impulsan el que se provoque esta
desagradable situación. En primer lugar, las
bases de datos todavía son vistas
como ‘silos’ y los responsables de dichas
bases de datos normalmente no quieren
que otros las toquen. Esta forma de
pensar, se basa en algunos supuestos de la
década de 1970: que sólo un puñado de
expertos son capaces de tratar con bases
de datos y que sólo el círculo interno del
departamento de ‘Tecnologías de la
Información’ es capaz de entender el
esquema y el significado de los datos. Esto
ha quedado obsoleto. En la era de Internet
de hoy en día, millones de desarrolladores
son capaces de construir aplicaciones de
valor cuando consiguen datos interesantes.
En segundo lugar, los datos están aún
encerrados en ciertas aplicaciones. El
problema técnico más común con la
arquitectura de la información actual es
que los metadatos y la información del
esquema no se separan bien desde la
lógica de la aplicación. Los datos no
pueden volver a utilizarse tan fácilmente
como debería ser. Si se deja de enfatizar en
que aplicación/es va a utilizar nuestros
datos y se centra en hacer una descripción
significativa de los datos en sí, vamos a
ganar en eficiencia a largo plazo.
En su esencia, Open Data significa que los
datos están abiertos a cualquier tipo de
aplicación y esto puede lograrse si se
utilizan estándares abiertos como RDF32
para describir los metadatos.
Hoy en día, la idea de vincular las páginas
web mediante el uso de hipervínculos es
obvia, pero se trataba de un concepto
innovador hace 20 años. Estamos en una
situación similar en la actualidad ya que
muchas organizaciones no entienden la
idea de la publicación de datos en la web, y
mucho menos por qué los datos en la web
deben ser enlazados.
Aunque la idea de Linked Open Data (LOD)
aún no se ha reconocido como la corriente
principal (como la web que todos
conocemos hoy en día), hay una gran
cantidad de LOD que ya está disponible. La
llamada LOD cloud33 cubre más de 50
millones de hechos de muchos ámbitos
diferentes como la geografía, los medios de
comunicación, biología, química,
economía, energía, etc. En el dominio de
turismo los data sets que en esta
investigación se han elegido por su
relevancia tanto por el número de tripletas,
como por el ámbito, como por el volumen
de los enlaces con otros data sets (out-
links) que es la característica que les da el
mayor potencial para ser descubiertos de
forma automática son los del dominio
media, geographic, government, cross-
domain y user-generated content. Los
datos son de calidad variable y la mayor
parte de ellos también pueden volver a
utilizarse con fines, propósitos comerciales.
Como línea futura proponemos hacer a
Euskadi pionera en este nuevo paradigma
de la Web, con la publicación de datos de
diferente naturaleza del sector turístico.
Serna et al.
tourGUNE Journal of Tourism and Human Mobility, issue 1, year 2013
13
7. Notas y/o agradecimientos
La investigación ha sido realizada en el
marco de los proyectos: Etortek SmarTUR34
liderado por CICtourGUNE35 y el Saiotek
TQM de Mondragon Unibertsitatea36.
8. Referencias
Auer, S., Bizer, C., Kobilarov, G., Lehmann,
J., Cyganiak, R. & Ives, Z. (2007). Dbpedia: A
nucleus for a web of open data. In K.
Aberer, K.-S. Choi, N. Noy, D. Allemang, K.-
I. Lee, L. Nixon, J. Golbeck, P. Mika, D.
Maynard, R. Mizoguchi, G. Schreiber & P.
Cudré-Mauroux [eds.]. Proceedings of the
6th international on the semantic web and
2nd Asian conference on Asian semantic
web conference ISWC'07/ASWC'07, Berlin-
Heidelberg: Springer, 722-735.
Bizer, C., Heath, T., & Berners-Lee, T.
(2009). Linked data-the story so far.
International Journal on Semantic Web and
Information Systems (IJSWIS), 5(3), 1-22.
Bizer, C., Heath, T., Ayers, D. & Raimond, Y.
(2007). Interlinking open data on the web.
In Demonstrations Track, 4th European
Semantic Web Conference, Innsbruck.
Bizer, C., Heath, T., Idehen, K., & Berners-
Lee, T. (2008). Linked data on the web. In Z.
Nie [ed.]. Proceedings of the 17th
international conference on World Wide
Web, Beijing: ACM, 1265-1266.
Bozzon B., Galli L., Fraternali P., Karam R.
(in press). Modeling CrowdSourcing
scenarios in Socially-Enabled Human
Computation Applications. Journal on Data
Semantics.
Celino I., Contessa S., Corubolo M.,
Dell'Aglio D., Della Valle E., Fumeo S. and
Krüger T (2012). Linking Smart Cities
Datasets with Human Computation – the
case of UrbanMatch. In D. Hutchinson et al.
[eds.]. Proceeding of the 11th International
Semantic Web Conference, LNCS 7650,
Berlin-Heidelberg: Springer, 34–49.
Celino I., Cerizza D., Contessa S., Corubolo
M., Dell'Aglio D., Della Valle E. and Fumeo
S. (2012). Urbanopoly – A Social and
Location-based Game with a Purpose to
Crowdsource your Urban Data. In R. Bilof
[ed.]. Proceedings of the the 4th IEEE
International Conference on Social Com-
putting, Workshop on Social Media for
Human Computation, Danvers: IEEE, 910-
913.
Chun, S. A., Shulman, S., Sandoval, R., &
Hovy, E. (2010). Government 2.0: Making
connections between citizens, data and
government. Information Polity, 15(1), 1-9.
Costa, T. & Leal, JP. (2013). Publishing
Linked Data with DaPress. In J.P. Leal, R.
Rocha & A. Simoes [eds.]. Proceedings of
the 2nd Symposium on Languages,
Applications and Technologies (29),
Dagstuhl: Leibniz-Zentrum fuer Informatik,
67-81.
Ding, L., DiFranzo, D., Graves, A., Michaelis,
J. R., Li, X., McGuinness, D. L. & Hendler, J.
A. (2010a). TWC data-gov corpus:
incrementally generating linked
government data from data. gov. In
Proceedings of the 19th international
conference on World Wide Web, Raleigh,
USA: ACM, 1383-1386.
Ding, L., DiFranzo, D., Graves, A., Michaelis,
J., Li, X., McGuinness, D. L., & Hendler, J.
(2010b). Data-gov Wiki: Towards Linking
Government Data. In AAAI Spring
Symposium: Linked Data Meets Artificial
Intelligence, 10, 1-1.
Ermilov, T. and Auer, S. (2013). Enabling
Linked Data access to the Internet of
Things. In H. Alani et al. [ed.]. Proceedings
of 12th International Semantic Web
Conference, 21-25 October 2013, Sydney,
Australia. Berlin-Heidelberg: Springer.
Groth P. and Gil Y (2011). Editorial - Using
Provenance in the Semantic Web. Web
Semantics: Science, Services and Agents on
the World Wide Web, 9(2)
Serna et al.
tourGUNE Journal of Tourism and Human Mobility, issue 1, year 2013
14
Heath, T. & Bizer, C. (2011). Linked Data:
Evolving the Web into a Global Data Space.
Synthesis Lectures on the Semantic Web:
theory and technology, 1(1), 1-136.
Huijboom, N. & Van den Broek, T. (2011).
Open data: an international comparison of
strategies. European journal of ePractice,
12(1), 1-13.
Iqbal, A. & Hausenblas, M. (2013).
Interlinking Developer Identities within and
across Open Source Projects: The Linked
Data Approach. ISRN Software Engineering,
1-12.
Larrinaga, F., Lizarralde, O., Serna, A. &
Gerrikagoitia, J. K. (2013). Caso de uso de
‘Open Data’ y ‘Linked Data’ en Turismo.
tourGUNE Journal of Tourism and Human
Mobility, 0, 31-39.
Lathrop, D. & Ruma, L. (2010). Open
government: Collaboration, transparency,
and participation in practice. Beijing –
Cambridge – Farnham – Köln – Sebastopol -
Tokyo: O'Reilly Media.
LombardiI, G. (2013). Linked Data: come
esportare il catalogo della biblioteca nel
web. Master’s Degree Thesis, Universidad
de Pisa.
Marcos-Martín, C., & Soriano-Maldonado,
S. L. (2011). Reutilización de la información
del sector público y open data en el
contexto español y europeo. Proyecto
Aporta. El profesional de la información,
20(3), 291-297.
Mitchell, ET. (2013). Linked Data Publishing
for Libraries, Archives, and Museums:
What Is the Next Step? Journal of Web
Librarianship, 7(2), 231-236.
Ramírez-Alujas, Á. (2011). Gobierno
Abierto y Modernización de la Gestión
Pública. Tendencias actuales y el
(Inevitable) Camino que Viene-Reflexiones
Seminales (Open Government and
Modernization of Public Management:
Current Trends and the (Inevitable) Way
Forward-Seminal Reflections). Revista
Enfoques: Ciencia Política y Administración
Pública, 9(15), 99-125.
Robinson, D., Yu, H., Zeller, W. & Felten, E.
(2009). Government data and the invisible
hand. Yale Journal of Law & Technology,
11, 160.
Serna, A., Murua, I., Gerrikagoitia, J. K.,
Alzua, A., Lizarralde, O., & Larrinaga, F.
(2013). Economía de Datos en Turismo.
tourGUNE Journal of Tourism and Human
Mobility, 0(6), 49-58.
Sheridan, J. & Tennison, J. (2010). Linking
UK Government Data. In C. Bizer, T. Heath,
T. Berners-Lee & M. Hausenblas [eds.].
Proceedings of the WWW2010 Workshop
on Linked Data on the Web, LDOW 2010.
Raleigh, USA: CEUR.
Umbrich, J., Hausenblas, M., Hogan, A.,
Polleres, A., & Decker, S. (2010). Towards
dataset dynamics: Change frequency of
linked open data sources. In C. Bizer, T.
Heath, T. Berners-Lee & M. Hausenblas
[eds.]. Proceedings of the WWW2010
Workshop on Linked Data on the Web,
LDOW 2010. Raleigh, USA: CEUR.
von-Ahn, L. (2006). Games with a Purpose.
IEEE Computer, 39 (6), 92-94
W3C: PROV Model Primer. Working Group.
Note 30 April 2013. Available online at:
http://www.w3.org/TR/2013/NOTE-prov-
primer-20130430/. Último acceso: 2013-
11-22.
1 Open Data Euskadi:
http://opendata.euskadi.net/w79-home/es. Último
acceso: 2013-11-22. 2Linked Data: http://linkeddata.org. Último acceso:
2013-11-22. 3Open Government Data:
http://opengovernmentdata.org. Último acceso:
2013-11-22. 4Transparency and Open Government:
http://www.whitehouse.gov/the_press_office/Trans
parencyandOpenGovernment. Último acceso: 2013-
11-22.
Serna et al.
tourGUNE Journal of Tourism and Human Mobility, issue 1, year 2013
15
5 World Bank Open Data: http://data.worldbank.org.
Último acceso: 2013-11-22. 6 UNdata: http://data.un.org. Último acceso: 2013-
11-22. 7 Clean Energy Datasets – free for re-use:
http://data.reegle.info. Último acceso: 2013-11-22. 8 New York Times – Linked Open Data:
http://data.nytimes.com. Último acceso: 2013-11-
22. 9The Guardian: http://www.theguardian.com/uk.
Último acceso: 2013-11-22. 10
The Open Knowledge Foundation: http://okfn.org.
Último acceso: 2013-11-22. 11
Sunlight Foundation:
http://sunlightfoundation.com. Último acceso: 2013-
11-22. 12
Open Kenya – Transparent Africa:
http://opendata.go.ke. Último acceso: 2013-11-22. 13
Digital agenda for Europa – European Commission:
http://ec.europa.eu/information_society/digital-
agenda. Último acceso: 2013-11-22. 14
eGovernment Action Plan Europe 2011–2015:
http://ec.europa.eu/information_society/activities/e
government/action_plan_2011_2015. Último
acceso: 2013-11-22. 15
Digital Agenda: Turning government data into
gold: http://bit.ly/s5FiQo. Último acceso: 2013-11-
22. 16
United States Data Government: http://data.gov.
Último acceso: 2013-11-22. 17
Australian Government: http://data.gov.au. Último
acceso: 2013-11-22. 18
Opening Up government: http://data.gov.uk.
Último acceso: 2013-11-22. 19
SWC mapa mundial: http://bit.ly/open-data-map.
Último acceso: 2013-11-22. 20
OKFN: http://datacatalogs.org. Último acceso:
2013-11-22. 21
State of the LOD Cloud: http://lod-
cloud.net/state/. Último acceso: 2013-11-22. 22
Open data Euskadi – Apertura de datos públicos:
http://www.jusap.ejgv.euskadi.net/contenidos/infor
macion/opcion01_innovacion_publica/es_pr_tc10/a
djuntos/OpenDataEuskadi_Tecnimap.pdf. Último
acceso: 2013-11-22. 23
Open data Euskadi – Catálogo de datos:
http://opendata.euskadi.net/w79-
buscador/es/contenidos/informacion/form_busqued
as/es_formv3/form_buscadatos.html. Último
acceso: 2013-11-22. 24
Proyecto eGIStour:
http://www.tourgune.org/uploads/tinymce/fileman
ager/Folleto_egistour_web_definitivo_seguridad.pdf
. Último acceso: 2013-06-23.
25
Cooperative Cities extend and validate mobility
services: http://co-cities.eu/. Último acceso: 2013-
11-22. 26
eMOTION: http://www.emotion-project.eu/.
Último acceso: 2013-11-22. 27
Intelligent and efficient travel management for
European cities: http://www.in-time-
project.eu/en/library/deliverables/. Último acceso:
2013-11-22. 28
CAI Bilbao: http://www.geobilbao.net/wfsCocities.
Último acceso: 2013-11-22. 29
Kulturklik: http://www.kulturklik.euskadi.net/.
Último acceso: 2013-11-22. 30
Kulturklik – Especificación de la API de eventos:
http://www.kulturklik.euskadi.net/wp-
content/uploads/2012/04/api-agenda-es.pdf. Último
acceso: 2013-11-22. 31
World Wide Web Consortium (W3C):
http://www.w3.org. Último acceso: 2013-11-22. 32
Resource Description Framework (RDF):
http://www.w3.org/RDF. Último acceso: 2013-11-22. 33
The Linking Open Data cloud diagram:
http://www.lod-cloud.net. Último acceso: 2013-11-
22. 34
Proyecto Smartur:
http://www.tourgune.org/es/4/78/0/0/proyectos-
smartur-.html. Último acceso: 2013-06-24. 35
Centro de Investigación Cooperativa en Turismo,
CICtourGUNE:
http://www.tourgune.org/es/index.html. Último
acceso: 2013-06-24. 36
Mondragon Unibertsitatea, grupo de investigación
de Ingeniería de Software e Ingeniería Web:
http://www.mondragon.edu/es/eps/investigacion/li
neas-de-investigacion/ingenieria-del-software.
Último acceso: 2013-11-22.