Research and Advanced Technology for Digital Libraries. International Conference on Theory and...

36
Linked (Open) Europeana: Vernetzte Daten in der Europäischen Digitalen Bibliothek Prof. Dr. Stefan Gradmann Unter Rückgriff auf M. Doerr, S. Hennicke, A. Isaac, C. Meghini, G. Schreiber, H. Van de Sompel Und Arbeiten von Europeana V1.0 und EuropeanaConnect

Transcript of Research and Advanced Technology for Digital Libraries. International Conference on Theory and...

Linked (Open) Europeana: Vernetzte Daten in der Europäischen Digitalen Bibliothek

Prof. Dr. Stefan Gradmann

Unter Rückgriff auf M. Doerr, S. Hennicke, A. Isaac, C. Meghini, G. Schreiber, H. Van de Sompel

Und Arbeiten von Europeana V1.0 und EuropeanaConnect

Linked Open Europeana / LSWT2011Prof. Dr. Stefan Gradmann, Humboldt Universität zu Berlin

Europeana V1.0 WP3 / EuropeanaConnect WP12

Übersicht

• NICHT: was ist Europeana• NICHT: was ist Linked Data• Nach dem Katalog: semantische

Kontextualisierung in Europeana• Das Europeana Data Model (EDM)

– Grundlagen– Mona Lisa und mehr ...– Status Quo

• Über 'Offenheit'

Linked Open Europeana / LSWT2011Prof. Dr. Stefan Gradmann, Humboldt Universität zu Berlin

Europeana V1.0 WP3 / EuropeanaConnect WP13

Nach dem Katalog

Linked Open Europeana / LSWT2011Prof. Dr. Stefan Gradmann, Humboldt Universität zu Berlin

Europeana V1.0 WP3 / EuropeanaConnect WP14

Alte und neue Begriffe (thanks, Karen Coyle!)

KatalogBestand'Record'DokumentSucheBibliothekInformation

AggregationExplorationNavigationVerbindungKontextWissen

Linked Open Europeana / LSWT2011Prof. Dr. Stefan Gradmann, Humboldt Universität zu Berlin

Europeana V1.0 WP3 / EuropeanaConnect WP15

Nach dem Katalog: Objekte und Semantischer Kontext in EuropeanaKontextualisierte Objektrepräsentationen (→ Wissensgenerierung): Europeana verbindet Objekt- und Wissensorganisationssysteme!

Linked Open Europeana / LSWT2011Prof. Dr. Stefan Gradmann, Humboldt Universität zu Berlin

Europeana V1.0 WP3 / EuropeanaConnect WP16

Die Semantische Datenschicht

Bibliothek

Archiv

Museum

Überbrückt Informationsinseln und verbindet Objektrepräsentationen aus verschiedenen Gedächtnisdomänen.

Linked Open Europeana / LSWT2011Prof. Dr. Stefan Gradmann, Humboldt Universität zu Berlin

Europeana V1.0 WP3 / EuropeanaConnect WP17

EDM und Linked Open Data

KontextoptionenDBpedia

VIAFGND

GeonamesLCSH

Europeana-Objekte

Linked Open Europeana / LSWT2011Prof. Dr. Stefan Gradmann, Humboldt Universität zu Berlin

Europeana V1.0 WP3 / EuropeanaConnect WP18

EDM

Linked Open Europeana / LSWT2011Prof. Dr. Stefan Gradmann, Humboldt Universität zu Berlin

Europeana V1.0 WP3 / EuropeanaConnect WP19

ESE

•“Europeana Semantic Elements” (ESE)» ad hoc für den ersten Prototyp (2008) kreiert» Interoperabilität: Bezug auf das minimalistische

und 'flache' Dublin-Core Modell» “einfach und robust” aber:

•Semantik der Original-Metadaten geht verloren•Keine Spezialisierung im Sinne granularer Modelle möglich

•Keine Verlinkungen und damit auch keine Verbindungen zu externen Ressourcen

• Wir hätten es wohl besser nicht „semantic“ genannt :)

Linked Open Europeana / LSWT2011Prof. Dr. Stefan Gradmann, Humboldt Universität zu Berlin

Europeana V1.0 WP3 / EuropeanaConnect WP110

EDM

“Europeana Data Model” (EDM)• wird ESE mit dem “Danube”-Release von Europeana (Mai 2011) ersetzen

• ESE wird dann ein “application profile” von EDM (Rückwärtskompatibilität!)

• erhält die Semantik der Originaldaten ohne Verlust von Interoperabilität

• ermöglicht eine Nutzung von Europeana als Linked Open Data

• ermöglicht eine Nutzung von Linked Open Data in Europeana

• ermöglicht 'semantische' Nutzungsszenarien

Linked Open Europeana / LSWT2011Prof. Dr. Stefan Gradmann, Humboldt Universität zu Berlin

Europeana V1.0 WP3 / EuropeanaConnect WP111

EDM: Anforderungen und Designprinzipien

• Unterscheidung zwischen realem Objekt (Buch, Bild, Akte, mediale Aufzeichnung) und digitaler Repräsentation

• Unterscheidung zwischen Objekt und beschreibenden Metadaten

• Es müssen mehrere Sichten eines Objekts möglich sein, mit potentiell einander widersprechenden Aussagen

• Unterstützung komplexer Kompositobjekte• Standard-Metadatenformat mit Spezialisierungsoption• Standard-Vokabularformat mit Spezialisierungsoption• Maximale Nachnutzung existierender Standards

Linked Open Europeana / LSWT2011Prof. Dr. Stefan Gradmann, Humboldt Universität zu Berlin

Europeana V1.0 WP3 / EuropeanaConnect WP112

EDM und andere Standards

• Simple Knowledge Organization System (SKOS)• Modelliert die Wissensorgabnisationssysteme (KOS) in der semantischen

Datenschicht von Europeana.

• Ermöglicht Verbindungen zwischen KOSs.• DCMI Metadata Terms (DCTerms)

• Basis für semantisch interoperable deskriptive Objekt-Metadaten

• Stellen Rückwärtskompatibilität zu ESE her• Open Archives Initiative Object Reuse & Exchange (OAI ORE)

• Organisiert und modelliert Aggregationen von Web-Resourcen für die Objektrepräsentation

• Provided Object: repräsentiert des gegebene (reale) Objekt

• Digital Representation: eine digitale Sicht des Objektes

• Proxy: Objektbeschreibung aus einer bestimmten Perspektive

• Aggregation: gruppiert alle Teilinformationen

Linked Open Europeana / LSWT2011Prof. Dr. Stefan Gradmann, Humboldt Universität zu Berlin

Europeana V1.0 WP3 / EuropeanaConnect WP113

EDM: Klassen

Linked Open Europeana / LSWT2011Prof. Dr. Stefan Gradmann, Humboldt Universität zu Berlin

Europeana V1.0 WP3 / EuropeanaConnect WP114

Mona Lisa: Beschreibung der Direction des Musées de France ...

Linked Open Europeana / LSWT2011Prof. Dr. Stefan Gradmann, Humboldt Universität zu Berlin

Europeana V1.0 WP3 / EuropeanaConnect WP115

… und als Metadaten-Aggregation in EDM

Proxy

Digitale Repräsentationen

Reales Objekt

Aggregation

Linked Open Europeana / LSWT2011Prof. Dr. Stefan Gradmann, Humboldt Universität zu Berlin

Europeana V1.0 WP3 / EuropeanaConnect WP116

Semantische Anreicherung

• Zeiträume, Daten• Räumliche Entitäten• Personen und

Organisationen • Konzepte

Linked Open Europeana / LSWT2011Prof. Dr. Stefan Gradmann, Humboldt Universität zu Berlin

Europeana V1.0 WP3 / EuropeanaConnect WP117

Ereignisbasierte Modellierung

Erhalt und Nutzung der Originaldaten impliziert Kompatibilität der Beschreibungen jenseits der einfachen Objektsicht!

Linked Open Europeana / LSWT2011Prof. Dr. Stefan Gradmann, Humboldt Universität zu Berlin

Europeana V1.0 WP3 / EuropeanaConnect WP118

Komplexe Objekte und Beziehungen

• Teil-Ganzes für komplexe (hierarchische) Objekte

• Objektanordnungen• Derivation und Versionierung

Linked Open Europeana / LSWT2011Prof. Dr. Stefan Gradmann, Humboldt Universität zu Berlin

Europeana V1.0 WP3 / EuropeanaConnect WP1

ESE in EDM

<...xmlns:europeana="http://www.europeana.eu/schemas/ese/“...<!--National Library of Poland--><record>

<dc:identifier>urn:repox.bn.org.pl:polona:oai:www.polona.pl:4445</dc:identifier>

<europeana:uri>http://www.europeana.eu/resolve/record/01406/18A8F5DFCAE75694A8AAD18E2791861FBE92589A</europeana:uri>

<dc:title>[Ośmiu powstańców uzbrojonych w kosy] [Dokument ikonograficzny]</dc:title>

<dc:subject>Powstanie 1863 r. styczniowe - ikonografia</dc:subject><dc:date>[1863-1864]</dc:date><dc:rights>Biblioteka Narodowa</dc:rights><europeana:object>http://193.59.172.16/szzz/IsShownBy.do?

id=6481</europeana:object><europeana:isShownAt>http://193.59.172.16/szzz/ShowStart.do?

id=6481</europeana:isShownAt></record>

19Europeana Audiovisual Community Meeting20100409

Linked Open Europeana / LSWT2011Prof. Dr. Stefan Gradmann, Humboldt Universität zu Berlin

Europeana V1.0 WP3 / EuropeanaConnect WP1

ESE in EDM 5.0

20Europeana Audiovisual Community Meeting20100409

Linked Open Europeana / LSWT2011Prof. Dr. Stefan Gradmann, Humboldt Universität zu Berlin

Europeana V1.0 WP3 / EuropeanaConnect WP121

Les Fleurs du Mal: UNIMARChttp://catalogue.bnf.fr/ark:/12148/cb37367035f

000 nam 22 450001FRBNF373670350000003009http://catalogue.bnf.fr/ark:/12148/cb37367035f039 $oGEA$a000288182100 $a19920409d1857 m y0frey50 ba1010 $afre102 $aFR105 $a||||z 00|||106 $ar2001 $aˆLes ‰fleurs du mal$bTexte imprimé$fpar Charles Baudelaire210 $aParis$cPoulet-Malassis et De Broise$d1857215 $a248 p.$d19 cm676 $a841.8$v22686 $a840$2Cadre de classement de la Bibliographie nationale française700 |$311890582$aBaudelaire$bCharles$4070801 0$aFR$bBNF$c19920409$gAFNOR$2intermrc

Linked Open Europeana / LSWT2011Prof. Dr. Stefan Gradmann, Humboldt Universität zu Berlin

Europeana V1.0 WP3 / EuropeanaConnect WP122

Les Fleurs du Mal: Gallicahttp://gallica.bnf.fr/ark:/12148/bpt6k70861t

Linked Open Europeana / LSWT2011Prof. Dr. Stefan Gradmann, Humboldt Universität zu Berlin

Europeana V1.0 WP3 / EuropeanaConnect WP123

Les Fleurs du Mal: Digitalisierthttp://gallica.bnf.fr/ark:/12148/bpt6k70861t.textePage.f1

Linked Open Europeana / LSWT2011Prof. Dr. Stefan Gradmann, Humboldt Universität zu Berlin

Europeana V1.0 WP3 / EuropeanaConnect WP124

Les Fleurs du Mal: EDM

Linked Open Europeana / LSWT2011Prof. Dr. Stefan Gradmann, Humboldt Universität zu Berlin

Europeana V1.0 WP3 / EuropeanaConnect WP125

Aggregationen … und Fragen

• Wo beginnen resource aggregations? Wo enden sie?

• Was konstituiert Dokumentgrenzen??

• Und welcher Knoten war zum Zeitpunkt X mit welchem verknüpft???

A

B

C

Linked Open Europeana / LSWT2011Prof. Dr. Stefan Gradmann, Humboldt Universität zu Berlin

Europeana V1.0 WP3 / EuropeanaConnect WP126

Status

Linked Open Europeana / LSWT2011Prof. Dr. Stefan Gradmann, Humboldt Universität zu Berlin

Europeana V1.0 WP3 / EuropeanaConnect WP127

Gegenwärtiger Stand des EDM

• Machbarkeit in vier 'community workshops' bestätigt (Archive, Bibliotheken, audiovisuelle Sammlungen, Museen – und Systemanbieter!)

• EDM ist Teil der Spezifikationen für den 'Danube'-Release der Europeana (Mai 2011).

• Prototyperprobung ist abgeschlossen.• Dokumentation:

• EDM Spezifikationen und Primer unter http://version1.europeana.eu/web/europeana-project/technicaldocuments/

• Martin Doerr, Stefan Gradmann, Steffen Hennicke, Antoine Isaac, Carlo Meghini, Herbert van de Sompel: The Europeana Data Model. IFLA 2010 (Gothenburg). Session on „Libraries and the Semantic Web“. http://www.ifla.org/files/hq/papers/ifla76/149-doerr-en.pdf

• Entwicklerdokumentation und OWL-Version in EuropeanaLabs: http://europeanalabs.eu/

Linked Open Europeana / LSWT2011Prof. Dr. Stefan Gradmann, Humboldt Universität zu Berlin

Europeana V1.0 WP3 / EuropeanaConnect WP128

EDM: Weiterentwicklung und Perspektiven

• FRBRoo (Functional Requirements for Bibliographic Records)Die Entitäten der Gruppe 1 werden im Rahmen von Europeana 2.0 (ab 2011) unterstützt werden.

• RDA (Resource Description and Access)RDA-basierte Metadaten werden in EDM integrierbar sein, sobald die FRBR-Entitäten unterstützt werden.

• Skalierbarkeit von RDF 'triple stores' ist kein kritischer Faktor.Relationale Datenhaltung mit Tripel-Aufsätzen wie D2R-Prozessoren sind eine gangbare Alternative zu nativen 'triple stores'.

• LOD (Linked Open Data)EDM erlaubt die technische Integration von Europeana in die Welt der Linked Open Data – ersetzt aber keinesfalls eine entsprechend angepasste Politik der Datenlieferanten!

• LoD Pilot : Ab Ende Mai 2011 … und heute in Leipzig!

Linked Open Europeana / LSWT2011Prof. Dr. Stefan Gradmann, Humboldt Universität zu Berlin

Europeana V1.0 WP3 / EuropeanaConnect WP129

Europeana LoD Pilot (1)

Linked Open Europeana / LSWT2011Prof. Dr. Stefan Gradmann, Humboldt Universität zu Berlin

Europeana V1.0 WP3 / EuropeanaConnect WP130

Europeana LoD Pilot (2)

Linked Open Europeana / LSWT2011Prof. Dr. Stefan Gradmann, Humboldt Universität zu Berlin

Europeana V1.0 WP3 / EuropeanaConnect WP131

Europeana LoD Pilot (3)

DEMO

Linked Open Europeana / LSWT2011Prof. Dr. Stefan Gradmann, Humboldt Universität zu Berlin

Europeana V1.0 WP3 / EuropeanaConnect WP132

Europeana LoD Pilot (6)

Zahlen, Fakten und kurzfristige ToDos

• Momentan ca. 3,5 Millionen der 16 Millionen in Europeana repräsentierten Objekte – Koalition der Willigen

• Freigabe ab Ende Mai 2011

• Integration von Kontextualisierungslinks (GeoNames, VIAF, DBPedia)

• Implementierung von load balancing

• Verfügbarstellung als RDF dump

• Credits to Bernhard Haslhofer (U Wien), Antoine Isaac (Europeana Foundation), Cesare Concordia (CNR IST) und weitere ...

33

Linked 'Open' Data

34Linked Open Europeana Prof. Dr. Stefan Gradmann / 05.05.2011

Wie 'offen' müssen Linked Data sein? (1)

• “Openness (allowing access) is separate question.” (TBL, http://www.w3.org/2008/Talks/0617-lod-tbl/#(22))

• Funktioniert Linked Data ohne 'offen' zu sein?

• Rein technisch besehen durchaus (so etwa in der Pharmaindustrie oder bei biochemischen Daten oder auch im Bankensektor)

• Aber der Ansatz wird dann extrem aufwändig und teuer …

• … viel zu teuer wahrscheinlich: für Europeana nicht zu bezahlen!• Sehr viel 'semantischer Charme' des offenen Ansatzes geht

verloren – und zudem ist der geschlossene Ansatz recht parasitär.• Dem entsprechend zielen wir in Europeana explizit auf ein Open

Linked Data (mehr in einem Statement der Europeana Foundation unter http://bit.ly/fe637P) und streben an, Europeana-Daten unter CC0 verfügbar zu machen!

35Linked Open Europeana Prof. Dr. Stefan Gradmann / 05.05.2011

Wie 'offen' müssen Linked Data sein? (2)

●Ein 'offener' Ansatz hat eine Reihe von Implikationen● Verwendung der Daten ist nicht kontrollierbar.● Zugang zu den Daten und deren Verwendung entfällt als

Einkommensquelle● Innovative und kommerziell attraktive Dienste können auf LoD

basieren (multimediale Mehrwertdienste)●→ Lizenzierung von Inhalten darf kommerzielle Nachnutzung nicht ausschließen.• → In den nun anstehenden Diskussionen nicht sämtliche

Fehler der Diskussion um Open Access wiederholen!• → Was ist der (kommerzielle!) Wert semantischer

Kontextualisierung?

Europeana v1.0 WP3EuropeanaConnect WP1Prof. Dr. Stefan GradmannHumboldt-Universität zu BerlinInstitut für Bibliotheks- und InformationswissenschaftUnter den Linden 610099 BerlinTel.: +49 30 2093-4481e-mail: [email protected]

Fragen?