Adaptive information retrieval system applied to digital libraries
Research and Advanced Technology for Digital Libraries. International Conference on Theory and...
Transcript of Research and Advanced Technology for Digital Libraries. International Conference on Theory and...
Linked (Open) Europeana: Vernetzte Daten in der Europäischen Digitalen Bibliothek
Prof. Dr. Stefan Gradmann
Unter Rückgriff auf M. Doerr, S. Hennicke, A. Isaac, C. Meghini, G. Schreiber, H. Van de Sompel
Und Arbeiten von Europeana V1.0 und EuropeanaConnect
Linked Open Europeana / LSWT2011Prof. Dr. Stefan Gradmann, Humboldt Universität zu Berlin
Europeana V1.0 WP3 / EuropeanaConnect WP12
Übersicht
• NICHT: was ist Europeana• NICHT: was ist Linked Data• Nach dem Katalog: semantische
Kontextualisierung in Europeana• Das Europeana Data Model (EDM)
– Grundlagen– Mona Lisa und mehr ...– Status Quo
• Über 'Offenheit'
Linked Open Europeana / LSWT2011Prof. Dr. Stefan Gradmann, Humboldt Universität zu Berlin
Europeana V1.0 WP3 / EuropeanaConnect WP13
Nach dem Katalog
Linked Open Europeana / LSWT2011Prof. Dr. Stefan Gradmann, Humboldt Universität zu Berlin
Europeana V1.0 WP3 / EuropeanaConnect WP14
Alte und neue Begriffe (thanks, Karen Coyle!)
KatalogBestand'Record'DokumentSucheBibliothekInformation
AggregationExplorationNavigationVerbindungKontextWissen
Linked Open Europeana / LSWT2011Prof. Dr. Stefan Gradmann, Humboldt Universität zu Berlin
Europeana V1.0 WP3 / EuropeanaConnect WP15
Nach dem Katalog: Objekte und Semantischer Kontext in EuropeanaKontextualisierte Objektrepräsentationen (→ Wissensgenerierung): Europeana verbindet Objekt- und Wissensorganisationssysteme!
Linked Open Europeana / LSWT2011Prof. Dr. Stefan Gradmann, Humboldt Universität zu Berlin
Europeana V1.0 WP3 / EuropeanaConnect WP16
Die Semantische Datenschicht
Bibliothek
Archiv
Museum
Überbrückt Informationsinseln und verbindet Objektrepräsentationen aus verschiedenen Gedächtnisdomänen.
Linked Open Europeana / LSWT2011Prof. Dr. Stefan Gradmann, Humboldt Universität zu Berlin
Europeana V1.0 WP3 / EuropeanaConnect WP17
EDM und Linked Open Data
KontextoptionenDBpedia
VIAFGND
GeonamesLCSH
…
Europeana-Objekte
Linked Open Europeana / LSWT2011Prof. Dr. Stefan Gradmann, Humboldt Universität zu Berlin
Europeana V1.0 WP3 / EuropeanaConnect WP18
EDM
Linked Open Europeana / LSWT2011Prof. Dr. Stefan Gradmann, Humboldt Universität zu Berlin
Europeana V1.0 WP3 / EuropeanaConnect WP19
ESE
•“Europeana Semantic Elements” (ESE)» ad hoc für den ersten Prototyp (2008) kreiert» Interoperabilität: Bezug auf das minimalistische
und 'flache' Dublin-Core Modell» “einfach und robust” aber:
•Semantik der Original-Metadaten geht verloren•Keine Spezialisierung im Sinne granularer Modelle möglich
•Keine Verlinkungen und damit auch keine Verbindungen zu externen Ressourcen
• Wir hätten es wohl besser nicht „semantic“ genannt :)
Linked Open Europeana / LSWT2011Prof. Dr. Stefan Gradmann, Humboldt Universität zu Berlin
Europeana V1.0 WP3 / EuropeanaConnect WP110
EDM
“Europeana Data Model” (EDM)• wird ESE mit dem “Danube”-Release von Europeana (Mai 2011) ersetzen
• ESE wird dann ein “application profile” von EDM (Rückwärtskompatibilität!)
• erhält die Semantik der Originaldaten ohne Verlust von Interoperabilität
• ermöglicht eine Nutzung von Europeana als Linked Open Data
• ermöglicht eine Nutzung von Linked Open Data in Europeana
• ermöglicht 'semantische' Nutzungsszenarien
Linked Open Europeana / LSWT2011Prof. Dr. Stefan Gradmann, Humboldt Universität zu Berlin
Europeana V1.0 WP3 / EuropeanaConnect WP111
EDM: Anforderungen und Designprinzipien
• Unterscheidung zwischen realem Objekt (Buch, Bild, Akte, mediale Aufzeichnung) und digitaler Repräsentation
• Unterscheidung zwischen Objekt und beschreibenden Metadaten
• Es müssen mehrere Sichten eines Objekts möglich sein, mit potentiell einander widersprechenden Aussagen
• Unterstützung komplexer Kompositobjekte• Standard-Metadatenformat mit Spezialisierungsoption• Standard-Vokabularformat mit Spezialisierungsoption• Maximale Nachnutzung existierender Standards
Linked Open Europeana / LSWT2011Prof. Dr. Stefan Gradmann, Humboldt Universität zu Berlin
Europeana V1.0 WP3 / EuropeanaConnect WP112
EDM und andere Standards
• Simple Knowledge Organization System (SKOS)• Modelliert die Wissensorgabnisationssysteme (KOS) in der semantischen
Datenschicht von Europeana.
• Ermöglicht Verbindungen zwischen KOSs.• DCMI Metadata Terms (DCTerms)
• Basis für semantisch interoperable deskriptive Objekt-Metadaten
• Stellen Rückwärtskompatibilität zu ESE her• Open Archives Initiative Object Reuse & Exchange (OAI ORE)
• Organisiert und modelliert Aggregationen von Web-Resourcen für die Objektrepräsentation
• Provided Object: repräsentiert des gegebene (reale) Objekt
• Digital Representation: eine digitale Sicht des Objektes
• Proxy: Objektbeschreibung aus einer bestimmten Perspektive
• Aggregation: gruppiert alle Teilinformationen
Linked Open Europeana / LSWT2011Prof. Dr. Stefan Gradmann, Humboldt Universität zu Berlin
Europeana V1.0 WP3 / EuropeanaConnect WP113
EDM: Klassen
Linked Open Europeana / LSWT2011Prof. Dr. Stefan Gradmann, Humboldt Universität zu Berlin
Europeana V1.0 WP3 / EuropeanaConnect WP114
Mona Lisa: Beschreibung der Direction des Musées de France ...
Linked Open Europeana / LSWT2011Prof. Dr. Stefan Gradmann, Humboldt Universität zu Berlin
Europeana V1.0 WP3 / EuropeanaConnect WP115
… und als Metadaten-Aggregation in EDM
Proxy
Digitale Repräsentationen
Reales Objekt
Aggregation
Linked Open Europeana / LSWT2011Prof. Dr. Stefan Gradmann, Humboldt Universität zu Berlin
Europeana V1.0 WP3 / EuropeanaConnect WP116
Semantische Anreicherung
• Zeiträume, Daten• Räumliche Entitäten• Personen und
Organisationen • Konzepte
Linked Open Europeana / LSWT2011Prof. Dr. Stefan Gradmann, Humboldt Universität zu Berlin
Europeana V1.0 WP3 / EuropeanaConnect WP117
Ereignisbasierte Modellierung
Erhalt und Nutzung der Originaldaten impliziert Kompatibilität der Beschreibungen jenseits der einfachen Objektsicht!
Linked Open Europeana / LSWT2011Prof. Dr. Stefan Gradmann, Humboldt Universität zu Berlin
Europeana V1.0 WP3 / EuropeanaConnect WP118
Komplexe Objekte und Beziehungen
• Teil-Ganzes für komplexe (hierarchische) Objekte
• Objektanordnungen• Derivation und Versionierung
Linked Open Europeana / LSWT2011Prof. Dr. Stefan Gradmann, Humboldt Universität zu Berlin
Europeana V1.0 WP3 / EuropeanaConnect WP1
ESE in EDM
<...xmlns:europeana="http://www.europeana.eu/schemas/ese/“...<!--National Library of Poland--><record>
<dc:identifier>urn:repox.bn.org.pl:polona:oai:www.polona.pl:4445</dc:identifier>
<europeana:uri>http://www.europeana.eu/resolve/record/01406/18A8F5DFCAE75694A8AAD18E2791861FBE92589A</europeana:uri>
<dc:title>[Ośmiu powstańców uzbrojonych w kosy] [Dokument ikonograficzny]</dc:title>
<dc:subject>Powstanie 1863 r. styczniowe - ikonografia</dc:subject><dc:date>[1863-1864]</dc:date><dc:rights>Biblioteka Narodowa</dc:rights><europeana:object>http://193.59.172.16/szzz/IsShownBy.do?
id=6481</europeana:object><europeana:isShownAt>http://193.59.172.16/szzz/ShowStart.do?
id=6481</europeana:isShownAt></record>
19Europeana Audiovisual Community Meeting20100409
Linked Open Europeana / LSWT2011Prof. Dr. Stefan Gradmann, Humboldt Universität zu Berlin
Europeana V1.0 WP3 / EuropeanaConnect WP1
ESE in EDM 5.0
20Europeana Audiovisual Community Meeting20100409
Linked Open Europeana / LSWT2011Prof. Dr. Stefan Gradmann, Humboldt Universität zu Berlin
Europeana V1.0 WP3 / EuropeanaConnect WP121
Les Fleurs du Mal: UNIMARChttp://catalogue.bnf.fr/ark:/12148/cb37367035f
000 nam 22 450001FRBNF373670350000003009http://catalogue.bnf.fr/ark:/12148/cb37367035f039 $oGEA$a000288182100 $a19920409d1857 m y0frey50 ba1010 $afre102 $aFR105 $a||||z 00|||106 $ar2001 $aˆLes ‰fleurs du mal$bTexte imprimé$fpar Charles Baudelaire210 $aParis$cPoulet-Malassis et De Broise$d1857215 $a248 p.$d19 cm676 $a841.8$v22686 $a840$2Cadre de classement de la Bibliographie nationale française700 |$311890582$aBaudelaire$bCharles$4070801 0$aFR$bBNF$c19920409$gAFNOR$2intermrc
Linked Open Europeana / LSWT2011Prof. Dr. Stefan Gradmann, Humboldt Universität zu Berlin
Europeana V1.0 WP3 / EuropeanaConnect WP122
Les Fleurs du Mal: Gallicahttp://gallica.bnf.fr/ark:/12148/bpt6k70861t
Linked Open Europeana / LSWT2011Prof. Dr. Stefan Gradmann, Humboldt Universität zu Berlin
Europeana V1.0 WP3 / EuropeanaConnect WP123
Les Fleurs du Mal: Digitalisierthttp://gallica.bnf.fr/ark:/12148/bpt6k70861t.textePage.f1
Linked Open Europeana / LSWT2011Prof. Dr. Stefan Gradmann, Humboldt Universität zu Berlin
Europeana V1.0 WP3 / EuropeanaConnect WP124
Les Fleurs du Mal: EDM
Linked Open Europeana / LSWT2011Prof. Dr. Stefan Gradmann, Humboldt Universität zu Berlin
Europeana V1.0 WP3 / EuropeanaConnect WP125
Aggregationen … und Fragen
• Wo beginnen resource aggregations? Wo enden sie?
• Was konstituiert Dokumentgrenzen??
• Und welcher Knoten war zum Zeitpunkt X mit welchem verknüpft???
A
B
C
Linked Open Europeana / LSWT2011Prof. Dr. Stefan Gradmann, Humboldt Universität zu Berlin
Europeana V1.0 WP3 / EuropeanaConnect WP126
Status
Linked Open Europeana / LSWT2011Prof. Dr. Stefan Gradmann, Humboldt Universität zu Berlin
Europeana V1.0 WP3 / EuropeanaConnect WP127
Gegenwärtiger Stand des EDM
• Machbarkeit in vier 'community workshops' bestätigt (Archive, Bibliotheken, audiovisuelle Sammlungen, Museen – und Systemanbieter!)
• EDM ist Teil der Spezifikationen für den 'Danube'-Release der Europeana (Mai 2011).
• Prototyperprobung ist abgeschlossen.• Dokumentation:
• EDM Spezifikationen und Primer unter http://version1.europeana.eu/web/europeana-project/technicaldocuments/
• Martin Doerr, Stefan Gradmann, Steffen Hennicke, Antoine Isaac, Carlo Meghini, Herbert van de Sompel: The Europeana Data Model. IFLA 2010 (Gothenburg). Session on „Libraries and the Semantic Web“. http://www.ifla.org/files/hq/papers/ifla76/149-doerr-en.pdf
• Entwicklerdokumentation und OWL-Version in EuropeanaLabs: http://europeanalabs.eu/
Linked Open Europeana / LSWT2011Prof. Dr. Stefan Gradmann, Humboldt Universität zu Berlin
Europeana V1.0 WP3 / EuropeanaConnect WP128
EDM: Weiterentwicklung und Perspektiven
• FRBRoo (Functional Requirements for Bibliographic Records)Die Entitäten der Gruppe 1 werden im Rahmen von Europeana 2.0 (ab 2011) unterstützt werden.
• RDA (Resource Description and Access)RDA-basierte Metadaten werden in EDM integrierbar sein, sobald die FRBR-Entitäten unterstützt werden.
• Skalierbarkeit von RDF 'triple stores' ist kein kritischer Faktor.Relationale Datenhaltung mit Tripel-Aufsätzen wie D2R-Prozessoren sind eine gangbare Alternative zu nativen 'triple stores'.
• LOD (Linked Open Data)EDM erlaubt die technische Integration von Europeana in die Welt der Linked Open Data – ersetzt aber keinesfalls eine entsprechend angepasste Politik der Datenlieferanten!
• LoD Pilot : Ab Ende Mai 2011 … und heute in Leipzig!
Linked Open Europeana / LSWT2011Prof. Dr. Stefan Gradmann, Humboldt Universität zu Berlin
Europeana V1.0 WP3 / EuropeanaConnect WP129
Europeana LoD Pilot (1)
Linked Open Europeana / LSWT2011Prof. Dr. Stefan Gradmann, Humboldt Universität zu Berlin
Europeana V1.0 WP3 / EuropeanaConnect WP130
Europeana LoD Pilot (2)
Linked Open Europeana / LSWT2011Prof. Dr. Stefan Gradmann, Humboldt Universität zu Berlin
Europeana V1.0 WP3 / EuropeanaConnect WP131
Europeana LoD Pilot (3)
DEMO
Linked Open Europeana / LSWT2011Prof. Dr. Stefan Gradmann, Humboldt Universität zu Berlin
Europeana V1.0 WP3 / EuropeanaConnect WP132
Europeana LoD Pilot (6)
Zahlen, Fakten und kurzfristige ToDos
• Momentan ca. 3,5 Millionen der 16 Millionen in Europeana repräsentierten Objekte – Koalition der Willigen
• Freigabe ab Ende Mai 2011
• Integration von Kontextualisierungslinks (GeoNames, VIAF, DBPedia)
• Implementierung von load balancing
• Verfügbarstellung als RDF dump
• Credits to Bernhard Haslhofer (U Wien), Antoine Isaac (Europeana Foundation), Cesare Concordia (CNR IST) und weitere ...
34Linked Open Europeana Prof. Dr. Stefan Gradmann / 05.05.2011
Wie 'offen' müssen Linked Data sein? (1)
• “Openness (allowing access) is separate question.” (TBL, http://www.w3.org/2008/Talks/0617-lod-tbl/#(22))
• Funktioniert Linked Data ohne 'offen' zu sein?
• Rein technisch besehen durchaus (so etwa in der Pharmaindustrie oder bei biochemischen Daten oder auch im Bankensektor)
• Aber der Ansatz wird dann extrem aufwändig und teuer …
• … viel zu teuer wahrscheinlich: für Europeana nicht zu bezahlen!• Sehr viel 'semantischer Charme' des offenen Ansatzes geht
verloren – und zudem ist der geschlossene Ansatz recht parasitär.• Dem entsprechend zielen wir in Europeana explizit auf ein Open
Linked Data (mehr in einem Statement der Europeana Foundation unter http://bit.ly/fe637P) und streben an, Europeana-Daten unter CC0 verfügbar zu machen!
35Linked Open Europeana Prof. Dr. Stefan Gradmann / 05.05.2011
Wie 'offen' müssen Linked Data sein? (2)
●Ein 'offener' Ansatz hat eine Reihe von Implikationen● Verwendung der Daten ist nicht kontrollierbar.● Zugang zu den Daten und deren Verwendung entfällt als
Einkommensquelle● Innovative und kommerziell attraktive Dienste können auf LoD
basieren (multimediale Mehrwertdienste)●→ Lizenzierung von Inhalten darf kommerzielle Nachnutzung nicht ausschließen.• → In den nun anstehenden Diskussionen nicht sämtliche
Fehler der Diskussion um Open Access wiederholen!• → Was ist der (kommerzielle!) Wert semantischer
Kontextualisierung?
Europeana v1.0 WP3EuropeanaConnect WP1Prof. Dr. Stefan GradmannHumboldt-Universität zu BerlinInstitut für Bibliotheks- und InformationswissenschaftUnter den Linden 610099 BerlinTel.: +49 30 2093-4481e-mail: [email protected]
Fragen?