Εργαλεία για ανάπτυξη Linked Open Data στις βιβλιοθήκες

224
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ – ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ (ΠΜΣ) ΔΙΑΧΕΙΡΙΣΗ ΤΕΚΜΗΡΙΩΝ ΠΟΛΙΤΙΣΤΙΚΗΣ ΚΛΗΡΟΝΟΜΙΑΣ ΚΑΙ ΝΕΕΣ ΤΕΧΝΟΛΟΓΙΕΣ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ Τίτλος Εργασίας: Εργαλεία για ανάπτυξη Linked Open Data στις βιβλιοθήκες Ακαδημαϊκό έτος: 2011-2013 Ονοματεπώνυμο: Ελεάνα Παθιακάκη Υπεύθυνος Διδάσκων: Χρήστος Παπαθεοδώρου 1

Transcript of Εργαλεία για ανάπτυξη Linked Open Data στις βιβλιοθήκες

ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ – ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ

ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ (ΠΜΣ)

ΔΙΑΧΕΙΡΙΣΗ ΤΕΚΜΗΡΙΩΝ ΠΟΛΙΤΙΣΤΙΚΗΣ ΚΛΗΡΟΝΟΜΙΑΣ ΚΑΙ ΝΕΕΣ ΤΕΧΝΟΛΟΓΙΕΣ

ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ

Τίτλος Εργασίας: Εργαλεία για ανάπτυξη Linked Open Data στις βιβλιοθήκες

Ακαδημαϊκό έτος: 2011-2013

Ονοματεπώνυμο: Ελεάνα Παθιακάκη

Υπεύθυνος Διδάσκων: Χρήστος Παπαθεοδώρου

1

2

ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ – ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ

ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ (ΠΜΣ)

ΔΙΑΧΕΙΡΙΣΗ ΤΕΚΜΗΡΙΩΝ ΠΟΛΙΤΙΣΤΙΚΗΣ ΚΛΗΡΟΝΟΜΙΑΣ ΚΑΙ ΝΕΕΣ ΤΕΧΝΟΛΟΓΙΕΣ

ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ

Τίτλος Εργασίας: Εργαλεία για ανάπτυξη Linked Open Data στις βιβλιοθήκες

Ακαδημαϊκό έτος: 2011-2013

Ονοματεπώνυμο: Ελεάνα ΠαθιακάκηΥπεύθυνος Διδάσκων: Χρήστος Παπαθεοδώρου

3

“Αυτό που έχει σημασία στη ζωή δεν είναι τι σου συμβαίνει, αλλά τιθυμάσαι και πώς το θυμάσαι”.

Gabriel Garcia Marquez

4

Η εργασία είναι αφιερωμένη στους

συνοδοιπόρους μου σε αυτή

διαδρομή Αθήνα-Κέρκυρα-Αθήνα

5

ΕυχαριστίεςΓια τη συγγραφή της παρούσας εργασίας πολλοί ήταν οι συντελεστές που

βοήθησαν έμμεσα με τις επιστημονικές τους έρευνες. Πρωτίστως όμως θα

ήθελα να ευχαριστήσω τον επιβλέποντα καθηγητή κ. Χρήστο Παπαθεοδώρου,

κυρίως για την υπομονή να είναι δίπλα μου σε όλες τις “εξωτερικές”

δυσκολίες που υπήρξανε κατά τη συγγραφή της εργασίας, καθώς και την

πολύτιμη βοήθεια του δρ. Μιχάλη Σφακάκη κατά την έναρξη της εργασίας για

τις πολύτιμες και καθοριστικές γνώσεις και συμβουλές που στέκονται σχεδόν

μοναδικές στο χώρο των ελληνικών βιβλιοθηκών. Επίσης τις βιβλιοθήκες του

Παντείου Πανεπιστημίου και του Ευγενιδείου Ιδρύματος για την πολύτιμη

βοήθειά τους σε πρακτικά θέματα διεκπεραίωσης της παρούσας εργασίας

6

7

Περιεχόμενα

ΠΕΡΙΛΗΨΗ.....................................................15

Εισαγωγή-Στόχοι διπλωματικής.................................18

KΕΦΑΛΑΙΟ 1...................................................21

Συνδεδεμένα δεδομένα και βιβλιοθήκες.........................21

1.1 Βιβλιοθήκες “Προ” συνδεδεμένων δεδομένων..........21

1.2. Βιβλιογραφικά δεδομένα..................................23

1.2.1 Ανοιχτά βιβλιογραφικά δεδομένα................................25

1.2.2 Τέσσερις Αρχές Ανοιχτών Βιβλιογραφικών Δεδομένων.................26

1.3 Συνδεδεμένα Δεδομένα.....................................27

1.3.1 Aνοιχτά Δεδομένα............................................28

ΚΕΦΑΛΑΙΟ 2...................................................29

W3C Linked Data Incubator Library Group:.....................29

Πλεονεκτήματα Διασύνδεσης Δεδομένων Βιβλιοθηκών..............29

Τρέχουσα Κατάσταση στις Βιβλιοθήκες..........................29

Τρέχοντα διαθέσιμα συνδεδεμένα δεδομένα βιβλιοθηκών..........29

Συστάσεις....................................................29

8

2.1 Πλεονεκτήματα Διασύνδεσης................................30

2.1.1 Πλεονεκτήματα για τους χρήστες των βιβλιοθηκών...................32

2.1.2 Πλεονεκτήματα για τους βιβλιοθηκονόμους........................33

2.1.3 Πλεονεκτήματα για προγραμματιστές και προμηθευτές.................33

2.2 Τρέχουσα Κατάσταση................................34

2.2.1 Η τρέχουσα κατάσταση στη δομή των δεδομένων των βιβλιοθηκών.......34

2.2.2 Τρέχοντα διαθέσιμα Συνδεδεμένα Δεδομένα Βιβλιοθηκών...............36

2.3.1 Θέματα Δικαιωμάτων........................................39

2.3.2 Αύξηση της συμμετοχής των βιβλιοθηκών στην τυποποίηση του

σημασιολογικού ιστού ........................................40

2.3.3 Πρακτικές σχεδιαστικών προτύπων προσαρμοσμένων σε

συνδεδεμένα δεδομένα βιβλιοθηκών..........................40

2.3.4 Για σχεδιαστές δεδομένων και συστημάτων........................41

2.3.5 Επαναχρησιμοποίηση ή αντιστοίχηση των υφιστάμενων λεξιλογίων

συνδεδεμένων δεδομένων για δεδομένα βιβλιοθηκών..................42

2.3.6 Συντήρηση συνδεδεμένων δεδομένων.............................43

2.4 Συμπεράσματα κεφαλαίου...................................43

ΚΕΦΑΛΑΙΟ 3...................................................45

MARC21 και Συνδεδεμένα Δεδομένα..............................45

9

ΚΕΦΑΛΑΙΟ 4...................................................48

Εννοιολογικό Μοντέλο FRBR και συνδεδεμένα δεδομένα...........48

4.1 Μια πρώτη ματιά..........................................48

4.2 Ιστορικό πλαίσιο - Σκοπός του μοντέλου.................49

4.3 FRBR και Συνδεδεμένα Δεδομένα............................50

4.4 Ο πυρήνας του μοντέλου...................................51

ΚΕΦΑΛΑΙΟ 5...................................................55

Λεξιλόγια Συνδεδεμένων Δεδομένων.............................55

5.1 Λεξιλόγια Πυρήνα RDF. (Core RDF Vocabularies)....56

5.2 Λεξιλόγια FRBR (FRBR Vocabularies)................57

5.3 Λεξιλόγια από βιβλιοθήκες και συναφείς οργανισμούς......59

5.4 Άλλα λεξιλόγια...........................................60

KΕΦΑΛΑΙΟ 6...................................................61

Μοντέλο ανοιχτών συνδεδεμένων δεδομένων της Εθνικής Βιβλιοθήκης

της Ισπανίας..............................................61

6.1 Πλαίσιο δημιουργίας......................................61

6.2 Πόροι δεδομένων (Resource Data)...................62

6. 3 Τεχνολογία-εργαλεία.....................................63

6.3.1 MARiMBa (a MARc Mappings and rdf generAtor)......................6310

6.3.2 Παράδειγμα διαδικασίας αντιστοίχησης με το εργαλείο marimba.........65

6.4 Άλλα εργαλεία...........................................69

6.5 Μοντελοποίηση............................................69

Κεφάλαιο 7...................................................73

Μοντέλο ανοιχτών συνδεδεμένων δεδομένων της Εθνικής Βιβλιοθήκης

της Βρετανίας.............................................73

7.1 Πλαίσιο δημιουργίας.....................................73

7.2 Διαθεσιμότητα Δεδομένων- Μοντέλο δεδομένων, σχήμα και

πρότυπα URIs..............................................75

7.3 Πρόσβαση στα Ανοιχτά Συνδεδεμένα Δεδομένα της BNB........76

7.4 Μοντελοποίηση............................................77

7.4.1 Βασική RDF/XML (Basic RDF/XML).................................81

7.4.2 Άρθρα περιοδικών..........................................81

7.4.3 Marc21 μέσω Z3950..........................................82

7.4.4 Νέοι τίτλοι BNB. Εβδομαδιαία αρχεία (PDF και Βασική rdf/xml)...........83

ΚΕΦΑΛΑΙΟ 8...................................................84

Παράδειγμα σύμφωνα με το Μοντέλο Περιγραφής Συνδεδεμένων

Δεδομένων της Εθνικής Βιβλιοθήκης της Ισπανίας............84

8.1 Σκοπός του παραδείγματος.................................84

11

8.2 Μεθοδολογία του παραδείγματος............................84

8.3 Προδιαγραφές συνδεδεμένων δεδομένων της ισπανικής

βιβλιοθήκης...............................................85

8.3.1 Προσδιορισμός και ανάλυση πηγών δεδομένων......................85

8.3.2 Ομαδοποίηση δεδομένων της εγγραφής............................87

8.3.3 Δημιουργία URIs............................................89

8.4 Πρόγραμμα περιήγησης “Disco Hyperdata Browser”...........90

8.4.1 Παράδειγμα σε περιηγητή “Disco”................................90

8.5 Ανάπτυξη λεξιλογίων για την μετατροπή των πηγών δεδομένων-

Μοντελοποίηση.............................................92

8.6 Frbrization: εντοπισμός FRBR οντοτήτων (Πρόσωπο, Έργο,

Έκφραση, Εκδήλωση) και δημιουργία καθιερωμένων και

βιβλιογραφικών εγγραφών...................................96

8.6.1 Εντοπισμός της οντότητας frbf:Πρόσωπο- Δημιουργία URI...............96

8.6.2 Εντοπισμός της frbr Οντότητας “Έργο” - Δημιουργία URI...............104

8.6.3 Εντοπισμός της frbr Οντότητας “ Έκφραση”-Δημιουργία URI............106

8.6.4 Εντοπισμός της οντότητας frbr:Εκδήλωση-Δημιουργία URI.............109

Πίνακας 12. Περιγραφή του manifestation σε πίνακα.....................112

8.6.5.Αντιστοίχηση MARC21 με FRBR και RDF στη βιβλιογραφική εγγραφή του

ισπανικού μοντέλου..........................................11212

8.6.6 Συσχεστίσεις οντοτήτων......................................119

8. 7 Παραγωγή δεδομένων σε RDF (RDF GENERATION).............121

8.7.1 Περιληπτική διαδικασία αντιστοίχησης με το εργαλείο Marimba.........121

8.7. Δημοσίευση συνδεδεμένων δεδομένων.....................127

8.8. Συμπεράσματα...........................................128

8.8.1 Πλεονεκτήματα και μειονεκτήματα του μοντέλου - Μελλοντικές βελτιώσεις. 129

ΚΕΦΑΛΑΙΟ 9..................................................131

Παράδειγμα σύμφωνα με το Μοντέλο Περιγραφής Συνδεδεμένων

Δεδομένων της Εθνικής Βιβλιοθήκης της Βρετανίας..........131

9.1 Σκοπός του παραδείγματος................................131

9.2 Ροή εργασίας (workflow) της μετατροπής MARC21 σε RDF/XML

από τη βρετανική βιβλιοθήκη..............................131

9.3 Παράδειγμα..............................................133

9.3.1 Επιλογή MARC εγγραφής.....................................133

9.3.3 Διαδικασία Μοντελοποίησης...................................134

9.3.4 Μετατροπή MARC21 δεδομένων σε αρχεία RDF/XML..................136

9.3.5 Διασύνδεση δεδομένων - Δημοσίευση συνδεδεμένων δεδομένων.........143

9.4 Γενικά συμπεράσματα-Οφέλη δημοσίευσης δεδομένων της

βρετανικής βιβλιοθήκης...................................146

13

9.5 Συγκριτική μελέτη των δύο μοντέλων......................147

Κεφάλαιο 10................................................151

Ένα παράδειγμα Σειριακής έκδοσης στα δύο μοντέλα βιβλιοθηκών 151

10.1 Επιλογή εγγραφής MARC21................................152

10.1.1 Εφαρμογή παραδείγματος στις δύο βιβλιοθήκες...................152

10.1.2 Εντοπισμός FRBR οντοτήτων στο μοντέλο της ισπανικής βιβλιοθήκης....158

10.1.3 Συμπεράσματα............................................159

10.2 Αναγωγή βρετανικής εγγραφής στο manifestation του

ισπανικού μοντέλου.......................................160

10.3 Σχέσεις μεταξύ έργων σύμφωνα με τους FRBR..............162

Κεφάλαιο 11.................................................164

Επίλογος – Συμπεράσματα.....................................164

Βιβλιογραφία................................................167

Διαδυκτιακές Πηγές..........................................170

ΠΕΡΙΕΧΟΜΕΝΑ ΕΙΚΟΝΩΝ/ΠΙΝΑΚΩΝ

Εικόνα 1. Εξαγωγή Αρχείων από MARC21......................................63

Εικόνα 2. Οπτικοποίηση αποτελέσματος ερωτήματος στον κατάλογο καθιερωμένων όρων της ισπανικής βιβλιοθήκης............................................86

14

Εικόνα 3. Επισκόπηση των λεξιλογίων της ισπανικής βιβλιοθήκης βασισμένα στην οικογένεια των FR μοντέλων...........................................95

Εικόνα 4. Περιγραφή και διασύνδεση της οντότητας frbr:Πρόσωπο.........................99

Εικόνα 5. Περιγραφή και διασύνδεση της οντότητας frbr:Έργο...........................105

Εικόνα 6. Περιγραφή και διασύνδεση της οντότητας frbr:Έκφραση............107

Εικόνα 7. Περιγραφή του manifestation....................................110

Εικόνα 8. Παράδειγμα προέλευσης και άδειας δεδομένων.....................124

Εικόνα 9. Owl:sameAs: Παράδειγμα διασύνδεσης.............................125

Εικόνα 10. Γραφικό περιβάλλον της υπηρεσίας datahub.io./datos.bne.es.....127

Εικόνα 11. RDF σχήμα όρων βρετανικής βιβλιοθήκης.........................136

Εικόνα 12. Γραφικό περιβάλλον αναζήτησης σε BNB Linked Data Platform.....144

Εικόνα 13. Γραφικό περιβάλλον σε SPARQL editor...........................145

Εικόνα 14. Γραφικό περιβάλλον bluk downloads............................145

Εικόνα 15. Εμφάνιση εγγραφής με συνδεδεμένα δεδομένα.....................145

Εικόνα 16. Περιγραφή και διασύνδεση του manifestation....................153

Εικόνα 17. Οπτικοποίηση εγγραφής με συνδεδεμένα δεδομένα.................156

Εικόνα 18. Σχήμα μοντέλου βρετανικής βιβλιοθήκης για τις σειριακές εκδόσεις.........................................................................157

Εικόνα 19. Relationship Whole/Part.......................................162

Πίνακας 1. Εξαγωγή δεδομένων της καθιερωμένης εγγραφής σε δομή MARC21...87

Πίνακας 2. Εξαγωγή δεδομένων από την MARC21 καθιερωμένη εγγραφή “Gabriel Garcia Marquez”...........................................................88

Πίνακας 3. Εμφάνιση συνδεδεμένων δεδομένων για το manifestation που αντιστοιχεί στη marc21 εγγραφή που ακολουθεί στον περιηγητή Disco.........91

15

Πίνακας 4. Κλάσεις και σχέσεις που εμφανίζονται μέσα στην datos.bne.es....94

Πίνακας 5. Αντιστοιχία γνωρισμάτων της οντότητας frbr: Πρόσωπο με πεδία και υποπεδία MARC21. 97

Πίνακας 6. Αντιστοιχία πεδίων MARC21 με την οντότητα frbr:Πρόσωπο και άλλα λεξιλόγια.......98

Πίνακας 7. Ιδιότητες που αποδίδονται στην οντότητα frbr: Πρόσωπο και ανάλυσή τους.........102

Πίνακας 8. Χρήση πεδίων Marc21 στη δημιουργία καθιερωμένων και βιβλιογραφικών εγγραφών των FRBR οντοτήτων Έργο, Εκδήλωση, Έκφραση.......103

Πίνακας 9. Ανάλυση ιδιοτήτων της οντότητας frbr: Έργο................................106

Πίνακας 10. Ανάλυση ιδιοτήτων της οντότητας frbr:Έκφραση.................108

Πίνακας 11. Οπτικοποίηση βιβλιογραφικής εγγραφής σε MARC21 δομή..........109

Πίνακας 12. Περιγραφή του manifestation σε πίνακα..................................112

Πίνακας 13. Αντιστοίχηση πεδίων MARC21 με FRBR και RDF στο ισπανικό μοντέλο.........................................................................118

Πίνακας 14.Μετατροπή σε RDF των πεδίων MARC21 με το εργαλείο Marimba................121

Πίνακας 15. Παράδειγμα μίας owl:SameAs σύνδεσης στο datos.bne.es.........126

Πίνακας 16. Οπτικοποίηση βιβλιογραφικής εγγραφής με isbn: “0224019902”...133

Πίνακας 17. Παραδείγματα προτύπων URIS από τη βρετανική βιβλιοθήκη.......134

Πίνακας 18. Οπτικοποίηση Βιβλιογραφικής εγγραφής σε δομή MARC21..........138

Πίνακας 19. Αντιστοίχηση πεδίων MARC21 με το μοντέλο της βρετανικής βιβλιοθήκης..............................................................142

Πίνακας 20. Συγκριτικός πίνακας λεξιλογίων των δύο μοντέλων..............148

Πίνακας 21. Συγκριτικός Πίνακας συμπερασμάτων των δύο μοντέλων...........150

Πίνακας 22. Οπτικοποίηση βιβλιογραφικής εγγραφής του παραδείγματος σε δομή MARC21από την ισπανική βιβλιοθήκη........................................153

Πίνακας 23. Ανάλυση ιδιοτήτων του manifestation της εικόνας 16...........154

16

Πίνακας 24. Οπτικοποίηση βιβλιογραφικής εγγραφής του παραδείγματος σε δομή MARC21από τη βρετανική βιβλιοθήκη........................................155

Πίνακας 25. Περιγραφή μέρους (part) και συνόλου (whole) του έργου........158

Πίνακας 26. Περιγραφή της έκφρασης του έργου.............................158

Πίνακας 27. Συγκριτικός πίνακας αντιστοίχησης MARC21 σε RDF μεταξύ των δύο μοντέλων.................................................................159

Πίνακας 28. Αναγωγή βρετανικής εγγραφής στο ισπανικό μοντέλο.............162

ΠΕΡΙΛΗΨΗ

Tο 2006 ο πατέρας του σύγχρονου Παγκόσμιου Ιστού Tim Berners-Lee

παρουσίασε τις “Αρχές συνδεδεμένων Δεδομένων” για τη δημιουργία ενός

ιστού αντικειμένων με Συνδεδεμένα Δεδομένα. Ουσιαστικά, εισήγαγε μία

νέα προοπτική στη συνδεσιμότητα των δεδομένων από ποικίλους και

πολλαπλούς τομείς και όπως το Πρόγραμμα Συνδεδεμένα Δεδομένα [(LOD)

Linking Open Data Project], προσέφερε ευκαιρίες στην υποστήριξη της

διαλειτουργικότητας σε εξαιρετικά δομημένα δεδομένα σαν αυτά των

βιβλιοθηκών μέσω των τεχνολογιών και των μεθοδολογιών του

Σημασιολογικού Ιστού. Οι τεχνολογικές και μεθοδολογικές αυτές

καινοτομίες ισχυροποιούν σταδιακά τη θέση τους στο πεδίο της

διαχείρισης των δεδομένων και της γνώσης. Πρότυπα για την οργάνωση

17

και επερώτηση σημασιολογικής πληροφορίας, όπως τα RDF(S) και SPARQL,

υιοθετήθηκαν από μεγάλες κοινότητες, ενώ εταιρικοί πάροχοι θέτουν σε

εφαρμογή σημασιολογικές τεχνολογίες για να οργανώσουν, εκθέσουν,

ανταλλάξουν και ανακτήσουν τα δεδομένα τους.

Το μοντέλο Web 3.0, η ψηφιακή πραγματικότητα, οι νέες

τεχνολογίες, η διαμόρφωση νέων τάσεων, ο ανταγωνισμός, ο σύγχρονος

τρόπος παραγωγής της γνώσης και γενικότερα η ιδέα της δημιουργίας ενός

παγκόσμιου ιστού όπου τα υπολογιστικά συστήματα κατανοούν την

πληροφορία και προσφέρουν προηγμένες υπηρεσίες, δε θα μπορούσαν να

αφήσουν ανεπηρέαστο ένα τοπίο σαν αυτό της κοινότητας των Επιστημόνων

της Πληροφορίας.

Πιο συγκεκριμένα, οι Βιβλιοθήκες εφόσον είναι ένας χώρος που

δομεί, κωδικοποιεί και διαθέτει τα δεδομένα του ακολουθώντας

καθορισμένες διαδικασίες και πρότυπα, δεν είναι δυνατόν να μείνουν

ανεπηρέαστες από τις ραγδαίες εξελίξεις που αφορούν τις διαδικασίες

κοινής χρήσης των δεδομένων. Για τον σκοπό αυτό ερευνούνται οι

δυνατότητες των ήδη υπαρχόντων κανόνων και προτύπων να προσαρμοστούν

στις τρέχουσες τεχνολογικές εξελίξεις, καθώς επίσης και η ανάπτυξη

και μετάβαση σε νέες μορφές, δομές και υπηρεσίες. Κύριος συντονιστής

σε αυτές τις διαδικασίες είναι ομάδα Library Linked Data Incubator

Group1 για τα Συνδεδεμένα Δεδομένα των Βιβλιοθηκών [LLD(Library

Linked Data)] της επιτροπής του σημασιολογικού ιστού W3C.

1http://www.w3.org/2005/Incubator/lld/18

Για τη δημοσίευση και τη διασύνδεση δομημένων δεδομένων, όπως αυτά

των βιβλιοθηκών, η επιτροπή W3C έχει υποδείξει ένα σύνολο βέλτιστων

πρακτικών που εφαρμόζονται στον παγκόσμιο ιστό γνωστές ως Συνδεδεμένα

Δεδομένα [(LD) Linked Data]. Επιπρόσθετα έχει αναπτύξει μια εφαρμογή

δημοσίευσης δεδομένων ελεύθερης πρόσβασης εφαρμόζοντας τους κανόνες

συνδεδεμένων δεδομένων η οποία είναι γνωστή ως Σύννεφο Ανοιχτών

Συνδεδεμένων Δεδομένων [( Linking Open Data Cloud Diagram) (LOD)].

Λέξεις κλειδιά:

Σημασιολογικός Ιστός, Συνδεδεμένα Δεδομένα, Βιβλιοθήκες,

Βιβλιογραφικά Δεδομένα, Ομάδα “Incubator”

Abstract

In 2006 the father of the modern World Wide Web Tim Berners-Lee

presented the “Linked Data Principles” for the creation of a web of

objects named Linked Data. Basically, he introduced a new perspective

in the connection of the data from different and multiple sectors

such as the Linking Open Data Project, which offered opportunities

in the support of the interoperability in exceptionally structured

data such as the ones in libraries, through technology and

methodology of the Semantic Web. Those technological and

methodological innovations gradually strengthen their position in the

field of managing data and knowledge. Standards for effective and

efficient organization of semantic information, such RDF(S) και

SPARQL, were adopted from large communities, whereas company

19

providers apply semantic technologies to organize, exhibit, exchange

and recover their data.

The Web 3.0 model, virtual reality, new technologies, new trend,

competition , the modern way knowledge is produced and in general

the idea of creating a world wide web where the τα υπολογιστικά

συστήματα understand information and advanced services, could not

leave the scientists of Information Technology community unaffected.

To be precise, since a library is the place that structures,

codes and provides data following certain procedures and standards,

it is not possible to remain unaffected by the current developments

that involve the procedures of common data use. For this purpose the

potential of existent rules and standards to adapt to the current

technological affairs is being investigated, as well as the

development and transition in new forms, structures and services. The

main coordinator in these procedures W3C Library Linked Data

Incubator Group.

The publish and link of structured data such as the ones in

libraries the committee W3C has suggested a set of best practices

that at are applied on the world web know as Linked Data. Furthermore

the committee has developed an application that enables the

publishing of free-access data while using the rules of linked data

known as Linking Open Data Cloud Diagram.

Key Words:

20

Semantic Web, Linked Data, Libraries, Bibliographic data,

Incubator Group

21

Εισαγωγή-Στόχοι διπλωματικής

Πριν αλλά και κατά τη διάρκεια της σταδιακής και χρόνιας

πορείας της αξιοποίησης των τεχνολογιών του σημασιολογικού ιστού οι

βιβλιοθήκες τείνουν να έχουν έναν πρωταγωνιστικό ρόλο στη δημιουργία,

διαχείριση και οργάνωση των δεδομένων της πολιτισμικής πληροφορίας

και πολιτισμικής πληροφορικής. Δημιουργούν, διατηρούν και

επιμελούνται ένα πολύ μεγάλο όγκο υψηλής ποιότητας δεδομένων που

αφορούν σε πόρους συλλογών στοιχείων μεταδεδομένων και όρων

λεξιλογίων τα οποία δομούν, κωδικοποιούν και διαθέτουν ακολουθώντας

καθορισμένες διαδικασίες και πρότυπα. Οι σύγχρονες βιβλιοθήκες

μετατρέπονται σε χώρους ελεύθερης πρόσβασης διαθέτοντας πολυμορφικές

πληροφορίες από ετερογενείς πηγές. Οι δράσεις των βιβλιοθηκών,

αξιοποιούν και αφομοιώνουν τις αλλαγές που απορρέουν από τη χρήση των

νέων τεχνολογικών εργαλείων στις προσφερόμενες υπηρεσίες τους και

γίνονται πλέον πιo εξωστρεφείς με σκοπό την ικανοποίηση των αναγκών

των χρηστών στο μέγιστο δυνατό βαθμό. Ο τρόπος που το δομημένο υλικό

των βιβλιοθηκών αξιοποιείται μέσω των τεχνολογιών του σημασιολογικού

ιστού διαφέρει ριζικά από τη σύλληψη που βασίζονταν οι μορφές

δεδομένων τον εικοστό αιώνα. Παράλληλα, διευκολύνεται η ανάπτυξη των

βασικών διοικητικών υπηρεσιών βιβλιοθήκης αλλά και των υπηρεσιών των

χρηστών και διευρύνεται η αξία τους πέρα από τα παραδοσιακά τους

όρια. Τα δεδομένα του σημασιολογικού ιστού δομούν τα δεδομένα ως

22

γράφους, οι οποίοι θεωρητικά, μπορούν να είναι απεριόριστοι μέσω

ειδικών φυλλομετρητών δίνοντας τη δυνατότητα στο χρήστη να πλοηγηθεί

από μία πηγή δεδομένων σε άλλες παρεμφερείς πηγές μέσω συνδέσεων.

Πράγματι, την τελευταία δεκαετία οι βιβλιοθήκες, τα μουσεία και

τα αρχεία έχοντας πλήρη αντίληψη των παραπάνω προοπτικών δείχνουν

μεγάλο ενδιαφέρον για τη σημασιολογική οργάνωση της πληροφορίας τους

και παρέχουν μέρος της ως ανοιχτά συνδεδεμένα δεδομένα. Από

πρωτοβουλίες αξιόλογου αριθμού βιβλιοθηκών, θεματικές επικεφαλίδες

και όροι θησαυρών παρέχονται πλέον διαδικτυακά με τη χρήση των

κατάλληλων σημασιολογικών τεχνολογιών επιτυγχάνοντας ταυτόχρονα τη

βελτίωση των μηχανισμών αναζήτησης με πιο ποιοτικά αποτελέσματα κατά

τις διαδικασίες ανάκτησης των δεδομένων και παραγωγής των

πληροφοριών.

Η χρήση των ανοιχτών συνδεδεμένων δεδομένων στις βιβλιοθήκες,

δημιουργεί ένα ανοιχτό, παγκόσμιο απόθεμα κοινών στοιχείων, το οποίο

αποσκοπεί στη χρησιμοποίηση και επαναχρησιμοποίηση της περιγραφής

των πόρων τους, καθώς και στον περιορισμό του κόστους και των

περιττών προσπαθειών σε τρέχουσες διαδικασίες καταλογογράφησης.

Στόχοι διπλωματικής

Η παρούσα διπλωματική εργασία κινείται στον παραπάνω άξονα και

συμβάλλει προς αυτή την κατεύθυνση αναλύοντας και ερευνώντας στο

πρώτο -θεωρητικό- μέρος της, τις πιο σημαντικές από τις έρευνες που

έχουν πραγματοποιηθεί από την ομάδα “Incubator”. Η αποστολή της

ομάδας έχει να κάνει με την αύξηση της παγκόσμιας διαλειτουργικότητας

23

των δεδομένων των βιβλιοθηκών στο διαδίκτυο φέρνοντας σε επαφή τα

άτομα που εμπλέκονται με τις δραστηριότητες του σημασιολογικού ιστού

αξιοποιώντας τις υφιστάμενες πρωτοβουλίες. Το περιεχόμενο της έρευνας

αποτελείται από βασικές ενότητες πρακτικών και θεωρητικών

προσεγγίσεων και προδιαγραφών Συνδεδεμένων Δεδομένων Βιβλιοθηκών.

(βλ. Κεφάλαιο 2)

Η μετάβαση των βιβλιοθηκών στη νέα γενιά συστημάτων, αντανακλά

τη χρήση εννοιολογικών μοντέλων. Μία από τις διατάξεις που μπορεί να

υποστηρίξει λειτουργικά αυτήν την καινοτομία είναι το πρότυπο

κωδικοποίησης βιβλιογραφικών δεδομένων MARC21 και το εννοιολογικό

μοντέλο FBRR. Γι’αυτούς τους λόγους, γίνεται αναφορά για το MARC21

και τους FRBR σε δύο ξεχωριστά κεφάλαια (βλ. Κεφάλαιο 3 και 4

αντίστοιχα).

Στο δεύτερο μέρος της εργασίας -το πρακτικό- εξετάζονται οι

διαδικασίες μετατροπής από καθιερωμένες και βιβλιογραφικές εγγραφές

καταλόγων από την MARC21 δομή σε RDF και συνδεδεμένα δεδομένα. Τα

παραδείγματα των εγγραφών επιλέχθηκαν από τους καταλόγους δύο

μεγάλων Ευρωπαϊκών Εθνικών Βιβλιοθηκών, της Βρετανίας και της

Ισπανίας, δεδομένης της σημαντικής συμβολής τους στην ανάπτυξη,

εφαρμογή, και ανταλλαγή των βιβλιογραφικών δεδομένων. Ο σκοπός των

παραδειγμάτων, μέσω της ανάλυσης της πολιτικής επεξεργασίας και

δημοσίευσης των δεδομένων, αποτελεί η αναπαράσταση της μεθοδολογίας

μετατροπής και αρχιτεκτονικής των διαφορετικών μοντέλων που η κάθε

βιβλιοθήκη χρησιμοποιεί για τη διασύνδεση των δεδομένων της. Μέσω της

συγκριτικής αυτής μελέτης οδηγούμαστε σε εύλογα συμπεράσματα για τη

24

νέα προοπτική της κοινής διάθεσης και διασύνδεσης των βιβλιογραφικών

δεδομένων μέσω του σημασιολογικού ιστού και των νέων εφαρμογών

διαχείρισης γνώσης. Επιπρόσθετα, επισημαίνεται σε τί βαθμό

εφαρμόζεται η χρήση των πρακτικών και των κανόνων που συνίστανται

από τον W3C για τη διασύνδεση και την ελεύθερη δημοσίευση των

βιβλιογραφικών δεδομένων. Βάσει των παραπάνω, θα καταλήξουμε στα

πλεονεκτήματα και τα μειονεκτήματα του κάθε μοντέλου κατανοώντας και

συγκρίνοντας τις διαφορές και τα οφέλη που δύναται να αποκομίσει η

κοινότητα των βιβλιοθηκών από τη δημοσίευση των συνδεδεμένων

δεδομένων αναδεικνύοντας την ανάγκη να δοθεί σημαντική έμφαση σε

προσπάθειες προτυποποίησης βιβλιογραφικών περιγραφών και την αναφορά

τους ως οντοτήτων στο διαδίκτυο.

Τα συνδεδεμένα δεδομένα δεν σκοπεύουν στη δημιουργία ενός

διαφορετικού ιστού αλλά στον εμπλουτισμό του με την προσθήκη

δομημένων στοιχείων στο περιεχόμενό του ώστε να γίνονται κατανοητά,

να ερμηνεύονται και να χρησιμοποιούνται τόσο από ανθρώπους όσο και

από ηλεκτρονικούς υπολογιστές για τη διευκόλυνση της μεταξύ τους

συνεργασίας.

25

KΕΦΑΛΑΙΟ 1

Συνδεδεμένα δεδομένα και βιβλιοθήκες

1.1 Βιβλιοθήκες “Προ” συνδεδεμένων δεδομένων

Η μετατροπή των παρεχόμενων υπηρεσιών των βιβλιοθηκών καθώς και

η παραγωγή των πληροφοριών τους από χειροκίνητες σε αυτοματοπoιημένες

διαδικασίες είναι μία διαδικασία η οποία χρονολογείται περίπου

πενήντα χρόνια πριν, στα μέσα δηλαδή, της δεκαετίας του 1960. Μέσα σε

αυτήν τη δεκαετία κάνουν την εμφάνισή τους κεντρικοί υπολογιστές

κατάλληλοι για επεξεργασία μεγάλης κλίμακας δεδομένων και

αξιοποιούνται από μεγάλα ιδιωτικά και δημόσια ιδρύματα, μεταξύ των

οποίων και της πλουσιότερης βιβλιοθήκης παγκοσμίως, της Βιβλιοθήκης

του Κογκρέσου (LC [Library of Congress]). Δύο βασικές υλοποιήσεις

έρχονται να συμπληρώσουν την τεχνολογική και πληροφοριακή εξέλιξη

στον χώρο των βιβλιοθηκών.

Η μία είναι, ο σχεδιασμός του MarcProject (1966-1967) (βλ.

Κεφάλαιο 3), από τη Βιβλιοθήκη του Κογκρέσου μία διάταξη

κωδικοποίησης που καθιστά δυνατή τη δημιουργία και αποθήκευση των

βιβλιογραφικών εγγραφών σε ψηφιακή μορφή οι οποίες υποστηρίζονται από

την ανταλλαγή δεδομένων (μέσω των πρώιμων δικτύων συνεργασίας, όπως

26

τα OCLC2, UTLAS3, RLIN4, WLN5κλπ). Σχεδόν παράλληλη είναι η δημιουργία

των Αγγλο-Αμερικάνικων Κανόνων Καταλογογράφησης (AACR [Anglo-American

Cataloging Rules]) από την LC (1967, πρώτη έκδοση) που αφορούν

κανόνες καταλογογράφησης οι οποίες ομαδοποιούν σχεδόν όλες τις

περιπτώσεις βιβλιογραφικών περιγραφών που είχαν ως τότε εμφανιστεί

με σημαντική καινοτομία την έμφαση στην πνευματική ιδιοκτησία των

έργων κατά την περιγραφή τους.

Η αυτοματοποίηση σε συνδυασμό με τον τεράστιο όγκο, την

ποικιλομορφία των διαθέσιμων πληροφοριών, τις μεθόδους πρόσβασης και

το περιβάλλον χρήσης των πηγών πληροφόρησης οδήγησαν στην ανάπτυξη

των τεχνολογιών πληροφορικής και κατ'επέκταση στη δημιουργία των

Ολοκληρωμένων Συστημάτων Βιβλιοθηκών (ILS [Integrated Library

Systems]). Τέτοιες εφαρμογές λογισμικών άρχισαν να γίνονται

οικονομικά προσιτές σε σχεδόν όλο το σύνολο των βιβλιοθηκών

αναπτύσσοντας ολοένα και περισσότερες λειτουργίες με σχεδιασμούς

“φιλικούς προς τους χρήστες”. Οι συλλογές τους έγιναν προσβάσιμες στο

κοινό μέσω των Ανοιχτών Δημόσιων Καταλόγων (OPACs [On-Line Access

Public Catalogues]) και των Ηλεκτρονικών Καταλόγων (WebPacs), όπου

πλέον οι χρήστες διεξάγουν αναζητήσεις στις συλλογές των βιβλιοθηκών

από οποιοδήποτε διαδικτυακό σημείο. Μία από τις αρχιτεκτονικές των

2 http://oclc.org/en-europe/home.html

3http://www.acronymfinder.com/University-of-Toronto-Library-Automated-Systems- (UTLAS).html

4 http://www.acronymfinder.com/Research-Libraries-Information-Network-(RLIN).html

5 http://www.acronymfinder.com/Western-Library-Network-(WLN).html27

ενοποιημένων συστημάτων που αξιοποιούν οι χρήστες των βιβλιοθηκών

είναι η Υπηρεσία Μετα-αναζήτησης (Federated Search) ή παράλληλης

αναζήτησης ή εικονικός συλλογικός κατάλογος όπου οι απαντήσεις των

επερωτήσεών τους παρουσιάζονται ενοποιημένες από ένα κεντρικό

σύστημα.

Ωστόσο, πολλές είναι οι πηγές που βρίσκονται πίσω από πληροφοριακά συστήματα

χωρίς να παρέχουν καμία δυνατότητα άμεσης πρόσβασης στους πόρους και τη δομή τους

(Σφακάκης,2010). Τα βιβλιογραφικά δεδομένα “κατοικοεδρεύουν” σε βάσεις

δεδομένων που δε συνδέονται με άλλες πηγές στο διαδίκτυο και ένας

σημαντικός αριθμός από αυτά τα δεδομένα και άλλα είδη πόρων στον

ιστό, που δια-μοιράζουν δεδομένα για ημερομηνίες, γεωγραφικές

πληροφορίες, πρόσωπα και οργανισμούς παραμένει ανεκμετάλλευτος. Σε

ένα περιβάλλον συνδεδεμένων δεδομένων όλα αυτά τα σημεία κατά ένα

μεγάλο ποσοστό συνδέονται.

Βάσει των παραπάνω αναγκών και των αλλαγών προκύπτουν οι πρώτες

προσπάθειες απελευθέρωσης βιβλιογραφικών δεδομένων από τα φυσικά όρια

των δελτιοκαταλόγων με την εκμετάλλευση της δυνατότητας της ευέλικτης

χρήσης των ίδιων των πληροφοριών μέσα στο ψηφιακό περιβάλλον. Οι

πλέον ευέλικτες πληροφορίες με τη στήριξη των τεχνολογιών του

σημασιολογικού ιστού, δημιουργούν ανοιχτά βιβλιογραφικά στοιχεία για

κοινή χρήση και ελεύθερη επαναχρησιμοποίηση για κάθε σκοπό και

μεγιστοποιoύν την εφαρμογή των εργασιών τους έξω από το περιβάλλον

της βιβλιοθήκης.

28

Συνεπώς, οι βιβλιοθήκες εμπλέκονται όλο και περισσότερο στο

δίκτυο των συνδεδεμένων δεδομένων στηριζόμενες στις παραδοσιακές τους

δραστηριότητες6 :

Στη διαχείριση των πόρων για τρέχουσα χρήση

Στη μακροχρόνια διαφύλαξη και περιγραφή των πόρων βασισμένη

σε συμφωνηθέντες κανόνες

Στην ανταπόκριση των αναγκών των χρηστών που αναζητούν

πληροφορίες.

Η ήδη δρομολογημένη μετάβαση των μεταδεδομένων και η έξοδός τους

από τον βαθύ ιστό καταδεικνύει σημαντικές αλλαγές στον χώρο οργάνωσης

της πληροφορίας. Η πρόσβασή τους από τις μηχανές αναζήτησης αλλά και

η σύνδεση των καταλόγων των βιβλιοθηκών με τα μέσα κοινωνικής

δικτύωσης θα αυξήσει την επισκεψιμότητα στις ιστοσελίδες τους και εν

τέλει θα τις βοηθήσει να ανταποκριθούν αρτιότερα στον δημόσιο

χαρακτήρα τους. Οι βιβλιοθήκες αποδέχονται το διαδίκτυο των

πληροφοριών κάνοντας τόσο τα δεδομένα τους διαθέσιμα για χρήση ως

συνδεδεμένα δεδομένα αλλά και χρησιμοποιώντας το δίκτυο των δεδομένων

στις υπηρεσίες βιβλιοθήκης. Στην ιδανική περίπτωση θα πρέπει να

υπάρχει πλήρης ενσωμάτωση των βιβλιοθηκονομικών δεδομένων με πόρους

του παγκόσμιου ιστού, δημιουργώντας μεγαλύτερη ορατότητα για τις6 Lynne C.Howarth(2012):FRBR and Linked Data:Connecting FRBR and Linked Data,

Cataloging & Classification Quarterly, 50:5-7, 763-776 (κείμενο σε ελεύθερη

μετάφραση), διαθέσιμο στο: http://dx.doi.org/10.1080/01639374.2012.680835 [Ημερομηνία ανάκτησης, 22/05/2014]

29

βιβλιοθήκες και κάνοντας τις υπηρεσίες των βιβλιοθηκών προσιτές για

τους ερευνητές της πληροφορίας. Με το ήθος τους, τον ποιοτικό έλεγχο

και τη δέσμευση για μακροχρόνια συντήρηση, οι βιβλιοθήκες θα έχουν

μια σημαντική συμβολή στην παραγωγή της σημασιολογικής πληροφορίας.

1.2. Βιβλιογραφικά δεδομένα

Οι παραδοσιακές μορφές δεδομένων βιβλιοθήκης συνδυάζουν την

έννοια των δεδομένων μέσω μιας δομημένης κωδικοποίησης. Σύμφωνα με

την Ομάδα Εργασίας για τα

30

Ανοιχτά Βιβλιογραφικά Δεδομένα του Οργανισμού Ανοιχτής Γνώσης

(Open Bibliographic Data Working Group of the Open Knowledge Foundation ) τα

βιβλιογραφικά δεδομένα χωρίζονται σε δύο κατηγορίες:

A. Βασικά δεδομένα (Core Data)

Τα βιβλιογραφικά δεδομένα αποτελούνται από βιβλιογραφικές

περιγραφές που περιγράφουν έναν βιβλιογραφικό πόρο (ένα άρθρο ή μια

μονογραφία- ηλεκτρονικό ή έντυπο-),με σκοπό να προσδιορίσουν και να

εντοπίσουν τον περιγραφόμενο πόρο. Μία βιβλιογραφική περιγραφή

παρέχει πληροφορίες που αφορούν όλα τα στοιχεία περιγραφής ενός έργου

με τη σειρά που ορίζει ένα συγκεκριμένο πρότυπο. Οι συγκεκριμένες

πληροφορίες αφορούν συγγραφείς, συντάκτες, τίτλους, εκδότες, την

τοποχρονολογία έκδοσης, τα στοιχεία φυσικής περιγραφής και

προσδιορίζουν τις αρχικές πηγές που μπορεί να είναι ο τίτλος ενός

περιοδικού ή οι σελίδες στις οποίες εμπεριέχεται ένα άρθρο καθώς και

άλλες βιβλιογραφικές πληροφορίες.

Στο διαδικτυακό περιβάλλον η ταυτοποίηση των βιβλιογραφικών

δεδομένων γίνεται με τη χρήση σχημάτων ονοματολογίας (αναγνωριστικών)

όπως είναι τα URN (Uniform Resource Name), τα DOI (Digital Object

Identifier) κ.ά. Ο εντοπισμός ενός στοιχείου πραγματοποιείται μέσω

των HTTP-URIs (URLs). Εν κατακλείδι, όλα τα ενιαία αναγνωριστικά

[URIs (Uniform Resource Identifiers)] των βιβλιογραφικών πηγών

εμπίπτουν στη στενή έννοια των βιβλιογραφικών δεδομένων.

Β. Δευτερεύοντα δεδομένα (Secondary Data)

31

Μια βιβλιογραφική περιγραφή μπορεί να περιλαμβάνει και άλλες

πληροφορίες που επίσης εμπίπτουν στη στενή έννοια των βιβλιογραφικών

δεδομένων όπως είναι τα παρακάτω “μη-διαδικτυακά” αναγνωριστικά (no-

Web Identifiers):

Διεθνής Μοναδικός Αριθμός Βιβλίου (ISBN

[International Standard Book Number)]

Ο Αριθμός Ελέγχου της Βιβλιοθήκης του Κογκρέσου (LCCN

[Library of Congress Control Number])

OCLC (Online Computer Library Center)

Ισχυρισμοί Δικαιωμάτων (Rights Assertion)

Διοικητικά Δεδομένα (Administrative Data)

Τα παραπάνω δεδομένα παράγονται από βιβλιοθήκες αλλά και από

εκδότες, ερευνητές, κοινωνικά συστήματα διαχείρισης πληροφοριών κ.ά.

Επιπλέον οι βιβλιοθήκες και τα συναφή όργανα παράγουν ελεγχόμενα

λεξιλόγια για τους σκοπούς των βιβλιογραφικών περιγραφών και της

οργάνωσης της γνώσης, όπως είναι τα θεματικά ευρετήρια, οι

ταξινομίες, τα αρχεία καθιερωμένων όρων, οι θησαυροί κ.ά., που

επίσης εμπίπτουν στην έννοια των βιβλιογραφικών δεδομένων.

1.2.1 Ανοιχτά βιβλιογραφικά δεδομένα7

Οι παραγωγοί των βιβλιογραφικών δεδομένων όπως είναι από την

εγγενή φύση τους οι βιβλιοθήκες, οι εκδότες, τα πανεπιστήμια ή

επιστημονικοί και κοινωνικοί φορείς που διαχειρίζονται βιβλιογραφικό7 http://opendefinition.org (κείμενο σε ελεύθερη μετάφραση)

32

περιεχόμενο έχουν πρωταρχικό ρόλο στην υποστήριξη της ανθρώπινης

γνώσης. Διαθέτοντας τα βιβλιογραφικά δεδομένα σε μια “Υπηρεσία

Ανοικτών Βιβλιογραφικών Δεδομένων” διαθέσιμη σε κάθε ενδιαφερόμενο

φορέα που διαχειρίζεται βιβλιογραφικό περιεχόμενο στοχεύουν στην

παροχή επικαιροποιημένων και έγκυρων βιβλιογραφικών δεδομένων με τον

μέγιστο δυνατό βαθμό βιωσιμότητας και επανάχρησης από τις

επιστημονικές κοινότητες. Η Υπηρεσία μπορεί να επιτρέπει τη

μεταφόρτωση, τη διαχείριση και τον εμπλουτισμό των βιβλιογραφικών

δεδομένων από τον τελικό χρήστη, τη δημιουργία σχετικών διαδικασιών

ελέγχου ποιότητας και την τελική διάθεση των βιβλιογραφικών δεδομένων

ως ανοιχτών συνδεδεμένων δεδομένων. Τα πλεονεκτήματα μιας τέτοιας

υπηρεσίας συνοψίζονται ως ακολούθως:

Εξασφάλιση πληρέστερων και ποιοτικών βιβλιογραφικών

δεδομένων μέσω της συνεισφοράς των τελικών χρηστών

Ανοιχτή διάθεση αξιόπιστων βιβλιογραφικών δεδομένων

Μείωση κόστους συντήρησης βιβλιογραφικών δεδομένων

Δημιουργία υπηρεσιών προστιθέμενης αξίας βασισμένων

στα ανοιχτά διασυνδεδεμένα βιβλιογραφικά δεδομένα.

Προκειμένου η δημοσίευση των ανοιχτών βιβλιογραφικών δεδομένων να

πραγματοποιείται βάσει αρχών και κανόνων ώστε να επιτευχθεί η

ομοιομορφία και η συνεργασία μεταξύ των φορέων δημοσίευσης η “Ομάδα

Εργασίας για τα Ανοιχτά Βιβλιογραφικά Δεδομένα του Οργανισμού

Ανοιχτής Γνώσης” προτείνει επίσημα τις παρακάτω “Αρχές Δημοσίευσης

Ανοιχτών Βιβλιογραφικών Δεδομένων”. (βλ. Υποκεφάλαιο 1.2.2).

33

1.2.2 Τέσσερις Αρχές Ανοιχτών Βιβλιογραφικών Δεδομένων8

1. Μεγίστης σημασίας για τους παρόχους των δεδομένων κατά τη

δημοσίευση των βιβλιογραφικών δεδομένων ή των συλλογών των

βιβλιογραφικών δεδομένων, είναι η ρητή και σαφής δήλωση των

επιθυμιών και των προσδοκιών τους, σε ό,τι αφορά την

επαναχρησιμοποίηση και τον προσδιορισμό της χρήσης των ατομικών

βιβλιογραφικών περιγραφών, ολόκληρης της συλλογής δεδομένων και

των υποσυνόλων της. Η παραπάνω δήλωση πρέπει να είναι ακριβής

και αμετάκλητη και να βασίζεται σε μία κατάλληλα αναγνωρισμένη

νομική δήλωση με μορφή πιστοποίησης ή άδειας. Ειδικότερα, η

κοινότητα των βιβλιοθηκών θεωρείται μια αντιπροσωπευτική

περίπτωση ευρείας εφαρμογής προτύπων κωδικοποίησης και

πρωτοκόλλων διάθεσης των πηγών.

2. Πολλές ευρέως αναγνωρισμένες άδειες, δεν προορίζονται ούτε

είναι κατάλληλες για βιβλιογραφικά δεδομένα ή για τις συλλογές

τους. Κάποιες πιστοποιήσεις και άδειες κατάλληλα σχεδιασμένες

για την επεξεργασία των δεδομένων, περιγράφονται στην

ηλεκτρονική διεύθυνση:

http://opendefinition.org/licenses

8 Οι αρχές των ανοιχτών βιβλιογραφικκών δεδομένων είναι δημοσιευμένες στην ιστοσελίδα: http :// openbiblio . net / principles / , και εκεί στηρίχτηκε το κείμενο σε ελεύθερη μετάφραση

34

Οι άδειες Creative Commons (εκτός από την CC09), τις GFDL10,

GPL11, BSD12 δεν είναι κατάλληλες για τα δεδομένα και η χρήση

τους δε συνίσταται.

. Oι άδειες που υπόκεινται σε περιοριστικούς όρους αφορούν

την περαιτέρω εμπορική χρήση και την παραγωγή παράγωγων έργων

και δε συνίστανται. Εξαίρεση αποτελούν όσες χρησιμοποιούνται

από συγκεκριμένα πρόσωπα και οργανώσεις και για συγκεκριμένους

σκοπούς. Οι άδειες αυτές καθιστούν με αποτελεσματικότητα την

ενσωμάτωση και τον επαναπροσδιορισμό του σκοπού των συνόλων των

δεδομένων. Επίσης αποτρέπουν, εμπορικές υπηρεσίες και

δραστηριότητες επιπρόσθετης αξίας και υποστήριξης συντήρησης

βιβλιογραφικών δεδομένων. Τα δεδομένα θα πρέπει να είναι

ανοιχτά σύμφωνα με τον ορισμό του "ανοιχτού" και δεν πρέπει να

χρησιμοποιούνται σε εμπορικές και άλλες περιοριστικές ρήτρες

προκειμένου να επιτευχθεί η αποτελεσματική χρήση και η ορθή

συμπλήρωσή τους από τρίτους.

. Επιπρόσθετα, συνίσταται η υποχρέωση της σαφούς

τοποθέτησης των βιβλιογραφικών δεδομένων ή των συλλογών τους

στο δημόσιο τομέα μέσω της άδειας Public Domain Dedication and

Licenseή της CC0, ιδίως όταν υπάρχει χρηματοδότηση από το

δημόσιο. Ως εκ τούτου μέσω του δημόσιου τομέα, προωθείται η

9 https://creativecommons.org/choose/zero/

10 http://opendefinition.org/licenses/gfdl/

11 http://www.gnu.org/copyleft/gpl.html

12 http://www.linfo.org/bsdlicense.html35

μέγιστη δυνατή επαναχρησιμοποίηση των δεδομένων, σύμφωνα με το

γενικό ήθος της ανταλλαγής στο πλαίσιο της χρηματοδοτούμενης

πολιτιστικής κληρονομιάς.

1.3 Συνδεδεμένα Δεδομένα13

Τα συνδεδεμένα δεδομένα από την άλλη, αναφέρονται σε μια

μεθοδολογία συσχέτισης πραγμάτων (δομημένων δεδομένων, εννοιών και

εγγράφων) στον παγκόσμιο ιστό και έχουν δημοσιευτεί βάσει

σχεδιασμένων αρχών με σκοπό τη δημιουργία συνδέσεων μεταξύ πόρων

συλλογών, στοιχείων μεταδεδομένων και όρων λεξιλογίων. Από

τεχνολογικής άποψης τα συνδεδεμένα δεδομένα κινούνται γύρω από δύο

βασικούς άξονες. Ο προσδιορισμός των πραγμάτων και των σχέσεών τους

προσδιορίζονται (ονομάζονται) με URIs για την ταυτοποίηση κάθε είδους

πόρου ως παγκόσμιο μοναδικό αναγνωριστικό. Σύμφωνα με την ομάδα

“Incubator” τα συνδεδεμένα δεδομένα μπορούν να κάνουν και χρήση

των ενιαίων αναγνωριστικών IRIs (Internationalized Resource

Identifiers) χρησιμοποιώντας το εκτεταμένο σύνολο των φυσικών γλωσσών

που υποστηρίζονται από διεθνείς κωδικούς. Η δημοσίευση (πρόσβαση)

των δεδομένων γίνεται μέσω του Πρωτόκολλου Μεταφοράς Υπερκειμένου

[(HTTP) Hypertext Transfer (or Transport) Protocol]. Για την

περιγραφή των δεδομένων επικεντρωμένη πλέον στις νοηματικές και

ουσιαστικές σχέσεις μεταξύ των πραγμάτων, και τη σύνδεσή τους με

σταθερά λεξιλόγια, χρησιμοποιείται η τεχνολογία του προτύπου “Πλαίσιο

13 http://www.w3.org/2005/Incubator/lld/XGR-lld-20111025/#Scope_of_this_report (κείμενο ελεύθερη μετάφραση)

36

Περιγραφής Πόρων” [(RDF) Resource Description Framework], ενός

μοντέλου αναπαράστασης δεδομένων που προδιαγράφει σχέσεις μεταξύ

αντικειμένων και εννοιών. Το RDF χρησιμοποιεί τριαδικούς συνδυασμούς πόρων

ιστού και επιτυγχάνει την προβολή μίας σαφούς μεθόδου έκφρασης σημασιολογίας σε

μηχαναγνώσιμη κωδικοποίηση. (Miller, 1998).

1.3.1 Aνοιχτά Δεδομένα14

Τα συνδεδεμένα δεδομένα αναφέρονται στην τεχνολογική

διαλειτουργικότητα των δεδομένων ενώ τα “Ανοιχτά Δεδομένα” σύμφωνα με

τον ορισμό των “Ανοιχτών Βιβλιογραφικών Δεδομένων και Μεταδεδομένων”

(βλ. Κεφάλαιο 1.2.1) διατίθενται με τέτοια άδεια, ώστε ο οποιοσδήποτε

να μπορεί να τα χρησιμοποιεί, να τα επαναχρησιμοποιεί και να

αναδιανέμει τα ίδια ή τροποποιήσεις τους, διατηρώντας ως μοναδικό

περιορισμό την αναφορά στην πηγή τους ή την παρόμοια διανομή. Η

δημοσίευση των βιβλιογραφικών μεταδεδομένων ως “Ανοιχτά Διασυνδεδεμένα

Μεταδεδομένα” συντελεί στον εμπλουτισμό του σημασιολογικού ιστού, στη

μεγαλύτερη ευρεσιμότητα των συλλογών που κατέχουν οι βιβλιοθήκες καθώς

και στη δημιουργία συλλογικών καταλόγων. Ταυτόχρονα, η διάθεση

ανοιχτών βιβλιογραφικών δεδομένων συντελεί στον περιορισμό του κόστους

της καταλογογράφησης (βλ.Kεφάλαιο 2.1.2)

14http://opendefinition.org (κείμενο ελεύθερη μετάφραση)

37

ΚΕΦΑΛΑΙΟ 2

W3C Linked Data Incubator Library Group:

Πλεονεκτήματα Διασύνδεσης Δεδομένων Βιβλιοθηκών

Τρέχουσα Κατάσταση στις Βιβλιοθήκες

Τρέχοντα διαθέσιμα συνδεδεμένα δεδομένα βιβλιοθηκών

Συστάσεις

Σκοπός της Ομάδας “Incubator” (Μαϊος 2010-Αύγουστος 2011) υπήρξε

η συμβολή στην αύξηση της παγκόσμιας διαλειτουργικότητας των δεδομένων

των βιβλιοθηκών στον παγκόσμιο ιστό, φέρνοντας σε επαφή ερευνητές που

εμπλέκονται με θέματα του παγκόσμιου ιστού και ειδικά με θέματα

συνδεδεμένων δεδομένων στη κοινότητα των βιβλιοθηκών αλλά και σε

ευρύτερους τομείς με βάση υπάρχουσες πρωτοβουλίες και πιθανές

μελλοντικές συνεργασίες. Στην τελική έκθεση της ομάδας (W3C Incubator

Group Report 25 October 2011) εξετάζεται ο τρόπος όπου τα πρότυπα του

σημασιολογικού ιστού σε συνδυασμό με τις αρχές συνδεδεμένων δεδομένων

μπορούν να χρησιμοποιηθούν ως βάση για την επέκταση ενός πολύτιμου

πολιτιστικού περιεχόμενου σαν αυτό που επιμελούνται και συντηρούν οι

βιβλιοθήκες σε έναν ευρύτερο ιστό, πέρα από το στενό πλαίσιο της εώς

τώρα διακίνησής του.

Οι πρωτοβουλίες των Εθνικών Βιβλιοθηκών για τη διασύνδεση των

δεδομένων τους στάθηκαν ως αφετηρία ώστε η ομάδα “Incubator” να38

συγκεντρώσει στην τελική της έκθεση τις πιο βασικές έρευνες που

μπορούν να χρησιμεύσουν ως θεωρητικό και πρακτικό εγχειρίδιο στις

προσπάθειες των βιβλιοθηκών να δημοσιεύσουν τα δεδομένα τους και

αναπτύσσει τη δραστηριότητά της στους παρακάτω βασικούς τομείς:

Πλεονεκτήματα Διασύνδεσης Δεδομένων Βιβλιοθηκών σε

βασικούς φορείς των υπηρεσιών τους

Μελέτη για την τρέχουσα κατάσταση των βιβλιογραφικών

δεδομένων στην παραδοσιακή τους δομή

Τρέχοντα διαθέσιμα συνδεδεμένα δεδομένα βιβλιοθηκών

Συστάσεις και θέματα νομικής διαχείρισης

2.1 Πλεονεκτήματα Διασύνδεσης15

Αδιαμφισβήτητα, τα συνδεδεμένα δεδομένα προσφέρουν πολλά και

αξιόλογα πλεονεκτήματα χρησιμοποιώντας τις τρέχουσες πρακτικές για

τη δημιουργία της σύνδεσης των δεδομένων των βιβλιοθηκών παρέχοντας

μία φυσική επέκταση των συνεργατικών μοντέλων επιμερισμού, που

ιστορικά διαχειρίζονται οι βιβλιοθήκες. Τα πλεονεκτήματα της

διασύνδεσης των δεδομένων μιας βιβλιοθήκης επηρεάζουν ριζικά τις

βασικές λειτουργίες των βιβλιοθηκών όντας άμεσα συνυφασμένες με το

ύφος και τη δομή των υπηρεσιών των βιβλιοθηκονόμων, των πληροφορικών

και των προμηθευτών των συστημάτων τους. Από αυτά που έχει15http://www.w3.org/2005/Incubator/lld/XGR-lld-20111025/#Benefits_of_the_Linked_Data_Approach (Κείμενο σε ελεύθερη μετάφραση)

39

καταγράψει η ομάδα “Incubator” στην τελική της έκθεσης συνοψίσαμε τα

βασικότερα :

Τα συνδεδεμένα δεδομένα και ειδικά τα ανοιχτά

συνδεδεμένα δεδομένα σύμφωνα με τους ορισμούς τους,

χαρακτηρίζονται ως διαμοιραζόμενα, επεκτάσιμα και

επαναχρησιμοποιήσιμα. Παρέχουν υποστήριξη στην

πολύγλωσση λειτουργία των δεδομένων και των υπηρεσιών

των χρηστών, όπως την ταυτοποίηση του προσδιορισμού των

εννοιών μέσω των “αναγνώσιμων γλωσσών” URIs.

Διευκολύνουν την επαναχρησιμοποίηση του συνόλου των

δεδομένων σε όλο το φάσμα της πολιτιστικής κληρονομιάς

εμπλουτίζοντας την περιγραφή τους με προερχόμενες

πληροφορίες από δεδομένα κοινοτήτων εκτός βιβλιοθηκών ή

προσώπων καθώς και από σχετικές εμπειρίες χρηστών πάνω

σε συγκεκριμένους τομείς. Η χρήση των παγκόσμιων

αναγνωριστικών εξασφαλίζει τη δυνατότητα ενός είδους

συνεργατικής περιγραφής των πόρων με δυνατότητα πολλών

περιγραφών στο ίδιο περιεχόμενο και επιφέρει

ανεξαρτησία από τα Ενοποιημένα Συστήματα Βιβλιοθηκών.

Οι πολλές διασυνδέσεις που προκύπτουν εμπεριέχουν

συμπληρωματικά δεδομένα από αξιόπιστες πηγές

διευρύνοντας μια συλλογή βιβλιοθήκης πέρα από το τοπικό

σύνολο των πηγών της επαυξάνοντας με αυτό τον τρόπο

την αξία των πόρων.

40

Η χρήση των URIs διευρύνει την προσβασιμότητα των

μεταδεδομένων με την αναφορά των πόρων τους σε ένα

ευρύτερο φάσμα πηγών δεδομένων περιγραφής έργων, τόπων,

ανθρώπων, γεγονότων και θεμάτων. Η περιοχή των

Διαδικτυακών Διευθύνσεων (Internet’s Domain Name)

διασφαλίζει σταθερότητα και εμπιστοσύνη τοποθετώντας

αυτά τα αναγνωριστικά μέσα σε ένα πλαίσιο μίας

συστηματοποιημένης και καλά κατανοητής ιδιοκτησίας σαν

αυτής των βιβλιοθηκών και των ιδρυμάτων μνήμης που

χαρακτηρίζονται από την ιδιαιτερότητα της παροχής

αξιόπιστων μεταδεδομένων για πόρους μακροπρόθεσμης

πολιτισμικής σημασίας ως δεδομένων στον ιστό.

Η επαναχρησιμοποίηση των URIs επιτρέπει στους

παραγωγούς δεδομένων να συνεισφέρουν τμήματα των

δεδομένων τους ως Δηλώσεις (Statements). Στο

οικοσύστημα των εγγράφων η ανταλλαγή των δεδομένων

πραγματοποιείται με τη μορφή ολόκληρων εγγραφών η κάθε

μία εκ των οποίων θεωρείται ως πλήρης περιγραφή.

Αντίθετα, σε ένα οικοσύστημα γράφων, σαν αυτό του

σημασιολογικού ιστού, μεμονωμένες δηλώσεις ενός πόρου

μπορούν να συγκεντρώνονται σε ένα παγκόσμιο γράφημα.

41

2.1.1 Πλεονεκτήματα για τους χρήστες των βιβλιοθηκών

Τα πλεονεκτήματα για τους χρήστες των βιβλιοθηκών δεν είναι πάντα

προφανή, λόγω του ότι οι αλλαγές που προκύπτουν έχουν την

ιδιαιτερότητα να βρίσκονται “κρυμμένες” κάτω από προηγμένες

ρυθμίσεις:

Τα συνδεδεμένα δεδομένα υποστηρίζουν την ευκολότερη

ενσωμάτωση των πολιτιστικών πληροφοριών και των

ψηφιακών αντικειμένων σε ερευνητικά έγγραφα και

βιβλιογραφίες.

Παρέχουν ενισχυμένη και εξελιγμένη πλοήγηση μέσω

πολιτιστικών και ετερογενών πληροφοριών προσφέροντας

περισσότερες επιλογές στους χρήστες με βελτιωμένες

ενιαίες αναζητήσεις και εκτεταμένα ευρετήρια. Ως εκ

τούτου οι ικανότητες των χρηστών μέσα στις υπηρεσίες

αναζήτησης βελτιώνονται παράλληλα με τις ανάγκες της

διευρυμένης διασύνδεσης των δεδομένων.

Το σύνολο των ιστοσελίδων και των ιστοτόπων

διατίθεται σαν ολότητα και το σύνολο των συνόλων

δεδομένων που χρησιμοποιούν τις τεχνολογίες RDF και

URIs παρουσιάζονται ως ένα παγκόσμιο γράφημα

πληροφοριών με τη δυνατότητα της ενιαίας περιήγησης.

Παράλληλα παρέχονται πληροφορίες από άλλα αποθετήρια

που συνδέουν τα δεδομένα τους με αυτά των βιβλιοθηκών

42

όπως είναι τα λήμματα από τη Wikipedia, οι γεωγραφικές

πληροφορίες από τη βάση GeoNames (βλ. Κεφάλαιο 5), τα

άρθρα των New York Times. Το σύνολο των παραπάνω

ενεργειών δημιουργεί ένα μεγαλύτερο σύμπαν πληροφοριών

στον Ιστό.

Η ενσωμάτωση των συνδεδεμένων δεδομένων σε HTML

σελίδες διευκολύνει την επαναχρησιμοποίηση των

στοιχείων των βιβλιοθηκών στις υπηρεσίες αναζήτησης

πληροφοριών. Με τον εμπλουτισμό της γνώσης τα συνδεμένα

στοιχεία ευνοούν τη διεπιστημονική έρευνα και μέσω της

πολλαπλής διασύνδεσης βελτιστοποιούν τις μηχανές

αναζήτησης των βιβλιοθηκών.

2.1.2 Πλεονεκτήματα για τους βιβλιοθηκονόμους16

Οι βιβλιοθήκες με τη χρήση των ανοιχτών συνδεδεμένων δεδομένων

δημιουργούν ένα ανοιχτό παγκόσμιο απόθεμα κοινών δεδομένων που

μπορούν να χρησιμοποιηθούν και να επαναχρησιμοποιηθούν για την

περιγραφή των πόρων. Ο μηχανισμός της χρήσης κοινών αναγνωριστικών

οδηγεί στον περιορισμό του πλεονασμού και του κόστους στις

διαδικασίες καταλογογράφησης συμβάλλοντας στην ομοιομορφία και την

ποιοτική αναβάθμιση της υπηρεσίας. Η συνολική περιγραφή των πόρων των

δεδομένων σε όλο το σύνολο των δεδομένων στον τομέα της πολιτιστικής

κληρονομιάς, αφαιρεί από την πλεονάζουσα προσπάθεια των16 http://www.w3.org/2005/Incubator/lld/XGR-lld-20111025/#Benefits_to_librarians.2C_archivists.2C_and_curators (Κείμενο σε ελεύθερη μετάφραση)

43

καταλογογράφων να δημιουργούν βιβλιογραφικές περιγραφές που έχουν ήδη

δημιουργηθεί και προσθέτει στην προσπάθειά τους να επικεντρωθούν στον

τομέα της τοπικής τους τεχνογνωσίας.

2.1.3 Πλεονεκτήματα για προγραμματιστές και προμηθευτές17

Οι μέθοδοι των συνδεδεμένων δεδομένων στηρίζονται στην ανάκτηση

και στην εκ νέου ανάμειξη των δεδομένων με έναν ομοιόμοφο τρόπο για

όλους τους παρόχους των δεδομένων. Η εφαρμογή των πλεονεκτημάτων της

διασύνδεσης των δεδομένων για τους προγραμματιστές και τους

προμηθευτές των συστημάτων είναι άμεση. Η χρήση βασικών πρωτοκόλλων

ιστού (π.χ. ΗTTP) επικαλύπτει τη χρήση των πρωτοκόλλων που έχουν

σχεδόν αποκλειστικά υιοθετηθεί από τον κόσμο των βιβλιοθηκών, όπως

είναι το Z395018, καθώς και τη συνεργασία με συγκεκριμένα

βιβλιοθηκονομικά μορφότυπα δεδομένων (π.χ. του ISO 270919 ή της

διάταξης MARC), για τα οποία απαιτείται έλεγχος εργαλείων λογισμικού

και εφαρμογών. Ως συνέπεια της χρήσης των τεχνολογιών του

σημασιολογικού ιστού, οι προγραμματιστές των βιβλιοθηκών επωφελούνται

από τις τεχνολογίες RDF και HTTP και διευρύνουν ολοένα και

περισσότερο τα εργαλεία γενικών εφαρμογών πολλά από τα οποία είναι

ανοιχτής πρόσβασης παραγκωνίζοντας την ανάγκη χρήσης συγκεκριμένων

τομέων λογισμικού. Οι προμηθευτές συνδεδεμένων δεδομένων βιβλιοθηκών17 http://www.w3.org/2005/Incubator/lld/XGR-lld-20111025/#Benefits_to_developers_and_vendors (Κείμενο σε ελεύθερη μετάφραση)

18 http://www.loc.gov/z3950/

19http://www.iso.org/iso/catalogue_detail.htm?csnumber=767544

αντιμετωπίζουν πολύ συγκεκριμένες απαιτήσεις από τις βιβλιοθήκες.

Είναι συνετό λοιπόν, η αναπροσαρμογή των προϊόντων τους να γίνεται

βάσει αυτών των απαιτήσεων.

2.2 Τρέχουσα Κατάσταση

2.2.1 Η τρέχουσα κατάσταση στη δομή των δεδομένων των βιβλιοθηκών20

Ένα από τα βασικότερα ζητήματα μελέτης της κοινότητας του

σημασιολογικού ιστού αποτελεί ο τρόπος αποθήκευσης των δεδομένων των

βιβλιοθηκών στα υπάρχοντα συστήματα και τις υπηρεσίες τους τα οποία

χαρακτηρίζονται από συγκεκριμένες δομές και χαρακτηριστικά. Σκοπός

της μελέτης του συγκεκριμένου πεδίου είναι σύμφωνα με την ομάδα

“Incubator” η επίτευξη της αύξησης της συμμετοχής των βιβλιοθηκών στο

σύννεφο των ανοιχτών συνδεδεμένων δεδομένων χωρίς αυτό να επιφέρει

αλλαγές στα τρέχοντα συστήματα και στις υπηρεσίες τους. Οι

προβληματισμοί της ομάδας, σύμφωνα πάντα με την τελική της έκθεση,

είναι οι παρακάτω:

Τα δεδομένα βιβλιοθηκών δεν ενσωματώνονται με τις διαδικτυακές πηγές (βλ. Κεφάλαιο 1.1)

Τα πρότυπα των βιβλιοθηκών είναι σχεδιασμένα για τις ανάγκες τηςκοινότητας

Τα πιο γνωστά από τα πρότυπα των βιβλιοθηκών, η διάταξη MARC και

το πρωτόκολλο ανάκτησης πληροφοριών Ζ39.50, έχουν αναπτυχθεί και

συνεχίζουν να εξελίσσονται βάσει ενός ιδιαίτερου πλαισίου

20http://www.w3.org/2005/Incubator/lld/XGR-lld-20111025/#The_Current_Situation (Κείμενο σε ελεύθερη μετάφραση)

45

προσαρμοσμένου σε βιβλιοθήκες (Library-Specific Context). Συνήθως οι

εξειδικευμένοι οργανισμοί στο πεδίο των βιβλιοθηκών αναλαμβάνουν το

κομμάτι της τυποποίησης όπως η Διεθνής Ομοσπονδία των Ενώσεων

Βιβλιοθηκών και Ινστιτούτων [(IFLA) The International Federation of

Library Associations and Institutions] και η Μεικτή Οργανωτική

Επιτροπή για την ανάπτυξη των RDA [(JSC) Joint Steering Committee for

Development of RDA]. Διευρύνοντας το πεδίο εφαρμογής τους, τη

συνεργασία και την επικοινωνία τους με τις πρωτοβουλίες τυποποίησης

συνδεδεμένων δεδομένων μπορούν να επεκτείνουν τη σχέση και τη

δυνατότητα εφαρμογής των προτύπων τους με δεδομένα που δημιουργούνται

και χρησιμοποιούνται από άλλες κοινότητες.

Τα δεδομένα βιβλιοθηκών εκφράζονται σε φυσική γλώσσα κειμένου.

Οι περισσότερες πληροφορίες που υπάρχουν στα δεδομένα των

βιβλιοθηκών έχουν ως βασική γλώσσα κωδικοποίησης και έκφρασης τη

φυσική γλώσσα του κειμένου. Κάποια από τα πεδία των εγγραφών MARC

χρησιμοποιούνται ως κωδικοποιημένες τιμές, όπως τα πεδία καθορισμένου

μήκους που αντιπροσωπεύουν τις γλώσσες. Δεδομένου ότι τα περισσότερα

πεδία κωδικοποιημένων δεδομένων δεν χρησιμοποιούνται στις λειτουργίες

των συστημάτων των βιβλιοθηκών δεν υπάρχει κανένα σαφές κίνητρο, ώστε

αυτές οι κωδικοποιημένες τιμές να συμπεριληφθούν σε όλες τις

εγγραφές. Μερικά από τα αναγνωριστικά που μεταφέρθηκαν σε εγγραφές

MARC, όπως τα ISBN βιβλίων θα μπορούσαν να χρησιμοποιηθούν για

σύνδεση, με την προϋπόθεση της εξαγωγής τους από τα πεδία κειμένων

στα οποία είναι ενσωματωμένα και τη μετέπειτα κανονικοποίησή τους.

46

Τα αρχεία ελεγχόμενων καθιερωμένων ονομάτων (Authority-

Controlled names) και θεμάτων (subjects) ανήκουν σε πεδία δεδομένων

που αφορούν σχετικές εγγραφές σε ξεχωριστά αρχεία και διαθέτουν

αναγνωριστικά που θα μπορούσαν να χρησιμοποιηθούν για την

αναπαράσταση οντοτήτων σε μεταδεδομένα των βιβλιοθηκών. Ωστόσο, οι

τρέχουσες μορφές δεδομένων δεν υποστηρίζουν πάντα τον συνυπολογισμό

αυτών των αναγνωριστικών στις εγγραφές και επομένως πολλά από τα

τρέχοντα συστήματα βιβλιοθηκών δεν υποστηρίζουν κατάλληλα τη χρήση

τους. Τα αναγνωριστικά των συγκεκριμένων αρχείων τείνουν μιας τοπικής

παρά μιας παγκόσμιας ρύθμισης και ως εκ τούτου δεν εκφράζονται με τη

μορφή URls, ενέργεια η οποία θα επέτρεπε τη σύνδεσή τους στο

διαδίκτυο. Η απουσία των συνδέσεων και της ανεπαρκούς υποστήριξης

των παραπάνω αρχείων στα συστήματα βιβλιοθηκών θέτει σημαντικά

ζητήματα. Οι αλλαγές στην καθιερωμένη απεικόνιση απαιτούν την

ανάκτηση όλων των σχετικών βιβλιογραφικών αρχείων, προκειμένου να

αλλαχτεί το μήκος των κειμένων που αποτελεί μία δαπανηρή και

αποδιοργανωτική διαδικασία, που συχνά αποτρέπει τις βιβλιοθήκες από

την έγκαιρη εφαρμογή των αλλαγών.

Η κοινότητα των βιβλιοθηκών και αυτή του σημασιολογικού ιστού

διατηρούν διαφορετική ορολογία για παρόμοιες έννοιες

μεταδεδομένων.

Οι έννοιες και οι ορολογίες μεταξύ των βιβλιοθηκών και του

σημασιολογικού ιστού διαφέρουν. Λίγοι βιβλιοθηκονόμοι κάνουν λόγο για

“Δηλώσεις” μεταδεδομένων, ενώ η Κοινότητα του Σημασιολογικού Ιστού

είναι λογικό να μην έχει γνώση των εννοιών “Κύριες Επικεφαλίδες”

47

(“Headings”) ή “Έλεγχος Καθιερωμένων Λημμάτων” (“Authority

Control”). Κάθε κοινότητα έχει το δικό της λεξιλόγιο, και έτσι

προκύπτει η διαφορετικότητα μεταξύ τους. Αναμφισβήτητα, η συνεργασία

δεν εμποδίζεται με την αμοιβαία κατανόηση και συνεργασία καθώς και οι

δύο ομάδες φέρουν σημαντική πείρα και τεχνογνωσία στην κατασκευή

ενός άρτιου λειτουργικά ιστού δεδομένων.

Όσο αφορά τις τεχνολογίες των βιβλιοθηκών υπάρχει μία εξάρτηση

από την ανάπτυξη των συστημάτων των προμηθευτών τους. Ένα μεγάλο

μέρος της τεχνικής πείρας στην κοινότητα βιβλιοθηκών συγκεντρώνεται

στον μικρό αριθμό προμηθευτών που παρέχουν τα συστήματα και το

λογισμικό που υποστηρίζει τις διοικητικές λειτουργίες των

βιβλιοθηκών, όπως οι παραγγελίες υλικού, ο δανεισμός, η υπηρεσία

αναζήτησης (εξεύρεσης) χρηστών. Οι βιβλιοθήκες βασιζόμενες σε αυτούς

τους προμηθευτές και στα προγράμματα ανάπτυξης της τεχνολογίας τους

τοποθετούν τα συνδεδεμένα δεδομένα σε μια κλίμακα παραγωγής.

2.2.2 Τρέχοντα διαθέσιμα Συνδεδεμένα Δεδομένα Βιβλιοθηκών

Η ομάδα “Incubator” προχώρησε σε μια καταγραφή ενός καταλόγου

διαθέσιμων πηγών21 σχετικών με συνδεδεμένα δεδομένα βιβλιοθηκών τα

οποία χωρίζει σε τρεις κατηγορίες:

Σύνολα Δεδομένων (Data Sets):

21http://www.w3.org/2005/Incubator/lld/XGR-lld-20111025/# http://bnb.bl.ukAppendix_A:_An_inventory_of_existing_library_Linked_Data_resources (Κείμενο σε ελεύθερη μετάφραση)

48

Εθνική Βρετανική Βιβλιογραφία (BNB [British National

Bibliography]) (βλ. Κεφάλαιο 9)

Κατάλογος Εθνικής Βιβλιοθήκης της Ουγγαρίας (The Catalog of

the Hungarian Νational Library22)

“Ανοιχτή Βιβλιοθήκη” (Open Library)23

CrossRef

Europeana

Λεξιλόγια τιμών (Value Vocabularies)

Θεματικές Επικεφαλίδες της Βιβλιοθήκης του

Κογκρέσου(LCSH [Library of Congress Subject Headings])

AGROVOC24

Αρχείο Καθιερωμένων Όρων VIAF25 (The Virtual International

Authority File)

22 http://www.oszk.hu/oszk_katalogusok

23 https://openlibrary.org

24http://aims.fao.org/standards/agrovoc/linked-open-data

25 http://viaf.org49

Δεκαδικό Σύστημα Ταξινόμησης Dewey (DDC26 [Dewey Decimal

Classification])

Γεωγραφική Βάση Δεδομένων “GeoNames” 27

Σύνολα Στοιχείων Μεταδεδομένων (Metadata Element Sets) (βλ.

Κεφάλαιο 5 για αναλυτικές πληροφορίες τους)

Σχήμα Μεταδεδομένων DCMI28 (Dublin Core metadata

Initiative)

Στοιχεία RDA (The Elements of RDA)29

Σύστημα Οργάνωσης Γνώσης SKOS30 (Simple Knowledge

Organization System)

Λεξιλόγιο της οντολογίας FOAF (The Friend of a Friend

vocabulary)

Πολλά σύνολα στοιχείων μεταδεδομένων και λεξιλόγια όρων έχουν

δημοσιευθεί ως συνδεδεμένα δεδομένα κατά τη διάρκεια των τελευταίων

ετών, τα οποία συμπεριλαμβάνουν σημαντικά λεξιλόγια, όπως οι

26 http://dewey.info

27 http://www.geonames.org

28 http://dublincore.org

29 http: http://www.w3.org/2004/02/skos///www.loc.gov/aba/rda/core_elements.html

30 http://xmlns.com/foaf/spec/50

Θεματικές Επικεφαλίδες της Βιβλιοθήκης του Κογκρέσου και του

Δεκαδικού Συστήματος Ταξινόμησης Dewey (DDC). Τα βασικά σύνολα

στοιχείων, (όπως οι όροι μεταδεδομένων DCMI), και τα πλαίσια

αναφοράς όπως οι FRBR, έχουν ήδη δημοσιευτεί ως συνδεδεμένα δεδομένα

ή σε μία συμβατή μορφή συνδεδεμένων δεδομένων.

Σύμφωνα με τη μελέτη της ομάδας “Incubator”, σχετικά λίγα

βιβλιογραφικά σύνολα δεδομένων έχουν διατεθεί ως συνδεδεμένα

δεδομένα, και ακόμα λιγότερα μεταδεδομένα έχουν παραχθεί για άρθρα

περιοδικών, παραπομπές και για την κυκλοφορία δεδομένων. Η έκδοση της

Εθνικής Βρετανικής Βιβλιογραφίας αποτελεί πρωτοποριακή πρωτοβουλία σε

τομείς που αφορούν τις απαιτούμενες προσπάθειες για την εξέταση

διάφορων βασικών θεμάτων για τη διασύνδεση και δημοσίευση δεδομένων

βιβλιοθηκών, όπως η χορήγηση αδειών, η μοντελοποίηση δεδομένων (Data

Modeling), η νομική διαχείριση των δεδομένων, καθώς και η συνεργασία

με τις πολλαπλές κοινότητες χρηστών. Δεδομένης της σταδιακής

αύξησης της εμπειρίας της κοινότητας των βιβλιοθηκών ο αριθμός

δημοσίευσης των συνόλων δεδομένων ως συνδεδεμένων δεδομένων αυξάνεται

με παράλληλους ρυθμούς.

2.3.1 Θέματα Δικαιωμάτων31

Είναι γεγονός ότι τα δεδομένα των βιβλιοθηκών εξαιτίας της

περιορισμένης χρήσης τους στηριζόμενη σε τοπικές πολιτικές, συμβάσεις31http://www.w3.org/2005/Incubator/lld/XGR-lld-20111025/ #Foster_a_discussion_about_Open_Data_and_rights (Κείμενο σε ελεύθερη μετάφραση)

51

και συνθήκες διατηρούν μια ασάφεια στα ζητήματα των δικαιωμάτων

γεγονός που παρακωλύει τη δημοσίευσή τους ως ανοιχτά. Τα θέματα των

δικαιωμάτων διαφέρουν σημαντικά από χώρα σε χώρα και η συνεργασία

για τη δημοσίευση ανοιχτών δεδομένων γίνεται περίπλοκη.

Η Νομική Ιδιοκτησία (Ownership of Legacy) των εγγραφών των

καταλόγων κατά τη διάρκεια των πενήντα προηγούμενων χρόνων έχει

περιπλεχθεί αναφορικά με τη διανομή των δεδομένων μεταξύ των

βιβλιοθηκών. Οι εγγραφές συχνά αντιγράφονται και τα αντίγραφα αυτών

τροποποιούνται ή ενισχύονται για χρήση από τοπικούς καταλόγους και

εν συνεχεία ενσωματώνονται στους καταλόγους των περιφερειακών εθνικών

και διεθνών κοινοπραξιών. Η νομική ανάθεση των ορθών δικαιωμάτων

πνευματικής ιδιοκτησίας μεταξύ σχετικών παραγόντων και φορέων είναι

δύσκολη, χαρακτηρίζεται από έλλειψη βεβαιότητας και κατά συνέπεια

εμποδίζει τη διανομή δεδομένων σε μια κοινότητα επιφυλακτική από τη

φύσης της σε θέματα νομικού περιεχομένου, σαν αυτή των βιβλιοθηκών.

Οι κάτοχοι των δικαιωμάτων των δεδομένων συνίσταται να εξετάσουν

το αντίκτυπο της χρήσης των περιορισμών και οι υπεύθυνοι των

βιβλιοθηκών να προχωρήσουν σε μία σχετική συμφωνία μαζί τους

αναφορικά τα δικαιώματα και τις άδειες σε επίπεδο κοινοπραξιών ή σε

εθνικό και διεθνές επίπεδο, για τον σαφή καθορισμό των δικαιωμάτων

των δεδομένων.

52

2.3.2 Αύξηση της συμμετοχής των βιβλιοθηκών στην τυποποίηση του σημασιολογικού ιστού 32

Σε πολλές περιπτώσεις η μετάφραση των δεδομένων των βιβλιοθηκών

δεν επιδέχεται επαρκή υποστήριξη εκφραστικότητας από τα πρότυπα του

σημασιολογικού ιστού. Ωστόσο, θα πρέπει να υπάρξει συνεργασία με την

κοινότητα του σημασιολογικού ιστού για την εξασφάλιση συμβατών

προτεινόμενων λύσεων με τις τρέχουσες βέλτιστες πρακτικές προκειμένου

οι καταναλωτές συνδεδεμένων δεδομένων να κατανοήσουν τις νέες δομές

που προκύπτουν.

Ένα παράδειγμα τέτοιας περίπτωσης που αναφέρει η ομάδα

“Incubator” αφορά το πρότυπο SKOS. Το συγκεκριμένο πρότυπο δεν

περιλαμβάνει μηχανισμούς για την αναπαράσταση των στοιχείων των προ-

συνδυασμένων θεματικών επικεφαλίδων, και οι σχεδιαστές δεδομένων

συνίσταται να προβούν στην εξεύρεση λύσεων για την επέκταση βασικών

στοιχείων του, π.χ., χρησιμοποιώντας την Γλώσσα Οντολογίας Ιστού OWL

(βλ. Υποκεφάλαιο 5.1). Σημαντικό ρόλο στην προσπάθεια και την πρόοδο

των διαδικασιών τυποποίησης θα είχε η δημιουργία ενός ανθρωποδικτύου

συστηματικής επικοινωνίας από μέλη βιβλιοθηκών με την επιτροπή W3C.

2.3.3 Πρακτικές σχεδιαστικών προτύπων προσαρμοσμένων σε συνδεδεμένα δεδομένα βιβλιοθηκών33

32 http://www.w3.org/2005/Incubator/lld/XGR-lld-20111025/#Increase_library_participation_in_Semantic_Web_standardization (Κείμενο σε ελεύθερη μετάφραση)

53

Από τη μεριά των βιβλιοθηκών οι παραδοσιακές πρακτικές

καταλογογράφησης έχουν τεκμηριωθεί με μια πλούσια σειρά από πρότυπα

και παραδείγματα ενώ από τη μεριά του σημασιολογικού ιστού αρχίζουν

να καταγράφονται οι καλύτερες πρακτικές για το χώρο των συνδεδεμένων

δεδομένων. Δημοσιεύματα όπως το “Linked Data: Evolving the Web into

a Global Data Space”34 και το “ Linked Data Patterns”35 παρέχουν, μέσω

των προφίλ εφαρμογών τους, μεθόδους καταγραφής, διαμοιρασμού προτύπων

και περιορισμών για τη χρήση λεξιλογίων περιγραφής συγκεκριμένων

ειδών πόρων. Η δημιουργία σχεδιαστικών προτύπων ειδικά προσαρμοσμένων

στις απαιτήσεις των συνδεδεμένων δεδομένων των βιβλιοθηκών θα

ικανοποιούσαν τις ανάγκες των προγραμματιστών δεδομένης της καλύτερης

κατανόησης των νέων τεχνικών μέσω προτύπων και παραδειγμάτων με

στόχο τη συνοχή των συνδεδεμένων δεδομένων των βιβλιοθηκών .

2.3.4 Για σχεδιαστές δεδομένων και συστημάτων36

Δημιουργία URIs στοιχείων συνόλων δεδομένων βιβλιοθήκης 33http://www.w3.org/2005/Incubator/lld/XGR-lld-20111025/#Design_and_test_user_services_based_on_Linked_Data_capabilities(Κείμενο σε ελεύθερημετάφραση)

34 http://linkeddatabook.com/editions/1.0/

35 http://patterns.dataincubator.org/book/

36 http://www.w3.org/2005/Incubator/lld/XGR-lld-20111025/#For_data_and_systems_designers (Κείμενο σε ελεύθερη μετάφραση)

54

Προτεινόμενες πολιτικές δημοσίευσης

Τα δεδομένα των βιβλιοθηκών δεν μπορούν να χρησιμοποιηθούν σε ένα

περιβάλλον συνδεδεμένων δεδομένων χωρίς να έχουν URIs τόσο για

συγκεκριμένους πόρους όσο και για καθιερωμένες έννοιες βιβλιοθηκών.

Υπεύθυνοι φορείς δημιουργίας εγγραφών καταλόγων και άλλων

μεταδεδομένων, όπως είναι οι Εθνικές Βιβλιογραφίες θεωρούνται οι

καταλληλότεροι φορείς για την ανάληψη της ευθύνης της δημιουργίας URIs

των περιγραφόμενων πόρων. Η ανάθεση των URIs συνίσταται να γίνεται από

τους επίσημους κάτοχους των δεδομένων των πόρων και των προτύπων.

Διαφορετικά, προκειμένου να αποφευχθεί ο πολλαπλασιασμός και η

επαναχρησιμοποίηση, υπάρχει σύσταση από την ομάδα, η ανάθεση της

τοποθέτησης και της συντήρησης των URIs να πραγματοποιείται από

εταίρους. Η ανάπτυξη πολιτικών για τα πεδία διευθύνσεων που

χρησιμοποιούνται για την παραγωγή αυτών των URIs θα ωφελήσουν τους

υπεύθυνους οργανισμούς και ιδιώτες δημιουργίας και συντήρησης URIs

και θα διασφαλίσουν ποιότητα για τους χρήστες των URIs και των

πεδίων ονομάτων τους. Οι πολιτικές μπορεί να καλύπτουν:

Μοτίβα κατασκευής URIs, κατά προτίμηση βασισμένα στις

κατευθυντήριες γραμμές βέλτιστων πρακτικών.

Θεσμικές δεσμεύσεις συντήρησης URIs.

Έλεγχο έκδοσης ενός λεξιλογίου και των όρων του.

Χρήση των "HTTP" URIs, που επικαλούνται το Πρωτόκολλο HTΤP το

οποίο επιδέχεται διεθνή υποστήριξη από προγράμματα περιήγησης

στο Web, και την επίλυσή τους σε οποιεσδήποτε ιστοσελίδες ή55

μηχαναγνώσιμες αναπαραστάσεις που καταγράφουν την έννοια των

URIs.

Επεκτασιμότητα του λεξιλογίου από άλλους οργανισμούς.

Μεταφράσεις ετικετών και άλλων επισημειώσεων σε άλλες γλώσσες.

2.3.5 Επαναχρησιμοποίηση ή αντιστοίχηση των υφιστάμενων λεξιλογίων συνδεδεμένων δεδομένων για δεδομένα βιβλιοθηκών37

Προκειμένου να μεγιστοποιηθεί η δυνατότητα σύνδεσης των βάσεων

δεδομένων των βιβλιοθηκών με άλλες βάσεις δεδομένων, συνίσταται η

χρήση της γλώσσας έκφρασης των όρων συνδεδεμένων δεδομένων

(ιδιότητες, κλάσεις και στιγμιότυπα) οι οποίοι έχουν σαφώς

καθορισμένες σχέσεις με εκείνες που χρησιμοποιούνται στο βαθύτερο

χώρο των συνδεδεμένων δεδομένων. Αυτό μπορεί να γίνει με δύο

τρόπους:

με τη χρήση λεξιλογίων συνδεδεμένων δεδομένων με βάση τα

ισχύοντα πρότυπα

τον καθορισμό σαφών σχέσεων "τυποποιήσεων” (Αlignments) μεταξύ

των όρων συνδεδεμένων δεδομένων του κόσμου των βιβλιοθηκών καιάλλων κοινοτήτων.

37 http://www.w3.org/2005/Incubator/lld/XGR-lld-20111025/#Preserve_Linked_Data_element_sets_and_value_vocabularies (Κείμενο σε ελεύθερη μετάφραση)

56

2.3.6 Συντήρηση συνδεδεμένων δεδομένων

Το αποτέλεσμα ειδικών άμεσων μετατροπών των δημοσίως διαθέσιμων

βάσεων δεδομένων σε RDF, οι οποίες δεν υπόκεινται σε τακτικούς

ελέγχους ακρίβειας ή ενημερώσεις συντήρησης αποτελεί μεγάλο μέρος του

περιεχομένου του σημερινού σύννεφου συνδεδεμένων δεδομένων. Όπως

αναφέρθηκε και σε προηγούμενο κεφάλαιο, οι βιβλιοθήκες με το ήθος

τους στον έλεγχο της ποιότητας και τη δέσμευση στη μακροπρόθεσμη

συντήρηση κατέχουν μια σημαντική ευκαιρία στην ανάληψη ενός

πρωταγωνιστικού ρόλου στη σημαντική λειτουργία της επιμέλειας των

συνδεδεμένων δεδομένων ως επέκταση της υπάρχουσας αποστολής τους. Οι

βιβλιοθήκες με την επιμέλεια και τη διατήρηση των πόρων που

περιγράφονται μέσα στα σύνολα δεδομένων ως πραγματικά αντικείμενα που

συσχετίζονται μεταξύ τους μπορούν να καρπωθούν τα οφέλη από την

“Ανοιχτή Δημοσίευση” των δεδομένων τους για τις συνεισφορές πρόσθετης

αξίας από άλλες κοινότητες. Για παράδειγμα, οι περιγραφές των

βιβλιοθηκονομικών πόρων μπορούν να εμπλουτιστούν με δεδομένα τα οποία

οι βιβλιοθήκες δεν παρέχουν συνήθως, όπως είναι η σύνδεση σε δεδομένα

από βιογράφους ή γενεαλόγους, βελτιώνοντας σημαντικά την ανακάλυψη

και την πλοήγηση των συλλογών των βιβλιοθηκών.

2.4 Συμπεράσματα κεφαλαίου

57

Συνοψίζοντας, τα συνδεδεμένα δεδομένα με τη σαφή ταυτοποίηση

βασικών οντοτήτων που διαμοιράζονται στο σύνολο των συνδεδεμένων

δεδομένων προσφέρουν ένα ανθεκτικό και ισχυρά σημασιολογικό μοντέλο.

Οι βιβλιοθήκες από την άλλη χρησιμοποιούν ενιαία συστήματα για τις

υπηρεσίες τους και με την ίδια λογική μπορούν να χρησιμοποιήσουν

ενιαίες λύσεις για τη διαχείριση των συνδεδεμένων δεδομένων. Για να

μπορέσουν να συμβάλλουν στις προσπάθειες τυποποίησης θα πρέπει να

υιοθετήσουν ως γλώσσα έκφρασης το RDF -το οποίο αλλάζει τις βασικές

υποδομές αλλά και τις λογικές μέσω των οποίων μπορούν να εκφραστούν

πλέον τα μεταδεδομένα- ώστε να μπορέσουν να χρησιμοποιηθούν από τα

εργαλεία του σημασιολογικού ιστού.

Οι βιβλιοθήκες με τη δημοσίευση των δεδομένων τους ως “ανοιχτά”

τείνουν να αυξήσουν την παρουσία τους στο διαδίκτυο και να

κατανοήσουν ότι η διαφάνεια των δεδομένων είναι περισσότερο ευκαιρία

παρά απειλή της τεχνολογίας. Από τη φύση τους τα συνδεδεμένα

δεδομένα διευκολύνουν μια σταδιακά αυξητική προσέγγιση στη δημιουργία

δεδομένων διαθέσιμων για χρήση στον ιστό. Όσο αυξάνονται τα δεδομένα

τόσο αυξάνεται και η ανάγκη διασύνδεσής τους. Σε ένα πολυσύνθετο

περιβάλλον δεδομένων σαν αυτό των βιβλιοθηκών η δημοσίευση των

δεδομένων απαιτεί να προηγηθεί η ρύθμιση των κατάλληλων προδιαγραφών

και πρακτικών για την άρτια διαδικασία μετατροπής και δημοσίευσης.

Ωστόσο, ορισμένες πηγές βιβλιοθήκης προσφέρονται για δημοσίευση ως

συνδεδεμένα δεδομένα χωρίς να διακόπτουν και να διαταράσσουν τα

τρέχοντα συστήματα και τις υπηρεσίες. Μεταξύ αυτών είναι τα αρχεία

καθιερωμένων όρων και οι κατάλογοι ελεγχόμενων όρων. Η αναγνώριση

58

τέτοιων “προσιτών καρπών” θα επιτρέψει στις βιβλιοθήκες να

επεκτείνουν γρήγορα την παρουσία τους στο σύννεφο των συνδεδεμένων

δεδομένων χωρίς να αλλάξουν τις ροές των εργασιών τους.

59

ΚΕΦΑΛΑΙΟ 3

MARC21 και Συνδεδεμένα Δεδομένα

Το MARC21 ορίζει τη λογική δομή μιας μηχαναγνώσιμης εγγραφής

βιβλιοθήκης (Suero, 2013, pp.5) και προσδιορίζει διαφορετικά μορφότυπα

επικοινωνίας. (Καθιερωμένες εγγραφές, βιβλιογραφικές εγγραφές,

ταξινόμηση, αντίτυπα). Για παράδειγμα το πεδίο με την ετικέτα 100

εμπεριέχει την καθιερωμένη μορφή του ονόματος του προσώπου που είναι

διαμορφωμένο βάση ενός Αρχείου Καθιερωμένων Όρων. Κάθε εγγραφή

διαχωρίζεται σε πεδία τα οποία προσδιορίζονται από τρεις διακριτές

ετικέτες και δύο τύπους πεδίων δεδομένων, τα πεδία ελέγχου (Control

Fields) και τα πεδία δεδομένων (Data Fields). Τα πεδία περιέχουν

αριθμούς ή άλλες κωδικοποιημένες πληροφορίες που χρησιμοποιούνται για

την επεξεργασία της εγγραφής αλλά δεν περιέχουν δείκτες ή κωδικούς

υποπεδίων. Τα πεδία δεδομένων περιέχουν πληροφορία για τον πόρο ή

τους πόρους που περιγράφονται μέσα στην εγγραφή και συνήθως

υποδιαιρούνται σε ένα ή περισσότερα υποπεδία που προσδιορίζονται από

ένα κωδικό υποπεδίου ο οποίος συνοδεύεται από έναν οριοθέτη (ένας από

αυτούς είναι το σύμβολο: $). Μερικά πεδία δεδομένων ορίζονται με τους

δείκτες (indicators) για τον προσδιορισμό πρόσθετων γνωρισμάτων.

Κύριος προσδιορισμός της διάταξης είναι ο ορισμός της έννοιας των

πιθανών τιμών για τoν προσδιορισμό του περιεχομένου (Context

60

Designators). Σημεία πρόσβασης (Access Points) θεωρούνται εκείνα τα

πεδία που χρησιμοποιούνται από τους χρήστες και τους βιβλιοθηκονόμους

να βρουν τις βιβλιογραφικές εγγραφές.

Όπως προαναφέρθηκε, το MARC21 χρησιμοποιείται έχοντας τη

δυνατότητα περιγραφής διαφορετικών τύπων μιας εγγραφής στους

καταλόγους των βιβλιοθηκών και σχεδιάστηκε ως φορέας καταχώρησης των

βιβλιογραφικών πληροφοριών σχετικά με έντυπα βιβλία, χειρόγραφα

τεκμήρια, ηλεκτρονικά αρχεία, χάρτες, μουσική, σειρές,

οπτικοακουστικό υλικό και μεικτά τεκμήρια. Τα βιβλιογραφικά δεδομένα

συνήθως περιλαμβάνουν πληροφορίες σχετικές με τίτλους, ονόματα,

θέματα, σημειώσεις, δημoσίευσης δεδομένων (publication data), αλλά

και πληροφορίες σχετικές με την φυσική περιγραφή των τεκμηρίων. To

ΜARC21 χωρίζει την περιγραφή τους σε μία εγγραφή σε τρία τμήματα:

τον Οδηγό (Leader), ο οποίος αποτελείται από συγκεκριμένα πεδία

σταθερού μήκους, με πληροφορίες για το μήκος της εγγραφής, τον τύπο

της κ.ά., το Ευρετήριο της Εγγραφής (Record Director), το οποίο

αποτελεί έναν κατάλογο των διευθύνσεων των συγκεκριμένων μεταβλητού

μήκους πεδίων δεδομένων, στο εσωτερικό της εγγραφής και τέλος, από τα

Μεταβλητού Μήκους Πεδία Δεδομένων (Variable Lenght Fields), τα οποία

περιέχουν τα βιβλιογραφικά δεδομένα της εγγραφής. Τα πεδία αυτά

προσδιορίζονται από συγκεκριμένα και προδιαγεγραμμένα από τη διάταξη

σύμβολα πεδίων, τις ετικέτες (tags) και αντιστοιχούν σε συγκεκριμένες

περιοχές δεδομένων της βιβλιογραφικής εγγραφής, όπως είναι τα

δεδομένα δημοσίευσης και διάθεσης.

61

Τα είδη των βιβλιογραφικών εγγραφών χαρακτηρίζονται από τα

στοιχεία κάθε βιβλιογραφικού δεδομένου:

- Βιβλία (Books) (BK)

- Σειριακές πηγές (Continuing Resources) (CR)

- Ηλεκτρονικά αρχεία (Computer Files) (CF)

- Χάρτες (Maps) (MP).

- Μουσική (Music) (MU)

- Οπτικά τεκμήρια (Visual Materials) (VM)

- Μικτά υλικά (Mixed Materials) (MX)

Επιπλέον, η διάταξη MARC περιλαμβάνει και κάποιους

Συμπληρωματικούς Χαρακτήρες (Fill Character) και κάποιες Τυπογραφικές Συμβάσεις.

(Typographical Convention)

Υπάρχουν και άλλες εκδοχές του MARC, εκτός από το MARC21, οι

οποίες είναι γνωστές ως οι DanMarc38, UNIMARC39 κ.ά. Η δομή με βάση

την οποία συγκροτείται μια ηλεκτρονική εγγραφή, προσδιορίζεται από το

Διεθνές Πρότυπο ISO 270940 και το περιεχόμενό της ορίζεται από την

ISBD, καθώς και από τους AACR. Η παραπάνω δομή που εισήγαγε το

MARC21, υιοθετήθηκε και αποτέλεσε τη βάση για την ανάπτυξη τόσο του

εθνικού αμερικανικού προτύπου για την ανάπτυξη διατάξεων ανταλλαγής

38 http://www.loc.gov/standards/sourcelist/format.html

39 http://www.ifla.org/unimarc

40 http://www.iso.org/iso/catalogue_detail.htm?csnumber=4131962

πληροφοριών (ANSI/NISO Z39.2-1994), όσο και του αντίστοιχου διεθνούς

προτύπου του ISO). Ιδιαίτερα σημαντικό για το Web2.0 περιβάλλον και τη

διαλειτουργικότητα που προσφέρει είναι ότι υφίσταται ήδη ένα πλαίσιο

λειτουργίας των MARC21 δεδομένων σε XML (αρχιτεκτονική, σχήμα και

τεκμηρίωση MARC/XML) καθώς και η επικοινωνία που προσφέρει με τα

πρότυπα των ψηφιακών βιβλιοθηκών-αποθετηρίων.

Η μετάβαση των βιβλιοθηκών στη νέα γενιά συστημάτων,

αντανακλάται στη χρήση εννοιολογικών μοντέλων (βλ. Εισαγωγή), και το

MARC21, μπορεί να υποστηρίξει λειτουργικά αυτή την καινοτομία.

Αναπτύσσεται, ενημερώνεται και υποστηρίζεται διαρκώς από τρεις από

τις μεγαλύτερες και πλέον σταθερές και έγκυρες βιβλιοθήκες στον

κόσμο, ιδρύματα που δεν ασχολούνται μόνο με πρότυπα, αλλά επίσης

διαθέτουν από τους μεγαλύτερους και πλέον έγκυρους βιβλιογραφικούς

καταλόγους μεγάλης εμβέλειας. Όσο αφορά την τεκμηρίωσή του είναι το

πλέον ενημερωμένο, ενώ παράλληλα ενημερώνεται για τις αλλαγές των

υφιστάμενων κανόνων καταλογογράφησης, αλλά και για νέα συναφή

πρότυπα, υποστηρίζοντας τους νέους κανόνες RDA και του σχήματος FRBR.

63

ΚΕΦΑΛΑΙΟ 4

Εννοιολογικό Μοντέλο FRBR και συνδεδεμένα δεδομένα

Ο Bennett έγραψε: "τα κύρια πλεονεκτήματα των FRBR εκτείνονται από την ιεραρχική του

δομή, που επιτρέπει την τοποθέτηση των βιβλιογραφικών πληροφοριών στο κατάλληλο

επίπεδο της αφαίρεσης και διευκόλυνσης της κληρονομιάς του".

4.1 Μια πρώτη ματιά41

Η ανάπτυξη του εννοιολογικού μοντέλου “Λειτουργικές Απαιτήσεις

για Βιβλιογραφικές Εγγραφές” (FRBR [Τhe Functional Requirements for

Bibliographic Records]), προσέφερε μια καινοτομία στις

βιβλιογραφικές εγγραφές με την καταγραφή τους ως σύνολα σε κομμάτια

δεδομένων (ή αναλυτικά στοιχεία), που έχουν τη δυνατότητα να

μοιραστούν και να χρησιμοποιηθούν με διαφορετικούς ή ακόμη και νέους

τρόπους. Οι “κανόνες” του Tim Berners-Lee, που στηρίζουν το έργο

“Ανοιχτά Συνδεδεμένα Δεδομένα”, προσφέρουν μια ευκαιρία στα συμβατά

με τους FRBR ποιοτικά βιβλιογραφικά δεδομένα να εκτεθούν στο ψηφιακό

σύμπαν μέσω του σημασιολογικού ιστού. Το FRBR, περιλαμβάνει ένα

ιδεατό μοντέλο ενοτήτων σχέσεων και γνωρισμάτων εντοπίζοντας

συγκεκριμένες διεργασίες χρηστών τις οποίες οι βιβλιογραφικές

εγγραφές τείνουν να εκπληρώσουν. Μία βιβλιογραφική εγγραφή έχει

41Lynne C. Howarth (2012): FRBR and Linked Data: Connecting FRBR and LinkedData, Cataloging & Classification Quarterly, 50:5-7, 763-776Διαθέσιμο στο: http://dx.doi.org/10.1080/01639374.2012.680835 (Κείμενο σε

ελεύθερη μετάφραση)64

επικρατήσει να θεωρείται ως μία συνάθροιση των λογικών και των

φυσικών χαρακτηριστικών ενός πόρου.

Το FRBR, δεν είναι μια σειρά από εγγραφές, αλλά ένα δίκτυο από συνδεδεμένα δεδομένα

που καθιστούν ικανό τον χρήστη να εκτελεί ομοιόμορφα όλες τις αναγκαίες λειτουργίες.

(Παπαθεoδώρου, 2012).

65

4.2 Ιστορικό πλαίσιο - Σκοπός του μοντέλου

Η προσπάθεια υλοποίησης των FRBR, χρονολογείται από τον Αύγουστο

του 1990, όπου το θεμελιώδες πρόγραμμα της IFLA για τον καθολικό και

Διεθνή Βιβλιογραφικό Έλεγχο MARC ((UBCIM) [IFLA Universal

Bibliographic Control and International MARC]) και το τμήμα της IFLA

για τον βιβλιογραφικό έλεγχο (IFLA Division for Bibliographic

Control), πραγματοποίησαν ένα σεμινάριο για τη διερεύνηση του σκοπού

και της φύσης των βιβλιογραφικών εγγραφών. Το επόμενο έτος, υπό την

αιγίδα της IFLA, δημιουργήθηκε η Ομάδα Μελέτης των FRBR (IFLA Study

Group on the Functional Requirements for

ibliographic Records). Κύριος στόχος της ομάδας υπήρξε η

οριοθέτηση σαφώς καθορισμένων όρων για τις λειτουργίες που αφορούν

στις βιβλιογραφικές εγγραφές.

Η τελική έκθεση εγκρίθηκε από τη Μόνιμη Επιτροπή της IFLA του

Τμήματος Καταλογογράφησης (IFLA Standing Committee of the Section on

Cataloguing) το 1997, και το τελικό κείμενο εκδόθηκε το 1998. Οι FRBR

ξεκίνησαν μία συνεχόμενη παραγωγή άλλων μοντέλων σχέσεων-oντοτήτων

εκδίδοντας το 2009 τις “Λειτουργικές Απαιτήσεις για Αρχεία

Καθιερωμένων Αποδόσεων” [(FRAD) Functional Requirements for Authority

Data], και το 2010 τις “Λειτουργικές Απαιτήσεις για Αρχεία

Καθιερωμένων Θεματικών Όρων” [(FRSAD) Functional Requirements for

Subject Authority Data]. Η θεμελιώδης αρχή των FRAD στηρίζεται στην66

προσπάθεια να γίνουν γνωστές οι βιβλιογραφικές οντότητες μέσω διεθνών

αναγνωριστικών και ονομάτων βάση για ελεγχόμενα σημεία πρόσβασης.

Σκοπός τους είναι να παρέχουν ένα σαφώς ορισμένο πλαίσιο αναφοράς για

τη συσχέτιση των δεδομένων που καταγράφονται στις εγγραφές

καθιερωμένων αποδόσεων ως προς τις ανάγκες των χρηστών. Οι FRSAD

αποτελούν εξειδίκευση των FRAD και ασχολούνται με τα θέματα. Και τα

τρία μοντέλα αντιπροσωπεύουν εννοιολογικά το βιβλιογραφικό σύμπαν και

προσφέρουν συνεχή ενημέρωση και σε άλλους τομείς και κλάδους εντός των

κοινοτήτων της πολιτιστικής κληρονομιάς αλλά και σε άλλους τομείς.

Στον ιστότοπο της IFLA υπάρχει ξεχωριστή ενότητα για τους FRBR η οποία

και ενημερώνεται διαρκώς.

(http://www.ifla.org/publications/functional-requirements-for-

bibliographic-records)

4.3 FRBR και Συνδεδεμένα Δεδομένα

Παραδοσιακά, η κωδικοποίηση των βιβλιογραφικών δεδομένων με τη

διάταξη MARC21 και UNIMARC επιτρέπει στους χρήστες των καταλόγων να

αναζητούν διακριτά στοιχεία δεδομένων που αφορούν τίτλους,

συγγραφείς, σειρές, ή θέματα πόρων. Στον παγκόσμιο ιστό διατίθενται

ενεργοί κατάλογοι που παρέχουν τη δυνατότητα ανάκτησης στοιχείων από

μια ακόμη μεγαλύτερη απογραφή δεδομένων, όπως οι ημερομηνίες, ο

φυσικός τύπος των μέσων, το ISΒΝ, ο εκδότης, η έκδοση της γλώσσας,

καθώς και συνδυασμοί διαφόρων χαρακτηριστικών που σχετίζονται με έναν

πόρο.

67

Επίσης, η αναθεώρηση των κωδικών της καταλογογράφησης που

κατευθύνουν το περιεχόμενο και τη δομή των στοιχείων μίας

βιβλιογραφικής εγγραφής, συνεχίζεται με γοργούς ρυθμούς μέσα από τις

εκδηλώσεις των RDA (Resource Description and Access) -διάδοχοι των

AACR-, των ISBD (International Standard Bibliographic Description) και

μεμονωμένων διεθνών κωδικών καταλογογράφησης, όπως οι REICAT (Regole

Italiane di Catalogazione), και τις πρωταρχικές αρχές που αρθρώθηκαν

στο IFLA ICP (Statement of International Cataloguing Principles), που

εκδόθηκε το 2009. Βασικός λόγος των παραπάνω αλλαγών δεν είναι άλλος

παρά η εναρμόνισή τους με τους FRBR, οι οποίοι θα επιτρέψουν στους

καταλόγους των βιβλιοθηκών να αποκτήσουν μια πιο λειτουργική μορφή και

να διαλειτουργήσουν και με άλλους φορείς πληροφορίας και περιεχομένου.

Συνολικά η ανάπτυξη του μοντέλου εισήγαγε την καταγραφή της

βιβλιογραφικής εγγραφής βάσει του επιμερισμού των δεδομένων της, αντί

της παραδοσιακής αντιμετώπισής της ως συνόλου. Σε αυτό το πλαίσιο, τα

δεδομένα, έχουν τη δυνατότητα να δια-μοιράζονται και να

χρησιμοποιούνται με διαφορετικούς ή και καινοτόμους τρόπους εισάγοντας

νέες εγγραφές για την περιγραφή των οντοτήτων του μοντέλου (βλ.επόμενο

Yποκεφάλαιο). Τα στοιχεία και τα χαρακτηριστικά, αντί να είναι μέρη

μιας εγγραφής συνδέονται με συγκεκριμένες οντότητες με μια είδους

κατάσταση “Ελεύθερου Πράκτορα” (Free Agent Status). Όλα τα παραπάνω

συνδέονται με την έννοια της λογικής και της διαδικασίας των

συνδεδεμένων δεδομένων. Το μοντέλο διαχωρίζει τα δεδομένα από τις

εγγραφές και προσφέρει τη δυνατότητα για “εκ νέου σύνδεση” μεμονωμένων

στοιχείων δεδομένων με άλλα σύνολα δεδομένων ή δομές εγγραφής, εφόσον

68

μπορεί να υποστηριχθεί ο κατάλληλος μηχανισμός ώστε να

πραγματοποιηθεί. Εδώ είναι που εισάγεται ο σημασιολογικός ιστός και τα

συνδεδεμένα δεδομένα.

4.4 Ο πυρήνας του μοντέλου42

Σχεδιαστικά το μοντέλο κινήθηκε πάνω σε τρεις βασικούς άξονες:

στην ποικιλομορφία των μέσων, των εφαρμογών αλλά και των αναγκών των

χρηστών με σκοπό η εφαρμογή του να εξυπηρετεί τους τέσσερις βασικούς

σκοπούς μιας βιβλιογραφικής εγγραφής (σύμφωνα με το μοντέλο):

Τον Εντοπισμό ( Find ) του υλικού που αντιστοιχεί στα κριτήρια που

θέτει ο χρήστης

Την Ταυτοποίηση ( Identify ) μιας οντότητας από τα μεταδεδομένα

περιγραφής

Την Επιλογή ( Select ) της κατάλληλης οντότητας για τον χρήστη

Tην Απόκτηση ( Obtain ) του ίδιου του αντικειμένου ή της πρόσβασης

σε αυτό

42 Το παρόν κεφάλαιο βασίστηκε σε μεγάλο βαθμό στην Μεταπτυχιακή Εργασία με τίτλο « Σύνθεση FRBR εγγραφών αξιοποιώντας υπάρχουσες βιβλιογραφικές εγγραφές (FRBRization): ομαδοποίηση σχετικών εγγραφών (clustering) και εμφάνισή τους σε online συστήματα. Δημιουργία καταλόγων με γνώμονα τους FRBR» την οποία κατέθεσε ο Μανόλης Πεπονάκης το ακαδημαϊκό έτος 2009-2010. Υπεύθυνος καθηγητής ήταν ο κ. Σαράντος Καπιδάκης.

69

Θεωρείται δεδομένο πως μια βιβλιογραφική εγγραφή μπορεί να ιδωθεί (ή πρέπει να

ιδωθεί) ως μια σειρά από διακριτές οντότητες οι οποίες όμως σχετίζονται μεταξύ τους.

(Πεπονάκης, 2010). Κάθε οντότητα διαθέτει μια σειρά από ιδιότητες.

Έτσι, ο πυρήνας του μοντέλου συγκροτείται από: τις οντότητες

(entities), τις ιδιότητες (attributes) που αποδίδονται σε αυτές και

τις σχέσεις (relationships) που έχουν οι οντότητες μεταξύ τους. Το

μοντέλο ορίζει δέκα βασικές οντότητες που χωρίζονται σε τρεις ομάδες.

Για κάθε μία από αυτές ορίζει τις ιδιότητές της και τέλος ορίζει τις

σχέσεις μεταξύ των οντοτήτων.

Πρώτη Ομάδα Οντοτήτων

Οι οντότητες της πρώτης ομάδας, αναπαριστούν τις διαφορετικές

οπτικές των ενδιαφερόντων των χρηστών των έργων μιας καλλιτεχνικής ή

πνευματικής προσπάθειας.:

Οι οντότητες που ορίζονται ως:

Έργο ( Work ) : μια συγκεκριμένη διανοητική, πνευματική ή

καλλιτεχνική δημιουργία

Έκφραση (Expression): η καλλιτεχνική ή πνευματική πραγμάτωση

ενός έργου,

αντανακλούν το πνευματικό ή καλλιτεχνικό περιεχόμενο.

Οι οντότητες που ορίζονται ως:

Εκδήλωση ( Manifestation ) : η φυσική ενσάρκωση μιας έκφρασης

ενός έργου

Αντίτυπο ( Item ): ένα πρωτότυπο μιας εκδήλωσης70

αντανακλούν τη φυσική μορφή της καλλιτεχνικής ή πνευματικής

προσπάθειας.

Οι οντότητες της πρώτης ομάδας αναπαριστούν τις παρακάτω

έννοιες και σχετίζονται μεταξύ τους ως εξής:

Έργο: Προορίζεται για την αναπαράσταση της αφηρημένης

μορφής μιας διακριτής πνευματικής ή καλλιτεχνικής

δημιουργίας. Ένα έργο πραγματώνεται ( is realized through )

μέσω μίας ή περισσότερων εκφράσεων.

Έκφραση: Προορίζεται για την αναπαράσταση της πραγμάτωσης

(realization) του έργου. Μία έκφραση είναι η πραγμάτωση

ενός και μόνο έργου. Μπορεί να ενσωματωθεί σε (embodied in )

μία ή περισσότερες εκδηλώσεις.

Εκδήλωση: Αναπαριστά τη φυσική ενσάρκωση της έκφρασης ενός

έργου, το μέσο που προσδίδει την υλική του υπόσταση. Μπορεί

να ενσωματώσει μία ή περισσότερες εκφράσεις. Μπορεί να

αναπαραχθεί (reproduced by) από ένα ή περισσότερα αντίτυπα.

Αντίτυπο: Αναπαριστά κάθε αντίγραφο που δημιουργήθηκε

έχοντας σαν πρωτότυπο μια εκδήλωση. Μπορεί να αποτελεί

παράδειγμα (is exemplified) μίας και μόνο μίας εκδήλωσης.

Μεταξύ των πλέον καθιερωμένων σχέσεων είναι και αυτές που

συνδέουν τις οντότητες του πυρήνα) μεταξύ τους:

Ο δημιουργός του ( Creator Of ) (μεταξύ ενός προσώπου και ενός

έργου)

71

πραγματώνεται μέσω ( realized through ) (μεταξύ ενός έργου

και μιας έκφρασης) και

είναι ενσωματωμένα σε (is embodied in) (μεταξύ μιας έκφρασης

και μιας εκδήλωσης)

Δεύτερη Ομάδα Οντοτήτων

Οι οντότητες της δεύτερης ομάδας, αντιπροσωπεύουν τους

υπεύθυνους για το καλλιτεχνικό ή πνευματικό περιεχόμενο, τη φυσική

παραγωγή και διάθεση καθώς και την επιμέλεια των σχετικών

διαδικασιών. Οι οντότητες αυτές, ορίζονται ως Πρόσωπο (Person) -ένα

φυσικό πρόσωπο- και Συλλογικό Όργανο (Corporate Body) -Ένας

οργανισμός ή μια ομάδα φυσικών προσώπων ή/και οργανισμών-.

Σχέσεις οντοτήτων μεταξύ πρώτης και δεύτερης ομάδας:

Ένα έργο μπορεί να δημιουργηθεί από ένα ή περισσότερα

πρόσωπα ή συλλογικά όργανα και το αντίστροφο.

Ένα πρόσωπο ή ένα συλλογικό όργανο μπορεί να δημιουργήσει

ένα ή περισσότερα έργα.

Μία έκφραση μπορεί να πραγματοποιηθεί από ένα ή περισσότερα

πρόσωπα ή συλλογικά όργανα.

Ένα πρόσωπο ή συλλογικό όργανο μπορεί να πραγματοποιήσει μία

ή περισσότερες εκφράσεις.

Μία εκδήλωση μπορεί να παραχθεί από ένα ή περισσότερα

πρόσωπα ή συλλογικά όργανα.

72

Ένα πρόσωπο ή συλλογικό όργανο μπορεί να παράγει μία ή

περισσότερες εκδηλώσεις.

Ένα αντίτυπο μπορεί να κατέχει ένα ή περισσότερα αντίτυπα.

Ένα αντίτυπο μπορεί να ανήκει σε ένα ή περισσότερα πρόσωπα

ή συλλογικά όργανα.

Ένα πρόσωπο ή συλλογικό όργανο μπορεί να παράγει ένα ή

περισσότερα αντίτυπα.

Τρίτη Ομάδα Οντοτήτων

Οι οντότητες της τρίτης ομάδας, αντιπροσωπεύουν ένα

πρόσθετο σύνολο οντοτήτων που χρησιμεύουν ως θέματα των έργων και

απεικονίζουν τα αντικείμενα ενδιαφέροντος της πνευματικής ή

καλλιτεχνικής προσπάθειας:

Έννοια (Concept)

Αντικείμενο (Object)

Γεγονός (Event)

Τόπος (Place)

Σχέσεις οντοτήτων μεταξύ πρώτης και τρίτης ομάδας

Ένα έργο μπορεί να έχει ως θέμα μία ή περισσότερες από τις

οντότητες της τρίτης ομάδας, καθώς και αυτές με τη σειρά τους μπορούν

να αποτελέσουν θέμα ενός ή περισσότερων έργων. Ένα έργο μπορεί να

έχει επίσης ως θέμα ένα ή περισσότερα από ένα έργο, μία έκφραση, μία

εκδήλωση, ένα αντίτυπο, ένα πρόσωπο ή/και συλλογικό όργανο. Όλες οι

οντότητες μπορεί να ανήκουν στην τρίτη ομάδα.73

Οι σχέσεις μεταξύ των συγκεκριμένων περιπτώσεων των οντοτήτων,

και η σημασία των γνωρισμάτων και σχέσεων που σχετίζονται με κάθε

οντότητα σε γενικές εργασίες του χρήστη για τον εντοπισμό, την

ταυτοποίηση, την επιλογή και την απόκτηση του ίδιου του

αντικειμένου ή της πρόσβασης σε αυτό, έχουν ομοίως μοντελοποιηθεί.

Συνεπώς, κάθε μία από τις ιδιότητες και τις σχέσεις του μοντέλου

μπορούν απευθείας και συστηματικά να έχουν αντιστοιχία στις εργασίες

των χρηστών που υποστηρίζουν.

ΚΕΦΑΛΑΙΟ 5

Λεξιλόγια Συνδεδεμένων Δεδομένων

Στο περιεχόμενο του σημασιολογικού ιστού, τα λεξιλόγια είναι που

καθορίζουν τις έννοιες και τις σχέσεις που χρησιμοποιούνται για να

περιγράψουν και να αντιπροσωπεύσουν έναν τομέα έρευνας. Θεωρούνται

βασικές μονάδες για τεχνικές ομαδοποίησης και βασικοί παράγοντες

ολοκλήρωσης στοιχείων και οργάνωσης της γνώσης κυρίως όταν η χρήση

τους προορίζεται για τις κοινότητες των βιβλιοθηκών που χρησιμοποιούν

τυποποιημένους όρους. Μέσω των προτύπων του ιστού, δίνεται η

δυνατότητα περιγραφής της πληροφορίας, όχι μόνο σε συντακτικό αλλά

και σε σημασιολογικό επίπεδο, βάσει αυτών των δομημένων λεξιλογίων.

Με αυτόν τον τρόπο, διευκολύνεται η αυτόματη επεξεργασία των

διαδικτυακών πόρων, και καθίσταται δυνατός ο άμεσος και ακριβής

εντοπισμός των πληροφοριών και η ανάπτυξη προηγμένων εφαρμογών.

Πολλά λεξιλόγια συνδεδεμένων δεδομένων θεωρούνται ουσιαστικά74

πολιτιστικά έργα αναφοράς που παρέχουν έγκυρες πληροφορίες σχετικά με

ανθρώπους, τόπους, γεγονότα, και έννοιες μέσα σε περιφερειακά,

εθνικά, ή διεθνή πλαίσια. Ως εκ τούτου, η διατήρηση των λεξιλογίων

Συνδεδεμένων Δεδομένων είναι μια φυσική και απαραίτητη επέκταση της

δραστηριότητας των ιδρυμάτων μνήμης.

Παρακάτω (Υποκεφάλαιο 5.1), παρατίθεται μία σύντομη

επεξηγηματική λίστα λεξιλογίων τα οποία στην παρούσα εργασία είτε

αναφέρονται θεωρητικά είτε χρησιμοποιούνται ως παραδείγματα. Στο

υποκεφάλαιο 5.2 γίνεται αναφορά σε λεξιλόγια που βασίζονται στο

μοντέλο FRBR, μέσα από τις προσπάθειες της κοινότητας των βιβλιοθηκών

να κινηθούν άρτια στο σημασιολογικό ιστό. Στο υποκεφάλαιο 5.3 γίνεται

αναφορά σε λεξιλόγια που έχουν παραχθεί από βιβλιοθήκες και συναφής

οργανισμούς. Το υποκεφάλαιο 5.4 περιέχει λεξιλόγια γενικών θεμάτων.

5.1 Λεξιλόγια Πυρήνα RDF. (Core RDF Vocabularies)

RDF SCHEMA.. Το RDFS ή RDF Schema είναι μία επεκτάσιμη

γλώσσα αναπαράστασης γνώσης που παρέχει βασικά

στοιχεία για τον ορισμό των οντολογιών οι οποίες θα

χρησιμοποιηθούν για τη δόμηση των RDF πόρων.

75

OWL43(Web Ontology Language): Ο όρος Γλώσσα

Οντολογίας Ιστού χρησιμοποιείται για να περιγράψει

μια ολόκληρη οικογένεια τυπικών γλωσσών (ονομαστικά

OWL Lite, OWL DL και OWL Full) με διαφορετικά

επίπεδα εκφραστικότητας.

Αυτές οι γλώσσες χρησιμοποιούνται για να συνταχθούν

οντολογίες στο σημασιολογικό ιστό. Η OWL είναι στενά

συνδεδεμένη με το Πλαίσιο Περιγραφής Πόρων RDF και

έχει εγκριθεί από τον W3C. Οι γλώσσες της

οικογένειας OWL μπορούν να δημιουργήσουν κλάσεις και

ιδιότητες, να καθορίσουν στιγμιότυπα και τις πράξεις

τους. Η OWL έχει εφαρμοστεί στον ακαδημαϊκό, ιατρικό

και εμπορικό τομέα.

SKOS (Simple Knowledge Organization System): Απλό

Σύστημα Οργάνωσης Γνώσης]. Το SKOS ορίζει ένα κοινό

μοντέλο δεδομένων για διαμοιρασμό και σύνδεση

συστημάτων οργάνωσης γνώσης μέσω του παγκόσμιου

ιστού και ορίζεται ως μια οικογένεια τυπικών γλωσσών

που σχεδιάζονται για την αναπαράσταση θησαυρών,

σχεδίων ταξινόμησης,

ταξινομιών,συστημάτωνπροσυνδυασμένης ευρετηρίασης, ή

οποιουδήποτε άλλου τύπου δομημένου ελεγχόμενου

λεξιλογίου.

43 http://www.w3.org/2001/sw/wiki/OWL76

Είναι μια εφαρμογή RDF, η οποία επιτρέπει την

εύκολη δημοσίευση δομημένων ελεγχόμενων λεξιλογίων

(εννοιών) στο σημασιολογικό ιστό. Μπορεί να

χρησιμοποιηθεί από μόνο του ή σε συνδυασμό με

τυπικές γλώσσες αναπαράστασης γνώσης, όπως τη γλώσσα

Οντολογίας του παγκοσμίου ιστού (OWL). Συνίσταται

από τον W3C από το 2009.

5.2 Λεξιλόγια FRBR (FRBR Vocabularies)

Expression of Core FRBR Concepts in RDF (Richard

Newman, Ian Davis, 2005): Λεξιλόγιο έκφρασης σε RDF

των εννοιών και των σχέσεων που περιγράφονται στην

έκθεση της IFLA για τους (FRBR). Το λεξιλόγιο αυτό

είναι ένα έργο σε εξέλιξη, και περιλαμβάνει κλάσεις

RDF για τις πρώτες ομάδες των FRBR οντοτήτων και

των ιδιοτήτων που αντιστοιχούν στις βασικές σχέσεις

μεταξύ αυτών των οντοτήτων. Δεν υπάρχουν ακόμα

περιγραφές για τα χαρακτηριστικά των οντοτήτων. Όπου

είναι δυνατόν, περιλαμβάνει κατάλληλες σχέσεις με

άλλα λεξιλόγια.

77

FradUsersTask44 Λεξιλόγιο που περιλαμβάνει ονόματα

και τίτλους που μπορούν να χρησιμοποιηθούν από τους

χρήστες των βιβλιογραφικών εγγραφών.

Περιλαμβάνει τις έννοιες:

- Find : Για τον εντοπισμό μια οντότητας ή ενός συνόλου

οντοτήτων που ανταποκρίνονται στα κριτήρια

αναζήτησης ή η εξερεύνηση του σύμπαντος των

βιβλιογραφικών οντοτήτων χρησιμοποιώντας τις

ιδιότητες και τις σχέσεις τους.

-Identify: Ταυτοποίηση μιας οντότητας ή επικύρωσή του

της μορφής του ονόματος το οποίο χρησιμοποιείται ως

ελεγχόμενο σημείο πρόσβασης.

-Contextualize: Τοποθέτηση ενός προσώπου, έργου κτλ στα

συμφραζόμενα, διευκρίνιση των σχέσεων ανάμεσα σε δύο

πρόσωπα, κτλ.

-J ustify : Τεκμηρίωση πάνω στους λόγους για τους οποίους

επιλέχθηκε η συγκεκριμένη μορφή του ονόματος.

FRBRerUsersTask45, (Gordon Dunshire, 2009): Λεξιλόγιο

που περιλαμβάνει οντότητες που μπορούν να

χρησιμοποιηθούν από τους χρήστες βιβλιογραφικών

εγγραφών.

44 http://metadataregistry.org/vocabulary/show/id/120.html

45 http://iflastandards.info/ns/fr/frbr/frbrer/frbrerusertask78

Περιλαμβάνει τις έννοιες:

-Find: Για τον εντοπισμό μίας απλής οντότητας ή ενός

συνόλου οντοτήτων σε ένα αρχείο ή σε μια βάση

δεδομένων, ως αποτέλεσμα μιας αναζήτησης,

χρησιμοποιώντας μια ιδιότητα ή σχέση μιας οντότητας.

-Identify: Για την επιβεβαίωση ότι η περιγραφόμενη

οντότητα αντιστοιχεί στην οντότητα που αναζητήθηκε, ή

για την διάκριση μεταξύ δύο ή περισσοτέρων οντοτήτων

με παρόμοια χαρακτηριστικά.

-Obtain: Για την απόκτηση μιας οντότητας μέσω της αγοράς

ή δανεισμού κ.α. ή μέσω ηλεκτρονικής πρόσβασης,

διαδικτυακά από υπολογιστές εξ’αποστάσεως.

-Select: Για την επιλογή μιας οντότητας που

ανταποκρίνεται στις απαιτήσεις του χρήστη σε σχέση με

το περιεχόμενο, τη φυσική μορφή, κλπ, ή το αντίθετο

(απόρριψη μιας οντότητας ως ακατάλληλης από τον

χρήστη)

FRSADUsersTask46: (Gordon Dunshire): Λεξιλόγιο που

διερευνεί τις σχέσεις μεταξύ των θεμάτων και ή τις

ονομασίες τους

Περιλαμβάνει τις έννοιες:

46 http://iflastandards.info/ns/fr/frsad/frsadusertask79

-Explore: Διερεύνηση των σχέσεων, προκειμένου να

κατανοηθεί η δομή ενός θεματικού τομέα και η ορολογία

του

-Find: Εξεύρεση ενός ή περισσότερων θεμάτων και, ή των

ονομασιών τους, βάσει κριτηρίων αναζήτησης των

χρηστών, χρησιμοποιώντας ιδιότητες και σχέσεις.

-Identify: Προσδιορισμός ενός θέματος ή της ονομασίας του

βάσει των ιδιοτήτων των σχέσεών του (π.χ. τη διάκριση

μεταξύ δύο ή περισσότερων θεμάτων ή ονομασιών με

παρόμοια χαρακτηριστικά και την επιβεβαίωση της

εύρεσης του κατάλληλου θέματος ή ονομασίας.

-Select: Επιλογή ενός θέματος και, ή, ονομασίας της

ανάλογα με τις ανάγκες του χρήστη (επιλογή ή απόρριψη

σύμφωνα με τις απαιτήσεις των χρηστών)

5.3 Λεξιλόγια από βιβλιοθήκες και συναφείς οργανισμούς

The RDA vocabularies47: Μερικά από αυτά είναι: RDA

AppliedMaterial, RDAAspectRatio, RDABaseMaterial κ.α.

ISBD48: Λεξιλόγιο-σύνολο κανόνων που παράγεται από την

IFLA, για τη δημιουργία μιας βιβλιογραφικής περιγραφής

σε μία τυποποιημένη και ανθρωπο-αναγνώσιμη μορφή. Οι

επιμέρους μορφές στις οποίες η έννοια ISBD έχει

47 http://rdvocab.info/

48 http://www.ifla.org/about-the-isbd-review-group#origins80

εφαρμοστεί χρησιμοποιείται από βιβλιογραφικές

υπηρεσίες, καταλόγους βιβλιοθηκών, καταλογογράφους σε

μια ευρεία ποικιλία των βιβλιοθηκών όλου του κόσμου.

Χρονολογείται από το 1969.

DCMI Metadata Terms (Dublin Core Metadata

Initiative): Λεξιλόγιο που περιλαμβάνει όλους τους

όρους μεταδεδομένων που διατηρούνται από το DCMI,

περιλαμβάνοντας κλάσεις, ιδιότητες, λεξιλόγια

κωδικοποίησης σχημάτων και σχήματα κωδικοποίησης

σύνταξης.

LocMads.49 (Library of Congress Metadata Authority

Description Standard.): Ένα πρότυπο με συμβατή στην

MARC21/XML μορφή, για το είδος των αρχείων που

μεταφέρονται σε μορφή καθιερωμένων αποδόσεων στο

MARC21.

5.4 Άλλα λεξιλόγια

Void50 (Vocabulary of Interlinks Datasets): Λεξιλόγιο

για την επεξήγηση μεταδεδομένων για σύνολα

μεταδεδομένων RDF.

Foaf (Friend of a Friend): Λεξιλόγιο που

δημιουργήθηκε για να καθορίσει ένα RDF λεξιλόγιο για49 http://www.loc.gov/standards/mads/

50 http://vocab.deri.ie/void81

την έκφραση μεταδεδομένων που αφορούν ανθρώπους και τα

ενδιαφέροντά τους, τις σχέσεις τους και τις

δραστηριότητές τους. Περιλαμβάνει μια μεγάλη ποικιλία

διαφορετικών όρων για ανθρώπους, ομάδες και έγγραφα.

KΕΦΑΛΑΙΟ 6

Μοντέλο ανοιχτών συνδεδεμένων δεδομένων της ΕθνικήςΒιβλιοθήκης της Ισπανίας51

6.1 Πλαίσιο δημιουργίας

Τα τελευταία χρόνια, το ποσοστό της σημασιολογικά δομημένης

γνώσης, που είναι διαθέσιμη στο διαδίκτυο ως μέρος του λεγόμενου

"Σύννεφου Συνδεδεμένων Δεδομένων”, έχει σημειώσει μια σημαντική51 Οι πληροφορίες που θα περιγραφούν στο “Κεφάλαιο: 6” έχουν ως κύρια πηγή την επίσημη ιστοσελίδα της βιβλιοθήκης της ισπανικής βιβλιοθήκης. http://www.bne.es/es/Inicio/index.html

82

αύξηση στον τομέα της πολιτιστικής κληρονομιάς και ιδιαίτερα στις

ψηφιακές βιβλιοθήκες. Όπως προαναφέρθηκε και στην εισαγωγή,

βιβλιοθήκες, μουσεία και αρχεία δείχνουν μεγάλο ενδιαφέρον στη

δημοσίευση των δεδομένων τους ως συνδεδεμένα δεδομένα. Μέσα σε αυτό

το πλαίσιο αρκετές εθνικές βιβλιοθήκες δημοσιεύουν τα δεδομένα τους

και από τις σημαντικότερες προσπάθειες που έχουν γίνει είναι σαν αυτή

της Εθνικής Βιβλιοθήκης της Ισπανίας.

Μέσα στο τέλος του 2011, δημιουργήθηκε η πύλη datos.bne.es52, η

οποία είναι το κύριο αποτέλεσμα του έργου “Linked Data at BNE”, που

υποστηρίζεται από την Εθνική Βιβλιοθήκη της Ισπανίας (BNE53

[Biblioteca Nacional de Espana]) σε μία συνεργασία με την Oμάδα

Μηχανικής Οντολογίας του Πολυτεχνείου της Μαδρίτης (OEG54 [Ontology

Engineering Group]), η οποία και ανέλαβε την πρωτοβουλία της

δημιουργίας των ανοιχτών βιβλιογραφικών δεδομένων της Εθνικής

Βιβλιοθήκης της Ισπανίας. Η τελευταία, μετέτρεψε σε RDF και συνέδεσε τον

βιβλιογραφικό κατάλογο καθιερωμένων Όρων (Catalogo y de Autoridades Bibliografico55), με

τη δέσμευση της διατήρησης, βελτίωσης και περιοδικής ενημέρωσης των RDF συνόλων

δεδομένων. (Suero, 2012). Στόχος της να εμπλουτίσει τον σημασιολογικό

ιστό με τα δεδομένα της βιβλιοθήκης.

Η πρωτοβουλία αυτή, είναι ένα έργο που δεικτοδοτεί ένα νέο

παράδειγμα δέσμευσης του ισπανικού δημοσίου τομέα για τη διαφάνεια

52 http://www.bne.es/es/Inicio/Perfiles/Bibliotecarios/DatosEnlazados/index.html

53 http://www.bne.es/es/Inicio/index.html

54 http://www.oeg-upm.net

55 http://www.bne.es/es/Catalogos/CatalogoAutoridades/83

και την επαναχρησιμοποίηση των δεδομένων και αντικατοπτρίζει τη

δέσμευση της κοινότητας στην τεχνολογία και στην έρευνα στη χώρα της

Ισπανίας, κάνοντας ευκολότερη την πρόσβαση στις πληροφορίες. Το

σύνολο δεδομένων που δημοσιεύονται αποτελεί μία από τις μεγαλύτερες

συμβολές της υψηλής ποιότητας δεδομένων RDF στα ισπανικά για το

Σύννεφο Συνδεδεμένων Δεδομένων.

6.2 Πόροι δεδομένων (Resource Data)

Τα RDF σύνολα δεδομένων, είναι το αποτέλεσμα της μετατροπής ενός

συνόλου αρχείων MARC21 από τον κατάλογο της Βιβλιοθήκης. Αυτό το σύνολο

εγγραφών αποτελείται από αρχεία καθιερωμένων όρων και βιβλιογραφικές εγγραφές.

(Suero, 2012).

Η πρώτη έκδοση του συνόλου των δεδομένων datos.bne.es είναι κυρίως

επικεντρωμένη στην επαναχρησιμοποίηση πολλών τυποποιημένων και ευρέως

χρησιμοποιούμενων λεξιλογίων και σε ένα δίκτυο οντολογιών που έχει

δημιουργηθεί από την επαναχρησιμοποίησή τους.

Η τελευταία έκδοση των δεδομένων έχει ως αποτέλεσμα τον

μετασχηματισμό των παρακάτω αρχείων:

4.200.000 καθιερωμένων όρων που συμπεριλαμβάνουν φυσικά

πρόσωπα, συλλογικά όργανα, συνέδρια, τίτλους έργων,

θεματικές επικεφαλίδες.

2.400.000 βιβλιογραφικών εγγραφών, αντιπροσωπευτικό

υποσύνολο του καταλόγου της Εθνικής Βιβλιοθήκης της

Ισπανίας, και παρέχουν μεταδεδομένα τα οποία αφορούν

παλαιότερες και σύγχρονες μονογραφίες, ηλεκτρονικά84

αρχεία, χειρόγραφα, περιοδικές εκδόσεις, χάρτες,

χαρακτικά, φωτογραφίες, παρτιτούρες και οπτικοακουστικό

υλικό. (βλ. Εικόνα 1.)

Τα παραπάνω δημιουργούν:

60.000.000 τριάδες στην ισπανική γλώσσα, που παράγονται

από τα αρχεία MARC21(Βλ. Πίνακα 1)

Εικόνα 1. Εξαγωγή Αρχείων από MARC21

6. 3 Τεχνολογία-εργαλεία

6.3.1 MARiMBa56 (a MARc Mappings and rdf generAtor)

Όσο αφορά τη διαδικασία μετατροπής από τη μορφή MARC21 σε RDF η

OEG έχει αναπτύξει το Marimba, ένα εργαλείο σχεδιασμένο από

56 http://mayor2.dia.fi.upm.es/oeg-upm/index.php/en/technologies/228-marimba (Κείμενο σε ελεύθερη μετάφραση)

85

βιβλιοθηκονόμους, το οποίο στηρίζει τη διαδικασία της αντιστοίχησης,

και επιτρέπει τη χρησιμοποίηση συνδυασμών επιλεγμένων RDFS/OWL

λεξιλογίων, για τη διαμόρφωση των δεδομένων.

Η μετατροπή δεδομένων MARC, σε RDF, κάτω από τις αρχές των

συνδεδεμένων δεδομένων, περιλαμβάνει μια σειρά από βήματα:

1. Ανάλυση των MARC εγγραφών

2. Ταξινόμηση των εγγραφών, αντιστοιχώντας ένα RDFS/OWL

τύπο μοντέλου ή της κλάσης που έχει επιλεγεί για την

μοντελοποίηση των δεδομένων

3. Επισήμανση ή περιγραφή των πόρων που δημιουργούνται,

με τη χρήση μεταδεδομένων από τα αρχεία MARC.

4. Δημιουργία σχέσεων μεταξύ των επισημανθέντων και

παραγόμενων πόρων

Λειτουργικά, το εργαλείο Marimba, πραγματοποιεί ένα βήμα προ-

επεξεργασίας, παράγοντας ένα σύνολο υπολογιστικών φύλλων με βάση

αρχεία πηγών, τα οποία λειτουργούν ως πρότυπα αντιστοίχησης

διαφορετικών στοιχείων μεταδεδομένων MARC σε κατάλληλες RDFS / OWL

κλάσεις και ιδιότητες.

Το Marimba εκμεταλλεύεται τη δομή των αρχείων MARC21,

συγκεκριμένα τους κωδικούς των πεδίων (π.χ.100, 245), τους κωδικούς

των υποπεδίων (π.χ.$a$i$t) και των πεδίων των πληροφοριών των

τίτλων. Αν και η σημασία αυτών των κωδικών ορίζεται από το πρότυπο

86

MARC, δε χρησιμοποιούνται πάντα όλοι οι κωδικοί και η χρήση τους

μπορεί να ποικίλλει μεταξύ των διαφόρων βιβλιοθηκών. Μία από τις

σχεδιαστικές αρχές πίσω από την προσέγγιση που ακολουθείται από το

Marimba, είναι να αντλήσει τις αντιστοιχήσεις από πραγματικά

δεδομένα, παρουσιάζοντας στο βιβλιοθηκονόμο τα τρέχοντα στοιχεία

μεταδεδομένων που χρησιμοποιούνται στα αρχεία MARC ώστε να μπορούν να

αντιστοιχήσουν χειροκίνητα τις αντιστοιχίες κλάσεων και ιδιοτήτων

RDFS και OWL. Το προ-επεξεργαστικό βήμα παράγει τρία υπολογιστικά

φύλλα. (βλ. παράδειγμα που ακολουθεί στο Υποκεφάλαιο 6.3.2)

6.3.2 Παράδειγμα διαδικασίας αντιστοίχησης με το εργαλείο marimba

A. Ανάλυση της διαδικασίας αντιστοίχησης για βιβλιογραφικές

εγγραφές από το εργαλείο Marimba.

Το παράδειγμα της διαδικασίας αντιστοίχησης που ακολουθεί μας

δείχνει ένα παράδειγμα αντιστοίχησης βιβλιογραφικής εγγραφής..

Το παράδειγμα που ακολουθεί, μας δίνει ένα αρχείο που

παρουσιάζει το ακόλουθο πεδίο τίτλου: “245$a Cronica de una muerte

anunciada” και ένα που παρουσιάζει το πεδίο τίτλου: “245$a Cronica

de una muerte anunciada c$ Gabriel Garcia Marquez.”

Τα βήματα που θα ακολουθήσουμε είναι τα εξής: 87

Αντιστοίχηση Ταξινόμησης (Classify Mapping):

Παρουσιάζονται στον χρήστη όλοι οι πιθανοί συνδυασμοί

του πεδίου και των υποπεδίων τίτλου και χρησιμοποιείται

για να ορίσουν τις οντότητες του μοντέλου FRBR αλλά και

τις συσχετίσεις μεταξύ τους.

-”245$c—Πρόσωπο (Person) (έχει ως προσωπικό όνομα)”

-“245$a---Έργο (Work) (έχει ως τίτλο)”

Αντιστoίχηση Επισήμανσης (Annotation Mapping):

Παρουσιάζονται στον χρήστη όλοι οι πιθανοί συνδυασμοί

του πεδίου και υποπεδίου (π.χ.245$c) για κάθε τύπο

οντότητας, και ό, τι χρησιμοποιείται για την

αντιστοίχηση κάθε πεδίου MARC σε μια συγκεκριμένη

ιδιότητα.

-“245$a Cronica de una muerte anucianda—Label”

-“245$c Gabriel Garcia Marquez—Label”

Αντιστοίχηση συσχετίσεων (Relationship Mapping):

Παρουσιάζονται στο χρήστη όλες οι δυνατές παραλλαγές

των υποπεδίων (π.χ.245$a+$c) στο πεδίο τίτλου για κάθε

ζεύγος οντοτήτων.

“To έργο “Cronica de una Muerte Anucianda” δημιουργήθηκε από(is created by) τον Gabriel Garcia Marquez”

Το παρακάτω σχεδιάγραμμα μας δείχνει πώς θα αντιστοιχηθούν οι

οντότητες frbr:person και frbr:work με τη διαδικασία αντιστοίχησης88

ταξινόμησης, το πεδίο $a σε frbr:titleOfwork το πεδίο $c σε

frbr:nameOfperson και πώς θα συσχετιστούν χρησιμοποιώντας την

ιδιότητα frbr:isCreatorOf βασισμένοι στην παραλλαγή των υποπεδίων

(245$a+$c) χρησιμοποιώντας τη διαδικασία αντιστοίχησης συσχέτισης.

Δεδομένα Marc21 Δομή Marc21 RDFS/OWL RDF

αντιστοιχεί

αντιστοιχεί

ιδιότητα

ιδιότητα

Σχεδιάγραμμα 1.: Διαδικασία αντιστοίχησης με το εργαλείο Marimba

89

245$c Gabriel Garcia

245$aCronica de una muerte anunciada$Gabriel Garcia Marquez

245$aCronica de una muerteanunciada

245$a

Περιεχόμενο(245$a)

Περιεχόμενο(245$a$c)

Πρόσωπο

Είναι δημιουργός του

έργου

Τίτλος του εργου

Gabriel Garcia

Cronica de unamuerte anunciada

“Cronica de una muerte

Είναι δημιουργός του

245$a$c

245$a

Classification

mapping

Σχεδιάγραμμα 2. Τα τρία βήματα αντιστοίχησης σε υπολογιστικά φύλλα προεπεξεργασίας

Β. Ανάλυση της διαδικασίας αντιστοίχησης για καθιερωμένες

εγγραφές από το εργαλείο Marimba.

Αντιστοίχηση RDF (RDF Classification): Βασίζεται στο

συνδυασμό των υποπεδίων του κύριου σημείου πρόσβασης

μίας εγγραφής (100$a$d) και παράγει μία εγγραφή όπου

προσδιορίζεται ο τύπος του παραγώμενου RDF πόρου.90

Annotation

Mapping

Relationship Mapping

Σκοπός είναι η ευθυγράμμιση μίας εγγραφής ή ο

συνδυασμός μερικών εγγραφών με μία ή παραπάνω owl/rdf

κλάσεις σύμφωνα με τα χαρακτηριστικά της εγγραφής.

Ο τύπος των εγγραφών καθιερωμένων όρων προσδιορίζεται από το

συνδυασμό των υποπεδίων των κύριων σημείων πρόσβασης (1ΧΧ). Υπάρχει

ένα φύλλο προ-επεξεργασίας για κάθε πεδίο. (πεδία, 100, 111, 130, 150,

151).

Περιγραφή RDF (RDF Description): Δεδομένου ότι η

προηγούμενη εγγραφή καθιερωμένων όρων (100$a$d)

αντιστοιχήθηκε στον τύπο της FRBR οντότητας Πρόσωπο. Σε

αυτό το βήμα διαδικασίας θα αποφασιστεί αν θα

αντιστοιχηθεί στο frbr:nameOfperson, ή στο rdfs:label.

Σύμφωνα με τον Suero (Suero, 2013) στις δυνατότητες του

εργαλείου, ένα πεδίο μπορεί να αντιστοιχηθεί σε μία ιδιότητα, ένα

πεδίο μπορεί να αντιστοιχηθεί σε πολλές ιδιότητες ένα υποπεδίo μπορεί

να αντιστοιχηθεί σε μία ιδιότητα ένα υποπεδίo μπορεί να αντιστοιχηθεί

σε πολλές ιδιότητες.

Για την καθιέρωση των συσχετίσεων μεταξύ βιβλιογραφικών και

καθιερωμένων εγγραφών χρησιμοποιείται η κλάση “frbr:isEmbodiedIn”

μεταξύ “frbr:Expression” και “frbr:Manifestation”. Η συσχέτιση

εγκαθιδρύεται με ένα πεδίο που βρίσκεται στο 245 της βιβλιογραφικής

εγγραφής που περιέχει έναν κωδικό αντιστοιχίας στο πεδίο 001 της

καθιερωμένης εγγραφής και η οντότητα που δημιουργείται είναι η

frbr:Work. Η οντότητα frbr:expression δεν υπάρχει στον κατάλογο και

91

έτσι δημιουργείται μία έκφραση από το πεδίο 008 της βιβλιογραφικής

εγγραφής. Η οντότητα “frbr:work” και “frbr:manifestation” συνδέονται

με τη νέα έκφραση. Τέλος γίνεται έλεγχος όλων των URIs από το εργαλείο

μετατροπής για τυχόν αλλαγές. Για να γίνει εφικτή η αυτόματη παραγωγή

στο υποσύνολο των δεδομένων datos.es το Marimba εισάγει τις MARC21

πηγές δεδομένων, τις προδιαγραφές των URIs, και τα τρία φύλλα προ-

επεξεργασίας.

Η ιστοσελίδα που φιλοξενεί το εργαλείο:

http://bne.linkeddata.es/mapping-marc21/, παρέχει περισσότερες

λεπτομέρειες σχετικά με την αντιστοίχηση και τις διαδικασίες

μετατροπής.

92

6.4 Άλλα εργαλείαΗ Ισπανική βιβλιοθήκη χρησιμοποιεί κατά τη διαδικασία διασύνδεσης

και δημοσίευσης των δεδομένων της τα παρακάτω εργαλεία:

Διακομιστή δεδομένων Virtuoso57

Εφαρμογή Web Server58

Pubby59: εργαλείο για την προσθήκη διεπαφών με Sparql-

endpoints συνδεδεμένων δεδομένων. Μεγάλο μέρος των δεδομένων

του σημασιολογικού ιστού, που είναι αποθηκευμένα μέσα σε

βάσεις δεδομένων προτάσεων RDF σε μορφή αποθηκευμένων τριάδων

(triple-stores) μπορούν να προσεγγιστούν μόνο με την αποστολή

ενός σημείου υποδοχής Sparql ερωτημάτων ή Sparql ερωτήματος.

Είναι δύσκολο υπάρξει σύνδεση πληροφοριών από αυτά τα triple-

stores, με άλλες πηγές εξωτερικών δεδομένων.

Silk60: a link discovery framework for the web of data:

εργαλείο για την ανεύρεση σχέσεων μεταξύ των πόρων από

διαφορετικές πηγές συνδεδεμένων δεδομένων. Οι δημιουργοί των

νέων συλλογών έχουν τη δυνατότητα να χρησιμοποιήσουν αυτό το

εργαλείο για να συμμετάσχουν σε συνδέσεις RDF από τις πηγές

των δεδομένων τους με άλλες πηγές στο Web.

57http://virtuoso.openlinksw.com 58 http://www.w3.org/Servers.html

59 http://www.w3.org/2001/sw/wiki/Pubby

60 http://wifo5-03.informatik.uni-mannheim.de/bizer/silk/93

6.5 Μοντελοποίηση Η πύλη Datos.bne.es αποτελεί μία από τις πρώτες διεθνείς

πρωτοβουλίες πλήρους κάλυψης των οντολογιών που ανέπτυξε η IFLA, οι

οποίες έχουν ευρέως συμφωνηθεί από την κοινότητα των βιβλιοθηκών για

την απεικόνιση των πόρων σε RDF. Τα στοιχεία του καταλόγου της Εθνικής

Βιβλιοθήκης της Ισπανίας έχουν διαμορφωθεί σύμφωνα με τα μοντέλα FRBR

(για τις βιβλιογραφικές εγγραφές), FRAD (για τα αρχεία καθιερωμένων

αποδόσεων), και FRSAD (για τα αρχεία καθιερωμένων θεματικών όρων) και

του λεξιλογίου ISBD. Ένας συγκεντρωτικός κατάλογος βιβλιοθήκης όλων

των παραπάνω σαφώς παρέχει ένα πολύ ολοκληρωμένο και εύρυθμο πλαίσιο

δεδομένων επιτρέποντας τη σχέση τους με άλλα θεωρητικά μοντέλα

παρεμφερών κλάδων.

Ο πυρήνας του δικτύου της οντολογίας απαρτίζεται από τις δύο

πρώτες ομάδες των FRBR οντοτήτων δηλαδή το έργο, την έκφραση, την

εκδήλωση και το αντίτυπο, το πρόσωπο και το συλλογικό όργανο. Η κλάση

”Θέμα”(Thema), προερχόμενη από το πρότυπο FRSAD, έχει χρησιμοποιηθεί

για να μοντελοποιήσει το Αρχείο Καθιερωμένων Θεματικών Όρων. Η ευκολία

της χρήσης αυτών των λεξιλογίων, είναι εκτεταμένη σε πρακτικές

βιβλιοθηκών και διασφαλίζει τη σωστή χρήση της ορολογίας και των

εννοιών.

Επιπλέον, τα συνδεδεμένα δεδομένα της Εθνικής Βιβλιοθήκης της

Ισπανίας, συνδέονται άμεσα με πόρους άλλων δεδομένων:

VIAF: Διεθνές Εικονικό Αρχείο Καθιερωμένων Όρων, το

οποίο καλύπτει ονόματα φυσικών προσώπων και

94

συλλογικών οργάνων. Συνδέει τις εγγραφές καθιερωμένων

ονομάτων διάφορων εθνικών βιβλιοθηκών σε μια ενιαία

υπηρεσία καθιέρωσης ονομάτων, η οποία διατίθεται

ελεύθερα στον Παγκόσμιο Ιστό και παρέχει έναν τρόπο

αναζήτησης πληροφοριών καθιερωμένων όρων και

ανάκτησης εγγραφών καθιερωμένων όρων, για τον

χρήστη, σε μια ποικιλία μορφών.

(συμπεριλαμβανομένων των Εθνικών Βιβλιοθηκών της

Γαλλίας, και της Βιβλιοθήκης του Κογκρέσου των Η.Π.Α,

καθώς και της εν λόγω Βιβλιοθήκης, η οποία

ενσωματώθηκε το 2009).

Dbpedia61: Η Dbpedia αποτελεί μια συλλογική προσπάθεια

για την εξαγωγή και την επαναχρησιμοποίηση δομημένης

πληροφορία από την Wikipedia και της δημοσιευσής της

ως διασυνδεδεμένα δεδομένα.

Sudoc.62 (Superintended of Document Classification

Scheme): Ταξινομικό Σύστημα το οποίο οργανώνεται

σύμφωνα με φορείς (agents) υπεύθυνους για τις

εκδόσεις.

Libris63. The NIE (National Institute of Education-

Singapore-Library and Information Services Centre):

61 http://dbpedia.org/About

62 http://www.sudoc.abes.fr/?

63 http://libris.nie.edu.sg95

Αποτελεί την μεγαλύτερη εκπαιδευτική βιβλιοθήκη στη

Σιγκαπούρη, η οποία σκοπεύει στην παροχή υπηρεσιών

και σχετικών πηγών πληροφόρησης για την άριστη

ανάπτυξη στους τομείς της κατάρτισης των

εκπαιδευτικών και της εκπαιδευτικής έρευνας στο NIE.

GND64.(Gemeinsame Normdatei [Αρχείο καθιερωμένων όρων

της Εθνικής Βιβλιοθήκης της Γερμανίας]): Προσφέρει ένα

ευρύ φάσμα στοιχείων για την περιγραφή καθιερωμένων

όρων. Προέρχεται από τη γερμανική βιβλιοθηκονομική

κοινότητα με σκοπό την επίλυση της ασάφειας των

ονομάτων στον βιβλιοθηκονομικό κόσμο.

DnB65.(Deutsche Nationalbibliografie): Η Υπηρεσία

Συνδεδεμένων Δεδομένων της Εθνικής Βιβλιοθήκης της

Γερμανίας, η οποία περιλαμβάνει βιβλιογραφικά

δεδομένα από τον Ιανουάριο του 2012.

Lexvo66. Λεξιλόγιο που προσφέρει πληροφορίες για τις

γλώσσες, τις λέξεις, τους χαρακτήρες, και άλλες

οντότητες της ανθρώπινης γλώσσας στον ιστό των

συνδεδεμένων δεδομένων και τον σημασιολογικό ιστό.

Καθορίζει παγκόσμια αναγνωριστικά για αντικείμενα

σχετικά με τις γλώσσες, διασφαλίζει την

64  http://www.dnb.de/gnd

65  http://www.dnb.de/nationalbibliografie

66 http://www.lexvo.org96

αντικατεύθυνση των αναγνωριστικών, τη στενή

αλληλεξάρτησή τους και τη σύνδεσή τους με μια

ποικιλία πόρων στο διαδίκτυο.

OWL:SameAs67: Ενσωματωμένη ιδιότητα στην οντολογία OWL

που εντοπίζει και συνδέει λεκτικά δύο σχετικούς

πόρους.

Δεδομένου ότι τα μοντέλα της IFLA είναι στην αγγλική γλώσσα, η

δημιουργία της ισπανικής ορολογίας γίνεται σε στενή συνεργασία με την

IFLA, μέσω μίας μεταφραστικής διαδικασίας.

67 http://www.w3.org/TR/owl-ref/#sameAs-def97

Κεφάλαιο 7

Μοντέλο ανοιχτών συνδεδεμένων δεδομένων της ΕθνικήςΒιβλιοθήκης της Βρετανίας68

7.1 Πλαίσιο δημιουργίας69

Η BNB70 αποτελεί μια ολοκληρωμένη βάση δεδομένων όλων των νέων

βιβλίων και περιοδικών που έχουν δημοσιευθεί ή διανεμηθεί στο

Ηνωμένο Βασίλειο και την Ιρλανδία από το 1950. Είναι ο πιο

ενημερωμένος ενιαίος κατάλογος τίτλων του Ηνωμένου Βασιλείου. Οι

βρετανικοί και οι Ιρλανδικοί τίτλοι έχουν από τον νόμο την

υποχρέωση να στέλνουν ένα αντίτυπο από όλες τις νέες εκδόσεις

(και των τίτλων των σειριακών εκδόσεών τους) στο Γραφείο Νομικής

Κατάθεσης (Legal Deposit Office71) της Βρετανικής Βιβλιοθήκης. Η

καταλογογράφηση του υλικού πραγματοποιείται από έμπειρο προσωπικό

σύμφωνα με τα διεθνή πρότυπα περιγραφής πόρων και πρόσβασης και

σε συνεργασία με τις άλλες 5 βρετανικές και ιρλανδικές

βιβλιοθήκες. 72

68

69 Περιοδικό, Καινοτομία Έρευνα και Τεχνολογία,10/11, 2010 σ.16

70 http://bnb.bl.uk

71 http://www.bl.uk/aboutus/legaldeposit/

72 http://www.bl.uk/aboutus/legaldeposit/98

Περιλαμβάνει πάνω από 3,5 εκατομμύρια εγγραφές που

περιγράφουν δημοφιλή και ερευνητικού επιπέδου δημοσιεύσεις για

ενήλικες και παιδιά σε όλα τα θέματα σε όλες τις γλώσσες της

δημοσίευσης. Οι εγγραφές της BNB, αντιπροσωπεύουν την εκδοτική

δραστηριότητα του Ηνωμένου Βασιλείου και της Ιρλανδικής

Δημοκρατίας και αποτελούν το “μέτρο” της πνευματικής παραγωγής

τους. Πρόσφατα η BNB έχει επεκταθεί και σε ηλεκτρονικές

δημοσιεύσεις.

Αρχικά, τα μεταδεδομένα και οι υπηρεσίες της Βρετανικής

Βιβλιοθήκης έχουν λειτουργήσει σε εμπορική βάση και αποσκοπούν

κυρίως στην κοινότητα των βιβλιοθηκών. Ωστόσο, η BNB έχει

εξελιχθεί μέσα από πολλές αλλαγές σε μορφές εκδόσεων και

τεχνολογίες υπολογιστών κατά τα τελευταία εξήντα χρόνια για τη

δημιουργία μίας αξιοσημείωτης πρωτοβουλίας στο τομέα των Ανοιχτών

Μεταδεδομένων της Βρετανικής Βιβλιοθήκης. Τα ανοιχτά μεταδεδομένα

για τη Βρετανική Βιβλιοθήκη είναι ένα λογικό βήμα ανάπτυξης της

εδραιωμένης αρχής της βιβλιοθήκης για ελεύθερη πρόσβαση στην

πληροφόρηση. Το 2010 η οργάνωση άρχισε μια νέα στρατηγική ανοιχτών

μεταδεδομένων που αποσκοπούν στην άρση των εμποδίων της ευρύτερης

χρήσης των περιγραφικών μεταδεδομένων της σε ζητήματα που

αφορούσαν περιοριστικούς όρους αδειοδότησης ή πρότυπα πρόσβασης73 Η

ανοιχτή πρόσβαση στα βιβλιογραφικά δεδομένα της Εθνικής

Βιβλιοθήκης της Βρετανίας εντάσσεται στο πλαίσιο του στόχου της να

παρέχει δεδομένα όχι μόνο στους ειδικούς στην επιστήμη της

73 http://data.gov.uk/blog/linked-open-british-national-bibliography99

πληροφόρησης αλλά και σε ένα ευρύτερο κοινό. Παράλληλα, παρέχοντας

ελεύθερη πρόσβαση στην εκτεταμένη συλλογή βιβλιογραφικών εγγραφών

της η Βιβλιοθήκη στοχεύει να ενισχύσει τις καινοτόμες χρήσεις που

θα προκύψουν από αυτό το σημαντικό υλικό.

Αριθμούνται περίπου 14 εκατομμύρια βιβλιογραφικές εγγραφές

δημοσιευμάτων, που χρονολογούνται έως και μερικούς αιώνες πριν και

αφορούν όλα τα πεδία της γνώσης ότι είναι πλέον προσβάσιμες από

όλους. Η Βρετανική Βιβλιοθήκη διαθέτει αυτό το υλικό σε μορφή

XML και δομημένο σε τύπο αρχείου RDF/DC, ενώ χρησιμοποιεί άδειες

CC0 που δεν επιτρέπουν την αξιοποίησή του για εμπορικούς σκοπούς.

Τα δεδομένα είναι χρήσιμα στην επιστημονική έρευνα, τη διδασκαλία

και την αναζήτηση καθώς και στις υπηρεσίες των βιβλιοθηκών. Η

Βρετανική Βιβλιοθήκη εξετάζει τις δυνατότητες που υπάρχουν

προκειμένου στο μέλλον τα μεταδεδομένα της να δομούνται ως

συνδεδεμένα δεδομένα. Η νέα αυτή υπηρεσία της Βρετανικής

Βιβλιοθήκης λειτουργεί παράλληλα με την υπηρεσία μαζικής

προμήθειας δεδομένων στο σύστημα MARC, η οποία χρησιμοποιείται με

πληρωμή από μεγάλους εμπορικούς πελάτες της βιβλιοθήκης.

7.2 Διαθεσιμότητα Δεδομένων- Μοντέλο δεδομένων, σχήμα και πρότυπα URIs

Τα Ανοιχτά Συνδεδεμένα Δεδομένα της Εθνικής Βρετανικής

Βιβλιογραφίας φιλοξενούνται στην ηλεκτρονική διεύθυνση:

http://bnb.data.bl.uk.100

Οι χρήστες μπορούν να επιλέξουν από τις παρακάτω επιλογές για

την αναζήτηση των δεδομένων:

1. Linked Open BNB. Διαθέσιμα στο:

http://www.bl.uk/bibliographic/datafree.html

H Βρετανική Βιβλιοθήκη, αναπτύσσει μία έκδοση της Εθνικής

Βρετανικής Βιβλιογραφίας η οποία γίνεται διαθέσιμη ως Ανοιχτά

Συνδεδεμένα Δεδομένα από τον Ιούλιο του 2011, διαμέσου της

πλατφόρμας Tso74 (η οποία διαδέχτηκε την πλατφόρμα Talis75 το 2013),

με την οποία συνεργάστηκε για την ανάπτυξη του μοντέλου. H αρχική

της έκδοση περιλαμβάνει δημοσιευμένα βιβλία (συμπεριλαμβανομένων

μονογραφιών που δημοσιεύονται σταδιακά) καθώς και περιοδικές/

σειριακές εκδόσεις με μελλοντική προοπτική επέκτασης σε πολύτομα

έργα, ενσωματωμένες πηγές, όπως είναι οι εκδόσεις που περιέχουν

άδετα δημοσιευμένα φύλλα, kits, καθώς και προσεχείς εκδόσεις σε

εξέλιξη.

Το μοντέλο δεδομένων για τα βιβλία και τις σειριακές εκδόσεις

είναι διαθέσιμα μέσω της Υπηρεσίας σε αρχεία PDF (βλ. Κεφάλαια

9,10 για τους πίνακες των σχημάτων). Η τελευταία έκδοση του

σχήματος βρίσκεται δημοσιευμένη στη διεύθυνση

http://www.bl.uk/schemas/. Όλα τα URIS της Βρετανικής Βιβλιοθήκης

είναι HTTP-URIs (ξεκινούν με HTTP) και βρίσκονται μέσα στο πεδίο

74http://openup.tso.co.uk

75 http://www.w3.org/2001/sw/wiki/TalisPlatform101

διευθύνσεων bnb.data.bl.uk. Ένας πλήρης κατάλογος των προτύπων που

χρησιμοποιούνται υπάρχει διαθέσιμος σε μορφή PDF (βλ. Κεφάλαιο 9).

7.3 Πρόσβαση στα Ανοιχτά Συνδεδεμένα Δεδομένα της BNB

Το υποσύνολο της Βρετανικής Εθνικής Βιβλιογραφίας που καλύπτει

τα βιβλία και τις περιοδικές εκδόσεις που έχουν δημοσιευτεί ή

διανεμηθεί στο Ηνωμένο Βασίλειο από το 1950 είναι διαθέσιμο στις

παρακάτω υπηρεσίες αναζήτησης:

Search service.76: Υπηρεσία αναζήτησης των ερωτημάτων

βάσει κριτηρίων (αριθμός αποτελεσμάτων, XLST77 )

SPARQL endpoint.78: Εργαλείο που μπορεί να χρησιμεύσει

ως τελικό σημείo υποδοχής ερωτήματος ή ερωτημάτων

SPARQL, για μεγάλα σύνολα δεδομένων. Τα αποτελέσματα

των ερωτημάτων επιστρέφουν σε ένα ή περισσότερα

μηχανο-επεξεργάσιμα μορφότυπα. Μια υπάρχουσα

σχεσιακή βάση δεδομένων τοποθετείται ως συνδεδεμένα

δεδομένα και SPARQL, με τη χρήση διακομιστή

δεδομένων D2RServer79.

76 bnb.data.bl.uk/search

77 http://www.w3.org/TR/xslt

78 http://www.w3.org/wiki/SparqlEndpoints

79 http://d2rq.org/d2r-server102

Describe endpoint80: Μία από τις μορφές εμφάνισης των

αποτελεσμάτων ενός ερωτήματος SPARQL. Δημιουργεί ένα

RDF γράφο, με τους ανακτηθέντες πόρους. Επίσης δίνει

τη δυνατότητα εμφάνισης των αποτελεσμάτων σε

γλώσσες XML81, N-triples82, Turtle83 και Json84.

The Data Hub85: Μητρώο δεδομένων, όπου δίνεται η

δυνατότητα συνεργατικής περιγραφής, χρήσης και

διαμοιρασμού πληροφοριών για όλων των τύπων συνόλων

δεδομένων. Πολλά από τα δεδομένα που περιγράφονται

στο μητρώο, είναι σε μορφή συνδεδεμένων δεδομένων.

Υπάρχουν δείγματα αρχείων RDF/XML που είναι διαθέσιμα στη

διεύθυνση: http://www.bl.uk/bibliographic/datasamples.html#lodbnb, καθώς

και ο όγκος των λήψεων των αρχείων σε RDF/XML και N-triples στη

διεύθυνση: http://www.bl.uk/bibliographic/download.html

Tο παραπάνω υποσύνολο (Αύγουστος, 2012, έκδοση 1.4 και

έκδοση 1.0 για τις σειριακές εκδόσεις) 2.8 περίπου εκατομμυρίων

αρχείων παρήγαγε 93.583.853 τριπλέτες. Η διανομή των αρχείων

80 http://www.w3.org/wiki/SparqlEndpointDescription.

81 http://www.w3.org/XML/

82 http://www.w3.org/2001/sw/RDFCore/ntriples/

83 http://www.w3.org/TR/turtle/

84 http://www.w3schools.com/json/

85 http://datahub.io.103

γίνεται με άδεια Creative Commons CC0 1.0 Universal Public Domain

Dedication.

7.4 Μοντελοποίηση

Τα δεδομένα που περιγράφονται χρησιμοποιούν τις ιδιότητες από

τα ακόλουθα λεξιλόγια:

Bibliographic Ontology86: Οντολογία που περιέχει

βασικές έννοιες και ιδιότητες για την περιγραφή

παραμπομπών και βιβλιογραφικών αναφορών στον

σημασιολογικό ιστό.

Bio87: Λεξιλόγιο το οποίο περιέχει βιογραφικές

πληροφορίες προσώπων (εν ζωή ή όχι) για βασικές

περιόδους της ζωής τους.

BLTerms88 (British Library Terms): Όροι βρετανικής

βιβλιοθήκης

Event Ontology.89: Η κύρια κλάση της συγκεκριμένης

οντολογίας επικεντρώνεται στην έννοια γεγονότων που

έχουν ήδη πραγματοποιηθεί.

86 http://bibliontology.com.

87 http://vocab.org/bio/0.1/.html.

88 http://www.bl.uk/terms

89 http://motools.sourceforge.net/event/event.html104

Org90.Organization Ontology: Oντολογία περιγραφής

οργανωτικών δομών, που δημιουργήθηκε για να

υποστηρίξει τη δημοσίευση των συνδεδεμένων δεδομένων

που έχουν σχέση με οργανωτικές πληροφορίες σε

διάφορα πεδία. Ο σχεδιασμός της επιτρέπει

προεκτάσεις σε συγκεκριμένους τομείς και την

ταξινόμηση των οργανισμών και των ρόλων τους και

υποστηρίζει παρεμφερείς πληροφορίες, όπως οι

δραστηριότητες των οργανισμών.

WGS84 Geo Positioning91: Το W3C Basic Geo Vocabulary

[GeoPos84] είναι ένα λεξιλόγιο που παρέχει μία

περιοχή ονομάτων για την αναπαράσταση ενός

γεωγραφικού πλάτους (lat) ή γεωγραφικού μήκους

(long) και άλλες πληροφορίες σχετικές με χωρικά

αντικείμενα, χρησιμοποιώντας το WGS84 ως τυπική έδρα

αναφοράς.

DCMI, FOAF, ISBD, SKOS, OWL, RDF SCHEMA Preliminary

Version of RDA: Resource Description and Access.

Για την τοποθέτηση των δεδομένων της BNB σε ένα βαθύτερο

πλαίσιο υπάρχει σύνδεση με τις παρακάτω ανοιχτές πηγές δεδομένων:

VIAF , LCSH, Lexvo

90 http://www.w3.org/TR/vocab-org/.http://www.w3.org/TR/vocab-org/.

91 http://www.w3.org/2003/01/geo/105

MarcCountry92, MarcLanguageCode93 για κωδικούς χωρών

και γλωσσών

Geonames: Παγκόσμια γεωγραφική βάση δεδομένων, η

οποία καλύπτει όλες τις χώρες και περιέχει πάνω από

10.000.000 γεωγραφικές ονομασίες, και περιλαμβάνει

7.500.000 μοναδικά χαρακτηριστικά, 2,8 εκατομμύρια

κατοικημένες περιοχές και άλλα 5,5 εκατομμύρια

εναλλακτικά ονόματα.

DEWEY.INFO94. Πειραματικό πεδίο σύνδεσης δεδομένων

DDC. Σκοπός του πρωτοτύπου είναι η δημιουργία μίας

πλατφόρμας για δεδομένα DEWEY στον παγκόσμιο ιστό.

Rdf book mashup95 (Serving RDF descriptions of your

books).: Υπηρεσία που μας επιδεικνύει τρόπους

ενσωμάτωσης Web 2.0 πηγών δεδομένων, όπως είναι το

Amazon, το Google, το Yahoo, στον σημασιολογικό

ιστό. Διαθέτει πληροφορίες σχετικά με βιβλία,

συγγραφείς, αξιολογήσεις, διαδικτυακά βιβλιοπωλεία

διαθέσιμα στον σημασιολογικό ιστό. Αυτές οι

πληροφορίες μπορούν να επεξεργαστούν από εργαλεία

92 http://www.w3.org/2005/Incubator/lld/XGR-lld-vocabdataset-20111025/#MARC_Countries_list

93 http://www.w3.org/2005/Incubator/lld/XGR-lld-vocabdataset-20111025/#MARC_Countries_list

94 http://dewey.info

95 http://wifo5-03.informatik.uni-mannheim.de/bizer/bookmashup/106

RDF και να συνδεθούν με άλλα δεδομένα στον

σημασιολογικό ιστό.

107

7.4.1 Βασική RDF/XML (Basic RDF/XML)96

Η Βρετανική Βιβλιοθήκη διαθέτει μερικά αντίγραφα από τα σύνολα

δεδομένων για ερευνητικούς σκοπούς, στην προσπάθεια του στόχου της

να προσφέρει τα μεταδεδομένα της για ευρύτερη χρήση πέρα από την

παραδοσιακή κοινότητα των βιβλιοθηκών. Τα αρχεία παρέχονται αρχικά

σε μία βασική XML/RDF παρουσίαση και διανέμονται με άδεια άδεια

CC01.0 Universal Public Domain Dedication.

BNB. Η βασική παρουσίαση RDF/XML είναι τεκμηριωμένη

σε μορφή pdf αρχείου

British Library Integrated Catalogue Books97

(Ολοκληρωμένος Κατάλογος Βιβλίων Βρετανικής

Βιβλιοθήκης )

Αυτό το σύνολο δεδομένων περιλαμβάνει βιβλία της συλλογής της

Βρετανικής Βιβλιοθήκης, τα οποία δεν έχουν επιλεχθεί από την BNB.

Η βασική παρουσίαση RDF/XML είναι ίδια με την βασική παρουσίαση

RDF/XML της BNB. Το πλήρες σύνολο δεδομένων είναι διαθέσιμο για

λήψη.

96 http://www.bl.uk/bibliographic/datafree.html#basicrdfxml

97http://catalogue.bl.uk/primo_library/libweb/action/search.do?dscnt=1&dstmp=1408961268670&vid=BLVU1&fromLogin=true

108

7.4.2 Άρθρα περιοδικών

Η Βρετανική Βιβλιοθήκη, εξετάζει τα θεματικά μεταδεδομένα από

άρθρα εφημερίδων και περιοδικών ώστε να γίνει συγκεκριμένη επιλογή

για τη διάθεσή τους σε ανοιχτά συνδεδεμένα δεδομένα. Υπάρχουν

δείγματα αρχείων που καλύπτουν τις θεματικές περιοχές

“Παλαιοντολογία” και “Κρυσταλλογραφία”, διαθέσιμα από το Data Hub

και μέσω FTP. Οι εκδόσεις των συγκεκριμένων συνόλων είναι

δομημένες με τη βασική μορφή RDF/XML και συνεπώς δεν προορίζονται

για ένα περιβάλλον συνδεδεμένων δεδομένων

7.4.3 Marc21 μέσω Z3950

Η πλήρης σειρά των δεδομένων είναι διαθέσιμη μέσω FTP και

ενημερώνεται μηνιαία. Η πρόσβαση στον πλήρη κατάλογο της

Βρετανικής Βιβλιοθήκης και στην Εθνική Βρετανική Βιβλιογραφία,

είναι διαθέσιμη σε marc21 με την προϋπόθεση της εγγραφής από τους

χρήστες και διαβεβαίωσής τους ότι η χρήση των δεδομένων θα

διατεθεί για μη-εμπορικούς σκοπούς:

Ανακάλυψη πόρων/ πηγών

Εκμάθηση, διδασκαλία, ακαδημαϊκή και επιστημονική έρευνα ή ιδιωτική μελέτη

Καταλογογράφηση ή παραγγελία υλικού

109

Παροχή πληροφοριών αποκλειστικά και μόνο για τα καταχωρημένα

αντίτυπα βιβλιοθηκών και την καταχώρησή τους σε έναν ενιαίο

κατάλογο ή σε μία βάση διαδανεισμού δεδομένων.

.

Η επαλήθευση των βιβλιογραφικών πληροφοριών ή/και του

προσδιορισμού των υλικών για τις παραγγελίες μέσω δια-δανεισμού,

από τους προμηθευτές εγγράφων ή άλλες πηγές πιστοποίησης του

υλικού μπορούν να αγοραστούν ή να αποκτηθούν. Για την πρόσβαση

στις βάσεις δεδομένων Z3950 είναι απαραίτητος ένας εξυπηρετητής

Z3950 client, ή με την εγκατάσταση ενός αυτόνομου εξυπηρετητή,

όπως:

BookWhere 98

EndNote 99

MarcEdit 100 (ελεύθερο λογισμικό)

Mercury 101 (ελεύθερο λογισμικό)

BibDesk 102 (ελεύθερο λογισμικό για Mac OS)

7.4.4 Νέοι τίτλοι BNB. Εβδομαδιαία αρχεία (PDF και Βασική rdf/xml)

Αυτή η υπηρεσία αφορά την παραγωγή ενός εβδομαδιαίου καταλόγου

με τις νέες εγγραφές της Εθνικής Βρετανικής Βιβλιογραφίας για98 http://www.webclarity.info/products/bookwhere/

99 http://endnote.com

100 http://marcedit.reeset.net/features

101 http://www.basedowinfosys.com

102 http://bibdesk.sourceforge.net110

διευκόλυνση των χρηστών Υπάρχει διαθέσιμη σε αρχεία PDF σύμφωνα με

την ταξινόμηση Dewey και σε μορφή XML/RDF για χρήση από

υπολογιστές. Τα ελεύθερα βιβλιογραφικά δεδομένα της Βρετανικής

Βιβλιοθήκης είναι προσβάσιμα στην

ιστοσελίδα: http://www.bl.uk/bibliographic/datafree.html.

111

ΚΕΦΑΛΑΙΟ 8

Παράδειγμα σύμφωνα με το Μοντέλο ΠεριγραφήςΣυνδεδεμένων Δεδομένων της Εθνικής Βιβλιοθήκης

της Ισπανίας

8.1 Σκοπός του παραδείγματος

Αυτή η ενότητα είναι αφιερωμένη σε ένα παράδειγμα των στοιχείων

που μπορούν να βρεθούν μέσα στο σύνολο δεδομένων datos.bne.es. Tα

δεδομένα σχετίζονται με τον κολομβιανό συγγραφέα Gabriel Garcia

Marquez και απεικoνίζουν την εσωτερική δομή των περιπτώσεων του

συνόλου των δεδομένων που προκύπτουν. Από το παραπάνω σύνολο των

δεδομένων επιλέχθηκε το έργο του συγγραφέα “Cronica de una muerte

anunciada” το οποίο έχει κωδικοποιηθεί στον κατάλογο της

βιβλιοθήκης με το πρότυπο MARC21. Τα δεδομένα που θα προκύψουν από

το αρχείο MARC κατά την εξαγωγή τους θα αντιστοιχηθούν στις

οντότητες του εννοιολογικού μοντέλου FRBR και με άλλες ιδιότητες

οντολογιών και σύμφωνα με τα κατάλληλα λεξιλόγια και με τo

κατάλληλo εργαλείo μετατροπής θα μετατραπούν σε RDF αρχεία

συνδεδεμένων δεδομένων. Επιπλέον το παράδειγμα αυτό μπορεί να

βοηθήσει τους χρήστες να κατανοήσουν τις βασικές οντότητες των FRBR

και των μεταξύ τους συσχετίσεων.

Η αρχιτεκτονική του ισπανικού μοντέλου συμπεριλαμβανομένων των

κλάσεων, των λεξιλογίων, των οντοτήτων και των συσχετίσεων που

προκύπτουν απεικονίζουν τη λογική της μετατροπής σε συνδεδεμένα

112

δεδομένα και της δημοσίευσής τους οδηγώντας μας στη διερεύνηση και

απόδοση των συμπερασμάτων.

8.2 Μεθοδολογία του παραδείγματος

Για την υλοποίηση του παραδείγματος, ακολουθήσαμε τα εξής

βήματα (Suero κ and Perez, 2013):

Προσδιορισμός και ανάλυση των πηγών των δεδομένων σύμφωνα με τις προδιαγραφές των συνδεδεμένων δεδομένων της ισπανικής βιβλιοθήκης.

Διαμόρφωση URIs σύμφωνα με την πολιτική διαμόρφωσης που ακολουθεί η ισπανική βιβλιοθήκη

Μοντελοποίηση

Αναφορά στο πρόγραμμα περιήγησης “Disco Hyperdata Browser”103

Ανάπτυξη λεξιλογίων για την μετατροπή των πηγών δεδομένων

Frbrization. Εντοπισμός των FRBR οντοτήτων

Περιγραφή του manifestation και αντιστοίχηση πεδίων MARC21 της βιβλιογραφικής εγγραφής με τα αντίστοιχα RDF λεξιλόγια και FRBRοντότητες.

Συσχετίσεις οντοτήτων

Μετατροπή δεδομένων σε RDF και δημοσίευση συνδεδεμένων δεδομένων

Παραγωγή δεδομένων σε RDF (RDF Generation)

Δημοσίευση Συνδεδεμένων Δεδομένων

103http://wifo5-03.informatik.uni-mannheim.de/bizer/ng4j/disco/113

Εξαγωγή συμπερασμάτων

8.3 Προδιαγραφές συνδεδεμένων δεδομένων της ισπανικής βιβλιοθήκης

8.3.1 Προσδιορισμός και ανάλυση πηγών δεδομένων

Σε αυτή την ενότητα θα εντοπίσουμε και θα επιλέξουμε τις πηγές

δεδομένων που θα χρησιμοποιηθούν για να δημοσιευτούν ως συνδεδεμένα

δεδομένα βιβλιοθηκών. Επιπρόσθετα θα αναζητήσουμε και θα

συγκεντρώσουμε όλα τα διαθέσιμα δεδομένα, θα τεκμηριώσουμε του

σχετικούς πόρους, συμπεριλαμβάνοντας τον σκοπό, το μοντέλο δεδομένων

και τις λεπτομέρειες της μετατροπής, θα εντοπίσουμε τις κύριες

οντότητες που περιγράφονται μέσα στις πηγές δεδομένων καθώς και τις

συσχετίσεις τους. Το σύνολο των δεδομένων που θα περιγραφεί αφορά

το έργο που έχει δημιουργήσει ο κολομβιανός συγγραφέας Gabriel

Garcia Marquez “Cronica de una muerte anunciada” σε γλώσσα κειμένου

την ισπανική. (βλ. Εικόνα 7). Η βιβλιογραφική εγγραφή του

παραδείγματος αντιστοιχεί στο manifestation με isbn:”84-322-2162-

7”. Σαν πρώτο βήμα για τις ανάγκες του παραδείγματος δημιουργήθηκε

το παρακάτω ερώτημα στον κατάλογο καθιερωμένων όρων της ισπανικής

βιβλιοθήκης: http://catalogo.bne.es/uhtbin/authoritybrowse.cgi που αφορά

τον συγγραφέα του έργου με όρο αναζήτησης το όνομα προσώπου “Gabriel

Garcia Marquez”. (βλ. Εικόνα 2 )

114

Εικόνα 2. Οπτικοποίηση αποτελέσματος ερωτήματος στον κατάλογο καθιερωμένων όρων τηςισπανικής βιβλιοθήκης

Από τα αποτελέσματα του ερωτήματος επιλέξαμε το όνομα προσώπου

“Gabriel Garcia Marquez” με σχετικές ημερομηνίες “1927-2014” που

αντιστοιχεί στην καθιερωμένη εγγραφή που έχει δημιουργηθεί από την

ισπανική βιβλιοθήκη. Καταδεικνύουμε την εγγραφή σε δομή MARC21 όπως

αυτή εμφανίζεται στον κατάλογό της ως προϋπόθεση για την εξέλιξη του

παραδείγματος. (βλ. Πίνακα 1)

001 XX933268005 20140421008 901120n| a||nnaaa a aaa |016 $aBNE19900072380024 7$ahttp://viaf.org/viaf/54147956$2viaf024 7$a0000000368641974$2isni040 $aSpMaBN$bspa$cSpMaBN$erdc$fembne080 0$a821.134.2(861)..."19"100 1$aGarcía Márquez, Gabriel$d1927-2014400 0$aGabo$d1927-2014

115

400 1$aGarsia Markes, Gabriel'$d1927-2014400 1$aGarcía Márquez, Gabriel José de la Concordia$d1927-2014670 $aCien años de soledad, 1993$bport. (Gabriel García Márquez)670 $aAquellos tiempos con Gabo, 2000670 $aIzbrannye proizvedeniia, 1989$bport. (Gabriel' Garsia Markes)670 $aDic. de literatura española e hispanoamericana, 1993$b(García Márquez, Gabriel

(Aracataca, Colombia, 1928); Premio Nobel de literatura en 1982)670 $aWWW BN Colombia cat., 12-4-2007$b(García Márquez, Gabriel, 1927-)670 $aWWW BBC Mundo, 12-4-2007$b(Gabriel García Marquez; n. 6-3-1927, así lo afirma su

hermano aunque él mismo y un certificado apuntan su nacimiento en 1928)670 $aWWW Wikipedia, 21-4-2014$b(Gabriel García Márquez; García Márquez, Gabriel José de

la Concordia 1927-2014; n. en 1927 y no en 1928 como se creyó durante mucho

Πίνακας 1. Εξαγωγή δεδομένων της καθιερωμένης εγγραφής σε δομή MARC21

8.3.2 Ομαδοποίηση δεδομένων της εγγραφής

Η εξαγωγή των δεδομένων της παραπάνω εγγραφής σε δομή MARC21 θα

μας εξυπηρετήσει στην “μεταφορά” πληροφορίας (μεταδεδομένων) που

αφορά την καθιερωμένη μορφή ονομάτων και θεμάτων ως Σημεία Πρόσβασης

(Access Points) στις εγγραφές MARC21 (βλ. Πίνακα 2).

Σύμφωνα με τις προδιαγραφές της μορφής των MARC21 εγγραφών

καθιερωμένων όρων104 τα πεδία ελέγχου περιγράφονται στο περιεχόμενο

των πεδίων 001, 003, 005, 008. Στην περίπτωση της ισπανικής

βιβλιοθήκης το πεδίο ελέγχου 001 περιέχει το αναγνωριστικό της

Εθνικής Βιβλιοθήκης της Ισπανίας (BNE Identifier), πεδίο από το

οποίο η βιβλιοθήκη διαμορφώνει τα URIs των πόρων της έτσι ώστε να

υπάρχει συμβατότητα με τις προδιαγραφές των συνδεδεμένων δεδομένων

για να κάνει τη διάθεσή τους. Επιπλέον η εγγραφή καθιερωμένων όρων

του παραδείγματος περιέχει έναν αριθμό Πεδίων Δεδομένων. Tο πεδίο

104 http://www.loc.gov/marc/authority/116

100 αποτελεί το Κύριο Σημείο Πρόσβασης (Main Access Entry) της

εγγραφής (βλ. AACR2, κεφάλαιο 21) και περιέχει πληροφορίες για την

κύρια οντότητα που περιγράφεται από την εγγραφή, ενώ το υποπεδίο $d

περιέχει πληροφορία για ημερομηνίες που σχετίζονται με την οντότητα

που περιγράφεται105. Το πεδίο 400 περιγράφει έναν αριθμό δεδομένων

που αντιστοιχούν σε ονόματα προσώπων που δεν έχουν καθιερωθεί ως

Κύριες Επικεφαλίδες και αναφέρονται στην Καθιερωμένη Μορφή του

ονόματος και άλλες παραλλαγές του ονόματος που δεν επιλέχθηκαν106, ενώ

το πεδίο 670περιγράφει τα Ευρισκόμενα Δεδομένα Πηγής (Source Data

Found107). Σύμφωνα με την παραπάνω ομαδοποίηση των MARC21 πεδίων

προκύπτει η παρακάτω καθιερωμένη εγγραφή:

001 XX933268

005 20140421

008 901112nI aI Innaaa a aaa II

016 $aBNE19900072380

040 $aSpMaBN$bspa$cSpMaBN$erdc$fembne

100 1$aGarcía Márquez,Gabriel$d1927-2014

400 0$aGabo$d1927-2014

400 1$aGarsia Markes, Gabriel'$d1927-2014

400 1$aGarcía Márquez, Gabriel José de la

Concordia$d1927-2014105 http://www.loc.gov/marc/authority/ad100.html

106 http://www.loc.gov/marc/authority/adtracing.html

107 http://www.loc.gov/marc/authority/ad670.html117

Control Fields

Data Fields

Access Point

Field Indicator subfieldContent

Πίνακας 2. Εξαγωγή δεδομένων από την MARC21 καθιερωμένη εγγραφή “Gabriel GarciaMarquez”

118

8.3.3 Δημιουργία URIs

Αυτή η ενότητα προσδιορίζει τον τρόπο διαμόρφωσης των URIs που

θα χρησιμοποιηθούν ως αναγνωριστικά για τα RDF σύνολα δεδομένων των

πόρων. Η ισπανική βιβλιοθήκη τα διαχωρίζει δε δύο τύπους (Suero and

Perez, 2013):

URIs λεξιλογίου (Vocabulary URIs) που προσδιορίζουν τα

στοιχεία ορολογίας (τις κλάσεις και τις RDF

ιδιότητες ) :

http://iflastandards.info/ns/ (IFLA namespaces)

http://iflastandards.info/ns/fr/frbr/frbrer/ (Οντότητες frbr)

http://iflastandards.info/ns/isbd/elements/ (Στοιχεία ISBD)

URIs Δεδομένων (Data URIs) που προσδιορίζουν τους πόρους

datos.bne.es

HTTP-URIs

Η βιβλιοθήκη χρησιμοποιεί αποκλειστικά τα HTTP-URIs. Για το

σχεδιασμό τους χρησιμoποιείται η μέθοδος “natural keys pattern”

(Dodds and David, 2012) ως πρότυπο παραγωγής URIs που αλγοριθμικά

προέρχονται από μοναδικά παγκόσμια αναγνωριστικά. Αυτό το πρότυπο

είναι συμβατό για τον προσδιορισμό πόρων που δημιουργούνται και

εκτός εγγραφών MARC21 από έναν απλό κατάλογο δεδομένου ότι το πεδίο

001 ή το πεδίο ελέγχου χρησιμοποιείται για τον προσδιορισμό των

119

εγγραφών μέσα στον κατάλογο. H παραδοσιακή χρήση του πεδίου ελέγχου

είναι η ανταλλαγή εγγραφών ανάμεσα σε οργανισμούς. Ο αριθμός

ελέγχου χρησιμεύει για τη σύνδεση μεταξύ RDF πόρων με εξωτερικά

σύνολα δεδομένων όπως είναι το VIAF. Διαμορφώνεται ως εξής:

http://datos.bne.es/resource/ control number. (Για παράδειγμα το URI

της FRBR οντότητας “Πρόσωπο” όπως θα δούμε και παρακάτω, σχεδιάζεται

βάσει των προδιαγραφών ως εξής ):

http://datos.bne.es/page/resource/XX933268

8.4 Πρόγραμμα περιήγησης “Disco Hyperdata Browser”

Πριν προχωρήσουμε στην περαιτέρω ανάλυση του παραδείγματος

θεωρήσαμε σκόπιμη μια μικρή αναφορά στο πρόγραμμα περιήγησης Disco

Hyperdata Browser108. Ο “Disco” καθιστά όλη την πληροφορία που μπορεί

να βρεθεί στον σημασιολογικό ιστό πάνω σε έναν συγκεκριμένο πόρο σε

μορφή HTML σελίδας. Ο πόρος εμπεριέχει υπερσυνδέσεις που επιτρέπουν

την πλοήγηση μεταξύ άλλων πόρων. Κατά την πλοήγηση από τον έναν πόρο

στον άλλον η πληροφορία ανακτάται δυναμικά δημιουργώντας

αντικατεύθυνση με HTTP URIs και ακολουθώντας συνδέσεις από την

108 http://wifo5-03.informatik.uni-mannheim.de/bizer/ng4j/disco/120

ιδιότητα του λεξιλογίου RDFs: seealso.109 Πρακτικά όλα τα παραπάνω

φαίνονται στην ενότητα του παραδείγματος που ακολουθεί.

8.4.1 Παράδειγμα σε περιηγητή “Disco”

Δημιουργήσαμε στον “Disco” ένα παράδειγμα εισάγοντας στο πεδίο

αναζήτησης που διαθέτει το URI του manifestation του παραδείγματος

(βλ. Πίνακα 3):

Disco - Hyperdata Browser (About)Resource http://datos.bne.es/resource/bimo0000152037

URI:   

Property Value Sources

sourceURL http://datos.bne.es/resource/bimo0000152037 

P1092 B 15140-1983

P1031 1

P1154 84-322-2162-7

P1018 [1983]

P1016 Barcelona

P1007 Gabriel García Márquez

P1117 Seix Barral

P1004 Crónica de una muerte anunciada

P1022 191 p.

109 http://www.w3.org/TR/rdf-schema/#ch_seealso

121

P1034 : 250 pts.

P2004 http://datos.bne.es/resource/XX1987431spa 

P1026 Obras maestras de la literatura contemporánea

language http://lexvo.org/id/iso639-3/spa notation 860(861)-31"19"

type http://iflastandards.info/ns/fr/frbr/frbrer/C1003 

P1024 21 cm

is primaryTopic of

...

is primaryTopic of http://datos.bn μν e.es/data/resource/bimo0000152037  

Sources G1. http://datos.bne.es/resource/bimo0000152037 

Session Cache

Display all RDF graphs that are currently in your session cache.

Πίνακας 3. Εμφάνιση συνδεδεμένων δεδομένων για το manifestation που αντιστοιχεί στηmarc21 εγγραφή που ακολουθεί στον περιηγητή Disco

Σύμφωνα με τον παραπάνω πίνακα οι ανακτημένες πληροφορίες

εμφανίζονται σε δύο στήλες και χωρίζονται σε ιδιότητες και τις

αντίστοιχες τιμές τους. Οι Ιδιότητες όπως αυτές αποδίδονται στο

manifestation που αναλύεται από τον περιηγητή χωρίζονται σε δύο

κατηγορίες σε αυτές που ενυπάρχουν και σε αυτές που προκύπτουν από

εξωτερικές πηγές. Το πρόγραμμα περιήγησης αποθηκεύει όλα τα

ανακτηθέντα γραφήματα RDF καθώς και τα URIs σε ένα κρυφό “session”,

των οποίων η οπτικοποίηση είναι διαθέσιμη.

122

Οι πόροι σαν ιδιότητες, περιγράφονται λεκτικά με τα στοιχεία

(elements) του κάθε λεξιλογίου που χρησιμοποιείται για κάθε πεδίο

περιγραφής, ενώ τα πεδία των τιμών παραμένουν σταθερά. O περιηγητής

“Disco” περιγράφει τη διαδικτυακή πληροφορία σε ένα γραφικό

περιβάλλον αλληλεπίδρασης. Δημιουργεί τριάδες περιγραφής

χρησιμοποιώντας το υποκείμενο του πόρου από τη στήλη 2 και το

κατηγόρημά του από τη στήλη 1. Υπάρχουν και άλλα παρεμφερή

προγράμματα περιήγησης όπως είναι ο “Tabulator”.110

8.5 Ανάπτυξη λεξιλογίων για την μετατροπή των πηγών δεδομένων-Μοντελοποίηση

Αυτό το κεφάλαιο παρόλο το θεωρητικό του περιεχόμενο επιλέχθηκε

να συμπεριληφθεί στο πρακτικό μέρος της εργασίας προκειμένου να

υπάρχει συνεχόμενη δομή στην πορεία υλοποίησης του παραδείγματος

σύμφωνα με τα βήματα επεξεργασίας που προαναφέρθηκαν.

Ο σκοπός της διαδικασίας μοντελοποίησης είναι ο σχεδιασμός και η

εφαρμογή των λεξιλογίων εκείνων που θα χρησιμοποιηθούν για την

περιγραφή των συνδεδεμένων δεδομένων σύμφωνα με τις αρχές

συνδεδεμένων δεδομένων. Οι εγγραφές καθιερωμένων όρων της ισπανικής

βιβλιοθήκης και οι σχέσεις μεταξύ τους περιγράφονται

(αντιστοιχούνται) στις FRBR κλάσεις και σχέσεις ως Πρόσωπα,

Συλλογικά Όργανα, Έργα, και Εκφράσεις. Ο παρακάτω πίνακας

απεικονίζει την κατανομή των κλάσεων και των σχέσεων που

110 http://www.w3.org/2005/ajar/tab123

χρησιμοποιούνται με μεγαλύτερη συχνότητα στον κατάλογο δεδομένων

της datos.bne.es (Suero and Perez , 2013).

Ετικέτα (Label) URI Τύπος (Type)

Εκδήλωση (Manifestation) frbr: C1003 Κλάση

Έργο (Work) frbr: C1001 Κλάση

Πρόσωπο (Person) frbr: C1005 Κλάση

Έκφραση (Expression) frbr: C1002 Κλάση

Θέμα (Thema) frsad: C1001 Κλάση

Συλλογικό Όργανο(Corporate Body)

frbr: C1006 Κλάση

γλώσσα (Language) dcterms:language Σχέση

είναι δημιουργός του (iscreator of)

frbr: P2010 Σχέση

δημιουργήθηκε από (iscreated by)

frbr: P2009 Σχέση

ενσωμάτωση του (isembodiment of)

frbr: P2004 Σχέση

124

ενσωματώνεται σε( isembodied in)

frbr: P2003 Σχέση

Πραγματώνεται μέσω (isrealized through)

frbr: P2001 Σχέση

πραγμάτωση του (isrealization of)

frbr: P2002 Σχέση

sameas owl:SameAs Σχέση

θέμα (subject) dcterms:subject Σχέση

έχει τίτλο μεμονωμένουέργου υπό τον ίδιο

συγγραφέα (has title ofindividual work by same

author)

frbr: P1117 Ιδιότητα

έχει τόπο έκδοσης,παραγωγής, διανομής (hasplace of publication,

production,distribution)

frbr: P1016 Ιδιότητα

έχει κύριο τίτλο (hastitle proper)

frbr: P1004 Ιδιότητα

ειδικό περιεχόμενουλικού και έκταση (has

specific materialdestignation and

extend)

frbr: P1022 Ιδιότητα

125

όνομα προσώπου (has nameof person)

frbr: P3039 Ιδιότητα

έχει τίτλο έργου (has

title of work)

frbr: P3001 Ιδιότητα

Πίνακας 4. Κλάσεις και σχέσεις που εμφανίζονται μέσα στην datos.bne.es

Η ανάπτυξη των λεξιλογίων θα μπορούσε στην παρούσα περίπτωση να

χωριστεί στα τρία παρακάτω στάδια:

A. Επιλογή κλάσεων για την μοντελοποίηση των frbr οντοτήτων που

εμφανίζονται στις εγγραφές (Πρόσωπο, Έργο, Έκφραση)

Β. Επιλογή των ιδιοτήτων για την μοντελοποίηση των γνωρισμάτων

των οντοτήτων (Όνομα Προσώπου, Τίτλος Έργου, Ονομασία οργανισμού)

Γ. Επιλογή συσχετίσεων μεταξύ των οντοτήτων (Ένα πρόσωπο είναι

δημιουργός ενός έργου, ένα έργο εκδόθηκε από έναν οργανισμό).

Η επισκόπηση των λεξιλογίων που χρησιμοποιεί η ισπανικής

βιβλιοθήκη αποδίδεται σχηματικά στο παρακάτω σχεδιάγραμμα εικόνας

(βλ. Εικόνα 3).

126

Εικόνα 3. Επισκόπηση των λεξιλογίων της ισπανικής βιβλιοθήκης βασισμένα στην οικογένειατων FR μοντέλων

Επόμενη μέριμνα αυτού του κεφαλαίου η ανάπτυξη ενός λεξιλογίου

για τη μοντελοποίηση των δεδομένων που απεικονίζονται στις εγγραφές

MARC21. Τα βιβλιογραφικά δεδομένα περιγράφονται από ιδιότητες που

έχουν επαναχρησιμοποιηθεί από έναν αριθμό λεξιλογίων:

-ISBD

-RDA Group Elements 2111

-RDA relationships for WEMI112

-DCMI

-SKOS

111 http://rdvocab.info/ElementsGr2

112 http://rdvocab.info/RDARelationshipsWEMI127

-Mads/RDF

Οι ιδιότητες που περιγράφουν τα δεδομένα των καθιερωμένων

εγγραφών έχουν επαναχρησιμοποιηθεί από τους FRBR, FRSAD, FRAD, και RDA

Group Elements 2.

Τέλος, για την περιγραφή των μεταδεδομένων χρησιμοποιούνται τα

λεξιλόγια:

OPMV113 και Dublin Core Metadata Terms

8.6 Frbrization: εντοπισμός FRBR οντοτήτων (Πρόσωπο, Έργο,Έκφραση, Εκδήλωση) και δημιουργία καθιερωμένων και βιβλιογραφικών εγγραφών

Αυτό το κεφάλαιο θα ασχοληθεί με τη διαδικασία δημιουργίας

συμβατών εγγραφών ως προς τους FRBR, χρησιμοποιώντας ως βάση την

καθιερωμένη και βιβλιογραφική εγγραφή του παραδείγματος που έχει ήδη

καταλογογραφηθεί σε MARC21. Χωρίσαμε τις παρακάτω ενότητες για τον

εντοπισμό της κάθε μίας από τις οντότητες Πρόσωπο, Έργο, Έκφραση,

Εκδήλωση, τη διαμόρφωση των μοναδικών αναγνωριστικών τους και την

αναπαράσταση των μεταξύ τους συσχετίσεων.

8.6.1 Εντοπισμός της οντότητας frbf:Πρόσωπο- Δημιουργία URI

Σύμφωνα με τους FRBR (FRBR, 4.6) τα γνωρίσματα της οντότητας

frbr:Πρόσωπο που εντοπίζουμε στην καθιερωμένη εγγραφή του

113 http://open-biomed.sourceforge.net/opmv/ns.html128

παραδείγματος αντιστοιχούν με συγκεκριμένα πεδία του MARC21 (βλ.

Πίνακες 5, 6).

Όνομα Προσώπου (Personal name) 100

Όνομα (Name) $a

Ημερομηνίες σχετικές με το όνομα (Dates associated with name)

$d

Πίνακας 5. Αντιστοιχία γνωρισμάτων της οντότητας frbr: Πρόσωπο με πεδία και υποπεδίαMARC21

Ορισμός πεδίου 001 Δεδομένα MARC21

Αριθμός Ελέγχου 001 XX933268*

Ιδιότητες της frbr Οντότητας

“Πρόσωπο”Δεδομένα MARC21

129

Κύρια επικεφαλίδα-Όνομα Προσώπου(100)

Όνομα Προσώπου-Όνομα

Ημερομηνίες που συνοδεύουν το

όνομα

100 10 $a Garcia Marquez, Gabriel

$d 1927-2014

rdvocab114 Ευρισκόμενα Δεδομένα Πηγής

Source Consulted Citation

670 $a Cien años de soledad, 1993$bport. (Gabriel García Márquez)670$aAquellos tiempos con Gabo, 2000 670 $aIzbrannye proizvedeniia, 1989$bport. (Gabriel' Garsia Markes) 670 $aWWW BN Colombia cat., 12-4-2007$b(García Márquez, Gabriel,1927-) 670 $aWWW BBC Mundo, 12-4-2007$b(Gabriel García Marquez; n.6-3-1927, así lo afirma su hermano aunque él mismo y un certificado apuntan su nacimientoen 1928)670 $aWWW Wikipedia, 21-4-2014$b(Gabriel García Márquez; García Márquez, Gabriel José de la Concordia 1927-2014; n. en 1927 y no en 1928 como se creyó durante mucho

Πίνακας 6. Αντιστοιχία πεδίων MARC21 με την οντότητα frbr:Πρόσωπο και άλλα λεξιλόγια

114 http://rdvocab.info130

Frbr: Πρόσωπο

Συνοψίζοντας, η παραπάνω εγγραφή καθιερωμένων όρων περιγράφει

ένα Πρόσωπο, που ονομάζεται Garcia Marquez, Gabriel με σχετικές

ημερομηνίες “1927-2014” .

To αντίστοιχο URI της οντότητας frbr:Πρόσωπο (βλ. Εικόνα 4)

σύμφωνα με τις προδιαγραφές διαμορφώνεται ως: “

http://datos.bne.es/page/resource/XX933268”.

Εικόνα 4. Περιγραφή και διασύνδεση της οντότητας frbr:Πρόσωπο

Στην ανωτέρω οντότητα αποδίδονται ιδιότητες από τα λεξιλόγια

FRBR, FRAD, MADS/RDF και OWL. Στον πίνακα που ακολουθεί

απεικονίζονται οι ιδιότητες που περιγράφουν την οντότητα και

δημιουργούν συσχετίσεις με τις άλλες οντότητες.131

Λεξιλόγιο (Vocabulary)

Ετικέτα (Label)/Περιγραφή (Description)

Τύπος (Type)

Τιμή (Value)

Ifla-frbr:P2010115

είναιδημιουργός

του/συσχετίζειένα Πρόσωπο μεένα έργο για το

οποίο είναιυπεύθυνος για

το καλλιτεχνικόκαι πνευματικότου περιεχόμενο

Ιδιότητα Αναφέρονται όλα τα έργα του Gabriel Garcia Marquez που υπάρχουνστην ισπανική βιβλιοθήκη (Το έργο με BNE:Ιdentifier XX1987431

επιλέχθηκε για το συγκεκριμένο παράδειγμα)

Ifla-frbr:P3039116

έχει όνομαΠροσώπου/

συσχετίζει έναπρόσωπο με τη

λέξη, τονχαρακτήρα ή ένα

σύνολο απόλέξεις και, ή,χαρακτήρες μετις οποίες τοΠρόσωπο είναι

γνωστό

Ιδιότητα Garcia Marquez, Gabriel

Ifla-frbr:P3040117

έχειημερομηνίες

σχετικές με τοΠρόσωπο

/συσχετίζει έναπρόσωπο με τηνακριβή ή κατάπροσέγγισηημερομηνία

γέννησης, ή,και θανάτου του

προσώπου ήημερομηνίες που

Ιδιότητα 1927-2014

115 http://metadataregistry.org/schemaprop/show/id/1581.html

116 http://metadataregistry.org/schemaprop/show/id/1721.html

117 http://metadataregistry.org/schemaprop/show/id/1722.html132

δείχνουν τηνπερίοδο ακμήςτου προσώπου

Ifla-frad:P4031118

άλλεςπαραλλαγές του

ονόματος(Πρόσωπο)/

σχετίζει έναόνομα προσώπουκαι διάφορες

άλλεςπαραλλαγές πάνωσε ένα όνομα.

Ιδιότητα Gabo

Garsia Markes, Gabriel

Madsrdf:citationNote119

Citation Note./

μία σημείωσηγια το πώς η

πηγήmadsrdf:sourceσχετίζεται μετον πόρο γιατον οποίο η

madsrdf:sourceείναι η πηγήπληροφορίας

Ιδιότητα (Gabriel García Marquez; n. 6-3-1927, así lo afirma su hermano aunque él mismo y un certificado apuntan su nacimiento en 1928)

(Gabriel García Márquez; n. 6-3-1927 y no en 1928 como se creyó durante mucho tiempo)

(García Márquez, Gabriel (Aracataca, Colombia, 1928); Premio Nobel de literatura en 1982)

(García Márquez, Gabriel, 1927-)

port. (Gabriel García Márquez)

port. (Gabriel' Garsia Markes)

owl:sameAs συνδέειισοδύναμους

πόρους

Ιδιότητα <http :// d - nb . info / gnd /118537601 >

<http :// dbpedia . org / resource / Gabriel _ Garc % C 3% ADa _ M % C 3% A 1 rquez >

<http :// libris . kb . se / resource / auth /187954 >

<http://viaf.org/viaf/54147956

<http://www.idref.fr/026881241/id>

rdvocab:sourceConsulted

ένας πόρος πουχρησιμοποιείταιγια τον ορισμό

Ιδιότητα Aquellos tiempos con Gabo, 2000

118 http://metadataregistry.org/schemaprop/show/id/1910.html

119 http://www.loc.gov/standards/mads/rdf/v1.html#citationNote133

του ονόματος,του τίτλου ήτων χαρακτηρι-στικών μιας

οντότητας ή τονπροσδιορισμότων σχέσεωνμεταξύ τωνοντοτήτων

Cien años de soledad, 1993

c. de literatura española e hispanoamericana, 1993

Izbrannye proizvedeniia, 1989

WWW BBC Mundo, 12-4-2007

WWW BN Colombia cat., 12-4-2007

WWW Wikipedia, 12-4-2007

Rdf:type Στιγμιότυπο τηςRdf:property

πουχρησιμοποιείταιγια να δηλώσειότι ένας πόρος

είναι τοστιγμιότυπομίας κλάσης

Ιδιότητα

ifla - frbr : C 1005 {Πρόσωπο/Τύπος:κλάση}

Πίνακας 7. Ιδιότητες που αποδίδονται στην οντότητα frbr: Πρόσωπο και ανάλυσή τους

Προκειμένου να δημιουργηθούν οι καθιερωμένες και βιβλιογραφικές εγγραφές που αντιστοιχούν στις

οντότητες “frbr:Έργο”, “frbr:Έκφραση” και “frbr:Εκδήλωση” χρησιμοποιήσαμε τα πεδία που έχουν προταθεί

από την ομάδα εργασίας RDA/MARC της Βιβλιοθήκης του Κογκρέσου120 (MARBI, 2009, 2011) σε πρότασή τους

για τον εντοπισμό των εγγραφών που προσδιορίζουν το έργο, την έκφραση και την εκδήλωση σε καθιερωμένες

και βιβλιογραφικές εγγραφές που έχουν κωδικοποιηθεί σε μορφή MARC21. Συνοψίσαμε τα πεδία και υποπεδία

που θα χρησιμοποιήσουμε για την περιγραφή των εγγραφών που θα ακολουθήσουν, στον παρακάτω πίνακα. (βλ.

Πίνακα 8).

Πεδίο Δείκτης/$Υποπεδίο Προσδιορισμός Οντότητας Ορισμός Χρήση

001 a Έργο/Έκφραση/Εκδήλωση Πεδίο Ελέγχου Για τη

δημιουργία των

URIs των

οντοτήτων

120 http://www.loc.gov/marc/marbi/2009/2009-01-3.html 134

100 10/$a$d Έργο/Έκφραση/Εκδήλωση a:Κύρια

αναγραφή-

Πνευματική

υπευθυνότητα/d:

ημερομηνίες

σχετικές με το

πρόσωπο

a:Από το

περιεχόμενο του

πεδίου

προκύπτει το

όνομα του

προσώπου και

αποτελεί το

κύριο σημείο

πρόσβασης της

εγγραφής./

d: από το

περιεχόμενο του

υποπεδίου

προκύπτουν

σχετικές

ημερομηνίες για

το πρόσωπο

(γέννησης και

θανάτου)

245 10/$a Εκδήλωση Πεδίο δήλωσης

τίτλου

Από το

περιεχόμενο του

πεδίου

προκύπτει η

δήλωση του

τίτλου

500121 1$a$d Έκφραση Πεδίο ελεύθερης

σημείωσης

700 i Έκφραση Πληροφορίες

συσχέτισης

(Relationship

Σχέση μεταξύ

έργου και

έκφρασης

121 http://www.loc.gov/marc/marbi/2009/2009-01-3.html 135

information)

883122 2/$a/ Έργο/Έκφραση/Εκδήλωση Προέλευση

μηχαναγνώσιμων

μεταδεδομένων

(Machine

Generated

Metadata

Provenance)

Ορισμός της

frbr οντότητας

και της ομάδας

που ανήκει η

οντότητα

Πίνακας 8. Χρήση πεδίων Marc21 στη δημιουργία καθιερωμένων και βιβλιογραφικών εγγραφών των FRBR οντοτήτων Έργο, Εκδήλωση, Έκφραση

8.6.2 Εντοπισμός της frbr Οντότητας “Έργο” - Δημιουργία URI

Σύμφωνα με τα παραπάνω πεδία δημιουργήσαμε για την frbr

Οντότητα “Έργο” τις καθιερωμένες και βιβλιογραφικές εγγραφές που

ακολουθούν:

Καθιερωμένη εγγραφή για τo έργο:

001awXX1987431*

100 10#aGarcia, Marquez, Gabriel$d1927-2014

883##$awork$2frbrgroup1

Βιβλιογραφική εγγραφή για το έργο:

122 http://www.loc.gov/marc/marbi/2011/2011-dp03.html 136

Κωδικός οντότητας

001awXX1987431

100 10#aGarcia, Marquez, Gabriel$d1927-

245$10$aCronica de una muerte anunciada

Η διαμόρφωση του URI της οντότητας “frbr :Έργο” (βλ. Εικόνα 5)

σύμφωνα με τις προδιαγραφές που αναφέρθηκαν στο υποκεφάλαιο 8.3.3

προκύπτει να είναι η: http://datos.bne.es/page/resource/XX1987431

137

τίτλος έργου (title of the work) (245)

Εικόνα 5. Περιγραφή και διασύνδεση της οντότητας frbr:Έργο

Οι ιδιότητες που αποδίδονται στην οντότητα frbr :Έργο με το αντίστοιχο λεξιλόγιο και τον τύπο

τους καθώς και τις τιμές που αντιστοιχούν σε αυτές αναλύονται στον παρακάτω πίνακα (βλ. Πίνακα 9).

Λεξιλόγιο Ετικέτα/Περιγραφή Τύπος Τιμή

ifla-frbr:P2001123 πραγματώνεταιμέσω/συσχετίσει ένα

έργο με μία έκφραση ηοποία είναι πραγμάτωση

του έργου

Ιδιότητα bne:resource/XX1987431spa

bne:resource/XX2969850

bne:resource/XX2980814

bne:resource/XX2980815

bne:resource/XX2980818

bne:resource/XX3412295

bne:resource/XX4734866

Όλες οι παραπάνω τιμέςαποτελούν τις εκφράσεις τουσυγκεκριμένου έργου πουυπάρχουν στην ισπανική

βιβλιοθήκη.

ifla-frbr:P2009124 δημιουργείται από(Πρόσωπο)/συσχετίζει

ένα έργο με ένα πρόσωποπου είναι υπεύθυνο γιατο καλλιτεχνικό και

πνευματικό περιεχόμενοτου έργου

Ιδιότητα

bne:resource/XX933268

Η τιμή αντιστοιχεί στο BNEαναγνωριστικό της frbrοντότητας “Πρόσωπο”

ifla-frbr:P3001125 έχει τίτλο τουέργου/συσχετίζει ένα

Σχέση Crónica de una muerteanunciada

123 http://metadataregistry.org/schemaprop/show/id/1573.html

124 http://metadataregistry.org/schemaprop/show/id/1582.html

125 http://metadataregistry.org/schemaprop/show/id/1683.html138

ή ένα σύνολο απόχαρακτήρες που

ονομάζουν το έργο

Rdf:type

ένα στιγμιότυπο τηςκλάσης rdf:property πουχρησιμοποιείται για ναδηλώσει ότι ένας πόροςείναι το στιγμιότυπο

μίας κλάσης

Ιδιότητα ifla-frbr:C1001

{Ετικέτα:Έργο/Τύπος:Κλάση}126

Πίνακας 9. Ανάλυση ιδιοτήτων της οντότητας frbr: Έργο

8.6.3 Εντοπισμός της frbr Οντότητας “ Έκφραση”-Δημιουργία URI

Καθιερωμένη εγγραφή για την έκφραση

001aeXX1987431spa*127

100 10#aGarcia, Marquez, Gabriel$d1927-

500 1#ahas work$aGarcia Marquez, Gabriel$d1927-$0aw001awXX1987431

883##$expression$2frbrgroup1

Βιβλιογραφική εγγραφή για την έκφραση

001aeXX1987431spa

100 10#aGarcia, Marquez, Gabriel$d1927-

245$10$aCronica de una muerte anunciada126 http://metadataregistry.org/schemaprop/show/id/1563.html

127 (Μετά τον αριθμό ελέγχου ακολουθούν τα αρχικά της γλώσσας του

κειμένου (Spa) το οποίο και αποτελεί το κύριο κλειδί του εντοπισμού της

έκφρασης).

139

700##$ihas work$a Cronica de una muerte anunciada$c Gabriel Garcia Marquez

883##$expression$2frbrgroup1

Η διαμόρφωση του URI της οντότητας frbr:Έκφραση (βλ. Εικόνα 6)

σύμφωνα με τις προδιαγραφές που αναφέρθηκαν στο υποκεφάλαιο 8.3.3

προκύπτει να είναι η: http://datos.bne.es/page/resource/XX1987431spa

Εικόνα 6. Περιγραφή και διασύνδεση τηςοντότητας frbr:Έκφραση

Οι ιδιότητες που αποδίδονται στην οντότητα frbr :Έκφραση με το αντίστοιχο λεξιλόγιο τιμών και

τον τύπο τους αναλύονται στον παρακάτω πίνακα (βλ. Πίνακα 10).

Λεξιλόγιο Ετικέτα/Περιγραφή

Τύπος Τιμή

ifla-frbr:P2002128 είναι ηπραγμάτωση

του /σχετίζειμία έκφραση μετο έργο το οποίο

Ιδιότητα http://datos.bne.es/resource/XX1987431

128 http://metadataregistry.org/schemaprop/show/id/1574.html140

πραγματώνεταιμέσω τηςέκφρασης

ifla-frbr:P2003129 ενσωματώνεταισε/σχετίζει μίαέκφραση με μίαεκδήλωση που

είναι ενσωμάτωσητης έκφρασης

Ιδιότητα Οι τιμές που παίρνει η συγκεκριμένηιδιότητα (βλ. Εικόνα 6) αφορούν όλα ταmanifestations που ενσωματώνονται στην

συγκεκριμένη έκφραση.

Dcterms:language130 Γλώσσα/Η γλώσσατου πόρου

Ιδιότητα http://lexvo.org/id/iso639-3/spa

Rdf:type στιγμιότυπο τηςιδιότητας

rdf:property,που

χρησιμοποιείταιγια να δηλώσειότι μια πηγήείναι στο

στιγμιότυπο μίαςκλάσης

Ιδιότητα ifla-frbr:C1002131{Ετικέτα:Έκφραση/Τύπος:Κλάση}

Πίνακας 10. Ανάλυση ιδιοτήτων της οντότητας frbr:Έκφραση

8.6.4 Εντοπισμός της οντότητας frbr:Εκδήλωση-Δημιουργία URI

Η έκφραση:http://datos.bne.es/page/resource/XX1987431spa, αποτελεί:

129 http://metadataregistry.org/schemaprop/show/id/1575.html

130 http://dublincore.org/documents/dcmi-terms/#terms-language

131 http://metadataregistry.org/schemaprop/show/id/1564.html141

την υλοποίηση/πραγμάτωση του

έργου:http://datos.bne.es/page/resource/XX1987431 και από τα

manifestations στα οποία ενσωματώνεται επιλέxθηκε το manifestation με

URI: http://datos.bne.es/page/resource/bimo000152037. Για τη σύνδεση

με το όνομα προσώπου της καθιερωμένης εγγραφής επιλέχθηκε η

βιβλιογραφική εγγραφή με isbn:” 84-322-2162-7”, η οποία συνδέεται

φυσικά με την περιγραφή του manifestation, όπως θα δούμε στη

συνέχεια. Η βιβλιογραφική εγγραφή απεικονίζεται στον παρακάτω πίνακα

σε μορφή MARC21 όπως αυτή εμφανίζεται στον κατάλογο της ισπανικής

βιβλιοθήκης.

000     am 0n a001     bimo0000152037005     20140715008     830711s1983 sp 0000 spa016 7    bimoBNE19920605214|zIBH8311092|2SpMaBN017     B 15140-1983|bOficina Depósito Legal Barcelona020     84-322-2162-7|c: 250 pts.035     (OCoLC)434632480040     IBH|bspa|cSpMaBN|erdc080     860(861)-31"19"100 1    García Márquez, Gabriel|d1927-2014245 10    Crónica de una muerte anunciada|cGabriel García Márquez260     Barcelona|bSeix Barral|c[1983]300     191 p.|c21 cm490 0    Obras maestras de la literatura contemporánea|v1956     1 2980     |.852. 40|aM-BN|bBNALCALA|9MO01167696|jDL/214992|xDG|

cCONSERVACI980     |.852. 40|aM-BN|bBNMADRID|9MO01167695|jHA/70047|xDG|

cSG_RECOLET901     CANJEL2

142

Πίνακας 11. Οπτικοποίηση βιβλιογραφικής εγγραφής σε MARC21 δομή

143

Βιβλιογραφική εγγραφή για το manifestation

001 am bimo000152037*

100 10#aGarcia, Marquez, Gabriel$d1927-

245 10$aCronica de una muerte anunciada$c Gabriel

Garcia Marquez

883##$a manifestation$2frbrgoup1

Ακολουθεί η περιγραφή της οντότητας frbr:Εκδήλωση όπως

εμφανίζεται στην παρακάτω εικόνα (βλ. Εικόνα 6) και σε μορφή

πίνακα (βλ. Πίνακα 12) για την καλύτερη επεξεργασία του στην πορεία

του παραδείγματος.

Εικόνα 7. Περιγραφή του manifestation144

Bimo0000152037 at datos.bne.es

http://datos.bne.es/resource/bimo0000152037

Ιδιότητα Τιμή

ISBD: P1004 Cronica de una muerte anunciada

ISBD: P1007 Gabriel Garcia Marquez

ISBD:P1016 Barcelona

ISBD:P1018 [1983]

ISBD:P1022 191 p.

ISBD:P1024 21 cm

ISBD:P1026 Obras Maestras de la Literatura Contemporanea

ISBD:P1031 1

ISBD:P1034 :250 pts.

ISBD:P1092 B15140-1983

ISBD:P1117 Seix Barral

ISBD:P1154 84-322-2162-7

Ifla-frbr:P2004 Bne:resource/xx1987431spa

dcTerms:language <http://lexvo.org/id/iso639-3/spa

Skos:notation 860(861)-31”19”

Rdf:type Ifla-frbr:c1003

Metadata

Anon_0

145

Rdf:type <http//www.w3.org/2004/03/trix/rdfg-1/Graph>

Foaf: primary topic Bne:resource/bimo0000152037

Void:subset Anon_1: (more)

Anon_2 (more)

Expand all

Πίνακας 12. Περιγραφή του manifestation σε πίνακα

8.6.5.Αντιστοίχηση MARC21 με FRBR και RDF στη βιβλιογραφική εγγραφή του ισπανικού μοντέλου

Αυτό το υποκεφάλαιο έχει ως σκοπό να καταδείξει την αντιστοίχηση

των ιδιοτήτων που αποδίδονται στην οντότητα “Εκδήλωση” με τα

αντίστοιχα πεδία και υποπεδία MARC21. Το ισπανικό μοντέλο σκοπεύει

την πλήρη μετατροπή των δεδομένων των βιβλιογραφικών εγγραφών χωρίς

απώλειές τους. Ως εκ τούτου, θεωρήθηκε χρήσιμη η δημιουργία ενός

πίνακα αντιστοίχησης των παρακάτω στοιχείων (βλ. Πίνακα 13).

146

147

MARC 21 FRBR RDF

Πεδίο Υποπεδίο Θέση Ορισμός πεδίων Οντότητα Γνώρισμα/Σχέση Ιδιότητα Ετικέτα Περιγραφή Τιμή

001 n/a n/a Αριθμός ελέγχου)Εγγραφή(Record) Αναγνωριστικό

εγγραφής

(Record

Identifier)

http://datos.bne.es/page/

bimo0000152037

008 n/a 00-05 Ημερομηνία

εισαγωγής στο

αρχείο

Εγγραφή Ημερομηνία

εισαγωγής στο

αρχείο (Date

entered on

file)

830711

008 n/a 06 Τύπος

ημερομηνία/

Κατάσταση

έκδοσης

Εγγραφή Τύπος

στοιχείων

δεδομένων

(Type of data

element)

s

008 n/a 07-14 Ημερομηνία

(Ημερομηνία1/

Ημερομηνία 2)

Εκδήλωση Ημερομηνία

έκδοσης/διανομ

ής 1983

148

008 n/a 15-17 Τόπος έκδοσης,

διανομή ή

υλοποίησης

(Place of

publication,

distribution or

execution)

Εκδήλωση Τόπος

έκδοσης/διανομ

ής spa

008 n/a 35-37 Γλώσσα

(Language)

Έκφραση Γλώσσα

έκφρασηςdcTerms:langua

ge132

Γλώσσα Η γλώσσα του

πνευματικού

περιεχομένου

του πόρου

Spa

016 n/a Εθνικός

βιβλιογραφικός

αριθμός ελέγχου

φορέα (National

Bibliographic

Agency Control

Number)

ISBD:P1092133έχει

σημείωσηγια

αριθμούς

συσχετίζει

έναν πόρο με

μία σημείωση

για αριθμούς ή

αναγνωριστικά

που το

χαρακτηρίζουν

B15140-1983

132http://dublincore.org/documents/dcmi-terms/#terms-language

133http://metadataregistry.org/schemaprop/show/id/2034.html? 149

020 a n/a Διεθνής Πρότυπος

Αριθμός

Βιβλίου(Internat

ional Standard

Book Number)

Εκδήλωση Αναγνωριστικό

εκδήλωσηςISBD:P1154134

έχειπρότυπο

αναγνωριστικό

συσχετίζει τον

πόρο με τον

Διεθνή Πρότυπο

Αριθμό Βιβλίου

84-322-2162-7

020 c n/a Όροι

διαθεσιμότητας

(Terms of

availability)

Εκδήλωση Όροι

διαθεσιμότητας ISBD:P1034135

έχει όρουςδιαθεσιμότη

τας

συσχετίζει τον

πόρο με τη

δήλωση τιμής

για πώληση ή

μια μικρή

αναφορά σε

άλλους όρους

που δεν είναι

για πώληση

250 pts.

082 a n/a

Διεθνής

δεκαδικός

αριθμός

ταξινόμησης

“Any” Όρος για…(Termfor…)

Skos:notation136 Notationσυσχετίζει τον

πόρο με μία

ακολουθία

χαρακτήρων που

χρησιμοποιείτα

ι για τον

860(861)-31”19”

134 http://metadathttp://metadataregistry.org/schemaprop/show/id/1975.htmlaregistry.org/schemaprop/show/id/2128.html

135 http://metadataregistry.org/schemaprop/show/id/1975.html

136 http://www.w3.org/TR/skos-reference/#notations150

(Dewew Decimal

Classification

Number)

μοναδικό

προσδιορισμό

μίας έννοιας

μέσα σε ένα

συγκεκριμένο

σχήμα εννοιών

245 a n/a Τίτλος (Title) Εκδήλωση Τίτλος

ISBD:P1004137

έχει κύριο

τίτλο

συσχετίζει τον

πόρο με τον

κύριο τίτλο Cronica de una muerte anunciada

245 c n/a Δήλωση

υπευθυνότητας

(Statement of

Responsibility)

Εκδήλωση Δήλωση

Υπευθυνότητας ISBD:P1007138

έχει δήλωση

υπευθυνότητ

ας σχετικά

με τον

τίτλο

συσχετίζει τον

πόρο με ένα ή

περισσότερα

ονόματα,

φράσεις ή

ομάδες από

χαρακτήρες

και/ή τη

λειτουργία

μερικών

προσώπων ή

συλλογικών

οργάνων

υπεύθυνων για

ή

Gabriel Garcia, Marquez

137 http://metadataregistry.org/schemaprop/show/id/1945.html

138 http://metadataregistry.org/schemaprop/show/id/1948.html151

συνεργαζόμενων

για τη

δημιουργία ή

τη πραγμάτωση

του

πνευματικού ή

καλλιτεχνικού

περιεχομένου

ενός έργου που

εμπεριέχεται

στον πόρο

260 n/a 01 Έκδοση, διανομή

κλπ

(Publication,

distribution

etc.)

Εκδήλωση Εκδότης/

Διανομέας

(Publisher/

Distributor)

260 a n/a Τόπος έκδοσης

(Place of

publication)

Εκδήλωση Τόπος έκδοσης ISBD:P1016139

έχει τόπο

έκδοσης,

διανομής,

παραγωγής

συσχετίζει

έναν πόρο με

το όνομα του

τόπου που

αναφέρεται

στην πηγή

πληροφορίας

που έχει ήδη

περιγραφεί με

Barcelona

139 http://metadataregistry.org/schemaprop/show/id/1957.html152

το όνομα του

εκδότη,

διανομέα ή

παραγωγού

260 b n/a Όνομα εκδότη,

διανομέα κλπ

(Name of editor,

distributor

etc.)

Εκδήλωση Εκδότης/

Διανομέας ISBD:P1117140έχει τίτλο

μεμονωμένου

έργου από

τον ίδιο

συγγραφέα

συσχετίζει

έναν πόρο με

τον τίτλο ενός

μεμονωμένου

έργου όταν ο

πόρος

περιλαμβάνει

δύο ή

περισσότερα

έργα χωρίς

συλλογικό

τίτλο

Seix Barral

260 c n/a Ημερομηνία

έκδοσης,

διανομής κλπ

Εκδήλωση Ημερομηνία

έκδοσης ISBD:P1018141έχει

ημερομηνία

έκδοσης,

διανομής,

παραγωγής

συσχετίζει

έναν πόρο με

την ημερομηνία

όπου επίσημα

διατέθηκε για

πώληση ή

διανομή στο

κοινό συνήθως

[1983]

140 http://metadataregistry.org/schemaprop/show/id/2059.html

141 http://metadataregistry.org/schemaprop/show/id/1959.html153

σε μορφή

ημερομηνίας

300 a n/a Έκταση (Extend) Εκδήλωση Έκταση φορέα

(Extent of

carrier)

ISBD:P1022142έχει ειδική

περιγραφή

υλικού και

έκταση

συσχετίζει τον

πόρο με μία

δήλωση για την

ειδική

περιγραφή του

υλικού την

έκτασή του, τη

δήλωση

αρίθμησης (αν

πρόκειται για

έντυπο

υλικό) .

191 p.

300 c n/a Διαστάσεις

(extend)

Εκδήλωση Διαστάσεις

φορέα ISBD:P1024143έχει

διαστάσεις

συσχετίζει τον

πόρο με μία

δήλωση για

τις διαστάσεις

της σε cm

21 cm

490 a n/a Δήλωση σειράς Εκδήλωση Δήλωση σειράς ISBD:P1026144

έχει κύριο

τίτλο

συσχετίζει

έναν πόρο που

142 http://metadataregistry.org/schemaprop/show/id/1963.html

143 http://metadataregistry.org/schemaprop/show/id/1965.html

144 http://metadataregistry.org/schemaprop/show/id/1967.html154

σειράς ή

πολυμερούς

μονογραφικο

ύ πόρου

είναι σειρά ή

πολυμερής

μονογραφία με

τον κύριο

τίτλο

Obras maestras de la literatura

contemporanea

490 v n/a Τόμος (Volume) Εκδήλωση Δήλωση σειράςISBD:P1031145

έχει

αρίθμηση

μέσα στη

σειρά ή

στον

πολυμερή

μονογραφικό

πόρο

συσχετίζει τον

πόρο που

ανήκει σε μία

σειρά με την

αρίθμησή της

1

Πίνακας 13. Αντιστοίχηση πεδίων MARC21 με FRBR και RDF στο ισπανικό μοντέλο

145 http://metadataregistry.org/schemaprop/show/id/1972.html155

Από τη μελέτη του παραπάνω πίνακα προκύπτει ότι υφίσταται πλήρης

αντιστοιχία της περιγραφής της MARC21 βιβλιογραφικής εγγραφής με το

λεξιλόγιο που χρησιμοποιεί το ισπανικό μοντέλο στην περιγραφή του

manifestation. Κατά συνέπεια δεν υπάρχει απώλεια δεδομένων κατά την

μετατροπή το οποίο αποτελεί βασική προδιαγραφή για τη διασύνδεση των

δεδομένων των βιβλιοθηκών με άλλες πηγές. Το λεξιλόγιο που κυριαρχεί

στην περιγραφή των βιβλιογραφικών δεδομένων είναι το ISBD το οποίο

παρέχει επαρκή κάλυψη των πεδίων και υποπεδίων βιβλιογραφικών

εγγραφών MARC21 καθώς είναι στενά συνυφασμένο με τους κανόνες

καταλογογράφησης της ισπανικής βιβλιοθήκης.

8.6.6 Συσχεστίσεις οντοτήτων

Για να γίνει λειτουργικό το μοντέλο της ισπανικής βιβλιοθήκης

καθοριστικός είναι ο ρόλος των συσχετίσεων μεταξύ των οντοτήτων. Οι

κλάσεις ifla-frbr:P2004, ifla-frbr:P2002, ifla-frbr:P2003

αντιστοιχούν σε συσχετίσεις μεταξύ των οντοτήτων της πρώτης ομάδας

του FRBR μοντέλου. Οι συσχετίσεις αυτές δεν ορίζονται από τα πεδία

MARC21.

Συνοψίζοντας από τα προηγούμενα υποκεφάλαια θέλοντας να

αποδώσουμε σχηματικά τις συσχετίσεις ανακεφαλαιώνουμε τα URIs που

προκύπτουν για την κάθε οντότητα:

URI έκφρασης: http://datos.bne.es/resource/XX1987431spa

156

URI εκδήλωσης: http://www.datos.bne.es/page/resource/bimo0000152037

URI έργου: http://datos.bne.es/page/resource/XX1987431

Οι συσχετίσεις που προκύπτουν ως εξής (βλ. Σχεδιάγραμμα 3).

157

Σχεδιάγραμμα 3. Συσχετίσεις οντοτήτων

158

http://www.datos.bne.es/page/resource/

bimo0000152037

http://datos.bne.es/resource/XX1987431spa

ενσωματώνεταισε Είναι η

πραγμάτωση του

http://datos.bne.es/page/

resource/XX1987431

ifla-

frbr:P2009:δημιουργήθηκε

(Πρόσωπο) από

ifla-frbr:P3001: τίτλος

έργου

rdf:type:ifla-

frbr:c1001:έργο

Δημιουργήθηκε από

Είναι δημιουργός του

http://datos.bne.es/resource/

XX933268

ifla-frbr:P2010: είναι δημιουργός

(Πρόσωπο) του

ifla-frbr:P3039: έχει όνομα

Προσώπου: “Gabriel Garcia Marquez”

ifla-frbr:P3040:έχει ημερομηνίες

σχετικές με το πρόσωπο “1927-2014”

ifla-frad:P4031:Παραλλαγές του

ονόματος

rdf:type:c1005:Πρόσωπο

http://datos.bne.es/

resource/XX1987431

Είναι η ενσωμάτωση τηςτης έκφρασης

8. 7 Παραγωγή δεδομένων σε RDF (RDF GENERATION)

8.7.1 Περιληπτική διαδικασία αντιστοίχησης με το εργαλείο Marimba

Το εργαλείο Marimba όπως ήδη έχουμε αναφέρει στο υποκεφάλαιο

6.3.2 χρησιμοποιεί υπολογιστικά φύλλα για την μετατροπή των

δεδομένων. Οι βιβλιοθηκονόμοι δημιουργούν χειροκίνητα τις

αντιστοιχίες με τη διαδικασία: “Classification Mapping” όπου γίνεται

ο συνδυασμός των πεδίων MARC21 με σκοπό τον εντοπισμό των FBRR

οντοτήτων. Στο δικό μας παράδειγμα ένα δείγμα αντιστοίχησης είναι το

παρακάτω:

Το Marimba, ερμηνεύει τις αντιστοιχήσεις και δημιουργεί το RDF:

Εγγραφή MARC21(Εισαγωγή

δεδομένων)

Ενέργεια RDF (Εξαγωγή δεδομένων)

100 $a$d Classify Rdf:Type frbr:C1005

100 $a Garcia Marquez,

Gabriel

Annotate frbr: P3039 “Garcia

Marquez, Gabriel"

100$d 1927-2014 Annotate frbr:P3040 “1927-2014”

Πίνακας 14.Μετατροπή σε RDF των πεδίων MARC21 με το εργαλείο MarimbaΣτο σχεδιάγραμμα που ακολουθεί περιγράφεται η ροή εργασίας της

μετατροπής με το εργαλείο Marimba για το συγκεκριμένο παράδειγμα. 159

MARC ΕΓΓΡΑΦΕΣ

Classify

Annotation

160

Bne: XX933268 rdf:type

frbr:Person

Bne: XX933268 a frbr:Person

frbr:name “Garcia Marquez,

Gabriel” ”

Bne: XX1987431

rdf:type frbr:Work

Bne: XX1987431 rdf:type

frbr:Work

frbr:title: “Cronica de una

001 XX933268

10010#aGarcia Marquez,

Gabriel$d1927-

001 XX1987431

10010#aGarciaMarquez,

Gabriel$d1927-

24510$aCronica de una

muerte anunciada

Bne: XX933268 a frbr:Person

frbr:name “Garcia Marquez,

Gabriel

frbr:hasDates 1927-2014

bne: XX1987431 rdf:type

frbr:Work

frbr:title “Cronica de

una muerte anunciada”

frbr:isCreated by bne:

XX1987431

Relation

Σχεδιάγραμμα 4. Περιληπτική απεικόνιση του εργαλείου Marimba

Όσο αφορά τις συσχετίσεις μεταξύ των οντοτήτων αυτές δεν

ορίζονται από το MARC21. Σκοπός είναι να δημιουργηθεί η σχέση μεταξύ

έργου και συγγραφέα. (Το έργο Cronica de una muerte anunciada

δημιουργήθηκε από τον Gabriel Garcia Marquez).

Ως εκ τούτου, εντοπίζουμε την διαφορά (Diff) μεταξύ των δύο

εγγραφών:

Γνωρίζοντας τον τύπο R1 και R2, ερευνούμε την διαφορά (diff)161

001 XX933268

100 10#aGarcia, Marquez, Gabriel$d1927-

2014

001 XX1987431

100 10#aGarcia, Marquez,

Gabriel$d1927-2014

245 $a Cronica de una muerte anunciada

diff

bne:001 XX933268 frbr:2010 (is Creator Of) bne:XΧ1987431

Σχεδιάγραμμα 5. Ορισμός Συσχετίσεων στο εργαλείο Marimba

Προέλευση μεταδεδομένων και άδειες

dcterms:creator

<http://datos.bne.es>

dcterms:publisher

<http://oeg-upm.net>

dcterms:license

<http://creativecommons.org/publicdomain/zero/1.0/>

rdf:type prv:DataCreation

prv:completedAt

2014-10-17T10:38:58.15Z

prv:performedBy

Anon_3   (more)

prv:usedData

Anon_4   (more)

rdf:type void:Dataset

Εικόνα 8. Παράδειγμα προέλευσης και άδειας δεδομένων

Στην παραπάνω εικόνα περιγράφεται η προέλευση και η άδεια των

δεδομένων. Οι πληροφορίες που τις αφορούν προστίθενται σε κάθε

περιγραφή πόρου RDF με τη βοήθεια ενός μηχανισμού που ονομάζεται

162

“Names Graphs” (Carroll et al., 2005). Οι πληροφορίες χωρίζονται σε

τρία μέρη:

Τρέχουσα πληροφορία (Temporal information).

Αναφέρεται η ημερομηνία κατά την οποία τα δεδομένα

ανακτήθηκαν. Χρησιμοποιούνται οι ιδιότητες

(prv:retrievedBy146, prv:completedAt147) από το

λεξιλόγιο: “Provenance Vocabulary Core Ontology

Specification”148

Αναφέρεται ο δημιουργός και εκδότης των δεδομένων

(Creator and Publisher of the data). Χρησιμοποιούνται

οι ιδιότητες (dcterms:publisher149, dcterms:creator150)

από το λεξιλόγιο DCMI

Τέλος αναφέρεται η άδεια (License) με την ιδιότητα

(dcterms:license151)

146 http://trdf.sourceforge.net/provenance/ns.html#retrievedBy147 http://trdf.sourceforge.net/provenance/ns.html#completedAt

148 http://trdf.sourceforge.net/provenance/ns.html

149 http://dublincore.org/documents/dcmi-terms/#terms-publisher

150 http://dublincore.org/documents/dcmi-terms/#terms-creator

151 http://dublincore.org/documents/dcmi-terms/#terms-license163

8.7.2 Διασύνδεση (Linking)

Εικόνα 9. Owl:sameAs: Παράδειγμα διασύνδεσης

Σκοπός της διαδικασίας διασύνδεσης είναι να συμπεριληφθούν

συνδέσεις από το σύνολο δεδομένων datos.bne.es σε άλλα σύνολα

δεδομένων RDF προκειμένου να επιτευχθεί η πλοήγηση μεταξύ σχετικών

πόρων από τους χρήστες. Η παρούσα διαδικασία περιλαμβάνει την

αυτόματη ανακάλυψη των σχέσεων μεταξύ των αντικειμένων των δεδομένων

με σκοπό να αυξήσει την εξωτερική συνδεσιμότητα των RDF συνόλων

δεδομένων.

Προσδιορισμός σχετικών συνόλων δεδομένων (βλ.Σχεδιάγραμμα 6) :

-VIAF

-DNB (GND-The authority data set)

-Libris

-Sudoc

-DBpedia (Το VIAF εμπεριέχει συνδέσεις από την DBpedia)

Δημιουργία συνδέσεων

Σκοπός είναι η δημιουργία όμοιων οντοτήτων στα σύνολα δεδομένων

που επιλέχθηκαν να γίνουν οι διασυνδέσεις. Για παράδειγμα τα URIS της164

GND ακολουθούν το πρότυπο gnd {GND-ID} και τα URIs της ΒΝΕ το πρότυπο

{ΒΝΕ-ID}. Χρησιμοποιώντας αυτά τα δύο πρότυπα URIS δημιουργούμε

συνδέσεις από το datos.bne.es με την GND δημιουργώντας δηλώσεις

owl:sameAs με ζευγάρια GND-ID και BNE-ID τα οποία βρίσκονται σε VIAF

αρχεία συνδέσεων (βλ.Πίνακα 15).

prefix bne: http://datos.bne.es/resource/

prefix dnb: http://d-nb.info/gnd/

bne: XX933268 owl: sameAs gnd: 118537601

Πίνακας 15. Παράδειγμα μίας owl:SameAs σύνδεσης στο datos.bne.es

Same As Same As

Same As Same As

Same As

http://d-nb.info/gnd/118537601

165

http://viaf.org/viaf/

54147956

http://datos.bne.es/resource/XX933268

http://www.idref.fr/026881241/id

http://dbpedia.org/resource/Gabriel_Garc%C3%ADa_M

%C3%A1rquez

http://libris.kb.se/resource/auth/187954

Σχεδιάγραμμα 6. Διασύνδεση μεταξύ συνόλων δεδομένων

166

8.7. Δημοσίευση συνδεδεμένων δεδομένων

Ο σκοπός όλης της παραπάνω διαδικασίας είναι το RDF σύνολο

δεδομένων που δημιουργήθηκε κατά τη διαδικασία μετατροπής να

δημοσιευτεί και να τεθεί για διάθεση και αναζήτηση στον ιστό. Οι

χρήστες έχουν τις παρακάτω επιλογές προβολής των αποτελεσμάτων:

A)SPARQL endpoint διαθέσιμο στην ιστοσελίδα: http://datos.bne.es/sparql

B) LD Front-end Pubby διαθέσιμο στην ιστοσελίδα: http :// bne . linkeddata . es

Γ) API διαθέσιμο στην ιστοσελίδα: http://datos.bne.es/frontend/persons

Δ) Η Δημοσίευση των μεταδεδομένων που αφορούν το σύνολο

δεδομένων με τη χρήση του Void είναι διαθέσιμη στην

ιστοσελίδα: http://datos.bne.es/void/bne.ttl

Η βάση με το σύνολο των ανοιχτών βιβλιογραφικών δεδομένων της

ισπανικής βιβλιοθήκης έχει καταχωρηθεί στο μητρώο δεδομένων:

“datahub.io/dataset/datos-bne-es”, προκειμένου να διευκολυνθεί η

επαναχρησιμοποίησή της από τρίτους.

167

Εικόνα 10. Γραφικό περιβάλλον της υπηρεσίας datahub.io./datos.bne.es

8.8. Συμπεράσματα

Τo μοντέλο δημοσίευσης των δεδομένων της Εθνικής Βιβλιοθήκης της

Ισπανίας παρέχει μία ενισχυμένη και εξελιγμένη πλοήγηση ετερογενών

πληροφοριών υποστηρίζοντας και προσφέροντας ένα συνεκτικό

σημασιολογικό μοντέλο που βασίζεται σε συγκεκριμένες δομές δεδομένων,

εμπλουτίζοντας την περιγραφή του υλικού της βιβλιοθήκης με

πληροφορίες προερχόμενες από πηγές γνώσης εκτός των τοπικών

πληροφοριών της. Στόχος του η παραγωγή ενός τυποποιημένου τρόπου

περιγραφής βιβλιογραφικών δεδομένων με σκοπό να καταστήσει την

ανταλλαγή των βιβλιογραφικών εγγραφών σε ένα παγκόσμια τυποποιημένο

εννοιολογικό μοντέλο.

168

Στο παράδειγμα που αναπτύχθηκε παρουσιάστηκε μια περιγραφή των

βασικών χαρακτηριστικών του συνόλου δεδομένων datos.bne.es και της

διαδικασίας που ακολουθείται στην ανάπτυξή του με τη χρήση του

εργαλείου MARiMBA. H προσέγγιση του MARiMBA είναι αρκετά ευέλικτη

ώστε να επιτρέπει και σε άλλους πολιτιστικούς φορείς να μετατρέψουν

τα δεδομένα του καταλόγου τους σε RDF.

Μία από τις μεγαλύτερες συνεισφορές του μοντέλου είναι ότι οι

εμπειρογνώμονες του τομέα (βιβλιοθηκονόμοι και καταλογογράφοι)

αντιστοίχησαν τα στοιχεία μεταδεδομένων MARC 21 με τα άκρως

εξειδικευμένα μοντέλα βιβλιοθήκης που παρείχε η IFLA, με τη χρήση

υπολογιστικών φύλλων. Με αυτόν τον τρόπο οι ειδικοί του χώρου

ενεπλάκησαν στη γενιά των διασυνδεδεμένων δεδομένων, με αισθητή

μείωση της προσπάθειας και του απαιτούμενου χρόνου. Θετική επίσης

προσέγγιση της διαδικασίας μετατροπής αναμφισβήτητα μπορεί να

θεωρηθεί η συμπερίληψη URIs ισοδύναμων πόρων σε εξωτερικά σύνολα

δεδομένων κατά τη διαδικασία καταλογογράφησης (συμπερίληψη URIs από

το αρχείο VIAF ή την Dbpedia κατά τη δημιουργία μίας νέας

καθιερωμένης εγγραφής).

Η διαθεσιμότητα των ήδη επικυρωμένων πόρων, όπως το VIAF

διευκολύνει τη δημιουργία υψηλής ποιότητας συνδέσεων μεταξύ του

συνόλου δεδομένων datos.bne.es και άλλων συνόλων δεδομένων στο

σύννεφο “LOD”. Χρησιμοποιούνται ήδη από πρωτοβουλίες όπως η

BibSoup152 του Ιδρύματος Ανοικτής Γνώσης και του JISC. Υπάρχει επίσης

152 http://blog.okfn.org/2012/02/13/open-biblio-launches-bibsoup-in-beta169

πρόβλεψη για τη χρήση της ως παρόχου δεδομένων στις εθνικές και

περιφερειακές βιβλιοθήκες εντός της Ισπανίας. (Suero et.al., 2012).

Στο παρακάτω υποκεφάλαιο αναπτύσσονται τα πλεονεκτήματα και τα

μειονεκτήματα του μοντέλου όπως αυτά προέκυψαν από την παρουσίαση του

παραδείγματος.

8.8.1 Πλεονεκτήματα και μειονεκτήματα του μοντέλου - Μελλοντικές βελτιώσεις

ΠΛΕΟΝΕΚΤΗΜΑΤΑ

Ανάπτυξη ενός συστήματος όπου εμπειρογνώμονες βιβλιοθηκών έχουν

τη δυνατότητα του προσδιορισμού και της αξιολόγησης των

αντιστοιχήσεων σε RDF ανεξάρτητα από ειδικούς πληροφορικής

Δεν απαιτείται αλλαγή στα συστήματα βιβλιοθήκης και στα

δεδομένα

Διατηρείται η ακεραιότητα των δεδομένων

Εμπλουτίζει τους καταλόγους των βιβλιοθηκών χωρίς να χρειάζεται

ο χρήστης να επιλέξει ανάμεσα στον κατάλογο της βιβλιοθήκης ή

στο διαδίκτυο για την πληροφόρησή του

Χρησιμοποιεί μία επαναληπτική και σταδιακή διαδικασία μετατροπής

Χρησιμοποιεί μοντέλα υψηλής εξειδίκευσης βιβλιοθηκών όπως το

FRBR και το ISBD

170

Συνεργάζεται με την IFLA (για θέματα γλωσσών)

Διαθέτει σαφή εικόνα των δεδομένων προέλευσης πριν τη μετατροπή

ώστε να εντοπιστούν πιθανές ελλείψεις

ΜΕΙΟΝΕΚΤΗΜΑΤΑ

Βασικά αναγνωριστικά δεν αποτελούν μέρος της βάσης δεδομένων

Περιορίζει την εισαγωγή των στοιχείων στις εγγραφές

Οι πηγές των δεδομένων είναι εγγραφές MARC21 και όχι RDB, οι

οποίες είναι δύσκολο να αντιστοιχηθούν με “πλουσιότερα” μοντέλα

δεδομένης της επίπεδης δομής τους

Συμμετοχή των καταλογογράφων στη διαδικασία αντιστοίχησης

Η ποιότητα των δεδομένων είναι υψηλή αλλά ακόμα υπάρχουν πολλά

λάθη: reporting

Μία μελλοντική βελτίωση και επέκταση του μοντέλου θα μπορούσε να

ήταν η αλληλεπίδραση με ψηφιακούς πόρους από την ψηφιακή βιβλιοθήκη

που διατηρεί η ισπανική βιβλιοθήκη.

171

ΚΕΦΑΛΑΙΟ 9

Παράδειγμα σύμφωνα με το Μοντέλο ΠεριγραφήςΣυνδεδεμένων Δεδομένων της Εθνικής Βιβλιοθήκης της

Βρετανίας

9.1 Σκοπός του παραδείγματος

Αυτή η ενότητα είναι αφιερωμένη στο να δείξει ένα παράδειγμα των

στοιχείων που μπορούν να βρεθούν μέσα στο σύνολο δεδομένων

data.bl.uk. Πιο συγκεκριμένα περιγράφει, μία βιβλιογραφική εγγραφή σε

δομή MARC21, που απαρτίζεται από ένα σύνολο δεδομένων, τα οποία μέσω

της πλατφόρμας Tso θα παράγουν συνδεδεμένα δεδομένα σύμφωνα με τα

λεξιλόγια που χρησιμοποιεί το μοντέλο της βρετανικής βιβλιοθήκης

για τη δημοσίευσή τους.

Το συγκεκριμένο παράδειγμα είναι ένα σύνολο δεδομένων που

σχετίζονται με τον κολομβιανό συγγραφέα Gabriel Garcia Marquez ως

δημιουργό του έργου: “Cronica de una muerte anuncuada” και αφορά μία

διαφορετική έκφραση (μετάφραση στην αγγλική γλώσσα) από αυτήν που

αναλύθηκε στο παράδειγμα της ισπανικής βιβλιοθήκης. Μέσω του

παραδείγματος απεικονίζεται η εσωτερική δομή του συνόλου των

δεδομένων και αναλύεται η μεθοδολογία μετατροπής τους από την δομή

MARC21 σε RDF/XML αρχεία και δημοσίευση συνδεδεμένων δεδομένων .

172

9.2 Ροή εργασίας (workflow) της μετατροπής MARC21 σε RDF/XML από τη βρετανική βιβλιοθήκη

Η βρετανική βιβλιοθήκη ακολουθεί μία συγκεκριμένη ροή εργασίας

προκειμένου να μετατρέψει τα δεδομένα των MARC21 δομημένων εγγραφών

της σε RDF/XML αρχεία και να παράγει τριπλέτες προκειμένου να τις

δημοσιεύσει στο μητρώο data hub και στην πλατφόρμα συνδεδεμένων

δεδομένων. Η ροή εργασίας σύμφωνα με τις Young (2011) και Deliot

(2013) διαμορφώνεται ως εξής :

Α. Προεπεξεργασία

“Επιλογή”-Επιλογή MARC εγγραφής από το ολοκληρωμένο αρχείο

MARC21 της BNB

Μετατροπή χαρακτήρων σε pre-composed UTF-8

Μετατροπή συνόλων χαρακτήρων. Κανονικοποίηση για βελτιωμένη

αντιστοίχηση (matching) και μετατροπές (transforms)

Δημιουργία URIs

Μετατροπή σε αρχείο RDF/XML

Παραγωγή RDF Triple dump

“Λήψη” στο data hub

“Λήψη” στην πλατφόρμα των συνδεδεμένων δεδομένων της βρετανικής

βιβλιοθήκης173

Β. Επεξεργασία

Επιλογή

Μετατροπή συνόλου χαρακτήρων

Προ-επεξεργασία

Παραγωγή URI

Μετατροπή δεδομένων

Δημιουργία και “Λήψη” τριπλετών

Παραγωγή περιγραφών VoiD

Γ. Εργαλεία

Τα εργαλεία που χρησιμοποιούνται για την μετατροπή (Deliot,

2013) είναι τα:

MARC Global/MARC Report153

Jena Eyeball154

9.3 Παράδειγμα

9.3.1 Επιλογή MARC εγγραφής

Για την υλοποίηση του παραδείγματος δημιουργήσαμε ένα ερώτημα

στον κατάλογό της βρετανικής βιβλιοθήκης με τίτλο: “Chronicle of a153 http://www.marcofquality.com

154 http://jena.sourceforge.net/Eyeball174

death foretold” και συγγραφέα: “Gabriel Garcia Marquez”. Από τα

αποτελέσματα που ανακτήθηκαν επιλέξαμε την βιβλιογραφική εγγραφή που

αντιστιστοιχεί στο isbn: “0224019902” (βλ. Πίνακα 16).

Title: Chronicle of a death foretold / Gabriel García Márquez ; translated from the Spanish by Gregory Rabassa.

Author: Gabriel García Márquez, 1928-Subjects: Fiction in Spanish Colombian writers 1945-

Translations ;Dewey: 863/.6 ;Dewey: 863

Publication Details: London : Cape, 1982.Language: EnglishUniform Title: Crónica de una muerte anunciada. EnglishIdentifier: ISBN 0224019902 : £5.95; BNB GB8225519; System

number 007362529Notes: Language note: Translation of: Crónica de una muerte

anunciada.Physical Description: 122p. ; 21cm.Shelfmark(s): General Reference Collection X.958/12059UIN: BLL01007362529

Πίνακας 16. Οπτικοποίηση βιβλιογραφικής εγγραφής με isbn: “0224019902”

Για τη δημιουργία των URIs της βρετανικής βιβλιοθήκης υπάρχει

σύντομη αναφορά στο υποκεφάλαιο 7.4 της εργασίας. Η αναλυτική λίστα

όλων των προτύπων URIs είναι διαθέσιμη στην ιστοσελίδα:

http://www.bl.uk/bibliographic/datafree.html. Ακολουθεί συνοπτικό

παράδειγμα (βλ. Πίνακα 17).

- Bibliographic resource :

175

Εδώ υπάρχει μία διαφοροποίηση στην ημερομηνία του προσώπου σε σχέση με την ισπανική βιβλιοθήκη

-http://bnb.data.bl.uk/id/resource/{control-

number}

-http://bnb.data.bl.uk/id/resource/{bnb-

number}

-http://bnb.data.bl.uk/doc/resource/

007362529.rdf

-http://bnb.data.bl.uk/doc/resource/

007362529.ttl

-http://bnb.data.bl.uk/doc/resource/

007362529.json

-http://bnb.data.bl.uk/doc/resource/

007362529.html

Πίνακας 17. Παραδείγματα προτύπων URIS από τη βρετανική

βιβλιοθήκη

Τα URIs που έχουν επινοηθεί από τη βρετανική βιβλιοθήκη

παράγονται από τις MARC εγγραφές ενώ τα URIs που αντιστοιχούν σε

εξωτερικές πηγές δεδομένων (για παράδειγμα συνδέσεις με το VIAF και

το Lexvo) προστίθενται με ένα εργαλείο που η ίδια η βιβλιοθήκη έχει

δημιουργήσει το “Catalogue Bridge Utilities”.

9.3.3 Διαδικασία Μοντελοποίησης

176

Η αναφορά στη διαδικασία μοντελοποίησης θεωρήθηκε χρήσιμη για

την καλύτερη κατανόηση της διαδικασίας μετατροπής των MARC21

δεδομένων σε RDF/XML αρχεία.

Ανάλυση του μοντέλου: Η μοντελοποίηση σύμφωνα με την Deliot

(Deliot, 2013), αναπτύχθηκε με βάση την ανάγκη του προσδιορισμού των

αντικειμένων ενδιαφέροντος. Μία εγγραφή MARC θα έπρεπε να

αποσαφηνιστεί για να προσδιορίσει το νόημά της σε σχέση με τα

“αντικείμενα του κόσμου” (things of the world). Κατά συνέπεια

δημιουργείται ένα σύνολο δεδομένων το οποίο περιλαμβάνει έννοιες,

αφηρημένα και υλικά αντικείμενα όπως βιβλιογραφικοί πόροι, πρόσωπα,

οργανισμοί, τόπους, θέματα και άλλα. Για την περιγραφή των οντοτήτων

και των συσχετίσεων μεταξύ τους το βρετανικό μοντέλο όπως φαίνεται

και από το παραπάνω σχήμα, χρησιμοποιεί ήδη υπάρχοντα RDF λεξιλόγια

και οντολογίες που έχουν χρησιμοποιηθεί από άλλες πρωτοβουλίες

ανοιχτών συνδεδεμένων δεδομένων στις οποίες έχουμε ήδη αναφερθεί σε

προηγούμενα κεφάλαια.

Χαρακτηριστικό του μοντέλου, η μη χρήση οντολογιών από το πεδία

βιβλιοθηκών θέλοντας με τον τρόπο αυτό να απευθυνθεί σε ένα ευρύτερο

κοινό εκτός βιβλιοθηκών. Επιπρόσθετα το μοντέλο της βρετανικής

βιβλιοθήκης κάνει εκτεταμένη χρήση της ιδιότητας “foaf:focus”155

προκειμένου να συσχετίσει ανθρώπους, οργανισμούς, τόπους κ.α με τις

έννοιες SKOS. Σε πολλές περιπτώσεις το μοντέλο κάνει χρήση κλάσεων

που φαίνεται να επικαλύπτει η μία την άλλη. Για παράδειγμα η

155 http://xmlns.c http://www.w3.org/TR/vocab-org/#class-organization om/foaf/spec/#term_focus

177

οντολογία “org:Organization”156 έχει οριστεί ως “owl:equivalentClass”157

στην “foaf:Organization”. Κάτι αντίστοιχο συμβαίνει και με την

οντολογία “foaf:Agent”158 και “dcterms:Agent”159 προκειμένου να καλυφθεί

ένα ευρύτερο φάσμα δεδομένων. Η βρετανική βιβλιοθήκη έχει επιλέξει να

περιγράψει με παραγόμενους από την ίδια όρους (BL Terms RDF schema)

κλάσεις και ιδιότητες, όπου θεωρήθηκε απαραίτητο για την περιγραφή

αντικειμένων για τα οποία δε βρέθηκαν ή δεν προτιμήθηκαν άλλα

αντίστοιχα λεξιλόγια.

Αυτό που χαρακτηρίζει το μοντέλο είναι η μοντελοποίηση της

δήλωσης της έκδοσης ως γεγονός (event) για την ανάγκη κάλυψης

μελλοντικών εκδόσεων. Απώτερος σκοπός της δημιουργίας της οντότητας

“Event” από τη βρετανική βιβλιοθήκη είναι η δημιουργία ενός

επεκτάσιμου μοντέλου σε άλλα “γεγονότα” στη “ζωή” του πόρου. Για

παράδειγμα, στην περίπτωση που ένα βιβλίο αποκτηθεί ή χαρακτηριστεί

εκτός κυκλοφορίας (out of print). Αυτόματα η μοντελοποίηση της

τοποχρονολογίας έκδοσης και του εκδότη ως οντοτήτων αυτόματα σημαίνει

τον προσδιορισμό τους με URIs και όχι με λεκτικούς προσδιορισμούς.

Βάσει του μοντέλου έχουν δημιουργηθεί μερικές κλάσεις και

ιδιότητες προκειμένου να διευκολυνθεί η αναζήτηση. Για παράδειγμα οι

κλάσεις: “blt:TopicLCSH” και “blt:TopicDDC” σαν υποκλάσεις της

156 http://www.w3.org/TR/vocab-org/#class-organization

157 http://www.w3.org/TR/owl-ref/#equivalentClass-def

158 http://xmlns.com/foaf/spec/#term_Agent

159 http://dublincore.org/documents/dcmi-terms/#terms-Agent178

skos:Concept160. Οι κλάσεις αυτές δίνουν τη δυνατότητα στον χρήστη να

έχει μια πιό βελτιωμένη αναζήτηση σε ένα ειδικό θέμα από την LCSH ή

από έναν αριθμό DDC. Επίσης έχουν δημιουργηθεί οντότητες όπως η

“blt:hasCreated” ως “αντίστροφη” ιδιότητα του “dcterms:creator”161, η

“blt:hasContributedTo” ως “αντίστροφη” ιδιότητα της ιδιότητας

“dcterms:contributor” με σκοπό την ευκολότερη αναζήτηση των δεδομένων

και την καλύτερη λειτουργικότητα της ανάκτησης των πληροφοριών. (Για

το σχεδιάγραμμα του μοντέλου δεδομένων της βρετανικής βιβλιοθήκης –

Βιβλία- βλ. Εικόνα 11).

Εικόνα 11. RDF σχήμα όρων βρετανικής βιβλιοθήκης

@prefix blt:http://www.bl.uk/schemas/bibliographic/blterms #

9.3.4 Μετατροπή MARC21 δεδομένων σε αρχεία RDF/XML

Το επόμενο βήμα που η βρετανική βιβλιοθήκη ακολουθεί κατά τη ροή

εργασίας της είναι η μετατροπή των συνόλων χαρακτήρων των δεδομένων

160 http://www.w3.org/2009/08/skos-reference/skos.html#Concept

161 http://dublincore.org/documents/dcmi-terms/#terms-creator179

από τις εγγραφές MARC21, τα οποία είναι κωδικοποιημένα με το σχήμα

κωδικοποίησης για το πρότυπο Unicode: “Unicode/UTF-8”.Η RDF, ωστόσο,

συστήνει για τους λεκτικούς χαρακτήρες να είναι σε “Unicode Normal

Form C”162. Εφόσον πραγματοποιηθεί η παραπάνω ενέργεια τα δεδομένα

κανονικοποιούνται με τη χρήση του εργαλείου MARC Global163, το οποίο

έχει δημιουργηθεί από την TMQ (The MARC of Quality). Το βελτιωμένο

αρχείο MARC μετατρέπεται σε RDF/XML χρησιμοποιώντας τη γλώσσα XSLT.

Το αρχείο ελέγχεται με ένα εργαλείο ανοιχτής πρόσβασης, το Jena

Eyeball. Τα συνδεδεμένα δεδομένα μετατρέπονται σε N-Triples

προκειμένου να δημοσιευτούν στην πλατφόρμα συνδεδεμένων δεδομένων.

Για την καλύτερη κατανόηση της μετατροπής καταδείξαμε τα εξής:

Την βιβλιογραφική εγγραφή του παραδείγματος σε δομή

MARC21(βλ. Πίνακα 18)

Την οπτικοποίηση του πόρου σε περιηγητή “Disco

Hyperdata Browser”

Την αντιστοίχηση των πεδίων MARC21 της βιβλιογραφικής

εγγραφής με RDF λεξιλόγια

Η εγγραφή MARC21 όπως αυτή εμφανίζεται στον κατάλογο της βρετανικής βιβλιοθήκης

απεικονίζεται στον παρακάτω πίνακα:

001 <007362529>

162 http://www.unicode.org/reports/tr15/

163 http://www.marcofquality.com/soft/mgfeatures.html180

008 <821129s1982 enk 000 1 eng>

015 ##$a GB8225519$2 bnb

020 ##$a0224019902 :$c 5.95

040 ##$a Uk$c Uk

041 1#$a eng$h spa

050 00$aPQ8180.17.A73

082 04$a 863/.6$2 18

082 04$a 863$ 2 19

100 1#$aGarcia Marquez, Gabriel$d1928-

240 10$a Cronica de una muerte anunciada$c Gabriel Garcia Marquez$I

English

245 10$a Chronicle of a death foretold$c Gabriel Garcia Marquez ;

translated from the Spanish by Gregory Rabassa

260 ##$a London$b Cape$c 1982

300 ##$a122 p.$c 21 cm.

336 ##$a text$2 rdacontent

337 ##$a unmediated $2 rdamedia

338 ##$a volume $2 rdacarrier

546 ##$a Translation of: Cronica de una muerte anunciada

653 ##$a Fictions in Spanish$a Colombian writers$a 1945$a Translations

852 41$aBritish Library$b HMNTS$j X958/12059

181

Όροι περιεχομένου rda αντιστοιχία με marc LDR/ O6 code:a

SYS <007362529>*

Πίνακας 18. Οπτικοποίηση Βιβλιογραφικής εγγραφής σε δομή MARC21

Σύμφωνα με τα παραπάνω δεδομένα και τις αντίστοιχες προδιαγραφές

URIs που προαναφέρθηκαν η διαμόρφωση URI του συγκεκριμένου πόρου

διαμορφώνεται ως: *http://bnb.data.bl.uk/doc/resource/007362529

Όπως και στο παράδειγμα της ισπανικής βιβλιοθήκης σύμφωνα με την

βιβλιογραφική εγγραφή του παραδείγματος, δημιουργήσαμε έναν πίνακα

αντιστοίχησης (βλ. Πίνακα 19) που αντιστοιχεί τα πεδία MARC21 της

εγγραφής με το μοντέλο της βρετανικής βιβλιοθήκης. (Λεξιλόγια,

κλάσεις, ιδιότητες, εξωτερικές συνδέσεις).

182

Πεδίο Υποπεδίο Θέση Ορισμός πεδίων Μοντέλο βρετανικής

βιβλιοθήκης

(Κλάσεις,ιδιότητες,στιγμιότυ

πα,λεκτικοί όροι)

Ετικέτα Εξωτερικές διασυνδέσεις Τιμή

001 n/a n/a Αριθμός

ελέγχου Owl:sameAs

Δηλώνει

την όμοια

αναφορά

ενός

πράγματος

από δυο

διαφορετικά

URIs

007362529

008 n/a 07-14 Ημερομηνία 1982

008 n/a 15-17 Τόπος έκδοσης,

διανομή ή

υλοποίησης

rda:placeofpublication Enk

008 n/a 07-14 Ημερομηνία 1982

008 n/a 15-17 Τόπος έκδοσης,

διανομή ή

υλοποίησης

Enk

008 n/a 35-37 Γλώσσα lexvoUri

marc language code uri

Γλώσσα http://www.lexvo.org/page/iso639-

3/eng eng

015 a n/a Εθνικός

Αριθμός

Βιβλιογραφίας

Same as Σύνδεση δύο

ίδιων

αντικειμένω

GB8225519

183

ν020 a n/a Διεθνής

Πρότυπος

Αριθμός

Βιβλίου

Bibo:isbn10 ISBN 0224019902

020 c n/a Όροιδιαθεσιμότητας

rda:termsofavailability 5.95

040 a n/a Φορέας

πρωτότυπης

καταλογογράφησ

ης (Original

cataloguing

Agency)

UK

040 c n/a Φορέας

μεταγραφής

(Transcribing

Agency)

UK

041 a n/a Κωδικός

γλώσσας

κειμένου

(Language code

of text)

Eng

041 h n/a Κωδικός

γλώσσας

πρωτοτύπου

Spa

050 a n/a Ταξινομικός

αριθμός της

PQ8180.17.A73

184

Βιβλιοθήκης

του Κογκρέσσου082 a n/a Δεκαδικός

Αριθμός

Ταξινόμησης

Dewey

Instance:Dewey bl uri

blTerms:TopicDDC

Skos:broader

θέμα 863.6/2 ‘18’

863/2 ‘19’

100 a n/a dct:creator

blt:hascreated

Instance:person -as-agent BL

URI

Foaf:family name

Foaf:given name

Foaf:name

Δημιουργός/

Έχει

δημιουργηθε

ί

Foaf:family name:Garcia

Marquez/foaf:given

name:Gabriel/foaf:name:Ga

briel Garcia Marquez

100 d n/a Ημερομηνίες

σχετικές με το

πρόσωπο

Instance:person -as-agent BL

URI

Οντολογία:Bio

Ιδιότητα:event

{bio:event}

Instance:birth BL URI

Οντολογία:Bio

Ιδιότητα:date

{bio:date}

Κλάση: Bio:birth

Το γεγονός

της

γέννησης

(Birth

Event)

http://vocab.org/bio/0.1/

Birth.html

1928-

240 a/l Ομοιόμορφος

τίτλος/Γλώσα

ενός έργου

dcterms:alternative Εναλλακτικό

ς τίτλος

Cronica de una muerte

anunciada.English

245 a n/a Τίτλος dcterms:title Τίτλος Chronicle of a death

185

foretold245 c n/a Δήλωση

υπευθυνότητας

Gabriel Garcia Marquez

260 a n/a Τόπος έκδοσης Instance: PublicationEvent

BL URI

Οντολογία:event

Ιδιότητα:Place

{event:place}

Instance:Place BL URI

Class:geo:SpatialThing

Τοποθεσία GeoNames URI:

http://www.geonames.org/6269131/

england.html

MARC country code URI

6269131

Dcterms:location:London

260 c n/a Ημερομηνία

έκδοσης,

διανομής κλπ

Instance:PublicationEvent

Οντολογία:event

Ιδιότητα:time

{event:time}

Κλάση:CalendarYear

http://r.d.g./id/1982 1982

300 a n/a Έκταση Ιδιότητα

ISBD: P1053

έχει έκταση 122p.

300 C n/a Διαστάσεις 21 cm

336

{rda}

a Όρος τύπου

περιεχομένου

text

337{rd

a}

a Όρος τύπου

μέσου

unmediated

338{rd

a}

a Όρος τύπου

φορέα)

volume

186

546 a n/a Σημείωση

γλώσσας

Isbd:P1073 Αφορά ένα

πόρο στη

σημείωση

σχετικά με

τη φύση,

το σκοπό,

το πεδίο

εφαρμογής ή

της γλώσσας

του

πόρου

Translation of: Cronica

de una muerte anunciada

653 a n/a Μη ελεγχόμενος

όρος

Fictions in Span

Colombian writers/1945/

Translations852 a/b/j n/a Τοποθεσία /

bΥπο-θέση -

Συλλογή

(collection)/j

Αριθμός

ελέγχου ραφιού

(Shelving

Control

Number)

Μας παραπέμπει σε ένα

rdf-book mash up αρχείο}

Πίνακας 19. Αντιστοίχηση πεδίων MARC21 με το μοντέλο της βρετανικής βιβλιοθήκης

187

Από τη μελέτη του παραπάνω πίνακα προκύπτουν:

Οι εξωτερικές συνδέσεις δεδομένων της βρετανικής βιβλιοθήκης

Η γέννηση (birth) και ο θάνατος (Death) ενός προσώπου

μοντελοποιούνται σα βιογραφικά γεγονότα (biographical events)

Η εκτεταμένη χρήση της ιδιότητας “foaf:focus”

Η δημιουργία μίας νέας οντότητας “Publication Event” που

χρησιμοποιείται για να περιγράψει το πεδίο της έκδοσης

Χρήση των RDA

9.3.5 Διασύνδεση δεδομένων - Δημοσίευση συνδεδεμένων δεδομένων

Η βρετανική βιβλιοθήκη αντιμετωπίζοντας με σεβασμό τις

εξωτερικές βάσεις δεδομένων με τις οποίες συνδέει τα δεδομένα της

έχει επιλέξει (όπως είδαμε και στον πίνακα αντιστοίχησης παραπάνω)

γενικού περιεχομένου πόρους, όπως είναι η γεωγραφική βάση δεδομένων

Geonames για την περιγραφή της χώρας έκδοσης, η βάση Lexvo για την

περιγραφή της γλώσσας. Όπως έχει προαναφερθεί υπάρχουν συνδέσεις με

βάσεις δεδομένων που ειδικεύονται στα πεδία των βιβλιοθηκών όπως

είναι το VIAF οι LCSH , το Dewey.info και η βάση MARC Country και

Language codes. Υπάρχει μία τεχνική που παράγει αυτόματα URIs από τη

βιβλιογραφική εγγραφή όπως και άλλες τεχνικές που περιλαμβάνουν

αυτόματη αντιστοίχηση των καθιερωμένων επικεφαλίδων στις

βιβλιογραφικές εγγραφές με τους κατάλληλους χαρακτήρες στις

“αποθήκες” των συνδεδεμένων δεδομένων από όπου ανακτώνται και188

αντιστοιχούνται τα URIs (αυτή η τεχνική σύμφωνα με την Deliot έχει

χρησιμοποιηθεί για τις βάσεις δεδομένων LCSH και VIAF).

Στο συγκεκριμένο παράδειγμα οι συνδέσεις με εξωτερικές πηγές

αποδίδονται σχηματικά παρακάτω:

http://www.geonames.org/6269131/england.html

Σχεδιάγραμμα 7. Σύνδεση βιβλιογραφικού πόρου με εξωτερικές πηγές δεδομένων

Τα συνδεδεμένα δεδομένα είναι διαθέσιμα στις παρακάτω υπηρεσίες :

BNB Linked data platform: http://bnb.data.bl.uk (βλ.Eικόνα

12)

SPARQL endpoint: http://bnb.data.bl.uk/sparql

SPARQL editor: http://bnb.data.bl.uk/flint (βλ. Εικόνα 13)

Bulk downloads: http://www.bl.uk/bibliographic/download.html

(βλ. Εικόνα 14)

Data Hub: http://datahub.io/dataset/bluk-bnb

FLINT SPARQL editor: http://bnb.data.bl.uk/flint-sparql

189

http://bnb.data.bl.uk/doc/resource/007362529

http://www.lexvo.org/

page/iso639-3/

Εικόνα 12. Γραφικό περιβάλλον αναζήτησης σε BNB Linked Data Platform

Εικόνα 13. Γραφικό περιβάλλον σε SPARQL editor

190

Εικόνα 14. Γραφικό περιβάλλον bluk downloads

Εικόνα 15. Εμφάνιση εγγραφής με συνδεδεμένα

δεδομένα

9.4 Γενικά συμπεράσματα-Οφέλη δημοσίευσης δεδομένων της βρετανικής βιβλιοθήκης

Αδιαμφισβήτητα η BNB αποτελεί ένα σύνολο δεδομένων που

χαρακτηρίζεται ως μια εξουσιοδοτημένη πηγή πληροφόρησης των εκδόσεων

της Μεγάλης Βρετανίας εδώ και δεκαετίες. Αναπτύσσει μια μεθοδολογία

στη δημοσίευση των συνδεδεμένων δεδομένων που μπορεί να χαρακτηριστεί

“πολυνηματική” προσεγγίζοντας τις ανάγκες των ερευνητών των

παραδοσιακών βιβλιοθηκών αλλά και ενός ευρύτερου κοινού. Οι νέες

τεχνικές προ-επεξεργασίας των μεταδεδομένων και η συνεχής συνεργασία

με προγραμματιστές δεδομένων προσφέρει καινοτομία στον χώρο των

δεδομένων παραγκωνίζοντας τους μη αναγκαίους περιορισμούς.

Η “μετανάστευση” (migration) των δεδομένων από τη βιβλιοθήκη σε

πρότυπα πολλαπλών τομέων ορίζει την BNB ως ένα επαναχρησιμοποιήσιμο

σύνολο δεδομένων τόσο στο περιεχόμενό της όσο και στη χρονική της

κάλυψη.

191

Μια μελλοντική εξέλιξη του μοντέλου της βρετανικής βιβλιοθήκης,

ως απόρροια της βελτίωσης και της υποστήριξης του έργου που έχει ήδη

δημιουργηθεί θα μπορούσε να εμπεριέχει:

Tη διερεύνηση και ενσωμάτωση των FRBR στο μοντέλο

Τη διασύνδεση με άλλες εξωτερικές πηγές δεδομένων και

βιβλιογραφικές βάσεις (DNB, INSI, LC/NACO, DNB, DBpedia

κ.α.)

Δημιουργία οντοτήτων που θα αντιστοιχούν σε επερχόμενες

εκδόσεις και συνέδρια

Σύνδεση των δεδομένων έκδοσης με τη βάση δεδομένων

“Geonames” και σε επίπεδο “πόλης”.

192

9.5 Συγκριτική μελέτη των δύο μοντέλων

Οι πρωτοβουλίες και των δύο Εθνικών βιβλιοθηκών να συνδέσουν τα

δεδομένα τους και να τα δημοσιεύσουν ως ανοιχτά, στηρίζεται σε

θεμελιώδεις βάσεις στηριζόμενες σε ένα άριστα καταρτισμένο θεωρητικό

πλαίσιο, στην πλήρη κατανόηση της αρχιτεκτονικής της διαστρωμάτωσης

του σημασιολογικού ιστού και των τεχνολογιών του και θα μπορούσε να

αποτελέσει ένα παγκόσμιο παράδειγμα διασύνδεσης.

Κύριο μέλημα για τον τομέα των βιβλιοθηκών και των πόρων

πολιτιστικής κληρονομιάς που συντηρούν και επιμελούνται είναι η

ακέραια διαφύλαξη των δεδομένων κατά τη διάρκεια όλων των

επεξεργασιών μετατροπής τους από την “περιορισμένης χρήσης” δομή που

ως τώρα διατηρούσαν. Οι παραπάνω παράμετροι μας οδήγησαν σε μια

περιληπτική συγκριτική μελέτη των δύο μοντέλων των οποίων τα

παραδείγματα αναφέραμε στις προηγούμενες ενότητες. Για την απόδοση

των συμπερασμάτων θα στηριχτούμε σε έναν συγκριτικό πίνακα (βλ.

Πίνακα 20) στον οποίο απεικονίζονται ένα αντιπροσωπευτικό δείγμα από

τα λεξιλόγια που χρησιμοποιούν τα δύο μοντέλα για τη περιγραφή των

εγγραφών τους κατά τη μετατροπή τους σε RDF.

Πεδίο Υποπεδίο/

Δείκτης

Datos.bne.es BNB (vocabulary)

008 15-17 dcTerms dcTerms

193

020 a ISBD:P1154 bibo:isbn10/bibo:isbn13

020 c ISBD:P1034 Δεν αντιστοιχείται

040 b dcTerms:language (iso-639-2)

080 a Skos:notation

082 a dcTerms

100 a Ifla-frbr:P3039 dcterms:creator <rdf:type

rdf:resource="http://xmlns.com/f

oaf/0.1/Person" />

100 d ifla-frbr:P3040 dcterms:creator <rdf:type

rdf:resource="http://xmlns.com/f

oaf/0.1/Person" />

245 a ISBD:P1004 dcterms

245 c ISBD:P1007 dcterms

260 a ISBD:P1016 ISBD:P1016

[hasPlaceOfPublicationProduction

Distribution]

260 b ISBD:P1117 dcterms:publisher

260 c ISBD:P1022 dcterms:created

300 a ISBD:P1053 ISBD:P1053

300 c ISBD:P1024 Δεν αντιστοιχείται

Πίνακας 20. Συγκριτικός πίνακας λεξιλογίων των δύο μοντέλων

Από τη μελέτη του παραπάνω πίνακα προκύπτουν ο ομοιότητες και οι διαφορές των

δύο μοντέλων.

Ισπανικό Μοντέλο Βρετανικό Μοντέλο

194

Υπάρχει πλήρης αντιστοιχία των

δεδομένων των εγγραφών MARC21

στα λεξιλόγια που χρησιμοποιεί

η ισπανική βιβλιοθήκη για την

περιγραφή τους

Το μοντέλο κάνει χρήση των RDA

πεδίων

Χρησιμοποιεί το ISBD λεξιλόγιο

για την περιγραφή των

βιβλιογραφικών δεδομένων των

εγγραφών

Χρησιμοποιεί τα λεξιλόγια

περιγραφής όρων DCMI και BLT για

την περιγραφή των βιβλιογραφικών

δεδομένων των εγγραφώ

Χρησιμοποιεί το λεξιλόγιο ISBD σε

πολύ μικρότερη συχνότητα σε

αντίθεση με το ισπανικό μοντέλο.

Είναι δομημένο σύμφωνα με τα

πρότυπα της IFLA, κάνοντας

λεπτομερή χρήση του

προτεινόμενου από τον

οργανισμό FRBR μοντέλου και

των λεξιλογίων που βασίζονται

σε αυτό.

Δεν κάνει χρήση του μοντέλου

FRBR. Υπάρχει στις μελλοντικές

προδιαγραφές του μοντέλου

Η περιγραφή των πόρων από το

μοντέλο αντιστοιχεί σε μία

ιδιότητα

Οι πόροι περιγράφονται

συνεργατικά με τη δυνατότητα

πολλών περιγραφών στο ίδιο

περιεχόμενο-αντικείμενο

Χρησιμοποιώντας τις οντότητες

του μοντέλου FRBR για την

Δημιουργεί μία νέα οντότητα

(Publication Event) η οποία

195

περιγραφή προσώπων, συλλογικών

οργάνων έργων και εκφράσεων

επιτυγχάνει την ολοκληρωμένη

και οργανωμένη περιγραφή των

βιβλιογραφικών δεδομένων και

επιτρέπει ταυτόχρονα τη

συλλογή χρήσιμων δεδομένων

και πλοήγησης

διατηρεί προοπτικές επέκτασης της

εκδοτικής δραστηριότητας ως

γεγονός

Οι MARC εγγραφές και τα αρχεία

καθιερωμένων όρων έχουν

αντιστοιχηθεί με τις κλάσεις

και τις ιδιότητες που

εμπεριέχονται στο μητρώο Open

Metadata Registry

Η έλλειψη ενός συγκεκριμένου

πυρήνα περιγραφής βιβλιογραφικών

δεδομένων καθιστά το μοντέλο μη

αυστηρά δομημένο

Resolvable URIs Transparent URIs

Χρησιμοποιεί αυστηρά τα

βιβλιοθηκονομικά πρότυπα από

τους οργανισμούς

προτυποποίησης

Σκοπός του μοντέλου ένα ευρύτερο

κοινό εκτός του κοινού της

βιβλιοθήκης. Στηρίζεται σε

εξωτερικές πηγές δεδομένων για

την περιγραφή των δεδομένων του

και σε ποικιλομορφία συνδέσεων.

Υπάρχει συνδεσιμότητα με πολλές

εξωτερικές πηγές δεδομένων και

ποικίλα λεξιλόγια περιγραφής όρων

βιβλιοθήκης.

196

Και τα δύο μοντέλα έχουν προοπτικές βελτίωσης και αλλαγών σε

μελέτη και επεξεργασία όπως φαίνεται από τις ιστοσελίδες τους

και τις πρόσφατες δημοσιεύσεις τους.

Πίνακας 21. Συγκριτικός Πίνακας συμπερασμάτων των δύο μοντέλων

197

Κεφάλαιο 10

Ένα παράδειγμα Σειριακής έκδοσης στα δύο μοντέλαβιβλιοθηκών

Σε αυτό το κεφάλαιο θα καταδείξουμε τον τρόπο που αντιμετωπίζουν

τα δύο μοντέλα που προαναφέρθηκαν (της ισπανικής και της βρετανικής

βιβλιοθήκης) μία σειριακή έκδοση (Serial Publication). Σύμφωνα με

τους RDA164 μία σειρά αποτελείται από μεμονωμένα αντίτυπα τα οποία

σχετίζονται μεταξύ τους, με το γεγονός ότι το κάθε αντίτυπο έχει

εκτός από τον δικό του κύριο τίτλο ένα συλλογικό τίτλο που

εμφανίζεται και ισχύει για το σύνολο των αντιτύπων (Whole). Τα

επιμέρους στοιχείς μπορεί να έχουν ή όχι αρίθμηση. Η εγγραφή που

επιλέξαμε να καταδείξουμε αφορά ένα μέρος (part) μιας πολυμερούς

μονογραφίας165. Πριν προχωρήσουμε στη διαδικασία του παραδείγματος,

αξίζει να σημειωθεί ότι οι σειριακές εκδόσεις εξαιτίας της δομής και

των αλλαγών που δέχονται σταδιακά στα δεδομένα τους διαθέτουν μία

εγγενή πολυπλοκότητα στην περιγραφή τους. Το παράδειγμα δεν έχει ως

σκοπό να δείξει τον τρόπο μετατροπής διασύνδεσης και δημοσίευσης των

δεδομένων, εφόσον έγινε διεξοδική ανάλυση αυτών στα προηγούμενα

κεφάλαια, και ως εκ τούτου θα αναλυθεί σε θεωρητική κυρίως βάση.

Για να αποφευχθεί η επανάληψη πληροφοριών με τα προηγούμενα

παραδείγματα θα εντοπίσουμε στα νέα στοιχεία που εμφανίζονται κατά

164 http://web.library.yale.edu/cataloging/workflow/sso

165

198

την ανάλυση. Κατά συνέπεια θα εστιάσουμε στην έννοια του μέρους

(part) και του συνόλου (whole). Επίσης δημιουργήθηκε “αναγωγή” της

βιβλιογραφικής εγγραφής του παραδείγματος της βρετανικής βιβλιοθήκης

στο ισπανικό μοντέλο. Στο τέλος του κεφαλαίου υπάρχει μία μικρή

ενότητα που αναφέρεται στους FRBR την οποία θεωρήσαμε χρήσιμο να

παραθέσουμε ως συνέχεια της ανάλυσης του παραδείγματος από το μοντέλο

της ισπανικής βιβλιοθήκης.

199

10.1 Επιλογή εγγραφής MARC21

Δημιουργήθηκε στους καταλόγους των δύο βιβλιοθηκών (της

ισπανικής και της βρετανικής) το ίδιο ερώτημα με τίτλο :”The

cambridge companion to medieval romance” των εκδόσεων “Cambridge

University Press”, μέρος των σειρών: “The Cambridge Companions to

Literature”-“The Cambridge Companion to Culture”. Η μεθοδολογία της

αναζήτησης έγινε με παρόμοιο τρόπο με αυτόν των προηγούμενων

παραδειγμάτων (βλ. Κεφάλαια 8 και 9).

10.1.1 Εφαρμογή παραδείγματος στις δύο βιβλιοθήκες

Η εγγραφή που επιλέχθηκε από τα αποτελέσματα του ερωτήματος στην

ισπανική βιβλιοθήκη εμφανίζεται σε MARC21 δομή στον παρακάτω πίνακα:

000 <am b0n a>

001 <bimo0001636083> {Control field}*

005 <20100512>

008 <010205s2000 xxk I eng>

016 #7$a bimoBNE20010044884$2SpMaBN

020 ##$a 0-52155687-2

035 ##$a (OCoLC) 318371960

040 ##$aSpMaBN$bspa$cSpMaBN$erdc

080 #0$a 82-146.2.09“11/14”

200

080 #0$a 82-392.09“11/14”

130 40$aThe Cambridge Companion to Medieval Romance

245 14$a The Cambridge Companion to Medieval Romance$h[texto impreso]$cedited by Roberta L.

Krueger

260 ##$a Cambridge$b Cambridge University Press$c 2000

300 ##$Axix, 290 p.$c 23 cm.

440 #0$a Cambridge Companion to Literature

504 ##$abibliografia:p. 267-279

650 #7$aRomances$xHistoria y critica$2embne

700 10$a Krueger, Roberta L.

Πίνακας 22. Οπτικοποίηση βιβλιογραφικής εγγραφής του παραδείγματος σε δομή MARC21απότην ισπανική βιβλιοθήκη

Το URI του manifestation της εγγραφής της ισπανικής βιβλιοθήκης

διαμορφώνεται ως εξής : *http://datos.bne.es/resource/bimo0001636083 και

αντιστοιχεί στην περιγραφή του manifestation.

201

Εικόνα 16. Περιγραφή και διασύνδεση του manifestation

Η περιγραφή του manifestation γίνεται με παρόμοιο τρόπο με τις

μεμονωμένες εκδόσεις. Από την περιγραφή, θα εστιάσουμε στα πεδία που

αφορούν το συνολικό τίτλο της σειράς ακολουθώντας την ίδια λογική των

προηγούμενων παραδειγμάτων.

Λεξιλόγιο Ετικέτα/Περιγραφή Αντιστοιχία με

MARC21

πεδία/Ορισμός

πεδίου

Τιμή URI

202

ISBD:P1026

έχει κύριο τίτλο σειράς ή πολυμερούς

βιβλιογραφικού πόρου/Αφορά έναν πόρο

που είναι σειρά ή πολυμερής πόρος

μονογραφίας στον κύριο τίτλο166

440/Δήλωση

σειράς-πρόσθετη

αναγραφή/$aΤίτλο

ς

Cambridge

Companion

to

Literature

http://

iflastandards.info/ns/

isbd/elements/P1026

ISBD:P1185

έχει μορφή περιεχομένου και δηλώνει

τον τύπο του μέσου167

245 Δήλωση

τίτλου/$hμέσο

[texto

impreso]

http://

iflastandards.info/ns/

isbd/elements/P11185

ISBD:P1045

έχει σημείωση/ Αφορά έναν πόρο σε μια

σημείωση των περιγραφικών πληροφοριών

που δεν έχουν δοθεί σε άλλους τομείς

της περιγραφής, αλλά θεωρούνται

σημαντικές για τους χρήστες των

βιβλιογραφικών εγγραφών (π.χ.

προσδιορισμός των σελίδων που

εμπεριέχεται η βιβλιογραφία) 168

504$a

Βιβλιογραφία

κ.λ.π.Σημείωση

bibliografi

a:p. 267-

279

http://

iflastandards.info/ns/

isbd/elements/P1045

ifla-frbr:C1003 Manifestation

Πίνακας 23. Ανάλυση ιδιοτήτων του manifestation της εικόνας 16

Αναζητώντας το ίδιο ερώτημα στον κατάλογο της βρετανικής

βιβλιοθήκης έχουμε τα αποτελέσματα που εμφανίζονται στον Πίνακα 24.

166

http://metadataregistry.org/schemaprop/show/id/1967.html

167 http://metadataregistry.org/schemaprop/show/id/2215.html

168 http://iflastandards.info/ns/isbd/elements/P1045203

FMT BK LDR <AM A2200277ua 4500>

001 <009410882> {Control field}

005 <20100512>

008 <001120s2000 enka 001 eng>

010 ##$a 99034240

015 ##$a GBA070256$2bnb

035 ##$a (OCoLC) 318371960

020 ##$a 0521553423 (cased):$c No price

020 ##$a 0521556872 (pbk):$c No price

040 ##$a DLC$ c DLC$ d UK

082 04$a 809.02$2 21

245 04$a The Cambridge Companion to Medieval Romance$c edited by Roberta L. Krueger14$a The

Cambridge Companion to Medieval Romance

260 ##$a Cambridge$b Cambridge University Press$c 2000

300 ##$a xix, 290 p.$b ill$c 23 cm.

490 0#$a Cambridge Companions to Culture

490 0#$a Cambridge Companions to Literature

504 ##$a Includes bibliographical references and index

650 #0$aRomances$xHistory and critisicm.

650 #0a Literature, Medieval$x History and criticism

700 1#$a Krueger, Roberta L.

852 41$a Bristih Library$b HMNTS$j YC.2000.A.12415

204

SYS < 009410882>

Πίνακας 24. Οπτικοποίηση βιβλιογραφικής εγγραφής του παραδείγματος σε δομή MARC21από τη βρετανικήβιβλιοθήκη

Το URI του πόρου σύμφωνα με τις προδιαγραφές της βρετανικής

βιβλιοθήκης διαμορφώνεται ως: http://bnb.data.bl.uk/doc/resource/009410882

205

Εικόνα 17. Οπτικοποίηση εγγραφής με συνδεδεμένα δεδομένα

206

Σύμφωνα με τα παραπάνω, η βρετανική βιβλιοθήκη (για το σχήμα

δεδομένων της βρετανικής βιβλιοθήκης-Σειρές βλ. Εικόνα 18.) για τη

μοντελοποίηση του “μέρους” χρησιμοποιεί τις ιδιότητες από την DCMI

ορολογία: “dcterms:Has Part”169 και “dcterms:IsPartOf”170:

dcterms:Haspart: Ένας σχετικός πόρος, ο οποίος συμπεριλαμβάνεται

είτε φυσικά είτε λογικά στον περιγραφόμενο πόρο.

dcterms:Ispartof. Ένας σχετικός πόρος, ο οποίος, συμπεριλαμβάνει

είτε φυσικά, είτε λογικά τον περιγραφόμενο πόρο.

Εικόνα 18. Σχήμα μοντέλου βρετανικής βιβλιοθήκης για τις σειριακές εκδόσεις

169 http://purl.org/dc/terms/hasPartOf

170 http://purl.org/dc/terms/isPartOf207

10.1.2 Εντοπισμός FRBR οντοτήτων στο μοντέλο της ισπανικής βιβλιοθήκης

130 $a The Cambridge Companion to Medieval Romance

(Ομοιόμορφος τίτλος ως τίτλος έργου)

883##$awork$2frbrgroup1

440 $a The Cambridge Companion to Literature

883##$awork$2frbrgroup1

Πίνακας 25. Περιγραφή μέρους (part) και συνόλου (whole) του έργου

Οι παραπάνω εγγραφές αντιστοιχούν σε δύο έργα, εκ των οποίων το

δεύτερο αποτελείται από πολλά ξεχωριστά έργα (μέρη). Τα δύο έργα

είναι ξεχωριστά μεταξύ τους. Το έργο 1 είναι μέρος (isPart) του έργου

2. Το έργο 2 έχει μέρος (hasPart) το έργο 1 και αποτελείται από πολλά

ξεχωριστά έργα (μέρη). Το έργο1 πραγματώνεται μέσω της έκφρασης:

008$ieng

245$hTexto Impreso

883##aexpression$2frbrgroup1

208

Έργο1:Μέρος (part)

Έργο2:Όλο (Whole)

Είναι μέρος του (is part of)

Έχει μέρος (has part)

Πίνακας 26. Περιγραφή της έκφρασης του έργου

Η έκφραση ενσωματώνεται στο manifestation με isbn:0-521-55687-2

10.1.3 Συμπεράσματα

Σύμφωνα με τα παραπάνω δεδομένα δημιουργήσαμε έναν συγκριτικό

πίνακα που αφορά την αντιστοίχηση των MARC21 πεδίων των

βιβλιογραφικών εγγραφών με τις αντίστοιχες ιδιότητες στα μοντέλα των

δύο βιβλιοθηκών προκειμένου να αναλύσουμε τη συμπεριφορά τους

περιγραφή και διασύνδεση των δεδομένων που αφορούν μία πολυμερή

μονογραφία. Η λογική της προσέγγισης που αφορούν τη μετατροπή σειριακώνεκδόσεων σε συνδεδεμένα δεδομένα είναι διαφορετική στα δύο μοντέλα.

Ισπανική βιβλιοθήκη Βρετανική βιβλιοθήκη

Πεδία marc21 Ιδιότητες μοντέλου ισπανικής

βιβλιοθήκης

Πεδία marc21 Ιδιότητες μοντέλου

βρετανικής βιβλιοθήκης

13040$a ISBD:P1004

24514$a$h$c ISBD:P1004/P1185/P1007 245 4 $a$c dct:title, c/dct:contributor

4400$a a/ISBD:P1026 490

0/$/rda:seriesState

ment

dct:IsPartof

504a a/ISBD:P1045 504a a/ISBD:P1045

209

Πίνακας 27. Συγκριτικός πίνακας αντιστοίχησης MARC21 σε RDF μεταξύ των δύο μοντέλων

Στο βρετανικό μοντέλο η δήλωση του τίτλου της σειράς αναφέρεται

στο πεδίο 490$a του MARC21 το οποίο αντιστοιχεί στην ιδιότητα

(IsPartOf), η οποία υποδηλώνει ότι ο περιγραφόμενος πόρος συμπεριλαμβάνεται

σε έναν άλλον πόρο ο οποίος συμπεριλαμβάνει (HasPartOf) τον

περιγραφόμενο πόρο. Υπάρχει αλληλένδετη σχέση μεταξύ των δύο αυτών

πόρων μέσω των παραπάνω δύο ιδιοτήτων IsPartOf και HasPartOf. Η

περιγραφή του κάθε πόρου, γίνεται μεμονωμένα αλλά με εμφανή τη σχέση

τους με το σύνολο των μερών, και της δήλωσης του τίτλου της σειράς.

Στο Ισπανικό Μοντέλo χρησιμοποιούνται τα πεδία MARC21 130$a

(ομοιόμορφος τίτλος) και 440$a, για να δηλώσουν τη σχέση της σειράς

με τη σχέση του μέρους (part) με το συνολικό έργο (whole).

Παρατηρείται, ότι στην περιγραφή του πόρου, δεν υπάρχουν αλληλένδετες

βιβλιογραφικές σχέσεις με τον τίτλο της σειράς όπως συμβαίνει στο

βρετανικό μοντέλο. Δεδομένης της χρήσης των παραπάνω πεδίων, γίνονται

διακριτές οι εκφράσεις των έργων. Οι σειριακές εκδόσεις, φαίνεται να

έχουν σχέσεις με τις εκφράσεις, τις εκδηλώσεις και τα αντίτυπά τους

και να αντιμετωπίζονται ως ξεχωριστές βιβλιογραφικές οντότητες

σχετιζόμενες με τις δικές τους εκφράσεις εκδηλώσεις και αντίτυπα.

Ένα συγκεκριμένο έργο θα πρέπει να αποτελεί έναν τίτλο, ο

οποίος θα πρέπει να αποτελείται από πολλές εκφράσεις εκδηλώσεις και

αντίτυπα. Μία έκφραση θα πρέπει να αποτελείται από όλες τις

διαφορετικές εκδηλώσεις, εγγραφές οι οποίες θα ομαδοποιούνται με

ομοιότητα. Ένα σύνολο εκφράσεων αποτελείται από τις εκδηλώσεις210

της σειράς που μοιράζονται το ίδιο περιεχόμενο και διαφέρουν μόνο στο

φυσικό τους φορέα.

10.2 Αναγωγή βρετανικής εγγραφής στο manifestation του ισπανικού μοντέλου

Για να πραγματοποιηθεί η αναγωγή της βρετανικής εγγραφής στο

manifestation του ισπανικού μοντέλου, χρησιμοποιήθηκαν οι αντίστοιχες

ιδιότητες από τα λεξιλόγια που το μοντέλο χρησιμοποιεί στην περιγραφή

του και δημιουργήθηκε η αντιστοιχία των οντοτήτων του FRBR μοντέλου.

Θα υποθέσουμε ότι το URI του manifestation, θα διαμορφωθεί ως

εξής: http://datos.bne.es/resource/bimo009410882. Αρχικά περιγράφουμε τα

βιβλιογραφικά δεδομένα της βρετανικής εγγραφής σε λεξιλόγιο ISBD. Η

περιγραφή συνεχίζεται με την αντιστοίχηση των δεδομένων με τις

ιδιότητες που δηλώνουν τις συσχετίσεις ανάμεσα στις οντότητες. Ας

υποθέσουμε ότι το manifestation είναι η ενσωμάτωση της έκφρασης με

URI: http://datos.bne.es/resource/ΧΧ009410882eng. Η έκφραση είναι η

πραγμάτωση του έργου με URI: http://datos.bne.es/resource/ΧΧΕΡΓΟ. Η

έκφραση ενσωματώνεται στο manifestation που είναι ενσωμάτωση της

έκφρασης, μαζί με άλλα manifestation που έχουν την ίδια έκφραση.

Με την περιγραφή στο ισπανικό μοντέλο της βρετανικής εγγραφής

δημιουργούνται περισσότερες οντότητες που αφορούν τη βιβλιογραφική

περιγραφή του πόρου και συσχετίζονται μεταξύ τους. Στο βρετανικό

μοντέλο δεν υπάρχει αυτή η αλληλένδετη σχέση μεταξύ των πόρων. Η

περιγραφή της βιβλιογραφικής εγγραφής στο λεξιλόγιο ISBD δημιουργεί

μία πιο αυστηρή δομή στην περιγραφή των δεδομένων μη έχοντας

211

εξωτερικές συνδέσεις ή ποικιλομορφία περιγραφών όπως συμβαίνει στο

βρετανικό μοντέλο. Η έκδοση δεν αποτελεί «γεγονός» και οι ιδιότητες

που την περιγράφουν δεν μπορούν να χρησιμοποιηθούν εκτεταμένα.

ISBD: P1004The Cambridge companion to medieval romance

ISBD:P1007edited by Roberta L. Krueger

ISBD: P1016Cambridge

ISBD:P10182000

ISBD:P1022XIX, 290 p.

ISBD: P102423cm

ISBD:P1026The Cambridge Companion to literature

ISBD:P1026The Cambridge Companion to culture

ISBD: P1045Includes bibliographical references and index

ISBD: P1117Cambridge University Press

ISBD: P11540521556872

ISBD: P1185[texto impreso]

Ifla-frbr:P2004: http:// / xx 009410882 engDcterms: language: http://www.lexvo.org/page/iso639-3/eng

Skos: notation809.02”2/21”

Rdf: type:IFLA-frbr:C1003

Ifla-frbr:P2002: http:// datos.bne.es/resource/ΧΧΈΡΓΟ

Ifla-frbr:P2003: http:// http://datos.bne.es/resource/bimo009410882

http://bnb.data.bl.uk/doc/resource/009413260

http://bnb.data.bl.uk/doc/resource/009410882

………………………………………………………………………………………………….(και άλλα)

DcTerms:Language: http://www.lexvo.org/page/iso639-3/eng

Rdf:type:ifla-frbr:c1002

212

Περιγραφή των βιβλιογραφικών δεδομένων της βρετανικής

βιβλιοθήκης με isbd λεξιλόγιο

Πίνακας 28. Αναγωγή βρετανικής εγγραφής στο ισπανικό μοντέλο

10.3 Σχέσεις μεταξύ έργων σύμφωνα με τους FRBR

Σύμφωνα με τους FRBR (5.3.1.1), υπάρχουν δύο κατηγορίες που αφορούν τις σχέσεις από

έργο σε έργο (work to work), και περιγράφονται με τον τύπο της σχέσης: Whole/Part has part →

← is part of

Relationship Type

Whole/Part has part → ←

is part of

Dependent Part

Chapter, Section, Part,

etc.

Volume/issue of serial

Intellectual part of a

multipart

work

Illustration for a text

Sound aspect of a film

Independent Part

Monograph in a series

Journal article

Intellectual part of a

multipart

work

Εικόνα 19. Relationship Whole/Part

Τα “μέρη”, τα οποία εξαρτώνται, συνήθως περιέχουν στοιχεία τα

οποία δεν είναι εύληπτα και είναι δύσκολο να αναγνωριστούν χωρίς την

αναφορά τους στο συνολικό μέρος και δεν περιέχουν ευδιάκριτα ονόματα

ή ευδιάκριτους τίτλους. Το συγκεκριμένο παράδειγμα (βλ. εικόνα) ,

αφορά ένα ανεξάρτητο μέρος ενός συνολικού μέρους εφόσον υπάρχουν213

διακριτά στοιχεία στις εγγραφές, ονομάτων και τίτλων. Υποθετικά το

συνολικό έργο είναι ένα ανεξάρτητο έργο.

Όπως αναφέρθηκε και παραπάνω το μέρος της μια σειράς,

αντιμετωπίζεται ως ξεχωριστή εκδήλωση. Κάθε αλλαγή στο πνευματικό ή

καλλιτεχνικό περιεχόμενο αποτελεί μία αλλαγή στην έκφραση. Αν το

μέρος μίας σειράς αναθεωρείται ή τροποποιείται η έκφραση η οποία

προκύπτει θεωρείται ότι είναι μια νέα έκφραση ανεξάρτητα από το πόσο

μικρή μπορεί να είναι η τροποποίηση. Στην πραγματικότητα, οι εγγραφές

δημιουργούνται σύμφωνα με τις τοπικές πολιτικές αντανακλώντας τις

ανάγκες των χρηστών σε διάφορα επίπεδα σύμφωνα με τους FRBR:

Συλλογής των έργων (Collection of Works)

Ανεξαρτήτου έργου (Idependent Work)

Στοιχείου ενός έργου (Element of a Work)

Οι FRBR παρουσιάζουν ρητά τις εννοιολογικές σχέσεις μεταξύ των

οντοτήτων και είναι επικεντρωμένοι στην εννοιολογική διάκρισή τους.

Σύμφωνα με τους FRBR (5.3.1.1), αναφέρεται ότι εντός της σχέσης

Σύνολο/Μέρος, υπάρχουν δύο κατηγορίες οι οποίες αφορούν τα μέρη ως:

Εξαρτημένα μέρη(Dependent parts) και ως

Ανεξάρτητα μέρη (Independent parts)

Τα εξαρτημένα μέρη είναι τα στοιχεία ενός έργου που

προορίζονται για να χρησιμοποιηθούν στο πλαίσιο ενός συνολικού έργου

το οποίο θα έχει μεγάλη σημασία στην κατανόηση του συνολικού έργου.

214

Τα εξαρτημένα μέρη δεν περιέχουν διακριτούς τίτλους και ονόματα και

κατά συνέπεια δεν μπορούν να αναγνωριστούν χωρίς να υπάρχει αναφορά

στο συνολικό έργο.

Τα ανεξάρτητα μέρη είναι εκείνα τα οποία δεν εξαρτώνται σε

σημαντικό βαθμό από το παρεχόμενο πλαίσιο του συνολικού έργου για τη

σημασία τους. Συνήθως τα ανεξάρτητα μέρη έχουν διακριτούς τίτλους και

διακριτά ονόματα. Υποτίθεται ότι και στις δύο περιπτώσεις το έργο που

αντιπροσωπεύει το σύνολο είναι ανεξάρτητο.

Το εξαρτημένο μέρος από μόνο του μπορεί να χωριστεί σε δύο

υποκατηγορίες:

Τμηματικά μέρη (segmental parts)

Συστημικά μέρη (systemic parts) του περιεχομένου ενός έργου

Τα τμηματικά μέρη είναι διακριτά στοιχεία ενός έργου του οποίου

το περιεχόμενο υπάρχει ως ξεχωριστό αναγνωρίσιμο τμήμα ενός συνόλου.

Κεφάλαιο 11

Επίλογος – Συμπεράσματα

Αναμφισβήτητα η εφαρμογή των νέων τεχνολογιών του σημασιολογικού

ιστού που καθιστά τη σύνδεση των δεδομένων και τη δημοσίευσή τους

σε υπηρεσίες υποστήριξης ανοιχτών δεδομένων, σηματοδοτεί μία νέα215

εποχή και μία νέα τάση εξελίξεων στο χώρο της επιστήμης της

πληροφόρησης. Από τη μία, η παραδοσιακή προσέγγιση της

βιβλιοθηκονομίας με τη στιβαρή υποδομή της στέκεται ως θεμελιώδης

βάση στις νέες αυτές προκλήσεις, από την άλλη οι γνώσεις που

καλείται πλέον να καλλιεργήσει ο επιστήμονας της πληροφόρησης

επεκτείνει τα όριά της, από τη δημιουργία καταλόγων στηριζόμενη σε

δοκιμασμένα επί δεκαετίες πρότυπα, στη χρήση εννοιολογικών μοντέλων

αναπαράστασης, γλώσσες σημασιολογικού ιστού και υπολογιστικών

συστημάτων με απώτερο στόχο τη βελτίωση και ανάπτυξη των νέων

τεχνολογιών προς όφελος των χρηστών.

Το νέο περιβάλλον τεχνολογιών του σημασιολογικού ιστού

αναπτύσσει τα δικά του συστήματα διαχείρισης μεταδεδομένων. Οι

βιβλιοθηκονομικές κοινότητες προκειμένου να μπορέσουν να συμβαδίσουν

με αυτά τα συστήματα και να επιτύχουν αποτελεσματική συνεργασία,

φαίνεται να υιοθετούν όλο και περισσότερες εναλλακτικές λύσεις πάνω

στις παραδοσιακές μορφές καταλογογράφησης. Το πρότυπο MARC

συμπληρώνοντας πενήντα χρόνια ζωής έχει ήδη παγκοσμίως δοκιμαστεί με

τα πλεονεκτήματα και μειονεκτήματα στις εγγραφές του. Παρόλη τη

συμβατότητά του με τη XML παρουσιάζει συσσώρευση στοιχείων και

δομικούς περιορισμούς που δύσκολα προσαρμόζονται στους κανόνες των

συνδεδεμένων δεδομένων.

Οι νέες νόρμες στην καταλογογράφηση απαιτούν, μεταξύ άλλων

περισσότερα ελεγχόμενα λεξιλόγια, συσχετίσεις, ευελιξία στις

καθιερωμένες αποδόσεις, συνδεδεμένα δεδομένα και χρήση URIs. Η

δημιουργία και η επέκταση των εννοιολογικών χρηστο-κεντρικών μοντέλων216

που περιγράφουν τα βιβλία ως περιεχόμενα και όχι ως αντικείμενα και

τα τυποποιημένα και ευρέως αποδεκτά λεξιλόγια από εγκεκριμένους

οργανισμούς τείνουν είναι αυτά τα οποία θα αποτελέσουν παγκόσμια

πρότυπα αρχιτεκτονικής μοντέλων συνδεδεμένων δεδομένων βιβλιοθηκών.

Διαμέσου των FRBR και του RDF αλλάζει ριζικά η λογική και η δομή

έκφρασης των μεταδεδομένων. Το FRBR παρέχει τη βάση για τους νέους

κανόνες καταλογογράφησης RDA. Το RDA χρησιμοποιεί την ορολογία του

μοντέλου, τα βασικά χαρακτηριστικά γνωρίσματα ως βάση για

συγκεκριμένα στοιχεία δεδομένων που θα περιλαμβάνονται στη

βιβλιογραφική εγγραφή καθορίζει τις σχέσης και χρησιμοποιεί τις

διεργασίες των χρηστών σαν βάση για τον καθορισμό ενός συνόλου

υποχρεωτικών στοιχείων μοντέλου δεδομένων.

Στην παρούσα εργασία εξετάσαμε τη προσέγγιση της ομάδας

“Ιncubator” για τη συμβολή της στην ανάπτυξη προδιαγραφών και

πρακτικών που αφορούν συνδεδεμένα δεδομένα βιβλιοθηκών. Οι

πρωτοβουλίες Εθνικών Βιβλιοθηκών, όπου τα μεταδεδομένα τους δεν

παράγονται πλέον αποκλειστικά από τις βιβλιοθήκες αλλά βρίσκονται σε

εμπορικές πλατφόρμες, εφαρμογές κοινωνικής δικτύωσης και άλλα μέσα,

στάθηκαν ως αφετηρία για τη σύνταξη των κατευθυντήριων γραμμών που

θεωρήθηκαν καινοτόμες για την άρτια δημοσίευση των δεδομένων των

βιβλιοθηκών στο σημασιολογικό ιστό και τη δημοσίευσή τους ως ανοιχτά.

Η IFLA και άλλοι οργανισμοί που εξειδικεύονται στο χώρο των

βιβλιοθηκών έχουν διαδραματίσει ήδη ένα πολύ σημαντικό ρόλο στην

ανάπτυξη λεξιλογίων και μοντέλων συμβατών με τις τεχνολογίες του

σημασιολογικού ιστού. Η περαιτέρω συνεισφορά από αυτούς τους217

οργανισμούς, η εξέλιξη, δημιουργία και προώθηση προτύπων και

επαγγελματικών πρακτικών σε ένα περιβάλλον συνδεδεμένων δεδομένων

μπορούν αυτόματα να δημιουργήσουν ένα εύνασμα για μία παγκόσμια

πρόταση προδιαγραφών συνδεδεμένων δεδομένων βιβλιοθηκών. H συμμετοχή

τους στο σημασιολογικό ιστό θα προσφέρει ποικίλλα οφέλη, παρέχοντας

βελτιωμένες υπηρεσίες προς τους χρήστες και αυξάνοντας την

αποδοτικότητα και την αποτελεσματικότητα των δεδομένων.

Συνεπώς είναι απαραίτητο οι βιβλιοθήκες να καταστήσουν τα

μεταδεδομένα τους δημόσια και ανακτήσιμα. Αν επιθυμούμε το άνοιγμα

των δεδομένων πρέπει να είμαστε απολύτως σίγουροι γιατί αυτό θα

ισχύει για πάντα.

ΒιβλιογραφίαΞενόγλωσση βιβλιογραφία

Aalberg, T. (2006). “A process and tool for the conversion of

MARC records to a normalized FRBR implementation”. IN:

Proceedings of the 9th international conference on Asian Digital

Libraries: achievements, Challenges and Opportunities. ICADL’06,

Berlin, Heidelberg, Springer-Verlag, pp. 283-292.

Bizer, C., Heath, T., Berners-Lee, T. (2009). Linked Data – The

Story so Far.

ΙΝ: International Journal on Semantic Web and Information

Systems (IJSWIS). Special Issue on Linked Data. Heath, T.,

Hepp, M., and Bizer, C. (eds.). 218

Διαθέσιμο στο: http :// linkeddata . org / docs / ijswis - special - issue .

Deliot, C, (2013) “Publishing the british national bibliography

as linked open data”. IN:CIG Event, Birmingham

Dimic, B. (2009). XML schema for UNIMARC and MARC2. ΙΝ:The

Electronic Library, vol.28 No.2, 2010, pp.245-262. Διαθέσιμο

στο: www.emeraldinsight/0264-0473.htm

Dunsire, G., Willer,M. (2011),"Standard library metadata models

and structures for the Semantic Web". IN: Library Hi Tech News,

Vol. 28, Iss 3, pp. 1 – 12. Διαθέσιμο στο:

http://dx.doi.org/10.1108/07419051111145118

“Fuctionals Requirements for Bibliographic Records: final

report,2009 (IFLA). Διαθέσιμο στο:

http://www.ifla.org/VII/s13/frbr/

Heath, T., Bizer, C. (2011). Linked Data: Evolving the Web into

a Global Data Space. IN:Synthesis Lectures on the Semantic Web:

Theory and Technology, 1:1, 1-136. Morgan & Claypoo (eds).

Διαθέσιμο στο:http://linkeddatabook.com/book.

Howarth, L. C.(2012). Frbr and linked data:connecting frbr and

linked data. IN: Cataloging & Classification Quarterly, 2012.

The Haworth Information Press (eds). Vol. 50, Issue: 5-7,

pp.763-776

.Διαθέσιμο στο: DOI:10.1080/01639374.2012.680835

219

Krier, L. ( 2012). Serials, FRBR, and Library Linked Data:

A WayForward.

ΙN: Journal of Library Metadata, 2012. Taylor & Francis (eds).

vol.12, Issue:2-3, pp.177-187

Διαθέσιμο στο:

http://www.tandfonline.com/doi/abs/10.1080/19386389.2012.699834?

journalCode=wjlm20

Library Linked Data Incubator Group (2011), W3C Incubator Group

Report 25 October 2011.Διαθέσιμο

στο: http://www.w3.org/2005/Incubator/lld/XGR-lld-20111025/).

Vila-Suero, D., Villazon-Terrazas, B., Gomez-Perez, A. (2012).

Datos.bne.es: a library Linked Dataset.IN: Semantic Web journal.

IOS Press (eds). Issue 1-6, pp. 1-7. Διαθέσιμο στο: http://www.semantic-web-journal.net/sites/default/files/iosart2c_0.pdf

Vila-Suero, D.Gomez-Perez, A. (2013) . "datos.bne.es and

MARiMbA: an insight into library linked data". IN: Library Hi

Tech, Vol. 31, Iss: 4, pp.575 – 601. Διαθέσιμο στο: http://dx.doi.org/10.1108/LHT-03-2013-0031

Ελληνική βιβλιογραφία

Άνθη – Καλοφωλιά, Έ. (2004). Αξιοπιστία και αποτελεσματικότητα

των ελληνικών καταλόγων: ασυνέπειες και λάθη στα αρχεία

καθιερωμένων ονομάτων. Στο: 13ο Πανελλήνιο Συνέδριο Ακαδημαϊκών

220

Βιβλιοθηκών. Κέρκυρα, 13-15 Οκτωβρίου 2004. Διαθέσιμο στο

http://www.ionio.gr/libconf/pdfs/Anthi.pdf.

Ζαπουνίδου, Σ. (2007). Μία θεωρητική προσέγγιση στις τεχνολογίες

του σημασιολογικού ιστού στο χώρο της πολιτισμικής πληροφορίας:

μια πρότυπη εφαρμογή στο χώρο της βιβλιοθηκονομίας. Έλλη-Άνθη

Καλοφωλιά (εκδ.). Στο: Μετα-βιβλιοθήκες: οι βιβλιοθήκες μετά το

διαδίκτυο και τον παγκόσμιο ιστό. Πρακτικά 13ου Πανελλήνιου

Ακαδημαϊκού Συνεδρίου Ακαδημαϊκών Βιβλιοθηκών (Ιόνιο

Πανεπιστήμιο, Κέρκυρα, 13-15 Οκτωβρίου 2004). Κέρκυρα: Ιόνιο

Πανεπιστήμιο, 13-15 Οκτωβρίου 2004

Κούης, Δ., Ευθυμίου,Φ., Μπράττης, Π., Τσιμπόγλου, Φ. και Πουλή,

Κ. (2007). Ελληνική βιβλιοθηκονομική κοινότητα και συλλογικοί

Κατάλογοι : Ευκαιρίες και προκλήσεις. Στο: 16ο Πανελλήνιο

Συνέδριο Ακαδημαϊκών Βιβλιοθηκών. Πειραιάς, 1-3 Οκτωβρίου 2007.

Διαθέσιμο στο http://eprints.rclis.org/12687. [Ημερομηνία

Πρόσβασης 08/02/2010].

Λεξικό Πληροφορικής της Microsoft. Κλειδάριθμος, 2004

Πεπονάκης, Μ. (2009-2010). Σύνθεση FRBR εγγραφών αξιοποιώντας

υπάρχουσες βιβλιογραφικές εγγραφές (FRBRization): ομαδοποίηση

σχετικών εγγραφών (clustering) και εμφάνισή τους σε on line

συστήματα: διπλωματική εργασία”, Ιόνιο Πανεπιστήμιο διαθέσιμο

στο: http://eprints.rclis.org/bitstream/10760/16674/1/Peponakis_FRBRization

_MSc_Thesis.pdf

221

Πεπονάκης, Μ.(2013). Libraries’ metadata as data in the era of

the semantic web: modeling a repository of master thesis and phd

dissertations for the web of data.IN: Journal of the Library

Metadata. Taylor&Francis(eds),13:330-348.

Διαθέσιμο στο: doi: 10.1080/19386389.2013.846618

Η Εθνική Βιβλιοθήκη της Βρετανίας “ανοίγει” εκατομμύρια

βιβλιογραφικές εγγραφές. (2010). Στο:Περιοδικό Έρευνα και

Καινοτομία.EKT (εκδ.), 10-11:σελ.16

Σφακάκης, Μ.(2010). Διαδικασίες βελτιστοποίησης

διαλειτουργικότητας κατανεμημένων πληροφοριακών συστημάτων

συμβατών με το πρωτόκολλο Z3950 και ολοκλήρωση βιβλιογραφικών

δεδομένων. Διδακτορική διατριβή, Τμήμα Αρχειονομίας

Βιβλιοθηκονομίας, Ιόνιο Πανεπιστήμιο.

Διαθέσιμο στο: http://dlib.ionio.gr/ptheses/Sfakakis_PhD.pdf

Χαριτούδη, Ε., “Libraries Now! – Inspiring, Surprising,

Empowering: εντυπώσεις από το 78ο συνέδριο της IFLA”,

Συνεργασία, αρ. 2/3 (Δεκέμβριος 2012)

Διαδυκτιακές Πηγές

http://www.w3.org/2005/Incubator/lld/

222

http://opendefinition.org

http :// www . w 3. org /2005/ Incubator / lld / XGR - lld - 20111025/# Benefits _ of _ the _ Linked _ Data _ Approach

http://www.w3.org/2005/Incubator/lld/XGR-lld-20111025/ #Benefits_to_librarians.2C_archivists.2C_and_curators

http://www.w3.org/2005/Incubator/lld/XGR-lld-20111025/ #Benefits_to_developers_and_vendors

http :// www . w 3. org /2005/ Incubator / lld / XGR - lld - 20111025/# The _ Current _ Situation

http://www.w3.org/2005/Incubator/lld/XGR-lld-20111025/# http://bnb.bl.ukAppendix_A:_An_inventory_of_existing_library_Linked_Data_resources

http://www.w3.org/2005/Incubator/lld/XGR-lld-20111025/ #Foster_a_discussion_about_Open_Data_and_rights

http://www.w3.org/2005/Incubator/lld/XGR-lld-20111025/ #Increase_library_participation_in_Semantic_Web_standardization

http :// www . w 3. org /2005/ Incubator / lld / XGR - lld - 20111025/# Design _ and _ test _ user _ services _ based _ on _ Linked _ Data _ capabilities

http://www.w3.org/2005/Incubator/lld/XGR-lld-20111025/ #For_data_and_systems_designers

http://www.w3.org/2005/Incubator/lld/XGR-lld-20111025/ #Preserve_Linked_Data_element_sets_and_value_vocabularies

http://www.ifla.org/about-the-isbd-review-group#origins http :// www . bne . es / es / Inicio / Perfiles / Bibliotecarios / DatosEnlazados / index . html

223

Alexander, K., Cyganiak Davis I. and Dodds, L. (2010). “Linked

Data Patterns”. Online resource

(http://patterns.dataincubator.org/book/).

224