Jakob Voß
Semantic Web und FRBR Digitale Bibliothek WS 2008/2009 Digitale Bibliothek Fachhochschule Hannover Informationsmanagement (BA) 20. Oktober 2008
Die Inhalte dieser Präsentation stehen (sofern nicht weiter angegeben) von Jakob Voß freigegeben unter der Creative Commons Attribution-Share Alike 3.0 Unported Lizenz.
Grundidee –
Computer sollen „verstehen“
–
Heterogene Daten weltweit vernetzen
–
–
Logische Beschreibung mit Regeln und automatischen Schlussfolgerungen Weniger „Semantik“ als „Verknüpfung von Daten“
Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement
Erste Voraussetzung: URIs als Identifikatoren
Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement
Identifikatoren in Bibliotheken –
Verlags-IDs (ISSN, ISBN, DOI...)
–
Datensatz-IDs im Katalog (z.B. PPN)
–
Sigel, ISIL, MARC-Codes für Einrichtungen
–
Notationen einer Klassifikation (z.B. RVK)
–
Nummer von Normdateien (z.B. PND, GKD...)
–
Signaturen von Büchern
–
Frage: Was genau wird jeweils identifiziert?
Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement
URIs als Identifikatoren –
–
Uniform Resource Identifier –
unabhängig vom Zugriffsmechanismus
–
jede mögliche Art von Resource
–
weltweit eindeutig, hierarchisches System
Allgemeine Syntax: schema:identifier –
http://...
URL
–
info:isbn:... info-URI
–
urn:...
–
...
URN
Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement
URI, IRI, URN, URL... –
URN und URL sind Teilmengen von URI
–
IRI: Internationalisierte URI (Unicode)
–
Im Semantic Web wird jedes Objekt durch (mindestens) eine URI identifiziert
–
Einfache Variante: Permalinks
–
Mehr als Technik: Commitment
–
Identifikation != Definition der Bedeutung
Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement
Zweite Voraussetzung: RDF als gemeinsames Daten(meta)modell
Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement
Resource Description Framework RDF = URI + Unicode + Tripel (+ Regeln) = „Semantik“
Subjekt
Prädikat
Objekt
Prädikat "Literal"@lang
Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement
RDF-Beispiel Abkürzung von URIs durch Namensräume @prefix skos: . @prefix agro: .
agro:c385
rdf:type
skos:Concept
skos:prefLabel "Ananas"@de
Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement
Feldbasiertes Format –
–
Einfache Daten –
Titel : Zettelwirtschaft
–
Autor : Krajewski, Markus
Pica+ –
021A : –
–
a : Zettelwirtschaft
028A : –
d : Markus
–
a : Krajeski
Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement
Abbildung nach RDF –
Statt Feldern werden URIs verwendet –
021A$a => http://purl.org/dc/elements/1.1/title
–
028A$d => http://xmlns.com/foaf/0.1/fir stN ame
–
028A$a => http://xmlns.com/foaf/0.1/secondN ame
Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement
Abbildung nach RDF –
Alle Objekte erhalten eine eigene URI –
Das Buch: http://dnb.info/96327841X
–
Die Person: http://dnb.info/gnd/13150794X
–
Verknüpfung von Semantischen Entitäten –
http://purl.org/dc/elements/1.1/title
–
http://purl.org/dc/elements/1.1/cr eat or
–
http://xmlns.com/foaf/0.1/fir stN ame
–
http://xmlns.com/foaf/0.1/secondN ame
Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement
RDF-basiertes Format @prefix foaf . @prefix dc . dc:title "Zettelwirtschaft" ; dc:creator .
N3
foaf:firstName "Markus" ; foaf:secondName "Krajeski" .
http://d-nb.info/96327841X
dc:title
Zettelwirtschaft
dc:creator foaf:firstName http://d-nb.info/gnd/13150794X foaf:secondName Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement
Graph Markus Krajewski
Kodierung als RDF/XML Zettelwirtschaft Markus Krajewski
Erste Version: 2001, aktuelle Version: 2004 Ein Hinderungsgrund des Semantic Web Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement
Cool URIs for the Semantic Web http://example.com/xy z ID Accept: application/rdf+xml
303 redirect
RDF http://example.com/xy z.rdf
HTML http://example.com/xy z. htm l
Menschenlesbare und Maschinenlesbare Informationen unter einer URI
Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement
Linked Data – –
–
–
Benutze URIs, um Objekte zu identifizieren. Benutze HTTP URIs, so dass Objekte nachgeschlagen werden können. Wenn jemand eine URI nachschlägt, stelle zweckdienliche Informationen bereit. Biete Links zu anderen URIs, so dass weitere Objekte nachgeschlagen werden können. Tim Berners Lee (2006): Linked Data Design Issues http://www.w3.org/DesignIssues/LinkedData.html
Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement
–
–
Initiative, um offene Datensammlungen in RDF verlinkt im Web zugänglich zu machen Eine der größten Datensammlungen dabei: –
DBpedia (http://dbpedia.org)
–
Daten erzeugt aus Wikipedia
Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement
Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement
LOD-Wachstum
Mai 2007
Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement
September 2008
Bild: Comuter History Museum
Once upon a time...
Das ARPANET 1969 Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement
Bibliotheksdaten ins Semantic Web bringen! –
–
–
Vorhandene Identifikatoren in (HTTP) URIs umwandeln Vorhandene Datenformate auf RDF und Ontologien abbilden Daten als „Linked Open Data“ verfügbar machen
Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement
z.B. Normdateien –
URIs für August Strindberg –
http://dbpedia.org/page/August_Strindberg
–
http://libris.kb.se/resource/auth/94541
–
http://d-nb.info/gnd/118619314
–
...
–
Mehr Verknüpfungen bitte!
–
Gleiche Objekte kombiniert mit owl:sameAs
Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement
Weitere Bestandteile: Ontologien, Schlussfolgerung, Abfragen, Anwendungen...
Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement
Komplexere Anfragen –
Beispiele: –
Filme, deren Musik jemand gemacht hat, der im Jahr 1965 geboren wurde
–
Bücher, deren Autor gleichzeitig Thema des Buches ist
–
Formulierung in SPARQL („SQL für RDF“)
–
Besser: Anfrage zusammenklicken
Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement
Beispielanfrage Filme, deren Musik jemand gemacht hat, der im Jahr 1965 geboren wurde?
?
music
? born
1965
„Dancer in the Dark“
music
„Björk“ born
Problem: Die Prädikate „music“ (hat-darin-Musikgemacht) und „born“ (ist-geboren-im-Jahr) müssen bekannt und einheitlich verwendet werden! Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement
1965
Vernüpfungen versch. Quellen OPAC Buch über Björk
dc:subject
PND:119525054 owl:sameAs
Dancer in the Dark
dc:creator
DBpedia
Björk dbpedia:birthYear
1965 Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement
Beispielanfrage und Daten RDF-Daten von http://libris.kb.se/resource/auth/94541:
dc:subject
kb:bib/5761604
kb:auth/94541 dc:creator
–
Sollte eine Autobiographie sein (ist aber nicht)
–
Vermeidung von Redundanzen
–
Anfragen zur Verbesserung der Qualität
Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement
Ontologien –
Spezifizieren, welche Prädikate möglich sind
–
Spezifizieren Objekttypen (Klassen)
–
–
–
Ermöglichen, Spezielles auf Einfaches abzubilden Geben zusätzliche Regeln an zur –
Schlussfolgerung (Inferenz)
–
Integrität (Validierung)
„Datenformate“ für das Semantic Web
Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement
Schlussfolgerungsregeln –
Wenn ... dann auch ...
–
A frbr:creator B => B rdf:type frbr:Work
–
Vorsicht, explosiv! –
Gefahr von vorschnellen Verallgemeinerungen!
–
Siehe –
–
Bowker and Star (1999): Sorting Things out. Classification and its consequences Voss (2007): The Semantic Web and why Wikipedia should bother.
Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement
Functional Requirements for Bibliographic Records (FRBR) –
Abstraktes Datenmodell für bibliographische Informationen
–
1998 von der IFLA verabschiedet
–
http://www.ifla.org/VII/s13/frbr/frbr.htm
–
Drei Gruppen von Entitäten 1) Work, Expression, Manifestation, Item 2) Person, CorporateBody 3) Concept, Event, Object, Place
Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement
Semantic FRBR –
Vom abstrakten Datenmodell zur Ontologie
–
Seit 1998 : IFLA verschläft Webstandards? –
keine Bezugnahme auf W3C, RFC...
–
keine Implementierung
–
fehlender technischer Sachverstand?
–
2004: erster Versuch von FRBR in RDF
–
2005: zweiter Versuch (IFLA-unabhängig)
Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement
FRBR – Gruppe 1 Entitäten Work
Expression
–
–
Manifestation
–
Item
–
Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement
Romeo und Julia Erste gedruckte Fassung Erstauflage Exemplar in der British Library
FRBR – Gruppe 1 Entitäten Work
–
Romeo und Julia
–
der Film mit di Caprio
Manifestation
–
DVD-Version
Item
–
Expression
Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement
Exemplar in Stadtbücherei
FRBR – Gruppe 1 Entitäten Work
–
Romeo und Julia
–
der Film mit di Caprio
–
deutsche Fassung
Manifestation
–
TV-Ausstrahlung
Item
–
Auf Video mitgeschnitten
Expression
Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement
FRBR – Gruppe 1 Attribute Work
–
Titel, Datum...
Expression
–
Sprache, Umfang...
Manifestation
–
Herausgeber, Ort...
Item
Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement
–
Anmerkungen, Provenienz...
FRBR-Entitäten in Bibliotheken Work xISBN thingISBN ...
Verfügbarkeitsrecherche
Expression
Bisherige Kataloge
Manifestation Digitalisierung
Item
Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement
FRBR – Gruppe 1 Relationen 1/4 Work realization
realizationOf
Expression embodiment
embodimentOf
Manifestation exemplar
exemplarOf
Item
Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement
FRBR – Gruppe 1 Relationen 2/4 Endeavour Work
relatedEndeavour
Expression
part
relatedEndeavour partOf
Manifestation
Item
Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement
FRBR – Gruppe 1 Relationen 3/4 Work
subject
abridgement revision translation
Expression
abridgementOf revisionOf translationOf
alternate arrangement
Manifestation
alternateOf arrangementOf
reconfiguration
Item
Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement
reconfigurationOf
FRBR – Gruppe 1 Relationen 4/4 adaption complement imitation successor summarization supplement transformation
Work
Expression
adaptionOf complementOf imitationOf successorOf summarizationOf supplementOf transformationOf
Manifestation reproduction
reproductionOf
Item
Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement
FRBR – Gruppe 2 Entitäten und Attribute
ResponsibleEntity –
Name, Titel...
–
Name, Ort...
Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement
Person CorporateBody
FRBR – Gruppe 2 Relationen responsibleEntity responsibleEntityOf
Work
creator creatorOf
ResponsibleEntity Expression
Manifestation
Item
realizer realizerOf
Person
producer producerOf owner ownerOf
Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement
CorporateBody
FRBR – Gruppe 3 Entitäten und Relation
Work
subject
Subject Concept
Place
Event
Object
ResponsibleEntity Endeavour
Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement
FRBR – Gruppe 3 Entitäten und Relation
Work
subject
dc:subject
skos:Concept
besser (auch) auf SKOS zurückgreifen! Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement
Subject Concept
Place
Event
Object
ResponsibleEntity Endeavour
Wo wird FRBR benötigt? –
– –
Ergebnisse von Bennett et al. (2003): –
Werk hat durchnittlich 1,5 Manifestationen
–
78% aller Werke haben nur eine Manifestation
–
99% aller Werke in WorldCat haben <= 7
–
Nur 30.000 (~1%) haben mehr als 20
Aber: die populären Fälle haben mehr! Gute Interfaces für einfache und umfangreiche Fälle erforderlich!
Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement
Weiteres FRBR-Beispiel Brema [ca. 1750]. Matthäus Seutter (1678-1756) Tobias Conrad Lotter (1717-1777)
Work
Vorzeichnung
Expression Kupferstich
Manifestation
Item
Weimar
Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement
Bremen
Digitalisat
Thumbnail
Weiteres FRBR-Beispiel Brema [ca. 1750]. Matthäus Seutter (1678-1756) Tobias Conrad Lotter (1717-1777)
Work
Kupferstich
Expression Kolorierungen
Manifestation
Item
Weimar
Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement
Bremen
Digitalisat
Thumbnail
Probleme des Semantic Web –
Daten und Anwendungen (Henne-Ei)
–
Visualisierung und Anfrageformulierung
–
Datenqualität
–
–
Unvollständige Daten
–
Unterschiedliche Interpretationen
–
Widersprüche
–
Nicht zu unterschätzen!
Semantik vs. Pragmatik (Theorie & Praxis)
Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement
Dankeschön & auf Wiedersehen!
Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement