Christian Erlinger

Linked Data für Bildrepositorien: „Structured Data on [Wikimedia] Commons“
(18:37 min)

Christian Erlinger (Dipl.-Ing. Mag. phil.) arbeitet als Systembibliothekar bei den Büchereien der Stadt Wien, ist Wikidata-Enthusiast und vermittelt im GLAM-Bereich die Anwendbarkeit und den Nutzen offener Daten und Plattformen wie Wikidata. Das Institut für Sächsische Geschichte und Volkskunde unterstützt er in der Verlinkung des Historischen Ortsverzeichnisses mit Wikidata.

2 Antworten auf „Christian Erlinger“

  1. Lieber Herr Erlinger, ein toller Vortrag, der noch einmal völlig anders geartete Fragen aufwirft und vor allem weitreichende Erschließungs-, Nutzungs- und Auswertungsmöglichkeiten eröffnet – und insbesondere den Wert von (Erschließungs)Daten deutlich macht. Zumal das „Wiki-System“ auch unsere gängige Auffassung von Sammeln, Bewahren und Zugänglichmachen in Kultureinrichtungen hinterfragt. Hätten Sie vielleicht noch ein paar Beispiele, die einerseits Bildmedien mit „schönen“ Daten und andererseits das Potential der Nutzung zeigen, also eine kreative Suche?

    1. Liebe Frau Kulbe, vielen Dank für Ihren Kommentar und die Frage!
      Die Veröffentlichung von Materialien aus Gedächtnisinstitutionen aller Art im Wiki*Versum erlaubt jedenfalls unzweifelhaft die Sichtbarkeit und Auffindbarkeit der vielfältigen Bestände zu erhöhen und leistet dabei einen nicht zu unterschätzenden Beitrag zum Aufbau einer freien und offenen Wissensgesellschaft.
      Die „klassische“ Erschließung von Mediendateien auf Wikimedia Commons war bislang rein textuell nach Wiki-internen Strukturen und mithilfe des zwar prinzipiell durchdachten aber tlw etwas starren und in der Recherche limitierenden Kategoriensystems. Die Rückgriff auf die rdf-Datenstruktur von Wikidata zur Beschreibung von Medien erlaubt es nun auf Commons mit völlig neuen Mitteln hochwertige Metadaten zu erzeugen. Der Vorteil dieses Datenschemas ist ein mehrfacher:
      – Datenfelder wie Inhalte sind automatisch mehrsprachig verfügbar (im Gegensatz zum dominant englischsprachigen Vorgehen in Commons bis dato)
      – Die Flexibilität des Datenmodells erlaubt die Erschließung nach Detailaspekten, die den jeweiligen Medien oder Sammlungen innewohnen mögen und die in oft streng regelkonformen Erschließungssystemen nur unzureichend erfasst werden können.
      – Gleichzeitig erlaubt die Flexibilität des Datenmodells aber auch ein möglichst exaktes Matching zu herkömmlichen oder lokalen Archiv- und Bibliothekssystemen, wodurch ein Datenaustausch gewährleistet werden kann. Dies geschieht einerseits über ein ontologisches Mapping der Feldeigenschaften zu den klassischen Feldtypen und andererseits durch Verlinkung von Konzepten in Wikidata mittels externer Identifikatoren in Lokalsysteme.
      Für die Medienerschließung mit Structured Data on Commons ist noch vieles im Fluss, insbesondere in der Konsensfindung eines möglichst leicht verständlichen und nutzbaren Datenmodells. Als einfaches Beispiel dabei sei die Unterscheidung im Datenmodell zwischen einem originär physischen Bild, welches gescannt auf Commons geladen wird, oder einem nativ digitalen Bild. Während bei letzterem der/die Urheber*in des Digitalbildes unzweifelhaft der/die Fotograf*in sein wird, so ist bei ersterem der/die eigentliche Urheber*in jene*r, der/die das Digitalisat angefertigt hat. Die Verknüpfung des Digitalisats zum Original erfolgt dann rein auf Datenebene mittels der Verknüpfung „digitales Abbild von“ – „Originalitem“ (an deren Stelle der/die Werk-Urheber*in verknüpft wird). Als illustratives Beispiel sei hier das Digitalisat des Gemäldes „Winckelmann im Kreise der Gelehrten“ von Theobald von Oër angeführt.
      Dieses Beispiel illustriert auch hervorragend den Einsatz des „depicts“-Statements in den Structured Data on Commons. Die inhaltliche Erschließung des Gemäldes zielt beispielsweise darauf, die auf dem Gemälde versammelten Gelehrten zu identifizieren, mit ihren korrespondierenden Wikidata-Items zu verknüpfen und ihnen auch mit Hilfe eines speziellen Online-Tools den exakten Platz im Gemälde zuzuweisen, was beispielsweise maschinelle Auswertungen oder Ausschnitte des Gemäldes ermöglicht. Durch die Verknüpfung des Gemäldes mit dem „Gelehrtenkreis“ lassen sich beispielsweise Abfragen auf Basis der biographischen Daten erstellen, ob ein solches Treffen überhaupt zeitlich hätte stattfinden können. (Matthias Erfurth und Jens Bemme) Die dort gezeigten Abfragen basieren allerdings rein auf der umfassenden Erschließung des Werkes auf Wikidata. Eine derartige Auswertung nur mit den Structured Data on Commons ist technologisch, aufgrund des noch in Entwicklung befindlichen Abfrage-Services, noch nicht möglich.
      Eine Recherche nach Motiv-Elementen in den Structured Data ist allerdings, mit einer etwas gewöhnungsbedürftigen Syntax über die wiki-interne Suche möglich. Durch Eingabe von „haswbstatement:P180=Q8738“ werden alle Bilder auf Commons angezeigt, denen im Motiv-Statement (P180) die Stadt Meißen (Q8738) verlinkt ist. Diese Abfragesyntax kann für jedes andere Datenfeld angepasst werden, bspw. für die Suche nach Verlagen: „haswbstatement:P123=Q14548670“ (Bilder des Verlages Brück & Sohn). Die Syntax lässt sich auch kombinieren: Abfrage von Bildern des Verlages Brück&Sohn mit Motiv Meißen.
      Vor allem für maschinenbasierte Abfrage- und Darstellungsvarianten ist die derzeitige Suchmöglichkeit nutzbar, für die menschliche Interaktion eher weniger. Eine erste Applikation, die spielerisch mit diesen Elementen eine Recherche in Wikimedia Commons darzustellen versucht, ist „Structured Search“ von Hay Kranen, damit lassen sich die zuvor gezeigten Recherche-Codes mittels eines einfachen Formulars erstellen, kombinieren und mit klassischen Commons-Recherchen (Text-/Kategorien) ergänzen: (Suche nach Bildern von Brück, die Meißen und einen Mann zeigen).
      Die Nutzbarkeit der Structured Data on Commons wird letztlich durch eine elaborierte Abfragbarkeit der rdf-Daten mittels SPARQL im Idealfall mit integraler Verbindung zu Wikidata, um somit auch durch die dortige Taxonomie quer suchen zu können, an Relevanz zulegen und somit auch für potentielle datenbereitstellende Institutionen an Bedeutung gewinnen.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.