Kurs:Unlock the Libraries LOD Einführung (2022)

Aus Wikiversity
Workshop Linked Open Data Einführung - Wikidata

Workshop der VÖB Arbeitsgruppe "Entwicklung Betriebsmodell für Linked Open Data im Österreichischen Bibliothekenverbund" im Rahmen der Reihe Unlock the Libraries LOD Workshop

Methoden

Workshop und Diskussion zum einfachen Editieren von Wikidata.

Termin

14. Juni 2022, 14-15.30 Uhr

Autor

Christian Erlinger, Scholia: (Q67173261), Open Data-Bibliografie

Aufzeichnung

Aufzeichnung online auf Phaidra

Folien
Präsentationsfolien „Wikidata ist für alle (Bibliotheken) offen“

Im Rahmen der von der Arbeitsgruppe "Entwicklung Betriebsmodell für Linked Open Data im Österreichischen Bibliothekenverbund" veranstalteten Reihe Unlock the Libraries[1] fand am 14. Juni 2022 ein Online-Workshop unter dem Titel "LOD Einführung" statt, der sich vorrangig mit Wikidata als "Linked Open Data"-Plattform und dem Editieren auf dieser Plattform befasste.

Präsentationsfolien „Wikidata ist für alle (Bibliotheken) offen“
Präsentationsfolien „Wikidata ist für alle (Bibliotheken) offen“

Wikidata[Bearbeiten]

Einen kompakten Überblick zu Wikidata bietet die Präsentation "Wikidata ist für alle (Bibliotheken) offen" (geringfügig adaptierte und auf den Stand Juni 2022 gebrachte Version der Präsentation erstmals gezeigt am Österr. Bibliothekartag 2019 in Graz)

Wikidata: Linked Open Data or not Linked Open Data?[Bearbeiten]

Aus einer orthodoxen Sicht auf "Linked Data" mag Wikidata verschiedene Kriterien von Linked Data nicht erfüllen. Dennoch kann der Datenbestand aus Wikidata gleich wie viel andere Datenbestände via SPARQL abgefragt werden und teilweise auch auf externe Ontologien gemachted werden. Für den Einsatzzweck in Bibliotheken spricht aber dennoch sehr viel, allen voran die Offenheit der Kooperation wie der Daten.

Datenmodell[Bearbeiten]

Wikidata besteht aus einer Sammlung an Items (identifiziert mit der QID). Diese Items werden durch multilinguale Labels, Beschreibungen (descriptions) und Verweisformen (alias) näher definiert.

Die weitere (verlinkte) Beschreibung eines Items erfolgt durch Tripel: Subject_Item - Property - Object_Item

Beispiel: Q2 (Erde)P610 (hat einen höchsten Punkt)Q513 (Mt. Everest)

Ein Tripel kann durch zusätzliche Angabe von Qualifiers (weiteren Properties) näher spezifiziert werden. (Beispielsweise kann die Gütligkeitsdauer oder der Zeitpunkt einer Aussage dadurch angegeben werden - Beispiel Literaturpreis oder Angabe des Archivs mit genauer Fundstelle/Signatur

Um die Überprüfbarkeit einer Aussage zu ermöglichen, kann jedes Statement noch mit References belegt werden. Dies kann bspw. durch eine Reference URL oder durch Verweis auf eine andere Quelle nachgewiesen in erfolgen.

Workshop[Bearbeiten]

Die folgenden Absätze bieten einen Rückblick auf die Inhalte des 90-minütigen Workshops. Sie orientieren sich an dem praktisch durchgeführten, aber auch an den in der Diskussion und im Chat gestellten Fragen.

„Wie steige ich am besten ein, wo und wie fange ich an?“[Bearbeiten]

  • Wikidata lässt sich auch anonym editieren, dennoch ist es empfehlenswert, zuvor einen Wikimedia-User anzulegen. Der Benutzer ermöglicht nicht nur das Editieren in allen Projekten mit gemeinsamer Historie, sondern zahlreiche Features die das Editieren erleichtern bzw. erweitern, sind nur mit Benutzeraccount möglich.
  • „Suche dir ein fertiges Beispiel und mache es nach.“ Learning by doing - durch das Ansehen von existierenden Items kann viel gelernt werden, wie das Datenmodell aussieht, welche Properties es gibt usw.
  • WikiProjects befassen sich mit Teilgebieten in Wikidata, bieten Diskussionsplattform und Hilfestellung. Datenmodelle für einzelne Objektarten werden hier diskutiert und dokumentiert. Eine Auswahl:

Übung: Neue Wikidata-Items für Personen mit GND-ID[Bearbeiten]

Eine GND-Recherche via der Plattform lobid.org/gnd ermöglicht sehr schöne Abfragen der Normdatei. Bsp.: Alle Datensätze mit einer Affiliation zur Universität Wien ohne Wikidata-ID: Abfrage. Als Ergebnis bekommen wir etwas mehr als 600 Personen-Datensätze.

  • Lobid zeigt die Wikidata-Verknüpfung von bestehenden GND-IDs über den DNB-Dienst Entity Facts an.
    • Achtung: Datenübernahme aus EntityFacts nach Lobid passieren nur unregelmässig, d.h. es kann in Wikidata bereits ein Datensatz für diese GND-ID existieren oder - noch wahrscheinlicher - es existiert ein Datensatz für das beschriebene Konzept aber die GND-ID ist in Wikidata noch nicht eingetragen. Daher vor dem Anlegen eines neuen Items aus der obigen Liste, immer via Recherche in Wikidata überprüfen, ob nicht doch ein Item existiert.
  • Create a new Item: Ein neues Datenobjekt kann in Wikidata über die Erfassungsmaske angelegt werden. Jedem Item soll bzw. kann hier ein Label (rdfs:label), eine Description (schema:description) und alternative Namen (skos:altLabel) angegeben werden, nach Anlage wird die Seite auf die neue Seite des Items weitergeleitet werden.
  • Hinzufügen weiterer Labels und anderssprachiger Descriptions
  • Hinzufügen der Wikidata-Statements:
    • P31 - instance of -> Q5 - Mensch
    • given Name -> Vorname als verlinktes Item
    • family name -> Nachmame als verlinktes Item
    • gender, date/place of birth, date/place of death.
    • affiliation, employer, educated at
    • language spoken/written
    • Country of Citizenship
    • GND-ID, VIAF, LCCN, ORCID, ...
  • biographische Statements mit einer Reference-Node zur GND-ID belegen.

Weitere Fragen aus dem Kurs[Bearbeiten]

  • Wo befinden sich Statistiken über die Verteilung von Klassen in allen Wikidata-Items?
  • Bei der Suche, ich habe die Vermutung, dass die Vorschläge sich allein aus dem Label speisen und man genau das eintragen muss, was da drinn steht. Stimmt das?
    • Textuelle Suche in Wikidata-Suchfeldern speisen sich zumeist aus allen textuellen Werten eines Items, vorrangig natürlich aus dem Label, aber auch Description und Alias werden berücksichtigt. Das AutoComplete fokussiert aber auf das Label. Wichtig ist dabei auch die jeweilige Spracheinstellung im Frontend zu beachten. Es wird nämlich jene Labels bevorzugt, die in dem Labelfeld korrespondiernd zur gewählten Frontend-Sprache gespeichert sind. Das führt insbesonders bei der Suche nach abstrakten Konzepten dazu, dass wenn bspw. in deutsch gesucht wird, das Frontend aber auf Englisch eingestellt ist, vorrangig Elemente gezeigt werden, die den Begriff auch im englischen beinhalten (bspw. bei Werken) aber nicht das Abstraktum selbst, da dies dann für gewöhnlich ein natives englisches Label besitzt. (Das gleiche gilt auch für die Recherche nach Porperties beim Anlegen - immer auf die eingestellte Sprache achten, und dies bei "merkwürdigen" Suchergebnissen im AutoComplete beachten)
  • Wie stelle ich sicher, dass ich eine Person finde, wenn ich z.B. eine Schreibvariante habe?
    • Auch hier gilt insbesonders die Spracheinstellungen zu beachten und sich vor allem nicht vom AutoComplete der Suche zu sehr beeinflussen zu lassen. Lieber das Suchergebnis etwas durchsuchen nach passenden Ergebnissen.
  • Was passiert, wenn eine Dublette dennoch erzeugt wurde?
    • Dubletten lassen sich in Wikidata sehr einfach durch "Merge" zusammenführen. Hierfür ist es notwendig, ein registrierter User zu sein und über Einstellungen -> Gadgetes -> merge.js zu aktivieren. Dann besitzt man in der Navigationsleiste neben der Suchbar einen Link "More/Weiteres" wo sich die merge-Funktion versteckt.
  • Kann man auch über die GND suchen?
    • Die GND-ID ist gleich allen anderen String-Werten eines Items im Suchindex vorhanden. D.h. eine einfache Suche nach einer GND-ID führt, wenn vorhanden, zu einem Ergebnis (bitte nicht vom AutoComplete verwirren lassen): 13281899X
    • Wikidata erlaubt auch eine Spezialsuche in einer direkten Propety, d.h. in einem speziell für eine Property angelegtes Indexfeld mit folgender Syntax: haswbstatement:P227=13281899X
  • Gibt es bei Wikidata auch Relevanzkriterien wie bei Wikipedia?
    • Es gibt auch in Wikidata Notability Criteria: d:Wikidata:Notability diese sind aber um ein vielfaches "inklusiver" als jene der deWikipedia.
  • Wikidata ist sozusagen eine leicht editierbare DB für Personen, Werke, usw., um dann über die Q-ID darauf referenzieren zu können. Wenn ich einen neuen Eintrag angelegt habe, wird dieser noch einmal geprüft und nach ca. 2 Wochen ist der Eintrag dann dauerhaft, wenn kein Widerspruch kommt. Vorteil gegenüber z.B. der GND: GND kann man nicht einfach editieren, geht nur über Agenturen
    • Wikidata ist in der Tat eine leicht und offen zugängliche und editierbare Datenbank für eigentlich _alles_ und somit jede Form des Wissens. Wenn ein Item angelegt wurde, ist dieses sofort referenzierbar. Eine "Wartefrist" gibt es nur für Properties, d.h. neue Eigenschaften. Auch diese werden von der Community "erzeugt". Um eine neue Eigenschaft (zB zur Verlinkung mit einer externen Datenbank) anzulegen, muss die Idee für die Eigenschaft mit einem stuktruierten Proposal vorgeschlagen werden: d:Wikidata:Property proposal, wenn innert 10 Tagen kein Widerspruch sondern genug Support kommt, kann die Eigenschaft von dafür berechtigten Usern angelegt werden.
  • Wann werden die Personen, für die man Wikidata-Einträge erstellt hat, in der vorgefilterten lobid-liste aktualisiert, d.h. herausgenommen? = Bekommt der GND Datensatz automatisch auch den Link zu Wikidata oder wird das immer manuell eingetragen???
    • Das Wikidata-GND-Mapping in Lobid stammt aus EntityFacts und passiert nur unregelmässig, d.h. es kann in Wikidata bereits ein Datensatz für diese GND-ID existieren oder - noch wahrscheinlicher - es existiert ein Datensatz für das beschriebene Konzept aber die GND-ID ist in Wikidata noch nicht eingetragen. Daher vor dem Anlegen eines neuen Items aus der obigen Liste, immer via Recherche in Wikidata überprüfen, ob nicht doch ein Item existiert.
  • Wie kann man eigentlich Einträge [Statements] innerhalb sortieren? Also wenn man Einträge unter "employer" nicht chronologisch eingegeben hat. Die Elemente lassen sich ja nicht verschieben, oder?
  • Wie wird das Tool QuickPresets implementiert?

Wikidata abfragen[Bearbeiten]

Um Abfragen nach Wikidata stellen zu können, muss der SPARQL-Endpoint query.wikidata.org bedient werden.

Ergebnisse (Auswahl)[Bearbeiten]

Während es Workshops wurden folgende Items neu angelegt bzw. bearbeitet:

Weblinks[Bearbeiten]

Einzelnachweise[Bearbeiten]

  1. Unlock the Libraries, abgerufen am 15. Juni 2022