Zum Inhalt springen

Handbuch Wikidata

Aus Wikiversity

Dieses Handbuch entstand während einer Lehrveranstaltung von Ina Blümel im Studiengang Informationsmanagement an der Hochschule Hannover, SoSe 2021. Autoren: Julia Solohub, Jule von Sass, Jeanice Noraman, Hassan Rizk, Karin Sidik, Deniz Göker, Ilknur Gencer, Elif Celik, Buket Bayram, Sofinias Terefework und kann laufend aktualisiert werden.

Einleitung Wikidata

[Bearbeiten]

"Wikidata ist eine freie, gemeinsame, mehrsprachige und sekundäre Datenbank zur Sammlung strukturierter Daten zur Unterstützung von Wikipedia, Wikimedia Commons, der anderen Wikis der Wikimedia-Bewegung und jedem auf der Welt.“ (Wikidata 2020)

  • Frei: Die Daten in Wikidata sind für die Öffentlichkeit frei zugänglich. Die Weiterverwendung von Daten ist für unterschiedlichste Vorhaben erlaubt, sprich das Kopieren, Modifikation, Verteilung und Auswertung der Daten ist gestattet.
  • Gemeinsam: Das Erstellen, die Verknüpfung von Wikidata-Daten sowie die Regeln des Erstellens werden von den einzelnen Benutzern administriert. Jeder Benutzer kann auf jegliche Inhalte zugreifen und diese bearbeiten. Automatische Bots speisen Daten in der Datenbank ein und vervollständigen diese.
  • Vielsprachig: Wikidata ist mehrsprachig, d.h. die Daten können in mehreren Sprachen erstellt, verwendet, durchsucht und wiederverwendet werden. Jegliche erstellten Daten sind sofort in allen anderen Sprachen zugänglich.
  • Eine sekundäre Datenbank: Wikidata stellt durch Quellenangaben eine Verbindung zu weiteren Datenbanken her, welche die Diversität und Nachweisbarkeit von abrufbaren Daten widerspiegelt.
  • Sammlung strukturierter Daten: Durch die einfache Struktur von Wikidata ist die Verwendung von den bereits vorhandenen Inhalten leicht nachvollziehbar. Des Weiteren können Computer aufgrund dieser Struktur die Daten lesen und verarbeiten.
  • Unterstützung der Wikimedia-Wikis: Durch leicht zu pflegende Infoboxen und Sprachlinks unterstützt Wikidata Wikipedia und verringert den Arbeitsaufwand. Dadurch wird die Qualität der Inhalte Wikipedias verbessert.
  • Jeder auf der Welt: Jeder Benutzer aus aller Welt kann auf die Inhalte zugreifen und diese verwenden (vgl. Wikidata 2020).

Wikidatas Ziel ist eine Datenbank zu schaffen, welche strukturiert und zentralisiert aufgebaut ist, um Daten und Fakten der realen Welt zu beschreiben und abzubilden.

Autoren: Julia Solohub, Jule von Sass

Quelle: Wikidata (2020): Wikidata:Einführung. Online unter https://www.wikidata.org/wiki/Wikidata:Introduction/de [Abruf 09.03.2021]

Suche nach Objekten

[Bearbeiten]

Um nach einem Objekt zu suchen wird der Suchbegriff in die Suchleiste (1) eingegeben. Bei der Eingabe werden bereits in der Vorschau der Suchergebnisliste übereinstimmende Ergebnisse angezeigt und können direkt ausgewählt werden. Durch Enter oder Klick auf die Lupe wird die Suche durchgeführt und man gelangt zur Suchergebnisseite.

Abbildung 1: Suche auf der Startseite

Falls es das gesuchte Objekt nicht gibt, kann es über den Text in den Ergebnissen (2) oder links in der Navigationsleiste über „Ein neues Datenobjekt erstellen“ erstellt werden.

Abbildung 2: Suchergebnisse

Neues Objekt Erstellen

[Bearbeiten]

Es wird eine neue Seite geladen, über die man die Bezeichnung, Beschreibung und ggf. Aliasse eintragen kann (3). Mit Klick auf „Erstellen“ (4) wird das Objekt erstellt.

Abbildung 3: Neues Datenobjekt erstellen

Zur Bearbeitung des Objekts, beispielsweise um weitere Sprachen hinzuzufügen, klickt man auf „bearbeiten“ und gelangt so zur Konfiguration in weiteren Sprachen. Dort können zusätzliche Bezeichnungen etc. eingegeben werden (5) und durch Klick auf „Veröffentlichen“ oben rechts gespeichert werden.

Abbildung 4: Objekt bearbeiten

Autor: Jeanice Noraman

Funktionen

[Bearbeiten]

Items

[Bearbeiten]

Ein Item (deutsch: Datenobjekt) stellt in Wikidata eine zentrale Einheit dar und besteht immer aus einer Datensatz-ID, die sich aus dem Buchstaben Q und einer Nummer zusammensetzt

  • Beispielweise steht (Q105943528) für Gefallenendenkmal Lohnde
  • Um vorhandene Items zu finden, gibt es 2 Herangehensweisen
  • Einerseits die Eingabe eines Suchbegriffes in das Suchfeld (wie in Kapitel Suche nach Objekten beschrieben). Hierbei können unterschiedliche Ergebnisse angezeigt werden
  • Andererseits kann nach der Eingabe eines Suchbegriffes über die Vorschau eine manuelle Auswahl zum konkreten Item führen
  • Jedes Item kann pro Sprache einen Namen, eine Kurzbeschreibung sowie mehrere Alternativnamen (Synonyme) haben.
  • weitere Bestandteile von Items sind Links zu Seiten in Wikimedia-Projekten (Wikipedia, Wikivoyage, Wikimedia Commons)

Items anlegen

[Bearbeiten]
  • Bevor ein neues Item erstellt wird, sollte geprüft werden, ob bereits so ein Item existiert
  • Wenn ein Item noch nicht vorhanden ist, so hat man die Möglichkeit ein neues Item zu erstellen. Über diesen Link gelangt man zur Erstellungsseite. Dort wird der Name und die Beschreibung des zu erstellenden Items eingegeben.
  • Items bestehen in der Regel aus einer Vielzahl von Aussagen. Diese enthalten Informationen über die reale Welt und sind der Kernteil jedes Items
  • Sie gliedern sich in Eigenschaften (property) mit vorgegebenem Vokabular und ihnen zugewiesenen Werten beziehungsweise Inhalten.
  • Aussagen in Wikidata können mit einem anderen Wikidata-Item oder mit einem externen Link verlinkt oder durch eine Eigenschaft inhaltlich oder objektiv beschrieben werden.
  • Eine Übersicht über aller Eigenschaften von Wikidata kann in einer Liste eingesehen werden, wo ebenfalls überprüft werden kann, welche Werte dort eingetragen werden können.

Autor: Mehreme Madjuni

Statements/Aussagen

[Bearbeiten]

In Wikidata ist ein Konzept, Thema oder Gegenstand als Objekt dargestellt. Jedes Objekt hat seine eigene Seite. Eine Aussage ist die Art und Weise, wie die Information oder Daten, die wir über ein Objekt haben, in Wikidata gespeichert werden. Dies geschieht, indem eine Eigenschaft mit mindestens einem Wert verbunden wird. Das ist die Grundlage einer Aussage. Aussagen können weiter ausgebaut, mit Anmerkungen versehen oder sie können in einen bestimmten Zusammenhang gebracht werden durch zusätzliche Werte, optionale Qualifikatoren, Bezüge und Rangfolgen. Aussagen dienen auch dazu, Objekte miteinander zu verbinden und führen zu einer vernetzten Datenstruktur.

Jedes Wikidata-Item kann mit Aussagen (statements) beschrieben werden:

Im Wesentlichen besteht eine Aussage aus einer Eigenschaft und einem Wert. Beispielsweise enthält das Item für die Stadt Hannover (Q1715) eine Aussage, die angibt, dass sich Hannover in Deutschland befindet. Die entsprechende Eigenschaft dafür hat die Bezeichnung “Staat” (P17). Aussagen in Wikidata können mit einem anderen Wikidata-Item oder mit einem externen Link verlinkt oder durch eine Eigenschaft inhaltlich oder objektiv beschrieben werden. Der aufgerufene Datensatz im Screenshot ist Hannover (Abb. 3). Die Eigenschaft Staat beschreibt das interne Wikidata-Item Deutschland. Die Eigenschaft LCNAF (Library of Congress Name Authoryity File) gibt einen externen Link wieder. Die KFZ- Kennzeichnung ist ein Beispiel für eine einfache Wertbeschreibung.

Qualifikatoren (qualifiers) werden in Wikidata benutzt, um eine Aussage näher zu beschreiben. Viele Aussagen benötigen weitere Qualifikatoren, um richtig interpretiert werden zu können. Sie liefern also zusätzliche Informationen und bestehen genau wie Aussagen aus einer Eigenschaft und einem Wert. Ränge (hierarchies) sind Qualitätsfaktoren, die helfen, die Qualität einer Aussage einzustufen. Das Ranking wird nur angewandt, wenn es zu einem Item mehrere Aussagen mit der gleichen Eigenschaft gibt. Es gibt drei mögliche Rangstufen:
1. Herabgestufter oder zweifelhafter Rang für Aussagen, die nicht als zuverlässig betrachtet werden können oder von denen man weiß, dass sie Fehler enthalten.
2. Der Normale Rang ist für Aussagen, die relevante Informationen enthalten. Diese Informationen gelten allgemein als korrekt.
3. Vorrangig ist ein Rang bei Aussagen mit den wichtigsten und aktuellsten Informationen.

Abgesehen von einige Ausnahmen sollten möglichst alle Aussagen in Wikidata mit zusätzlichen Belegen (sources) versehen werden.In folgenden Fällen kann bei Aussagen auf Belege verzichtet werden:

  • Wenn die Aussage allgemein bekannt und unumstritten ist.
  • Wenn das Item, über das Aussagen gemacht werden, selbst als Beleg für diese Aussagen dienen kann – beispielsweise sind die Autoren und Autorinnen eines Buches in der Regel dem Buch selbst zu entnehmen.
  • Wenn die Aussage sich auf eine externe Quelle bezieht, die selbst als Beleg dienen kann. Diese Ausnahme trifft auf die meisten Aussagen mit Normdaten-Eigenschaften in Wikidata zu.

Autoren: Hassan Rizk, Karin Sidik

Abgeleitete Aussagen

[Bearbeiten]

Wikidata lässt nur in den seltensten Fällen inversive Properties zu. Um dieses Problem zu lösen und sie anzeigen zu lassen müssen folgende Schritte befolgt werden:

1. Ein Objekt mit der inversiven Bezeichnung der Property finden/erstellen.

  • Es sollte ein "Objekt für inverse Bezeichner von Eigenschaften"(Q65932995) sein

2. Property die inversiv sein soll, muss eine Aussage mit der Eigenschaft "inversive Bezeichnung" (P7087) haben. Diese sollte als Item das im ersten Schritt erwähnte Objekt haben. 3. Zu den Einstellungen -> Helferlein und unter "Wikidata" den Haken bei "relateditems" setzen.

4. Im Objekt, in dem die inversive Property eines anderen Objekts nach unten scrollen und die Box "zeige abgeleitete Aussagen" anklicken.

  • Dort werden alle Aussagen angezeigt, die sich aus anderen Objekten ableiten lassen.


Autor: Jeanice Noraman

References

[Bearbeiten]

Es ist wichtig, dass andere den Inhalt überprüfen können, um sicherzustellen, ob er korrekt ist und aus einer zuverlässigen Quelle stammt. Die Referenz/Quelle wird verwendet, um auf eine bestimmte Quelle zu verweisen, damit die Sicherheit der Ansprüche in Wikidata gewährleistet werden kann. Eine Referenz kann ein Link zu einer URL oder zu einem Objekt sein. Zum Beispiel ein Buch. Wikidata zielt nicht darauf ab, die Frage zu beantworten, ob eine Aussage korrekt ist, sondern nur, ob die Aussage in einer Referenz erscheint.

Schritt 1: Datenobjekt / Item Das gewünschte Datenobjekt / Item auswählen


In diesem Beispiel: Elisabethkirche von 1867 in Langenhagen (Q105825900)

Schritt 2: Aussagen/Statement Die gewünschte Aussage/Statement auswählen

Schritt 3: References/Quelle/Fundstellen

Rechts Fundstelle hinzufügen anklicken

Im Feld Eigenschaft die Quelle eingeben

Im zweiten Feld hat man die Möglichkeit einen Wert einzufügen, das Feld kann aber auch freigelassen werden.

Anschließend oben rechts "Veröffentlichen" anklicken

Autoren: Deniz Göker, Ilknur Gencer

Quickstatements in Wikidata

[Bearbeiten]

Über Quickstatements (QS) lassen sich Einträge bzw. deren Aussagen, Bezeichnungen, Beschreibungen und Alternativbezeichnungen in Wikidata schnell über einfach Befehle erstellen oder ändern. Somit dient QS als ein Werkzeug. Über das Tool lassen sich die Quickstatements generieren. Dafür wird eine bestimmte Syntax verwendet, die auf der Hilfe zu den Quickstatements Seite näher beschrieben wird.

Beispiel Wir möchten den Eintrag Brücke über den Zweigkanal bearbeiten indem wir den Staat Niederlande hinzufügen wollen. Gehen wir das Schritt für Schritt durch:


1. Einloggen mit seinen Wikidata Daten in quickstatements.toolforge.org.

Schritt 1: Einloggen in quickstatements.toolforge.org


2. Auf "Neuer Stapel" klicken.

Schritt 2: Neuer Stapel klicken


3. Den Befehl eingeben indem man zuerst das zu bearbeitende Item Q105747124 anspricht, dann die zu bearbeitende Property Staat (P17) und zum Schluss der Wert, der eingefügt werden soll. Hier ist es Niederlande (Q55). Alle Bausteine werden durch ein "|" getrennt. Ebenfalls sollte ein Name für den Stapel eingefügt werden, wie in dem Beispiel "Änderung Staat".

Schritt 3: Befehl eingeben


4. Änderung über Quickstatements starten, damit der Befehl ausgeführt wird.

Schritt 4: Den Befehl starten


5. Am Ende wird der Status des Befehls gezeigt. Hier ist die Änderung erfolgreich durchgeführt worden.

Schritt 5: Status des Befehls sehen


6. In dem bearbeiteten Eintrag schauen, ob die Änderungen übernommen worden sind.

Schritt 6: Änderungen im Wikidata Item anschauen

Autor: Julia Solohub

Mögliche Probleme/Hinweise

[Bearbeiten]

a) Kennungen/Identfiers – Wie und wo erstellen?

[Bearbeiten]

1. Als erstes auf „Anweisung hinzufügen“ klicken. Anschließen „Denkmalatlas Niedersachsen Objekt-ID“ eingeben.

Die aus dem Denkmalatlas erkundigte Objekt ID veröffentlichen.

2. Die Kategorie „Kennung/Identifiers“ ergibt sich aus dem Hinzufügen einer Anweisung mit der Verknüpfung des Denkmalatlas automatisch nach der Veröffentlichung.

b) "Hilfe"

[Bearbeiten]

Auf der Menüleiste von Wikidata befindet sich die Kategorie „Hilfe“. Hier werden Hinweise sowohl für Anfänger als auch für Fortgeschrittene Benutzer gegeben.

c) Welche Properties gibt es? / Welche Property kann man für den Wert nutzten? =

[Bearbeiten]

--> Liste in Wikidata mit allen Properties anlegen.

d) Fehlerhafter Wert wird einer Property zugewiesen

[Bearbeiten]

Ausrufezeichen, Blitz oder Flagge werden angezeigt.

Das angezeigte Symbol anklicken, um die mögliche Fehlerbehebung / den Hinweis zu sehen.

e) Die benötigte Property ist nicht vorhanden/ Property soll ein neues Datenobjekt mit einem Datentyp sein

[Bearbeiten]

Die benötigte Property in diesem Fall selbständig neu anlegen.

oder

Hilfe durch Anschauen von anderen ähnlichen Properties holen, indem das Erstellen der Property ersichtlich wird.

f) Welche Property passt am besten zu dem Wert?

[Bearbeiten]

Nach ähnlichen Einträgen suchen und überprüfen, unter welcher Property der Wert eingefügt wurde.

g) Bereits vorhandener Eintrag

[Bearbeiten]

Den Eintrag als Dublette mergen. Hierfür P31+ Q17362920 + Qulifikator P642 und das duplizierte Objekt eintragen. Siehe auch https://www.wikidata.org/wiki/Help:Merge/de

h) Probleme mit inversen Properties

[Bearbeiten]

Dein Eintrag dazu finden Sie hier.




Autoren: Elif Celik, Buket Bayram

WD-Query

[Bearbeiten]

Unter einer Query versteht man eine Abfrage mit der eine Suche nach und innerhalb Wikidata Objekten und den zugehörigen Daten möglich ist. Für die Abfrage wird die SPARQL-Query-Sprache verwendet. Um diese zu erstellen, kann man den Wikidata Query Service benutzen. Ein weiteres hilfreiches Tool ist der Wikidata Query Builder. Der Wikidata Query Builder bietet eine visuelle Schnittstelle zum Erstellen einer einfachen Wikidata-Abfrage. Mit Hilfe der Abfragehelfer wird es jedem ermöglicht eine Abfrage zu erstellen, auch wenn man die SPARQL-Query-Sprache nicht beherrscht. Der Query Builder bietet nicht die volle Funktionalität von SPARQL, jedoch kann die Abfrage im Query Service geöffnet werden, wo sie weiter bearbeitet und erweitert werden kann. Weitere Informationen zu den Wikidata SPARQL-Query-Abfragen sind hier zu finden.

Anleitung des Wikidata Query Service

[Bearbeiten]
  • Um den Abfragehelfer zu öffnen muss man auf das runde Symbol mit dem i klicken
  • Es erscheinen die zwei Felder "Filter" und "Anzeigen" sowie die Begrenzungsoption
  • Beim Filter wird die Eingrenzung eingegeben, sprich das, was angezeigt werden soll. Beim Tippen erscheinen Vorschläge, die man abhängig von der gewünschten Abfrage auswählen kann. Mehrere Filter sind durch das Klicken auf das Plus Zeichen möglich.
  • Beim Anzeigen kann man ebenfalls eintragen, was man als Ergebnis erhalten möchte. Auch hierbei werden beim Tippen Vorschläge angezeigt. Mehrere Anzeigemöglichkeiten sind ebenfalls möglich.
  • Die Begrenzung ist dazu da die Anzahl der Ergebnisse einzugrenzen.


Anbei ein Erklärungsvideo, das eine SPARQL-Abfrage zeigt, wo alle Zoo-Instanzen, in denen Löwen und Eisbären vorkommen, abgefragt werden.

Create query zoo that keeps polar bear and lion

Diese Datei ist lizenziert unter der Creative-Commons-Lizenz „Namensnennung – Weitergabe unter gleichen Bedingungen 4.0 international“. Der Urheber dieses Werkes ist Jonas Kress. Es wurden keine Änderungen vorgenommen.

Nähere Informationen sind auf Wikidata SPARQL Query Service zu finden.

Anleitung des Wikidata Query Builder

[Bearbeiten]
  • Pro Bedingung gibt es ein Feld
  • Über die Buttons "With" und "Without"(1) wird ausgewählt, ob die entsprechende Bedingung in die Abfrage eingebunden oder von der Abfrage ausgeschlossen werden soll
  • Das Eigenschaftsfeld ("Property")(2) in einer Bedingung ist die Kategorie oder der Deskriptor für den Wert. Zum Beispiel wäre "Farbe" eine Eigenschaft, die für den Wert "blau" verwendet werden würde.
  • Das Wertefeld ("Value") (3) enthält die konkreten Informationen, mit denen ein Element beschrieben wird. Zum Beispiel ist "blau" ein möglicher Wert für die Eigenschaft "Farbe".
  • Außerdem wird ausgewählt, ob die Eigenschaft den Wert ein- oder ausschließen soll oder unabhängig vom Wert sein soll
  • Die Ergebnisse können weiter eingeschränkt werden, indem ausgewählt wird, ob nur Aussagen mit oder ohne Referenzen angezeigt werden sollen (4)
  • Über "Add condition" (5) kann eine weitere Bedingung hinzugefügt werden
    • Bei mehreren Bedingungen wird durch "and" und "or" (6) ausgewählt, ob beide erfüllt sein müssen
  • Bei den Einstellungen (7) kann die Anzahl der Ergebnisse auf eine bestimmte Zahl eingeschränkt werden. Außerdem können statt Labels auch nur IDs angezeigt werden.
  • Über "Run query" (8) wird die Abfrage ausgeführt und das Ergebnis angezeigt
  • Darüber hinaus ist es möglich einen Link für die Abfrage zu bekommen (9) oder sich die Abfrage im Query Service anzeigen zu lassen

Timeframe zum Projekt

[Bearbeiten]

Link zum Timeframe vom Projekt

Query zu Wikidata

[Bearbeiten]

Visualisierung auf einer Karte

[Bearbeiten]

(Stand 26.03.2021)

  • Alle Denkmalatlas-Items mit Koordinaten in einem 100km Radius von Hannover (darstellbar als Karte): https://w.wiki/38TT

(Stand 26.03.2021)

Autoren: Julia Solohub, Jeanice Noraman, Jule von Sass, Sofinias Terefework

Bearbeitung von Orte des Gestapoterrors in Niedersachsen

[Bearbeiten]

Wikidata Query

[Bearbeiten]

Der nachfolgende Link zeigt die Query, für alle Wikidata Einträge zum Projekt "Orte des Gestapoterrors in Niedersachsen".

Des Weiteren werden die Orte des Gestapoterrors in Niedersachsen auf der Karte visualisiert.

Probleme und Lösungsvorschläge

[Bearbeiten]

Bei der Erstellung der Items für die Orte des Gestapoterrors sind einige Probleme aufgetreten. Diese werden in der unten stehenden Tabelle samt möglichen Lösungen dargestellt.

Probleme Lösungsvorschläge
Welche Properties gibt es? / Welche Property kann man für den Wert nutzten? Eine Liste in Wikidata mit allen Properties anlegen. Es gibt bereits eine Liste, die einige Properties darstellt. Diese könnte man erweitern.
Fehlerhaften Wert einer Property zugewiesen --> Blitz, Flagge oder Ausrufezeichen wird angezeigt Auf das angezigte Symbol draufklicken und gucken, was man machen muss, um den Fehler zu beheben
Benötigte Property gibt es nicht Die benötigte Property neu anlegen. Zuerst aber auf Wikidata:Property proposal anfragen
Der angelegte Eintrag ist bereits vorhanden Den Eintrag als Dublette mergen. Dafür P31+ Q17362920 + Qualifikator P642 & Das duplizierte Objekt eintragen. Siehe Hilfe. Man kann aber auch den bereits vorhanden Eintrag bearbeiten.
Welche Property passt am besten zu dem Wert? Nach ähnlichen Einträgen suchen und gucken, unter welcher Property der Wert eingefügt wurde

Neue Property anlegen

[Bearbeiten]

Um eine neue Property anlegen zu können, muss der Property Vorschlag erst einmal auf Wikidata:Property proposal diskutiert werden, bis dieser angenommen und in Wikidata aufgenommen wird. In das Feld "Eigenschaftsname" soll der Name der gewünschten Property eingetragen werden. Anschließend gelangt man auf ein Bearbeitungsfeld, wo man Daten eintragen muss, die bereits vorgegeben werden. Dahinter stehen nähere Beschreibungen, was dort eingetragen werden muss als Kommentare.

In diesem Beispiel sollte die Property "hat Gedenkort" für die Erstellung Items der Orte des Gestapoterrors. So sieht das Formular ausgefüllt aus:

Wikidata Property Vorschlag
Wikidata Property Vorschlag

Eigenschaftenersteller oder Administratoren sehen sich in nächster Zeit den Vorschlag an und beginnen eine Diskussion. Falls sie den Vorschlag für nachvollziehbar halten, können diese die Property anlegen.

Autor: Julia Solohub

OpenRefine

[Bearbeiten]

Definition

[Bearbeiten]

OpenRefine ist eine Desktop Anwendung, die den Webbrowser als graphische Oberfläche nutzt. Mit OpenRefine kann man Daten aus einem Tabellenformat wie csv-Dateien oder tabulatorgetrennte Datein (tsv) angezeigt werden. Mit dieser Anwendung lassen sich Daten standardisieren und bereinigen. Folgende Vorteile lassen sich erschließen:

  • Überblick über den Datensatz
  • Standardisierung von Daten
  • Aufteilung in detaillierte und übersichtliche Teile
  • Vergleich von lokalen Daten mit anderen Datensätzen
  • Erweiterung des Datensatzes mit weiteren Daten aus anderen Quellen

Nähere Erläuterung zu der Definition ist in librarycarpentry OpenRefine zu finden

Installation

[Bearbeiten]

Für die Installation von OpenRefine wird Java benötigt. Falls dies auf dem PC nicht vorhanden ist, muss das installiert werden. Danach muss man auf openrefine.org unter OpenRefine 3.4.1 das Windows Kit herunterladen. Die Datei openrefine-win-3.4.1 wird heruntergeladen, die dann entpackt werden muss. Anschließend auf openrefine.exe klicken, um OpenRefine zu starten. Ein separater Browser-Tab wird mit der Anwendung geöffnet.

Autor Julia Solohub

OpenRefine in Verbindung mit dem Denkmalatlas Niedersachsen

[Bearbeiten]

Für das Projekt sollen alle Datensätze, die noch nicht in Wikidata eingetragen sind, in OpenRefine importiert werden, um Denkmäler in Wikidata aufzustöbern, die noch nicht die Denkmalatlas-Property P:7900 haben. Zunächst müssen die Metadaten der Denkmäler vom Denkmalatlas heruntergeladen und importiert werden. Dazu muss man auf Coding Da Vinci auf den Link unten Metadaten und Metadateien klicken. Anschließend mit einem Rechtsklick auf den Ordner "Metadaten" klicken und diesen herunterladen.

Nachdem man die Metadaten heruntergeladen hat, muss man diese in OpenRefine importieren. Dafür klickt man "Datei hinzufügen" an und wählt die heruntergeladene Datei aus. Diese wird anschließend als ein XML-Baum angezeigt.

Probleme/Schwierigkeiten

[Bearbeiten]
  • Adressen in Wikidata können unterschiedlich angelegt werden
  • Mehrere Objekte unter derselben Adresse
  • Zu viele Datensätze
  • -> Sehr lange Bearbeitungszeit
  • -> Computer hatte bei der Verarbeitung starke Schwierigkeiten
  • Leere Zeilen/Datensätze in der Tabelle, die wir entfernen mussten
  • Unnötige oder doppelte Spalten, unklare Bedeutung der Spalten
  • Probleme beim reconcilen
  • -> Dauert durch die große Datenmenge sehr lange
  • -> Mussten trotzdem manuell zu Wikidata-Items zugeordnet werden
  • Daten ließen sich nicht in das Schema reinziehen
  • Datenexport nicht möglich

Autor: Julia Solohub

Quellen

[Bearbeiten]

...