Kurs:Partizipative Transkriptionsprojekte (DieDatenlaube)

Aus Wikiversity
Die Datenlaube
Die Gartenlaube und die Datenlaube – Erschließung von Transkriptionen in Wikisource mit Wikidata

Ein praktischer Erfahrungsaustausch am Museum für Naturkunde, online 28. und 29. Oktober 2021

Publikum

GLAM-Kolleg:innen in Museen, Archiven, Bibliotheken

Methoden

Vortrag und Hands On Lab

Vortragende

Die Datenlaube: Jens Bemme (SLUB Dresden) und Matthias Erfurth (Stadtwiki Dresden)

Status

Skript für Vortrag und Hands On-Workshop am 29. Oktober 2021, ab 13 Uhr

Die höchsten Bauwerke und Denkmäler der Welt, in: Die Gartenlaube, 1882, Heft 40.
Bemme, Erfurth, Erlinger: Open Citizen Science: Metadaten und Links für ‚Die Bauwerke und Denkmäler der Welt‘.
Bemme, Erfurth: Wikicite, Caviar für Die Gartenlaube.

Projekt*e[Bearbeiten]

Die Gartenlaube und Die Datenlaube – Erschließung von Transkriptionen in Wikisource mit Wikidata, Beitrag zum Tagungsband, DOI 10.5281/zenodo.7080199, Preprint

Die Gartenlaube[Bearbeiten]

Langjähriges Großprojekt der deutschprachigen Wikisource-Community

Diese Daten (Scans, OCR, Texte, Bilder) sind Grundlage für Die Datenlaube:

  • circa 20.000 Artikel, teils illustriert (Detailabbildungen und Doppelseiten), vgl. Projektstand
  • OCR-Korrekturen: 4 bzw. 6-Augen-Prinzip in Wikisource, Artikel- bzw. Seitensstrukturierung
  • Bilder freistellen in Wikimedia Commons (u.a. Croptool [1])
  • Artikelseiten anlegen (Tutorial auf https://diedatenlaube.github.io)

Die Datenlaube[Bearbeiten]

Binationales Citizen Science-Projekt für und mit offenen Kulturdaten der Gartenlaube

https://diedatenlaube.github.io/, Twitter: @DieDatenlaube, Wikiversität: DieDatenlaube (DatenlaubeJam meist am Dienstagmorgen)

  • skriptbasierte Formalerschließung aus den Textdatenboxen der Wiksiource-Artikelseiten durch Stapelverarbeitung in Wikidata, inzwischen circa 1x wöchentlich aus allen neu angelegten Wikisource-Gartenlaubeartikeln
  • inhaltliche Sacherschließung (main subject) der einzelnen Artikel-Items in Wikidata: Bilder, Bildunterschriften, Illustratoren, Zitationen, bibliografische Zusammenhänge (Serien-Items)
  • Vorträge, Veröffentlichungen: Poster, Artikel, Blogposts
  • Queries: Wikidata-Abfragen
So hängen unsere #transkription21-Gartenlaube-Infrastrukturen zusammen: Tweet, 27. Okt. 2021
  • Beteiligte und Motivation
  • Nebenaspekte

Allgemein: Wikisource+Wikidata[Bearbeiten]

DieDatenlaube ist im Grunde ein beispielhaftes Pilotprojekt für alle Transkriptionen in Wikisource. ("Man müsste mal!")

Zum Beispiel derzeit laufend:

Wikisource ist geeignet (mit Blick auf GLAM- und [Open] Citizen Science-Anliegen):

  • für kleine Transkriptions- und solche Pilotprojekte für gemeinfreie Werke im Wikiversum
  • um digitale Objekte und Bestände sichtbar und nutzbar zu machen
  • für deren Vernetzung bzw. Erschließung im Wikiversum (Wikidata, Wikipedia, Wikiversity, ...)
  • für Schulungsprojekte: Digital Humanities, Linked Open Data-Strategien/LOD-Denke, in house mit Mitarbeiter*innen z.B. im Zusammenhang mit 1lib1Ref (bzw. 1lib1nearby)-Aktionen
vgl. Gavin Willshaw: WIKISOURCE AS A TOOL FOR OCR TRANSCRIPTION CORRECTION: THE NATIONAL LIBRARY OF SCOTLAND’S RESPONSE TO COVID-19, 2021
  • fürs lokale wie auch fürs überregionale Community-Building
  • für die offene Projektkommunikation i.V.m. illustrierten Metadaten-Vorschaubildern aus Wikidata-Items: open GLAM-Produktion von (bibliografischen) Social Media- & Wisskomm-Inhalten

Herausforderung: Schnittstellen zwischen Wikidata und Verbundkatalog (K10+). Wikisource-Volltexte werden bereits in der Sächsischen Bibliografie und im Katalog der SLUB ausgewiesen, vgl. Spezial-Tourenbuch für Radfahrer und Touristen durch die Sächsische Oberlausitz > SAXB.

Hands On[Bearbeiten]

 Wikisource: Hilf mit! – Quellen und Volltexte

Ein Arbeitsschwerpunkt für die Anlage separater Artikelseiten ist gerade noch (für uns) Jahrgang 1891. Dort kann korrigiert werden, andere Jahrgänge können auch bearbeitet werden.

 Wikisource: Die Gartenlaube (1891) – Quellen und Volltexte
Jens Bemme
Matthias Erfurth im Radio-Depot Technische Sammlung Dresden 2016
Christian Erlinger, WikidataCon 2019

Aufgaben[Bearbeiten]

  • Kick auf [Seitenzahl] im jeweiligen Artikelfließtext führt zur Quellseite der Artikel-OCR, dort Textkorrektur (Formatierung und Sectionierung) sowie Statusänderung der OCR-Seite unkorrigiert (Rot) > korrigiert (gelb) > fertig (grün) am Texteditor unten & Speichern.
  • Klick Bearbeiten einer Artikelseite offenbart die vorlagenbasierte Zusammensetzung der Artikelseiten aus den verschiedenen - ggf. sectionierten - OCR- und Bilderquellseiten. Die Metadaten der Textbox dienen uns für die Erschließung in Wikidata; Wikipedialink = erstes Schlagwort main subject; Sonstiges z.B. für Permalinks zu Digitalisaten im Artikel zitierter Literatur (ggf. #WikiCite, wenn zitierte Quelle mit spezifischem Item erschlossen wird).

Exkurs LOD-Interwikilinks (Stadtwiki Dresden)[Bearbeiten]

Dresden's Wintergarten

 Wikisource: Dresden’s Wintergarten – Quellen und Volltexte

Beispiele für Gartenlauben-Abfragen[Bearbeiten]

Werkzeug[Bearbeiten]

Tagungsband[Bearbeiten]

Stört, D.; Schuster, F.; Hermannstädter, A. (2022). Partizipative Transkriptionsprojekte in Museen, Archiven und Bibliotheken. [Dataset]. Data Publisher: Museum für Naturkunde Berlin (MfN) - Leibniz Institute for Evolution and Biodiversity Science. https://doi.naturkundemuseum.berlin/data/10.7479/szm4-fs62

Bemme, Jens, Christian Erlinger und Matthias Erfurth: „Die Gartenlaube“ und „Die Datenlaube“ : Erschließung von Transkriptionen in Wikisource mit Wikidata, doi 10.5281/zenodo.7080199 Preprint