Wikiversity:Fellow-Programm Freies Wissen/Einreichungen/From project data to language corpus: an online guide to opening linguistic recordings for further analysis/Zwischenbericht

Aus Wikiversity
Zur Navigation springen Zur Suche springen

Fellow-Programm Freies Wissen - Zwischenbericht[Bearbeiten]

Dieser Zwischenbericht dient als Grundlage zur Bewilligung der Weiterfinanzierung der einzelnen Forschungsvorhaben sowie zur Evaluation des Fellow-Programms Freies Wissen. Bitte beantworte bis zum 15.01.2020 die Fragen in Textform, füge dabei gerne auch Links zu Beispielen oder anderen Quellen ein.

I. Infos​ ​zum​ ​eigenen​ ​Forschungsvorhaben​ ​(max.​ ​3000​ ​Zeichen)[Bearbeiten]

A. Status​ ​Quo​[Bearbeiten]

Ursprünglich geplant war eine Kurzanleitung, die Schritt für Schritt beschreibt, wie projektbezogene linguistische Daten erhoben and vorbereitet werden sollten, um sie später als FAIR und open Korpus zu veröffentlichen. Nach mehreren Gesprächsrunden mit potentiellen Nutzern in verschiedenen linguistischen Bereichen, hat sich das Vorhaben auf die Erhebung von Daten zur Sprechatmung eingegrenzt. Da dieser Forschungsschwerpunkt relative neu in der Linguistik ist, existieren hierzu momentan keine Referenzmaterialien. In der Praxis bedeutet dies, dass das Methodenwissen derzeit über verschiedenen internationale wissenschaftlichen Einrichtungen zerstreut ist. Das Ziel des Projektes ist es nun diese Informationen in einer freizugängliche Online-Anleitung (Open Educational Resource) zu sammeln. Begleitend soll ein beispielhaftes Übungskopurs aus Sprech- und Atmungsdaten erstellt werden. Dabei liegt ein Schwerpunkt auf die Berücksichtigung von FAIR und Open-Standards in den einzelnen Abschnitten.

Das Projekt gliedert sich in vier Arbeitspakete:

  • AP I: Vortrag & Diskussionsrunde; Meetings mit potentiellen Nutzer (Oktober bis Dezember 2019)
  • AP II: erster Entwurf von der Anleitung (bis Februar 2020)
  • AP III: Workshop zur Präsentation; Kommentierung des Entwurfs (18-19 Februar 2020; bis April 2020)
  • AP IV: Finale Fassung, inkl. Übungskorpus (bis Juni 2020)

B. Fortschritt​[Bearbeiten]

Arbeitspaket I ist abgeschlossen.

  • 18.09.2019: Gespräch: Korpuslinguisten; Themen: Herausforderungen bei der Erstellung von Korpora; Bedarf für eine Anleitung; Möglichkeit der Anleitung auf CLARIN-D zu veröffentlichen
  • 30.10.2019: Vortrag und Diskussion, Humboldt-Universität zu Berlin
  • 15.11.2019: Gespräch: Dokumentationslinguisten; Themen: Status Quo für Data-Sharing und die Bedürfnisse von Dokumentationslinguisten
  • 2.12.19: Gespräch: Phonetiker; Themen: Fellow-Projekt vorgestellt; Enbindung in anstehendem Workshop im Februar 2020

Arbeitspaket II wird Mitte Februar fertiggestellt.

Zurzeit schreibe ich die erste Fassung der Anleitung. Diese besteht aus einem technischen Teil (Datenerhebung, - management, -annotation usw.) und einem FAIR & Open Teil (Veröffentlichung von multimodalen linguistischen Daten; 10 Gründe, Daten FAIR & Open zu gestalten; FAQs)

C. Ausblick[Bearbeiten]

​Der nächste Schritt ist die Vorstellung des Entwurfs bei einem Workshop in Februar. Für den Workshop ist ein „Redaktions-Sprint“ geplant, um die einzelnen Abschnitte der Anleitung zu besprechen.

Der folgende und letzter Schritt ist die Überarbeitung der Anleitung. Ich bin optimistisch, dass eine finale Fassung der Anleitung bis Ende der Programmlaufzeit erstellt wird, gleichwohl ist der Arbeitsaufwand für AP IV schwer einschätzen. Insbesondere ist dies davon abhängig, wie stark die erste Fassung nach dem Workshop überarbeitet werden muss. Bei AP IV entsteht vermutlich ein intensiverer Kommunikationsbedarf mit dem Mentor um Entscheidungen bezüglich der Anleitung mit ihm zu besprechen. Gleichfalls wäre es in dieser Phase hilfreich von den Erfahrungen bezüglich Veröffentlichungen und Aktivitäten zur Weitergabe des Wissens zu profitieren. Von Seiten Wikimedias wird zwecks Veröffentlichung der Anleitung bei Wikiversity evenutell Unterstützung benötigt.

II. Zusammenarbeit​ ​mit​ ​Fellows​ ​sowie​ ​Mentorinnen​ ​und​ ​Mentoren​ ​(max.​ ​3000​ ​Zeichen)[Bearbeiten]

A. Zusammenarbeit​ ​mit​ ​deiner​ ​Mentorin/deinem​ ​Mentor[Bearbeiten]

Unsere Mentorgruppe kommuniziert bei Bedarf über WhatsApp. Meinem Mentor berichte ich monatlich telefonisch oder via Email über Fortschritt, Neuigkeiten und die nächste Schritte. Der Austausch mit meinem Mentor ist sehr unterstützend und motivierend. Max ist sehr engagiert und neugierig über mein Fachgebiet. Ich finde es sehr bereichernd mit jemandem außerhalb der Linguistik über mein Projekt zu sprechen. Max stellt hilfreiche Fragen und gibt mir viele Ratschläge und Ideen, die mir eine andere Sichtweise eröffnen und mich diesbezüglich voranbringen. Für die künftige Zusammenarbeit habe ich vor, öfter Kontakt aufzunehmen, um Strategien zur Veröffentlichung und Bekanntmachung der Materialien zu besprechen.

B. Austausch​ ​mit​ ​anderen​ ​Fellows[Bearbeiten]

In den vergangenen Monaten ist der Austausch eher passiver Natur, indem ich einigen Fellows über LinkedIn folge und dort Updates sehe. Aber in den kommenden Monaten will ich das Austauschangebot stärker in Anspruch nehmen. Jetzt, da mein Projekt klarer wird, weiß ich besser wo ich Unterstützung benötige. Dementsprechend habe ich vor einige (auch ehemalige) Fellows zu kontaktieren, um aktiv diesen Austausch zu initiieren. In diesem Sinne freue ich mich sehr auf den Workshop im Februar.

III. Kommunikation​ ​und​ ​Vernetzung​ ​(max.​ ​3000​ ​Zeichen)[Bearbeiten]

A. Kommunikationsaktivitäten​ ​mit​ ​Bezug​ ​zum​ ​Fellow-Programm[Bearbeiten]

Ich habe bereits einige Kommunikationsaktivitäten unternommen, um mein Projekt vorzustellen und Feedback von den Zielgruppen zu erhalten. Ende Oktober habe ich einen Vortrag zum Stand des Themas Open Data/Datasharing in der Linguistik an der HU gehalten (siehe unten). Außerdem habe ich Einzelgespräche mit verschiedenen Stakeholdern geführt. Für mitte nächstes Jahres ist ein Blog-Eintrag geplant, der die Anleitung vorstellen soll.

B. Weitergabe von Wissen[Bearbeiten]

Ende Oktober habe ich einen Vortrag beim Kolloquium für Korpuslinguistik und Phonetik (ca. 30 Teilnehmer) an der Humboldt-Universität zu Berlin mit anschließender Diskussionsrunde zum Thema Data-Sharing in der Linguistik gehalten. Im Vortrag habe ich einen Überblick zur EU-Politik bezüglich FAIR/Open Richtlinien, z.B. Horizon 2020 gegeben. Anschließend wurde das Fellow-Projekt vorgestellt und in der folgenden Diskussionsrunde eine Art „Diagnostik/Amnese“ durchgeführt, um die Bedürfnisse der Kollegen zu ermitteln. Hierzu habe ich mehrere thematisch gegliederte PowerPoint-Folien mit Fragen genutzt, um sowohl die aktuellen Data-Sharing Praxen als auch die Probleme zu erörten. Das hat sehr gut funktioniert, da die Meinungen sehr unterschiedlich ausfielen, was zu einer extrem rege Diskussion führte. Als wichtigste Anliegen wurden rechtliche Aspekte (Sicherheit bei der Veröffentlichung), das korrekte Zitieren von offenen linguistischen Daten und die Einhaltung von einheitlichen Standards genannt. Dieses Semester lehre ich im Master-Studiengang Linguistik an der HU und thematisiere Open-Science auch im Seminar (Replication Crisis, Pre-registration, Open Data – vieles ist für die Studierende neu und es gibt viele Fragen hiezu). Es lässt sich sehr effektiv anhand von Beispielen (z.B. einzelne Journal-Artikeln, Blog-Einträge) zeigen, was Open Science bewirkt. Für Anfang nächstes Jahres ist ein Blog-Eintrag geplant, der den Status Quo von Data-Sharing in der Linguistik thematisieren soll. Hier sehe ich ein Bedürfniss für Unterstützung bei der Veröffentlichung (z.B. Unterstützung beim Teilen über Social-Media).

C. Neue Kontakte Offene Wissenschaft[Bearbeiten]

Am Ende September habe ich an der Impact School der Alexander von Humboldt Institute for Internet and Society Impact School (HIIG) teilgenommen. Dort habe ich einige Open-Science „Mitstreiter“ kennen gelernt, die über ganz Deutschland verteilt sind. Auch während der Berlin Science Week habe ich mehrere Veranstaltungen besucht und neue Kontakte geknüpft, z.B. bei dem InnoSci Idea-Sprint. Dort habe ich mich mit einer Post-Doc vernetzt, die in der Wissenschaftskommunikation tätig ist. Ich finde, dass die Open-Science-Community in Berlin ziemlich stark ausgeprägt ist. Das Fellow-Programm ermutigt mich, mich weiter in diese Community einzubinden.

D. Neue Kontakte Wikimedia-Communities[Bearbeiten]

Noch nicht, aber Forscher an meiner wissenschaftliche Einricthung haben Interesse daran und wir würden gerne in diesem Zusammenhang ein Treffen mit Wikimedia vereinbaren, um künftige Kollaborationsmöglichkeiten zu besprechen.

IV.​ ​Förderung​ ​von​ ​Offener​ ​Wissenschaft​ ​(max.​ ​4000​ ​Zeichen)[Bearbeiten]

A. Neue Initiativen zur Förderung Offener Wissenschaft[Bearbeiten]

An meiner wissenschaftliche Einrichtung nimmt das Interesse an Open Praktiken deutlich zu. Es gibt viel Interesse und Austausch zu den Themen Pre-Registration und Data-Sharing. Allerdings gibt es noch keine formelle Initiativen. Ich baue hierbei Kontakte zu den Interessenten auf, um Aktivitäten langfristig zu planen und ggf. zu begleiten. An der HU bin ich im Gespräch mit einem weiteren Fellow, um dort eine Open-Science-Initiative ins Leben zu rufen, z.B. eine Vortragsreihe oder einen Arbeitskreis. Dieses Vorhaben befindet sich noch in der Konzeptualisierungsphase.


B. Initiativen zur Förderung Offener Wissenschaften[Bearbeiten]

Eine einfache Möglichkeit ist die Verteilung von Information, um dem Thema mehr Aufmerksamkeit zu schenken. Als Doktorandensprecherin an meiner wissenschaftlichen Einrichtung leite ich Information zu Open-Science- Veranstaltungen an den Doktoranden und Post-Docs durch den internen Verteiler weiter (zusammen ca. 50 Abonnenten). Eine Herausforderung liegt in der Tatsache, dass das Thema Open Wissenschaft in meinem Bereich der Linguistik (Phonetik) noch nicht weitverbreitet ist. Das heißt, der erste Schritt ist Gespräche zu ermöglichen und Information anzubieten. Nach der Diskussionsrunde an der HU habe ich gesehen, dass viele Leute wissen nicht genau, was „Open“ bedeutet – oder sie sehen Offene Wissenschaft als ein „alles-oder-nichts“ Ansatz. Deshalb sehe ich eine große Chance darin, die verschiedene Open-Ansätze sichtbarer zu machen. Zum Beispiel, wenn man die eigene Daten nicht veröffentlichen will, kann man trotzdem einen Beitrag zur offenen Wissenschaft leisten in dem man den Softwarecode für die statistische Analyse hochlädt.