Wikiversity:Wikiversity:Fellow-Programm Freies Wissen/Einreichungen/Nachnutzung von strukturierten Daten aus Wikidata für bibliometrische Analysen/Zwischenbericht
Fellow-Programm Freies Wissen - Zwischenbericht[Bearbeiten]I. Infos zum eigenen Forschungsvorhaben (max. 3000 Zeichen)[Bearbeiten]A. Status Quo[Bearbeiten]Meine Projekt “Nachnutzung von strukturierten Daten aus Wikidata für bibliometrische Analysen – Erstellung einer generischen Python Library und Durchführung eines Workshops” umfasst einerseits die Software-Entwicklung eines Tools zur Anreicherung bibliographischer Daten (zunächst aus Wikidata) und andereseits die Organisierung einer WikiCite Satellite Tagung im Mai 2020 in Köln.
Wikidata-Tool:[Bearbeiten]Die erste Aufgabe bestand in der Vergegenwärtigung bestehender verwandter Projekte und Tools. Daneben habe ich zusätzlich zu den bereits vorbereiteten Python Klassen "Author", "Institution" und "Journal" auch die Klasse "Article" eingeführt (siehe Graphik). Erst durch die neue Artikel-Klasse wird es möglich von der Ebene der Publikationen, eindeutig identifiziert zB. mit DOI oder PubMed-Id, auf die Ebene der Autor*innen, Journals oder Institute "umzuschalten". Die hier von Wikidata abgerufenen Q-Nr. der Autor*innen werden dann in dem zweiten Schritt, mithilfe der anderen Klassen die gewünschten Informationen abgefragt. Derzeit führe ich einige Probeabfragen mit der Library im Rahmen meiner Arbeit durch. Leider stoße ich dabei auf verschiedene Probleme: 1. ist die API von Wikidata offenbar nicht stabil und liefert für die selben Eingangsdateien (dh. wissenschaftliche Artikel mit PubMed-Id oder DOI) unterschiedliche viele Ergebnisse aus (also Infos zu Autor*innen). Dem will ich nun begegnen indem ich zusammen mit Kollegen einen eigenen Triplestore mit den Wikidatadaten aufbaue. 2. ist die Abdeckung zumindest für unseren Use case "Cholesterol" offenbar recht gering: nur etwa 4% der Autor*innen unseres Untersuchungs-Datensatzes können durch Wikidata angereichert werden. Dies mag einerseits am gewählten Thema liegen, das auf viele Publikationen zurückgreift, die aus den 50er, 60er oder 70er Jahren stammen, die weniger von Wikidata abgedeckt werden. Das heißt mit einem anderen Untersuchungsgegenstand könnten die Stärken von Wikidata eher ausgespielt werden, die wohl bei aktuelleren Daten liegen. Weiterhin setzte ich auf die doch stark anwachsende Zahl an Informationen, die in Wikidata aufgebaut werden. Also, wahrscheinlich wird sich die Abdeckung in wenigen Jahren weitaus positiver darstellen. Auf dem Einführungsworkshop wurde ich zudem immer wieder auf das Thema der Datengrundlage angesprochen, die eben auch Informationen zu Individuen umfasst. Mit diesem Problem habe ich mich inhaltlich auseinandergesetzt und schreibend positioniert. Meinen Projekt-Prozess dokumentiere ich auf einem Blog “On the edge of the data knife” (Metamorphosis), zu dem ich durch zwei Mentorinnen des Fellowships angeregt worden bin. Einige Gedanken dazu habe ich auch in einem Blogartikel für Wikimedia zusammengefasst. WikiCite Satellite Cologne:[Bearbeiten]Aufbauend auf unserem Mentoren-Team hat sich die Gruppe im Hinblick auf die Organisierung der WikiCite Satellite in den letzten Monaten um Kollegen von GESIS, der TH Köln und von ZB MED erweitert. Mit der WikiCite Satellite findet nach den großen internationalen WikiCite-Konferenzen 2016, 2017 und 2018 vom 6.-8. Mai 2020 in Köln endlich wieder eine WikiCite Veranstaltung statt. Mit der Konferenz wollen wir Wissenschaftler*innen, Kolleg*innen aus Bibliothekseinrichtungen und Freund*innen der Wikimedia-Communities, die sich mit der Vernetzung offener bibliographischer Daten beschäftigen, zusammenbringen und vernetzen. Auch ich möchte dort mein Tool vorstellen. B. Fortschritt[Bearbeiten]Wikidata-Tool:[Bearbeiten]Gerade habe ich erste praktische Anwendungen für Artikel zum Thema “Cholesterol”, an dem ich mit KollegInnen aus dem Forschungsprojekt, in dem ich angestellt bin, abgeschlossen. Im Anschluss werde ich mit der GND (LOBID-API) und ORCID, zwei weitere Datenbanken integrieren. WikiCite Satellite Cologne:[Bearbeiten]Im Hinblick auf die WikiCite Satellite ist schon viel geschehen. Der Termin steht für den 6.-8. Mai; Veranstaltungsort ist das Leibniz-Institut für Sozialforschung, GESIS, in Köln. Mit Daniel Mietchen[1], Andrea Scharnhorst und Andra Waagmeester haben auch schon drei Invited Speaker zugesagt. Der Call for Contribution ist veröffenlicht. Bis zum 16. Februar, können Beiträge vorgeschlagen werden. Seid dabei! Metadaten[Bearbeiten]• Datum: 6.-8. Mai 2020 • Veranstaltungsort: GESIS, Unter Sachsenhausen 6-8, 50667 Köln • Organisation: ZB MED, GESIS, TH Köln • Einreichungsfrist für Beiträge: 16. Februar 2020 • Benachrichtigung für Beiträge: KW 10 (erste Woche im März) • Teilnahme Registrierung: ab März 2020 (Beschränkung auf 100 Teilnehmende) • Hashtag: #wikicite20 • Schlagwörter: WikiCite • Wikidata • Bibliographie • Linked Open Data • Knowledge Graph • Open Access • Information Retrieval • Digital Libraries • Bibliometrik • Homepage: https://w.wiki/9jj C. Ausblick[Bearbeiten]Die Erreichung der Projektziele halte ich weiterhin für realistisch. Alles läuft nach Plan. II. Zusammenarbeit mit Fellows sowie Mentorinnen und Mentoren (max. 3000 Zeichen)[Bearbeiten]A. Zusammenarbeit mit deiner Mentorin/deinem Mentor[Bearbeiten]Mein Mentor und ich telephonieren regelmäßig über den Online-Telephondienst Jitsi. Darüber hinaus findet einmal im Monat ein gemeinsamer Call mit meinem Co-Fellow statt. Bei Bedarf kommunizieren wird per Mail, den Messenger Telegramm und via eines kollaborativen Organisations-Dokuments bei Google-Drive (WikiCite Satellite). Auch haben wir uns auf der Konferenz “Semantic Web in Libraries” (SWIB, November 2019) in Hamburg getroffen und dort auch schon unsere Konferenz beworben. Ich erlebe die Zusammenarbeit als produktiv und wertschätzend. B. Austausch mit anderen Fellows[Bearbeiten]Ich habe mit einem Fellow einen längeren Austausch über einen Sachverhalt in seinem Projekt gehabt. Darüber hinaus erfahre ich über Twitter von einigen anderen Fellows und freue mich, dass auch schon ein Co-Fellow für unsere Veranstaltung Interesse angemeldet hat. III. Kommunikation und Vernetzung (max. 3000 Zeichen)[Bearbeiten]A. Kommunikationsaktivitäten mit Bezug zum Fellow-Programm[Bearbeiten]Auf dem Instituts-Blog von meinem Arbeitgeber ZB MED - Informationszentrum Lebenswissenschaften habe ich bereits über das Fellowship und mein Projekt berichtet. Zudem habe ich an einer Instructor-Schulung für die “Carpentries” teilgenommen, die die Voraussetzung dafür sind, eigenständige Data-, Software- und library-Carpentry-Workshops durchzuführen. Durch sie wird eine breite Öffentlichkeit ermächtigt, selbst die ersten Schritte in der IT zu nehmen. Auch die geplante WikiCite Satellite Konferenz kann wohl als Kommunikations-Aktivität im Sinne der Offenen Wissenschaft gelten. B. Weitergabe von Wissen[Bearbeiten]Mein Wissen über Offene Wissenschaft konnte ich in vilen GEsprächen in meinem Institut unter Beweis stellen und auf das Thema Offene Wissenschaft aufmerksam machen. Hier bei ZB MED - einer Forschungsbibliothek - renne ich dabei natürlich in der Regel offene Türen ein. Im Gespräch mit externen Wissenschaftler*innen ist das ähnlich. Ein Hindernis für die Umsetzung ist hier jedoch oftmals die Veröffentlichung in Open Access-Journalen, die oftmals weniger lange existieren und dadurch weniger etabliert sind als "alte" subskriptionsbasierte Zeitschriften. Hier ist das Prestige der Zeitschrift meist wichtiger als ihr OA-Status.
C. Neue Kontakte Offene Wissenschaft[Bearbeiten]Besonders durch die Organisierung der WikiCite Satellite Konferenz komme ich mit Vertreter*innen der Offenen Wissenschaft, inbesondere der Wikimedia,in Kontakt. D. Neue Kontakte Wikimedia-Communities[Bearbeiten]Durch das Organisieren der Tagung bin ich mit verschiedenen Menschen in Kontakt getreten. Unter anderem habe ich die lokale Wikipedia-Community im “LokalK” in Köln-Ehrenfeld aufgesucht und das Konzept der Tagung vorgestellt. Die Aktiven bei Wikipedia wollen auch einen Workshop auf der WikiCite Satellite halten, auch um damit in Kontakt neuen potentiellen Aktiven (zB. die Studierenden der TH) zu kommen. IV. Förderung von Offener Wissenschaft (max. 4000 Zeichen)[Bearbeiten]A. Neue Initiativen zur Förderung Offener Wissenschaft[Bearbeiten]An unserer Einrichtung sind seit dem Start des Fellow-Programms soweit mir bekannt ist keine neuen Initiativen zur Förderung Offener Wissenschaft entstanden. Dies liegt wahrscheinlich daran, dass wir als Informationszentrum eh schon ganz gut aufgestellt sind. B. Initiativen zur Förderung Offener Wissenschaften[Bearbeiten]Als Möglichkeiten eigene Initiativen zur Förderung Offener Wissenschaften an meiner Einrichtung (oder anderen) anzustoßen, sehe ich vor allem die Notwendigkeit, mit gutem Beispiel voranzugehen. Politische Vorgaben zur Publikation in Open Access (zB. als Bedingung für Fördergelder) oder Instituts-Policies, die Grundsätz der von Open Science festschreiben, halte ich für eine gute Maßnahme. Freiwillige Selbstverpflichtungen reichen hier wohl leider nicht aus. |