Benutzer:OpenScientist/Offenes Antragschreiben/Wissenswert 2011

Aus Wikiversity
Dieses Projekt ist eines der fünf Gewinner des Wissenswert-Wettbewerbs 2011. Der Bot ist nun auf Wikimedia Commons aktiv.
Bienen vertreiben eine Hornisse. Ein Video aus dem Anhang eines Artikels in der Open-Access-Zeitschrift PLoS ONE. In diesem Projekt geht es darum, solche frei lizensierten Multimedia-Dateien via Wikimedia Commons nachnutzbar zu machen.

Metadaten[Bearbeiten]

Titel deiner Idee in 140 Zeichen[Bearbeiten]

Open-Access-Medienimporter für Wikimedia Commons

Drei Tags (Schlagworte), die die Schwerpunkte Deiner Idee beschreiben (bitte per Komma trennen)[Bearbeiten]

Open Access, Multimedia, Wikimedia Commons

Kurzbeschreibung deiner Idee und deren Beitrag zur Förderung Freien Wissens (maximal 600 Zeichen)[Bearbeiten]

Ein stetig wachsender Anteil wissenschaftlicher Artikel wird unter einer CC BY-Lizenz veröffentlicht, welche eine Nachnutzung der Materialien auf Wikimedia-Projekten zulässt. Viele dieser Artikel beinhalten Abbildungen oder Multimedia-Dateien, die sich zur Illustration enzyklopädischer Inhalte eignen. Bisher wird davon selten Gebrauch gemacht. In diesem Projekt soll daher Software entwickelt werden, welche die Artikel in Open-Access-Zeitschriften systematisch nach Multimedia-Dateien durchsucht, diese dann herunterlädt, in freie Formate konvertiert und auf Wikimedia Commons hochlädt.

Beteiligte Organisationen oder Personen[Bearbeiten]

Arbeitest du mit einer Organisation oder einer Gruppe an Leuten zusammen an diesem Projekt?

  • Universität Regensburg, Lehrstuhl für Medieninformatik (Raphael Wimmer), beratend, techn. Umsetzung
  • Nils Dagsson Moskopp, Entwickler, techn. Umsetzung

Ziele und Zielgruppe deiner Idee[Bearbeiten]

Welches Ziel soll mit deiner Idee erreicht werden?[Bearbeiten]

Ziel ist es, Ton- und Bilddateien aus wissenschaftlichen Open-Access-Veröffentlichungen systematisch auf Wikimedia Commons hochzuladen. Warum? Weil sie dort einfacher gefunden, in den Kontext bereits vorhandener Materialien gestellt und in neuen Kontexten wiederverwendet werden können als an ihrem ursprünglichen Platz, typischerweise dem Anhang zu wissenschaftlichen Artikeln.

Wie lässt sich messen, ob dieses Ziel erreicht wird?[Bearbeiten]

Gibt es Kennzahlen oder andere Daten, anhand derer du den Erfolg deines Projektes messen kannst?

  • Die Anzahl der auf Wikimedia Commons publizierten Mediendateien lässt sich ermitteln. Auch die Anzahl der in einer Open-Access-Zeitschrift publizierten Mediendateien lässt sich mit Suchanfragen und/oder einem Web-Crawler relativ genau ermitteln (Beispiel für Videos in PLoS-Zeitschriften). Dadurch können wir messen, welchen Prozentsatz an Videos wir schon transferiert haben, d.h. wie weit das Projekt fortgeschritten ist.
  • Anhand der Downloads und Verlinkung der auf Wikimedia Commons publizierten Videos können wir auf Akzeptanz und Verwendung schließen.
  • Wenn die Zeitschriften - wie bei PLoS üblich - ihre Zugriffsstatistiken öffentlich machen, können wir auch untersuchen, ob ein Video auf Wikimedia Commons öfter verlinkt oder verwendet wurde, als das gleiche Video auf der Seite der Zeitschrift. Dies ist vermutlich die wichtigste Kennzahl für den Erfolg dieses Projekts und für eventuelle Nachfolgeprojekte.

Was ist die Zielgruppe deiner Idee?[Bearbeiten]

Nutzer von Wikimedia Commons (direkt, via ein Wikimedia-Projekt oder InstantCommons): insbesondere Medien, Wissenschaftler, Lehrer, Studenten.

Wie erreichst du diese Zielgruppe?[Bearbeiten]

Über welche Kanäle und mit welchen Mitteln wirst du mit der Zielgruppe kommunizieren?

Primärer Kommunikationskanal werden die Kategorien auf Wikimedia Commons sein, über welche die verschiedenen Medien in Beziehung gesetzt werden. Der Fortgang der Entwicklungsarbeit kann auf GitHub beobachtet werden und wird durch regelmäßige Blog-Einträge begleitet. Darüberhinaus werde ich im Dezember im Rahmen des "Wikimedian in Residence on Open Science"-Projektes ein Pilotprojekt "Open Access Image of the Day" starten und über den Projektblog sowie Mailinglisten ankündigen. Sobald ausreichend Multimedia-Materialien aus Open-Access-Quellen auf Wikimedia Commons vorliegen, werden diese unter "Open Access Media of the Day" mit einbezogen.

Lässt sich deine Idee auch von anderen Zielgruppen, Orten, Projekten nutzen? Wenn ja, wie und von wem?[Bearbeiten]

Jeder kann den Code nutzen und für ähnliche Zwecke (also z.B. das systematische Hochladen von Multimedia-Dateien aus anderen offenen Archiven) adaptieren.

Umsetzung und Nachhaltigkeit deiner Idee[Bearbeiten]

Beschreibe, welche Tools, Technologien oder Hilfsmittel du für die Umsetzung benötigst.[Bearbeiten]

Der Open-Access-Medienimporter für Wikimedia Commons ist modular aufgebaut. Dies erleichtert es, neue Medientypen, Ressourcen oder Ausgabeformate hinzuzufügen. Im Allgemeinen holt sich jede Komponente ein neues Arbeitspaket aus einer Warteschlange und legt die bearbeiteten Daten in die Warteschlange der nächsten Komponente. In der Regel laufen alle Komponenten auf dem gleichen Server.

  • Der Crawler/ Scraper durchsucht eine Liste an Open-Access-Ressourcen nach neuen Artikeln mit angehängten Mediendateien (Video, evtl. Audio). Dies geschieht entweder über eine Such-API (falls vorhanden, z.B. bei PLoS) oder eine lokale Suche (Beispiel PLoS) oder Google (Beispiel: PLoS ONE). Anschließend extrahiert er für jeden gefundenen Artikel die URLs der Mediendateien sowie deren Metadaten (Urheber, Beschreibung, Lizenz, Original-Artikel, etc.).
  • Der Downloader lädt die Mediendateien herunter und speichert sie zusammen mit den Metadaten.
  • Der Transcoder konvertiert die Mediendateien in ein offenes Format (Ogg Theora, Ogg Vorbis) und fügt ggf. die Metadaten in die Mediendatei ein.
  • Das Review-Tool erlaubt es dem Benutzer, Bild- und Tonqualität, Lizenz und Metadaten einer Datei zu überprüfen und zu korrigieren, bevor diese zur Verwendung freigegeben wird.
  • Der Uploader lädt die Mediendateien mit Beschreibung und Kategorien auf Wikimedia Commons hoch.
  • Die Konfiguration der Komponenten erfolgt mittels einer geschützten Wiki-Seite. Dies ermöglicht es u.a. auch Nicht-Programmierern, neue Ressourcen hinzuzufügen.

Alle Komponenten überprüfen vor der Verarbeitung einer Mediendatei, ob diese schon auf Wikimedia Commons verfügbar ist. Ist dies der Fall, wird die Verarbeitung abgebrochen.

Wie viel wird die Umsetzung deiner Idee in etwa kosten?[Bearbeiten]

Gib hier bitte den Bruttogesamtbetrag in Euro an und sende uns die Einzelpositionen des Budgets per Mail, s.u.

4016€

Wird deine Idee bereits aus anderen Töpfen gefördert? Wenn ja, aus welchen und in welcher Höhe?[Bearbeiten]

Antwort wird nicht veröffentlicht

Nicht direkt. Allerdings stehen mir aus dem Wikimedian in Residence on Open Science-Projekt 1000 US-Dollar zur Verfügung, um Texte aus dem Open-Access-Subset der Datenbank PubMed Central in Wikimedia-Projekte zu überführen. Das würde sich gut zur Kombination mit diesem Projekt eignen.

Wird deine Idee weiterleben, nachdem die Förderphase beendet ist? Wie nachhaltig ist dein Projekt?[Bearbeiten]

  • Das Hauptergebnis, die Mediendateien, wird auch nach Projektende auf Wikimedia Commons verfügbar sein.
  • Wenn möglich, soll der Importer nach Projektende weiter auf dem Wikimedia-Toolserver laufen und neue Multimedia-Dateien importieren.
  • Sämtlicher Code ist frei verfügbar, so dass der Importer auch auf anderen Servern laufen kann.
  • Der Code kann auch modifiziert und für andere Projekte verwendet werden.
  • Der Importer kann auch nach längerer Zeit der Inaktivität gestartet werden und sammelt dann alle seit dem letzten Lauf neu hinzugekommenen Medien-Dateien.

Alle im Rahmen deiner Idee erstellen Inhalte stehen unter einer Freien Lizenz. Wie setzt du diese Lizenzierung um, welche Lizenz verwendest du?[Bearbeiten]

Das Projekt hat nicht die Erstellung von Inhalten zum Ziel, sondern den Import freier Inhalte aus Open-Access-Artikeln. Dabei beschränken wir uns zunächste auf Inhalte unter CC BY. Die im Rahmen des Projektes entstehende Software wird auf GitHub veröffentlicht und unter die GNU General Public License gestellt.

Lässt sich dein Projekt innerhalb von sechs Monaten umsetzen? Wenn nein, welche Meilensteine wirst du in dieser Zeit abschließen können?[Bearbeiten]

Ja.

Erwartest du Unterstützung (über die beantragten Mittel hinaus) von Wikimedia Deutschland während der Umsetzung deiner Idee? Wenn ja, in welcher Form?[Bearbeiten]

Wenn der Importer stabil läuft, beabsichtigen wir, ihn auf den Toolserver zu überführen und dort weiter zu betreiben. Eventuell wird dafür in geringem Umfang technische Unterstützung seitens des Toolserver-Teams benötigt.

Hast du Erfahrungen in ähnlichen Projekten? Wenn ja, welche?[Bearbeiten]

Ich bin Wikimedian in Residence on Open Science und als solcher bereits an der Schnittstelle zwischen Wikimedia- und Open-Access-Communities tätig. Auch bin ich als Autor, Gutachter und Berater mit den Arbeitsabläufen in wissenschaftlichen Verlagen sehr gut vertraut.

Wofür würdest du die 2.000 Euro aus dem Publikumspreis einsetzen? (2 Sätze genügen)[Bearbeiten]

Der Gewinner des Publikumspreises erhält 2.000 Euro extra, um sein Projekt noch schöner, größer, toller zu machen. Wofür würdest du diesen Sonderpreis einsetzen?

Zwei Erweiterungen bieten sich an:

  1. Zusätzlich zu den Multimedia-Dateien aus Open-Access-Artikeln könnten auch die Abbildungen aus den Artikeln auf Wikimedia Commons hochgeladen werden.
  2. Das Tool könnte eine Zusatz-Komponente erhalten, die Wikipedia-Artikel (in verschiedenen Sprachen) vorschlägt, wozu die Dateien thematisch passen könnten.

Wie hast du von diesem Wettbewerb erfahren?[Bearbeiten]

  • Mailing-Liste
  • Blog

Über Dich[Bearbeiten]

Dein Vorname[Bearbeiten]

Daniel

Dein Nachname[Bearbeiten]

Mietchen

Deine Email-Adresse[Bearbeiten]

daniel [dot] mietchen [at] googlemail [dot] com

Dein Wohnort[Bearbeiten]

Jena

Dein Blog, Deine Website, Dein Wiki[Bearbeiten]

Sag uns in drei Sätzen, wer du bist und was du machst.[Bearbeiten]

Ich bin Biophysiker und habe zur nichtinvasiven Bildgebung biologischer Materialien promoviert. Derzeit beschäftige mich hauptsächlich mit der Integration von Online-Plattformen - insbesondere Wikis - mit wissenschaftlichen Arbeitsabläufen. Open Access spielt dabei eine zentrale Rolle und steht auch im Mittelpunkt meines Projektes als Wikimedian in Residence on Open Science.

Möchtest du uns noch etwas sagen?[Bearbeiten]

Ich halte es nicht für sinnvoll, zu verlangen, "dass alle Materialien und Inhalte, die im Rahmen der geförderten Idee erstellt werden, unter der Lizenz Creative Commons (CC-BY-SA 3.0) veröffentlicht werden." Ziel ist doch, die Förderung der Verbreitung freien Wissens, und eine Lizensierung unter CC0 oder CC BY sollte daher ebenfalls möglich sein.

So geht's weiter[Bearbeiten]

Per Klick auf „Senden“ reichst du deine Idee bei uns ein. Bitte sende uns zeitnah (spätestens am 24. November 2011) auch dein Budget und den Projektplan per Mail an ideen@wikimedia.de. Ohne diese Mail kann deine Idee nicht bewertet werden!

Budget[Bearbeiten]

  • 3000€ Entwicklerhonorar + 375€ Serverkosten +19%MWSt. = 4016€ (auf ganze Euro gerundet)

Entwicklerhonorar[Bearbeiten]

50€/h vor MwSt.

  • Prototyp Downloader, Transcoder, Uploader, Konfiguration: zusammen ca. 20h (1000€)
  • Prototyp Crawler/ Scraper: ca. 20h (1000€)
  • Prototyp Review Tool: ca. 10h (500€)
  • Troubleshooting und Fine-Tuning: ca. 10h (500€)
  • Zwischensumme: 3000€

Server[Bearbeiten]

  • Servermiete: 5 Monate zu je 75€/Monat vor MWSt.
  • Zwischensumme: 375€

Projektplan[Bearbeiten]

  • 2.1.2012 Projektstart
  • 5.1. Serverbereitstellung
  • 10.1. Prototyp Downloader, Transcoder, Uploader, Konfiguration
  • 20.1. Prototyp Crawler/ Scraper
  • 10.2. Prototyp Review Tool
  • 20.2. Beginn des Medienimports
  • 10.3. Troubleshooting und Fine-Tuning
  • 20.3. Beginn Erweiterung der Ressourcen-Liste
  • 10.4. Ende Erweiterung der Ressourcen-Liste
  • 10.5. Überführung auf den Toolserver zum kontinuierlichen Weiterbetrieb
  • 30.5. Projektende

Bitte beachte[Bearbeiten]

Deine Idee wird sowohl der Jury vorgelegt als auch zur öffentlichen Bewertung auf unserer Website und im Meta-Wiki veröffentlicht.

Mit der Einreichung stimmst du zu, dass alle Materialien und Inhalte, die im Rahmen der geförderten Idee erstellt werden, unter der Lizenz Creative Commons (CC-BY-SA 3.0) veröffentlicht werden. Software muss entsprechend unter eine Free/Libre/Open-Source-Software-Lizenz gestellt werden. Du erklärst dich außerdem damit einverstanden, dein Projekt im Fall einer Förderung ausführlich zu dokumentieren und Wikimedia Deutschland regelmäßig über den Fortgang zu informieren.

Es werden nur Einreichungen in deutscher Sprache berücksichtigt. Der Rechtsweg ist ausgeschlossen.

Siehe auch[Bearbeiten]