Benutzer:O.tacke/2015/Big Data

Aus Wikiversity

Ich versuche mich an einer MOOC-Reihe, die bei Coursera "Spezialisierung" heißt. Sie dreht sich um das Thema "Big Data". Ich habe die Spezialisierung kurz vor Schluss abgebrochen. Die Kurse waren einfach zu schlecht.

Kurs 1: Introduction to Big Data[Bearbeiten]

Die Einführung war gelinde gesagt ein Witz. Angekündigt war der Kurs für drei Wochen mit einem Aufwand von jeweils 5-6 Stunden, erledigt habe ich ihn an einem Nachmittag. Das lag leider nicht daran, dass ich ein Genie wäre, sondern dass in den Tests lediglich einige Fakten aus den zuvor genannten Videos reproduziert werden mussten. Es ist sicherlich seeeehr hilfreich zu wissen, dass in den USA demnächst 140.000 bis 190.000 Analysten für Big Data benötigt werden. Am zeitaufwändigsten war noch der Download einer 4 Gigabyte großen Datei, in der sich eine für Hadoop vorgefertigten Umgebung befand. Ich bin schwer am überlegen, ob ich mir den Rest überhaupt antun soll. Immerhin soll es im nächsten Teil dann praktisch werden. Abwarten.

Das "Zertifikat"

Kurs 2: Hadoop Platform and Application Framework[Bearbeiten]

Der zweite Kurs war didaktisch so ziemlich aus der untersten Schublade. Die Videos waren nicht nur so hässlich und folienumentig wie im ersten Kurs, die neuen Dozenten haben auch teilweise bloß die Stichwörter vorgelesen. Den Knaller fand ich, den Ablauf eines Tutorials von Cloudera vorzustellen, das ja eigentlich dafür da ist, dass man es selbst durcharbeitet. Tz, tz. Immerhin war es inhaltlich gehaltvoller als bei Kurs 1, und dass nun neben den immer noch hohlen Tests auch einige praktische Programmieraufgaben zu bewältigen sind, werte ich auch positiv. Nichts, was ich mir nicht selbst auch hätte aneignen können, aber wenigstens eine Art Tutorial. Es wurde besser. Aufhören oder weitermachen???

Das "Zertifikat"

Kurs 3: Introduction to Big Data Analytics[Bearbeiten]

Auweia, es wird nicht besser. Offenkundig ohne didaktische Überlegungen werden Fakten zu PIG, HIVE und Spark präsentiert, einschließlich Vorstellen von Quelltext in Windeseile per Vortrag. Analysemöglichkeiten werden rudimentär angeschnitten, was für eine Einführung wohl auch genügt -- aber dafür genügt sicher jedes x-beliebige Tutorial der jeweiligen Software, das es anderswo auch zu finden gibt. Die drei Low-Lights waren über die bereits bekannten Debakel aus den ersten beiden Kursen hinaus:

  1. Die Test-Fakten-Fragen beziehen sich auf Inhalte, die erst später im Kurs vorgestellt werden.
  2. Die Daten, sie man sich zur Bearbeitung des Kurses von einer Website herunterladen muss, sind offenbar inzwischen aktualisiert worden und stimmen nicht mehr überein, so dass man andere Ergebnisse erhält.
  3. Die kommerzielle Software splunk lässt sich zwar kostenlos herunterladen, dafür wird man aber zu einem E-Mail-Opt-In gezwungen (es lebe die Anonbox) -- zudem warnt Ubuntu vor einer Installation konkret vor Sicherheitsproblemen mit der Software.

Mich interessiert die gesamte Kursreihe eigentlich nur noch, weil es am Ende ein abschließendes Projekt geben soll...

Das "Zertifikat"