R (Software)

Aus Wikiversity

Die Software und Programmiersprache R zusammen mit der graphischen Benutzerschnittstelle R-Studio ermöglicht die Auswertung und Visualisierung von Daten.

Aufgabe für Lernende[Bearbeiten]

  • (Visualisierung von Daten) Suchen Sie sich ein Anwendungsgebiet aus dem Bereich Visualisierung von erhobenen Daten. Welche Visualisierungsmöglichkeiten von Daten kennen Sie allgemein und wie werden diese in R verwendet?
  • (Export von Daten - Wikiversity) Exportieren Sie Beispieldaten oder verwenden Sie Demodaten in eine CSV-Datei. Analysieren Sie Möglichkeiten der Diagrammdarstellung von CSV-Dateien mit CSV2Chart für Wikiversity-Lernumgebungen, die mit mathematischen Analysen arbeiten und diese Ergebnisse von Beispielanalysen in der Lernumgebung darstellen. Führen Sie einen solchen Datenexport durch und speichern Sie das Diagramm in Ihrer eigenen Nutzer:innen-Seite oder in der Wikiversity-Sandbox, um das Ergebnis zu überprüfen.
  • (SOFA - Statistics Open For All) Analysieren die OpenSource-Software (SOFA) Statistics Open For All [1]. Für welche Lerngruppen, wissenschaftliche Arbeiten, Seminararbeiten, ... würden Sie SOFA verwenden und für welche Anwendungsfälle in der statistischen Auswertung von Daten ist R die geeigneter? Stellen Sie dazu Kategorien auf, die Ihnen wichtig bei der Auswertung von Daten sind und vergleichen Sie die Software bzgl. dieser Kategorien (z.B. Benutzerführung, Hilfesystem, größe der Community zur Software, ....)
  • (Numerische oder statistische Auswertung von Daten) Bei einer numerischen Anwendung werden z.B. mathematische Funktionen berechnet, die z.B. einen zeitlichen Verlauf in den erhobenen Daten durch eine Funktion beschreibt. In der Statistik gibt es Zeitreihenanalysen, um einen zeitlichen Verlauf beschreiben.
    • Untersuchen Sie Ihr Anwendungsgebiet und die Struktur Ihrer Daten und erläutern Sie, ob sich eher numerische Methoden oder eher statistische Methoden für die Datenanalyse eignen (ggf. sogar ein Mischung aus Verfahren)!
    • Erläutern Sie, wie sich daraus die Auswahl von Softwarepaketen ergibt, mit denen Sie die Aufgabe der Datenanalyse durchführen wollen!
  • (Computeralgebrasysteme CAS) Untersuchen Sie das Computeralgebrasysteme Maxima bzgl. des generellen Funktionsumfangs (z.B. Ableitung von Funktionen, Integration, Lösung von Gleichungssystemen, Matrixmultiplikation, ...)! Wie können Sie den Funktionsumfang eines Computeralgebrasystems für die Datenauswertung verwenden oder umgekehrt die Resulate der Datenauswertung in R, SOFA oder Octave in einem Computeralgebrasystem? (z.B. nach Berechnung von Funktionsparameter die Funktion in Maxima eingeben)
  • (Tabellenkalkulation) Daten werden oft vor der Analyse mit Statistiksoftware (oder auch numerischer Software) aufbereitet, fehlende Daten identifiziert und Unkonsistenzen in der Datenerhebung identifiziert
(z.B. gemessene Temperatur in der Stadt "299 Grad" ist eher einem Tippfehler und es wurde wahrscheinlich 29 Grad gemessen. Den Datenpunkt kann man dann als Datensatz nicht verwerten, wenn die Temperatur in der Erhebung nicht gemessen werden konnte)
Wie kann man eine Konsistenzüberprüfung der Daten z.B. LibreOffice Calc durchgeführt werden, damit solche fehlerhaften Eingaben identifiziert werden können (z.B. =WENN(A1 > 40;"Fehler in Eingabe","OK"). Erläutern Sie, wie Sie eine solche Konsistenzüberprüfung auch in R durchführen können.
  • (KnitR) Untersuchen Sie die Möglichkeit, Datenerhebung und Analyse in eine Report-Dokument mit KnitR zu intergrieren. Welche Vorteile und Herausforderungen gibt es, ein solches integrierte Konzept in die Datenanalyse zu integrieren?

Externe Quellen[Bearbeiten]

Siehe auch[Bearbeiten]

Quellennachweis[Bearbeiten]

  1. SOFA OpenSource-Software (2021) Statistics Open For All (SOFA) URL: http://www.sofastatistics.com/home.php (accessed 2021/04/22)