Datenanalyse
"Data analysis' ist der Prozess der Betrachtung und Zusammenfassung von Daten mit der Absicht, nützliche Informationen zu extrahieren und Schlussfolgerungen daraus abzuleiten. Mit statistischer oder numerischer Software können Datenanalysen mithilfe einer Reihe von Techniken, einschließlich Statistik, durchgeführt werden.
Beachten Sie, dass "Datenanalyse" verschiedene Aspekte und möglicherweise verschiedene Namen in verschiedenen Bereichen besitzt.
Prozess
[Bearbeiten]
Aktivitäten
[Bearbeiten]Die ersten Aktivitäten betreffen Diagramm oben und die Einbettung der Datenanalyse in Entscheidungsprozesse.
- (Entscheidungsfindung), warum die Datenanalyse für evidenzbasierte Entscheidungsfindung relevant ist.
- (Use Case) Schauen Sie sich das Diagramm oben an und schauen Sie sich Ihr Fachgebiet an. Bevölkern Sie die verschiedenen Schritte mit einem Workflow mit Rohdaten, auf die Sie Zugriff haben.
- Spatial Decision Support Systems (SDSS) überbrücken den Bereich der Datenanalyse und Entscheidungsunterstützung und der Umgang mit räumlichen Daten. Sehen Sie sich die Domain Transportation an. Erstellen Sie einen Workflow für die Analyse von räumlichen Daten für Transportgüter zusammen mit den LKWs, Schiffen, Zügen, Flugzeugen... und identifizieren Sie nachhaltige Transportmöglichkeiten von Waren und Dienstleistungen an einen Kunden.
- adressieren Sie die Datenanalyse für die Nutzung der Kapazitäten von LKWs und Zügen, so dass das Fahren ohne Fracht oder minimale Nutzung der Kapazität reduziert wird. Indikatoren in der Datenanalyse identifizieren, um spezifische Nachhaltige Entwicklungsziele zu adressieren. Identifizieren Sie, welche SDGs angesprochen werden und wie die Definition von Sustainable Development Goals.SDGs] die verwendeten Methoden für die Datenanalyse bestimmen. Beschreiben Sie die Grundlagen der Datenanalyse, die erforderlich sind, um die Auswirkungen der Intervention auf ein nachhaltiges Verkehrs- und Liefersystem zu messen.
- (Machinelles Lernen) Daten können mit [[[machine learning]] verarbeitet werden. Vergleichen Sie Methoden der klassischen statistischen Analyse und des maschinellen Lernens als eine Möglichkeit der Datenanalyse. Was sind Ähnlichkeiten, Unterschiede, Vorteile und Nachteile zwischen diesen Ansätzen?
- (Digitale Lernumgebung) Betrachten Sie digitale Lernumgebungen] und das oben angegebene Diagramm.
- Betrachten Sie eine bestimmte Lernumgebung in Ihrer Domain. Wie würde ein Lehrer geeignete Lernaufgaben auswählen, die für den Schüler in einer Weise zugeschnitten sind, dass die Übung schwierig genug und zu komplex ist? Was sind die Indikatoren (erforderliche Informationen) für den Lehrer an die Übung oder die Unterstützung, die der Lehrer den spezifischen Anforderungen und Zwängen des Schülers/Lerners angemessen bietet?
- Nun übertragen wir das auf die Datenanalyse (in diesem Fall learner Analytics). Kennen Sie Daten, die in einer digitalen Lernumgebung gesammelt werden können, die verwendet werden können, um den Lehrer bei der Bereitstellung von maßgeschneiderten Lehr- und Lernmaterial für den Schüler zu unterstützen?
- Wählen Sie aus Ihrem aktuellen Wissen über die Datenanalyse eine geeignete Methodik, um die erhobenen Daten zu analysieren. Beginnen Sie von sehr Basismethoden von
- bedeutet,
- Standardabweichung,
- schlimmster Fall, bester Fall...
Wiki2Reveal Slides
[Bearbeiten]Die folgenden Wiki2Reveal-Präsentationen können von Dozenten als Open Educational Resources] verwendet werden, um ihre Kursarbeit zusätzlich zu Standard-Statistik- und Zahlenansätzen zur Verarbeitung und Analyse von Daten zu unterstützen.
Kapitel 1 - Einführung =
[Bearbeiten]- Einführung - (Wiki2Reveal slides)
- Geschichte - (Wiki2Reveal slides) ].
- Schwarmintelligenz - Sehen Sie sich das Konzept von Schwarmintelligenz an und identifizieren Sie, wie Daten in der Gruppe von Individuen analysiert und gespeichert werden.
Lernaufgabe
[Bearbeiten]- (1) Erkennen Sie ein Anwendungsszenario, für das Sie Ihre Datenanalyse anwenden möchten. Schreiben Sie eine kleine Zusammenfassung Ihres Projekts (z.B. Bachelor, Master, Doktorarbeit).
- (2) Beschreiben Sie das experimentelle Design, in dem die Daten erhoben werden.
- (3) Geben Sie ein Szenario an,
- (3.1) bei der Sie eine feste Zeit für die Datenerhebung haben und nach der Datenerhebung die Datenanalyse beginnt und
- (3.2) bei dem Sie einen konstanten Eingangsstrom von Daten erhalten, der kontinuierlich mit einer geeigneten Methodik für dynamische Berichterstattung und dynamische Datenanalyse im Echtzeitszenario verarbeitet werden muss
- in Bachelor, Master, Doktorarbeit haben Sie hauptsächlich Szenario (3.1). In diesem Fall ist es nur eine Übung, von (3.1) auf ein Szenario (3.2) zu extrapolieren, das einen konstanten Eingangsstrom von Daten für eine dynamische Analyse behandelt.
- (4) Schwarmintelligenz: Vergleichen Sie den Ablaug der Datenanalyse und vergleichen Sie die dort aufgeführten Aspekte mit Problemlösefähigkeiten in einem Schwarm. Schwärme können Daten nicht in einen zentralen Swarm-Container speichern und diese zentral analysieren. Individuen in einem Schwarm nehmen unterschiedliche Informationen/Daten wahr und der Schwarm reagiert auf die wahrgenommenen Daten als Gruppe. Identifizieren Sie Analogien und Unterschiede zwischen Schwarmintelligenz und Datenanalyse auf qualitativer Ebene.
= Kapitel 2 - Datenreinigung - Verarbeitung von Rohdaten
[Bearbeiten]Der Abschnitt behandelt die Vorverarbeitung von Daten.
- Gleitender Mittelwert - ist ein Beispiel, wie Vorverarbeitung verwendet werden kann, um Daten zu reinigen und Geräusche zu entfernen.
- Datenkompression - (Wiki2Reveal slides) ] - stellen die gleichen Informationen mit weniger Daten dar.
- Fehlende Daten und Datenimputation und unvollständige Datensätze / Aufzeichnungen und wie man misst, dass es keinen Einfluss auf die mittlere und Standardabweichung des Datensatzes hat.
- [Normalisierung] ' '
Lernaufgabe
[Bearbeiten]- Schauen Sie sich die Daten an, die von einer Börse für eine bestimmte Aktie kommen. Erklären Sie den Vorteil der Vorverarbeitung der Daten mit einem Moving Average. Was ist Rauschen in den Daten und wie trägt Moving Average] dazu bei reduce Geräusch in den Daten].
- Fehlende Daten können eine Herausforderung für den Forscher sein, da in der Datenanalyse möglicherweise unvollständige Datensätze nicht verwendet werden. Erklären Sie die Umstände, unter denen die Eingabe fehlender Daten dazu beitragen könnte, mehr Daten in die Datenanalyse einzubeziehen und welche Anforderungen und Einschränkungen für die Datenerhebung sind.
Kapitel 6 - Mustererkennung =
[Bearbeiten]- Hopfield network - (Wiki2Reveal slides)
- Künstliche Intelligenz im Gesundheitswesen
- Lernen und neuronale Netze
Lernmodule
[Bearbeiten]Siehe auch =
[Bearbeiten]- Fuzzy-Logik
- Räumliche Entscheidungsunterstützungssysteme
- Nachhaltigkeitsziele
- Gleitender Mittelwert
- Verkehr
- statistische Software
- Schwarmintelligenz