Zum Inhalt springen

Kurs:Maschinelles Lernen/Daten laden und speichern

Aus Wikiversity

Einführung

[Bearbeiten]

Das Laden von Daten aus CSV-Dateien ist ein zentraler Schritt, um Trainingsdaten für das maschinelle Lernen in den nachfolgenden Softwarepaketen verfügbar zu machen. Um mit den Daten zu arbeiten, muss man ferner auch wissen, wie man auf einzelne Werte oder Datensätze zugreifen kann. In dieser Lerneinheit wird das Laden und Speichern an OpenSource-Beispielen betrachtet (siehe Open Community Approach) einige Beispiele für den Zugriff auf einzelne Werte in den Daten für jede Sprache:

Zentrale Schritte

[Bearbeiten]

Zugriff auf einzelne Werte

[Bearbeiten]

Um auf einzelne Werte in den Daten zuzugreifen, können Sie die folgenden Funktionen verwenden:

  • GNU R: data$Spalte[Zeile]
  • Octave: data(Zeile, Spalte)
  • Maxima: data[Zeile, Spalte]
  • Python: data.iloc[Zeile, Spalte] oder data.loc[Zeile, Spalte]

Zugriff auf Spalten und Zeilen

[Bearbeiten]

Um auf Spalten und Zeilen zuzugreifen, können Sie die folgenden Funktionen verwenden:

  • GNU R: data[, Spalte] oder data[Zeile, ]
  • Octave: data(:, Spalte) oder data(Zeile, :)
  • Maxima: data[, Spalte] oder data[Zeile, :]
  • Python: data[Spalte] oder data.loc[Zeile]

Beispiele - Zugriff auf einzelne Werte

[Bearbeiten]

Hier sind einige Beispiele für den Zugriff auf einzelne Werte in den Daten für jede Sprache:

GNU R

[Bearbeiten]
# Laden von Daten aus einer CSV-Datei
data <- read.csv("daten.csv")

# Zugriff auf einzelne Werte
print(data$Spalte[1])  # Zugriff auf den ersten Wert in der Spalte
print(data$Spalte[2])  # Zugriff auf den zweiten Wert in der Spalte

Octave

[Bearbeiten]
# Laden von Daten aus einer CSV-Datei
data = csvread("daten.csv");

# Zugriff auf einzelne Werte
disp(data(1, 1))  # Zugriff auf den ersten Wert in der ersten Zeile
disp(data(2, 2))  # Zugriff auf den zweiten Wert in der zweiten Zeile

Python

[Bearbeiten]

In dem folgenden Beispielcode wird mit der Bibliothek pandas gearbeitet, die zu Beginn des Codebeispiels importiert wird.

import pandas as pd

# Laden von Daten aus einer CSV-Datei
data = pd.read_csv("daten.csv")

# Zugriff auf einzelne Werte
print(data.iloc[0, 0])  # Zugriff auf den ersten Wert in der ersten Zeile
print(data.iloc[1, 1])  # Zugriff auf den zweiten Wert in der zweiten Zeile

Beispiele - Zeilen- und Spaltenzugriff

[Bearbeiten]

Hier sind einige Beispiele für den Zugriff auf Spalten und Zeilen für jede Sprache:

GNU R

[Bearbeiten]
# Laden von Daten aus einer CSV-Datei
data <- read.csv("daten.csv")

# Zugriff auf eine Spalte
print(data[, 1])  # Zugriff auf die erste Spalte

# Zugriff auf eine Zeile
print(data[1, ])  # Zugriff auf die erste Zeile

Octave

[Bearbeiten]
# Laden von Daten aus einer CSV-Datei
data = csvread("daten.csv");

# Zugriff auf eine Spalte
disp(data(:, 1))  # Zugriff auf die erste Spalte

# Zugriff auf eine Zeile
disp(data(1, :))  # Zugriff auf die erste Zeile

Python (mit pandas)

[Bearbeiten]
import pandas as pd

# Laden von Daten aus einer CSV-Datei
data = pd.read_csv("daten.csv")

# Zugriff auf eine Spalte
print(data[0])  # Zugriff auf die erste Spalte

# Zugriff auf eine Zeile
print(data.loc[0])  # Zugriff auf die erste Zeile


Siehe auch

[Bearbeiten]