Zum Inhalt springen

Textanalyse und Textgenerierung/Kryptoanalyse und Stochastik

Aus Wikiversity

Einleitung

[Bearbeiten]

Diese Seite zum Thema Textanalyse und Textgenerierung/Kryptoanalyse und Stochastik kann als Wiki2Reveal Folien angezeigt werden. Einzelne Abschnitte werden als Folien betrachtet und Änderungen an den Folien wirken sich sofort auf den Inhalt der Folien aus. Dabei werden die folgenden Teilaspekte im Detail behandelt:

  • (1) Buchstabenhäufigkeiten in einer Sprache,
  • (2) Bijektive Abbildung von einem Klartextalphabet in ein Geheimtextalphabet,
  • (3) Möglichkeiten und Beispiele, sich mit Stochastik und Texten Verschlüsselung und Kryptoanalyse zu beschäftigen

Zielsetzung

[Bearbeiten]

Diese Lernressource zu Textanalyse und Textgenerierung/Kryptoanalyse und Stochastik in der Wikiversity hat das Ziel, elementare Kryptoanalyse mit Häufigkeitsverteilungen von Buchstaben bei einem bijektiven Schlüssel zwischen einem Quelltextalphabet und einem Geheimtextalphabet herzustellen.

Zielgruppe

[Bearbeiten]

Die Zielgruppe der Lernressource zum Thema Kryptoanalyse und Stochastik Textanalyse und Textgenerierung sind

  • Lehramtstudierende im Fach Mathematik und Informatik
  • Schüler:innen im Fach Mathematik und Informatik

Aufgaben für Lernende / Studierende

[Bearbeiten]

Mit den folgenden Aufgaben zum Thema Kryptoanalyse und Stochastik wird ein Teilbereich von Stochastik mit Texten und Alphabeten bearbeitet.

  • Versuchen Sie, die Wahrscheinlichkeitsverteilung auf dem deutschen Alphabet mit Sonderzeichen zu bestimmen (Internet, konkrete Text, ...).
  • Wie hilft die Kenntnis über diese Wahrscheinlichkeitsverteilung dabei, einen kodierten Buchstaben mit einem bijektiven Alphabet-Kodierer zu entschlüsseln?

Alphabet

[Bearbeiten]

Ein Alphabet ist im diesem Kontext eine Menge von Zeichen, die allerdings ggf. nicht nur Buchstaben, sondern auch Zahlen, Sonderzeichen und das Leerzeichen enthalten kann. Diese Alphabet wird im Folgenden mit bezeichnet.

Wörter

[Bearbeiten]

Wörter sind Sequenzen von Zeichen. Das Worter "EIMER" besteht aus einer Sequenz (Tupel) von 5 Zeichen aus dem Alphabet. Dabei ist es zulässig, dass ein Zeichen (z.B. das "E") mehrfach in einem Wort auftritt.

Menge aller Wörter

[Bearbeiten]

Wörter sind mathematisch gesehen -Tupel, wobei diese eine beliebige Länge besitzen können. Formal schreibt man:

Beispiel: , wobei als z.B. das Alphabet mit allen Großbuchstaben gewählt wird.

Häufigkeiten von Buchstaben

[Bearbeiten]

In der deutschen Sprachen kommen nicht alle Buchstaben in Texten mit der gleichen Häufigkeit vor. Sei nun unser Ergebnisraum , Sigma-Algebra die Potenzmenge des Alphabets und die Wahrscheinlichkeitsverteilung, mit der jedem Zeichen die Wahrscheinlichkeit für das Auftreten in einem deutschen Text zugeordnet wird.

Bijektiver Schlüssel

[Bearbeiten]

Ein bijektiver Schlüssel ist eine bijektive Abbildung von .

Literatur/Quellennachweise

[Bearbeiten]


Siehe auch

[Bearbeiten]

Seiteninformation

[Bearbeiten]

Diese Lernresource können Sie als Wiki2Reveal-Foliensatz darstellen.

Wiki2Reveal

[Bearbeiten]

Dieser Wiki2Reveal Foliensatz wurde für den Lerneinheit Textanalyse und Textgenerierung' erstellt der Link für die Wiki2Reveal-Folien wurde mit dem Wiki2Reveal-Linkgenerator erstellt.