Kurs:Mathematische Modellbildung/Themen/Sprache und Semantische Netze/Einführung Thema

Aus Wikiversity

Einleitung[Bearbeiten]

  • Ziel: Erstellung eines Epochenschlüssels zur Einordnung unbekannter/undatierter Gedichte
  • untersuchte Textart: Gedichte (bieten sich für eine Untersuchung am besten an, da sie häufig einem schematischen Aufbau folgen und es distinktive Merkmale gibt im Gegensatz zu anderen Gattungen wie Epos oder Dramen)
  • Epochen: Renaissance, Romantik, Moderne
  • untersuchte Merkmale: Versanzahl, Reimschema, Metrum

Theorie zur Bestimmung der Rohdaten[Bearbeiten]

Epochen[Bearbeiten]

  • Renaissance:1500-1649
  • Romantik: 1780-1837
  • Moderne: 1914-1945

Metrum[Bearbeiten]

(unbetont: x, betont: /)

  • Jambus: x/
  • Trochäus: /x
  • Daktylus: /xx
  • Anapäst: xx/

Reimschemata[Bearbeiten]

  • Paarreim: aabb
  • Kreuzreim: abab
  • umarmender Reim: abba
  • verschränkender Reim: abc abc

Tabellarische Darstellung der Rohdaten am Beispiel Renaissance[Bearbeiten]

Mathematische Aspekte[Bearbeiten]

Problemstellung der Modellierung[Bearbeiten]

  • Besteht die Möglichkeit undatierte Gedichte anhand eines von uns definierten Epochenschlüssels einer Epoche zuordnen zu können ?

Mathematische Grundlagen/Theorien zur Berechnung[Bearbeiten]

Sekundarstufe I:[Bearbeiten]

  • Satz des Pythagoras
  • Tabellenkalkulation, Daten in Excel eintragen
  • Anteil verschiedener Merkmale der Gedichte als Bruch ausdrücken
  • Brüche in Prozentschreibweise umwandeln
  • Berechnung arithmetisches Mittel

Sekundarstufe II:[Bearbeiten]

  • Eintragen von Punkten und Vektoren im Koordinatensystem des ℝ3
  • Bestimmen/Berechnen von Punkten im ℝ3
  • Abstandsberechnung von Punkten im ℝ3
  • Vektorrechnung im ℝ3 (Bestimmen von Längen)
  • Einsatz von GeoGebra
  • Kugelgleichung im ℝ3
  • Normen, Metrik, Topologie

Universität:[Bearbeiten]

Programme zur Berechnung[Bearbeiten]

  • Sek I: GeoGebra, Tabellenkalkulation
  • Sek II: GeoGebra
  • Universität: wxMaxima, Tabellenkalkulation

Durchführung Modellierungszyklus 1[Bearbeiten]

Ziel[Bearbeiten]

  • Bestimmen von Kugeln im ℝ3 (=Epochen), um Gedichte (dargestellt als Punkte im ℝ3) mit Berechnung des Abstands zur Kugel zu Epochen zuordnen zu können
  • Annahme: Gedichte gehören zu der Epoche, zu der sie den geringsten Abstand aufweisen.

Modellierung[Bearbeiten]

Erhebung der Daten[Bearbeiten]

  • durch eigene Analyse von Gedichten (je 5 Trainingsgedichte, 3 Testgedichte pro Epoche)
  • Eintragen der Daten in Tabellenkalkulationsprogramm
  • Bestimmen des arithmetischen Mittels für jedes untersuchte Merkmal

Bestimmung der Punkte der Gedichte und Epochen im ℝ3[Bearbeiten]

Punkte Trainingsgedichte Renaissance (GeoGebra)
  • Beschränkung auf x: Jambus, y: Trochäus, z: Verszahl der Gedichte aus Daten
  • Verwendung von x,y,z als Koordinaten der Punkte der Gedichte
  • Epochen dargestellt durch Durchschnittswerte für x,y,z

Bestimmung Kugelgleichung anhand der Trainingsgedichte[Bearbeiten]

  • Durchschnittswerte der Epoche für x,y,z als Mittelpunkt der Kugel
  • Radius: größter Abstand eines zugehörigen Trainingsgedichts zur Epoche
Bestimmung Abstände Trainingsgedichte zu Mittelpunkt 1[Bearbeiten]
Quader um die Punkte Renaissance und Donne (GeoGebra)
  • größter Abstand = Radius Kugel
  • Erstellen Quader um den Mittelpunkt und Punkt eines Trainingsgedichts (Seiten parallel zu Ebenen definiert durch Achsen)
  • Raumdiagonale Quader entspricht Abstand der Punkte
Bestimmung Abstände Trainingsgedichte zu Mittelpunkt 2[Bearbeiten]
  • mithilfe Satz des Pythagoras kann Länge Raumdiagonale bestimmt werden
Abbildung des Satz des Pythagoras zur Bestimmung des Abstandes der Punkte Renaissance und Donne (GeoGebra)
  • Erstellen der Formel für weitere Berechnungen:
  • Berechnungen können mithilfe von GeoGebra überprüft werden
Bestimmung der Kugelgleichung[Bearbeiten]
Kugeln aller Epochen und alle Testgedichte
  • aus Durchschnittspunkt der Epoche (=Kugelmittelpunkt) und größtem Abstand Trainingsgedicht zu Durchschnittspunkt Epoche (=Radius)
  • Einsetzen der Werte in Koordinatenform:
  • Darstellung mit GeoGebra

Test des Modells mithilfe der Testgedichte[Bearbeiten]

  • Überprüfung Güte des Modells
  • Überprüfung, ob Testgedichte zur passenden Epoche zugeteilt werden durch Berechnung des Abstands zu allen Kugelmittelpunkten
  • Berechnung durch Bestimmung Länge Verbindungsvektor (Überprüfung mit GeoGebra)
  • Zuordnung zu Epoche in Tabellenkalkulation dargestellt (=WENN(UND(C4<D4;C4<E4);"Renaissance"; WENN(UND(D4<C4;D4<E4);"Romantik";"Moderne")))
  • Ausgabe richtige oder falsche Zuordnung in Tabellenkalkulation (=WENN(F4="Renaissance";"ja";"nein"))

Bewertung und Optimierung Modellierungszyklus 1[Bearbeiten]

  • nur 4 von 9 Testgedichten richtig zugeordnet
  • Optimierungsvorschläge:
  • mehr Merkmale beachten
  • mehr Daten (Trainings- und Testgedichte)
  • prozentuale Zuordnung und nicht "1:1"-Zuordnung bestimmen

Durchführung Modellierungszyklus 2[Bearbeiten]

Ziel[Bearbeiten]

  • Finden einer Funktion f zur prozentualen Zuordnung der Gedichte zu den Epochen
  • Berechnung Fehler der Funktion f
  • Bestimmen Fehlerfunktion E zur Funktion f
  • Minimieren des Fehlers mithilfe des Gradientenabstiegsverfahrens/ Optimierung der Funktion f

Modellierung[Bearbeiten]

Aufstellen der Funktion f 1[Bearbeiten]

  • gibt prozentuale Zuordnung der Gedichte zu den 3 Epochen aus
  • mögliche Werte müssen im Intervall liegen
  • "perfekte" Zuordnung hat Wert 1, keine Übereinstimmung bei Wert 0
  • Form f: Spaltenvektor mit der Zuordnung
  • Berechnung der Funktionswerte mit WxMaxima

Aufstellen der Funktion f 2[Bearbeiten]

Funktion f Zuordnung Gedichte zu Epochen

Berechnung des Fehlers von f[Bearbeiten]

  • Bestimmen der Güte der Funktion
  • Vergleich der Länge der Vektoren der Funktionswerte und der tatsächlichen Zuordnungen
  • Quadrieren: positive Ergebnisse, Differenzierbarkeit
  • Gesamtfehler der Funktion durch Bildung der Summe aller Fehler der Trainingsgedichte

Aufstellen der Fehlerfunktion E[Bearbeiten]

Fehlerfunktion E
  • Ersetzen der Daten der Mittelpunkte der Kugeln durch Variablen
  • später: Optimierung der Kugelmittelpunkte und Minimierung Fehler

Gradientenabstiegsverfahren[Bearbeiten]

  • Iteratives Verfahren
  • Optimierung der Fehlerfunktion (Finden des Minimums von E)
  • Verschiebung Kugelmittelpunkte
  • Verringerung Fehler
  • Verwenden des negativen Gradienten (Richtung stärkster Abstieg) zum Finden des Minimums der Funktion
  • Abbruchkriterium: Gradient wird 0
  • in unserem Fall: Wert Optimierung = 0
Bestimmen Gradient[Bearbeiten]
  • Bestimmen partielle Ableitungen der Fehlerfunktion E
  • Verwendung WxMaxima
Berechnung Gradientenabstiegsverfahren mithilfe Tabellenkalkulation 1[Bearbeiten]
  • 18 Iterationsschritte -> zeitliche Begrenzung
  • Eingabe Startwerte (Mittelpunkte der Kugeln, Schrittweite 1)
  • Veränderung der Variablen (Mittelpunkte der Kugeln) (durch Tabellenkalkulation =WENN($ AE3<$ AD3;A3+T3;A3))
Gradientenabstiegsverfahren: Variablen
Berechnung Gradientenabstiegsverfahren mithilfe Tabellenkalkulation 2[Bearbeiten]
  • falls optimierter Funktionswert von E kleiner als vorheriger Funktionswert: Addition des Schritts zur Variable
  • Eintragen Wert partieller Ableitungen (berechnet mit WxMaxima als Summe aller Werte der partiellen Ableitungen der einzelnen Trainingsgedichte)
  • Schrittweite α als 1 festlegen: bei fehlender Optimierung des Funktionswertes von E wird diese halbiert (durch Tabellenkalkulation =WENN(AE3>AD3;S3/2;S3))
Gradientenabstiegsverfahren: partielle Ableitungen, Schrittweite
Berechnung Gradientenabstiegsverfahren mithilfe Tabellenkalkulation 3[Bearbeiten]
  • Berechnung Schritt der Variablen: negativer Wert normierter Gradient (Division durch seine Vektorlänge) wird mit Schrittweite multipliziert (durch Tabellenkalkulation =-J3*S3/AC3)
Gradientenabstiegsverfahren: Schritte, Vektorlänge
  • Berechnung Vektorlänge Gradient zur Normierung des Gradienten durch euklidische Norm des Gradientenvektors (durch Tabellenkalkulation =WURZEL(J3^2+K3^2+L3^2+M3^2+ N3^2+O3^2+P3^2+Q3^2+R3^2))
Berechnung Gradientenabstiegsverfahren mithilfe Tabellenkalkulation 4[Bearbeiten]
  • Berechnung Funktionswert der Fehlerfunktion E vor der Optimierung des Iterationsschritts (durch WxMaxima)
  • Berechnung Funktionswert der Fehlerfunktion E nach Optimierung durch Addition Schritt zur Variable (durch WxMaxima)
  • Bestimmung der Optimierung: Subtraktion neuer von altem Funktionswert (durch Tabellenkalkulation =AD3-AE3)
Gradientenabstiegsverfahren Optimierung

Bestimmen der verbesserten Funktion f und der Funktionswerte und Fehler[Bearbeiten]

  • Einsetzen der neu berechneten Punkte in die Funktion f
  • mit neuer Funktion Funktionswerte Trainingsgedichte berechnen
  • Fehler der Trainingsgedichte mit neuen Kugelmittelpunkten bestimmen

Bestimmen der Zuordnung der Testgedichte anhand der verbesserten Funktion f[Bearbeiten]

  • Bestimmen der Funktionswerte der verbesserten Funktion f mit den Werten der Testgedichte
  • in WxMaxima
  • Eingabe in Tabellenkalkulation, Zuordnung automatisch ausgegeben
=WENN(UND(C4>D4;C4>E4);"Renaissance"; WENN(UND(D4>C4;D4>E4);"Romantik";"Moderne"))
  • automatische Ausgabe in Tabellenkalkulation, ob richtig zugeordnet
=WENN(F5="Renaissance";"ja";"nein")

Bewertung und Optimierung Modellierungszyklus 2[Bearbeiten]

  • Funktion zur prozentualen Zuordnung erstellt
  • Fehler konnte verringert werden
  • verbesserte Funktion erstellt
  • mehr Iterationsschritte möglich
  • Automatisierung Gradientenabstiegsverfahren
  • geringe Anzahl an verwendeten Merkmalen
  • wenige Daten verwendet

Seiteninformation[Bearbeiten]

Dieser Wiki2Reveal Foliensatz wurde für den Lerneinheit Kurs:Mathematische Modellbildung' erstellt der Link für die Wiki2Reveal-Folien wurde mit dem Wiki2Reveal-Linkgenerator erstellt.