Kurs:Mathematische Modellbildung/Themen/Sprache und Semantische Netze/Einführung Thema

Einleitung

Ziel: Erstellung eines Epochenschlüssels zur Einordnung unbekannter/undatierter Gedichte
untersuchte Textart: Gedichte (bieten sich für eine Untersuchung am besten an, da sie häufig einem schematischen Aufbau folgen und es distinktive Merkmale gibt im Gegensatz zu anderen Gattungen wie Epos oder Dramen)
Epochen: Renaissance, Romantik, Moderne
untersuchte Merkmale: Versanzahl, Reimschema, Metrum

Theorie zur Bestimmung der Rohdaten

Epochen

Renaissance:1500-1649
Romantik: 1780-1837
Moderne: 1914-1945

Metrum

(unbetont: x, betont: /)

Jambus: x/
Trochäus: /x
Daktylus: /xx
Anapäst: xx/

Reimschemata

Paarreim: aabb
Kreuzreim: abab
umarmender Reim: abba
verschränkender Reim: abc abc

Tabellarische Darstellung der Rohdaten am Beispiel Renaissance

Mathematische Aspekte

Problemstellung der Modellierung

Besteht die Möglichkeit undatierte Gedichte anhand eines von uns definierten Epochenschlüssels einer Epoche zuordnen zu können ?

Mathematische Grundlagen/Theorien zur Berechnung

Sekundarstufe I:

Satz des Pythagoras
Tabellenkalkulation, Daten in Excel eintragen
Anteil verschiedener Merkmale der Gedichte als Bruch ausdrücken
Brüche in Prozentschreibweise umwandeln
Berechnung arithmetisches Mittel

Sekundarstufe II:

Eintragen von Punkten und Vektoren im Koordinatensystem des ℝ³
Bestimmen/Berechnen von Punkten im ℝ³
Abstandsberechnung von Punkten im ℝ³
Vektorrechnung im ℝ³ (Bestimmen von Längen)
Einsatz von GeoGebra
Kugelgleichung im ℝ³
Normen, Metrik, Topologie

Universität:

Gradientenabstiegsverfahren
mehrdimensionale Differentialrechnung (v.a. partielle Ableitung und Bestimmung Gradient)
Fehlerrechnung

Programme zur Berechnung

Sek I: GeoGebra, Tabellenkalkulation
Sek II: GeoGebra
Universität: wxMaxima, Tabellenkalkulation

Durchführung Modellierungszyklus 1

Ziel

Bestimmen von Kugeln im ℝ³ (=Epochen), um Gedichte (dargestellt als Punkte im ℝ³) mit Berechnung des Abstands zur Kugel zu Epochen zuordnen zu können
Annahme: Gedichte gehören zu der Epoche, zu der sie den geringsten Abstand aufweisen.

Modellierung

Erhebung der Daten

durch eigene Analyse von Gedichten (je 5 Trainingsgedichte, 3 Testgedichte pro Epoche)
Eintragen der Daten in Tabellenkalkulationsprogramm
Bestimmen des arithmetischen Mittels für jedes untersuchte Merkmal

Bestimmung der Punkte der Gedichte und Epochen im ℝ³

Beschränkung auf x: Jambus, y: Trochäus, z: Verszahl der Gedichte aus Daten
Verwendung von x,y,z als Koordinaten der Punkte der Gedichte
Epochen dargestellt durch Durchschnittswerte für x,y,z

Bestimmung Kugelgleichung anhand der Trainingsgedichte

Durchschnittswerte der Epoche für x,y,z als Mittelpunkt der Kugel
Radius: größter Abstand eines zugehörigen Trainingsgedichts zur Epoche

Bestimmung Abstände Trainingsgedichte zu Mittelpunkt 1

größter Abstand = Radius Kugel
Erstellen Quader um den Mittelpunkt und Punkt eines Trainingsgedichts (Seiten parallel zu Ebenen definiert durch Achsen)
Raumdiagonale Quader entspricht Abstand der Punkte

Bestimmung Abstände Trainingsgedichte zu Mittelpunkt 2

mithilfe Satz des Pythagoras kann Länge Raumdiagonale bestimmt werden

Erstellen der Formel für weitere Berechnungen:

{\begin{aligned}\mid Quaderdiagonale\mid ^{2}&=a_{1}^{2}+a_{2}^{2}+a_{3}^{2}\\&=(q_{1}-p_{1})^{2}+(q_{2}-p_{2})^{2}+(q_{3}-p_{3})^{2}\end{aligned}}

{\begin{aligned}\Rightarrow \mid Quaderdiagonale\mid &={\sqrt {a_{1}^{2}+a_{2}^{2}+a_{3}^{2}}}\\&={\sqrt {(q_{1}-p_{1})^{2}+(q_{2}-p_{2})^{2}+(q_{3}-p_{3})^{2}}}\end{aligned}}

Berechnungen können mithilfe von GeoGebra überprüft werden

Bestimmung der Kugelgleichung

aus Durchschnittspunkt der Epoche (=Kugelmittelpunkt) und größtem Abstand Trainingsgedicht zu Durchschnittspunkt Epoche (=Radius)
Einsetzen der Werte in Koordinatenform: $(x-x_{M})^{2}+(y-y_{M})^{2}+(z-z_{M})^{2}=r^{2}$
Darstellung mit GeoGebra

Test des Modells mithilfe der Testgedichte

Überprüfung Güte des Modells
Überprüfung, ob Testgedichte zur passenden Epoche zugeteilt werden durch Berechnung des Abstands zu allen Kugelmittelpunkten
Berechnung durch Bestimmung Länge Verbindungsvektor (Überprüfung mit GeoGebra)
Zuordnung zu Epoche in Tabellenkalkulation dargestellt (=WENN(UND(C4<D4;C4<E4);"Renaissance"; WENN(UND(D4<C4;D4<E4);"Romantik";"Moderne")))
Ausgabe richtige oder falsche Zuordnung in Tabellenkalkulation (=WENN(F4="Renaissance";"ja";"nein"))

Bewertung und Optimierung Modellierungszyklus 1

nur 4 von 9 Testgedichten richtig zugeordnet
Optimierungsvorschläge:
mehr Merkmale beachten
mehr Daten (Trainings- und Testgedichte)
prozentuale Zuordnung und nicht "1:1"-Zuordnung bestimmen

Durchführung Modellierungszyklus 2

Ziel

Finden einer Funktion f zur prozentualen Zuordnung der Gedichte zu den Epochen
Berechnung Fehler der Funktion f
Bestimmen Fehlerfunktion E zur Funktion f
Minimieren des Fehlers mithilfe des Gradientenabstiegsverfahrens/ Optimierung der Funktion f

Modellierung

Aufstellen der Funktion f 1

gibt prozentuale Zuordnung der Gedichte zu den 3 Epochen aus
mögliche Werte müssen im Intervall $[0,1]$ liegen
"perfekte" Zuordnung hat Wert 1, keine Übereinstimmung bei Wert 0
Form f: Spaltenvektor mit der Zuordnung $\left({\begin{array}{c}Renaissance\\Romantik\\Moderne\end{array}}\right)$
Berechnung der Funktionswerte mit WxMaxima

Aufstellen der Funktion f 2

Berechnung des Fehlers von f

Bestimmen der Güte der Funktion
$F(t)=(\mid f(t)-z(t)\mid )^{2}=\left(\left|f\left(\left({\begin{array}{c}x_{t}\\y_{t}\\z_{t}\end{array}}\right)\right)-z\left(\left({\begin{array}{c}x_{t}\\y_{t}\\z_{t}\end{array}}\right)\right)\right|\right)^{2}$
Vergleich der Länge der Vektoren der Funktionswerte und der tatsächlichen Zuordnungen
Quadrieren: positive Ergebnisse, Differenzierbarkeit
$F_{f}(t)=\sum _{i=1}^{15}(\mid (f(t_{i})-z(t_{i}))\mid )^{2}$
Gesamtfehler der Funktion durch Bildung der Summe aller Fehler der Trainingsgedichte

Aufstellen der Fehlerfunktion E

Ersetzen der Daten der Mittelpunkte der Kugeln durch Variablen
später: Optimierung der Kugelmittelpunkte und Minimierung Fehler

Gradientenabstiegsverfahren

Iteratives Verfahren
Optimierung der Fehlerfunktion (Finden des Minimums von E)
Verschiebung Kugelmittelpunkte
Verringerung Fehler
Verwenden des negativen Gradienten (Richtung stärkster Abstieg) zum Finden des Minimums der Funktion
Abbruchkriterium: Gradient wird 0
in unserem Fall: Wert Optimierung = 0

Bestimmen Gradient

Bestimmen partielle Ableitungen der Fehlerfunktion E
$-\sum _{i=1}^{15}\operatorname {grad} (E)=-\sum _{i=1}^{15}\nabla E=-{\begin{pmatrix}\sum _{i=1}^{15}{\frac {\partial E}{\partial a_{1}}}\\\vdots \\\sum _{i=1}^{15}{\frac {\partial E}{\partial a_{9}}}\end{pmatrix}}$
Verwendung WxMaxima

Berechnung Gradientenabstiegsverfahren mithilfe Tabellenkalkulation 1

18 Iterationsschritte -> zeitliche Begrenzung
Eingabe Startwerte (Mittelpunkte der Kugeln, Schrittweite 1)
Veränderung der Variablen (Mittelpunkte der Kugeln) (durch Tabellenkalkulation =WENN($ AE3<$ AD3;A3+T3;A3))

Berechnung Gradientenabstiegsverfahren mithilfe Tabellenkalkulation 2

falls optimierter Funktionswert von E kleiner als vorheriger Funktionswert: Addition des Schritts zur Variable
Eintragen Wert partieller Ableitungen (berechnet mit WxMaxima als Summe aller Werte der partiellen Ableitungen der einzelnen Trainingsgedichte)
Schrittweite α als 1 festlegen: bei fehlender Optimierung des Funktionswertes von E wird diese halbiert (durch Tabellenkalkulation =WENN(AE3>AD3;S3/2;S3))

Berechnung Gradientenabstiegsverfahren mithilfe Tabellenkalkulation 3

Berechnung Schritt der Variablen: negativer Wert normierter Gradient (Division durch seine Vektorlänge) wird mit Schrittweite multipliziert (durch Tabellenkalkulation =-J3*S3/AC3)

Berechnung Vektorlänge Gradient zur Normierung des Gradienten durch euklidische Norm des Gradientenvektors (durch Tabellenkalkulation =WURZEL(J3^2+K3^2+L3^2+M3^2+ N3^2+O3^2+P3^2+Q3^2+R3^2))

Berechnung Gradientenabstiegsverfahren mithilfe Tabellenkalkulation 4

Berechnung Funktionswert der Fehlerfunktion E vor der Optimierung des Iterationsschritts (durch WxMaxima)
Berechnung Funktionswert der Fehlerfunktion E nach Optimierung durch Addition Schritt zur Variable (durch WxMaxima)
Bestimmung der Optimierung: Subtraktion neuer von altem Funktionswert (durch Tabellenkalkulation =AD3-AE3)

Bestimmen der verbesserten Funktion f und der Funktionswerte und Fehler

Einsetzen der neu berechneten Punkte in die Funktion f
mit neuer Funktion Funktionswerte Trainingsgedichte berechnen
Fehler der Trainingsgedichte mit neuen Kugelmittelpunkten bestimmen

Bestimmen der Zuordnung der Testgedichte anhand der verbesserten Funktion f

Bestimmen der Funktionswerte der verbesserten Funktion f mit den Werten der Testgedichte
in WxMaxima
Eingabe in Tabellenkalkulation, Zuordnung automatisch ausgegeben

=WENN(UND(C4>D4;C4>E4);"Renaissance"; WENN(UND(D4>C4;D4>E4);"Romantik";"Moderne"))

automatische Ausgabe in Tabellenkalkulation, ob richtig zugeordnet

=WENN(F5="Renaissance";"ja";"nein")

Bewertung und Optimierung Modellierungszyklus 2

Funktion zur prozentualen Zuordnung erstellt
Fehler konnte verringert werden
verbesserte Funktion erstellt
mehr Iterationsschritte möglich
Automatisierung Gradientenabstiegsverfahren
geringe Anzahl an verwendeten Merkmalen
wenige Daten verwendet

Seiteninformation

Dieser Wiki2Reveal Foliensatz wurde für den Lerneinheit Kurs:Mathematische Modellbildung' erstellt der Link für die Wiki2Reveal-Folien wurde mit dem Wiki2Reveal-Linkgenerator erstellt.

Die Seite wurde als Dokumententyp PanDocElectron-SLIDE erstellt.
Link zur Quelle in Wikiversity: https://de.wikiversity.org/wiki/Kurs:Mathematische%20Modellbildung/Themen/Sprache%20und%20Semantische%20Netze/Einf%C3%BChrung%20Thema
siehe auch weitere Informationen zu Wiki2Reveal und unter Wiki2Reveal-Linkgenerator.

Einleitung

Theorie zur Bestimmung der Rohdaten

Epochen

Metrum

Reimschemata

Tabellarische Darstellung der Rohdaten am Beispiel Renaissance

Mathematische Aspekte

Problemstellung der Modellierung

Mathematische Grundlagen/Theorien zur Berechnung

Sekundarstufe I:

Sekundarstufe II:

Universität:

Programme zur Berechnung

Durchführung Modellierungszyklus 1

Ziel

Modellierung

Erhebung der Daten

Bestimmung der Punkte der Gedichte und Epochen im ℝ3

Bestimmung Kugelgleichung anhand der Trainingsgedichte

Bestimmung Abstände Trainingsgedichte zu Mittelpunkt 1

Bestimmung Abstände Trainingsgedichte zu Mittelpunkt 2

Bestimmung der Kugelgleichung

Test des Modells mithilfe der Testgedichte

Bewertung und Optimierung Modellierungszyklus 1

Durchführung Modellierungszyklus 2

Ziel

Modellierung

Aufstellen der Funktion f 1

Aufstellen der Funktion f 2

Berechnung des Fehlers von f

Aufstellen der Fehlerfunktion E

Gradientenabstiegsverfahren

Bestimmen Gradient

Berechnung Gradientenabstiegsverfahren mithilfe Tabellenkalkulation 1

Berechnung Gradientenabstiegsverfahren mithilfe Tabellenkalkulation 2

Berechnung Gradientenabstiegsverfahren mithilfe Tabellenkalkulation 3

Berechnung Gradientenabstiegsverfahren mithilfe Tabellenkalkulation 4

Bestimmen der verbesserten Funktion f und der Funktionswerte und Fehler

Bestimmen der Zuordnung der Testgedichte anhand der verbesserten Funktion f

Bewertung und Optimierung Modellierungszyklus 2

Seiteninformation

Bestimmung der Punkte der Gedichte und Epochen im ℝ³