Zum Inhalt springen

Kurs:Mathematische Modellbildung/Themen/Sprache und Semantische Netze

Aus Wikiversity

Themen und Zielsetzung

[Bearbeiten]

Im nachstehenden Portfolio wollen wir Gedichte auf die folgenden Merkmale näher betrachten und untersuchen. Diese Merkmale sind die Versanzahl, das Reimschema und das Metrum. Im Anschluss versuchen wir aus den uns bekannten Kriterien eine Art "Epochenschlüssel" zu erstellen, der als Grundlage zur Identifikation bzw. Einordnung unbekannter Gedichte weiterhelfen soll. Diese Modellierung könnte eine Möglichkeit bieten, nicht datierte Sonette in den zeitlich-historischen Kontext einzuordnen.

Aufgaben

[Bearbeiten]

Das Portfolio wird während des Semesters erstellt. Ergänzen Sie jeweils hier die bereits bearbeitenden Teilaufgaben für hinter der Bezeichnung für Ihr Portfolio - z.B. (A1)

Sprache und Semantische Netze(A1)(A2)(A3)(A4)(A5)(A6)(A7)

Gruppenmitglieder

[Bearbeiten]
  • Jana Dahler, Emma Kranz, Katharina Schwenk

Wiki2Reveal Präsentationen

[Bearbeiten]

Sie können in Wikiversity Wiki2Reveal-Präsentationen erstellen, die Sie für die Protfolio-Präsentation in der Prüfung verwenden können. Listen Sie hier die verwendeten Präsentationen.

Zuordnung zu Nachhaltigkeitszielen

[Bearbeiten]

Im vorliegenden Modellierungskreislauf werden folgende Nachhaltigkeitsziele der UN beachtet:

  • SDG4: Quality Education
    • Eine qualitativ hochwertige Bildung kann nur gewährleistet werden, wenn noch nicht erforschte Themenfelder erschlossen werden,

um somit einen Grundstein für weiterführende Forschungen zu legen und ebenso einen Anstoß zu geben, um fachfremde Bereiche (Mathematik und Sprache) miteinander zu verknüpfen und Zusammenhänge festzustellen.

Rohdaten

[Bearbeiten]

Für die Modellierungszyklen wurden die folgende Rohdaten verwendet. Rohdaten können entweder tatsächliche existierende Rohdaten sein, auf die Sie zugreifen, oder zufällig nach einer Verteilung generierte Daten sein, auf die Sie die Modellierung anwenden.

Bei der Modellbildung zur Erstellung eines Epochenschlüssels für Gedichte haben wir uns auf die Epochen Renaissance, Romantik und Moderne konzentriert. Die drei Epochen haben je einen Abstand von ca. 100 Jahren zueinander und bilden somit einen Querschnitt durch die Epochen der englischen Literatur. Des Weiteren wurde die Gattung der Gedichte (Lyrik) gewählt, um diese Textart in die Epochen einzuteilen.

Für den gesamten Modellierungsprozess wurden pro Epoche 5 Gedichte ausgesucht und eigenständig analysiert, um ihre Merkmale bezüglich Versanzahl, Metrum und Reimschema herauszufinden. Diese Trainingsgedichte wurden zur Modellierung verwendet, während später weitere Testgedichte für jede Epoche analysiert wurden, um die Modelle auf ihre Güte zu testen. Die Angaben hinsichtlich Metrum wurden in Prozent angegeben, um die Verteilung auf Jambus, Trochäus, Anapäst, Daktylus und sonstige Metren aufzuzeigen. Dasselbe wurde bei den Angaben bezüglich des Reimschemas gemacht, um auch hier die Verteilung auf Paarreim, Kreuzreim, umarmender Reim, verschränkender Reim und sonstige Reimschemata innerhalb eines Gedichtes andeuten zu können.


Daten: Modellierungszyklus 1

[Bearbeiten]

Quelle angeben, Methode zur Generierung der Zufallsdaten beschreiben.

Im ersten Modellierungszyklus haben wir uns auf die Daten der Gedichte beschränkt, die die Versanzahl und das prozentuale Vorkommen von Jambus und Trochäus beschreiben. Die Daten wurden dabei durch eigene Analyse der Gedichte erhoben.

Trainingsgedichte Renaissance
Autor William Shakespeare John Donne John Milton Thomas Wyatt Philip Sidney Durchschnitt Renaissance
Gedicht Shall I compare thee to a summers day[1] The Flea[2] On Shakespeare[3] Whoso list to hunt[4] Loving in truth[5]
Versanzahl 14 27 16 14 14 17
Jambus 100 100 100 92.9 100 98.58
Trochäus 0 0 0 7.1 0 1.42
Daktylus 0 0 0 0 0 0
Anapäst 0 0 0 0 0 0
sonstiges Metrum 0 0 0 0 0 0
Paarreim 14.3 100 100 14.3 14.3 48.58
Kreuzreim 85.7 0 0 0 85.7 34.28
umarmender Reim 0 0 0 85.7 0 17.14
verschränkender Reim 0 0 0 0 0 0
sonstiges Reimschema 0 0 0 0 0 0
Trainingsgedichte Romantik
Autor Samuel Taylor Coleridge John Keats George Gordon Byron William Wordworth Percy Bysshe Shelley Durchschnitt Romantik
Gedicht Reflections on Having Left a Place of Retirement[6] On First Looking into Chapman's Homer[7] The destruction of Sennacherib[8] Composed upon Westminster Bridge[9] Love's Philosophy[10]
Versanzahl 71 14 24 14 16 27.8
Jambus 100 100 100 100 100 100
Trochäus 0 0 0 0 0 0
Daktylus 0 0 0 0 0 0
Anapäst 0 0 0 0 0 0
sonstiges Metrum 0 0 0 0 0 0
Paarreim 0 57.14 100 57.14 0 42.86
Kreuzreim 0 42.86 0 42.86 100 37.14
umarmender Reim 0 0 0 0 0 0
verschränkender Reim 0 0 0 0 0 0
sonstiges Reimschema 100 0 0 0 0 20
Trainingsgedichte Moderne
Autor T. S. Eliot Wilfred Owen Siegfried Sassoon Stevie Smith Dylan Thomas Durchschnitt Moderne
Gedicht The Love Song of J. Alfred Prufrock[11] Dulce et Decorum Est[12] The poet as a hero[13] Not waving but drowning[14] Do not go gentle into that good night[15]
Versanzahl 131 28 12 12 19 40.4
Jambus 100 0 100 0 100 60
Trochäus 0 0 0 0 0 0
Daktylus 0 0 0 0 0 0
Anapäst 0 0 0 0 0 0
sonstiges Metrum 0 100 0 100 0 40
Paarreim 48.85 0 16.67 0 63.16 25.74
Kreuzreim 10.69 100 83.33 50 0 48.80
umarmender Reim 4.58 0 0 0 0 0.92
verschränkender Reim 0 0 0 0 0 0
sonstiges Reimschema 35.88 0 0 50 36.84 24.54

Daten: Modellierungszyklus 2

[Bearbeiten]

Im zweiten Modellierungszyklus wurden die selben Trainingsgedichte wie in Modellierungszyklus 1 verwendet. Die Punkte, die den Gedichten im ersten Modellierungszyklus zugeteilt wurden, wurden weiterhin verwendet. Es wurde zu den Daten nur die beabsichtigte Zuordnung zu den Epochen durch die Funktion f hinzugefügt. Außerdem wurden die berechneten Funktionsgleichungen der Kugeln weiterverwendet.

Terainingsgedichte aller Epochen
Autor Gedicht Epoche beabsichtigte Zuordnung durch Funktion f Punkt des Gedichts
William Shakespeare Shall I compare thee to a summers day[16] Renaissance (100, 0, 14)
John Donne The Flea[17] Renaissance (100, 0, 27)
John Milton On Shakespeare[18] Renaissance (100, 0, 16)
Thomas Wyatt Whoso list to hunt[19] Renaissance (92.9, 1.7, 14)
Philip Sidney Loving in truth[20] Renaissance (100, 0, 14)
Samuel Taylor Coleridge Reflections on Having Left a Place of Retirement[21] Romantik (100, 0, 71)
John Keats On First Looking into Chapman's Homer[22] Romantik (100, 0, 14)
George Gordon Byron The destruction of Sennacherib[23] Romantik (100, 0, 24)
William Wordworth Composed upon Westminster Bridge[24] Romantik (100, 0, 14)
Percy Bysshe Shelley Love's Philosophy[25] Romantik (100, 0, 16)
T. S. Eliot The Love Song of J. Alfred Prufrock[26] Moderne (100, 0, 131)
Wilfred Owen Dulce et Decorum Est[27] Moderne (0, 0, 28)
Siegfried Sassoon The poet as a hero[28] Moderne (100, 0, 12)
Stevie Smith Not waving but drowning[29] Moderne (0, 0, 12)
Dylan Thomas Do not go gentle into that good night[30] Moderne (100, 0, 19)

Güte

[Bearbeiten]

Um die Güte unseres Modells nach den Modelierungszyklen bewerten zu können, haben wir unsere Auswahl an Gedichten für jede Epoche in die in den Rohdaten genannten Trainingsgedichte und die hier genannten Testgedichte unterteilt. Pro gewählte Epoche gab es so 5 Trainingsgedichte und 3 Testgedichte. Mit Hilfe der Trainingsgedichte haben wir unser Modell erstellt, sie enthielten also die Daten die für den Aufbau der Modellierungszyklen wichtig waren. Die Testgedichte waren die Menge an Gedichten, mit denen die gestalteten Modelle getestet wurden. So wurde im Modell mit den Testgedichten ausprobiert, ob die Zuteilung verschiedener Gedichte zur richtigen Epoche mit dem Modell möglich war oder nicht. Je geringer dabei die Abweichung von dem gewünschten richtigen Zuteilungsergebnis war, desto höher war die Güte des Modells.

Daten Modellierungszyklus 1

[Bearbeiten]
Testgedichte Renaissance
Autor Walter Raleigh Michael Drayton Samuel Daniel
Gedicht A farewell to false love[31] Idea: To the reader of these sonnets[32] Delia 1: Unto the boundless ocean of thy beauty[33]
Versanzahl 30 14 14
Jambus 100 0 100
Trochäus 0 100 0
Daktylus 0 0 0
Anapäst 0 0 0
sonstiges Metrum 0 0 0
Paarreim 1/3 ≈ 33.33% 1/7 ≈ 14.29% 1/7 ≈ 14.29%
Kreuzreim 2/3 ≈ 66.67% 6/7 ≈ 85.71% 6/7 ≈ 85.71%
umarmender Reim 0 0 0
verschränkender Reim 0 0 0
sonstiges Reimschema 0 0 0
Testgedichte Romantik
Autor John Clare William Blake Robert Southey
Gedicht The Badger[34] To Summer[35] After Blenheim[36]
Versanzahl 40 19 66
Jambus 100 0 100
Trochäus 0 0 0
Daktylus 0 0 0
Anapäst 0 0 0
sonstiges Metrum 0 100 0
Paarreim 100 0 0
Kreuzreim 0 0 0
umarmender Reim 0 0 0
verschränkender Reim 0 0 0
sonstiges Reimschema 0 100 100
Testgedichte Moderne
Autor Wystan Hugh Auden Edward Estlin Cummings William Carlos Williams
Gedicht Funeral Blues[37] I carry your heart with me (I carry it in)[38] This is just to say[39]
Versanzahl 16 15 12
Jambus 15/16 = 93.75% 0 0
Trochäus 0 0 0
Daktylus 0 0 0
Anapäst 0 0 0
sonstiges Metrum 1/16 = 6.25% 100 100
Paarreim 100 2/15 ≈ 13.33% 0
Kreuzreim 0 2/5 = 40% 0
umarmender Reim 0 0 0
verschränkender Reim 0 0 0
sonstiges Reimschema 0 7/15 ≈ 46.67% 100

Daten Modellierungszyklus 2

[Bearbeiten]
Testgedichte aller Epochen
Autor Gedicht Epoche beabsichtigte Zuordnung durch Funktion f Punkt des Gedichts
Walter Raleigh A farewell to false love[40] Renaissance (100, 0, 30)
Michael Drayton Idea: To the reader of these sonnets[41] Renaissance (0, 100, 14)
Samuel Daniel Delia 1: Unto the boundless ocean of thy beauty[42] Renaissance (100, 0, 14)
John Clare The Badger[43] Romantik (100, 0, 40)
William Blake To Summer[44] Romantik (0, 0, 19)
Robert Southey After Blenheim[45] Romantik (100, 0, 66)
Wystan Hugh Auden Funeral Blues[46] Moderne (93.75, 0, 16)
Edward Estlin Cummings I carry your heart with me (I carry it in)[47] Moderne (0, 0, 15)
William Carlos Williams TThis is just to say[48] Moderne (0, 0, 12)

Modellierungszyklen

[Bearbeiten]
Modellbildungszyklus

In den Modellierungszyklen wird schrittweise

  • modelliert,
  • bewertet und
  • ein Optimierungsvorschlag gemacht,

der in den nächsten Modellierungszyklus einfließt

Modellierungszyklus 1

[Bearbeiten]

Zielsetzung

[Bearbeiten]

Im ersten Modellierungszyklus wird anhand der Testdaten über die Versanzahl, der prozentuale Ausprägung des Jambus und der prozentualen Ausprägung des Trochäus eine Kugel im ℝ3 bestimmt, in denen die Trainingsgedichte aus einer Epoche liegen. Das Ziel ist dabei, durch die Berechnung des Abstands eines Testgedichts (dargestellt als Punkt im ℝ3) zu einer solchen Kugel, die Zugehörigkeit von dem Testgedicht zu einer Epoche zu bestimmen. Angenommen wird dabei, dass das Testgedicht zu der Epoche gehört, zu deren Kugel es den kleinsten Abstand aufweist.

Modellierung

[Bearbeiten]

Wie eben angedeutet, haben wir uns im ersten Modellierungszyklus auf die Daten von Versanzahl, Jambus und Trochäus beschränkt. Diese drei Daten werden nun je einer Achse des dreidimensionalen Koordinatensystems zugeteilt. Der Jambus wird auf der x-Achse eingetragen, der Trochäus auf der y-Achse und die Versanzahl auf der z-Achse. Somit entsteht durch die Daten für diese drei Merkmale für jedes Gedicht sowie für die Durchschnitte der Epochen je ein Punkt der im ℝ3 eingetragen werden kann.

Punkte aus Daten
x: Jambus y: Trochäus z: Versanzahl Punkt
Renaissance Durchschnitt (Training Renaissance) 98.58 1.42 17 (98.58, 1.42, 17)
Shakespeare (Training Renaissance) 100 0 14 (100, 0, 14)
Donne (Training Renaissance) 100 0 27 (100, 0, 27)
Milton (Training Renaissance) 100 0 16 (100, 0, 16)
Wyatt (Training Renaissance) 92.9 7.1 14 (92.9, 7.1, 14)
Sidney (Training Renaissance) 100 0 14 (100, 0, 14)
Raleigh (Test Renaissance) 100 0 30 (100, 0, 30)
Drayton (Test Renaissance) 0 100 14 (0, 100, 14)
Daniel (Test Renaissance) 100 0 14 (100, 0, 14)
Romantik Durchschnitt (Training Romantik) 100 0 27.8 (100, 0, 27.8)
Coleridge (Training Romantik) 100 0 71 (100, 0, 71)
Keats (Training Romantik) 100 0 14 (100, 0, 14)
Byron (Training Romantik) 100 0 24 (100, 0, 24)
Wordsworth (Training Romantik) 100 0 14 (100, 0, 14)
Shelley (Training Romantik) 100 0 16 (100, 0, 16)
Blake (Test Romantik) 0 0 19 (0, 0, 19)
Clare (Test Romantik) 100 0 40 (100, 0, 40)
Southy (Test Romantik) 100 0 66 (100, 0, 66)
Moderne Durchschnitt (Training Moderne) 60 0 40.4 (60, 0, 40.4)
Eliot (Training Moderne) 100 0 131 (100, 0, 131)
Owen (Training Moderne) 0 0 28 (0, 0, 28)
Sasson (Training Moderne) 100 0 12 (100, 0, 12)
Smith (Training Moderne) 0 0 12 (0, 0, 12)
Thomas (Training Moderne) 100 0 19 (100, 0, 19)
Auden (Test Moderne) 93.75 0 16 (93.75, 0, 16)
Cummings (Test Moderne) 0 0 15 (0, 0, 15)
Williams (Test Moderne) 0 0 12 (0, 0, 12)

Der Durchschnitt wurde als arithmetisches Mittel der Ausprägungen der einzelnen Merkmale der Testgedichte berechnet. Das arithmetische Mittel für eine Zahlenmenge berechnet sich durch:


Bestimmung der Kugel anhand der Trainingsgedichte
[Bearbeiten]

Im nächsten Schritt wird nun die Kugel errechnet, in der alle Punkte der Trainingsgedichte einer Epoche liegen. Dieser Schritt wurde für alle Epochen durchgeführt, soll hier aber ausführlich nur am Beispiel der Renaissance erklärt werden und danach nur noch in Form der Rechnungen für Romantik und Moderne aufgegriffen werden.

Renaissance
[Bearbeiten]
Punkte Trainingsgedichte Renaissance (GeoGebra)

Nach der Betrachtung der Punkte einer Epoche im ℝ3 entstand die Idee, den Durchschnittspunkt einer Epoche als Mittelpunkt der Kugel zu wählen und dann anhand des größten Abstands eines Trainingsgedichtpunkts den Radius dieser Kugel zu bestimmen, damit jeder Punkt der Trainingsgedichte in der Kugel liegen kann.

Um den Radius zu bestimmen werden alle Abstände der Punkte der Trainingsgedichte vom Mittelpunkt der Kugel berechnet. Dabei wurde im Fall der Renaissance zunächst der Abstand vom Punkt Donne zum Punkt Durchschnitt Renaissance berechnet. Dazu wurde um die beiden Punkte ein Quader erstellt, dessen Seiten parallel zu den Ebenen, die durch die Achsen des Koordinatensystems definiert sind, liegen. Der Abstand der beiden Punkte entspricht somit der Länge der Raumdiagonalen des Quaders.

Quader im Koordinatensystem Renaissance Donne GeoGebra
Quader um die Punkte Renaissance und Donne (GeoGebra)

Im Quader sind 2 rechtwinklige Dreiecke entstanden, durch die mithilfe des Satzes des Pythagoras jeweils die Diagonale d und danach die Diagonale berechnet werden kann. Dazu müssen vorher aber die Seitenlängen a1, a2 und a3 am Quader bestimmt werden. Diese ergeben sich durch die Subtraktion der Werte von x, y und z der Eckpunkte der Seiten.

Nachdem nun alle benötigten Seitenlängen bekannt sind, wird mithilfe des Satzes des Pythagoras d und danach berechnet.

Abbildung des Satz des Pythagoras zur Bestimmung des Abstandes der Punkte Renaissance und Donne (GeoGebra)


Um die nächsten Abstände schneller berechnen zu können, wird nun eine Formel für die Diagonale durch den Quader aufgestellt.

Um dies jetzt zu verallgemeinern werden die Koordinaten von Donne zu und die Koordinaten von Renaissance zu verallgemeinert.


Nun werden die restlichen Abstände der Trainingsgedichtpunkte zum Punkt Renaissance berechnet.

Renaissance - Shakespeare:

Renaissance (98.58, 1.42, 17)

A (100, 1.42, 17)

B (100, 0, 17)

Shakespeare (100, 0, 14)

Renaissance - Milton

Renaissance (98.58, 1.42, 17)

A (100, 1.42, 17)

B (100, 100, 0, 17)

Milton (100, 0, 14)

Renaissance - Wyatt

Renaissance (98.58, 1.42, 17)

A (92.9, 1.42, 17)

B (92.9, 7.1, 17)

Wyatt (92.9, 7.1, 14)

Renaissance - Sidney

Renaissance (98.58, 1.42, 17)

A (100, 1.42, 17)

B (100, 0, 17)

Sidney (100, 0, 14)

Kugel erstellt um die Punkte der Trainingsgedichte der Renaissance (GeoGebra)

Den größten Abstand zum Punkt Renaissance hat somit der Punkt Donne. Deshalb wird der Radius der Kugel r(Renaissance) als der Abstand der beiden Punkte gewählt.

Somit kann nun die Kugelgleichung aufgestellt werden. Eine Kugel ist definiert als Menge aller Punkte X des Raumes, die von einem gegebenen Mittelpunkt M den Abstand r haben.

Ihre Koordinatenform ist

Im hier berechneten Fall ergibt sich nun durch Einsetzen von Renaissance = M und dem Abstand von Donne zu Renaissance (=10.19964705) die Koordinatenform der Kugel der Renaissance k(Renaissance):

Romantik
[Bearbeiten]

Rechnungen zur Bestimmung der Kugel zur Epoche Romantik:

Kugel erstellt um die Punkte der Trainingsgedichte der Romantik (GeoGebra)

Romantik (100, 0, 27.8) - Coleridge (100, 0, 71):

Romantik (100, 0, 27.8) - Keats (100, 0, 14):

Romantik (100, 0, 27.8) - Byron (100, 0, 24):

Romantik (100, 0, 27.8) - Wordsworth (100, 0, 14):

Romantik (100, 0, 27.8) - Shelley (100, 0, 16):

Den größten Abstand zum Punkt Romantik hat somit der Punkt Coleridge. Deshalb wird der Radius der Kugel r(Romantik) als der Abstand der beiden Punkte gewählt. .

Die Koordinatenform der Kugel zur Romantik ist k(Romantik):

Moderne
[Bearbeiten]

Rechnungen zur Bestimmung der Kugel zur Epoche Moderne:

Kugel erstellt um die Punkte der Trainingsgedichte der Moderne (GeoGebra)


Moderne (60, 0, 40.4) - Eliot (100, 0, 131):

Moderne (60, 0, 40.4) - Owen (0, 0, 28):

Moderne (60, 0, 40.4) - Sasson (100, 0, 12):

Moderne (60, 0, 40.4) - Smith (0, 0, 12):

Moderne (60, 0, 40.4) - Thomas (100, 0, 19):

Den größten Abstand zum Punkt Moderne hat somit der Punkt Eliot. Deshalb wird der Radius der Kugel (rModerne) als der Abstand der beiden Punkte gewählt. .

Die Koordinatenform der Kugel zur Moderne ist k(Moderne):

Test des Modells mithilfe der Testgedichte

[Bearbeiten]
Kugeln aller Epochen und alle Testgedichte

Um zu überprüfen, ob durch das erstellte Modell Gedichte zu der passenden Epoche zugeordnet werden, werden nun die Abstände der Testgedichte zu den Epochenkugeln berechnet. Die Gedichte werden den Epochen zugeordnet, zu deren Kugel sie den kleinsten Abstand aufweisen. Hiermit soll die Güte des Modells überprüft werden.

Die Berechnung des Abstands wird hier am Beispiel des Abstandes der Renaissance-Kugel und des Testgedichts von Raleigh, welches zu der Epoche der Renaissance gehört, einmalig vorgeführt.

Das Testgedicht Raleigh besitzt die Koordinaten (100, 0, 30) und der Mittelpunkt der Renaissance-Kugel hat die Koordinaten (98.58, 1.42, 17). Der Abstand d(Raleigh,Renaissance) wird mittels Vektorrechnung bestimmt.

Die restlichen Abstände wurden analog bestimmt und werden in der nachfolgenden Tabelle dargestellt.

Zuordnung der Testgedichte
Name Epoche Abstand Renaissance Abstand Romantik Abstand Moderne zugeordnet zu richtige Zuordnung?
Raleigh Renaissance 13.15419325 2.2 41.32989233 Romantik nein
Drayton Renaissance 139.4454474 142.0930681 119.5698959 Moderne nein
Daniel Renaissance 3.610096952 13.8 47.92661056 Renaissance ja
Blake Romantik 98.6105106 100.3864533 63.70211927 Moderne nein
Clare Romantik 23.08750311 27.8 40.00199995 Renaissance nein
Southy Romantik 49.04113376 38.2 47.49063065 Romantik ja
Auden Moderne 5.132767285 13.35299592 41.6463984 Renaissance nein
Cummings Moderne 98.6105106 100.8158718 65.15489237 Moderne ja
Williams Moderne 98.71693269 101.2405057 66.38192525 Moderne ja

Die Zuordnung der Gedichte wurde in der Tabellenkalkulation mit WENN-Abfragen realisiert. Die Zuordnung durch den geringsten Abstand zu einer Epoche wurde durch =WENN(UND(C4<D4;C4<E4);"Renaissance";WENN(UND(D4<C4;D4<E4);"Romantik";"Moderne")) eingegeben. Die Beantwortung der Frage, ob die Zuordnung zu (hier beispielsweise der Renaissance) richtig ist, wurde durch =WENN(F4="Renaissance";"ja";"nein") dargestellt.

Nach der Berechnung der Abstände der Testgedichte zu den einzelnen Kugelmittelpunkten, kann man feststellen, dass das Modell nur in 4 von 9 Fällen die richtige Epoche zuordnet.

Bewertung 1

[Bearbeiten]

Das Ziel eine Zuordnung mithilfe der Berechnung der Abstände von Gedichten zu den Epochenkugeln wurde nur bedingt erreicht. Die Epochenkugeln konnten errechnet werden und die Gedichte konnten auch im ℝ3 dargestellt werden, jedoch liefert das Modell bei 9 Testgedichten nur 4 mal eine richtige Zuordnung.

Optimierung 1

[Bearbeiten]

Beim ersten Modellierungszyklus gibt es mehrere Punkte die verbessert werden könnten. So werden im ersten Zyklus von den insgesamt 11 untersuchten Merkmalen der Gedichte nur 3 beachtet. Somit werden bezeichnende Merkmale der Epochen nicht in die Modellierung mit einbezogen. Würden mehr Merkmale beachtet werden und somit anstatt im ℝ3 in höheren Dimensionen modelliert werden, so könnte unter Umständen eine genauere Definition der Epochen und somit eine genauere Zuordnung erzielt werden. Des Weiteren wurden pro Epoche zur Modellierung nur 5 Trainingsgedichte betrachtet. Es konnten zwar bei den betrachteten Gedichten schon Gemeinsamkeiten festgestellt werden, jedoch würden bei einer größeren Anzahl an Trainingsgedichten genauere Durchschnittspunkte für die Epochen errechnet werden und dadurch würde eine bessere Definition der Epochenkugeln möglich werden. Außerdem wurde im ersten Modellierungszyklus nur eine 1:1-Zuordnung zwischen Gedicht und Epoche untersucht und dadurch eine Art Treppenfunktion, die nicht ableitbar wäre, erstellt. Im nächsten Modellierungszyklus könnte deshalb keine prozentuale Zuordnung der Gedichte zu den einzelnen Epochen errechnet werden. Diese sollte durch eine Funktion definiert werden, die bei Einsetzung der Variablen eine prozentuale Zuordnung zu allen Epochen ausgibt.

Modellierungszyklus 2

[Bearbeiten]

Zielsetzung

[Bearbeiten]

Im zweiten Modellierungszyklus soll nun eine Funktion definiert werden, die bei Eingabe der Daten passend zu einem Gedicht eine prozentuale Zuordnung zu allen 3 untersuchten Epochen ausgibt. Dabei werden wieder nur die Werte für die ersten drei untersuchten Merkmale (x: Jambus, y: Trochäus, z: Versanzahl) beachtet. Um diese Funktion weiter optimieren zu können, soll in einem nächsten Schritt eine Fehlerfunktion zu dieser Funktion bestimmt werden und diese mithilfe des Gradientenabstiegsverfahren verbessert werden.

Modellierung

[Bearbeiten]
Aufstellen der Funktion zur Zuordnung aller drei Epochen
[Bearbeiten]

Um eine Art prozentuale Zuordnung der Epochen zu ermöglichen müssen die Ergebnisse im Intervall liegen. Die Daten der Epochen müssen deshalb dahingehend geändert werden, dass eine perfekte Zuordnung den Wert 1 erhält. Gehört ein Gedicht gar nicht zu einer Epoche, so soll die Funktion bezüglich dieser Epoche den Wert 0 ausgeben. Da die Funktion für alle drei Epochen gleichzeitig die Zuordnung ausgeben soll, wird diese in Form eines Spaltenvektors gestaltet. In seiner ersten Zeile soll die Zuordnung zur Renaissance, in der zweiten Zeile die Zuordnung zur Romantik und in der dritten Zeile die Zuordnung zur Moderne berechnet werden. Die entstandene Funktion f(x,y,z) hat folgende Form:

Als U wird in diesem Fall eine Untermenge von bezeichnet, in der die Werte der Gedichte liegen.

Eine perfekte Zuordnung zur Renaissance wird durch die Funktion als dargestellt. Die perfekte Zuordnung zur Romantik ist und die perfekte Zuordnung zur Moderne ist .

Aufgrund dieser Tatsache kann den Trainings- und Testgedichten ihre beabsichtigte ("perfekte") Zuordnung als neue Daten hinzugefügt werden. Dies wurde in den Rohdaten zum Modellierungszyklus 2 gemacht. Die beabsichtigte Zuordnung spielt beim späteren berechnen des Fehlers der Funktion eine Rolle.

Zur Entstehung der Funktion f ist generell zu sagen: Die einzelnen Abstände werden im Nenner eines Bruches mit eins addiert. Auf diese Art und Weise wird garantiert, dass der Bruch positiv bleibt und somit auch positive Abstände entstehen. Der einzelne Abstand wird dann wiederum durch die Summe aller 3 Abstände geteilt die auf die selbe Art wie eben erklärt in einem Bruch dargestellt werden. Somit entsteht im Endergebnis eine Zahl im Intervall [0,1], die den prozentualen Anteil der Zuordnung zu einer Epoche angibt.

Nach der Erstellung der Zuordnungsfunktion f wurden zu den Trainings- und Testgedichten deren jeweilige Funktionswerte bestimmt. Dies konnte über die Eingabe der Funktion in WxMaxima erleichtert werden.

Code Funktion f WxMaxima

Die errechneten Funktionswerte zu Trainings- und Testgedichten sind in der nachfolgenden Tabelle zusammengefasst.

Funktionswerte
Gedicht x: Jambus y: Trochäus z: Versanzahl Punkt Funktionswert
Shakespeare (Training Renaissance) 100 0 14 (100, 0, 14)
Donne (Training Renaissance) 100 0 27 (100, 0, 27)
Milton (Training Renaissance) 100 0 16 (100, 0, 16)
Wyatt (Training Renaissance) 92.9 7.1 14 (92.9, 7.1, 14)
Sidney (Training Renaissance) 100 0 14 (100, 0, 14)
Raleigh (Test Renaissance) 100 0 30 (100, 0, 30)
Drayton (Test Renaissance) 0 100 14 (0, 100, 14)
Daniel (Test Renaissance) 100 0 14 (100, 0, 14)
Coleridge (Training Romantik) 100 0 71 (100, 0, 71)
Keats (Training Romantik) 100 0 14 (100, 0, 14)
Byron (Training Romantik) 100 0 24 (100, 0, 24)
Wordsworth (Training Romantik) 100 0 14 (100, 0, 14)
Shelley (Training Romantik) 100 0 16 (100, 0, 16)
Blake (Test Romantik) 0 0 19 (0, 0, 19)
Clare (Test Romantik) 100 0 40 (100, 0, 40)
Southy (Test Romantik) 100 0 66 (100, 0, 66)
Eliot (Training Moderne) 100 0 131 (100, 0, 131)
Owen (Training Moderne) 0 0 28 (0, 0, 28)
Sasson (Training Moderne) 100 0 12 (100, 0, 12)
Smith (Training Moderne) 0 0 12 (0, 0, 12)
Thomas (Training Moderne) 100 0 19 (100, 0, 19)
Auden (Test Moderne) 93.75 0 16 (93.75, 0, 16)
Cummings (Test Moderne) 0 0 15 (0, 0, 15)
Williams (Test Moderne) 0 0 12 (0, 0, 12)
Berechnen des Fehlers der Zuordnungsfunktion f
[Bearbeiten]

Im nächsten Schritt soll der Fehler Ff der Funktion f berechnet werden. Dadurch kann die Güte der Funktion f beschrieben werden.

Um die Güte des Graphen zu bestimmen, werden zunächst die Funktionswerte f(t) der Trainingsgedichte, die durch die Funktion f erstellt wurden, mit den beabsichtigten Zuordnungswerten z(t) verglichen. Es wird hierzu die Differenz der Länge der Vektoren der beiden Werte bestimmt und diese anschließend quadriert. Das Quadrieren ist notwendig, um durchweg positive und (im Gegensatz zum Betrag) differenzierbare Ergebnisse zu erhalten. Das Ergebnis ist der quadratische Fehler F(t) an der Stelle t.

Um danach den gesamten Fehler Ff der Funktion f zu erhalten, wird die Summe der einzelnen Fehler der Trainingsgedichte gebildet.


Die Menge T wird dazu definiert als die Menge aller Trainingsgedichte.

Beispielhaft soll der Fehler des Trainingsgedichts Shakespeare der Renaissance (=t1) berechnet werden.

Die restlichen Fehler der Trainingsgedichte werden analog berechnet.

Funktionswerte
T Gedicht Punkt Funktionswert Fehler
t1 Shakespeare (Training Renaissance) (100, 0, 14) 0.1368964130460918
t2 Donne (Training Renaissance) (100, 0, 27) 1.443411553052149
t3 Milton (Training Renaissance) (100, 0, 16) 0.09851016042960496
t4 Wyatt (Training Renaissance) (92.9, 7.1, 14) 0.2908014692725666
t5 Sidney (Training Renaissance) (100, 0, 14) 0.1368964130460918
t6 Coleridge (Training Romantik) (100, 0, 71) 0.5853728022453986
t7 Keats (Training Romantik) (100, 0, 14) 1.116477059945846
t8 Byron (Training Romantik) (100, 0, 24) 0.2881431356074798
t9 Wordsworth (Training Romantik) (100, 0, 14) 1.116477059945846
t10 Shelley (Training Romantik) (100, 0, 16) 1.228739519071587
t11 Eliot (Training Moderne) (100, 0, 131) 0.62768261287956
t12 Owen (Training Moderne) (0, 0, 28) 0.4589812842191316
t13 Sasson (Training Moderne) (100, 0, 12) 1.341302569307724
t14 Smith (Training Moderne) (0, 0, 12) 0.4902783909575719
t15 Thomas (Training Moderne) (100, 0, 19) 1.421692752847623

Der Gesamtfehler Ff berechnet sich nun durch

Aufstellen der Fehlerfunktion E
[Bearbeiten]

Im nächsten Schritt soll nun die Fehlerfunktion E aufgestellt werden. Bei dieser werden die Daten, welche die Mittelpunkte der Epochenkugeln darstellen durch Variablen ersetzt. Dadurch kann die Fehlerfunktion in späteren Schritten optimiert werden und der Fehler verkleinert werden.

Die Fehlerfunktion E wurde zusätzlich in WxMaxima dargestellt, um den Fehler leichter ausrechnen zu können.

Darstellung Fehlerfunktion E in WxMaxima
Gradientenabstiegsverfahren
[Bearbeiten]

Die Fehlerfunktion soll jetzt mithilfe des Gradientenabstiegsverfahrens optimiert werden. Da die Koordinaten der Mittelpunkte der Epochenkugeln mit den Variablen ersetzt wurden, nach denen abgeleitet werden soll, bewirkt die Optimierung der Funktion eine Verschiebung der Mittelpunkte der Kugeln bis der Fehler kleinstmöglich ist und somit die Zuordnung der Gedichte zu den Epochen am besten funktioniert.

Die Optimierung berechnet also .

Da der Gradient einer Funktion (definiert durch ihre partiellen Ableitungen) in Richtung des stärksten Anstiegs zeigt, zeigt der negative Gradient in die Richtung, in der die Funktionswerte der Funktion kleiner werden. Durch die Iterationsschritte des Gradientenabstiegsverfahren soll die Stelle gefunden werden, an der der Gradient von der Funktion 0 ist. Ist diese Stelle gefunden, so bricht das Verfahren ab. In unserem Fall wäre der kleinste Fehler dann gefunden.

Das Gradientenabstiegsverfahren umfasst folgende Schritte:

  1. Der Anfangspunkt ist eine Stelle x0 der Funktion f, für die ein Minimum angenähert werden soll.
  2. Für die Stelle xj (Anfangsstelle x0 oder durch vorherige Iterationsschritte gefundenes xj) wird die Richtung des steilsten Abstiegs durch den negativen Gradienten von f an der Stelle xj gesucht.
  3. Wäre der gefundene Gradient der Nullvektor, so bricht das Verfahren ab. In diesem Fall wäre das Minimum gefunden.
  4. Ist der gefundene Gradient nicht der Nullvektor, so wird er auf die Länge 1 normiert und mit der Schrittweite αj multipliziert.
  5. So lange die Funktionswerte abnehmen, kann die selbe Schrittweite αj verwendet werden. Steigen die Funktionswerte ab einem Iterationsschritt jedoch wieder an, so wird die Schrittweite halbiert.
Gradient bestimmen
[Bearbeiten]

Der Gradient zur Fehlerfunktion wird bestimmt, indem man die partiellen Ableitungen der Funktion für ihre Variablen a1, ...,a9 bildet. Dieser zeigt dann in die Richtung der stärksten Änderung. Um den stärksten Abstieg, also die stärkste Verkleinerung des Fehlers zu erhalten, benutzt man den negativen Gradienten. In unserem Fall wurde zur Bestimmung des Gradienten WxMaxima benutzt.

partielle Ableitung von E nach a_1 in WxMaxima

Berechnung Gradientenabstiegsverfahren mithilfe Tabellenkalkulation
[Bearbeiten]

Wir haben uns dazu entschieden die Verkleinerung des Fehlers mithilfe eines Tabellenkalkulationsprogramms durchzuführen. Durch das Gradientenabstiegsverfahren werden in unserem Fall die Mittelpunkte der Kugeln, die die einzelnen Epochen beschreiben, verschoben und somit die Zuordnung der Gedichte verbessert. Die Mittelpunkte der Kugeln werden in der Fehlerfunktion durch die Variablen a1, ...,a9 beschrieben. In den folgenden Darstellungen in WxMaxima und der Tabellenkalkulation wurden die Variablen wegen einfacherer Eingabe in a bis i umbenannt. Als Ziel des Verfahrens wurde in diesem Fall eine Verbesserung von 0 des Fehlers angestrebt. Dies bedeutet, dass der Fehler vom vorherigen auf den neuen Iterationsschritt keine Verkleinerung mehr erfahren hat. Um das Gradientenabstiegsverfahren durchzuführen, haben wir in unserer Tabelle 18 Iterationsschritte durchgeführt. Es könnten mehr Iterationsschritte durchgeführt werden, um das tatsächliche Ziel einer Optimierung des Fehlers um 0 zu erreichen, jedoch ist dies zeitlich nicht möglich. In der Praxis müssen Annäherungsverfahren ab einem bestimmten Punkt abgebrochen werden, da sie ansonsten zu viel Zeit oder Kapazität benötigen. Trotz der Tatsache, dass die Iterationsschritte nicht durchgeführt wurden bis die Optimierung des Fehlers 0 betrug, konnte der Fehler und die Lage der Mittelpunkte verbessert werden.

Gradientenabstiegsverfahren: Variablen
Gradientenabstiegsverfahren: partielle Ableitungen, Schrittweite
Gradientenabstiegsverfahren: Schritte, Vektorlänge
Gradientenabstiegsverfahren Optimierung


Unsere Tabelle zur Berechnung des Gradientenabstiegsverfahrens ist wie folgt aufgebaut: Die gelb markierten Felder sind bei Beginn des Verfahrens frei zu wählen. Diese sind bei uns die berechneten Mittelpunkte der Kugeln, da diese verbessert werden sollen und die Schrittweite wurde als 1 festgelegt.

  • In den Spalten A bis I wurden die Variablen (also die Koordinaten der Kugelmittelpunkte) eingetragen, die verbessert werden sollen. Der Startwert ist hier im Gradientenabstiegsverfahren, wie eben erläutert, frei wählbar. Hier wurden die im ersten Modellierungszyklus errechneten Kugelmittelpunkte eingesetzt, da diese verändert werden sollen. In den nächsten Iterationsschritten bleiben diese Werte gleich, wenn der durch sie errechnete Funktionswert von der Fehlerfunktion E durch den vorherigen Schritt nicht verbessert wurde. Ist der neuen Funktionswert von E, der durch den vorherigen Iterationsschritt ermittelt wurde, jedoch kleiner als der vorherige Funktionswert von E, es wurde also eine Verbesserung des Fehlers erzielt, so wird zu den vorherigen Werten jeweils der dazu passende Schritt addiert. In der Tabelle wurde dies als =WENN($AE3<$AD3;A3+T3;A3) realisiert (erste Veränderung des Werts von a).
  • In den Spalten J bis R werden die Werte der partiellen Ableitungen der Fehlerfunktion nach der jeweiligen Variable eingetragen. Diese Werte wurden mithilfe von WxMaxima berechnet und eingetragen. In WxMaxima wurden Funktionen erstellt, die jeweils die partielle Ableitung nach einer Variable angeben. Durch Einsetzen der berechneten Werte der Kugelmittelpunkte durch die Iterationsschritte und den Werten für ein Trainingsgedicht konnte der Wert der partiellen Ableitung für ein Trainingsgedicht in WxMaxima bestimmt werden. Daraufhin musste die Summe der Werte aller Trainingsgedichte gebildet werden, um den Gesamtwert der partiellen Ableitung zu erhalten, der in die Tabellenkalkulation eingegeben wurde. Betrachtet man nun alle Werte der partiellen Ableitung zusammen, so bilden diese einen Richtungsvektor, der in die Richtung des stärksten Anstiegs zeigt.
Berechnung des Wert des Gradienten WxMaxima (1)
Berechnung des Wert des Gradienten WxMaxima (2)
Berechnung des Wert des Gradienten WxMaxima (3)
  • In Spalte S wird die Schrittweite α bestimmt. Der Startwert kann frei gewählt werden und wurde bei uns auf 1 festgelegt. Verändert wird die Schrittweite jeweils, wenn der neue errechnete Funktionswert von E (der durch die veränderten Werte der Variablen a1 bis a9 entsteht) größer als der vorherige Funktionswert von E ist. In diesem Fall wurde durch die neue Bestimmung der Variablen a1 bis a9 keine Verbesserung des Fehlers erzielt. Deshalb kann möglich sein, dass man das gesuchte Minimum überschritten hat. Es werden also kleinere Schritte benötigt, um dieses zu finden. Die Schrittweite α wird in einem solchen Fall halbiert. Ist der neue Funktionswert von E jedoch kleiner als der alte, so bleibt die Schrittweite gleich. In der Tabelle wurde dies (am Beispiel der ersten möglichen Veränderung von α) wie folgt realisiert: =WENN(AE3>AD3;S3/2;S3).
  • In den Spalten T bis AB wurde der Schritt, der zu den einzelnen Werten der Variablen a1 bis a9 addiert wird, wenn eine Veränderung dieser im nächsten Iterationsschritt nötig ist, berechnet. In unserer Tabelle wurde dieser Schritt am Beispiel der ersten Berechnung des Schritts für a durch =-J3*S3/AC3 dargestellt. Die Veränderung der Variablen im nächsten Iterationsschritt wird vorgenommen, wenn der alte Funktionswert von E größer als der neue Funktionswert von E ist, der Fehler also vermindert wurde. Der Schritt für jede Variable wird berechnet, indem der negative Wert der partiellen Ableitung nach der jeweiligen Variable mit der Schrittweite multipliziert wird und durch die Vektorlänge des Gradienten dividiert wird. Durch das Dividieren durch die Vektorlänge des Gradienten wird dieser auf die Länge 1 normiert. Dies geschieht beim ganzen Gradienten, indem man die einzelnen Werte der partiellen Ableitungen durch die Gesamtlänge des Vektors dividiert. Dadurch dass der negative Wert der partiellen Ableitung nach einer Variable in Richtung des stärksten Abstiegs zeigt, fungiert er als Richtung, in die die Variable verändert werden muss. Dadurch dass der Vektor auf die Länge 1 normiert wurde, wird sichergestellt, dass der Schritt von a auch genau die gewünschte Länge α erhält. Durch die Multiplikation mit der Schrittlänge α erhält der Schritt der Variablen nun also die Länge α. Die Berechnung des Schritts von a bewirkt also, dass beispielsweise die Variable a bei Addition mit dem Schritt von a im nächsten Iterationsschritt bzw. beim Berechnen des neuen Funktionswertes von E in Richtung des stärksten Abstiegs verändert wird.
  • In der Spalte AC wird die Vektorlänge des Gradienten berechnet. Dieser wird wie eben erläutert zur Normierung des Gradienten auf Länge 1 benötigt. Da der Gradient ein Spaltenvektor ist, dessen Werte wir vorher schon bestimmt haben (Spalten J bis R), kann dessen Länge durch die Euklidische Norm des Vektors berechnet werden. Es wird also die Wurzel aus der Summe aller Werte des Gradienten im Quadrat bestimmt. ( (Definition Euklidische Norm)). In der Tabelle wurde dies (am Beispiel der ersten Berechnung der Vektorlänge) durch =WURZEL(J3^2+K3^2+L3^2+M3^2+N3^2+O3^2+P3^2+Q3^2+R3^2) realisiert.
  • In der Spalte AD wird der Funktionswert der Fehlerfunktion E durch Einsetzung der in der jeweiligen Zeile angegebenen Variablen a1 bis a9 berechnet. Diese Berechnung wurde in WxMaxima durchgeführt und das Ergebnis dann in die Tabelle eingefügt. Es wurde dazu die Fehlerfunktion E in WxMaxima dargestellt, sodass die Variablen a1 bis a9 sowie auch die Werte eines Trainingsgedichtes in sie eingegeben werden konnten. Nach der Berechnung des Fehlers für ein einzelnes Trainingsgedicht wurden die Summe aller Fehler gebildet, um den Funktionswert der Fehlerfunktion E zu erhalten. Dieser Funktionswert wurde dann in die Tabelle übertragen.
Berechnung Funktionswert E in WxMaxima: Funktionsterm, Eingabe Punkte
Berechnung Funktionswert E in WxMaxima: Eingabe Werte Trainingsgedicht, Funktionswert, Summe
  • In Spalte AE wurde der veränderte Funktionswert der Fehlerfunktion E berechnet. Dieser Funktionswert ergibt sich durch das Einsetzen der Variablen a1 bis a9 und der Werte der Trainingsgedichte in die Funktion. Hier werden jedoch zu den einzelnen Werten der Variablen a1 bis a9 ihre jeweiligen Schritte addiert, sodass ein veränderter Funktionswert von E entsteht. Diese Rechnung wurde wiederum in WxMaxima durchgeführt, indem eine Funktion Eneu implementiert wurde, in die man die Werte der Variablen a1 bis a9, deren Schritte und die Werte eines Trainingsgedichts, eingeben konnte. So wurden auch hier zunächst die einzelnen Fehler der Trainingsgedichte bestimmt, deren Summe daraufhin gebildet wurde, um den Funktionswert von Eneu zu erhalten. Dieser wurde dann in die Tabelle übertragen.
Berechnung Funktionswert E_neu in WxMaxima: Funktionsgleichung
Berechnung E_neu in WxMaxima: Eingabe Punkte und Werte Trainingsgedichte
Berechnung E_neu mit WxMaxima: Eingabe Schrittlänge, Funktionsterm, Summe
  • In Spalte AF wurde die Optimierung bestimmt. Der Funktionswert Eneu wurde dazu vom Funktionswert E subtrahiert. Eine Verbesserung des Fehlers ist somit erzielt, wenn das Ergebnis positiv ist. Dieses Ergebnis gibt den Wert an, um den sich der Fehler im Iterationsschritt verbessert hat. Bei der Berechnung der ersten Optimierung wurde dies in der Tabelle durch =AD3-AE3 dargestellt.

Ergebnis

[Bearbeiten]

Durch das Gradientenabstiegsverfahren wurde der Fehler von 10,7246586746602 auf 8,92701330802841 verringert.

Außerdem ergaben sich durch die Verschiebung der Variablen folgende neue Koordinaten für die Kugelmittelpunkte:

neue Koordinaten Epochen
Renaissance (87.651838162202, 6.85289713889483, 18.8923605891146)
Romantik (105.703911969397, -0.7236238567342, 35.4776431566771)
Moderne (57.2555578112307, -0.017072826713715, 38.947370280653)


Aus diesen neuen Mittelpunkten konnte eine neue Funktion fneu für die Zuordnung der Gedichte erstellt werden:


Die Fehler der einzelnen Gedichte veränderten sich zu folgenden Werten:

Funktionswerte
T Gedicht Punkt Funktionswert Fehler
t1 Shakespeare (Training Renaissance) (100, 0, 14) 0.3929170267274847
t2 Donne (Training Renaissance) (100, 0, 27) 0.7266114061510152
t3 Milton (Training Renaissance) (100, 0, 16) 0.4084355953821217
t4 Wyatt (Training Renaissance) (92.9, 7.1, 14) 0.2144658421092845
t5 Sidney (Training Renaissance) (100, 0, 14) 0.3929170267274847
t6 Coleridge (Training Romantik) (100, 0, 71) 0.495688429005297
t7 Keats (Training Romantik) (100, 0, 14) 0.7062732114593753
t8 Byron (Training Romantik) (100, 0, 24) 0.4677060552791474
t9 Wordsworth (Training Romantik) (100, 0, 14) 0.7062732114593753
t10 Shelley (Training Romantik) (100, 0, 16) 0.6802699181100706
t11 Eliot (Training Moderne) (100, 0, 131) 0.6589535387194628
t12 Owen (Training Moderne) (0, 0, 28) 0.4534106450609646
t13 Sasson (Training Moderne) (100, 0, 12) 1.064803018562477
t14 Smith (Training Moderne) (0, 0, 12) 0.483704805786023
t15 Thomas (Training Moderne) (100, 0, 19) 1.094606794326814

Bei manchen Gedichten verschlechterte sich der Fehler. Jedoch verbesserte sich der Gesamtfehler deutlich.

Im letzten Schritt wurde anhand der neu berechneten Funktion eine Zuordnung der Testgedichte zu den Epochen durchgeführt, um zu überprüfen, ob eine bessere Zuordnung als im ersten Modellierungszyklus erzielt wurde. Die Zuordnung wurde durch das Berechnen des Funktionswertes in WxMaxima bestimmt.

Zuordnung der Testgedichte
Name Epoche prozentuale Zuordnung zu Renaissance prozentuale Zuordnung zu Romantik prozentuale Zuordnung zu Moderne zugeordnet zu richtige Zuordnung?
Raleigh Renaissance 0,282014440895037 0,598242728449059 0,119742830655904 Romantik nein
Drayton Renaissance 0,338641347613019 0,294007457646602 0,367351194740379 Moderne nein
Daniel Renaissance 0,49947090012079 0,342792807754845 0,157736292124364 Renaissance ja
Blake Romantik 0,306163170344874 0,252112386104901 0,441724443550224 Moderne nein
Clare Romantik 0,209303018169597 0,664436660711702 0,126260321118701 Romantik ja
Southy Romantik 0,28265164699132 0,442405687311165 0,274942665697515 Romantik ja
Auden Moderne 0,593234188134981 0,263956189637605 0,142809622227414 Renaissance nein
Cummings Moderne 0,309556321503181 0,253536298682577 0,436907379814241 Moderne ja
Williams Moderne 0,312144572410023 0,254752162105011 0,433103265484966 Moderne ja

Es wurde im 2. Modellierungszyklus ein Testgedicht mehr zugeordnet als im 1. Modellierungszyklus. Es fand also eine Verbesserung statt.

Bewertung 2

[Bearbeiten]

Es konnte eine Funktion erstellt werden, die eine prozentuale Zuordnung der Gedichte zu den Epochen ausgibt. Außerdem wurde durch das Gradientenabstiegsverfahren der Fehler dieser Funktion verringert und es wurden neue Koordinaten für die Kugelmittelpunkte errechnet. Dadurch wurde das gesetzte Ziel zu Beginn des Modellierungszyklus 2 erreicht.

Optimierung 2

[Bearbeiten]

Im zweiten Modellierungszyklus wurde das Ziel generell erreicht. Jedoch wurden nur 18 Iterationsschritte beim Gradientenabstiegsverfahren durchgeführt. Dies führt nicht zum bestmöglichen Ergebnis, sondern nur zu einer Annäherung von diesem. Zur Verbesserung könnten mehr Iterationschritte durchgeführt werden, um einen noch geringeren Fehler zu erhalten. Um dies zu erreichen wäre es sinnvoll eine Möglichkeit zu finden, durch die das Gradientenabstiegsverfahren automatisch abläuft, damit nicht so viele Schritte von Hand berechnet werden müssen. Dies würde die benötigte Zeit zur Berechnung deutlich verringern. Weiterhin bleiben die Probleme aus dem ersten Modellierungszyklus bestehen, dass nur eine geringe Anzahl der untersuchten Merkmale der Gedichte in die Modellierung mit eingeflossen sind und nur wenige Trainingsgedichte betrachtet wurden.

Modellierungsergebnisse

[Bearbeiten]

Unser Modell sollte eine erste Grundlage bzw. Ansatz für weitere Untersuchen darlegen. Im ersten Modellzyklus konnten 4 von 9 Gedichten ihrer entsprechenden Epoche zugeordnet werden. Im zweiten Zyklus konnten sogar 5 von 9 Gedichten richtig zugeordnet werden. Es muss angemerkt werden, dass man bei iterativen Verfahren n Schritte durchführen kann, um eine Verbesserung aufzuzeigen. Dies wurde in unserem Modell schon nach 4 Schritten ersichtlich. In diesem Zusammenhang bietet es sich an statt eine große Anzahl an Iterationen die Konvergenzgeschwindigkeit zu bestimmen, um zu errechnen, wann die null erreicht bzw. sie fast null ist. Dies sollte aus praktischen Gründen in Erwägung gezogen werden. Wegen der geringen Konvergenzgeschwindigkeit würde es sich anbieten ein bekanntes Programm wie R oder GnuOctave zu nutzen, um ein Skript mit entsprechender Abbruchbedingung zu erstellen. In unserer Untersuchung haben wir die Gedichte auf drei Merkmale untersucht: Versanzahl, Metrum und das Reimschema. In einem alternativen Durchgang würde es sich schwer gestalten andere Merkmale auszuwählen, da man meist bei formalen Merkmalen verharren sollte als inhaltlichen . Wenn man sich nun entscheidet ein Stilmittel wie die Metapher aufzunehmen, müsste dies erst klar definiert werden, da es doch eine großen Bereich gibt und jeder hat eine andere subjektive Wahrnehmung was eine Metapher ist und was nicht, selbst mit Definition. Beim Erstellen der Punkte für das Koordinatensystem und die weiterführenden Berechnungen ist es uns schwer gefallen alle drei Merkmale mit einzubeziehen. Wir haben uns auf zwei Metren und die Versanzahl geeinigt, da es in der Realität schwer ist Gedichte mit nur einem Reimschema also 100% oder einem Metrum zu finden. Dies würde im Umkehrschluss auch wenig Sinn für eine Analyse machen, da man zwei Merkmale mit sozusagen 100% hätte und allein die Versanzahl variiert. Die Kugeln würden kaum einen Unterschied aufzeigen, da sie um zwei Punkte konzentriert wären. Man könnte versuchen mehr Daten zu sammeln, um ein besseres und detaillierteres Ergebnis zu erhalten. Darauf sollte geachtet werden, dass es ein Autor immer nur einmal genannt wird. Es muss berücksichtigt werden, dass ein Autor, der eine Vielzahl an Gedichten veröffentlicht hat, sich vielleicht auch anderen epochentypischen Merkmalen bedient hat ( zB Barock mit Sonett wird in darauffolgenden Epochen nochmals aufgegriffen ) und verfälscht so das Ergebnis bzw. es kann passieren, dass die Epochen falsch zugeordnet werden anhand dieses Merkmal. In unserer Untersuchung haben wir versucht darauf zu achten, dass die Epochen ca. 100 Jahre auseinander liegen. Man könnte natürlich auch andere Epochen als Vorlage nehmen. Generell muss man in der Lyrik beachten, dass die Epochenübergänge fließend sind und man dadurch teilweise nur schwer eine Zuordnung treffen kann. Deshalb haben wir versucht wie oben schon genannt weit auseinander liegende Epochen zu nehmen , um diese Hürde zu nehmen.

Niveauzuordnung

[Bearbeiten]

Sekundarstufe I:

[Bearbeiten]
Mathematische Werkzeuge / Theorien Anwendung auf die Gedichte
Rohdaten zusammentragen (Analyse der Gedichte auf die 3 festgelegten Merkmale ) authentisches Zahlenmaterial wird zur Bearbeitung realitätsnaher Aufgaben herangezogen und Basis für weitere Rechnungen zu legen
Daten in Excel eintragen (Tabellenkalkulation) Schnelle Durchführung von Berechnungen mit ermittelten Rodaten
Umrechnung der ermittelten Rohdaten Anteil verschiedener Merkmale der Gedichte als Bruch ausdrücken und im Anschluss in Prozent ausdrücken, um Daten universeller zu nutzen
Satz des Pythagoras ( 2 dimensionale Darstellung ) Erstellen einer Grafik und eine erste Veranschaulichung der Daten
Berechnung des arithmetischen Mittels Errechnen des Durchschnittswerts verschiedener Merkmale der Gedichte
  • Satz des Pythagoras
  • Tabellenkalkulation, Daten in Excel eintragen
  • Anteil verschiedener Merkmale der Gedichte als Bruch ausdrücken
  • Brüche in Prozentschreibweise umwandeln
  • Berechnung arithmetisches Mittel

Sekundarstufe II:

[Bearbeiten]
Mathematische Werkzeuge / Theorien Anwendung auf die Gedichte
Bestimmen/Berechnen von Punkten im ℝ3 Eintragen von Punkten und Vektoren im Koordinatensystem des ℝ3
Abstandsberechnung von Punkten im ℝ3 benötigt, um die Abstände untereinander in einer Epoche zu bestimmen aber auch um die Abstände epochenübergreifend miteinander zu vergleichen
Vektorrechnung im ℝ3 (Bestimmen von Längen) wird genutzt , um im Anschluss die Euklidische Norm zu bestimmen und im späteren Verlauf die Abstände miteinander zu vergleichen
Kugelgleichung im ℝ3 Voraussetzungen um eine Kugel im ℝ3 zu erstellen und wird auch später für die Fehlerfunktion E Grundlage sein
Einsatz von GeoGebra Darstellung der fertig erstellten Kugeln im ℝ3



  • Eintragen von Punkten und Vektoren im Koordinatensystem des ℝ3
  • Bestimmen/Berechnen von Punkten im ℝ3
  • Abstandsberechnung von Punkten im ℝ3
  • Vektorrechnung im ℝ3 (Bestimmen von Längen)
  • Einsatz von GeoGebra
  • Kugelgleichung im ℝ3
  • Normen, Metrik, Topologie

Universität:

[Bearbeiten]
Mathematische Werkzeuge / Theorien Anwendung auf die Gedichte
Gradientenabstiegsverfahren iteratives Verfahren, um eine bessere Approximation für die Kugeln zu geben
Daten in Excel eintragen (Tabellenkalkulation) wird GAV erstellt mit Startwert bis , die Werte der Gradienten von bis eintragen und. Die E-Funktion alt und neu berechnen, um zu prüfen, ob es eine Verbesserung kam oder nicht.
mehrdimensionale Differentialrechnung benötigt, um einen Gradienten aufzustellen und im GAV den neuen Punkt "Schritt" zu bestimmen.
Fehlerrechnung Gesamtfehler vor starten der Iteration und nach n-ten Iterationsschritt Differenz erstellen, um beide miteinander zu vergleich und abzuschätzen, ob es zu einer Verbesserung kam oder nicht


Modellierungsalternativen

[Bearbeiten]

In unserem Modell haben wir uns bewusst für die Kugeln entschieden. Der Vorteil daran ist, dass es einfacher und verständlicher, vor allem als Schüler, sich vorzustellen als eine Ebene. Alternativ bestünde die Möglichkeit eine Art Ausgleichsebene im ℝ3 aufzustellen und die betreffenden Punkte zu lokalisieren. In diesem Zusammenhang kann man auch die Variablen ändern. Im unserem fertigen Modell haben wir uns auf zwei Metren und die Versanzahl festgelegt. Dies kann man in einem erneuten Durchgang ändern in zwei Reimschemata und Versanzahl bzw. Reimschemata und Metren. Um die abschließende Aussagekraft der beiden Modelldurchgänge miteinander zu vergleichen, kann man zuerst die Variablen behalten und in einem zweiten Durchlauf die Variablen ändern. Diese Änderungen beziehen sich auf den 1. Modellzyklus, da es für den 2. Modellzyklus kaum eine bessere Iteration für unser Modell gibt bzw. es kein anderes mit dieser Aussagekraft.

Verwendete Software für die Modellbildung

[Bearbeiten]

Geben Sie hier die in Ihrem Projekt verwendet Software an und begründen, warum Sie diese für die Modellbildung eine geeignetes Werkzeug ist.

GeoGebra wurde im ersten Modellierungszyklus dazu verwendet, die Punkte und Kugeln im dreidimensionalen Raum darzustellen. So konnte der erste Modellierungszyklus anschaulich gemacht werden und es konnten Berechnungen (v.a. Abstandsberechnungen) anhand GeoGebra überprüft werden.

GeoGebra eignete sich dabei besonders gut für unsere Modellierung, da mithilfe von GeoGebra die Veranschaulichung von Objekten im Raum einfach dargestellt werden konnten. Außerdem konnte mit GeoGebra einfach Anschauungsmaterial zu Berechnungen erstellt werden, die das Vorgehen bei den Rechnungen im dreidimensionalen Raum auch für Schülerinnen und Schüler veranschaulichen und dadurch vereinfachen konnten.

Die Tabellenkalkulation wurde zur Sammlung der Daten in beiden Modellierungszyklen verwendet. Durch sie konnten die Daten übersichtlich dargestellt werden und sie blieben für ihre weitere Verwendung zugänglich. Im zweiten Modellierungszyklus wurde die Tabellenkalkulation für das Gradientenabstiegsverfahren verwendet. Durch die Verwendung der Tabellenkalkulation konnten in diesem Fall mehrere Schritte automatisch berechnet werden (z.B. neue Werte der Variablen, Optimierung). Außerdem konnten die Werte des Gradientenabstiegsverfahren übersichtlich dargestellt werden.

WxMaxima wurde im zweiten Modellierungszyklus benutzt. Das Computer Algebra System half dabei, Funktionswerte schneller auszurechnen und die partiellen Ableitungen zu bestimmen. Es war besonders hilfreich dabei, die längeren Rechnungen des Gradientenabstiegsverfahren schneller durchzuführen. Es wurde nur für algebraische Berechnungen benötigt.

Literatur

[Bearbeiten]
  1. https://www.poetryfoundation.org/poems/45087/sonnet-18-shall-i-compare-thee-to-a-summers-day
  2. https://www.poetryfoundation.org/poems/46467/the-flea
  3. https://www.poetryfoundation.org/poems/46453/on-shakespeare-1630
  4. https://www.poetryfoundation.org/poems/45593/whoso-list-to-hunt-i-know-where-is-an-hind
  5. https://www.poetryfoundation.org/poems/45152/astrophil-and-stella-1-loving-in-truth-and-fain-in-verse-my-love-to-show
  6. http://www.online-literature.com/coleridge/645/
  7. https://poets.org/poem/first-looking-chapmans-homer
  8. https://www.poetryfoundation.org/poems/43827/the-destruction-of-sennacherib
  9. interestingliterature.com/2016/02/a-short-analysis-of-wordsworths-composed-upon-westminster-bridge/
  10. https://interestingliterature.com/2020/09/percy-shelleys-loves-philosophy-analysis/
  11. https://www.poetryfoundation.org/poetrymagazine/poems/44212/the-love-song-of-j-alfred-prufrock
  12. hhttps://www.poetryfoundation.org/poems/46560/dulce-et-decorum-est
  13. https://www.poetryfoundation.org/poems/57270/the-poet-as-hero
  14. https://www.poetryfoundation.org/poems/46479/not-waving-but-drowning
  15. https://poets.org/poem/do-not-go-gentle-good-night
  16. https://www.poetryfoundation.org/poems/45087/sonnet-18-shall-i-compare-thee-to-a-summers-day
  17. https://www.poetryfoundation.org/poems/46467/the-flea
  18. https://www.poetryfoundation.org/poems/46453/on-shakespeare-1630
  19. https://www.poetryfoundation.org/poems/45593/whoso-list-to-hunt-i-know-where-is-an-hind
  20. https://www.poetryfoundation.org/poems/45152/astrophil-and-stella-1-loving-in-truth-and-fain-in-verse-my-love-to-show
  21. http://www.online-literature.com/coleridge/645/
  22. https://poets.org/poem/first-looking-chapmans-homer
  23. https://www.poetryfoundation.org/poems/43827/the-destruction-of-sennacherib
  24. interestingliterature.com/2016/02/a-short-analysis-of-wordsworths-composed-upon-westminster-bridge/
  25. https://interestingliterature.com/2020/09/percy-shelleys-loves-philosophy-analysis/
  26. https://www.poetryfoundation.org/poetrymagazine/poems/44212/the-love-song-of-j-alfred-prufrock
  27. hhttps://www.poetryfoundation.org/poems/46560/dulce-et-decorum-est
  28. https://www.poetryfoundation.org/poems/57270/the-poet-as-hero
  29. https://www.poetryfoundation.org/poems/46479/not-waving-but-drowning
  30. https://poets.org/poem/do-not-go-gentle-good-night
  31. https://www.poetryfoundation.org/poems/50385/a-farewell-to-false-love
  32. https://www.poetryfoundation.org/poems/44154/idea-to-the-reader-of-these-sonnets
  33. https://www.poetryfoundation.org/poems/50420/delia-1-unto-the-boundless-ocean-of-thy-beauty
  34. https://poemanalysis.com/john-clare/the-badger/
  35. https://poemanalysis.com/william-blake/to-summer/
  36. https://poemanalysis.com/robert-southey/after-blenheim/#Structure_of_After_Blenheim
  37. https://medium.com/poem-of-the-day/w-h-auden-funeral-blues-8771e2868595
  38. https://www.poetryfoundation.org/poetrymagazine/poems/49493/i-carry-your-heart-with-mei-carry-it-in
  39. https://https://www.poetryfoundation.org/poems/56159/this-is-just-to-say
  40. https://www.poetryfoundation.org/poems/50385/a-farewell-to-false-love
  41. https://www.poetryfoundation.org/poems/44154/idea-to-the-reader-of-these-sonnets
  42. https://www.poetryfoundation.org/poems/50420/delia-1-unto-the-boundless-ocean-of-thy-beauty
  43. https://poemanalysis.com/john-clare/the-badger/
  44. https://poemanalysis.com/william-blake/to-summer/
  45. https://poemanalysis.com/robert-southey/after-blenheim/#Structure_of_After_Blenheim
  46. https://medium.com/poem-of-the-day/w-h-auden-funeral-blues-8771e2868595
  47. https://www.poetryfoundation.org/poetrymagazine/poems/49493/i-carry-your-heart-with-mei-carry-it-in
  48. https://https://www.poetryfoundation.org/poems/56159/this-is-just-to-say