Kurs:Numerik I/1 Besonderheiten des numerischen Rechnens
Aus Wikiversity
Inhaltsverzeichnis |
[Bearbeiten] 1.1 b-adische Brüche
Alle Berechnungen auf digitalen Rechenanlagen können grundsätzlich nur mit endlicher Genauigkeit durchgeführt werden. Deshalb spielt die verwendete Zahlendarstellung eine wichtige Rolle.
Bekanntlich ist die Zahl
im Dezimalsystem gleichbedeutend mit

Man spricht in diesem Fall auch von einem b-adischen Bruch zur Basis b = 10. Statt der bekannten Basis b: = 10 in unserem Dezimalsystem kann man auch eine andere Basis
mit
wählen. Wäre b: = 8, so hätte beispielsweise die Zahl mit der Ziffernfolge
im Dezimalsystem den Wert

Sind
insbesondere die Stellen einer Zahl bezüglich der Basis b, so entspricht diese also im Dezimalsystem der reellen Zahl

Praktisch wichtig sind dabei die Basen



Die Babylonier beispielsweise verwendeten die Basis b = 60 (Sexagesimalsystem).
[Bearbeiten] Beispiel 1.1
(1) b = 2. Dem sog. dyadischen Bruch 11100.10 entspricht im Dezimalsystem die Zahl

(2) b = 16. Der b-adische Bruch C17.E zur Basis b = 16 bedeutet im Dezimalsystem die Zahl

Will man umgekehrt eine Dezimalzahl bezüglich einer anderen Basis als b: = 10 beschreiben, so verfährt man wie folgt.
[Bearbeiten] Beispiel 1.2
Gegeben sei die Zahl x: = 60.125 im Dezimalsystem. Diese sei nun mittels einer anderen Basis dargestellt.
(1) b = 2. (Als Vielfache der Potenzen von 2 stehen nur die Ziffern 0 und 1, für die erste Stelle nur die 1 zur Verfügung.) Man ermittelt zuerst die höchste Potenz von 2, die in 60 steckt. Dies ist wegen 25 = 32 und 26 = 64 die 5. Weiter enthält 60.125 − 25 = 28.125 das 1-fache von 24 = 16, die Zahl 28.125 − 16 = 12.125 das 1-fache von 23 = 8, die Zahl 4.125 das 1-fache von 22 = 4, die Zahl 0.125 das 0-fache von 21 = 2 sowie das 0-fache von 20 = 1, die Zahl 0.125 das 0-fache von 2 − 1 = 0.5 sowie das 0-fache von 2 − 2 = 0.25 und schließlich das 1-fache von 2 − 3 = 0.125, so dass man zu folgender Darstellung gelangt:
(2) b = 8. (Als Vielfache der Potenzen von 8 stehen jetzt die Ziffern
zur Verfügung bzw. für die erste Stelle die Ziffern
.) Es ergibt sich

Also entspricht 60.125 im Dezimalsystem der Zahl 74.1 zur Basis b = 8.
(3) b = 16. Man erhält

Es ergibt sich zur Basis b = 16 die Zahl 3C.2.
[Bearbeiten] Satz 1.3
- Sei
und
. Dann lässt sich jede reelle Zahl in einen b-adischen Bruch zur Basis b entwickeln.
[Bearbeiten] 1.2 Rechnen auf einem Computer
Wir gehen nun von einer Zahlendarstellung von
mittels der Basis
mit
und den Ziffern
aus, d. h. von einer Darstellung

mit
. (Für b > 10 kann mi also auch eine Ziffer mit mehr als einer Stelle sein.) Durch Abschneiden dieses unendlichen Ausdrucks ergibt sich eine endliche Zahlendarstellung

Digitale Rechenanlagen, kurz Computer oder Rechner, arbeiten meist mit einer normalisierten (endlichen) Gleitkomma-Darstellung reeller Zahlen

wobei die sog. Mantisse M von der Form

und der Exponent E von der Form

mit Ziffern
sind und insbesondere
gilt. Diese Darstellung ist wegen
eindeutig. Für die Darstellung der Null setzt man M: = 0 und E beliebig. Die Speicherung von a in (1.1) erfolgt in der Form
![a \to (\pm) [\alpha_1 \ldots \alpha_r] (\pm) [e_1 \ldots e_s]](http://upload.wikimedia.org/math/f/7/b/f7b067311c487239835e9ede0a4f710b.png)
und benötigt
[Bearbeiten] Beispiel 1.4
Sei b: = 10.
(1) Die Zahl − 30.421 lautet (bei Nichtberücksichtigung der Größen r und s) in normalisierter Gleitkomma-Darstellung
. Letztere Darstellung schreibt man z.B. für r: = 6 und s: = 2 auch in der Form − 0.304210E + 02 oder − 0.30421010 + 02.
(2) Die Zahl − 0.00030421 lautet in der normalisierten Gleitkomma-Darstellung für r: = 6 und s: = 2 z. B. − 0.304210E − 03 oder − 0.30421010 − 03.
Eine normalisierte Gleitkomma-Darstellung mit der Basis b, beispielsweise b: = 10 oder b: = 2, bestimmt die Menge A: = A(b;r;s) reeller Zahlen, die auf dem Rechner exakt dargestellt werden können, die sog. Maschinenzahlen. Eine solche Zahlendarstellung ermöglicht also nur die Repräsentation einer endlichen Teilmenge der reellen Zahlen. Und zwar ist offenbar insbesondere die kleinste darstellbare positive Zahl amin durch

und die größte positive Zahl amax durch

gegeben. Die Mantisse M von amin entspricht offenbar der Dezimalzahl b − 1 und die von amax der Dezimalzahl
![(b - 1) \sum^r_{i=1} b^{-i} = (b - 1) \left[ \frac{1 - b^{-r-1}}{1 - b^{-1}} - 1 \right] = \frac{b (b^{r+1} - 1)}{b^{r+1}} - b + 1 = 1 - b^{-r}.](http://upload.wikimedia.org/math/2/6/a/26a813d692eb7d632dc868e853c193d3.png)
Der Exponent E für beide Zahlen ist bis auf das Vorzeichen gegeben durch die Dezimalzahl

Somit haben amin und amax den Dezimalwert

Ist D die reelle Zahlenmenge
![D := [-a_\max, - a_\min] \cup \{0\} \cup [a_\min, a_\max],](http://upload.wikimedia.org/math/3/0/8/30855738703aa85d2a13666cb116f9b1.png)
so können also insbesondere Zahlen
nicht auf dem Rechner wiedergegeben werden. Im Fall x > amax und x < − amax melden alle Rechner normalerweise einen Exponentenüberlauf („overflow“), während sie im Fall
meist keine Meldung machen und x = 0 setzen.
Ferner ist offenbar nicht jede Zahl
auf dem Rechner, d. h. als
darstellbar (z. B. trifft dies für die Zahlen π und
zu). Somit stellt sich das Problem, eine Zahl
durch eine Zahl aus A zu approximieren. Man verwendet hierzu einen Rundungsoperator
, der jeder Zahl
eine Zahl
zuordnet, welche sinnvollerweise der folgenden Beziehung genügt:

Im Fall, dass die Aufgabe in (1.2) zwei Lösungen besitzt, rundet man dabei normalerweise (wir legen dies hier auch so fest) z. B. für b: = 10 und eine Endziffer 5 nach oben.
[Bearbeiten] Beispiel 1.5
Sei b: = 10,r: = 4 und s: = 2. Dann gilt




Allgemein kann man für b: = 10 und eine Mantissenlänge r die zu einer beliebigen Zahl
gehörende Maschinenzahl
folgendermaßen finden. Es sei dazu
zunächst in der Form
dargestellt, wobei
und

mit
und
seien. Insbesondere ist also
. Zu a bildet man nun

und setzt dann

Offenbar ist die Zahl
für jedes
eine Maschinenzahl, d. h.
.
[Bearbeiten] Beispiel 1.6
Für b: = 10,r: = 4 und s: = 2 folgt


Für den mit der Rundung verbundenen absoluten Fehler hat man

und für den relativen Fehler, sofern
ist,

Bei einer analogen Definition der Rundungsoperation für die Basis b erhält man

Diese Vorgehensweise führt auf die Definition der sogenannten relativen Maschinengenauigkeit

Mit dieser gilt also

wie man mit der Setzung
sieht.
[Bearbeiten] Beispiel 1.7 (IEEE-Standard)

Die arithmetischen Grundoperationen + , − , * , / werden auf digitalen Rechnern durch sog. Gleitpunktoperationen ersetzt, welche Maschinenzahlen wieder auf Maschinenzahlen abbilden. Sind
, ist „
“ eine der vier Grundoperationen,
und
, so definiert man die zugehörige Gleitpunktoperation
durch

Für sie gilt nach (1.3)

Für das Ergebnis
kann natürlich auch
gelten. In diesem Fall meldet der Rechner normalerweise einen Exponentenüberlauf oder setzt er c: = 0.
[Bearbeiten] 1.3 Stabilität und Kondition
Unter einem Algorithmus verstehen wir eine eindeutig festgelegte Folge von elementaren Operationen + , − , * , / , d. h. ein eindeutig festgelegtes Verfahren zur numerischen Lösung eines Problems oder einer Klasse von Problemen. Zumeist gibt es mehrere unterschiedliche Algorithmen zur Lösung eines Problems, die bei exakter Rechnung zu demselben Ergebnis führen würden, die dies jedoch numerisch aufgrund von Rundungsfehlern, Speicherplatz etc. auf dem Computer im Allgemeinen nicht tun.
[Bearbeiten] Beispiel 1.8
Seien a = 0.03615,b = 62.88 und c = 62.73. Dann gilt bei exakter Rechnung
Bei 4-stelliger Rechnung ergibt sich hingegen
mit 4 in Bezug auf das exakte Ergebnis korrekten Stellen oder alternativ
mit einem Ergebnis, welches lediglich 2 korrekte Stellen aufweist.
Die gl-Operationen genügen also weder dem Assoziativ- noch dem Distributivgesetz!
Das Ziel der numerischen Mathematik ist die Konstruktion und Analyse von effizienten Algorithmen. Dabei meinen wir mit effizient, dass sie
(a) schnell und sparsam sein, d. h. möglichst wenige Rechenoperationen und damit bei geringem Speicherplatzbedarf wenig Rechenzeit zur Berechnung des gewünschten Resultates benötigen sollten,
(b) numerisch stabil sein sollten, d. h. die Verfälschung der Resultate durch Rundungsfehler nicht wesentlich größer sein sollte als die Verfälschung durch die Eingabefehler.
Unter Eingabefehler versteht man dabei die durch Rundung der Eingabedaten auf dem Rechner sich bereits ergebenden (im Allgemeinen kleinen) Fehler. Ein mathematisches Problem kann aber selbst schon „gutartig“ oder „bösartig“ sein. So nennt man ein mathematisches Problem gut konditioniert, wenn kleine Störungen in den Daten auch nur kleine Fehler in den Lösungen zur Folge haben, und es heißt schlecht konditioniert (ill-conditioned), wenn kleine Störungen in den Daten große Fehler in den Lösungen bewirken können. Bei schlecht konditionierten Problemen ziehen also Eingabefehler auf dem Rechner üblicherweise automatisch große Fehler in den erzielten Resultaten nach sich und zwar für jeden Algorithmus.
[Bearbeiten] Beispiel 1.9
(1) Die Subtraktion c: = a − b etwa gleich großer reeller Zahlen a und b ist ein schlecht konditioniertes Problem. Denn sind a und b mit Fehlern
und
gestört, d. h. hat man statt a und b

dann ergibt sich

Für
(und
bzw.
) hat man bezüglich c: = a − b im Ergebnis eine Fehlerverstärkung gegenüber
bzw.
von

Auf dem Rechner führt dies zum Phänomen der Auslöschung von korrekten Stellen. Hat man z. B. bei 8-stelliger Rechnung
(6 korrekte Stellen),
(7 korrekte Stellen),so erhält man
(2 korrekte Stellen).(2) Das Problem, den Schnittpunkt zweier Geraden g und h, die fast parallel zueinander sind, zu berechnen, ist schlecht konditioniert. Um dies einzusehen, mache man sich geometrisch klar, dass im Fall zweier sich im rechten Winkel schneidender Geraden kleine „Störungen“ der Geraden auch nur kleine Störungen bezüglich des gemeinsamen Schnittpunktes zur Folge haben, während solche Störungen großen Einfluss haben, wenn die Geraden fast parallel zueinander sind.
Bei der Konstruktion von Algorithmen sollte man also, wenn möglich, schlecht konditionierte Teilprobleme vermeiden.
[Bearbeiten] Beispiel 1.10
(1) Der Ausdruck
sollte mittels der numerisch stabileren Darstellung
berechnet werden.
(2) Die Funktion

erlaubt die stabilisierte Darstellung

welche sich zur Berechnung von Funktionswerten für
anbietet. Man mache sich klar, dass bei der Auswertung der stabilisierten Darstellung keine Auslöschung auftritt.
[Bearbeiten] 1.4 Differentielle Fehleranalyse
Der Einfluss von Störungen in den Daten auf die Lösung eines Problems sowie die Fortpflanzung von Eingangs- und Rundungsfehlern bei numerischen Algorithmen kann durch die sogenannte differentielle Fehleranalyse untersucht werden. Zu deren Beschreibung nehmen wir an, dass ein Problem bzw. eine Berechnungsvorschrift mittels einer zweimal stetig differenzierbaren Funktion
durch die Gleichung
bzw. gleichbedeutend durch die Gleichungen

beschrieben wird. Dabei ist also
der Daten- und
der Ergebnis-Vektor. Für
gilt dann nach dem Satz von Taylor zeilenweise

so dass für hinreichend kleine | Δxj | der Restterm
vernachlässigt werden kann und folglich der dominierende relative Fehler gegeben ist durch

mit

Die Größen kij(x) entscheiden demnach über den Einfluss der relativen Fehler | Δxj | / | xj | in den Daten auf den relativen Fehler | Δyi | / | yi | im Ergebnis. Sie werden deshalb häufig auch Verstärkungsfaktoren genannt. Im Fall, dass die Ausgangsgleichung einen Algorithmus beschreibt, sagt man, dass dieser stabil ist, wenn alle kij(x) „klein“, idealerweise ungefähr gleich 1 sind. Anderenfalls sagt man, er ist instabil.
Im Fall, dass die Ausgangsgleichung ein mathematisches Problem beschreibt, spricht man bei den kij(x) auch von Konditionszahlen (engl. to condition = bedingen, bestimmen). Sind die Konditionszahlen dem Betrag nach groß, hat man also ein schlecht konditioniertes, anderenfalls ein gut konditioniertes Problem. Für manche Zwecke ist aber diese Definition von Konditionszahlen unpraktisch, so dass auch andere Größen als Konditionszahlen bezeichnet werden (vgl. Definition 2.18).
[Bearbeiten] Beispiel 1.11
Die Lösungen λ1 und λ2 einer quadratischen Gleichung
sind gegeben durch

wobei wir hier davon ausgehen, dass die Gleichung zwei unterschiedliche reelle Lösungen besitzt, also
ist. Zur Analyse der Fehlerempfindlichkeit der beiden Lösungen von (1.6) in Abhängigkeit von den Eingabedaten p und q betrachten wir diese nun als Funktionen von p und q. Wir untersuchen dazu die beiden Gleichungen

(Im Vergleich mit (1.4) ist x: = (p,q),m = 2,fi: = λi und entsprechen die rechten Seiten in (1.8) den yi.) Man hat dafür

Damit errechnet man


Hieraus ergeben sich die Verstärkungsfaktoren




Die Bestimmung der Lösungen von (1.6) ist somit für
ein schlecht konditioniertes Problem. Zur Veranschaulichung geben wir ein Zahlenbeispiel. Es seien p: = 2 und q: = 3.999. Dann sind λ1 = 2.01 und λ2 = 1.99 die beiden Nullstellen von (1.6). Für die Verstärkungsfaktoren ergibt sich in diesem Fall

Somit ist zu erwarten, dass Eingabefehler in den Daten p und q in Bezug auf die Lösungen λ1 und λ2 von (1.6) um den 100- bis 200-fachen Wert verstärkt werden.
Wir wollen nun zwei unterschiedliche Algorithmen zur Berechnung von

betrachten und zwar unter den Bedingungen

In diesem Fall ist offenbar

d. h. für nicht zu kleine | p | auch
und somit das Problem der Bestimmung der Lösungen der quadratischen Gleichung (1.6) gut konditioniert. Ein „Lösungsalgorithmus“ könnte nun zunächst darin bestehen, hintereinander die folgenden Größen zu berechnen

Wegen p < 0 sollte man als nächstes den unkritischen Wert
berechnen. Zur Berechnung von λ1 betrachten wir nun zwei Varianten (vgl. (1.9)):


Da unter den Voraussetzungen (1.10)
gilt, tritt bei Variante A zwangsläufig Auslöschung auf. Betrachtet man λ1 als Funktion in den Variablen p und w, so erhält man für die Verstärkungsfaktoren


Also ist die Variante A im Fall (1.10) nicht stabil. Bei Variante B erhält man dagegen
D. h., der Algorithmus B ist stabil. Für p: = − 2 und q: = 0.01 ergibt sich bei exakter (bzw. 4-stelliger) Rechnung




Die exakte Lösung für λ1 ist λ1 = − 0.0025. Bei Rechnung mit 4-stelliger Mantisse erhält man im Fall der Variante B λ1 = − 0.0025, während man für die Variante A λ1 = − 0.0030 erhält mit einem relativen Fehler bezüglich der exakten Lösung von

Im Fall

gilt offenbar
. Somit ist die Berechnung von λ1: = p + w stabil möglich und von λ2: = p − w kritisch. Ein stabiler Algorithmus ergibt sich hier durch die Vertauschung der Rollen von λ1 und λ2 oben.
Wir nennen einen Algorithmus zur Lösung eines bestimmten Problems numerisch stabiler als einen zweiten zur Lösung desselben Problems, wenn der Gesamteinfluss aller Rundungsfehler auf die Lösung bei dem ersten Algorithmus kleiner als bei dem zweiten ist.