Zum Inhalt springen

Benutzer:Stepri2005/Kurs:Optimierung/Einführung

Aus Wikiversity

1.1 Aufgabenstellung

[Bearbeiten]

In dieser Vorlesung werden stetige Optimierungsprobleme der Gestalt

(1.1)

behandelt, wobei eine Menge und eine stetige Funktion in Veränderlichen ist. Die Funktion bezeichnet man als Zielfunktion und die Menge als zulässige Menge, zulässigen Bereich oder Menge der zulässigen Punkte des Problems. Das Wort „Minimiere“, abgekürzt „Min.“, ist hier als Aufforderung und nicht als „“ im mathematischen Sinne von Minimum zu verstehen.

Es ist also nicht unbedingt von Vorneherein klar, ob auf einen kleinsten Wert besitzt. Die Aufgabe (1.1) ist demnach gleichbedeutend mit dem Problem

Ist bekannt, dass sein Minimum auf in einem Punkt annimmt, dann kann das Problem (1.1) bekanntlich auch in der Form

geschrieben werden und es gilt für einen solchen globalen Minimalpunkt

Die Existenz eines globalen Minimalpunktes für das Problem (1.1) ist z. B. nach dem aus der Analysis 2 bekannten Satz von Weierstraß gesichert, wenn eine nichtleere kompakte Menge ist (s. Satz 2.38). Sobald wir uns mit numerischen Verfahren zur Lösung einer Problemklasse beschäftigen, werden wir aber einfach voraussetzen bzw. durch geeignete Voraussetzungen garantieren, dass das entsprechende Problem eine globale Lösung besitzt.

Aufgrund der Identität

(1.2)

kann jedes Maximierungsproblem in ein Minimierungsproblem umgeschrieben werden. Denn jeder lokale Maximalpunkt von ist ein lokaler Minimalpunkt von , so dass man, wenn man maximieren möchte, auch statt dessen minimieren kann. Der optimale Zielfunktionswert hat dann jedoch das umgekehrte Vorzeichen, so dass er anschließend mit zu multiplizieren ist. Es genügt somit, nur Minimierungsprobleme zu betrachten, was wir hier auch nur tun wollen.

In der Optimierung interessieren nun besonders zwei Fälle, zum einen der Fall , bei dem man von einem unrestringierten Optimierungsproblem spricht und zum anderen der Fall des restringierten Optimierungsproblems, bei dem der zulässige Bereich mittels Funktionen durch

(1.3)

definiert wird. Die Funktionen und müssen nur auf oder einer offenen Obermenge von definiert sein. Dieses lässt sich aber im Fall von (1.3) nur umständlich ausdrücken, da implizit durch die und festgelegt ist. Deshalb wird zumeist der Einfachheit halber angenommen, dass die verwendeten Funktionen auf dem ganzen definiert sind. In der Praxis muss dies aber natürlich nicht der Fall sein. Man denke z. B. an rationale Funktionen. Ein restringiertes Optimierungsproblem des Typs (1.1) schreibt man normalerweise in der Form

(1.4)

Darin bedeutet „u. d. N.“ „unter den Nebenbedingungen“ (oder gegebenenfalls „unter der Nebenbedingung“) und es wird als bekannt angenommen, dass über minimiert wird.

Bedingungen des Typs und in einem Optimierungsproblem nennt man Gleichungs- bzw. Ungleichungsnebenbedingungen. Statt von einer Nebenbedingung spricht man auch von einer Restriktion. In Problem (1.4) sind die Fälle oder zugelassen, d. h., dass das Problem nur Gleichungs- oder nur Ungleichungsrestriktionen besitzt. Man beachte, dass „“-Restriktionen nicht gesondert in einer Problemformulierung aufgeführt werden müssen, da sie mittels einer Multiplikation mit äquivalent durch „“-Restriktionen ersetzt werden können. Ferner sei darauf hingewiesen, dass man auch eine Gleichungsnebenbedingung äquivalent durch Ungleichungsnebenbedingungen ausdrücken könnte und zwar durch die beiden Bedingungen und . Eine solche Ersetzung ist jedoch zumeist nicht ratsam, da Gleichungsrestriktionen leichter als Ungleichungsrestriktionen behandelt werden können.

Seien nun und eine Matrix. Eine reellwertige Funktion des Typs

(1.5)

heißt affin oder affin-linear und im Fall auch linear. Der Einfachheit halber sprechen wir häufig auch bei von einer Funktion, obwohl es sich dabei streng genommen um den Funktionswert einer Funktion handelt. Weiter bezeichnet man eine reellwertige Funktion der Gestalt

als eine quadratische Funktion. (Wie in Bemerkung 2.32 erläutert werden wird, kann ohne Beschränkung der Allgemeinheit für angenommen werden, dass die Matrix symmetrisch ist.) Für ist der Graph einer affin-linearen Funktion eine Gerade in der Ebene und der einer linearen Funktion eine Gerade in der Ebene durch den Nullpunkt. Für stellt dann der Graph der quadratischen Funktionen eine Gerade dar, wenn ist, eine nach oben geöffnete Parabel, wenn ist und eine nach unten geöffnete Parabel, falls gilt.

Man sagt, dass das Problem (1.4) ein lineares Optimierungsproblem ist, wenn gilt:

sind affin-linear.

(Affin-lineare Funktionen und Restriktionen bezeichnet man in der Optimierung auch kurz - und nicht ganz korrekt - als linear.) Das Problem (1.4) ist ein quadratisches Optimierungsproblem im Fall

ist quadratisch und sind affin-linear.

Ist schließlich in einem unrestringierten Optimierungsproblem die Zielfunktion oder in einem restringierten Problem zumindest eine der Funktionen und eine nichtlineare Funktion, so spricht man von einem nichtlinearen Optimierungsproblem.

Die Theorie und Lösung linearer und quadratischer Optimierungsprobleme ist das Thema der Vorlesung „Optimierung I“. Verfahren für nichtlineare unrestringierte Optimierungsprobleme werden in „Optimierung II“ und solche der restringierten Optimierung in „Optimierung III“ vorgestellt.

Bezüglich letzterer beiden Vorlesungen sei bereits gesagt, dass wir voraussetzen, dass alle im Problem vorkommenden Funktionen auf einer geeigneten Menge mindestens einmal stetig differenzierbar, d. h. dass die betrachteten Probleme glatte Optimierungsprobleme sind. Für eine Einführung in die Theorie und Numerik der nichtglatten Optimierung verweisen wir z. B. auf das Buch von Alt [Alt04]. Es sei hier nur angemerkt, dass die nichtglatte Optimierung bei weitem nicht so entwickelt ist wie die glatte Optimierung. Darüber hinaus können viele nichtglatte Probleme unter Einführung von (zusätzlichen) Restriktionen auch als glatte Optimierungsprobleme beschrieben und gelöst werden.

1.2 Ein Beispiel aus der aktuellen Forschung

[Bearbeiten]

1.2.1 Einleitung

[Bearbeiten]

Die Inhalte dieses Abschnitts sind für das Verständnis des Kurses nicht erforderlich, so dass der Abschnitt auch zu einem späteren Zeitpunkt gelesen werden kann. Das ausführlich dargestellte Beispiel der Bestrahlungsplanung soll neugierig auf die Optimierung und die Möglichkeiten ihrer Anwendung machen. Es soll darüber hinaus eine Brücke von den manchmal nüchternen mathematischen Ergebnissen zur Praxis der Mathematik bauen und die Rolle der Modellbildung dabei aufzeigen. Und schließlich soll das Beispiel auch als Motivation dienen, da es zeigt, dass die Vorlesungen „Optimierung I - III“ die Mittel bereit stellen, solche praxisrelevanten und aktuellen Probleme zu lösen.

Die Minimierung und Maximierung von Zuständen und Prozessen in Abhängigkeit von den sie bestimmenden Größen sind in allen technischen, naturwissenschaftlichen und wirtschaftlichen Bereichen von Interesse. Beispiele sind die Maximierung des Gewinns oder die Minimierung des Verlustes bei einem Vorgang in der Wirtschaft, die maximale Auslastung bei Produktionsprozessen, die optimale Konstruktion von Produkten im Hinblick auf Material, Volumen oder Fähigkeiten, die möglichst geringe Abweichung technisch realisierbarer Zustände und Prozesse von idealen Vorgaben dafür, usw. Man könnte nun dem eigentlichen Stoff eine Reihe solcher Optimierungsprobleme als Motivation voranstellen. Wir wollen dies jedoch nicht tun, sondern verweisen den Leser diesbezüglich auf die genannte Literatur, wo er viele solcher Beispiele findet.

Anwendungsbeispiele in Lehrbüchern sind aber im Vergleich mit realen Praxisproblemen von der Zahl der Variablen und Nebenbedingungen her naturgemäß eher sehr klein und werden zumeist als fertige und einzig mögliche Modelle für eine Aufgabenstellung präsentiert. Deshalb ziehen wir es hier vor, ein einziges, aber aktuelles „real-life“ Problem, die optimale Bestrahlungsplanung im Rahmen der Krebsbehandlung, ausführlich zu diskutieren und wir wollen daran unter anderem Schwierigkeiten im Zusammenhang mit der Modellierung von Optimierungsaufgaben in der Praxis verdeutlichen. Die Bestrahlungsplanung mit Optimierungsmethoden hat seit Anfang der 90er Jahre durch die Verfügbarkeit ganz neuer Technologien und die damit mögliche Behandlung von Patienten, die zuvor nicht strahlentherapeutisch behandelt werden konnten, große Aufmerksamkeit in der Forschung auf sich gezogen und wird das sicher auch noch einige Zeit weiter tun.

In der Praxis hat der Mathematiker oft Aufgaben gemeinsam mit Vertretern anderer Berufsgruppen zu lösen. Im Fall der Bestrahlungsplanung hat er dies gemeinsam mit Strahlenphysikern und Medizinern zu tun. Bei der Modellierung einer Aufgabe ist dann im Allgemeinen nicht nur eine mathematische Formulierung denkbar, sondern sind zumeist miteinander konkurrierende Ansätze möglich, welche jeweils Vor- und Nachteile besitzen. So hat der Mathematiker bei der Erstellung eines Modells häufig den Grad der Komplexität und die numerische Lösbarkeit des resultierenden Problems miteinander abzuwägen. Denn zum einen sollte ein Modell genügend Informationen über die gestellte Aufgabe verarbeitet haben, so dass eine Lösung die Anwender zufrieden stellt und zum anderen muss das mathematische Problem nach dem aktuellen Stand der Forschung auch noch in akzeptabler Zeit lösbar sein. Naturgemäß nimmt dabei der Grad der Komplexität von Modellen zu, die im Laufe der Zeit für ein wichtiges praktisches Problem vorgeschlagen werden, da man immer mehr Phänomene im Modell berücksichtigen möchte. Letzteres ist auch bei der Bestrahlungsplanung zu beobachten, für die man eine große Zahl von unterschiedlichen mathematischen Ansätzen findet. (Dazu und für Details zu den folgenden Unterabschnitten verweisen wir auf den Übersichtsartikel [ReeAlb08].)

Wir beginnen in den Unterabschnitten 1.2.2 und 1.2.3 mit einer kurzen Einführung in die Bestrahlungsplanung und die neue Technik der intensitätsmodulierten Radiotherapie. Für letztere werden wir in 1.2.3 auch einige ältere Modelle diskutieren und im Unterabschnitt 1.2.4 einen neuen, biologische Kriterien berücksichtigenden Ansatz diskutieren. Es folgen in 1.2.5 ein Fall aus der klinischen Praxis und in 1.2.6 ein Ausblick auf weitere Aufgabenstellungen für die Optimierung in diesem Zusammenhang.

1.2.2 Bestrahlungsplanung

[Bearbeiten]

Im Rahmen einer Krebsbehandlung werden in Deutschland jährlich etwa 130 000 Patienten bestrahlt, z. B. in den USA sind dies etwa 500 000 Patienten. Bei etwa jedem zweiten dieser Patienten wurde der Tumor bzw. wurden die Tumore zuvor ganz oder teilweise operativ entfernt. Für die Bestrahlung ist dann das Zielvolumen festzulegen, d. h. der Bereich des Körpers, der den (Rest-)Tumor und das Gewebe umfasst, in dem Tumorzellen vermutet werden. (Der Einfachheit halber gehen wir hier von nur einem Zielvolumen aus.)

Das Hauptproblem bei der Bestrahlung besteht darin, dass sie nicht nur auf Krebszellen, sondern auch auf gesundes Gewebe eine biologische Wirkung ausübt. Daher muss für jeden Patienten auf der Basis der durch Computertomographie erzeugten Bilder ein Bestrahlungsplan erstellt werden. Dieser muss einen Kompromiss zwischen den beiden miteinander konkurrierenden Zielen darstellen, einerseits eine für die Zerstörung der Tumorzellen ausreichend hohe Dosis im Zielvolumen zu deponieren und andererseits das gesunde Gewebe und insbesondere die Risikoorgane so weit wie möglich zu verschonen.

Würde ein Patient nur aus einer Richtung bestrahlt, so würde das in Strahlrichtung vor und hinter dem Zielvolumen liegende Gewebe ebenfalls erheblicher Strahlung ausgesetzt sein. Daher bestrahlt man zeitlich hintereinander aus mehreren Richtungen mit geringerer Intensität, so dass zum einen das Zielvolumen im Schnitt der Strahlen liegt und durch Überlagerung der deponierten Einzeldosen eine ausreichend hohe Dosis erhält und zum anderen das auf dem Weg der Strahlen liegende gesunde Gewebe nur in akzeptablem Maße in Mitleidenschaft gezogen wird. Bestrahlungsplanung beinhaltet demzufolge, in Abhängigkeit von der Anatomie des Patienten und der Lage des Zielvolumens geeignete Richtungen und Intensitäten, d. h. Öffnungszeiten der Strahlenquelle, für die einfallenden Strahlen festzulegen.

Konventionell wird bei der Krebsbestrahlung mit hoch-energetischen Photonen bestrahlt, welche von einem Linearbeschleuniger geliefert werden, ihre Energie im Gewebe abgeben und damit die beabsichtigte biologische Reaktion erzeugen. Die per Einheitsmasse deponierte Energie wird als (absorbierte) Dosis bezeichnet und führt zu einer biologischen Reaktion des Gewebes. Sie wird in Gray, abgekürzt Gy, bemessen, wobei ein Gy einem Joule von Energie entspricht, welche in einem Kilo Materie deponiert wird. Um die Regenerationsfähigkeit des gesunden Gewebes nicht zu erschöpfen, wird die bei einer Behandlung zu applizierende Strahlendosis normalerweise in kleinen Portionen über einen längeren Zeitraum verabreicht. So werden z. B. 70 Gy für einen Lungentumor in 35 Tagesportionen à 2 Gy aufgeteilt.

Die Strahlenquelle kann prinzipiell so ausgerichtet werden, dass das Zielvolumen von jeder Richtung aus bestrahlt werden kann. Die Behandlung selbst ist in den meisten Kliniken standardisiert. Abhängig von der Lage und dem Typ des Tumors ist die Anzahl der Strahlenfelder festgelegt (typischerweise 2 bis 4). Ihre Positionen im Raum sind im wesentlichen vorbestimmt und werden höchstens geringfügig für den einzelnen Patienten angepasst und die Strahlenintensitäten sind konstant oder besitzen einen konstanten Gradienten.

Ein vollständiges Strahlenfeld - die Öffnung im Gerät, durch welche der Strahl bzw. die Strahlung auf den Patienten trifft - ist rechteckig, wobei sich die Größe des Feldes an der Größe des Zielvolumens orientiert. Um ein Strahlenfeld dem Zielvolumen anzupassen, werden häufig unterschiedliche Vorrichtungen verwendet, die Teile des rechteckigen Feldes blockieren und damit für Teile des Körpers die Strahlung reduzieren bzw. ausblenden. So werden z. B. speziell für den Patienten und jeden Einstrahlwinkel hergestellte, mit Keilen und Blöcken aus Blei versehene Platten vor die Strahlenquelle in das Gerät eingebracht, welche dann zeitaufwändig für jeden neuen Einstrahlwinkel ausgetauscht werden müssen.

In dieser Hinsicht, aber nicht nur in dieser, haben die vor einigen Jahren auf den Markt gekommenen Multi-Leaf Kollimatoren (MLCs) einen gewaltigen Fortschritt bei der Krebsbestrahlung gebracht. Ein MLC ist eine in das Bestrahlungsgerät integrierte Apparatur, die typischerweise aus je 25 bis 60 dünnen Wolframblenden auf gegenüberliegenden Seiten besteht, welche mit dem Computer und damit zeitlich effizient gesteuert werden können. Mit einem MLC können praktisch beliebige Feldformen erzeugt werden. Insbesondere ist es damit möglich, zumindest in guter Näherung nur die Fläche zu öffnen, welche sich durch Projektion des Zielvolumens auf den MLC ergibt. Darüber hinaus ermöglichen MLCs die im nächsten Abschnitt diskutierte, viel genauere intensitätsmodulierte Bestrahlung.

1.2.3 Intensitätsmodulierte Radiotherapie

[Bearbeiten]

Als Quantensprung im Hinblick auf die Möglichkeiten der Krebsbehandlung mittels Radiotherapie wird die sog. intensitätsmodulierte Radiotherapie (IMRT) angesehen, welche etwa 1994 erstmalig klinisch umgesetzt und seitdem ständig weiterentwickelt wurde. Im Unterschied zu einer konventionellen Behandlungsplanung, bei der man die Strahlenwirkung auf einen Patienten für einige wenige unterschiedliche Anzahlen, Richtungen und Intensitäten der Strahlen mittels einer Trial-und-Error-Technik abschätzt, geht man bei der IMRT umgekehrt vor, indem man (möglichst auch erreichbare) Behandlungsziele in Form von Dosisverteilungen für das Zielvolumen, die Risikoorgane und das übrige normale Gewebe vorgibt und dann versucht, die Parameter - im wesentlichen die Zahl der Strahlenfelder und die Strahlenintensitäten - so zu bestimmen, dass die Zieldosis die Vorgaben in gewissem Sinne optimal erfüllt. Dabei werden die einzelnen Strahlen moduliert, d. h. in Tausende kleiner Nadelstrahlen zerlegt, wobei dann für jeden dieser Nadelstrahlen die Intensität zu bestimmen ist.

IMRT ermöglicht so die Erzeugung viel genauerer und komplexerer Dosisverteilungen und damit die Behandlung von Krebspatienten, die zuvor wegen zu hoher Risiken nicht strahlentherapeutisch behandelt werden konnten. Im Vergleich mit konventioneller Radiotherapie erfordert IMRT auf der anderen Seite aber wegen der damit erzeugten, viel inhomogeneren Dosisverteilungen ein subtileres Modell der Strahlenwirkung sowie die Lösung großer Optimierungsprobleme. IMRT setzt also neben zusätzlicher Software auch geschultes Personal voraus, weswegen diese Form der Therapie in Deutschland bislang nur an wenigen Strahlenkliniken eingesetzt wird.

Zur Optimierung eines Behandlungsplans für IMRT können neben den Strahlenintensitäten die Anzahl und Winkel der Strahlenfelder sowie weitere Parameter herangezogen werden. Idealerweise würde man bezüglich all dieser Parameter optimieren, was jedoch bei Zugrundelegung praxisrelevanter Anzahlen auf so komplexe mathematische Optimierungsprobleme führen würde, dass diese weder gegenwärtig noch in absehbarer Zeit lösbar wären. Überdies erlauben die vollautomatischen MLCs beispielsweise die Verwendung einer größeren Anzahl von Strahlenfeldern als herkömmliche Methoden und es ist bekannt, dass bei einer größeren Anzahl von Strahlenfeldern deren Anordnung im Raum die resultierende Dosisverteilung nur noch geringfügig beeinflusst. Somit erscheint beispielsweise der Gewinn, den eine diskrete Optimierung hinsichtlich der Anzahl und Ausrichtung der Strahlenfelder bringen könnte, im Verhältnis zum Aufwand als zu gering.

Deshalb geht man üblicherweise für die Bestrahlungsplanung mit IMRT und gehen wir hier davon aus, dass die Anzahl sowie die Positionen der Strahlenfelder, also die Strahlenrichtungen, von einem Experten für den aktuellen Fall festgelegt wurden und man optimiert nur bezüglich der Strahlenintensitäten. Normalerweise ist eine Zahl zwischen 3 und 6 und kleiner als 12. Die Form jedes Strahlenfeldes kann aufgrund der Verwendung eines MLCs als zwei-dimensionales Gebiet angenommen werden, welches von der Projektion des Zielvolumens auf eine Ebene in der Position des MLCs herrührt. Weiter wird das -te dieser Strahlenfelder in rechteckige Feldelemente und damit der -te Strahl in Nadelstrahlen gleicher Größe unterteilt. Folglich ist die Gesamtzahl der Nadelstrahlen.

Für jeden der Nadelstrahlen muss nun ein nichtnegatives Gewicht bestimmt werden, d. h. ein Faktor, mit dem die Einheitsintensität des Nadelstrahls multipliziert werden muss, damit eine gewünschte Dosis erzielt wird. Diese Gewichte

(1.6)

bilden die Unbekannten eines Optimierungsmodells zur Bestrahlungsplanung für IMRT. Typisch ist eine Zahl von 1 000 bis 2 000 Nadelstrahlen pro Feld und damit eine Gesamtzahl von Gewichten bzw. Variablen zwischen 3 000 und 15 000.

Der in den Strahlenrichtungen liegende Teil des Körpers wird in drei-dimensionale Volumina aufgeteilt, welche neben dem Zielvolumen die Risikoorgane und Gebiete normalen Gewebes repräsentieren. Jedes dieser Volumina wird weiter in kubische Volumenelemente gleicher Größe mit einer Kantenlänge von normalerweise mm unterteilt, inbesondere das -te Volumen in Elemente . Typischerweise ist kleiner als 15 und die Gesamtzahl aller Volumenelemente kleiner als 2 000 000. Wir nummerieren alle Volumenelemente von 1 bis durch und bezeichnen die Indexmenge der Volumenelemente, welche zu dem -ten Volumen gehören, mit . Der Einfachheit halber sprechen wir bei auch von dem Volumen selbst, wobei das Zielvolumen sei.

Nun sei die Dosis, welche im -ten Volumenelement vom -ten Nadelstrahl bei Einheitsintensität absorbiert wird. Dann ist die entsprechende Dosis bei -facher Intensität und gibt die Summe dieser Terme über alle Nadelstrahlen

die totale Dosis im -ten Volumenelement an. Dabei ist der unbekannte Gewichtsvektor und die -te Zeile der sog. Dosismatrix . Diese Dosismatrix wird hier als gegeben angenommen und muss für jeden Patienten in Abhängigkeit von der Zahl und den Positionen der Einstrahlfelder im Raum nach einer Methode berechnet werden, die hier nicht beschrieben werden kann. Man geht dabei davon aus, dass der -te Nadelstrahl nur Auswirkungen auf Volumenelemente in der Umgebung seines Weges durch den Körper hat und vernachlässigt Streueffekte außerhalb davon, so dass typischerweise nur 3 bis 8 % der Elemente von verschieden von Null sind. Letzteres lässt sich numerisch nutzen. (Man bedenke, dass die Matrix größenordnungsmäßig bis Elemente hat.)

Ziel ist es nun, für die Variablen ein geeignetes glattes Optimierungsproblem aufzustellen, welches nach heutigem Kenntnisstand auch numerisch lösbar ist (wobei die Rechenzeiten aus Sicht des klinischen Personals nicht kurz genug sein können). In vielen Modellen, insbesondere in den ersten Modellen für IMRT, wird für jedes Risikoorgan und das übrige gesunde Gewebe, also für jedes eine volumenspezifische obere Schranke für die Dosis in festgelegt, was auf die linearen Restriktionen

(1.7)

führt. Unter solchen Nebenbedingungen wird dann z. B. die Gesamtdosis im Zielvolumen

über alle maximiert. (Offenbar ist der Vektor für dieses Problem zulässig und dessen zulässiger Bereich somit nichtleer.) Oder es wird die Gesamtdosis im „ganzen“ Körper

unter den Nebenbedingungen in (1.7) über alle minimiert, wobei zusätzlich eine untere Schranke für die Dosis im Zielvolumen festlegt wird und die Restriktionen

(1.8)

mit in das Problem aufgenommen werden, damit das Zielvolumen eine ausreichend hohe Dosis erhält, die für die Zerstörung der Tumorzellen benötigt wird. (Außerdem wäre ansonsten die Lösung des Problems.)

Das sind nur einige Beispiele von Modellen, die zur Bestrahlungsplanung für IMRT vorgeschlagen wurden und welche auf lineare Optimierungsprobleme führen. Von ihrer Struktur her sind dies „einfache“ Probleme, jedoch sind sie nicht nur - wie alle anderen Modelle - von der Variablenzahl, sondern auch von der Zahl der Restriktionen her sehr groß, da sie für jedes Volumenelement zumindest des gesunden Gewebes wenigstens eine Restriktion enthalten. Es ist darum keineswegs klar, dass ein so großes lineares Problem einfacher und schneller gelöst werden kann als eines der im Folgenden beschriebenen nichtlinearen Probleme, welches solche Restriktionen nicht enthält. Bei Problemen, die gleichzeitig obere Dosisschranken wie in (1.7) und eine untere Dosisschranke für das Zielvolumen wie in (1.8) enthalten, besteht außerdem die Gefahr, dass diese Schranken zu optimistisch gewählt wurden und nicht gleichzeitig eingehalten werden können. In letzterem Fall ist der zulässige Bereich des Problems leer. Die zuletzt genannte Schwierigkeit hat zu approximationsartigen Modellen geführt. Ein sehr verbreiteter Ansatz ist der folgende, der vielfach variiert wurde. Setzt man

so stellt offenbar die Summe der quadrierten Verletzungen der Restriktionen in (1.7) für ein Volumen mit dar. Man minimiert dann über alle die Funktion

(1.9)

wobei und jedes ein vorgegebenes volumenspezifisches Gewicht ist, dessen Größe die Bedeutung widerspiegeln soll, die man der Einhaltung der Dosisvorgabe für dieses Volumen gibt.

Man beachte, dass die Minimierung von bei einer Verwendung der Funktion anstelle von für die gesunden Volumina eine Dosis in der Nähe der zulässigen Höchstdosen liefern würde, was nicht erwünscht sein kann (aber sogar vorgeschlagen worden ist). Die Funktion ist eine stückweise quadratische und nur einmal stetig differenzierbare Funktion, was bei der Wahl der Lösungsmethode berücksichtigt werden muss. Bei einer Erhöhung der Potenz von 2 auf 3 in (1.9) wäre zwar zweimal stetig differenzierbar, aber wüchse auch die Größe der Funktionswerte, was numerisch problematisch werden kann.

Bei dem Ansatz in (1.9) ist die Gewichtung durch die sehr kritisch zu sehen, da sie relativ willkürlich ist und ihre Wahl die Lösung stark beeinflusst. Im Grunde handelt es sich bei diesem Problem um ein multikriterielles bzw. vektorielles Optimierungsproblem (z. B. [Jah04]) und wäre es demgemäß sinnvoll, Lösungen für eine hinreichend große, endliche Menge von Gewichtsvektoren zu erzeugen und auf ihre medizinische Wirkung hin miteinander zu vergleichen. Eine solche, durchaus angebrachte multikriterielle Optimierung ist aber wegen der Anzahl der Variablen und der zumeist hohen Dimension des Gewichtsraumes gegenwärtig nicht möglich.

Alle bisher genannten Bedingungen berücksichtigen die biologische Reaktion von Gewebe auf die Strahlung nur in unzureichender Weise. So hängt die Empfindlichkeit eines gesunden Organs nicht nur von der Maximaldosis ab, die einige seiner Volumenelemente absorbieren, sondern von der Verteilung der von dem Organ insgesamt absorbierten Dosis. Deshalb setzt sich allmählich eine biologische Sichtweise für Bestrahlungsmodelle durch und wurden mathematische Beschreibungen biologischer Bedingungen der Strahlenwirkung vorgeschlagen. Diese Bedingungen, bei deren Entwicklung und Anwendung eine Forschergruppe am Universitätsklinikum Tübingen eine Vorreiterrolle gespielt hat, lassen sich jedoch nicht mehr alle durch lineare oder (stückweise) quadratische Funktionen beschreiben. Das in Tübingen entwickelte Modell der Bestrahlungsplanung für IMRT wollen wir im nächsten Unterabschnitt kurz darstellen.

1.2.4 Ein neuer Optimierungsansatz

[Bearbeiten]

Mit meinen wir im Folgenden die Anzahl der Elemente von . Die verwendete Zielfunktion, welche maximiert werden soll, beschreibt die Tumorkontrollwahrscheinlichkeit, d. h. die Wahrscheinlichkeit, dass alle Tumorzellen im Zielvolumen zerstört werden:

(1.10)

Dabei ist eine gegebene, sich auf die Überlebenswahrscheinlichkeit einer Zelle beziehende Konstante und der vorgegebene Wert der Dosis, welche das Zielvolumen idealerweise bei homogener Verteilung absorbieren soll.

Die Funktion in (1.10) sieht furchterregend aus. Man bedenke nun aber, dass eine Lösung von für eine Funktion gefunden werden kann, indem man das Problem löst. Also ist die Maximierung der Funktion in (1.10) mathematisch äquivalent mit der Minimierung der einfacheren Logarithmic Tumor Control Probability (LTCP)

(1.11)

Im Idealfall ist für alle und damit . Weiter beachte man, dass eine Unterdosierung in einigen Elementen des Zielvolumens ein starkes Wachstum des Zielfunktionswertes zur Folge hat und daher durch die Minimierung im Allgemeinen vermieden wird.

Um im Zielvolumen eine exzessiv hohe und damit schädliche Dosis zu vermeiden oder in Teilen eines gesunden Volumens eine moderate Überdosierung zu erlauben, werden Nebenbedingungen des Typs

(1.12)

verwendet (QOP = Quadratic Overdosage Penalty), wobei der Wert einer volumenspezifischen Referenzdosis und eine gegebene Konstante ist, mit der die Abweichung von in gesteuert wird. So muss in Volumina, die dem Zielvolumen benachbart sind, eine geringe Überdosierung in einer kleinen Umgebung des Zielvolumens akzeptiert werden, weil ein starker Dosisabfall von diesem zu den Nachbarvolumina physikalisch nicht möglich ist.

Die Risikoorgane teilt man in serielle und parallele Organe ein. Ein serielles Organ, wie z. B. das Rückenmark oder eine Nervenstruktur, ist vollständig zerstört, sobald nur ein kleiner Teil davon zerstört ist, während parallele Organe wie Lungen, Nieren, Speicheldrüsen, usw. im Hinblick auf die zu erwartende Lebensqualität eines Patienten bis zu einem gewissen Grad geschädigt werden können, wenn dies für die insgesamt zu erzielende Dosisverteilung von Vorteil ist.

Als akzeptable Dosisverteilung für jedes serielle Risikoorgan wird die (generalized) Equivalent Uniform Dose (EUD)

(1.13)

zugrunde gelegt. Setzt man diese gleich einer Dosis , so stellt die EUD im Hinblick auf die Strahlenwirkung ein Modell für biologisch zulässige inhomogene Dosisverteilungen in dar, welche einer homogenen Dosisverteilung von Gy im Organ entsprechen. Die Potenz ist dabei organabhängig zu wählen. Sie wird im Fall einer gegenüber der Strahlung unempfindlicheren Struktur klein und im anderen Fall, wie z. B. für das Rückenmark, groß gewählt.

Beispiel 1.1

[Bearbeiten]

Es seien und der Ausdruck in (1.13) sei gleich gesetzt. Letztere Beziehung lässt offenbar für jedes die homogene Dosisverteilung in als Lösung zu. Kann für insbesondere gesetzt werden, so erlaubt sie aber auch eine inhomogene Verteilung mit relativ großen Abweichungen von in Bereichen des Organs, wie z. B. die Identität

zeigt. Ist dagegen „groß“, z. B. , so ermöglicht die anfangs genannte Identität im Vergleich mit nur geringe Überdosierungen in Teilen des Organs und nur dann, wenn gleichzeitig die übrigen Teile keine oder nur eine entsprechend geringere Dosis erhalten. Z. B. hat man hier


Für jedes serielle Risikoorgan wird nun gefordert, dass die EUD für kleiner oder gleich einer Dosis zu sein hat, dass also die Nebenbedingung

(1.14)

zu erfüllen ist, wobei und organabhängig festzulegen sind.

Im Fall eines parallelen Risikoorgans möchte man aus den oben genannten Gründen ausdrücken, dass ein Teil des Organs zerstört werden kann, sofern der restliche Teil eine ausreichende Funktionsfähigkeit behält. Dazu wird der Verlust der Funktionsfähigkeit eines Organs, wie z. B. der Verlust einer Speicheldrüse, Speichel zu produzieren, modellartig durch eine Sigmoidfunktion beschrieben. Im Beispielfall der Sigmoidfunktion drückt diese aus, dass das Organ bzw. ein Volumenelement des Organs bei Gy die Hälfte seiner Funktion verliert, während es bei einer Nulldosis voll funktionstüchtig ist und für seine ganze Funktion verliert.

In das Optimierungsproblem selbst wird für ein paralleles Organ eine Nebenbedingung der Form

(1.15)

aufgenommen (PV = Partial Volume), wobei den Prozentsatz der Funktionsfähigkeit von angibt, der maximal aufgegeben werden darf und die Dosis und Potenz wieder organabhängig zu wählen sind. Bei Daten und für eine Speicheldrüse drückt diese Ungleichung also aus, dass die Speicheldrüse bei einer homogenen Dosis von 26 Gy 50% ihrer Funktion, der Produktion von Speichel, verliert und dass ein Verlust von im Extremfall 60% der gesamten Funktion des Organs akzeptiert wird, solange die übrigen 40% eine Nulldosis erhalten. (Für 60% der Anzahl der Volumenelemente dürfen die Summanden in (1.15) den Wert 1 haben, solange die verbleibenden 40% identisch 0 sind.)

Die LTCP-, QOP- und EUD-Funktionen sind konvexe Funktionen (s. Definition 2.25), eine PV-Funktion ist nichtkonvex. Somit handelt es sich bei den resultierenden großen Optimierungsproblemen um konvexe Optimierungsprobleme (vgl. Abschnitt 2.9), wenn keine parallelen Organe berücksichtigt werden müssen und um nichtkonvex-nichtlineare Probleme im anderen Fall. Während für konvexe Probleme jeder lokale Minimalpunkt auch ein globaler Minimalpunkt ist (s. Satz 2.37), sind nichtkonvexe Probleme im Rahmen eines routinemäßigen Einsatzes, bei dem nur wenig Zeit für Experimente besteht, gefürchtet, da man bei ihrer Lösung in einem lokalen Minimalpunkt hängen bleiben kann, der einen im Verhältnis zum Minimalwert des Problems relativ großen Zielfunktionswert besitzt. Die bei dem beschriebenen Modell entstehenden Optimierungsaufgaben scheinen im kritischen Bereich jedoch nahezu konvex zu sein, so dass ein solches Verhalten bisher nicht beobachtet wurde.

Für die Lösung der im Vergleich mit früheren Ansätzen viel komplexeren Optimierungsprobleme, welche mit den beschriebenen Funktionen gebildet werden, wurde ein Algorithmus entwickelt, der sich charakteristische Eigenschaften des Problems zunutze macht ([AlbRee07]). Dieser Algorithmus, der bereits an mehreren Kliniken weltweit für die Bestrahlungsplanung eingesetzt wird, kann als eine neue Variante einer Penalty-Multiplier-Methode verstanden werden (vgl. Optimierung III). Die unrestringierten nichtlinearen Teilprobleme darin werden mit dem Polak-Ribière-Verfahren der konjugierten Gradienten gelöst (vgl. Optimierung II), da beobachtet wurde, dass nur relativ wenige Eigenwerte der Hesse-Matrix ihrer Zielfunktion in einer Lösung signifikant verschieden voneinander sind und sich die übrigen bei 0 häufen und weil bekannt ist, dass sich Verfahren der konjugierten Richtungen in einem solchen Fall sehr günstig verhalten.

1.2.5 Ein Beispielfall

[Bearbeiten]

Als Beispielfall wird der Fall eines 55-jährigen Mannes mit einem Tumor des oberen Kehlkopfes dargestellt, der sich entlang der linken Mund- und Rachenhöhle bis zur Schädelbasis und in den oberen Bereich des Brustkorbs ausgebreitet hatte. Eine Bestrahlung mit herkömmlichen Techniken ohne Intensitätsmodulation hätte in diesem Fall wegen der Nähe zum Rückenmark keine ausreichend hohe Dosis im Hinblick auf die Zerstörung der Tumorzellen erreichen können. Ferner werden bei herkömmlicher Bestrahlung solcher Kopf-Hals-Tumore typischerweise die Speicheldrüsen stark geschädigt, was chronische und schmerzhafte Folgen für den Patienten hat.

Die Bestrahlung des Resttumors mit IMRT erfolgte nach einer operativen Entfernung des Kehlkopfes. Die insgesamt verabreichte Dosis betrug 70 Gy. Bestrahlt wurde aus 9 gleichmäßig verteilten, koplanaren Richtungen. Die Gesamtzahl der Feldelemente und damit die Anzahl der Variablen des Optimierungsproblems betrug 14 557. Bestrahlt wurde ein cm³ großer Kubus, der in ca. 1 600 000 Volumenelemente mit 3 mm Seitenlänge unterteilt wurde. Etwa 800 000 davon fielen auf den Körper des Patienten und gingen somit in die im vorangehenden Unterabschnitt beschriebenen Funktionen ein.

Es wurden zwei Zielvolumina betrachtet, der sichtbare Resttumor und der den Resttumor umgebende Bereich , in dem noch Tumorzellen vermutet wurden. Die Zielfunktion wurde aus der Summe der beiden zugehörigen LTCP-Funktionen gebildet. Mit Nebenbedingungen für 5 Risikoorgane , welche im Problem spezifiziert werden, sowie für das gesunde Restvolumen hatte das zu lösende Optimierungsproblem die folgende Gestalt:

Offenbar erfüllt alle Restriktionen, so dass der zulässige Bereich nichtleer ist. Unter einer praktisch erfüllten Voraussetzung kann man auch leicht zeigen, dass das Problem eine Lösung besitzt (s. [AlbRee07]). Es hat weiter 14 557 Variable und neben den entsprechend vielen, üblichen Nebenbedingungen , welche einfacher als allgemeine Ungleichungsnebenbedingungen behandelt werden können, zusätzlich 9 nichtlineare Restriktionen. Die Aufgabe ist also von der Zahl der Nebenbedingungen her erheblich kleiner als eines der oben beschriebenen linearen Optimierungsprobleme. Dafür ist die Auswertung der einzelnen Problemfunktionen und ihrer Gradienten wegen der darin vorkommenden großen Summen und Skalarprodukte numerisch teuer. Mit dem in [AlbRee07] entwickelten Algorithmus konnte das Problem in ca. 38 Minuten auf einem PC mit einem Xeon 2.66 GHz Prozessor gelöst werden.

Eine Abbildung zeigt den Umriss des bestrahlten Bereichs für eine der mehreren Öffnungen des MLCs des frontalen Feldes (der helle Bereich links der Wirbelsäule). Das Bild macht deutlich, dass die Speicheldrüsen und das Rückenmark (jeweils dunkel markiert) weitgehend bei der Bestrahlung ausgespart werden. Dies zeigt auch die Darstellung der optimalen Gewichtsverteilung für die Nadelstrahlen des frontalen Feldes, bei dem sich die zentrale Einwölbung auf das Rückenmark bezieht. (Der Graph ist geglättet, denn für jeden Nadelstrahl, also jede kleine Rechteckfläche, ist ja das Gewicht konstant.) Der Patient, der gemäß dem berechneten Plan bestrahlt wurde, scheint vom Krebs geheilt zu sein, soweit man dies schon nach Ablauf weniger Jahre beurteilen kann. Insbesondere sind seine Speicheldrüsen in ausreichendem Maße funktionstüchtig geblieben.

1.2.6 Ausblick

[Bearbeiten]

Eine auf der Basis eines Optimierungsmodells berechnete Intensitätsverteilung für ein Strahlenfeld wird technisch so umgesetzt, dass der LC mehrfach hintereinander mit unterschiedlichen Geometrien für jeweils eine gewisse Zeit geöffnet wird. Durch Überlagerung der Einzeldosen versucht man auf diese Weise, näherungsweise die gewünschte Dosisverteilung zu realisieren.

Es gibt Versuche, diese Umrechnung eines Intensitätsprofils in möglichst wenige MLC-Öffnungen mittels diskreter Optimierung in den Griff zu bekommen. Ideal wäre es, wenn man geeignete Nebenbedingungen, die sich auf die Realisierung durch einen MLC beziehen, direkt mit in das Problem für die Berechnung der Strahlenintensitäten aufnehmen könnte. Alle Versuche in diesem Zusammenhang waren aber bisher für die klinische Routine nicht tauglich, so dass die genannte Umrechnung in der gängigen, klinisch eingesetzten Software mittels heuristischer Verfahren erfolgt.

Ein berechneter Bestrahlungsplan ist durch einen Experten anhand diverser Grafiken und Werte qualitativ zu bewerten. In diesem Zusammenhang sei erwähnt, dass sich erste berechnete Dosisverteilungen in der Praxis häufig als unbefriedigend im Hinblick auf die Behandlungsziele herausstellen, so dass die ursprünglichen Vorgaben dafür modi.ziert werden müssen. So muss vielleicht im Fall, dass das Zielvolumen nach einem berechneten Plan nicht überall eine ausreichende Dosis erhält, ein größerer Prozentsatz eines in der Nähe liegenden, parallelen Organ preisgegeben, d. h. in der zugehörigen Ungleichung (1.15) vergrößert werden.

Bei einer Modifikation der Behandlungsziele ist es jedoch sinnvoll, nur solche Ziele abzuändern, deren Änderung voraussichtlich den größten Gewinn in Bezug auf die Zielfunktion des Problems bringen werden. Eine diesbezügliche Vorhersage leistet unter gewissen Annahmen (zumindest lokal) eine sog. Sensitivitätsanalyse für die Lösung des Optimierungsproblems (s. Optimierung II). Ein entsprechend modifiziertes Problem kann dann zumeist in relativ kurzer Zeit gelöst werden, wenn man den Algorithmus mit der zuerst erzielten Lösung startet.

Abschließend sei auf die ganz neue Möglichkeit der Krebsbehandlung durch eine Bestrahlung mit Protonen hingewiesen. Es ist seit mehreren Jahrzehnten bekannt, dass eine solche Bestrahlung aufgrund günstigerer Eigenschaften von Protonen ein besseres Werkzeug zur Krebsbehandlung sein könnte als die herkömmliche Bestrahlung mit Photonen. So kann durch eine Behandlung mit Protonen die Strahlenbelastung des in Strahlenrichtung hinter dem Zielvolumen liegenden Gewebes erheblich reduziert werden. Einer Anwendung zumindest in größerem Stil standen aber bis vor kurzem große technische Probleme und zu hohe Kosten im Wege. In den letzten Jahren ist diesbezüglich jedoch ein Durchbruch gelungen und so werden vor allem in den USA, aber auch in Deutschland erste Zentren für Radiotherapie mit Protonen und für intensitätsmodulierte Protonentherapie (IMPT) gebaut. Die Kosten für die Geräte sowie für eine Therapie mit Protonen betragen jedoch heute noch ein Vielfaches der Kosten, die für die Technik und Therapie mit Photonen aufgewendet werden müssen.

Anders als bei der IMRT hängen die Intensitäten der Strahlenelemente bei der IMPT nicht nur von den zwei Parametern ab, welche die Position im Feld bestimmen, sondern auch noch von einem dritten Parameter, der Partikelenergie. Diese Tatsache erhöht die Anzahl der Unbekannten pro Feld beträchtlich. Z. B. erhält man bei einem Fallbeispiel mit 900 Unbekannten für IMRT 27 000 Variable für denselben Fall bei einer Behandlung mit IMPT. Auf der anderen Seite erfordert die IMPT aufgrund ihrer günstigeren Eigenschaften normalerweise nur eine Bestrahlung aus 2 oder 3 Richtungen. So beträgt die Anzahl der Unbekannten für IMPT typischerweise etwa 45 000 und mehr.

Das beschriebene biologische Modell für IMRT kann direkt auf die IMPT übertragen werden. Ein Fallbeispiel mit 47 043 Variablen, welches mit dem Algorithmus aus [AlbRee07] in nur 11 Minuten auf einem PC mit einem XEON 2.66 GHz Prozessor gelöst wurde, findet man in [ReeAlb08]. Die Bestrahlung mit Protonen steht jedoch noch ganz am Anfang ihrer Entwicklung. Insbesondere ist auch die biologische Wirkung von Protonen noch nicht ausreichend bekannt. Deshalb wird auf nicht absehbare Zeit noch Bedarf für Forschung in diesem Bereich bestehen, auch hinsichtlich der Optimierung von Bestrahlungsplänen.