Numerik Partieller Differentialgleichungen
Transcrição
Numerik Partieller Differentialgleichungen
Numerische Mathematik 2 (Numerik Partieller Differentialgleichungen) Rolf Rannacher Institut für Angewandte Mathematik Universität Heidelberg Vorlesungsskriptum WS 2007/2008 12. Februar 2008 ii Adresse des Autors: Institut für Angewandte Mathematik Universität Heidelberg Im Neuenheimer Feld 293/294 D-69120 Heidelberg, Deutschland [email protected] http://www.numerik.uni-hd.de Inhaltsverzeichnis Literaturverzeichnis vi 0 Einleitung 1 0.1 Notation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 0.2 Ableitung von partiellen Differentialgleichungen . . . . . . . . . . . . . . . . . . . 3 0.3 Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 0.4 Numerische Methoden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 1 Theorie partieller Differentialgleichungen 9 1.1 Typeneinteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 1.2 Elliptische Probleme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 1.2.1 Existenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 1.2.2 Eindeutigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 1.2.3 Stetige Abhängigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 1.2.4 Regularität . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 Hilfsmittel aus der Theorie von Funktionenräumen . . . . . . . . . . . . . . . . . 24 1.3.1 Sobolew-Räume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 1.3.2 Eigenschaften von Lebesgue- und Sobolew-Räumen . . . . . . . . . . . . . 27 1.3.3 Elemente der Spektraltheorie elliptischer Operatoren . . . . . . . . . . . . 31 1.4 Parabolische Probleme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 1.5 Hyperbolische Probleme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 1.6 Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 1.3 2 Differenzen-Verfahren für elliptische Probleme 2.1 2.2 2.3 2.4 45 Allgemeine Differenzenapproximationen . . . . . . . . . . . . . . . . . . . . . . . 45 2.1.1 Konsistenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46 Eigenschaften der Differenzengleichungen . . . . . . . . . . . . . . . . . . . . . . 51 2.2.1 Das Konvergenzverhalten von Differenzenverfahren . . . . . . . . . . . . . 55 Lösungsaspekte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60 2.3.1 Aufwandsanalyse: ein Beispiel . . . . . . . . . . . . . . . . . . . . . . . . . 64 Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68 iii iv INHALTSVERZEICHNIS 3 Finite-Elemente-Verfahren für elliptische Probleme 3.1 73 Allgemeine Projektionsverfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 3.1.1 Beispiele von Galerkin-Ansatzräumen . . . . . . . . . . . . . . . . . . . . 78 3.1.2 Diskretes Maximumprinzip für Finite-Elemente-Approximationen . . . . . 84 3.1.3 Approximation krummer Ränder . . . . . . . . . . . . . . . . . . . . . . . 86 3.2 Allgemeine Finite-Elemente-Ansätze . . . . . . . . . . . . . . . . . . . . . . . . . 91 3.3 Interpolation mit finiten Elementen . . . . . . . . . . . . . . . . . . . . . . . . . . 100 3.4 A priori Fehleranalyse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109 3.4.1 3.5 3.6 3.7 Punktweise Fehlerabschätzung . . . . . . . . . . . . . . . . . . . . . . . . 110 Implementierungsaspekte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118 3.5.1 Aufbau der Systemmatrizen und Vektoren . . . . . . . . . . . . . . . . . . 118 3.5.2 Konditionierung der Systemmatrix . . . . . . . . . . . . . . . . . . . . . . 120 3.5.3 Aufstellung der Systemmatrizen mit numerischer Integration . . . . . . . 123 A posteriori Fehleranalyse und Gittersteuerung . . . . . . . . . . . . . . . . . . . 132 3.6.1 Allgemeine a posteriori Fehlerabschätzung . . . . . . . . . . . . . . . . . . 132 3.6.2 Spezielle a posteriori Fehlerschätzer . . . . . . . . . . . . . . . . . . . . . 136 3.6.3 Strategien zur Gittersteuerung . . . . . . . . . . . . . . . . . . . . . . . . 141 3.6.4 Ein Testbeispiel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146 Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149 4 Iterative Lösungsverfahren für FD- und FE-Gleichungen 4.1 4.2 4.3 Krylow-Raum-Methoden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157 4.1.1 Verfahren der konjugierten Richtungen (CG-Verfahren) . . . . . . . . . . 159 4.1.2 CG-Verfahren für unsymmetrische und indefinite Probleme . . . . . . . . 164 4.1.3 Vorkonditionierung (PCG-Verfahren) . . . . . . . . . . . . . . . . . . . . . 165 Mehrgitterverfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168 4.2.1 Mehrgitteralgorithmus im Finite-Elemente-Kontext . . . . . . . . . . . . . 169 4.2.2 Konvergenz- und Aufwandsanalyse . . . . . . . . . . . . . . . . . . . . . . 174 Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181 5 Verfahren für parabolische Probleme 5.1 157 183 Differenzenverfahren für parabolische Probleme . . . . . . . . . . . . . . . . . . . 187 5.1.1 Zeitschrittverfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187 5.1.2 Stabilität und Konvergenz . . . . . . . . . . . . . . . . . . . . . . . . . . . 194 INHALTSVERZEICHNIS 5.2 v FE-Galerkin-Verfahren für parabolische Probleme . . . . . . . . . . . . . . . . . . 203 5.2.1 A priori Konvergenzabschätzungen . . . . . . . . . . . . . . . . . . . . . . 204 5.2.2 Fehlerkontrolle und Schrittweitensteuerung . . . . . . . . . . . . . . . . . 208 5.3 Verallgemeinerungen und Lösungsaspekte . . . . . . . . . . . . . . . . . . . . . . 215 5.4 Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 220 6 Verfahren für hyperbolische Probleme 221 6.1 Differenzenverfahren für hyperbolische Probleme . . . . . . . . . . . . . . . . . . 221 6.2 Finite-Elemente-Verfahren für hyperbolische Probleme . . . . . . . . . . . . . . . 228 6.3 Verallgemeinerungen und Lösungsaspekte . . . . . . . . . . . . . . . . . . . . . . 230 6.4 Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 231 Index 233 vi INHALTSVERZEICHNIS Literaturverzeichnis [1] R. Rannacher: Numerische Mathematik 0 (Einf. in die Numerische Mathematik), Vorlesungsskriptum, Universität Heidelberg, http://numerik.uni-hd.de/∼lehre/notes/ [2] R. Rannacher: Numerische Mathematik 1 (Numerik Gew. Differentialgleichungen), Vorlesungsskriptum, Universität Heidelberg, http://numerik.uni-hd.de/∼lehre/notes/ (I) Theorie partieller Differentialgleichungen [3] G. Hellwig: Partielle Differentialgleichungen, B.G. Teubner 1960. [4] A. Friedman: Partial Differential Equations, Holt, Rinehart und Winston 1970. [5] F. John: Partial Differential Equations, Springer 1978. [6] J. Wloka: Partielle Differentialgleichungen, Sobolewräume und Randwertaufgaben, B.G. Teubner 1982. [7] W. R. Strauss: Partial Differential Equations: An Introduction, John Wiley 1992. [8] M. Renardy, R. Rogers: An Introduction to Partial Differential Equations, Springer 1993. [9] A. Tveito, R. Winther: Introduction to Partial Differential Equations: A Computational Approach, Springer 1998. (II) Numerik partieller Differentialgleichungen [10] R. D. Richtmeyer, K. W. Morton: Difference Methods for Initial Value Problems, Interscience 1967. [11] G. Strang, G. J. Fix: An Analysis of the Finite Element Method, Prentice-Hall 1973. [12] A. R. Mitchell: Computational Methods in Partial Differential Equations, John Wiley 1976. [13] A. R. Mitchell, R. Wait: The Finite Element Method in Partial Differential Equations, John Wiley 1977. [14] P. G. Ciarlet: The Finite Element Method for Elliptic Problems, North-Holland 1978. [15] A. R. Mitchell, D. F. Griffiths: The Finite Difference Method in Partial Differential Equations, John Wiley 1980. vii viii LITERATURVERZEICHNIS [16] O. Axelsson, V. A. Barker: Finite Element Solution of Boundary Value Problems, Theory and Computation, Academic Press 1984. [17] V. Thome: Galerkin Finite Element Methods for Parabolic Problems, Springer 1984. [18] W. Hackbusch: Theorie und Numerik elliptischer Differentialgleichungen, B. G. Teubner 1986. [19] C. Johnson: Numerical Solution of Partial Differential Equations by the Finite Element Method, Cambridge University Press 1987. [20] H. R. Schwarz: Methode der finiten Elemente, B. G. Teubner 1991. [21] W. Hackbusch: Iterative Lösung großer schwachbesetzter Gleichungssysteme, B. G. Teubner 1991. [22] F. Brezzi, M. Fortin: Mixed and Hybrid Finite Element Methods, Springer 1991. [23] D. Braess: Einführung in die Methode der Finiten Elemente, Springer 1991. [24] Ch. Großmann, H.-G. Roos: Numerik partieller Differentialgleichungen, B. G. Teubner 1992. [25] H. Goering, H.-G. Roos, L. Tobiska: Finite-Elemente-Methode, Akademie-Verlag 1993. [26] S. C. Brenner, L. R. Scott: The Mathematical Theory of Finite Element Methods, Springer 1994. [27] A. Quarteroni, A. Valli: Numerical Approximation of Partial Differential Equations, Springer 1994. [28] K. Eriksson, D. Estep, P. Hansbo, C. Johnson: Computational Differential Equations, Cambridge University Press 1996. [29] P. Knabner, L. Angermann: Numerik partieller Differentialgleichungen, Springer 2000. 0 Einleitung Gegenstand dieser Vorlesung sind numerische Algorithmen zur näherungsweisen Lösung von partiellen Differentialgleichungen. In der Regel lassen sich für die in der Praxis auftretenden partiellen Differentialgleichungen keine Lösungen in analytischer Form angeben. Man ist also auf numerische Approximation angewiesen. Dabei wird das kontinuierliche Ausgangsproblem durch ein diskretes“, d.h. endlich dimensionales, ersetzt und dieses dann mit Hilfe des Computers ” gelöst. 0.1 Notation Wir stellen zuächst einige der im folgenden verwendeten Begriffe und abkürzenden Bezeichnungen zusammen. i) Unabhängige Variable: Wir betrachten (offene beschränkte) Gebiete Ω ⊂ Rd für d = 1, 2, 3 mit Rand ∂Ω. Der äußere Normaleneinheitsvektor zu ∂Ω ist n. Punkte im Rd sind x = (x1 , ..., xd )T oder im R3 auch (x, y, z)T . Die Zeitvariable ist t. Für d-dimensionale Vektoren a, b wird das übliche euklidische1 Produkt mit (a, b) oder auch mit a · b bezeichnet. Die euklidische Vektornorm ist kak := (a, a)1/2 und die zugehörige natürliche Matrizennorm kAk := maxx∈Rd {kAxk, kxk = 1}. ii) Funktionen: Wir betrachten im allgemeinen skalare Funktionen u = u(x) oder u = u(x, t) für Argumente x ∈ Rd bzw. t ∈ R. In einigen Fällen treten auch vektorwertige Funktionen auf u = (u1 , ..., ud )T , die im allgemeinen wie skalare Funktionen bezeichnet werden. Analog werden Skalarprodukte und Normen über ein Gebiet Ω unterschiedslos für skalare wie für vektorwertige Funktionen verwendet. iii) Ableitungen: Für Funktionen u(t) , u(x) bzw. u(x, t) werden totale sowie partielle Ableitungen abgekürzt geschrieben als dt u := du , dt ∂t u := ∂u , ∂t ∂x u := ∂u , ∂x ∂i u := ∂u , ∂xi u.s.w. und analog auch für höhere Ableitungen, z.B.: ∂tp u und ∂xq u . Mit dem Nabla-Operator ∇ werden der Gradient einer skalaren Funktion sowie die Divergenz einer Vektorfunktion geschrieben als grad u = ∇u := (∂1 u, ..., ∂d u)T und div u = ∇ · u := ∂1 u1 + ... + ∂d ud . Zu einem Vektor β ∈ Rd wird die Ableitung in Richtung β mit ∂β u := β · ∇u bezeichnet. Entsprechend ist z.B. ∂n u = n · ∇u die Ableitung in Richtung der äußeren Normalen entlang des Gebietsrandes ∂Ω . Kombination von Divergenz- und Gradientenbildung ergibt den sog. Laplace2 -Operator“ ” ∇ · (∇u) = ∆u = ∂12 u + ... + ∂d2 u. Mit dem Symbol ∇m u bezeichnen wir den Tensor aller partiellen Ableitungen der Ordnung m von u ; z.B. in zwei Dimensionen ∇2 u = (∂xi ∂yj u)i+j=2 . 1 Euklid (ca. 355-290 v. Chr.): griechischer Philosoph und Mathematiker; wirkte in Alexandria; sein mehrbändigen Lehrbuch “Die Elemente” faßte die Grundlagen der klassischen Geometrie zusammen; von ihm stammt das klassische mathematische Ausdrucksschema “Voraussetzung - Behauptung - Beweis”. 2 Pierre Simon Marquis de Laplace (1749-1827): französischer Mathematiker und Astronom; Prof. in Paris; begründete u.a. die Wahrscheinlichkeitsrechnung. 1 2 Einleitung iv) Integralsätze: Für stückweise glatt berandete Gebiete Ω ⊂ Rd und hinreichend glatte Funktionen u, v gelten der klassische Integralsatz von Gauß3 Z Z n · u do, (0.1.1) ∇ · u dx = ∂Ω Ω sowie als Folgerung die Integralformel von Green4 Z Z Z u∆v dx. u∂n v do − ∇u · ∇v dx = (0.1.2) Ω ∂Ω Ω v) Funktionenräume: Auf Punktmengen Ω ∈ Rd verwenden wir die üblichen Vektorräume von stetigen bzw. stetig differenzierbaren Funktionen C(Ω), C m (Ω), C0∞ (Ω). Der Raum C(Ω) ist, versehen mit der Maximumnorm kuk∞;Ω := max |u(x)|, x∈Ω vollständig, d.h. ein Banach-Raum5 . Weiter ist L2 (Ω) der Raum der auf Ω meßbaren und im Lebesgueschen Sinne quadratintegrablen Funktionen. Versehen mit dem Skalarprodukt und der zugehörigen Norm Z u(x)v(x) dx, (u, v)Ω := Ω 1/2 kukΩ = (u, u)Ω , ist L2 (Ω) vollständig, d.h. ein Hilbert-Raum6 . Wenn der Definitionsbereich Ω aus dem Zusammenhang klar ist, wird er in der Bezeichnung von Skalarprodukten und Normen meist weggelassen; z.B.: kuk = kukΩ . Weitere Funktionenräume werden später an den Stellen eingeführt, wo sie gebraucht werden. vi) Ungleichungen: Wir listen einige der im folgenden häufig verwendeten Ungleichungen für Funktionen aus den oben definierten Funktionenräumen. Für Funktionen u, v ∈ L2 (Ω) gilt die Höldersche7 Ungleichung“ ” Z Z 1/2 Z 1/2 |u(x)|2 dx u(x)v(x) dx ≤ |v(x)|2 dx , (0.1.3) Ω 3 Ω Ω Carl Friedrich Gauß (1777-1855): bedeutender deutscher Mathematiker, Astronom und Physiker; wirkte in Göttingen. 4 George Green (1793-1841): englischer Mathematiker; Autodidakt und Besitzer einer Mühle; Beiträge zur Potentialtheorie. 5 Stefan Banach (1892-1945): polnischer Mathematiker; Prof. in Lvov; begründete die Funktionalanalysis. 6 David Hilbert (1862-1943): bedeutender deutscher Mathematiker; wirkte in Königsberg und Göttingen; begründete u. a. den axiomatischen Aufbau der Mathematik; zum Wesen der Axiomatik (in der Geometrie) sagte er “Man muß jederzeit anstelle von Punkten, Geraden, Ebenen - Tische, Stühle, Bierseidel sagen können”. 7 Ludwig Otto Hölder (1859-1937): deutscher Mathematiker; Prof. in Tübingen; Beiträge zunächst zur Theorie der Fourier-Reihen und später vor allem zur Gruppentheorie; fand 1884 die nach ihm benannte Ungleichung. 0.2 Ableitung von partiellen Differentialgleichungen 3 bzw. in kompakter Schreibweise: |(u, v)|Ω ≤ kukΩ kvkΩ . Für Funktionen u ∈ C(Ω) ∩ C 1 (Ω) mit den Eigenschaften u|∂Ω = 0 und |∇u| ∈ L2 (Ω) gilt die Poincarésche8 Ungleichung“ ” 1/2 1/2 Z Z |∇u(x)|2 dx |u(x)|2 dx , (0.1.4) ≤ dΩ Ω Ω bzw. in kompakter Schreibweise: kukΩ ≤ dΩ k∇ukΩ , wobei dΩ := diam(Ω) . 0.2 Ableitung von partiellen Differentialgleichungen Partielle Differentialgleichungen werden meist als mathematische Modelle zur Beschreibung physikalischer Vorgänge abgeleitet. Ziel ist es, die Eigenschaften dieser Vorgänge durch die Gleichungen möglichst vollständig zu erfassen und davon ausgehend dann ihren Ablauf vorherzusagen. Bei der Konstruktion solcher Gleichungen geht man häufig nach recht formalen Regeln vor und verwendet Analogieschlüsse. Völlig unterschiedliche physikalische Prozesse lassen sich häufig durch Gleichungen sehr ähnlicher Gestalt beschreiben. i) Harmonische (d.h. schwingende“) Ausbreitungsvorgänge sind z.B. die Ausbreitung einer Was” serwelle (lokale Störung der Wasseroberfläche) oder eines Geräuschs (lokale Störung der Luftdichte). Es erscheint sinnvoll, diese im einfachsten Fall durch eine Funktion u = u(x, t) im Ort x und der Zeit t der Form u(x, t) = sin(x) sin(t) zu beschreiben. Diese genügt der Differentialgleichung ∂t2 u = ∂x2 u. (0.2.5) Es zeigt sich, daß diese sog. Wellengleichung“ tatsächlich die in der Natur auftretenden Schwin” gungsvorgänge beschreibt. Sie ist der Prototyp einer hyperbolischen“ Differentialgleichung. ” ii) Andere Ausbreitungsvorgänge sind dadurch gekennzeichnet, daß lokale Störungen nicht schwingend, sondern diffundierend“ und sich abschwächend fortgepflanzt werden, z.B.: Temperatur” ausbreitung in einem Leiter (Wärmeleitung) oder Verteilung einer Dichtekonzentration in einer Flüssigkeit (Stofftransport). Zur Beschreibung solcher Vorgänge dienen Funktionen der Form u(x, t) = sin(x) e−t . Diese genügen der Differentialgleichung ∂t u = ∂x2 u. (0.2.6) Es zeigt sich, daß diese sog. Wärmeleitungsgleichung“ tatsächlich die in der Natur auftreten” den Diffusionsvorgänge beschreibt. Sie ist der Prototyp einer parabolischen“ Differentialglei” chung. In Fall zweier Raumdimensionen, u = u(x, y, t) , lautet die Wärmeleitungsgleichung unter Berücksichtigung von externen Wärmequellen ∂t u = ∂x2 u + ∂y2 u = ∆u + f. (0.2.7) 8 Jules Henri Poincaré (1854-1912): französischer Mathematiker; Prof. an der École Polytechnique und der Sorbonne in Paris; eins der letzten mathematischen Universalgenies; fundamentale Beiträge zu allen Bereichen der Mathematik, zur Himmelsmechanik, Strömungsmechanik und Wissenschaftsphilosophie. 4 Einleitung iii) Der Grenzzustand für t → ∞ eines Diffusionsprozesses u(x, y, t) , z.B. beschrieben durch die Wärmeleitungsgleichung (0.2.7), ist als Lösung der sog. Poisson9 -Gleichung“ ” −∆u = −∂x2 u − ∂y2 u = f, (0.2.8) gegeben. Diese ist der Prototyp einer elliptischen“ Differentialgleichung. ” 0.3 Beispiele Die folgenden Beispiele aus verschiedenen Wissenschaftsdisziplinen vermitteln einen Eindruck von der Vielfältigkeit der auftretenden Probleme. 1. Erhaltungsgleichungen Die Grundgleichungen der (klassischen) Kontinuumsmechanik basieren auf dem physikalischen Grundprinzip der Erhaltung“, d.h.: Zustandsgrößen wie z.B. Massedichte ρ(x, t), innere Ener” gie bzw. Temperatur T (x, t), Impuls ρ(x, t)~v (x, t), u.s.w., werden als Dichtefunktionen beschrieben, deren Integrale über beliebige bewegte Kontrollvolumen“ sich beim Fehlen von äußeren ” Einflüssen nicht verändern. Für die zeitliche Veränderung der Masse mV (t) eines solchen mit dem Geschwindigkeitsfeld v = (v1 , v2 , v3 ) bewegten Volumens V (t) gilt (sog. Reynoldsches10 ” Transporttheorem“) Z Z {∂t ρ + ∇ · (ρv)} dx. (0.3.9) ρ(x, t) dx = 0 = dt mV (t) = dt V (t) V (t) Da dies für beliebige Volumen V (t) gelten soll, ergibt sich für stetige Dichtefunktionen die folgende Erhaltungsgleichung 1. Ordnung (sog. Kontinuitätsgleichung“): ” ∂t ρ + ∇ · (ρv) = 0. (0.3.10) Auf analogem Wege erhält man aus dem Erhaltungssatz für die Temperatur unter Berücksichtigung von Quelltermen und Wärmediffusion in einem ruhenden Medium ( ~v ≡ 0) die folgende Erhaltungsgleichung 2. Ordnung (sog. Wärmeleitungsgleichung“): ” ∂t T − ∇ · (a∇T ) = ∇ · q, (0.3.11) Physikalische Anschauung erfordert, daß Lösungen zu diesen Gleichungen bei physikalisch sinnvollen Anfangs- und Randbedingungen stets positiv sind: ρ > 0, T > 0 . Wir werden sehen, daß dies tatsächlich der Fall ist. Die entsprechenden Erhaltungssätze für Impuls und Drehimpuls führen unter geeigneten zusätzlichen Annahmen zusammen mit der Kontinuitätsgleichung auf 9 Siméon Denis Poisson (1781-1840): französischer Mathematiker und Physiker; Prof. in Paris; Beiträge zur mathematischen Formulierung der Physik, zum Magnetismus, zur Himmelsmechanik und Wahrscheinlichkeitsrechnung; einer der Begründer der Potentialtheorie. 10 Osborn Reynolds (1842-1912): englischer Ingenieur und Mathematiker; Prof. in Manchester; Beiträge zur Theorie des Elektro-Magnetismus und der Strömungslehre, Fundamente der Turbulenzbeschreibung und der hydrodynamischen Stabilität. 0.3 Beispiele 5 die bekannten Navier11 -Stokes12 -Gleichungen“ für inkompressible, Newtonsche Fluide mit kon” stanter Dichte und Temperatur ( ρ ≡ konst., T ≡ konst.): ∂t v − ν∆v + v · ∇v + ∇p = f, ∇ · v = 0. (0.3.12) Diese werden hier aber nur der Vollständigkeit halber formuliert und im Laufe dieser Vorlesung nicht näher betrachtet. 2. Variationsgleichungen Die Grundgleichungen der (klassischen) Elastizitätstheorie basieren auf dem physikalischen Grundprinzip der Energieminimierung“, d.h.: Der von einem elastischen Körper unter statischer ” äußerer Belastung eingenommene Zustand ist so betimmt, daß er die potentielle Gesamtenergie des Systems minimiert. Zur Beschreibung eines elastischen Systems werden in der linearen Theorie die folgenden Größen verwendet: der Verschiebungsvektor u , der Verzerrungstensor ε(u) := 12 (∇u + ∇uT ) , der flächenorientierte (symmetrische) Spannungstensor σ und die Volumenkraft f . Die Spannungen σ sind die Reaktionskräfte des Körpers auf von außen erzwungene Verzerrungen ε(u) und werden idealisierend in einer linearen Beziehung angenommen, dem sog. (elastischen) Materialgesetz“, σ = Aε(u) , mit dem symmetrischen und positiv definiten Elasti” zitätstensor A . Die potentielle Gesamtenergie des belasteten, elastischen Körpers schreibt sich dann in der Form: Z Z Z Z 1 1 f u dx = f u dx. (0.3.13) σ : ε(u) dx − Aε(u) : ε(u) dx − E(u) = 2 Ω 2 Ω Ω Ω Die sich unter der äußeren Belastung einstellende Verschiebung in einen neuen Gleichgewichtszustand u∗ verleiht dann E(·) einen minimalen Wert unter allen zulässigen Verschiebungen, d.h. solchen mit denselben Randwerten. Für einen solchen optimalen Zustand u∗ gilt dann notwendig d E(u∗ + εϕ)|ε=0 = 0, dε für beliebige zulässige“ Variationen ϕ . Auswertung dieser Beziehung liefert die sog. Variati” ” onsgleichung“ (Aε(u), ε(ϕ))Ω = (f, ϕ)Ω ∀ zulässigen“ ϕ. ” (0.3.14) Dabei bedeutet zulässig“ für eine Testfunktion ϕ, daß sie hinreichend glatt ist und entlang des ” Randes ∂Ω verschwindet. Nimmt man an, daß das Minimum u hinreichend glatt ist, so folgt durch partielle Integration (∇ · Aε(u) + f, ϕ)Ω = 0 ∀ zulässigen“ ϕ, ” 11 Claude Louise Marie Henri Navier (1785-1836): französischer Bauingenieur und Mathematiker; Prof. an der École Polytechnique in Paris; Beiträge zum Brückenbau (erste Theorie der Hängebrücke), Elastizitätstheorie und Strömungsmechanik. 12 Sir Georg Gabriel Stokes (1819-1903): englischer Mathematiker und Physiker; Prof. in Cambridge; Beiträge zur Differential- und Integralrechnung, zur Hydrodynamik und zur Theorie des Lichts, Spektralanalyse und Fluoreszenz. 6 Einleitung und hieraus das Differentialgleichungssystem 2. Ordnung (in kompakter sowie ausführlicher Schreibweise) −∇ · Aε(u) = f ⇔ − d d X X ∂i Aijkl εkl (u) = fj (j = 1, ..., d). (0.3.15) i=1 k,l=1 Der wohl einfachste (mehrdimensionale) Spezialfall eines elastisch deformierten Körpers ist die eingespannte Membran“ in einem (beschränkten) Gebiet Ω ⊂ R2 (Trommelfell). Hier wird ” eine Belastung nur in vertikaler Richtung zugelassen f~ = (0, 0, f ) und entsprechend auch nur die Auslenkung in vertikaler Richtung ~u = (0, 0, u) berücksichtigt. Der Elastizitätstensor ist diagonal und wird hier der Einfachheit halber zu A = aI gesetzt. Dann nimmt das obige Funktional der potentiellen Gesamtenergie die Form an E(u) = 12 ak∇uk2Ω − (f, u)Ω , (0.3.16) und die zugehörige Differentialgleichung ( Poisson-Gleichung“) lautet ” −a∆u = f, in Ω. (0.3.17) Da die Membran am Rand eingespannt sein soll, muß weiter u|∂Ω = 0 sein. In einer elastischen Membran wirken als Gegenkräfte zur Belastung reine Federkräfte (in vertikaler Richtung) und keine Biegemomente. Dies ist begründet durch die Vernachlässigung der Dicke der Membran. Flache Körper mit (konstanter) positiver, aber geringer Dicke werden als Platten“ bezeichnet. Im Rahmen der linearen Kirchhoffschen Plattentheorie“ werden ” ” zwar Biegemomente berücksichtigt, aber nur vertikale Verschiebungen zugelassen ( Kirchhoff” Hypothese“). Im Fall kleiner Verschiebungen (gegenüber der Plattendicke) erhält dann die potentielle Gesamtenergie die Form E(u) = 12 Dk∆uk2Ω + (1 − σ)D (∂12 u, ∂22 u)Ω − k∂1 ∂2 uk2Ω − (f, u)Ω , mit Materialparametern σ ∈ (0, 1), D > 0 . Die zulässigen Funktionen müssen in diesem Fall quadratintegrable zweite Ableitungen besitzen. Durch den Variationsansatz wie oben erhält man als notwendige (und hinreichende) Bedingung für ein Energieminimum die sog. Plattengleichung“ ” D∆2 u = f. (0.3.18) Aus naheliegenden Gründen wird der Operator 4. Ordnung ∆2 auch biharmonischer Opera” tor“ genannt. Ist die Platte am Gebietsrand eingespannt“, so müssen die Randbedingungen ” u|∂Ω = 0, ∂n u|∂Ω = 0 erfüllt sein. Wir merken an, daß ein identisches Modell bei der Beschreibung viskoser, inkompressibler Strömungen in zwei Raumdimensionen als Gleichung für die sog. Stromfunktion“ ϕ auftritt; das Geschwindigkeitsfeld ergibt sich dabei durch Rotationsbildung ” u := (∂y ϕ, −∂x ϕ)T . 3. Schwingungsgleichungen Wenn der elastische Körper unter Belastung zeitliche Schwingungen ausführen kann, so wird die zugehörige Auslenkung eine Funktion des Orts und der Zeit, u(x, t), und genügt im Rahmen 0.4 Numerische Methoden 7 der linearen Theorie der sog. elastische Schwingungsgleichung“ ” ∂t2 u − ∇ · Aε(u) = f. (0.3.19) Die Gleichung für die frei schwingende Membran ist die klassische Wellengleichung“ ” ∂t2 u = a∆u. (0.3.20) Diese beschreibt allgemein die Ausbreitung von Wellen in schwingfähigen Medien (z.B. Schallwelle in einem Gas, Auslenkung einer elastischen Membran oder die Amplitude eines elektrischen Feldes). Sie wird üblicherweise zusammen mit Randbedingungen“ u|∂Ω = 0 sowie Anfangsbe” ” dingungen“ u|t=0 = u0 , ∂t u|t=0 = u1 betrachtet. 0.4 Numerische Methoden Aus den oben skizzierten Wegen zur Herleitung von partiellen Differentialgleichungen gewinnt man unmittelbar Ansätze zu deren Diskretisierung. 1. Differenzenverfahren Ersetzt man die Ableitungen in den Differentialgleichungen (0.2.5), (0.2.6), (0.2.7) und (0.2.8) durch geeignete Differenzenquotienten bezüglich eines regulären Punktegitters, gewinnt man lineare Gleichungen für die zugehörigen diskreten“ Funktionswerte. Dies ist eine sog. Differen” ” zenapproximation“ der Differentialgleichung. Die Eigenschaften solcher Differenzengleichungen, d.h. ihre Lösbarkeit und Approximationsgüte, werden weiter unten eingehend behandelt. 2. Finite-Volumen-Verfahren Die lokale Erhaltungseigenschaft (0.3.9) führt dadurch auf ein numerisches Verfahren, daß man für die Lösung einen bzgl. einer endlichen Zerlegung des Gebiets Ω in Teilvolumina (z.B. Dreiecke oder Vierecke) stückweise konstanten Ansatz macht und die Gültigkeit der Erhaltungseigenschaften dafür auf jedem der sog. Kontrollvolumen fordert. Dies führt auf ein algebrai” ” sches Gleichungssystem für die zugehörigen Zellmittelwerte. Dieser Diskretisierungsansatz wird Finite-Volumen-Methode“ genannt. Derartige Methoden finden hauptsächlich im Bereich der ” numerischen Strömungsmechanik Anwendung. Wegen ihrer eingeschränkten Anwendbarkeit und schwierigen Analysierbarkeit werden wir uns mit dieser Methodenklasse in dieser Vorlesung nicht weiter befassen. 3. Variationsmethoden ( Methode der finiten Elemente“) ” Die Variationsgleichung (0.3.14) führt durch Einschränkung auf einen endlich dimensionalen Teilraum Vh des Lösungsraums des kontinuierlichen Variationsproblems auf eine diskrete Variationsaufgabe (Aε(uh ), ε(ϕh ))Ω = (f, ϕh )Ω ∀ zulässigen“ ϕh ∈ Vh . ” (0.4.21) 8 Einleitung Dies ist äquivalent zu einem linearen (quadratischen) Gleichungssystem für die Entwicklungskoeffizienten der diskreten Lösung uh bzgl. einer geeignet gewählten Basis des Ansatzraumes Vh . Sind die Funktionen in Vh stückweise polynomial bzgl. einer Zerlegung des Gebiets Ω z.B. in Dreiecke oder Vierecke gewählt, liegt eine sog. Finite-Elemente-Methode“ vor. Diese Methoden ” werden unten sehr ausführlich behandelt. 1 Theorie partieller Differentialgleichungen In diesem Kapitel wird eine Einführung in die Theorie der partiellen Differentialgleichungen gegeben, soweit sie für deren numerische Behandlung relevant ist. Wir betrachten zunächst lineare Differentialgleichungen zweiter Ordnung der Form Lu := − d X aij ∂i ∂j u + d X aj ∂j u + au = f, (1.0.1) j=1 i,j=1 mit gegebenen Koeffizientenfunktionen aij , aj , a und rechter Seite f . Wenn diese Funktionen nicht zusätzlich von der unbekannten Lösung u abhängen, nennt man die Gleichung linear“. ” Wegen der Vertauschbarkeit der Reihenfolge der Ableitungen kann o.B.d.A. aij = aji angenommen werden. Für allgemeine nichtlineare Gleichungen F (x, u, ∇u, ∇2 u) = 0 (1.0.2) gibt es keine einheitliche Lösungstheorie. Wir beschränken uns im folgenden daher im wesentlichen auf lineare Probleme. Differentialgleichungen werden in der Regel auf (beschränkten oder halbbeschränkten) Gebieten Ω ⊂ Rd betrachtet. Dazu kommen dann noch Bedingungen entlang des Randes ∂Ω. Die geeignete Wahl dieser Randbedingungen“ ist eine sehr delikate Sache und erfordert eingehende ” Berücksichtigung der speziellen Eigenschaften des Differentialoperators. Diesen wird der nächste Abschnitt gewidmet sein. Damit eine Differentialgleichung mit den zugehörigen Randbedingungen ein sinnvolles Modell eines realen physikalischen Vorgangs ist, sind eine Reihe von Forderungen zu stellen: i) Existenz von Lösungen in einem möglicherweise verallgemeinerten Sinne; unter einer klassi” schen“ Lösung versteht man eine solche, für die alle auftretenden Ableitungen im Gebietsinnern im strengen Sinne definiert sind und die bis an den Rand stetig ist, d.h.: u ∈ C 2 (Ω) ∩ C(Ω). ii) Eindeutigkeit der Lösungen möglicherweise unter Hinzunahme von weiteren physikalisch motivierten Bedingungen. iii) Stetige Abhängigkeit von den Daten wegen der meist inexakten Verfügbarkeit von Koeffizienten und Randdaten in den physikalischen Modellen; Lösungen sollten sich unter kleinen Datenstörungen auch nur wenig ändern. Eine Aufgabe, welche diesen Minimalforderungen genügt, nennt man wohl-gestellt“ (im Sinne ” von Hadamard1 ). Bei Anfangs- oder Randwertaufgaben gewöhnlicher Differentialgleichungen war die Regularität der Lösung kein besonderes Thema, da sich die Regularität der Daten direkt auf die entsprechende der Lösung überträgt. Bei partiellen Differentialgleichungen ist dies nicht immer der Fall und bedarf für verschiedene Typen von Differentialgleichungen gesonderter Untersuchung. 1 Jacque Salomon Hadamard (1865-1963): französischer Mathematiker; Prof. in Bordeaux und Paris; viele wichtige Beiträge zur komplexen Analysis und speziellen Funktionen, zur analytische Zahlentheorie, zur Variationsrechnung und zu den Differentialgleichungen der mathematischen Physik. 9 10 Theorie partieller Differentialgleichungen 1.1 Typeneinteilung Partielle Differentialgleichungen lassen sich in drei Haupttypen einteilen: die elliptischen“, die ” parabolischen“ und die hyperbolischen“ Gleichungen. Wir werden das dieser Unterteilung ” ” zugrunde liegende Prinzip anhand einer leicht überschaubaren Situation erläutern. Dies sind die linearen, skalaren Gleichungen 2. Ordnung in zwei Variablen: Lu = a11 ∂x2 u + 2a12 ∂x ∂y u + a22 ∂y2 u + a1 ∂x u + a2 ∂y u + au = f mit konstanten Koeffizienten aij . Dabei sollen nicht alle drei Koeffizienten a11 , a12 , a22 der Ableitungen zweiter Ordnung gleichzeitig Null sein. Diese Gleichung wird auf einem Gebiet Ω ⊂ R2 betrachtet. Ausgangspunkt ist ein direkter Lösungsansatz, wie er auch bei gewöhnlichen Differentialgleichungen angewendet werden kann. Für die Anfangswertaufgabe u′ (t) = f (t, u(t)), t ≥ 0, u(0) = u0 , erhält man aus der Vorgabe u(0) = u0 durch sukzessives Differenzieren von f (t, x) Formeln für alle Ableitungen von u : u(i) (0) = di−1 f (0, u0 ) =: f (i−1) (0, u0 ), dti−1 i = 1, 2, 3, ... . Wenn die Ableitungen f (i−1) nicht zu schnell wachsen (für f (t, x) = sin(x) sind sie z.B. gleichmäßig beschränkt), konvergiert die Taylor2 -Reihe u(t) = u0 + ∞ i X t i=1 i! f (i−1) (0, u0 ) für alle t ≥ 0 absolut und stellt die (eindeutige) Lösung der Anfangswertaufgabe dar. y Ω n Γ x Abbildung 1.1: Konfiguration der allgemeinen partiellen Differentialgleichung 2 Brook Taylor (1685-1731): englischer Mathematiker und Schüler Newtons; die nach ihm benannte Reihenentwicklung war im Kern bereits Gregory, Newton, Leibniz und Johann Bernoulli bekannt. 1.1 Typeneinteilung 11 Wir versuchen, diese Konstruktion auf partielle Differentialgleichungen zu übertragen. Dazu sei Γ ein Jordan3 -Kurvenstück in Ω mit beliebig oft differenzierbarer Parametrisierung Γ = {(x(τ ), y(τ )), τ ∈ [0, 1]} . Entlang Γ seien für die Lösung u(x, y) der Differentialgleichung die Funktionswerte u sowie ihre Ableitungen ∂n u in Normalenrichtung n zu Γ vorgegeben. Dies entspricht der Tatsache, daß wir es mit einer Differentialgleichung 2. Ordnung zu tun haben. Mit u und ∂n u ist der ganze Gradient ∇u = (∂x u, ∂y u)T entlang Γ bekannt. Wir wollen versuchen, aus diesen Vorgaben alle weiteren Ableitungen von u entlang Γ zu bestimmen, um damit wieder einen Taylor-Reihenansatz für u in einer Umgebung von Γ zu machen. Zu diesem Zweck führen wir die Abkürzungen ein: p := ∂x u, q := ∂y u, r := ∂x2 u, s := ∂x ∂y u, t := ∂y2 u. Differentiation von p und q entlang Γ , d.h. bzgl. des Parameters τ , ergibt ∂τ p = ∂x p∂τ x + ∂y p∂τ y = r∂τ x + s∂τ y, ∂τ q = ∂x q∂τ x + ∂y q∂τ y = s∂τ x + t∂τ y. mit den bekannten tangentialen Ableitungen ∂τ x und ∂τ y entlang Γ. Zusammen mit der Differentialgleichung Lu = f ergibt dies ein 3 × 3-Gleichungssystem für die drei gesuchten Ableitungen r, s, t: a11 r + 2a12 s + a22 t = f − a1 p − a2 q − au ∂τ xr + ∂τ ys = ∂τ p ∂τ xs + ∂τ yt = ∂τ q mit entlang Γ bekannter rechter Seite. Die Determinante der Koeffizientenmatrix B erhält man durch Entwicklung nach der ersten Zeile zu det B = a11 ∂τ y 2 − 2a12 ∂τ x∂τ y + a22 ∂τ x2 . Wir unterscheiden jetzt zwei Fälle. i) Fall det B 6= 0 entlang ganz Γ: In diesem Fall sind alle zweiten Ableitungen r, s, t von u durch Vorgabe von u, ∂n u entlang Γ (eindeutig) bestimmbar. Durch weitere Differentiation des Gleichungssystems nach x und y erhält man wieder ein System für die dritten Ableitungen ∂x r, ∂x s, ∂x t sowie ∂y r, ∂y s, ∂y t jeweils mit derselben Koeffizientenmatrix. Durch weiteres Differenzieren lassen sich so alle höheren Ableitungen von u entlang Γ bestimmen. Durch den Reihenansatz u(x, y) = X (x − x0 )i (y − y0 )j ∂xi ∂yj u(x0 , y0 ) (i + j)! i+j≥0 bzgl. eines Punktes (x0 , y0 ) ∈ Γ erhält man dann in einer Umgebung der Kurve Γ eine Lösung der Differentialgleichung, die auf Γ die vorgegebenen Werte annimmt. Diese nennt man Lösung der Cauchyschen4 Anfangswertaufgabe“ der Differentialgleichung bzgl. der Anfangskurve“ Γ. ” ” 3 Marie Ennemond Camille Jordan (1838-1922): französischer Mathematiker; Prof. in Paris; Beiträge zur Algebra, Gruppentheorie, Analysis und Topologie. 4 Augustin Louis Cauchy (1789-1857): Ingenieur, Physiker und bedeutendster französischer Mathematiker seiner Zeit; wirkte an der École Polytechnique und der Sorbonne in Paris; gilt als Begründer der modernen Analysis und 12 Theorie partieller Differentialgleichungen ii) Fall det B = 0 in einem Punkt (x0 , y0 ) ∈ Γ: Die quadratische Gleichung a11 ∂τ y 2 − 2a12 ∂τ x∂τ y + a22 ∂τ x2 = 0 bestimmt gewisse Richtungen ∂τ y/∂τ x = dy/dx bzw. ∂τ x/∂τ y = dx/dy von Kurven (mit Graph y = y(x) oder x = x(y) ) durch den Punkt (x0 , y0 ). Zu deren Bestimmung sei etwa angenommen, daß a11 6= 0 und ∂τ x 6= 0. Dann besitzt die Gleichung dy 2 dx die Lösungen dy dx +/− − = 2a12 dy a22 + =0 a11 dx a11 a12 1 ± a11 a11 q a212 − a11 a22 . Diese entsprechen Steigungen von Kurven durch den Punkt (x0 , y0 ) ∈ Γ , entlang welcher die höheren Ableitungen von u sich nicht aus den Vorgaben entlang Γ bestimmen lassen. Entlang dieser kritischen, auch charakteristisch“ genannten Kurven (sog. Charakteristiken“ des Dif” ” ferentialoperators L) läßt sich also die Lösung der Differentialgleichung nicht aus den obigen Vorgaben konstruieren. Entlang solcher Kurven können Unstetigkeiten in der Lösung oder ihres Gradienten auftreten. Es ist also sehr wichtig, die Existenz von Charakteristiken und deren Gestalt für den zu betrachtenden Differentialoperator vor Ansatz eines numerischen Verfahrens genau zu bestimmen. Offensichtlich hängt die Existenz von Charakteristiken allein von den Koeffizienten der höchsten Ableitungen des Operators L , d.h. seinem sog. Hauptteil“ ” a11 ∂x2 u + 2a12 ∂x ∂y u + a22 ∂y2 u , ab. Diesem wird die quadratische Form q(x, y) := a11 x2 + 2a12 xy + a22 y 2 zugeordnet. Die Gleichung q(x, y) = 0 beschreibt Kegelschnitte in der (x, y)-Ebene: < 0 : 2 a12 − a11 a22 = 0 : >0: Ellipse, P arabel, Hyperbel. Von dieser rein formalen Charakterisierung stammen die obigen Bezeichnungen für die drei Typen von partiellen Differentialgleichungen. Die Klassifikation eines Differentialoperators als elliptisch“, parabolisch“ oder hyperbolisch“ wird für jeden einzelnen Punkt (x0 , y0 ) sepa” ” ” rat vorgenommen. Im Falle variabler Koeffizienten aij = aij (x, y) oder im nichtlinearen Fall aij (u(x, y)) kann der Typ einer Gleichung also im Lösungsgebiet wechseln. Wir werden im folgenden nur Gleichungen eines einheitlichen Typs betrachten; in vielen Anwendungen spielt aber gerade der Typwechsel eine wichtige Rolle. Als nächstes wollen wir die prototypischen Vertreter von (linearen) elliptischen, parabolischen und hyperbolischen Differentialgleichungen ableiten. Dies wird uns erneut auf die obige Typenunterteilung führen. Dazu schreiben wir den Hauptteil L0 des Differentialoperators in der Funktionentheorie. 1.1 Typeneinteilung 13 Matrix-Vektor-Form: L0 = a11 ∂x2 + 2a12 ∂x ∂y + a22 ∂y2 = ∂x ∂y !T a11 a12 a21 a22 ! ∂x ∂y ! = ∇T A∇ Die symmetrische Matrix A besitzt zwei reelle Eigenwerte λ, µ und ein zugehöriges Orthonormalsystem von Eigenvektoren {ξ, η} . Mit der Spaltenmatrix Q := [ξ, η] gilt QQT = I, QT AQ = D = diag(λ, µ). Damit können wir schreiben: L0 = ∇T QDQT ∇ = (QT ∇)T D(QT ∇) !T ! ! ξ1 ∂x + ξ2 ∂y λ 0 ξ1 ∂x + ξ2 ∂y = 0 µ η1 ∂x + η2 ∂y η1 ∂x + η2 ∂y bzw. L0 = λ(ξ1 ∂x + ξ2 ∂y )2 + µ(η1 ∂x + η2 ∂y )2 , oder mit den Richtungsableitungen ∂ξ = ξ · ∇ und ∂η = η · ∇ : L0 = λ∂ξ2 + µ∂η2 . Die Eigenwerte erhält man als Nullstellen des charakteristischen Polynoms det(A − zI) = (a11 − z)(a22 − z) − a212 = z 2 − (a11 + a22 )z + a11 a22 − a212 = (z − λ)(z − µ) = z 2 − (λ + µ)z + λµ. Durch Koeffizientenvergleich findet man ( Vietascher5 Wurzelsatz). ” λ + µ = a11 + a22 , λµ = a11 a22 − a212 . a) Elliptischer“ Fall a212 − a11 a22 < 0 : ” Beide Eigenwerte λ, µ sind ungleich Null und haben dasselbe Vorzeichen. Die Lösungen der charakteristischen Gleichung sind nicht reell, d.h.: Es existieren keine charakteristischen Kurven durch den Punkt (x0 , y0 ). In diesem Fall ist der Konstruktionsprozeß für die höheren Ableitungen von u durchführbar. Die Normalform eines elliptischen Operators L ist im Fall λ = µ = 1 : Lu = ∂ξ2 u + ∂η2 u + ψ(ξ, η, u, ∂ξ u, ∂η u) Der Hauptteil“ dieses Operators ist also gerade der Laplace-Operator“ ∆ , der sich somit als ” ” prototypischer Vertreter elliptischer Differentialoperatoren 2. Ordnung erweist. Wir werden uns daher im Folgenden hauptsächlich mit der zugehörigen Poisson-Gleichung beschäftigen: ∂x2 u + ∂y2 u = f. (1.1.3) 5 Francois Viete, lat. Franciscus Vieta (1540-1603): französischer Mathematiker; Arbeiten über algebraische Gleichungen und sphärische Trigonometrie; gab trigonometrische Tafeln heraus und führte die systematische Buchstabenrechnung ein. 14 Theorie partieller Differentialgleichungen b) Parabolischer“ Fall: a212 − a11 a22 = 0 ” Einer der Eigenwerte ist Null; der zweite ist dann notwendig ungleich Null. Es existiert genau eine charakteristische Richtung im Punkt (x0 , y0 ) mit der Steigung dy/dx = a12 /a11 . Die Normalform eines parabolischen Operators L ist im Fall λ = 1, µ = 0 : Lu = ∂ξ2 u + ψ(ξ, η, u, ∂ξ u, ∂η u). Der Hauptteil dieses Operators ist im linearen Fall gerade der sog. Wärmeleitungsoperator“, ” der prototypische Vertreter parabolischer Differentialoperatoren 2. Ordnung. Wir werden uns daher im folgenden mit der zugehörigen Wärmeleitungsgleichung beschäftigen: ∂t u − ∂x2 u = f. (1.1.4) c) Hyperbolischer“ Fall: a212 − a11 a22 > 0 ” Beide Eigenwerte sind ungleich Null, haben aber verschiedene Vorzeichen. Es existieren zwei charakteristische Richtungen im Punkt (x0 , y0 ) mit den Steigungen (dy/dx)± = a12 /a11 ± p −1 2 a11 a12 − a11 a22 . Die Normalform eines hyperbolischen Differentialoperators L ist im Fall λ = 1, µ = −1 : Lu = ∂ξ2 u − ∂η2 u + ψ(ξ, η, u, ∂ξ u, ∂η u). Der Hauptteil dieses Operators ist der sog. Wellenoperator“, der prototypische Vertreter hy” perbolischer Differentialoperatoren 2. Ordnung. Wir werden uns daher im folgenden mit der zugehörigen Wellengleichung beschäftigen: ∂t2 u − ∂x2 u = f. (1.1.5) Wir haben gesehen, daß die Cauchysche Anfangswertaufgabe“ durch Reihenansatz lösbar ” ist, wenn die Anfangskurve“ Γ nirgends mit einer Charakteristik des Differentialoperators ” zusammenfällt. Andernfalls kann die Situation eintreten, daß zu beiden Seiten der Kurve Γ eine Lösung existiert, diese aber nicht auf Γ stetig-differenzierbar fortsetzbar ist. Im folgenden werden wir die für die drei Gleichungstypen geeigneten Randbedingungen diskutieren und dabei ganz unterschiedliche Ergebnisse erhalten. 1.2 Elliptische Probleme 15 1.2 Elliptische Probleme Wir haben gesehen, daß für (im ganzen Lösungsgebiet Ω ) elliptische Differentialoperatoren die Cauchysche Anfangswertaufgabe“ für jede (analytische) Anfangskurve“ Γ ⊂ Ω lösbar ist. Die ” ” Verallgemeinerung dieser Aussage für nichtlineare Differentialoperatoren der Art L(u) = ∂x2 u − F (x, y, u, ∂x u, ∂y u, ∂y2 u) (1.2.6) ist der berühmte Satz von Cauchy-Kovalevskaya6 Dieser sehr allgemeine Existenzsatz für elliptische Differentialgleichungen ist aber für die Praxis nur von geringer Bedeutung. Die über einen lokalen Reihenansatz konstruierte Lösung u hängt nämlich i.a. nicht stetig von den vorgegebenen Anfangswerten entlang Γ ab. Dies ist aber eine unverzichtbare Bedingung an ein physikalisch sinnvolles Modell. Beispiel: In der Halbebene Ω = {(x, y) ∈ R2 : x > 0} seien entlang der Randkurve Γ = {(0, y) ∈ R2 } die Randwerte u(0, y) = u00 (y) = 0, ∂x u(0, y) = u10 (y) = 0 gegeben. Die zugehörige Lösung der Poisson-Gleichung ∆u = 0 ist u ≡ 0. Mit ε > 0 seien die Randdaten nun gestört zu u0ε (y) = 0, u1ε (y) = ε sin(y/ε), wobei limε→0 u1ε (y) = 0 . Die zugehörige gestörte Lösung der Poisson-Gleichung (nachrechnen!) uε (x, y) = ε2 sin(y/ε) sinh(x/ε), sinh(z) = 12 (ez − e−z ), konvergiert aber für ε → 0 nicht gegen Null. Es zeigt sich, daß in diesem Fall entlang der Anfangskurve Γ nicht gleichzeitig Werte für u und ∂n u vorgegeben werden dürfen, wenn man an physikalisch sinnvollen Lösungen interessiert ist. Wir haben gesehen, daß man bei der Wahl von Randbedingungen für elliptische Operatoren vorsichtig sein muß, wenn das resultierende Randwertproblem wohl-gestellt sein soll. Sei also Ω ⊂ R2 ein beschränktes Gebiet mit hinreichend glattem Rand ∂Ω. Wir wollen dabei Ränder mit einer glatten Parametrisierung (mindestens zweimal stetig differenzierbar) oder ein Polygongebiet (mit endlich vielen Ecken) zulassen. Als prototypischen Modellfall betrachten wir die Poisson-Gleichung“ ” −∆u = f auf Ω. (1.2.7) Es gibt drei Typen von Randbedingungen und zugehörige Randwertaufgaben ( RWAn“): ” 7 a) Dirichletsche Randbedingungen ( 1. RWA“): u = g auf ∂Ω . ” 6 Sofia Vasilyevna Kovalevskaya (1850-1891): russische Mathematikerin, eine der ersten Frauen mit Universitätskarriere; 1869 Studium in Heidelberg als “Gasthörerin”, da hier für Frauen ein offizielles Universitätsstudium noch nicht möglich war; ab 1871 Studium in Berlin bei Weierstraß und danach in Göttingen; eine ihrer ersten Veröffentlichungen enthält den nach ihr benannten “Existenzsatz”; konnte damals als Frau aber keine Universitätsanstellung in Deutschland bekommen, trotz Fürsprache von Weierstraß; auf Betreiben Mittag-Lefflers ab 1884 Stelle als “Privatdozent” in Stockholm; leistete Beiträge zur Analysis und zur Theorie von Differentialgleichungen der Physik; Anekdotisches: In ihrer Autobiografie steht, daß sie bereits als 11-Jährige durch die Lektüre von Seiten aus Ostrogradskis Vorlesungskriptum über Differential- und Integralrechnung, mit denen ihr Kinderzimmer tapeziert war, mit der Analysis in Berührung gekommen war. 7 Johann Peter Gustav Lejeune Dirichlet (1805-1859) geb. in Düren (damals bei Frankreich): wirkte in Berlin und als Prof. in Göttingen (Nachfolger von Gauß ); wichtige Beiträge zur Zahlentheorie, Analysis und Differentialgleichungen (“Dirichletsches Prinzip”). 16 Theorie partieller Differentialgleichungen b) Neumannsche8 Randbedingungen ( 2. RWA“): ∂n u = g auf ∂Ω . ” 9 c) Robinsche Randbedingungen ( 3. RWA“): ∂n u + αu = g auf ∂Ω . ” Die Randfunktionen g werden i.a. als glatt und α ≥ 0 angenommen. Alle diese RWAn sind, wie wir zum Teil zeigen werden, unter geeigneten Zusatzbedingungen an die Daten wohl gestellt. n Ω Ω Abbildung 1.2: Konfiguration der elliptischen Randwertaufgabe 1.2.1 Existenz Die Frage nach der Existenz von Lösungen der 1. RWA ist wesentlich schwieriger als bei AWAn gewöhnlicher Differentialgleichungen. Als Vorbereitung für analoge Argumente im Zusammenhang mit den Diskretrisierungsverfahren wollen wir zwei völlig unterschiedliche Zugänge zu dieser Frage diskutieren, den klassischen“, potentialtheoretischen und den modernen“, funk” ” tionalanalytischen. Der Einfachheit halber wird nur der Fall homogener“ Randbedingungen ” u|∂Ω = 0 betrachtet. i) Potentialtheoretische Methode: Zunächst ist der Begriff einer klassischen“ Lösung für die Dirichletschen Randbedingung zu ” präzisieren. Wir verstehen darunter eine Funktion u ∈ C 2 (Ω) ∩ C(Ω), welche im Innern von Ω der Differentialgleichung und entlang des Randes ∂Ω der Randbedingung genügt. Ferner soll ihr Gradient (möglicherweise im uneigentlichen Riemannschen10 Sinne) quadratintegrabel sein: |∇u| ∈ L2 (Ω). Zur Konstruktion solcher klassischer Lösungen postulieren wir zunächst die Existenz einer Funktion G(x, y) auf Ω × Ω , G ∈ C 2 ({Ω × Ω} \ {x = y}) ∩ C({Ω × Ω} \ {x = y}), 8 John von Neumann (1903-1957): US-amerikanischer Mathematiker ungarischer Abstammung; wirkte hauptsächlich am Institute for Advanced Studies in Princeton (zus. mit A. Einstein u.a.) und gilt als mathematisches Genie; lieferte fundamentale Beiträge zu den mathematischen Grundlagen der Quantenmechanik, zur Operatortheorie, zur Spieltheorie, zur Gruppentheorie und zur Theorie der partiellen Differentialgleichungen; Pionier der Automatentheorie und theoretischen Informatik. 9 Victor Gustave Robin (1855-1897: französischer Mathematiker; lehrte an der Sorbonne in Paris; Beiträge zur Potentialtheorie unf Thermodynamik; hat die nach ihm benannte 3. Randbedingung anscheinend selbst gar nicht benutzt. 10 Bernhard Riemann (1826-1866): deutscher Mathematiker; Professor in Göttingen als Nachfolger Dirichlets; Mitbegründer der Funktionentheorie und der modernen Geometrie; einer der bedeutendsten Mathematiker des 19. Jh.s, von großem Einfluß auch auf die theoretische Physik. 1.2 Elliptische Probleme 17 mit den Eigenschaften −∆x G(·, y) = 0 in Ω \ {y}, G(·, y) = 0 auf ∂Ω \ {y}, (1.2.8) für beliebiges festes y ∈ Ω . Für x = y habe G(x, y) eine dimensionsabhängige Singularität, die so beschaffen ist, daß sich −∆x G(·, y) wie die Dirac-Distribution verhält, d.h.: Für v ∈ C(Ω) gilt mit den Kugelumgebungen Bε := {y ∈ Ω : |x| ≤ ε} , ε > 0 : Z x ∈ Ω : lim −∆x G(x, y) v(y) dy = v(x), (1.2.9) ε→0 Ω\Bε Z x ∈ ∂Ω : lim ∂n G(x, y) v(y) dy = v(x). (1.2.10) ε→0 ∂Ω\Bε Eine solches G(x, y) wird Greensche Funktion (1. Art)“ genannt. Wir machen damit den ” Lösungsansatz Z Z ∂n G(x, y)g(y) doy . G(x, y)f (y) dy + u(x) := Ω ∂Ω Die formulierten Eigenschaften der Greenschen Funktion erlauben es, zu zeigen, daß dieser Ansatz tatsächlich eine klassische Lösung der 1. RWA liefert. Diese Rechnung ist aufwendig und kann z.B. im Buch von Hellwig nachgelesen werden. Die Konstruktion einer Greenschen Funktion für allgemeine Gebiete im Rd ist schwer. Im Fall d = 2 folgt ihre Existenz aber mit Hilfe des Riemannschen Abbildungssatzes aus der Theorie komplexer Funktionen (siehe Hellwig). Für sehr spezielle Konfigurationen, wie z.B. Halbebenen oder Kreise, läßt sich die Greensche Funktion explizit angeben. Beispiel: Auf dem Kreis Ω := {x ∈ R2 : |x| < R} ist durch o R R2 1 n log(|x − y|) + log( ) − log(| 2 x − y|) , 2π |x| |x| o 1 n log(|y|) − log(R) , x = 0. G(x, y) = − 2π G(x, y) = − x 6= 0, (1.2.11) (1.2.12) eine Greensche Funktion mit den obigen Eigenschaften gegeben. Die Existenz Greenscher Funktionen läßt sich für sehr allgemeine Gebiete Ω nachweisen, auch für die anderen RWAn. Das Konzept der klassischen“ Lösung ist in vielen Anwendungsfällen ” zu restriktiv, z.B. wenn die rechte Seite f nicht regulär genug ist, um eine C 2 -Lösung zuzulassen. Die Greensche Funktion selbst ist ein Extremfall in dieser Hinsicht. Als nächstes werden wir eine Abschwächung dieser Anforderungen kennenlernen, welche mehr Flexibilität bietet und für die man vergleichweise leicht die Existenz von Lösungen garantieren kann. ii) Funktionalanalytische Methode: Wir haben bereits früher gesehen, daß eine enge Beziehung zwischen der Poisson-Gleichung und der Minimierung des zugehörigen Energiefunktionals besteht. Dies kann man zum Nachweis der Existenz von Lösungen ausnutzen. Wir betrachten das Funktional Z Z 1 2 f v dx E(v) := |∇v| dx − 2 Ω Ω 18 Theorie partieller Differentialgleichungen auf dem Vektorraum Ṽ der zulässigen“ Funktionen: ” Ṽ0 := {v : Ω → R : v ∈ C 1 (Ω) ∩ C(Ω), v|∂Ω = 0, |∇v| ∈ L2 (Ω)}. Dieser Raum wird mit der natürlichen Energie-Norm“ ” kvkE := k∇vkΩ , v ∈ Ṽ0 , versehen. Daß dies wirklich eine Norm ist, folgt aus den entsprechenden Eigenschaften der L2 Norm k · k = k · kΩ . Aus der Poincaréschen Ungleichung kvkΩ ≤ dΩ k∇vkΩ , v ∈ Ṽ0 , mit dΩ := diam(Ω) folgt weiter, daß diese Norm stärker ist als die L2 -Norm. In kompakter Schreibweise ist E(v) = 12 k∇vk2 − (f, v). Wir verwenden jetzt eine Argumentation aus der Variationsrechnung, die dort als die direkte Methode“ bekannt ist. ” i) Wir zeigen zunächst, daß E(·) nach unten beschränkt ist. Für v ∈ Ṽ0 folgt mit Hilfe der Hölderschen und der Poincaréschen Ungleichung E(v) ≥ 12 k∇vk2 − kf k kvk ≥ 12 k∇vk2 − dΩ kf k k∇vk. Anwendung der Ungleichung ab ≤ 12 a2 + 21 b2 liefert weiter dΩ kf k k∇vk ≤ 12 k∇vk2 + 12 d2Ω kf k2 , und folglich E(v) ≥ − 12 d2Ω kf k2 > −∞, v ∈ Ṽ0 . ii) Sei nun (uk )k∈N ⊂ Ṽ0 eine Minimalfolge“ des Funktionals E(·) , d.h.: ” E(uk ) → inf E(v) =: d > −∞. v∈Ṽ Wir wollen zeigen, daß (uk )k∈N eine Cauchy-Folge bzgl. der Energie-Norm ist. Wichtiges Hilfsmittel dazu ist die sog. Parallelogrammidentität“ ” kv − wk2E + kv + wk2E = 2kvk2E + 2kwk2E , die man durch direktes Nachrechnen verifiziert. Für beliebige Indizes n, m ∈ N gilt folglich kun − um k2E = 2kun k2E + 2kum k2E − 4k 12 (un + um )k2E = 4E(un ) + 4(f, un ) + 4E(um ) + 4(f, um ) − 8E( 12 (un + um )) − 8(f, 12 (un + um )) = 4E(un ) + 4E(um ) − 8E( 21 (un + um )). Wegen lim {E(un ) + E(um )} = 2d, n,m→∞ E( 12 (un + um )) ≥ d, folgt damit lim sup kun − um k2E ≤ 0, n,m→∞ 1.2 Elliptische Probleme 19 d.h.: (un )n∈N ist wie behauptet eine Cauchy-Folge. Die Cauchy-Folge (un )n∈N besitzt i.a. keinen Limes im normierten (unvollständigen) Raum Ṽ0 . Durch Vervollständigung von Ṽ0 erhält man den sog. Sobolew-Raum“ H01 (Ω). Die Ele” mente von H01 (Ω) sind zunächst als Äquivalenzklassen von Cauchy-Folgen (analog wie bei der Konstruktion der reelen Zahlen aus den rationalen) definiert; sie lassen sich aber wieder als Funktionen interpretieren. Sie sind L2 -Funktionen, deren erste Ableitungen (im Distributionssinne) wieder in L2 liegen und die in einem abgeschwächten Sinn auf ∂Ω verschwinden (siehe die angegebene Literatur zur Theorie partieller Differentialgleichungen). Wir werden unten in Abschnitt 1.3 die Eigenschaften dieser Sobolew11 -Räume“ genauer diskutieren. Der Limes u ∈ H01 (Ω) ” der Folge (un )n∈N wird als die schwache“ oder auch variationelle“ Lösung der 1. RWA des ” ” Laplace-Operators bezeichnet. Als Minimalpunkt des Funktionals E(·) genügt sie, wie wir schon früher gesehen haben, notwendig der Beziehung (∇u, ∇ϕ) = (f, ϕ) ∀ϕ ∈ H01 (Ω). (1.2.13) Umgekehrt gilt für eine Funktion u ∈ H01 (Ω) , welcher dieser Variationsgleichung genügt, mit jeder anderen Funktion v ∈ H01 (Ω) E(v) − E(u) = 12 k∇vk2 − (f, v) − 12 k∇uk2 + (f, u) = 21 k∇vk2 − (∇u, ∇v) − 12 k∇uk2 + (∇u, ∇u) = 12 k∇vk2 − (∇u, ∇v) + 12 k∇uk2 = 21 k∇(v − u)k2 ≥ 0. Folglich ist u automatisch auch Minimum des Energiefunktionals und somit schwache Lösung. Wenn die schwache Lösung u regulärer ist, etwa sogar die Regularität einer klassischen Lösung besitzt, so kann partiell integriert werden, und wir finden (−∆u, ϕ) + (∂n u, ϕ)∂Ω = (f, ϕ) ∀ϕ ∈ H01 (Ω) bzw. wegen der Randbedingung ϕ|∂Ω = 0 (−∆u − f, ϕ) = 0 ∀ϕ ∈ H01 (Ω). Hieraus folgt mit den üblichen Argumenten, daß −∆u = f , d.h.: u ist sogar klassische Lösung der RWA. Umgekehrt erfüllt natürlich jede klassische Lösung u ∈ C 2 (Ω) ∩ C 1 (Ω̄) die Variationsgleichung (∇u, ∇ϕ) − (f, ϕ) = (−∆u − f, ϕ) + (∂n u, ϕ)∂Ω = 0 ∀ϕ ∈ H01 (Ω). Damit ist der schwache“ Lösungsbegriff verträglich mit dem ursprünglichen klassischen“. Der ” ” Nachweis höherer Regularität der schwachen Lösung u ∈ H01 (Ω) ist allerdings schwierig und kann im Rahmen dieser Vorlesung nur andiskutiert werden (siehe wieder die empfohlene Literatur). Wir wollen noch kurz diskutieren, wie das obige Argument verwendet werden kann, um die 11 Sergei Lvovich Sobolew (1908-1989): russischer Mathematiker; wirkte zunächst in Leningrad (St. Petersburg) und dann am berühmten Steklov-Institut für Mathematik der Akademie der Wissenschaften in Moskau; fundamentale Beiträge zur Theorie der partiellen Differentialgleichungen, Konzept der verallgemeinerten (distributionellen) Lösung, Sobolew-Räume; beschäftigte sich auch mit numerischen Methoden, numerische Quadratur. 20 Theorie partieller Differentialgleichungen Existenz von schwachen Lösungen der 1. RWA auch im Fall inhomogener Randdaten u|∂Ω = g zu sichern. Dazu nehmen wir an, daß die Randfunktion g als Spur“ einer auf ganz Ω definierten ” Funktion ĝ ∈ C 2 (Ω) ∩ C(Ω) gegeben ist, d.h.: g = ĝ|∂Ω . Dann wäre die Funktion v := u − ĝ Lösung der RWA −∆v = f − ∆ĝ in Ω, v|∂Ω = 0. Hierfür garantiert nun die variationelle Methode die Existenz einer (eindeutigen) schwachen Lösung v ∈ H01 (Ω) mit der Eigenschaft (∇v, ∇ϕ) = (f, ϕ) + (∇ĝ, ∇ϕ) ∀ϕ ∈ H01 (Ω). Die schwache Lösung der ursprünglichen RWA ergibt sich dann als u := v + ĝ . 1.2.2 Eindeutigkeit Die Eindeutigkeitsforderung an Lösungen dieser RWAn ist leicht zu gewährleisten. Wir diskutieren hier nur die 1. RWA. Die entsprechenden Argumente für die 2. und die 3. RWA seien als Übung gestellt. (i) Besonders einfach ist der Beweis für die schwachen Lösungen. Seien also u(1) , u(2) ∈ H01 (Ω) zwei schwache Lösungen der 1. RWA, d.h.: (∇u(i) , ∇ϕ) = (f (i) , ϕ) ∀ϕ ∈ H01 (Ω). Dann gilt für die Differenz w := u(1) − u(2) (∇w, ∇ϕ) = 0 ∀ϕ ∈ H01 (Ω). Mit ϕ := w folgt k∇wk = 0 und folglich w ≡ konst. bzw. w ≡ 0 wegen der Randbedingung. (ii) Die Eindeutigkeit von klassischen Lösungen folgt unmittelbar aus der gerade bewiesenen Eindeutigkeit von schwachen Lösungen, da jede klassische Lösung ja auch schwache Lösung ist. Eine direktere Argumentation ergibt sich mit Hilfe des sog. Maximumprinzips“ . ” Hilfssatz 1.1 (Maximumprinzip): Für den elliptischen Operator Lu := −∆u + au mit a ≥ 0 auf einem Gebiet Ω ∈ Rd gilt das sog. Maximumprinzip“, d.h.: Eine Funktion ” u ∈ C 2 (Ω) ∩ C(Ω) mit der Eigenschaft Lu ≤ 0 hat in Ω kein positives Maximum. Dies bedeutet, daß entweder u ≤ 0 auf ganz Ω ist, oder max u ≤ max u. Ω ∂Ω (1.2.14) Beweis: Wir führen den Beweis nur für den Fall, daß a > 0 auf Ω . Der allgemeine Fall a ≥ 0 erfordert eine aufwendigere Argumentation (siehe z.B. das Buch von Hellwig). Ferner sei d = 2. Angenommen, die Funktion u habe im Fall u 6≤ 0 in einem Punkt z ∈ Ω ein positives Maximum, u(z) > 0. Dann ist notwendig ∇u(z) = 0, ∂x2 u(z) ≤ 0, ∂y2 u(z) ≤ 0. 1.2 Elliptische Probleme 21 Damit folgt 0 ≥ Lu(z) = −∆u(z)+au(z) ≥ au(z) , was wegen a > 0 den Widerspruch u(z) ≤ 0 erzwingt. Q.E.D. Das Maximumprinzip für elliptische Operatoren 2. Ordnung ist die natürliche Verallgemeinerung der simplen Tatsache, daß in einer Raumdimension aus u′′ (x) ≥ 0 die Konvexität von u folgt. y u"(x) > 0 u(x) Ω x Abbildung 1.3: Maximumprinzip in einer Dimension Aussagen vom Typ des obigen Maximumprinzips lassen sich für sehr allgemeine (auch nichtlineare) elliptische Operatoren 2. Ordnung herleiten. Wir betonen, daß das Maximumprinzip i.a. für elliptische Operatoren höherer Ordnung (z.B. den biharmonischen Operator“ ∆2 u ) und für ” elliptische Systeme (z.B. die Gleichungen der linearen Elastizitätstheorie) nicht mehr gilt. Als erste, einfache Anwendung des Maximumprinzips erhalten wir einen alternativen Beweis für die Eindeutigkeit (klassischer) Lösungen der 1. RWA des Laplace-Operators. Sind u(1) , u(2) zwei Lösungen, so gilt für die Differenz w := u(1) − u(2) wieder −∆w = 0 in Ω, w = 0 auf ∂Ω. Anwendung des Maximumprinzips auf w sowie −w impliziert dann, daß notwendig w ≤ 0, −w ≤ 0 , d.h.: w ≡ 0. 1.2.3 Stetige Abhängigkeit (i) Die Frage nach der stetigen Abhängigkeit der Lösungen der 1. RWA wollen wir wieder sowohl mit Hilfe des klassischen Ansatzes als auch mit der variationellen Methode angehen. Seien zunächst u(1) , u(2) zwei Lösungen (klassisch oder variationell) der 1. RWA des LaplaceOperators zu unterschiedlichen rechten Seiten f (1) , f (2) . Für die Differenz w = u(1) − u(2) folgt dann k∇wk2 = (f (1) − f (2) , w) ≤ kf (1) − f (2) kΩ kwk. Unter Ausnutzung der Poincaréschen Ungleichung folgt daraus k∇wk ≤ dΩ kf (1) − f (2) k, d.h. die Stetigkeit der Lösung (in der Energie-Norm) gegenüber Störungen der rechten Seite. 22 Theorie partieller Differentialgleichungen (ii) Als nächstes betrachten wir Störungen der Randdaten. Dazu verwenden wir wieder das Maximumprinzip. Seien dazu u(1) , u(2) zwei Lösungen zu den Randdaten g(1) , g(2) . Für die Differenz w := u(1) − u(2) gilt dann −∆w = 0 in Ω, w = g := g(1) − g(2) auf ∂Ω. Mit dem Maximumprinzip erschließen wir hieraus, daß w ≡ 0 (was natürlich i.a. nicht eintritt) oder max w ≤ max g, max −w ≤ max −g. ∂Ω Ω Ω ∂Ω Dies impliziert maxΩ |w| ≤ max∂Ω |g|. Schließlich ergibt sich mit Hilfe des Maximumprinzips noch, daß eine Lösung der 1. RWA des Laplace-Operators zu nichtnegativer rechter Seite und ebensolchen Randdaten, −∆u ≥ 0 in Ω, u ≥ 0 auf ∂Ω, notwendig überall nicht-negativ ist: u ≥ 0 . Dies gilt dann z.B. auch für die zugehörige Greensche Funktion: g(·, ·) ≥ 0. Durch schärfere Argumente kann man darüber hinaus zeigen, daß die Greensche Funktion im Innern des Definitionsgebiets Ω positiv ist. Dies bedeutet u.a., daß bei einem elliptischen Problem lokale Störungen in den Daten die Lösung im gesamten Lösungsgebiet verändern. Es liegt also gewissermaßen eine unendliche Ausbreitungsgeschwindigkeit“ von ” Information vor. Dies ist charakteristisch für elliptische Randwertaufgaben. 1.2.4 Regularität Auf glatt berandeten Gebieten Ω besteht, ähnlich wie bei gewöhnlichen Differentialgleichungen, für (lineare) partielle Differentialgleichungen vom elliptischen Typ die Regel, daß sich die Regularität der Daten (rechte Seite und Randwerte) auf natürliche Weise auf die Lösung überträgt. Der Rand ∂Ω sei aus der Klasse C 2 (2-mal stetig differenzierbar parametrisierbar). Dann besitzt die schwache Lösung u ∈ H01 (Ω) im Falle f ∈ L2 (Ω) zweite Ableitungen mit der Regularität |∇2 u| ∈ L2 (Ω) , und es gilt die a priori Abschätzung 2 X k=0 k∇k uk2 1/2 ≤ ckf k. (1.2.15) Diese Aussage bleibt gültig, wenn Ω ein konvexes Polygongebiet oder ein konvexer Polyeder ist. Ist darüber hinaus f Hölder-stetig, so ist die schwache Lösung u ∈ H01 (Ω) sogar klassische Lösung. Höhere Regularitätseigenschaften von ∂Ω und f übertragen sich entsprechend auf u . Im Fall von Gebieten mit Ecken, insbesondere einspringenden“ Ecken (Innenwinkel ω > π) ” treten allerdings dort Irregularitäten in der Lösung auf; z. B. ist die in ebenen Polarkoordinaten (r, θ) ausgedrückte Funktion 2 u(r, θ) = r 3 sin( 23 θ) auf der gelochten Ebene R2 \ {0} harmonisch, d.h. ∆u ≡ 0 . Auf dem Tortenstück“ ” Ω := {(x, y) ∈ R2 | 0 < r < 1, 0 < θ < 32 π} mit einer rechtwinkligen einspringenden Ecke ist ∇u ∈ L2 (Ω)2 , und u ist daher (klassische) 1.2 Elliptische Probleme 23 Lösung der Poisson-Gleichung ∆u = 0 zu den Randbedingungen u(r, θ) = 0 für θ ∈ {0, 32 π}, u(r, θ) = sin( 32 ) für r = 1. Wir sehen an diesem Beispiel, daß klassische“ Lösungen elliptischer Gleichungen nicht unbe” dingt regulär bis zum Rand ∂Ω zu sein brauchen. Für allgemeinen Innenwinkel ω ∈ (0, 2π] (Der Fall ω = 2π entpricht einem sog. Schlitzgebiet“.) erhält man analoge klassische Lösungen in π ” der Form u(r, θ) = r ω sin( ωπ θ) . Für ω > π , d.h. für eine einspringende“ Ecke hat die Lösung ” bei r = 0 singuläre erste Ableitungen. Diese sog. Eckensingularitäten“ sind gut analysiert und ” abschätzbar. Sie haben einen signifikanten, negativen Einfluß auf die Approximationsgüte von Diskretisierungen und erfordern besondere Vorkehrungen. 24 Theorie partieller Differentialgleichungen 1.3 Hilfsmittel aus der Theorie von Funktionenräumen In diesem Abschnitt stellen wir einige Aussagen über Räume verallgemeinert differenzierbarer Funktionen, sog. Sobolew-Räume“, zusammen, soweit sie später bei der Analyse von Diskreti” sierungsverfahren benötigt werden. 1.3.1 Sobolew-Räume Sei Ω ein Gebiet im Rd (d = 2, 3) mit Rand ∂Ω . Der Rand wird als ausreichend“ glatt ange” nommen, was von der betrachteten Situation abhängt; diesbezügliche Einschränkungen werden von Fall zu Fall angegeben. Wir nehmen generell an, daß ∂Ω eine Lipschitz-stetige Parametrisierung besitzt und überall bis auf endlich viele Punkte oder Kanten eine wohl-definierte äußere Normale n besitzt. Auf einem solchen Gebiet Ω definieren wir zunächst für Funktionen aus C(Ω) (Vektorraum der stetigen Funktionen auf dem Abschluß Ω ) das sog. L2 -Skalarprodukt und die zugehörige Norm Z Z u(x)v(x) dx, (u, v)Ω := Ω kuk0;Ω := Ω |u(x)|2 dx 1/2 . Wenn Verwechslungen ausgeschlossen sind, wird auch die kürzere Notation (·, ·) = (·, ·)Ω sowie k · k = k · k0 = k · k0;Ω verwendet. Die Vervollständigung von C(Ω) bzgl. der Norm k · k0;Ω liefert den Lebesgueschen12 Hilbert-Raum“ L2 (Ω) der auf Ω im Lebesgueschen Sinne meßbaren ” und quadratintegrablen Funktionen. Eine Funktion“ v ∈ L2 (Ω) ist dann dadurch charakte” risiert, daß es eine Folge glatter Funktionen (vk )k∈N ⊂ C(Ω) gibt, welche bzgl. der L2 -Norm Cauchy-Folge ist und fast überall“ (im Lebesgueschen Sinne) gegen v konvergiert. Mit einem ” einfachen Approximationsargument läßt sich zeigen, daß sich L2 (Ω) auch als Vervollständigung des Raumes der Testfunktionen“ (Begriff aus der Distributionen-Theorie) ” C0∞ (Ω) := {v ∈ C ∞ (Ω) : Trg(v) := {x ∈ Ω, v(x) 6= 0} ⊂ Ω kompakt} gewinnen läßt. Auf analoge Weise gewinnt man für 1 ≤ p < ∞ die sog. Lp -Räume“ Lp (Ω) als ” Vervollständigung von C(Ω) bzgl. der Norm Z 1/p kvkLp (Ω) := |v(x)|p dx . Ω Der Fall p = ∞ bedarf einer gesonderten Betrachtung. Der Lebesgue-Raum L∞ (Ω) besteht aus allen auf Ω definierten, im Lebesgueschen Sinne meßbaren und wesentlich beschränkten“ ” Funktionen; seine Norm ist kvkL∞ (Ω) := ess supx∈Ω |v(x)|. Man beachte, daß sich L∞ (Ω) nicht als Vervollständigung von C(Ω) bzgl. der Norm k·k∞;Ω gewinnen läßt, denn dies ergibt wieder C(Ω) . Wenn Mißverständnisse ausgeschlossen sind, werden die Lp -Normen auch kurz mit k · kp = k · kLp = k · kLp (Ω) bezeichnet. Die funktionalanalytische Methode zum Nachweis der Existenz von schwachen“ Lösungen ” 12 Henri Léon Lebesgue (1875-1941): französischer Mathematiker, Professor am Collège de France in Paris, lieferte grundlegende Beiträge zur modernen Integrationstheorie (“Lebesgue-Intgeral”) 1.3 Hilfsmittel aus der Theorie von Funktionenräumen 25 der Poisson-Gleichung −∆u = f in Ω, u|∂Ω = 0, (1.3.16) bedient sich als natürlichen Lösungsraum“ des Sobolew-Raums H01 (Ω) . Dieser ist Teilraum ” des Sobolew-Raums H 1 (Ω) , welchen man erhält z.B. durch Vervollständigung des Vektorraums C 1 (Ω) bzgl. der sog. H 1 -Norm kvk1 := kvk20 + k∇vk20 1/2 . Entsprechend ist H01 (Ω) definiert als der Abschluß von C0∞ (Ω) in H 1 (Ω) . Die Definition des Sobolew-Raums H 1 (Ω) als Vervollständigung von C 1 (Ω) besagt zunächst, daß seine Elemente als Äquivalenzklassen von Cauchy-Folgen (vk )k∈N ⊂ C 1 (Ω) bzgl. der H 1 Norm definiert sind. Dies ist ein sehr unhandliches Konzept, mit dem man schlecht arbeiten kann. Daher werden diesen Äquivalenzklassen Funktionen auf Ω zugeordnet durch folgende Konstruktion: {(vk )k∈N } 7→ v ∈ H 1 (Ω) : v := lim vk , k→∞ ∇v := lim ∇vk , k→∞ wobei die Konvergenz jeweils im L2 -Sinne zu verstehen ist. Umgekehrt existiert dann für jede solche Funktion v ∈ H 1 (Ω) eine approximierende Folge glatter“ Funktionen (vk )k∈N mit kv − ” vk k1 → 0 (k → ∞) . Auf diesem Wege, d.h. durch Konstruktion einer solchen approximierenden Folge wird auch für eine gegebene Funktion v ∈ L2 (Ω) gegebenenfalls v ∈ H 1 (Ω) gezeigt. Die Limiten ∂i v := limk→∞ ∂i vk werden verallgemeinerte“ (oder auch schwache“) Ableitungen ” ” von v genannt. Sie sind i.a. nicht stetig oder beschränkt und existieren nur im L2 -Sinne, d.h. im Lebesgueschen Sinn fast überall“. Zum Nachweis, daß eine in fast allen Punkten x ∈ Ω ” definierte Funktion v in H 1 (Ω) liegt, geht man üblicherweise wie folgt vor: Zunächst wird aus Kenntnis der Struktur von v eine Folge approximierender glatter“ Funktionen (vk )k∈N ⊂ ” C 1 (Ω) konstruiert, welche für k → ∞ samt ihrer ersten Ableitungen (fast überall) punktweise gegen v konvergieren. Kann dann noch gezeigt werde, daß lim kvk k1;Ω < ∞, so folgt (nach dem Satz von der dominierten Konvergenz“ der Maß-Theorie), daß (vk )k∈N eine ” Cauchy-Folge bzgl. der H 1 -Norm ist und den Limes v besitzt; d.h. v ∈ H 1 (Ω) . Beispiel 1.1: (i) L2 -Funktionen: Sei Ω zunächst die gepunktete Kreisscheibe Ω0 = {x ∈ R2 : 0 < |x| < 1}. Auf Ω0 ist die Funktion u(x) = ln(|x|) stetig, aber unbeschränkt. Auf der vollen Kreisscheibe Ω = {x ∈ R2 : |x| < 1} ist u(x) = ln(|x|) aber als Funktion in L2 (Ω) erklärt. Dies wird klar bei Betrachtung der approximierenden, stetigen Funktionen ln(|x|) für k−1 < |x| < 1, uk (x) := ln(k−1 ) für 0 ≤ |x| ≤ k−1 . Man rechnet leicht nach, daß (uk )k∈N eine Cauchy-Folge bzgl. der L2 -Norm auf Ω ist und in allen Punkten x ∈ Ω (bis auf x = 0 ) uk (x) → u(x) (k → ∞) gilt. 26 Theorie partieller Differentialgleichungen Wir betrachten nun die Funktion u(x) := |x|−1 , welche ebenfalls auf Ω0 stetig und unbeschränkt ist. In diesem Fall bilden die approximierenden Funktionen −1 |x| für k−1 < |x| < 1, uk (x) := k für 0 ≤ |x| ≤ k−1 , wegen kuk k2Ω = 2π Z k −1 2 k r dr + 2π Z 1 r −1 dr = 2π k −1 0 1 2 + ln(k) → ∞ (k → ∞) keine Cauchy-Folge bzgl. der L2 -Norm, d.h.: Dieses u ist zu singulär, um als L2 -Funktion auf Ω erklärt zu sein. Bei der analogen Betrachtung auf der Einheitskugel im R3 ergibt sich dagegen, daß u(x) = |x|−1 in diesem Fall sehr wohl in L2 (Ω) liegt. Die Zugehörigkeit von Funktionen mit lokalen Singularitäten zum Lebesgue-Raum L2 (Ω) hängt also von der jeweiligen Raumdimension ab. Wir werden denselben Effekt auch beim Sobolew-Raum H 1 (Ω) finden. (ii) H 1 -Funktionen: Wir betrachten wieder die Funktion u(x) = ln(|x|) auf der punktierten Kreisscheibe Ω0 ⊂ R2 . Ihr Gradient ∇u(x) = |x|−2 x verhält sich bei Annäherung an x = 0 wie |∇u(x)| ≈ |x|−1 . Im Hinblick auf das eben diskutierte Beispiel ist ∇u also nicht zu einer L2 Funktion auf die volle Kreisscheibe Ω fortsetzbar. Folglich ist u auch nicht in H 1 (Ω) . Wir sehen, daß insbesondere die Greensche Funktion zum Laplace-Operator in zwei Raumdimensionen nicht im Energie-Raum“ H 1 (Ω) liegt. Man beachte, daß v(x) = ln(x) in drei Raumdimensionen ” aber sehr wohl in H 1 (Ω) liegt; der kritische Grenzfall ist hier die stärker singuläre Funktion u(x) = |x|−1 . Als zweites Beispiel zeigen wir, daß H 1 -Funktionen in mehr als einer Dimension nicht beschränkt sein müssen. Auf Ω0 sei die Funktion u(x) = ln(ln(|x|−1 ) + 1) betrachtet. Da | ln ln(r −1 )| für r → 0 langsamer wächst als | ln(r)| , ist u sicherlich zu einer L2 -Funktion auf Ω fortsetzbar. Wir berechnen nun den Gradienten ∇u(x) = − x |x|2 (ln(|x|−1 ) + 1) . Die zugehörigen abgeschnittenen“ Funktionen ” ln(ln(|x|−1 ) + 1) für k−1 < |x| < 1, uk (x) := ln(ln(k) + 1) für 0 ≤ |x| ≤ k−1 , haben die stückweise“ definierten Gradienten ” ( x ∇uk (x) := |x|2 (ln(|x|−1 )+1) 0 für k−1 < |x| < 1, für 0 ≤ |x| ≤ k−1 , 1.3 Hilfsmittel aus der Theorie von Funktionenräumen 27 welche überall (bis auf x = 0 ) gegen ∇u konvergieren. Aus der Abschätzung 2 Z 1 Z 2 r dr = 2π r 1 1 dr 2 −1 −1 r (ln(r ) + 1) r(ln(r ) + 1)2 k −1 k −1 1 2π 2π = ≤ 2π −1 = 2π − −1 ln(r ) + 1 k ln(k) + 1 k∇uk k = 2π (1.3.17) (1.3.18) ersehen wir ferner, daß (∇uk )k∈N bzgl. der L2 -Norm eine Cauchy-Folge ist. Folglich ist u zu einer Funktion im Sobolew-Raum H 1 (Ω) fortsetzbar. Mit der eben verwendeten Abschneide” technik“ erhalten wir approximierende Funktionen uk , welche i.a. nur stückweise stetig differenzierbar sind, d.h. nicht im strengen Sinne in C 1 (Ω) liegen und somit nicht direkt in das oben formulierte Approximationskonzept für H 1 -Funktionen passen. Dieser Mangel kann behoben werden, in dem man statt abzuschneiden regularisiert, z.B. gemäß uk (x) = ln(ln((|x| + k)−1 ) + 1). Diese uk ∈ C 1 (Ω) bilden dann ebenfalls eine approximierende Folge von u bzgl. der H 1 -Norm. Eine ähnliche Modifikation (schon bei der Definition der Sobolew-Räume) muß auch vorgenommen werden, um spezielle Gebiete Ω mit schlitz-artigen“ Randeinsprüngen einbeziehen zu ” können. Solche Schlitz-Gebiete“ spielen eine wichtige Rolle z.B. in der Baumechanik, wenn die ” Ausbreitung von Rissen in Bauteilen beschrieben werden soll. Analog zu dem Sobolew-Raum H 1 (Ω) erster Ordnung“ quadrat-integrabler Funktionen ” kann man auch Sobolew-Räume H m,p (Ω) höherer Ordnung m ∈ N , bestehend aus p-integrablen Funktionen (1 ≤ p < ∞) , definieren. Diese erhält man durch Vervollständigung des Raumes C m (Ω) bzgl. der Norm kvkH m,p (Ω) := kvkpLp (Ω) + ... + k∇m vkpLp (Ω)p 1/p . Der Fall p = ∞ bedarf wieder einer gesonderten Betrachtung. Die Räume H m,∞ (Ω) werden über die Gleichsetzung H m,∞ (Ω) := W m,∞ (Ω) als Räume sog. verallgemeinert differenzier” barer“ Funktionen mit distributionellen Ableitungen in L∞ (Ω) definiert. Wir wollen auf diese Begiffsbildungen nicht weiter eingehen und verweisen statt dessen auf die einschlägige Literatur über Sobolew-Räume (z.B.: Wloka (1982)). 1.3.2 Eigenschaften von Lebesgue- und Sobolew-Räumen Wir wollen im folgenden einige wichtige Eigenschaften von Lebesgue- und Sobolew-Räumen zusammenstellen, welche später bei der Analyse numerischer Verfahren benötigt werden. Sei 1 < p < ∞ und q := p/(p − 1) . Dann gilt für Funktionen u ∈ Lp (Ω) und v ∈ Lq (Ω) die allgemeine Höldersche Ungleichung“ ” Z Z 1/p Z 1/q p |u(x)| dx |v(x)|q dx , (1.3.19) u(x)v(x) dx ≤ Ω Ω Ω bzw. in Kurzform |(u, v)Ω | ≤ kukLp (Ω) kvkLq (Ω) . Für die Grenzfälle p = ∞ bzw. q = 1 gilt |(u, v)Ω | ≤ kukL∞ (Ω) kvkL1 (Ω) . (1.3.20) 28 Theorie partieller Differentialgleichungen Die variationelle Methode zum Nachweis von schwachen“ Lösungen der Poisson-Gleichung ” basierte auf der Eigenschaft der bilinearen Form (∇u, ∇v)Ω , auf dem Teilraum H01 (Ω) ⊂ H 1 (Ω) ein Skalarprodukt zu sein. Hilfssatz 1.2 (Poincarésche Ungleichung): Für Funktionen v ∈ H01 (Ω) gilt die sog. Poin” carésche Ungleichung“ kvkΩ ≤ dΩ k∇vkΩ , (1.3.21) mit dem Durchmesser dΩ := diam(Ω) des Gebiets Ω . Beweis: Wir geben den Beweis nur in zwei Raumdimensionen. In höheren Dimensionen verläuft die Argumentation ganz analog. Sei Q eine Quadrat der Kantenlänge L = dΩ , in welchem das Gebiet Ω enthalten ist. O.B.d.A. sei das Koordinatensystem so verschoben und gedreht, daß Q = (0, L)×(0, L) . Für irgendein v ∈ H01 (Ω) sei (vk )k∈N ⊂ C0∞ (Ω) eine approximierende Folge. Mit v̂k bezeichnen wir die trivialen Fortsetzungen der vk auf Q : vk (x) für x ∈ Ω, v̂k (x) := 0 für x ∈ Q \ Ω. Diese sind dann ebenfalls in C0∞ (Q) . Wir setzen nun w := v̂k . Zunächst gilt in Punkten (x, y) ∈ Q : Z x ∂ξ w(ξ, y) dξ, w(x, y) = w(0, y) + 0 und folglich, bei Beachtung von w(0, y) = 0 , 2 |w(x, y)| ≤ L Z L 0 |∂ξ w(ξ, y)|2 dξ Integration zunächst über y ∈ (0, L) und danach über x ∈ (0, L) ergibt Z 0 LZ L 0 2 |w(x, y)| dy dx ≤ L 2 Z 0 LZ L 0 |∂ξ w(ξ, y)|2 dξ dy. Dies bedeutet kwkQ ≤ Lk∇wkQ . und wegen w = v̂k ≡ 0 auf Q \ Ω : kvk kΩ ≤ Lk∇vk kΩ . Für k → ∞ überträgt sich diese Beziehung durch Stetigkeit auf v ∈ H01 (Ω) . Q.E.D. Die variationelle Methode liefert auch die Existenz von Lösungen der 1. RWA des LaplaceOperators, wenn die Randwertvorgaben inhomogen sind. Im allgemeinen Fall findet man eine schwache Lösung v ∈ H 1 (Ω) . Wir haben gesehen, daß H 1 -Funktionen Singularitäten haben können. Es stellt sich also die Frage, in welchem Sinne die Randwerte von der schwachen“ ” Lösung überhaupt angenommen werden. 1.3 Hilfsmittel aus der Theorie von Funktionenräumen 29 Hilfssatz 1.3 (Spur-Lemma): Für Funktionen v ∈ C 1 (Ω) gilt die sog. Spur-Abschätzung“ ” kvkL2 (∂Ω) ≤ c(Ω) kvkH 1 (Ω) (1.3.22) mit einer Ω-abhängigen Konstante c(Ω) . Beweis: Zuerst betrachten wir den Spezialfall des Einheitsquadrats Ω = (0, 1) × (0, 1) . Sei v ∈ C 1 (Ω) . Für Punkte (0, y) ∈ ∂Ω gilt Z x ∂ξ v(ξ, y) dξ + v(x, y), x ∈ [0, 1]. v(0, y) = − 0 und folglich 2 |v(0, y)| ≤ Z 1 0 Z 2 |∂ξ v(ξ, y)| dξ + |v(x, y)| ≤ 2 1 0 |∂ξ v(ξ, y)|2 dξ + 2|v(x, y)|2 . Integration zunächst über y ∈ (0, 1) und dann über x ∈ (0, 1) liefert Z 0 1 2 |v(0, y)| dy ≤ 2 Z 0 1Z 1 0 2 |∂ξ v(ξ, y)| dξ dy + 2 Z 0 1Z 1 0 |v(x, y)|2 dy dx. Dieselbe Argumentation kann auch für die drei anderen Randkomponenten von Ω angewendet werden. Zusammenfassung der sich ergebenden Abschätzungen ergibt dann kvk2L2 (∂Ω) ≤ 8kuk2H 1 (Ω) . Die gezeigte Argumentation für das Einheitsquadrat läßt sich ohne Probleme für allgemeine Polygongebiete modifizieren. Im allgemeineren Fall eines krumm berandeten Gebiets Ω erhält man dasselbe Resultat mit Hilfe lokaler Transformationen, welche krumme Randstücke lokal gerade transformieren, so daß wieder das obige Argument angewendet werden kann. Q.E.D. Mit Hilfe des Spurlemmas können wir Funktionen v ∈ H 1 (Ω) eine Spur“ v|∂Ω ∈ L2 (∂Ω) ” zuordnen, was die Frage nach der Annahme von Randwerten durch die schwache Lösung der 1. RWA beantwortet. Sei v ∈ H 1 (Ω) und (vk )k∈N ⊂ C 1 (Ω) eine approximierende Folge. Aufgrund der Spurabschätzung gilt dann kvk − vl kL2 (∂Ω) ≤ c(Ω) kvk − vl kH 1 (Ω) , k, l ∈ N. Da die Norm auf der rechten Seite für k, l → ∞ gegen Null konvergiert, folgt, daß die Spuren vk|∂Ω (k ∈ N) auf ∂Ω eine Cauchy-Folge im Lebesgue-Raum L2 (∂Ω) bilden. Deren Limes v|∂Ω ∈ L2 (∂Ω) wird dann als die Spur“ der Funktion v ∈ H 1 (Ω) bezeichnet. In diesem Sinne ” nehmen schwache H 1 -Lösungen vorgegebene Randwerte an. Das Variationsargument liefert zunächst nur die Existenz einer schwachen“ Lösung u ∈ ” der Poisson-Gleichung. Um zu sehen, daß diese im Fall glatter“ Daten auch klassische“ ” ” Lösung ist, zeigt man (mit einigem Aufwand) u ∈ H m (Ω) für sukzessive ansteigendes m ≥ 2 . Hieraus kann dann geschlossen werden, daß u auch bis zur gewünschten Stufe klassisch differenzierbar ist. Dazu bedient man sich einer sog. Sobolewschen Ungleichung“. Zur Motivation ” sei zunächst der eindimensionale Fall betrachtet. H 1 (Ω) Beispiel 1.2: Wir betrachten das Intervall Ω = (0, 1) ⊂ R1 . Für eine Funktion u ∈ C 1 (Ω) 30 Theorie partieller Differentialgleichungen impliziert der Fundamentalsatz der Differential- und Integralrechnung, daß Z x u′ (ξ) dξ, x, y ∈ Ω. u(x) = u(y) + y Daraus folgt nach Integration über y ∈ [0, 1] : sup |u(x)| ≤ x∈Ω Z 0 1 ′ |u | dξ + Z 1 0 |u| dξ = kukH 1,1 (Ω) , mit der Norm des Sobolew-Raums H 1,1 (Ω) . Dies bedeutet, daß in einer Raumdimension eine H 1,1 -Funktion beschränkt ist. Darüber hinaus ist sie sogar stetig (genauer im L2 -Sinne äquivalent zu einer stetigen Funktion), was man mit Hilfe des üblichen Approximationsarguments erschließt. Hierfür reicht schon die L1 -Integrabilität der ersten Ableitung aus. In höheren Dimensionen ist die Situation komplizierter. Wir haben schon am Beispiel der Funktion v(x) = ln(ln(|x|−1 )+1) gesehen, daß Funktionen in H 1 (Ω) (im R2 ) i.a. unbeschränkt sein können und man ihnen folglich auch nicht überall Punktwerte zuordnen kann. Dies ist aber möglich für Funktionen in Sobolew-Räumen höherer Ordnung. Wir präsentieren hier als Beispiel den folgenden Sobolewsche Einbettungssatz“. ” Hilfssatz 1.4 (Sobolewsche Ungleichung): Für Funktionen v ∈ C 2 (Ω) gilt in zwei Raumdimensionen die Abschätzung sup |v(x)| ≤ c(Ω) kvkH 2 (Ω) (1.3.23) x∈Ω mit einer Ω-abhängigen Konstante c(Ω) . Beweis: Für den nicht trivialen Beweis verweisen wir auf die einschlägige Literatur über SobolewRäume (z.B.: Wloka (1982)). Q.E.D. Analog wie schon vorher bei der Spurabschätzung dient die Sobolewsche Ungleichung (1.3.23) zur Definition von Punktwerten von Funktionen in Sobolew-Räumen. Für ein v ∈ H 2 (Ω) sei wieder (vk )k∈N ⊂ C 2 (Ω) eine approximierende Folge. Mit der Sobolewschen Ungleichung (1.3.23) erschließen wir, daß (vk )k∈N auch Cauchy-Folge bzgl. der Maximumnorm ist. Folglich können für v ∈ H 2 (Ω) Punktwerte definiert werden durch v(x) := lim vk (x), k→∞ x ∈ Ω. In diesem Sinne besteht also eine ( stetige“) Einbettung H 2 (Ω) ֒→ C(Ω) . Die Abschätzung ” (1.3.23) läßt sich (im R2 ) übertragen auf die Normen der Sobolew-Räume H 2,1 (Ω) und H 1,p (Ω) für p > 2 . Folglich bestehen die stetigen Einbettungen H 2,1 (Ω) ∪ H 1,p (Ω) ֒→ C(Ω), p > 2, im R2 . Weitere Sobolewsche Ungleichungen führen auf die stetigen Einbettungen H 1 (Ω) ֒→ Lp (Ω) (1 ≤ p < ∞) im R2 , H 1 (Ω) ֒→ L6 (Ω) im R3 . (1.3.24) 1.3 Hilfsmittel aus der Theorie von Funktionenräumen 31 Von fundamentaler Bedeutung ist der sog. Rellichsche Auswahlsatz“. Wir formulieren hier nur ” eine einfache Variante, welche weiter unten benötigt wird. Hilfssatz 1.5 (Rellichscher Auswahlsatz): Die natürliche Einbettung des Sobolew-Raumes H 1 (Ω) in L2 (Ω) ist kompakt, d.h.: Aus jeder bzgl. der H 1 -Norm beschränkten Folge (vk )k∈N ⊂ H 1 (Ω) ⊂ L2 (Ω) läßt sich eine Teilfolge auswählen, welche in L2 (Ω) gegen einen Limes v konvergiert. Dieser Limes ist dann auch wieder in H 1 (Ω) . Beweis: Für den Beweis wird auf die Literatur verwiesen; z.B. Wloka (1982). Q.E.D. Der Rellichsche Auswahlsatz ist das Sobolew-Raum-Analogon des Auswahlsatzes von Arzelà-Ascoli für gleichgradig stetige“ Folgen stetiger Funktionen (siehe das Vorlesungsskriptum ” Numerische Mathematik I). 1.3.3 Elemente der Spektraltheorie elliptischer Operatoren Eine der wichtigsten Anwendungen des Rellichschen Auswahlsatzes findet sich in der Spektral” Theorie“ elliptischer Differentialoperatoren, speziell des Laplace-Operators. Wir wollen deren Elemente hier kurz entwickeln. Dabei haben wir vor allem deren Anwendung in der Lösungstheorie für parabolische ARWAn im Auge. Ferner werden wir später die numerische Lösung von Eigenwertaufgaben des Laplace-Operators mit Hilfe von Finite-Elemente-Verfahren untersuchen, wobei Resultate der Spektraltheorie benötigt werden. Wir haben gesehen, daß für jede rechte Seite f ∈ L2 (Ω) eine eindeutige schwache“ Lösung ” u ∈ H01 (Ω) der 1. RWA des Laplace-Operators existiert: −∆u = f in Ω, u|∂Ω = 0. (1.3.25) Diese ist bestimmt durch die variationelle Beziehung (∇u, ∇ϕ) = (f, ϕ) ∀ϕ ∈ H01 (Ω). (1.3.26) Die Zuordnung f 7→ Sf := u definiert dann einen linearen Operator S : L2 (Ω) 7→ L2 (Ω) , der in diesem Sinne als die L2 -Inverse“ des Laplace-Operators auf Ω unter Dirichlet-Randbedingungen ” bezeichnet werden kann. Der Beziehung k∇uk20 = (f, u) ≤ kf k0 kuk0 ≤ dΩ kf k0 k∇uk0 entnehmen wir, daß kSf k0 ≤ dΩ k∇Sf k0 ≤ d2Ω kf k0 , d.h.: Der Lösungsoperator S : L2 (Ω) 7→ L2 (Ω) ist beschränkt und wegen der kompakten Einbettung H 1 (Ω) ֒→ L2 (Ω) sogar kompakt. Wir haben schon gesehen, daß der Laplace-Operator als Operator im Hilbert-Raum L2 (Ω) symmetrisch und positiv-definit ist: (−∆u, v) = (∇u, ∇v) = (u, −∆v), 2 (−∆u, u) = k∇uk20 ≥ d−2 Ω kuk0 . Dies gilt für Funktionen u, v ∈ D(∆) im Definitionsbereich der L2 -Realisierung“ des Laplace” Operators, welcher definiert ist durch D(∆) := v ∈ H01 (Ω) : |(∇v, ∇ϕ)| ≤ c(v)kϕk0 , ϕ ∈ H01 (Ω) ⊂ L2 (Ω). 32 Theorie partieller Differentialgleichungen Für glatt berandete Gebiete oder konvexe Polygongebiete Ω kann man zeigen, daß D(∆) = H01 (Ω) ∩ H 2 (Ω) . Im Fall einspringender Ecken ist dagegen D(∆) 6⊂ H 2 (Ω) . Wir haben damit eine Realisierung des Laplace-Operator im Hilbert-Raum L2 (Ω) konstruiert, welche auf ihrem Definitionsbereich D(∆) symmetrisch ist, diesen ein-eindeutig auf ganz L2 (Ω) abbildet, also bijektiv ist und deren Inverse S = (−∆)−1 kompakt ist. Damit ist der Rahmen für die Anwendung abstrakter Resultate der Funktionalanalysis kompakter Operatoren geschaffen. Für das Eigenwertproblem des Laplace-Operators −∆w = λw in Ω, w|∂Ω = 0, (1.3.27) mit Eigenfunktion w ∈ H01 (Ω) und Eigenwert λ ∈ R gelten die folgenden Aussagen: – Es existieren nur relle, positive Eigenwerte 0 < λ1 ≤ ... ≤ λi ≤ ... , welche sich im Endlichen nicht häufen können. Die zugehörigen Eigenräume E(λi ) sind endlich dimensional. – Es existiert ein vollständiges Orthonormalsystem von Eigenfunktionen {wi )i∈N ⊂ L2 (Ω) , d.h.: Für jedes u ∈ L2 (Ω) gilt die L2 -konvergente Fourier13 -Entwicklung“ ” ∞ X (u, wi ) wi . (1.3.28) u= i=1 – Mit Hilfe der Eigenwerte λi (ihrer Vielfachheiten entsprechend oft gezählt) und zugehörigen (orthonormierten) Eigenfunktionen wi lassen sich allgemeine Funktionen des LaplaceOperators definieren. Sei Φ(z) eine meromorphe Funktion, so daß die Eigenwerte λi keine Pole sind. Dann wird durch Φ(−∆)u := ∞ X Φ(λi )(u, wi ) wi (1.3.29) i=1 ein linearer Operator in L2 (Ω) erklärt. Wenn Φ(z) beschränkt ist, wird auch Φ(−∆) beschränkt und ist auf ganz L2 (Ω) erklärt. Diese Aussagen zeigen die starke Parallelität zwischen kompakten Operatoren bzw. von (dicht definierten) Operatoren mit kompakter Inverser im Hilbert-Raum und durch (n × n)-Matrizen dargestellte linearen Abbildungen des Rn . 13 Jean-Baptiste Baron de Fourier (1768-1830): französischer Mathematiker und Physiker; Mitglied der Pariser Akademie lehrte an der École Polytechniqe; begleitete Napoleon auf seinem Feldzug nach Ägypten; zählt zu den bedeutendsten Mathematikern des 19. Jahrhunderts; fand bei seinen Arbeiten zur Theorie der Wärmeleitung die Darstellbarkeit periodischer Funktionen durch triginometrische Reihen. 1.4 Parabolische Probleme 33 1.4 Parabolische Probleme Die sog. eindimensionale Wärmeleitungsgleichung“ ” ∂t u = ∂x2 u, (1.4.30) oder allgemeiner in höheren Ortsdimensionen ∂t u − ∆u = f, (1.4.31) wird üblicherweise auf Zylindern QT := Ω × I des Orts/Zeit-Raumes betrachtet. Dabei sind Ω ⊂ Rd ein Ortsgebiet und I := (0, T ] ein Zeitintervall. Im örtlich eindimensionalen Fall (d = 1) ist die natürliche Anfangskurve Γ = {(x, t) ∈ R2 : t = 0} gerade Charakteristik, so daß das zugehörige Cauchysche Anfangswertproblem i.a. nicht lösbar ist. Entlang Γ dürfen, wie wir noch sehen werden, nur Anfangsbedingungen an u selbst gestellt werden: u|t=0 = u0 (x). Entlang eines nicht-charakteristischen örtlichen“ Randes {(x, t) ∈ Rd+1 : x ∈ ∂Ω, t > 0} gilt ” dagegen dasselbe wie im elliptischen Fall, d.h.: Die zugehörige Anfangswertaufgabe ist lösbar, doch dürfen nur u oder ∂n u vorgeschrieben werden, wenn man stetige Abhängigkeit von den Randdaten gewährleisten will. Analog zum elliptischen Fall bieten sich drei verschiedene Typen von Randbedingungen entlang des örtlichen Randes ∂Ω × I für die Anfangs-Randwert-Aufgabe (kurz ARWA“) der ” Wärmeleitungsgleichung an. Zusätzlich zu der Anfangsbedingung u|t=0 = u0 (1.4.32) wird gefordert: a) Dirichletsche Randbedingungen ( 1. ARWA“): u = g auf ∂Ω × I ; ” b) Neumannsche Randbedingungen ( 2. ARWA“): ∂n u = g auf ∂Ω × I ; ” c) Robinsche Randbedingungen ( 3. ARWA“): ∂n u + αu = g auf ∂Ω × I . ” Die Randfunktionen g werden i.a. als glatt und α ≥ 0 angenommen. Alle diese ARWAn sind, wie wir zum Teil zeigen werden, unter geeigneten Zusatzbedingungen an die Daten ebenfalls wohl gestellt. Unter einer klassischen Lösung“ verstehen wir eine Funktion u ∈ C(Q̄T ) ∩ C 2 (QT ) , ” welche der Differentialgleichung sowie den Anfangs- und Randbedingungen genügt. Ähnlich wie bei elliptischen Problemen gibt es auch im parabolischen Fall den Begriff der schwachen ” Lösung“, den wir hier aber wegen seiner Kompliziertheit nicht definieren wollen. Zunächst diskutieren wir die Eindeutigkeitsfrage. Seien u(1) , u(2) wieder zwei klassische (analog zum elliptischen Fall definiert) Lösungen der 1. ARWA des Wärmeleitungsoperators, für die k∇u(i) (t)kΩ existiert und beschränkt ist. Für die Differenz w := u(1) − u(2) gilt dann ∂t w − ∆w = 0 in Ω × I, w|t=0 = 0, w|∂Ω = 0. Multiplikation mit w , Integration über Ω und anschließende partielle Integration im Ort ergeben analog zum elliptischen Fall 0 = (∂t w, w) − (∆w, w) = 12 dt kwk2 + k∇wk2 . Dies impliziert, daß kw(t)k ≤ kw(0)k = 0 für t ≥ 0, und somit die Eindeutigkeit der Lösung 34 Theorie partieller Differentialgleichungen und darüber hinaus deren stetige Abhängigkeit von den Anfangsdaten. Die Existenzfrage läßt sich im Prinzip mit ähnlichen Methoden behandeln wie im elliptischen Fall. Wir wollen das hier aus Zeitgründen nicht weiter verfolgen. Im örtlich eindimensionalen Spezialfall Ω = (−∞, ∞) und f ≡ 0 läßt sich die Lösung der Anfangswertaufgabe explizit angeben: Z ∞ 2 √ 1 e−(x−s) /4t u0 (s) ds. (1.4.33) u(x, t) = 4πt −∞ Dies wird durch Nachrechnen verifiziert, wobei speziell auf die Existenz der auftretenden Integralterme zu achten ist. Man beachte, daß durch den Ansatz s(x, t) = 2 √ 1 e−x /4t 4πt eine spezielle Lösung der Wärmeleitungsgleichung gegeben ist. Im Fall allgemeinerer, beschränkter Ortsgebiete Ω ⊂ Rd gewinnt man eine zu (1.4.33) korrespondierende Lösungsdarstellung mit Hilfe der Methode der Variablenseparation“. Einsetzen ” des Lösungsansatzes u(x, t) = v(x)ψ(t) in die Wärmeleitungsgleichung ergibt ψ ′ (t)v(x) = ψ(t)∆v(x) ∆v(x) ψ ′ (t) = ≡ konst. , ψ(t) v(x) ⇒ für alle Argumente (x, t) ∈ QT . Die Separationsfaktoren v(·) ∈ C(Ω) ∩ C 2 (Ω) , v|∂Ω = 0 , und ψ(·) ∈ C(I) sind also notwendig Lösungen der Eigenwertprobleme −∆v(x) = λv(x) , x ∈ Ω , −ψ ′ (t) = λψ(t) , t ≥ 0 , unter den Nebenbedingungen v|∂Ω = 0 bzw. ψ(0) = 1 , mit Parametern λ ∈ R. Die Eigenwertaufgabe für v(x) besitzt, wie schon oben diskutiert, eine abzählbare Folge von Lösungen λj > 0 und vj : −∆vj = λj vj (j = 1, 2, 3, ...).. Die Eigenfunktionen (vj )j∈N bilden ein vollständiges Orthonormal-System im Raum L2 (Ω) der auf Ω Lebesgue-meßbaren und quadratintegrablen Funktionen. Die zugehörigen Lösungen für ψ(t) sind ψj (t) = e−λj t . Die Anfangsfunktion besitzt die (verallgemeinerte) Fourier-Entwicklung: 0 u (x) = ∞ X u0j vj (x) , u0j = j=0 Z u0 (x)vj (x) dx . I Durch Superposition der Einzellösungen für j ∈ N , u(x, t) := ∞ X u0j vj (x)e−λj t , (1.4.34) j=1 erhalten wir folglich eine Lösung der Wärmeleitungsgleichung, welche den Randbedingungen und insbesondere den Anfangsbedingungen genügt. (Zum Nachweis überprüfe man die Konvergenz der Reihen der jeweils nach x sowie t abgeleiteten Einzellösungen.) Im eindimensionalen 1.4 Parabolische Probleme 35 Spezialfall Ω = (0, 1) ⊂ R1 ist gerade vj (x) = αj sin(jπx) , λj = j 2 π 2 , Z αj = sin2 (jπx) dx I −1/2 (j ∈ N), und die Lösungsdarstellung erhält die explizite Form u(x, t) = ∞ X u0j αj sin(jπx)e−aj 2 π2 t (1.4.35) j=1 Anhand dieser Lösungsdarstellungen lassen sich einige wichtige Eigenschaften der ARWA der Wärmeitungsgleichung ablesen. Wie bei AWAn gewöhnlicher Differentialgleichungen entwickelt sich die Lösung ausgehend vom Anfangswert in der Zeit. Der adäquate numerische Ansatz wird also wieder ein Teilschrittverfahren in der Zeit sein. Im Ort pflanzen sich Störungen wie im elliptischen Fall unendlich schnell“ fort. Irregularitäten in den Anfangs- oder Randdaten werden ” sofort ausgeglättet, d.h.: im Innern des Zylindergebiets QT := Ω×(0, T ] ist die Lösung (im Falle glatter rechter Seite f ) stets glatt. Im folgenden wollen wir einige qualitative Eigenschaften von Lösungen der Wärmeleitungsgleichung diskutieren. Die Wärmeleitungsgleichung wird u.a. verwendet, um (ihrem Namen entsprechend) Wärmeausbreitungs- bzw. allgemein instationäre Diffusionsvorgänge zu beschreiben. Es ist daher wichtig, garantieren zu können, daß ihre Lösungen bei kompatiblen Daten auch stets positiv sind. Dies wird durch ein (dem elliptischen Fall ähnliches) Maximumprinzip geleistet. t T Ω x (0, T] Ω x (0, T] x Ω x {0} Abbildung 1.4: Parabolisches Raum-Zeit-Gebiet Satz 1.1 (Parabolisches Maximumprinzip): Für jede klassische Lösung der WärmeleitungsUngleichung ∂t u − ∆u ≤ 0 in Ω, (1.4.36) gilt das sog. Maximumprinzip“, d.h.: Sie nimmt im (halboffenen) Zylinder QT := Ω × (0, T ] ” kein striktes Maximum an. Beweis: Wir geben den Beweis nur für eine Raumdimension. Die Verallgemeinerung für höhere Dimensionen ist dann evident. Für eine Lösung u der Wärmeleitungs-Ungleichung setzen wir 36 Theorie partieller Differentialgleichungen vε := u − εt, mit beliebigem ε > 0. Da vε stetig auf Q̄T ist, nimmt es in einem Punkt (x0 , t0 ) ∈ Q̄T sein Maximum an. Angenommen, (x0 , t0 ) ∈ QT . Dann gilt ∂x2 vε (x0 , t0 ) ≤ 0 , und folglich ∂t vε (x0 , t0 ) ≤ ∂t vε (x0 , t0 ) − ∂x2 vε (x0 , t0 ) = ∂t u(x0 , t0 ) − ε − ∂x2 u(x0 , t0 ) ≤ −ε. Aus Stetigkeitsgründen ist dann auch ∂t vε (x0 , t) ≤ − 12 ε für t0 −h ≤ t ≤ t0 , mit einem geeigneten h > 0. Hiermit folgern wir, daß Z t0 ∂t vε (x0 , t) dt ≤ − 12 εh < 0. vε (x0 , t0 ) − vε (x0 , t0 − h) = t0 −h Dies führt auf den Widerspruch vε (x0 , t0 ) < vε (x0 , t0 − h). Also nimmt vε notwendig sein Maximum für t = 0 an. Da ε > 0 beliebig klein gewählt werden darf, gilt diese Aussage auch für den (stetigen) Grenzfall ε = 0 , d.h. für die Lösung u . Q.E.D. Als Konsequenz des parabolischen“ Maximumprinzips sehen wir insbesondere, daß eine Lösung ” der (homogenen) Wärmeleitungsgleichung ∂t u − ∆u = 0 in Ω, u = 0 auf ∂Ω, (1.4.37) zu nicht-negativen Anfangsdaten u0 ≥ 0 (u|∂Ω = 0) nicht-negativ bleibt für alle t ≥ 0 : u0 ≥ 0 ⇒ 0 ≤ u(x, t) ≤ maxΩ u0 , (x, t) ∈ QT . (1.4.38) Ferner sind wieder klassische“ Lösungen u ∈ C(Q̄T ) ∩ C 2 (QT ) eindeutig bestimmt. ” Satz 1.2 (Globale Beschränktheit): Für jede Lösung der inhomogenen Wärmeleitungsgleichung (1.4.31) gilt die a priori Abschätzung ku(t)k ≤ e−λt ku0 k + λ−1 sup kf k, (1.4.39) [0,t] mit dem kleinsten Eigenwert λ > 0 des elliptischen Operators −∆ auf Ω zu homogenen Dirichlet-Randbedingungen. Beweis: Wir betrachten die beiden Hilfsprobleme ∂t v − ∆v = 0 in QT , ∂t w − ∆w = f in QT , v|∂Ω = 0, v|t=0 = u0 , w|∂Ω = 0, w|t=0 = 0. (1.4.40) (1.4.41) Offenbar ist dann u = v + w wegen der Linearität des Wärmeleitungsoperators (Superpositionsprinzip). Wir schätzen nun die beiden Lösungsanteile v und w separat ab. (i) Multiplikation von (1.4.40) mit v und Integration im Ort ergibt 2 1 2 dt kvk + k∇vk2 = 0. Wir multiplizieren dies mit e2λt und finden 2λt 1 kvk2 + e2λt k∇vk2 − λe2λt kvk2 = 0. 2 dt e 1.4 Parabolische Probleme 37 Wegen λkvk2 ≤ k∇vk2 impliziert dies dt e2λt kvk2 ≤ 0 , und Integration bzgl. t ergibt e2λt kv(t)k2 ≤ ku0 k2 bzw. wieder kv(t)k ≤ e−λt ku0 k. (ii) Multiplikation von (1.4.41) mit w und Integration im Ort ergibt 2 1 2 dt kwk + k∇wk2 = (f, w) ≤ 12 λkwk2 + 21 λ−1 kf k2 . Mit Hilfe von λkwk2 ≤ k∇wk2 folgern wir dt kwk2 + k∇wk2 ≤ λ−1 kf k2 . Wir multiplizieren diese Ungleichung nun mit eλt und finden dt eλt kwk2 + eλt k∇wk2 − λeλt kwk2 ≤ λ−1 eλt kf k2 , bzw. dt eλt kwk2 ≤ λ−1 eλt kf k2 . Integration bzgl. t ergibt λt 2 −1 Z t eλs kf k2 ds, Z t kw(t)k2 ≤ λ−1 e−λt eλs kf k2 ds. e kw(t)k ≤ λ 0 0 Die Abschätzung −λt e Z t 0 impliziert dann kw(t)k ≤ behauptete Abschätzung. λ−1 max [0,t] kf k . eλs ds ≤ λ−1 . Kombination der Resultate für v und w liefert die Q.E.D. Als Folgerung aus diesem Satz ersehen wir insbesondere, daß bei einem parabolischen Problem der Einfluß der Anfangsdaten exponentiell mit der Zeit abklingt. Weiter interessiert das Lösungsverhalten für Anfangsdaten u0 mit minimaler Regularität. Satz 1.3 (Glättungseigenschaft): Für jede Lösung der homogenen Wärmeleitungsgleichung (1.4.31) mit f ≡ 0 gelten die a priori Abschätzungen k∂t u(t)k + k∆u(t)k ≤ k∆u0 k, k∂t u(t)k + k∆u(t)k ≤ t −1 0 ku k, t ≥ 0, t > 0, (1.4.42) (1.4.43) vorausgesetzt, der Anfangswert u0 besitzt die erforderliche Regularität. Beweis: Wir bedienen uns zum Beweis der sog. Spektral-Methode“, welche aber auf symmetri” sche und autonome (d.h. nicht explizit von der Zeit abhängige) Operatoren beschränkt ist. Alternative Zugänge sind die Halbgruppen-Methode“, welche nicht die Symmetrie des Operators ” 38 Theorie partieller Differentialgleichungen erfordert, sowie die Energie-Methode“, welche im allgemeinen Fall und sogar für nichtlineare ” Probleme anwendbar ist. Aus der Lösungsdarstellung (1.4.34) mit dem Orthonormalsystem von Eigenfunktionen {vj }j∈N des Laplace-Operators, u(x, t) := ∞ X u0j vj (x)e−λj t , j=1 folgern wir ∂t u(x, t) = ∆u(x, t) := − ∞ X u0j λj vj (x)e−λj t . j=1 Aufgrund der (verallgemeinerten) Parsevalschen14 Identität gilt demnach k∂t uk2 = k∆uk2 = ∞ X (u0j )2 λ2j e−2λj t . j=1 Als erstes Resultat entnehmen wir dieser Beziehung, daß k∂t uk2 = k∆uk2 ≤ ∞ X j=1 (u0j )2 λ2j = k∆u0 k2 . Hieraus folgt wegen xe−x ≤ 1, x ≥ 0, : k∂t uk2 = k∆uk2 = t−2 ∞ ∞ X X (u0j )2 = t−2 ku0 k2 , (u0j )2 (λj t)2 e−2λj t ≤ t−2 j=1 j=1 was den Beweis vervollständigt. Q.E.D. Als Folgerung aus diesem Satz finden wir nochmal bestätigt, daß die Wärmeleitungsgleichung die Glättungseigenschaft“ besitzt, d.h.: Irregularitäten in den Anfangsdaten werden für t > 0 ” ausgeglättet. Durch Weiterführung der Argumentation im Beweis von Satz 1.3 lassen sich analog beliebig hohe Ableitungen der Lösung abschätzen: k∂tp u(t)k + k∇2p u(t)k ≤ c(p) k∆p u0 k, t ≥ 0, (1.4.44) t > 0, p ∈ N. (1.4.45) sowie k∂tp u(t)k + k∇2p u(t)k ≤ c(p) t−p ku0 k, 14 Mare-Antoine Parseval des Chênes (1755-1836): französischer Mathematiker; Privatgelehrter; Beiträge zu Reihen, insbesondere Fourier-Reihen. 1.5 Hyperbolische Probleme 39 1.5 Hyperbolische Probleme Die Wellengleichung ∂t2 u − ∆u = 0 (1.5.46) wird in der Regel wieder auf einem Zylindergebiet QT := Ω × I mit einem (meist beschränkten) Gebiet Ω ⊂ Rd und einem Intervall I = (0, T ] betrachtet. Die Frage nach der Wohlgestelltheit zugehöriger Anfangs-Randwertaufgaben wollen wir nur für den örtlich eindimensionalen Fall diskutieren. Die charakteristischen Steigungen der (örtlich) eindimensionalen Wellengleichung ∂t2 u = ∂x2 u (1.5.47) sind gerade gegeben durch dt/dx = ±1, d.h.: die Charakteristiken sind alle Geraden in der (x, t)Ebene mit der Steigung ±1. Die natürliche Anfangskurve Γ := {(x, t) : x ∈ Ω, t = 0} ist also keine Charakteristik, so daß gemäß der Theorie die zugehörige Cauchysche Anfangswertaufgabe bei Vorgabe von Werten u(x, 0) = u0 (x) und ∂t u(x, 0) = u1 (x) lösbar ist. Diese Lösung läßt sich im Fall einer Raumdimension leicht angeben. Wir betrachten den Sonderfall Ω = R1 . t t0 (x0, t0) B(x0, t0) A(x0, t0) x x0 Abbildung 1.5: Hyperbolisches Raum-Zeit-Gebiet Die Koordinatentransformation ξ = x + t, η = x − t überführt die Wellengleichung in die Form ∂ξ ∂η u = 0. Diese hat die Lösungen der Form u(ξ, η) = F (ξ) + G(η) mit beliebigen, hinreichend glatten Funktionen F (·) und G(·). Die allgemeine Lösung der Wellengleichung lautet demnach u(x, t) = F (x + t) + G(x − t). Zur Erfüllung der Anfangsvorgaben auf Γ muß nun gelten: F (x) + G(x) = u0 (x), F ′ (x) − G′ (x) = u1 (x). 40 Theorie partieller Differentialgleichungen Hieraus entnehmen wir, daß F (x + t) + G(x + t) + F (x − t) + G(x − t) = u0 (x + t) + u0 (x − t), Z x+t F (x + t) − G(x + t) − F (x − t) + G(x − t) = u1 (s) ds, (1.5.48) (1.5.49) x−t und folglich, u(x, t) = 1 2 n 0 0 u (x + t) + u (x − t) + Z x+t x−t o u1 (s) ds . Dies ist die (eindeutige) klassische Lösung der Wellengleichung zu den vorgegebenen Anfangsdaten u0 (x), u1 (x) . Eine analoge Konstruktion ist auch in höheren Raumdimensionen möglich. Die Form der Lösung u(x, t) zeigt, daß bei einem hyperbolischen Problem die Ausbreitungsgeschwindigkeit von Information endlich ist. Lokale Störungen pflanzen sich entlang der Charakteristiken (Geraden mit Steigung ±1 ) fort. Insbesondere erzeugen unstetige Anfangsdaten notwendig auch unstetige Lösungen. Dies erfordert im Falle irregulärer Anfangs- oder Randdaten einen neuartigen Lösungsbegriff, der auch Unstetigkeiten zuläßt. Für jeden Punkt (x0 , t0 ) ∈ QT gibt es demnach einen Abhängigkeitsbereich“ A(x0 , t0 ) sowie einen Bestimmtheitsbereich“ ” ” B(x0 , t0 ) , innerhalb deren sich das Anfangswertproblem unabhängig vom restlichen Bereich lösen läßt: A(x0 , t0 ) := {x ∈ R : |x − x0 | ≤ t0 }, B(x0 , t0 ) := {(x, t) ∈ R × R+ : |x − x0 | ≤ t}. Die Eindeutigkeit von Lösungen der Wellengleichung erschließt man wieder am leichtesten mit Hilbertraum-Argumenten“. Sei u(x, t) eine klassische Lösung der ARWA ” ∂t2 u = ∆u in Ω, u|t=0 = u0 , ∂t u|t=0 = u1 , u|∂Ω = 0, (1.5.50) mit endlicher Energie“ (kinetische + potentielle Energie) ” E(t) := k∂t u(t)k2Ω + k∇u(t)k2Ω < ∞. Multiplikation der Differentialgleichung mit ∂t u , Integration über Ω und anschließende partielle Integartion ergibt 0 = (∂t2 u − ∆u, ∂t u) = 12 dt k∂t uk2 + k∇uk2 . Dies impliziert, daß k∂t u(t)k2 + k∇u(t)k2 = ku1 k2 + k∇u0 k2 , (1.5.51) d.h. die Lösung ist eindeutig und hängt bzgl. der natürlichen Energie-Norm stetig von den Anfangsdaten ab. Ferner bleibt die Gesamtenergie E(t) im System in der Zeit erhalten. Dies entspricht der Vorstellung, daß bei einem Schwingungsprozeß, etwa der Schwingung eines elastischen Körpers oder einer Schallwelle, bei Vernachlässigung von Dämpfung im Verlaufe der Zeit keine Energie verloren geht. Ein gutes“ Diskretisierungsverfahren für die Wellengleichung sollte ” diese kritische Eigenschaft möglichst gut wiedergeben. 1.6 Übungen 41 1.6 Übungen Übung 1.1: Gegeben sei die Anfangswertaufgabe (AWA) einer skalaren gew. Differentialgleichung u′ (t) = f (t, u(t)), t ≥ t0 , u(t0 ) = u0 , mit einer analytischen Funktion f (t, x) mit gleichmäßig beschränkten Ableitungen sup k∂tj ∂xk f (t, ·)k∞ ≤ K < ∞, j,k≥0 t ≥ t0 , (z.B. die Funktion f (t, x) := sin(x) ). Man zeige, daß man durch den Taylor-Ansatz u(t) = u0 + ∞ X f (k−1) (t0 , u0 ) k=1 k! (t − t0 )k mit f (r) (t0 , u0 ) := (d/dt)r f (t, u(t))|t=t0 eine globale (d.h. für alle t ≥ t0 existierende) Lösung der AWA erhält. Übung 1.2: In der Vorlesung wurde die Typeneinteilung von linearen Differentialoperatoren 2. Ordnung mit der Aufgabe motiviert, aus gegebenen Werten u(x0 , y0 ) und ∂n u(x0 , y0 ) entlang einer Kurve Γ die Lösung u(x, y) über einen Taylor-Reihenansatz zu bestimmen. Diese Konstruktion wurde allerdings nur bis zu den drei zweiten Ableitungen ∂x2 u(x0 , y0 ) , ∂x ∂y u(x0 , y0 ) und ∂y2 u(x0 , y0 ) durchgeführt und hing von der Regularität einer gewissen Matrix A ab. Man zeige, daß nach Bestimmung der zweiten Ableitungen die Konstruktion der vier dritten Ableitungen ∂x3 u(x0 , y0 ) , ∂x2 ∂y u(x0 .y0 ) , ∂x ∂y2 u(x0 , y0 ) und ∂y3 u(x0 , y0 ) auf dieselbe Matrix A führt. Diese Aussage gilt auch für die weiteren, höheren Ableitungen. Die Vorgenommene Klassifizierung des Differentialoperators als elliptisch, parabolisch oder hyperbolisch basierend auf der Konstruierbarkeit der Lösung aus den Randdaten ist also sinnvoll. Übung 1.3: Man bestimme den Typ der Differentialgleichungen a) ∂x ∂y u − ∂x u = 0, b) ∂x2 u + ∂x ∂y u + y∂y2 u + 4u = 0, c) 2(∂x + ∂y )2 u + ∂y u = 0. (Hinweis: Das in der Vorlesung angegebene Kriterium für den Typ einer Gleichung kann auch bei variablen Koeffizienten separat in jedem einzelnen Ortspunkt verwendet werden.) Übung 1.4: Eine (skalare) lineare partielle Differentialgleichung (PDE) 2. Ordnung der Form a11 ∂12 u + a12 ∂1 ∂2 u + a21 ∂2 ∂1 u + a22 ∂22 u = f läßt sich durch Setzung u1 := ∂1 u, u2 := ∂2 u in ein System von PDE 1. Ordung umformen: ∂2 u1 − ∂1 u2 = 0, a11 ∂1 u1 + a12 ∂1 u2 + a21 ∂2 u1 + a22 ∂2 u2 = f. 42 Theorie partieller Differentialgleichungen Man zeige, daß sich die in der Vorlesung für (skalare) lineare PDE 2. Ordnung durchgeführte Typeneinteilung analog auch für Systeme 1. Ordnung der allgemeinen Form b111 ∂1 u1 + b112 ∂1 u2 + b121 ∂2 u1 + b122 ∂2 u2 = f1 , b211 ∂1 u1 + b212 ∂1 u2 + b221 ∂2 u1 + b222 ∂2 u2 = f2 , vornehmen läßt (mit analogen Resultaten). Ziel ist dabei die Bestimmung von Kurven Γ ⊂ R2 , bei denen die Vorgabe von Anfangswerten für u1 und u2 entlang Γ die Konstruktion aller Ableitungen von u1 und u2 , beginnend mit den zweiten Ableitungen ∂12 u1 , ∂1 ∂2 u1 , ∂22 u1 , ∂12 u2 , ∂1 ∂2 u2 , ∂22 u2 und damit einen Taylor-Reihenansatz für die Lösung erlaubt. (Bem.: Wenn die Konstruktion von u1 und u2 auf diesem Wege möglich ist, erhält man für die gegebene PDE 2. Ordnung dann durch weitere Vorgabe von u entlang Γ aus der Kenntnis von ∂1 u = u1 und ∂2 u = u2 im ganzen Lösungsgebiet dort auch eine Lösung u durch einfaches Aufintegrieren.) Übung 1.5: In der Vorlesung wurde die Poincarésche Ungleichung Z Z 2 2 k∇u(x)k2 dx, dG := diam(G), |u(x)| dx ≤ dG G G nur für Funktionen u ∈ V0 (G) formuliert, d.h. welche auf dem ganzen Rand ∂G null sind. Der Beweis funktioniert aber auch für Funktionen, die nur entlang eines Teils Γ ⊂ ∂G des Randes mit Länge |Γ| = 6 0 null sind, d.h. auf dem Raum V0 (Γ; G) := {v ∈ C 1 (G) ∩ C(G) : ∇v ∈ L2 (G)n , v|Γ = 0}. (i) Man führe den Beweis dieser Verallgemeinerung der Poicaréschen Ungleichung für das Einheitsquadrat Q = (0, 1)2 ⊂ R2 und den Randteil Γ := {x = (x1 , 0) : 0 ≤ x1 ≤ 1} . (ii) Kann die Poincareśche Ungleichung gültig bleiben, wenn der Randteil Γ ⊂ ∂G trivial ist, etwa nur aus einem Punkt besteht? Man untersuche diese Frage anhand der in (i) gegebenen Situation mit Γ := {(0, 0)} . Welche Konsequenzen hat die Antwort auf diese Frage für die 1. RWA des Laplace-Operators? (Hinweis: Man betrachte die Folge der Funktionen uk (r, θ) = r 1/k .) Übung 1.6: Auf einem beschränkten Gebiet Ω ⊂ Rn mit glattem Rand ∂Ω werden die folgende (a) zweite und (b) dritte Randwertaufgabe betrachtet: (a) (b) − ∆u + au = f in Ω, − ∆u + au = f in Ω, ∂n u = g auf ∂Ω, ∂n u + αu = g auf ∂Ω, mit Konstanten a > 0 und α ≥ 0 . Man zeige, daß diese RWAn jeweils höchstens eine “klassische” Lösung u ∈ C 2 (Ω) ∩ C 1 (Ω) haben können. Welches Problem ergibt sich im Fall a = 0 , d.h. für den reinen Laplace-Operator? Übung 1.7: Für die klassische Lösung der Randwertaufgabe −∆u = 1 in Ω, u = 0 auf ∂Ω, auf einem glatt berandetem Gebiet Ω ⊂ Q1 := {(x, y) ∈ R2 | 0 < x, y < 1} zeige man mit Hilfe des Maximumprinzips die Einschließung 0 ≤ u(x) ≤ 18 . (Hinweis: Man vergleiche u mit der 1.6 Übungen 43 quadratischen Funktion v = 41 x(1 − x) + 14 y(1 − y) .) Übung 1.8: Der Laplace-Operator ∆ = div grad hat für Funktionen u = u(r, θ) in Polarkoordinaten (r, θ) ∈ [0, ∞) × [0, 2π] die folgende Form: ∆u = (∂r2 + r −1 ∂r + r −2 ∂θ2 )u. (i) Für ein ω ∈ (0, 2π] sei Sω := {(r, θ) : r > 0, θ ∈ (0, ω)} der zugehörige Sektor der (x, y)Ebene. Man zeige, daß die auf dem Gebiet G := Sω ∩ K1 (0) definierte Funktion sω (r, θ) := r π/ω sin(θπ/ω) harmonisch ist, d.h. ∆sω ≡ 0 , und den Randbedingungen sω (r, 0) = sω (r, ω) = 0 sowie sω (1, θ) = sin(θπ/ω) genügt. (ii) Man zeige, daß im Fall π < ω ≤ 2π , d.h. im Fall eines stumpfen Innenwinkels, die ersten Ableitungen dieser Funktion zwar unbeschränkt aber noch (uneigentlich) quadrat-integrabel sind, daß ihre zweiten Ableitungen aber nicht mehr quadrat-integrabel sind. Wie sieht das bei spitzen Innenwinkeln, d.h. 0 < ω < π , aus? Dieses Beispiel zeigt, daß klassische Lösungen von elliptischen RWAn auch zu glatten Daten am Gebietsrand nicht regulär zu sein brauchen. Übung 1.9: Man untersuche, ob die folgenden Funktionen auf dem Einheitsquadrat Ω = {(x, y) ∈ R2 | 0 < x, y < 1} im Sobolew-Raum H 1 (Ω) liegen: a) u(x, y) = |x − y|1/2 , 1/2 b) u(x, y) = sin ln(1/r) , r = x2 + y 2 . (Hinweis: Man untersuche die “uneigentliche” Riemann-Integrabilität der Ableitungen.) Übung 1.10: Man zeige, daß für Funktionen u ∈ H 1 (Ω) unter der Mittelwertbedingung Z u(x) dx = 0 Ω ebenfalls die Poincarésche Ungleichung gilt (mit einer Konstante cΩ ): kukΩ ≤ cΩ k∇ukΩ . (Hinweis: Zum Beweis gibt es zwei alternative Wege: Modifikation des direkten Beweises aus der Vorlesung unter Verwendung von “Randwerten” u|Γ = 0 , oder Widerspruchsargument unter Verwendung des Rellichschen Auswahlsatzes.) Übung 1.11: Auf welchem der folgenden Gebiete ist die RWA −∆u = 0 in Ω, u|∂Ω = 0, wohl gestellt, d.h. besitzt eine eindeutige schwache Lösung u ∈ H01 (Ω) (mit Begründung)? 44 Theorie partieller Differentialgleichungen a) gepunktete Kreisscheibe Ω = {x ∈ R2 | 0 < |x| < 1} ⊂ R2 ; b) geschlitzte Kreisscheibe Ω = {x ∈ R2 | |x| < 1} \ Γ, Γ := {x ∈ R2 | − 1 2 ≤ x1 ≤ 21 , x2 = 0 } ⊂ R2 . Übung 1.12: Man gebe eine variationelle Formulierung der folgenden Randwertaufgabe an: −∆u + u = f in Ω, ∂n u + u|∂Ω = g, und begründe, daß deren Lösung im Falle ausreichender Glattheit die RWA löst. Übung 1.13: Welche von den folgenden Sobolewschen Ungleichungen sind richtig? a) b) c) d) kukL∞ (Ω) ≤ c kukH 2 (Ω) , u ∈ H 2 (Ω), Ω ⊂ R3 ; kukL∞ (Ω) ≤ c kukH 1 (Ω) , u ∈ H 1 (Ω), Ω ⊂ R2 ; kukL∞ (Ω) ≤ c kukH 1,1 (Ω) , kukL1 (∂Ω) ≤ c kukH 1,1 (Ω) , u ∈ H 1,1 (Ω), Ω ⊂ R1 ; u ∈ H 1,1 (Ω), Ω ⊂ R2 . Man erkläre die Bedeutung der verwendeten Funktionenräume und Normen. 2 Differenzen-Verfahren für elliptische Probleme In diesem Kapitel werden wir zunächst die klassischen Differenzenapproximationen zur Lösung elliptischer Randwertaufgaben diskutieren. Der Übersichtlichkeit halber beschränken wir uns dabei auf das Modellproblem der Poisson-Gleichung in zwei Raumdimensionen mit Dirichletschen Randbedingungen, d.h. auf die 1. RWA: Lu := −∆u = f in Ω, u = g auf ∂Ω. (2.0.1) Das Definitionsgebiet Ω ⊂ R2 wird zunächst wieder als glatt berandet oder als konvexes Polygongebiet vorausgesetzt. Die Problemdaten f, g sind ebenfalls glatt, so daß die im vorigen Kapitel beschriebenen Resultate anwendbar sind. Erweiterungen für Probleme mit variablen Koeffizienten oder anderen Randbedingungen sowie auf den dreidimensionalen Fall werden gegebenenfalls in Bemerkungen berücksichtigt. 2.1 Allgemeine Differenzenapproximationen Zur Definition einer sog. Differenzenapproximation“ der RWA wird das Lösungsgebiet Ω durch ” ein endliches (nicht notwendig äquidistantes oder kartesisches) Punktgitter überdeckt. Wir definieren disjunkte Punktmengen Ωh := { innere” Gitterpunkte in Ω}, ” ∂Ωh := { Rand-Gitterpunkte” nahe bei ∂Ω}, ” und setzen Ωh := Ωh ∪ ∂Ωh . Welche Punkte zu ∂Ωh gehören, hängt von der Eigenart der gewählten Differenzenapproximation ab; im folgenden werden verschiedene Beispiele betrachtet. Der Parameter h > 0 beschreibt wie üblich die Feinheit” des Gitters Ωh , d.h. so etwas wie den ” mittleren Abstand benachbarter Gitterpunkte. Die Gitterpunkte in ∂Ωh seien ähnlich dicht verteilt wie die in Ωh . Die Differentialgleichung wird nun in den Punkten in Ωh betrachtet und jede Ableitung durch einen Differenzenquotient ersetzt. Diese Differenzenappoximation greift dabei auch auf Randpunkte in ∂Ωh zurück. So ergibt sich ein Differenzenschema zur Bestimmung einer diskreten Lösung uh : Ωh → R der allgemeinen Gestalt Lh uh (P ) = fh (P ) für P ∈ Ωh , uh (P ) = gh (P ) für P ∈ ∂Ωh , (2.1.2) wobei fh und gh geeignete Approximationen der rechten Seite f bzw. der Randwerte g sind (im einfachsten Fall etwa gh (P ) = g(P ) ). Auf natürliche Weise verstehen wir die Anwendung des Operators Lh auch auf die kontinuierliche Lösung u ∈ C(Ω) . Zur Konstruktion konkreter Differenzenoperatoren definieren wir zu jedem Punkt eine Umgebung von (verschiedenen) Punkten N (P ) := {Qi , i = 0, ..., rP } (Konvention: Q0 := P ), auf denen eine Differenzenapproximation des Laplace-Operators definiert ist. Der Differenzenoperator hat dann die Form X Lh uh (P ) = σ(P, Q)uh (Q), (2.1.3) Q∈N (P ) mit gewissen Koeffizienten σ(P, Q). Diese sind so zu bestimmen, daß die folgenden Forderungen erfüllt sind: 45 46 Differenzen-Verfahren für elliptische Probleme i) Konsistenz: Das Schema ist konsistent”, d.h.: Für den Abschneidefehler” ” ” τh (P ) := Lh u(P ) − fh (P ), P ∈ Ωh , gilt max |τh (P )| → 0 (h → 0). (2.1.4) P ∈Ωh Wünschenswert wäre eine möglichst hohe Konsistenzordnung“ m ≥ 1 , d.h.: ” max |τh (P )| = O(hm ). (2.1.5) P ∈Ωh Wir werden uns im folgenden üblicherweise meist mit m = 2 begnügen. Aus Ökonomiegründen wird man rP von moderater Größe wählen ( rP ≈ 4 − 24 in zwei Raumdimensionen). ii) Stabilität: Das Differenzenschema ist wohl-gestellt, d.h.: Es bestimmt eindeutige diskrete Lösungen (uh (P ))P ∈Ωh , welche gleichmäßig bzgl. h stetig von den Daten des Problems abhängen. Dazu wäre z.B. eine Stabilitätsabschätzung des folgenden Typs zu beweisen: (2.1.6) max |uh (P )| ≤ cstab max |Lh uh (P )| + max |uh (P )| , P ∈Ωh P ∈Ωh P ∈∂Ωh mit einer von h unabhängigen Konstante cstab > 0 . iii) Verträglichkeit: Der Differenzenoperator Lh soll analoge charakteristische Eigenschaften wie der kontinuierliche L besitzen; z.B.: Symmetrie, Definitheit, Maximumprinzip, u.s.w. Das Hauptziel der Konvergenzanalyse von Differenzenschemata ist der Nachweis, daß eine Konsistenzordnung m auch eine Konvergenzordnung m des Fehlers eh := u − uh impliziert: max |eh (P )| = O(hm ), (2.1.7) P ∈Ωh vorausgesetzt, die Lösung u ist ausreichend regulär. 2.1.1 Konsistenz Für den Fall fh (P ) = f (P ) betrachten wir o.B.d.A. den Punkt P = Q0 = 0 und die Punktumgebung N (P ) = {Qi = (xi , yi ), i = 0, ..., rP } . Taylorentwicklung ergibt: u(Qi ) = u(P ) + xi ∂x u(P ) + yi ∂y u(P ) + 21 x2i ∂x2 u(P ) + xi yi ∂x ∂y u(P ) + 12 yi2 ∂y2 u(P ) + · · · . Wir wollen aus diesem Ansatz die Koeffizienten σi := σ(P, Qi ) im Differenzenoperator so bestimmen, daß eine vorgegebene Konsistenzordnung garantiert ist. Mit dem Ansatz τh (P ) = O(hm ) erhält man durch Koeffizientenvergleich als notwendige und hineichende Bedingung für Konsistenz: (B0) Konsistenz: Für die Koeffizienten des Differenzenschemas gilt: rP X i=0 σi = rP X i=0 xi σi = rP X i=0 y i σi = rP X i=0 xi yi σi = 0, 1 2 rP X i=0 x2i σi = 1 2 rP X i=0 yi2 σi = 1. (2.1.8) 2.1 Allgemeine Differenzenapproximationen 47 Aus diesen Beziehungen sind die Koeffizienten σi , i = 0, ..., rP , im Differenzenoperator Lh zu bestimmen. Für Konsistenz sind also im allgemeinen Fall eines völlig unstrukturierten Gitters mindestens 6 Punkte in N (P ) erforderlich. Die Konsistenz des Differenzenschemas ist offenbar äquivalent dazu, daß der Differenzenoperator exakt” ist für quadratische Polynome: ” u ∈ P2 : Lh u(P ) = Lu(P ), P ∈ Ωh . (2.1.9) Da man in der Regel Diskretisierungen auf Folgen von Gittern mit Gitterweiten h → 0 betrachtet, führt man skalierte Parameter ξi = h−1 xi , ηi = h−1 yi ein, um sich von der h-Abhängigkeit in den Koeffizienten zu befreien. Wegen 1 2 2h rP X ξi2 σi = 12 h2 i=0 rP X ηi2 σi = 1, i=0 ist σi = 0 oder σi ∼ h−2 . Wenn also eine Lösung für (σ0 , . . . , σrP ) existiert, dann ergibt sich für den Konsistenzfehler τh (P ) = (Lh u − Lu)(P ) = O(h3 ξi3 σi + . . .) = O(h). (2.1.10) Auch bei ganz irregulärer Gitterpunktsanordnung erhält man somit schon mindestens eine Konsistenzordnung m = 1 . Es gibt mehrere Möglichkeiten, die Ordnung zu erhöhen: – Man nimmt mehr Gitterpunkte in die Menge N (P ) auf. – Man ordnet das Gitter regulär an, um in der Taylor-Entwicklung des Abschneidefehlers Weghebeffekte zu erzielen. Wir werden uns nun im folgenden mit regulären, speziell äquidistanten, kartesischen Gittern beschäftigen. Der Einfachheit halber sollen die Gitterpunkte äquidistant entlang von Parallelen zu den Koordinatenachsen angeordnet sein. Dabei bezeichnet R2h das gesamte den R2 überdeckende Punktgitter. Die Schnittpunkte der Gitterlinien mit dem Rand ∂Ω bilden dabei natürliche Stützpunkte für die Approximation der Randwerte. Die Gitterweite“ h hat auf ” solchen Gittern eine natürliche Bedeutung. Ω Ωh 0 P innere Knoten ✱ Ωh Pseudo-Randknoten Ω Randknoten h h Abbildung 2.1: Gitter für Differenzenapproximation 48 Differenzen-Verfahren für elliptische Probleme Die einfachste Approximation ∆h ≈ ∆ des Laplace-Operators verwendet zentrale Differenzenquotienten 2. Ordnung in jeder der Koordinatenrichtungen. Man erhält den sog. 5-Punkte” Operator“: n o 1 (5) ∆h uh (x, y) := 2 u(x ± h, y) + u(x, y ± h) − 4u(x, y) h für innere Gitterpunkte P = (x, y) ∈ Ωh . Wir verwenden hier die Konvention, daß ... ± h” ” abkürzend für die Summe der beiden Terme ... + h” und ... − h” steht. Die Konsistenzordnung ” ” dieser Differenzenapproximation ist wegen der Äquidistanz des Gitters und der symmetrischen Plazierung der Stützpunkte m = 2 : (5) |∆h u(P ) − ∆u(P )| ≤ 16 M4 (u)h2 , (2.1.11) wobei M4 (u) := maxΩ {|∂xi ∂yj u|, i + j = 4} . Diese Aussage bleibt gültig, wenn das Gitter nur in jeder einzelnen der Koordinatenrichtungen äquidistant ist. Dagegen ginge die Konsistenzordnung auf m = 1 zurück, wenn das Gitter zwar kartesisch, aber innerhalb einer Koordinatenrichtung nicht äquidistant wäre. Höhere Approximationsordnungen lassen sich z.B. auf einem gleichförmigen Gitter durch Hinzunahme von weiteren Punkten in der Umgebung des Auswertungspunkts (x, y) erzielen: i) Approximation der zweiten Ableitungen im Laplace-Operator durch zentrale Differenzenquotienten auf jeweils 5 Punkten ergibt den gestreckten“ 9-Punkte-Operator: ” n o 1 (9) − u(x ± 2h, y) + 16u(x ± h, y) − u(x, y ± 2h) + 16u(x, y ± h) − 60u(x, y) . ∆h uh (x, y) = 12h2 Dieser Differenzenoperator hat offensichtlich die Konsistenzordnung m = 4 , doch hat die zugehörige Koeffizientenmatrix wegen des Vorzeichenwechsels ungünstige Eigenschaften. ii) Der kompakte“ 9-Punkte-Operator verwendet neben dem Auswertungspunkt (x, y) die 8 ” direkten Nachbarpunkte (x ± h, y), (x ± h, y ± h), (x, y ± h) : n o ¯ (9) uh (x, y) = 1 4u(x ± h, y) + 4u(x, y ± h) + u(x ± h, y ± h) − 20u(x, y) . ∆ h 6h2 Dieses Schema hat zunächst auch nur die Ordnung m = 2 , doch kann man es durch eine Modifikation bei der Auswertung der rechten Seite auf die Ordnung m = 4 bringen (Übungsaufgabe): f (x, y) → f (x, y) + 1 2 (5) 12 h ∆h f (x, y). (2.1.12) Approximation entlang des Randes: Bei der Approximation am (möglicherweise gekrümmten) Rand des Gebiets gibt es verschiedene Möglichkeiten, die, wie wir später sehen werden, durchaus auf unterschiedliche Approximationsordnungen führen. Wir betrachten wieder den 5Punkte-Operator und definieren zunächst die folgenden Gitterpunktmengen: [ N (P ) \ Ωh . Ωh := {P ∈ R2h | N (P ) ⊂ Ω}, ∂Ωh := P ∈Ωh i) Konstante Randwertextrapolation: In Punkten von Ωh wird der 5-Punkte-Operator angesetzt, und in Punkten P ∈ ∂Ωh werden die Randwerte uh (P ) = g(P 0 ) verwendet. Dabei ist P 0 der P entlang einer der Koordinatenachsen am nächsten gelegene Punkt auf ∂Ω . Dies ergibt entlang des Randes nur eine Approximationsordnung m = 1 . 2.1 Allgemeine Differenzenapproximationen 49 Ω P0 P Abbildung 2.2: Schema der konstanten Randapproximation ii) Lineare Randwertinterpolation: Jeder Punkt P ∈ ∂Ωh liegt in x- und/oder y-Richtung zwischen zwei Punkten P0 ∈ ∂Ω und P1 ∈ Ωh mit Abständen 0 ≤ αh < h zu P0 und h zu P1 . Man setzt dann (lineare Interpolation): uh (P ) := 1 g(P0 ) + αuh (P1 ) . 1+α (2.1.13) Damit wird eine implizite Kopplung der Randwerte an die inneren“ Lösungswerte bewirkt. ” Diese Randwertapproximation hat die Ordnung m = 2 . Ω P0 P P1 Abbildung 2.3: Schema der linearen Randapproximation iii) Shortley1 -Weller2 -Approximation: Wir definieren die folgenden Punktmengen: [ N (P ) \ Ωh , Ω0h := {P ∈ R2h | N (P ) ⊂ Ω}, ∂Ω∗h := P ∈Ω0h Ωh := Ω0h ∪ ∂Ω∗h , ∂Ωh := {Schnittpunkte der Gitterlinien mit ∂Ω}. In Punkten P ∈ Ωh wird wieder der normale 5-Punkte-Operator und in den fiktiven“ Rand” punkten P ∈ ∂Ω∗h der modifizierte 5-Punkte-Operator verwendet (siehe die schematische Darstellung): n 2 2 2 2 uh (x, y) − uh (x + h, y) − uh (x − αh, y) α β 1+α α(1 + α) o 2 2 uh (x, y + h) − uh (x, y − βh) = f (x, y) , − 1+β β(1 + β) −∆∗h uh (x, y) := h−2 1 2 George Shortley (1910-: ???? R. Weller (????-????): ???? + 50 Differenzen-Verfahren für elliptische Probleme gemäß −∆∗h uh = f auf ∂Ω∗h , (2.1.14) mit den Werten uh (P ) := g(P ) auf ∂Ωh . Für diesen Differenzenoperator gilt |∆∗h u(P ) − ∆u(P )| ≤ 23 M3 (u)h, (2.1.15) wobei M3 (u) := maxΩ {|∂xi ∂yj u|, i + j = 3} . (x, y+h) h h Gitterweite αh (x, y) (x+2h, y) h (x- αh, y) (x+h, y) (x, y) Stützpunkt 0 < α, β ≤ 1, αβ < 1 βh (x, y- βh) Abbildung 2.4: Schema der Shortley-Weller-Approximation Die Verwendung dieser Differenzenapproximationen führt auf Schemata der Form L h uh = f h in Ωh , Rh uh = gh auf ∂Ωh , (2.1.16) wobei der Randoperator“ Rh die jeweilige Randwertapproximation beschreibt. Dabei wer” den die echten Randwerte von uh auf ∂Ωh unter Umständen implizit mit Werten im Innern verkoppelt. In diesem Fall sind alle Werte uh (P ), P ∈ Ωh , zu bestimmen. Der Differenzenoperator Lh steht für den normalen 5-Punkte-Operator in Ωh und gegebenfalls den modifizierten Shortley-Weller-Operator auf ∂Ω∗h . Im einfachsten Fall der trivialen Randwertapproximation Rh uh = uh können die Randwerte uh (P ) = gh (P ), P ∈ ∂Ωh , direkt eliminiert werden. Wir werden im folgenden nur diesen Fall weiter diskutieren. Bemerkung: Die obigen Differenzenschemata haben natürliche Analoga in drei Raumdimensionen. Man spricht dann aus naheliegendem Grund vom 7-Punkte-Operator“. Dessen Abschnei” defehler genügt der Abschätzung (7) |∆h u(P ) − ∆u(P )| ≤ 14 M4 (u)h2 . (2.1.17) 2.2 Eigenschaften der Differenzengleichungen 51 2.2 Eigenschaften der Differenzengleichungen Ausgangspunkt der folgenden Untersuchungen ist das Differenzenschema der Gestalt X Lh uh (P ) := σ(P, Q)uh (Q) = fh (P ), P ∈ Ωh , (2.2.18) Q∈N (P ) uh (P ) = gh (P ), P ∈ ∂Ωh , (2.2.19) mit geeigneten Approximationen fh (·) zu f und gh (·) zu g . Wir definieren die Koeffizenten σ(P, Q) := 0 für Punkte Q 6∈ N (P ). Für P ∈ Ωh gilt dann X X σ(P, Q)uh (Q) = fh (P ) − σ(P, Q)gh (Q). (2.2.20) Q∈Ωh Q∈∂Ωh Bei (beliebiger) Numerierung der Gitterpunkte etwa gemäß Ωh = {Pn , n = 1, ..., N } , ∂Ωh = {Pn , n = N + 1, ..., N + M } ergibt sich ein quadratisches Gleichungssystem für den Vektor der (inneren) Knotenwerte U = (Un )N n=1 , Un := uh (Pn ) : AU = F, (2.2.21) N mit A = (Anm )N n,m=1 , F = (Fn )n=1 , wobei Anm := σ(Pn , Pm ), 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Fn := fh (Pn ) − NX +M σ(Pn , Pm )gh (Pm ). m=N +1 h= 1 m+1 N = m2 Gitterweite innere“ Gitterpunkte ” h h Abbildung 2.5: Differenzengitter Beispiel ( Modellproblem”): Im Fall des Einheitsquadrats Ω ” 5-Punkte-Operator bei zeilenweiser Durchnumerierung des Gitters dünn-besetzte Matrix der Dimension N = m2 : Bm −Im 4 −1 1 −Im Bm −Im A= 2 N Bm = .. h . −Im Bm .. .. . . = (0, 1)2 ergibt sich für den Ωh = {Pij }m+1 i,j=0 die folgende 4 −1 . m −1 4 .. .. .. . . −1 52 Differenzen-Verfahren für elliptische Probleme mit der m×m-Einheitsmatrix Im . Die rechte Seite ist F := (f (x11 ), . . . , f (xmm ))T . Die Matrix A ist eine dünn besetzte Bandmatrix mit der Halbbandbreite m , symmetrisch und (irreduzibel) diagonal-dominant. Damit ist sie auch regulär und positiv definit. Bemerkung: In drei Raumdimensionen hat die entsprechende Matrix die Dimension N = m3 und die Halbbandbreite m2 . Ansonsten hat sie dieselben Eigenschaften wie in zwei Dimensionen. Im allgemeinen Fall ist für moderates rP die Matrix A dünn besetzt, aber häufig wegen der Randwertapproximation nicht symmetrisch. Dies wäre ein schwerwiegender Nachteil, etwa bei der Approximation von Eigenwertaufgaben zum Laplace-Operator. Um die Regularität von A bzw. die Lösbarkeit der Differenzengleichung garantieren zu können, formulieren wir die folgenden Strukturbedingungen in numerierungs-unabhängiger Form: (B1) Erweiterte Diagonaldominanz: Für Punkte P ∈ Ωh gilt: X |σ(P, Q)| ≤ |σ(P, P )| , (i) (2.2.22) Q∈Ωh , Q6=P und für Punkte P ∈ Ω∗h := {Q ∈ Ωh : N (Q) ∩ ∂Ωh 6= ∅} : X (ii) Q∈Ωh , Q6=P |σ(P, Q)| < |σ(P, P )| . (2.2.23) (B2) Nicht-negativer Typ: Für Punkte P ∈ Ωh und Q ∈ Ωh \ {P } gilt: σ(P, P ) > 0, σ(P, Q) ≤ 0 . (2.2.24) (B3) Zusammenhang: Es ist ∂Ωh 6= ∅ , und mit N (P ) := {Q ∈ Ωh , σ(P, Q) 6= 0} gilt für jede echte Teilmenge Sh ⊂ Ωh : [ N (P ) ∩ (Ωh \ Sh ) 6= ∅ . (2.2.25) P ∈Sh Die ersten beiden Bedingungen (B1) und (B2) werden von vielen Differenzenschemata, insbesondere solchen höherer als zweiter Ordnung (z.B.: der gestreckte” 9-Punkte-Operator), nicht ” erfüllt. Die hier betrachteten 5-Punkte-Schemata mit Randapproximation genügen ihnen aber. Wir zeigen im folgenden, wie bei den einzelnen Randapproximationen die Bedingung (B1ii) erfüllt ist. i) Konstante Randwertextrapolation: Für P ∈ Ω∗h gilt X |σ(P, Q)| ≤ 3h−2 = Q∈Ωh , Q6=P 3 4 |σ(P, P )| , ii) Lineare Randwertinterpolation: Für P ∈ Ω∗h gilt X −2 7 −2 α h ≤ 2h ≤ |σ(P, Q)| ≤ 3 + 1+α Q∈Ωh , Q6=P 7 8 |σ(P, P )| , 2.2 Eigenschaften der Differenzengleichungen 53 iii) Shortley-Weller-Randwertapproximation: Für P ∈ Ω∗h gilt X Q∈Ωh , Q6=P |σ(P, Q)| ≤ 2 1+α + 2 1+β h−2 ≤ 2 α 1 2 + 2 β h−2 = 1 2 |σ(P, P )| . Die dritte Bedingung (B3) sichert die Kopplung eines jeden inneren Gitterpunktes P ∈ Ωh mit allen anderen, insbesondere mit den Randpunkten. Die Eigenschaft des kontinuierlichen Problems, daß sich eine kleine Störung in einem Punkt global bemerkbar macht, spiegelt sich hier wider. Die obigen Eigenschaften des Differenzenschemas korrespondieren zu den bereits bekannten der zugehörigen Koeffizientenmatrix A . Unabhängig von der gewählten Numerierung der Gitterpunkte implizieren die Bedingungen (B1) und (B3) zunächst die einfache Diagonaldominanz von A , darüber hinaus aber auch die stärkere irreduzible Diagonaldominanz” (analog dem schwa” ” chen Zeilensummenkriterium“ für die Konvergenz des Jacobi- oder des Gauß-Seidel-Verfahrens). Die Bedingung (B2) entspricht einer analogen für A . Um Existenz und Eindeutigkeit einer Lösung für das allgemeine Differenzenschema garantieren zu können, geht man ähnlich wie im Kontinuierlichen vor und nutzt ein diskretes Analogon des Maximumprinzips”. ” Satz 2.1 (Diskretes Maximumprinzip): Wenn die Bedingungen (B1i), (B2) und (B3) erfüllt sind, genügt das zugehörige Differenzenschema einem diskreten Maximumprinzip“, d.h.: Git” terfunktionen uh mit der Eigenschaft Lh uh (P ) ≤ 0, P ∈ Ωh , (2.2.26) haben in Ωh kein positives Maximum. Genauer gilt uh ≤ 0 auf Ωh oder max uh ≤ max uh . ∂Ωh Ωh (2.2.27) Beweis: Wir nehmen an, daß (2.2.26) für ein uh erfüllt ist, und führen den Beweis indirekt. Es gebe also einen Punkt P0 ∈ Ωh , so daß M := uh (P0 ) = max uh > 0, Ωh max uh < M. ∂Ωh Ausgehend von Lh uh (P ) ≤ 0 , folgt mit Bedingung (B2): X σ(P ,Q) X σ(P ,Q) 0 0 uh (Q) u (Q) = uh (P0 ) ≤ − h σ(P0 ,P0 ) σ(P0 ,P0 ) Q6=P0 Q6=P0 X σ(P ,Q) X σ(P ,Q) 0 uh (P0 ) + 0 {uh (Q) − uh (P0 )}. = σ(P0 ,P0 ) σ(P0 ,P0 ) Q6=P0 Q6=P0 Weiter gilt wegen Bedingung (B1i) X σ(P ,Q) 0 ≤ 1, σ(P0 ,P0 ) Q6=P0 54 Differenzen-Verfahren für elliptische Probleme und folglich ( uh (P0 ) = M ) M ≤M+ X σ(P0 ,Q) {uh (Q) − M }. σ(P0 ,P0 ) Q∈N (P0 )\{P0 } Da nach Voraussetzung uh (Q) ≤ M ist, muss also uh (Q) = M in allen Punkten Q ∈ N (P0 ) (d.h. solchen mit σ(P0 , Q) 6= 0 ) sein, da sonst ein Widerspruch entsteht. Anwendung derselben Schlußweise für alle Punkte in N (P0 ) liefert [ uh (Q) = M, Q ∈ N (P ). P ∈N (P0 ) Mit Hilfe der Bedingung (B3) erschließen wir dann durch sukzessive Fortsetzung dieses Arguments, daß uh ≡ M auf Ωh . Nach Voraussetzung ist ∂Ωh 6= ∅ , so daß es wegen (B3) einen Punkt Q ∈ ∂Ωh ∩ N (P ) mit einem inneren“ Punkt P ∈ Ωh geben muß. Für diesen folgt dann ” uh (Q) = M , was im Widerspruch zur Annahme max∂Ωh uh < M steht. Q.E.D. Das diskrete Maximumprinzip hat eine Reihe von wichtigen Folgerungen für die obigen Differenzenschemata. Korollar 2.1 (Eindeutigkeit): Unter den Voraussetzungen (B1), (B2) und (B3) besitzt das Differenzenschema (2.2.18), (2.2.19) genau eine Lösung uh . Im Falle fh ≥ 0 folgt aus gh ≥ 0 auch uh ≥ 0 . Beweis: i) Wegen der Äquivalenz von (2.2.18), (2.2.19) zu dem Gleichungssystem Ah U = Fh (1) (2) genügt es, die Eindeutigkeit zu zeigen. Seien also uh und uh zwei Lösungen: (i) L h uh = f h (1) in Ωh , (i) uh = gh auf ∂Ωh . (2) Für die Differenz wh := uh − uh gilt dann Lh wh = 0 in Ωh , wh = 0 auf ∂Ωh . Nun wird das diskrete Maximumprinzip auf Lh wh ≤ 0 sowie auf Lh (−wh ) ≤ 0 angewendet. Ersteres ergibt wh ≤ 0 und letzteres wh ≥ 0 und folglich wh ≡ 0 . ii) Sei nun fh ≥ 0 und gh ≥ 0 . Dann impliziert das diskrete Maximumprinzip angewendet für −uh , daß entweder uh ≥ 0 oder minΩh uh = − maxΩh (−uh ) ≥ − max∂Ωh (−gh ) = min∂Ωh gh , was zu beweisen war. Q.E.D. Im nächsten Abschnitt werden wir das diskrete Maximumprinzip verwenden, um die stetige Abhängigkeit der Lösungen von den Problemdaten zu zeigen. Dies wird sich als Nebenprodukt einer sehr viel stärkeren Stabilitätsungleichung ergeben. Korollar 2.2 (Inverse Monotonie): Unter den Voraussetzungen (B1), (B2) und (B3) ist die zum Differenzenoperator Lh bei beliebiger Numerierung der Gitterpunkte gehörende Koeffizientenmatrix A eine sog. M-Matrix” (invers-monotone Matrix), d.h.: Ihre Inverse A−1 ist ” elementweise nicht negativ: A−1 ≥ 0. (2.2.28) 2.2 Eigenschaften der Differenzengleichungen 55 Beweis: Die Matrix A wird wie üblich geschrieben als Summe A = L + D + R einer linken unteren Dreiecksmatrix L , einer Diagonalmatrix D und einer rechten oberen Dreiecksmatrix R . Die Bedingungen (B1), (B2) und (B3) implizieren, wie oben bereits bemerkt, die (irreduzible) Diagonaldominanz von A und damit 1) die Regularität von A und D und 2) die Kontraktivität spr(J) < 1 der Jacobi-Matrix J := −D−1 (L + R) . Dann existiert eine (natürliche) Matrizennorm k · k , bzgl. derer kJk < 1 ist. Hiermit folgt die Existenz der Reihe (im Sinne der Matrizenkonvergenz) ∞ X J k = (I − J)−1 . k=0 Bedingung (B2) garantiert, daß (elementweise) J = −D−1 (L + R) ≥ 0 und folglich auch A−1 D = (D −1 A)−1 = (I + D −1 (L + R))−1 = (I − J)−1 = ∞ X k=0 Wegen D−1 ≥ 0 impliziert dies A−1 ≥ 0 . J k ≥ 0. Q.E.D. Die Matrix A−1 ordnet der rechten Seite fh und den Randwerten gh eindeutig den Lösungsvektor U der Differenzengleichung zu: A−1 : {fh , gh } → U = A−1 F (fh , gh ). Damit ist A−1 das algebraische Äquivalent der kontinuierlichen Greenschen Funktion G(·, ·) : Z Z ∂n G(x, y)g(y) dy. G(x, y)f (y) dy − G : {f, g} → u(x) = ∂Ω Ω Als Folgerung des Maximumprinzips ist G(x, y) ≥ 0, x 6= y , was analog zur gerade gezeigten Eigenschaft A−1 ≥ 0 ist. 2.2.1 Das Konvergenzverhalten von Differenzenverfahren Die Grundlage der Fehleranalyse für die oben eingeführten Differenzenschemata ist wie im Fall von Differenzenverfahren für gewöhnliche Differentialgleichungen eine asymptotische Stabilitätsabschätzung. Wir formulieren diese im folgenden Satz für ein allgemeines Differenzenschema Lh uh = fh in Ωh , uh = gh auf ∂Ωh . (2.2.29) Wir setzen im folgenden stets voraus, daß dieses Schema konsistent ist. Satz 2.2 (Stabilität): Das Differenzenschema (2.2.29) sei konsistent und genüge den Bedingungen (B1), (B2) und (B3). Dann gilt für jede Gitterfunktion uh die Stabilitätsabschätzung max |uh (P )| ≤ 14 d2Ω max |Lh uh (P )| + max |uh (P )| , P ∈Ωh wobei dΩ := diam(Ω) . Ωh P ∈∂Ωh (2.2.30) 56 Differenzen-Verfahren für elliptische Probleme Beweis: Wir argumentieren im folgenden ähnlich wie auf der kontinuierlichen Ebene. Durch die folgende Vorschrift für beliebiges, festes Q ∈ Ωh Lh Gh (·, Q) = h−2 δ(·, Q) in Ωh , Gh (·, Q) = δ(·, Q) auf ∂Ωh , (2.2.31) wird ein diskretes Analogon Gh (P, Q) : Ωh × Ωh → R zur kontinuierlichen Greenschen Funktion (des Laplace-Operators) definiert. Dabei ist δ(P, Q) das übliche Kronecker3 -Symbol”. Aus ” dem diskreten Maximumprinzip folgt, daß Gh (P, Q) ≥ 0 . Für eine Gitterfunktion vh gilt dann die diskrete Greensche Identität” ” X X Gh (P, Q)Lh vh (Q) + Gh (P, Q)vh (Q), P ∈ Ωh . vh (P ) = h2 Q∈Ωh (2.2.32) Q∈∂Ωh Um dies zu sehen, bezeichnen wir die rechte Seite von (2.2.32) mit wh und erhalten mit den Eigenschaften der Greenschen Funktion Lh wh = Lh vh in Ωh , wh = vh auf ∂Ωh . Die Eindeutigkeit der Lösungen des Diffenzenschemas impliziert dann wh ≡ vh . Aus der diskreten Greenschen Identität folgt für jede Gitterfunktion vh X X Gh (P, Q) max |Lh vh | + Gh (P, Q) max |vh |, P ∈ Ωh . |vh (P )| ≤ h2 Q∈Ωh Ωh Q∈∂Ωh ∂Ωh (2.2.33) i) Wegen der Konsistenz des Schemas gilt für die Gitterfunktion wh ≡ 1 notwendig Lh wh ≡ 0 , so daß aus der Greenschen Identität folgt: X X X Gh (P, Q)Lh wh (Q) + 1 = h2 Gh (P, Q)wh (Q) = Gh (P, Q) . (2.2.34) Q∈Ωh Q∈∂Ωh Q∈∂Ωh Dies impliziert eine Schranke für die zweite Summe in (2.2.33). ii) Jeder Punkt P0 ∈ Ωh ist Mittelpunkt eines Ω enthaltenden Kreises mit Radius dΩ . O.b.d.A. sei hier P0 = 0 . Für die Funktion w(P ) := 14 |P |2 gilt in Punkten P ∈ Ωh : Lh w(P ) = Lh w(P ) + ∆w(P ) − ∆w(P ) = M3 (w)O(h) − ∆w(P ) = −1, da M3 (w) = 0. Wir definieren nun die Gitterfunktion X Gh (P, Q). vh (P ) := h2 Q∈Ωh Durch elementares Nachrechnen verifiziert man, daß Lh vh = 1 in Ωh , vh = 0 auf ∂Ωh , Lh (vh + w) = 0 in Ωh , vh + w ≤ 14 d2Ω auf ∂Ωh . 3 Leopold Kronecker (1823-1891): deutscher Mathematiker; wirkte in Berlin als “Privatgelehrter”; betrieb die Arithmetisierung der Mathematik; wichtiger Vertreter des “Konstruktivismus”, welcher die generelle Verwendung des Widerspruchsbeweises und des “aktual Unendlichen” in Form z.B. der allgemeinen reellen Zahlen ablehnt. 2.2 Eigenschaften der Differenzengleichungen 57 Aus dem diskreten Maximumprinzip folgt dann wegen w ≥ 0 notwendig max vh ≤ max (vh + w) ≤ max (vh + w) = max w ≤ 14 d2Ω , Ωh ∂Ωh ∂Ωh Ωh und somit h2 X Q∈Ωh Gh (P, Q) ≤ 14 d2Ω , P ∈ Ωh . (2.2.35) Die Abschätzungen (2.2.34) und (2.2.35) ergeben zusammen mit (2.2.33) die Behauptung. Q.E.D. Als unmittelbare Folgerung aus Satz 2.2 erhalten wir (in Analogie zum kontinuierlichen Fall) die stetige Abhängigkeit der Lösung von den Daten. Das wichtigste Resultat ist eine a priori Konvergenzabschätzung für das Differenzenschema (2.2.29). Korollar 2.3 (Konvergenz): Unter den Voraussetungen von Satz 2.2 gilt für das Differenzenschema (2.2.29) die a priori Konvergenzabschätzung max |eh (P )| ≤ 14 d2Ω max |τh (P )| + max |eh (P )|, P ∈Ωh P ∈Ωh P ∈∂Ωh (2.2.36) mit dem Fehler eh = u − uh und dem Abschneidefehler τh (P ) := Lh u(P ) + ∆u(P ) . Beweis: Für den Fehler eh gilt die Differenzengleichung Lh eh (P ) = τh (P ) P ∈ Ωh , so daß die Stabilitätsungleichung (2.2.30) unmittelbar die Behauptung liefert. Q.E.D. Die Abschätzung (2.2.36) garantiert wieder, daß für ein gutes“ Differenzenschema der globale ” Diskretisierungsfehler mit derselben Ordnung wie der lokale Abschneidefehler konvergiert. Wir wollen diese allgemeinen Resultate für die obigen speziellen Diskretisierungen anwenden. Dabei wird wieder die folgende Bezeichnung für Normschranken der exakten Lösung verwendet: Mm (u) := max{|∂xi ∂yj u|, i + j = m}. Ω Korollar 2.4 (Konvergenz): Unter den Voraussetungen von Satz 2.2 gilt für den Fehler den 5-Punkte-Operator mit konstanter Randwertextrapolation die a priori Fehlerabschätzung max |eh (P )| ≤ P ∈Ωh 2 1 2 24 dΩ M4 (u)h + M1 (u)h. Beweis: Für den Abschneidefehler gilt max |τh | ≤ 16 M4 (u)h2 , Ωh und in Randgitterpunkten max |eh | = max |u(P ) − u(P ⋆ )| ≤ M1 (u)h. ∂Ωh ∂Ωh (2.2.37) 58 Differenzen-Verfahren für elliptische Probleme Die Stabilitätsabschätzung (2.2.30) impliziert damit die Behauptung. Q.E.D. Der ordnungsreduzierende Effekt der mangelhaften Randwertapproximation kann durch die oben beschriebene lineare Randwertinterpolation“ behoben werden. Für das so modifizierte ” 5-Punkte-Schema erhält man ähnlich wie eben die a priori Fehlerabschätzung max |eh (P )| ≤ P ∈Ωh 2 1 2 12 dΩ M4 (u)h + 21 M2 (u)h2 . (2.2.38) Korollar 2.5 (Konvergenz): Unter den Voraussetungen von Satz 2.2 gilt für den modifizierten 5-Punkte-Operator nach Shortley-Weller die a priori Fehlerabschätzung max |eh (P )| ≤ P ∈Ωh 2 1 2 24 dΩ M4 (u)h + 31 M3 (u)h3 . (2.2.39) Beweis: Für den Fehler eh gelten die Beziehungen −∆h eh = τh in Ωh , −∆∗h eh = τh∗ auf ∂Ω∗h , eh = 0 auf ∂Ωh . Für die Abschneidefehler gilt |τh∗ | ≤ 32 M3 (u)h. max ∗ max |τh | ≤ 16 M4 (u)h2 , Ωh ∂Ωh In diesem Fall können wir nicht direkt die Stabilitätsungleichung (2.2.30) anwenden, da sie nur auf eine reduzierte Konvergenzordnung O(h) führen würde. Statt dessen modifizieren wir in geeigneter Weise den Beweis dieser Abschätzung. Mit den Bezeichnungen des Beweises von Satz 2.2 ergibt die Greensche Identität ( eh = 0 auf ∂Ωh ) X X Gh (P, Q)τh (Q) + h2 eh (P ) = h2 Gh (P, Q)τh∗ (Q) Q∈Ω0h Q∈∂Ω∗h und folglich |eh (P )| ≤ h2 X Q∈Ω0h Gh (P, Q) max |τh | + h2 Ω0h X Q∈∂Ω∗h |τh∗ | . Gh (P, Q) max ∗ ∂Ωh Wie im Beweis von Satz 2.2 folgt X X Gh (P, Q) ≤ 14 d2Ω . Gh (P, Q) ≤ h2 h2 Q∈Ω0h (2.2.40) (2.2.41) Q∈Ωh Wir wollen jetzt zeigen, daß X Q∈∂Ω∗h Gh (P, Q) ≤ 1 2 . Dazu definieren wir die Gitterfunktion wh durch wh = 1 in Ωh , wh = 0 auf ∂Ωh . (2.2.42) 2.2 Eigenschaften der Differenzengleichungen 59 Für diese verifiziert man durch Nachrechnen −∆h wh = 0 in Ω0h , −∆∗h wh ≥ 2h−2 auf ∂Ω∗h . Mit Hilfe der Greenschen Identität folgt damit X X 1 = h2 Gh (P, Q)(−∆∗h )wh (Q) ≥ 2 Gh (P, Q), Q∈∂Ω∗h was (2.2.42) impliziert. Dies vervollständigt den Beweis. Q∈∂Ω∗h Q.E.D. Bemerkung: In drei Raumdimensionen gelten Satz 2.2 und Korollar 2.3 mit der Konstante 61 d2Ω . Hiermit und der zugehörigen Abschätzung (2.1.17) für den Konsistenzfehler ergeben sich dann auch die a priori Fehlerabschätzungen der Korollare 2.4 und 2.4 mit der führenden 1 2 dΩ . Konstante 24 Bemerkung: Wir betonen, daß die Konvergenz der betrachteten Differenzenschemata eine vergleichsweise hohe Regularität der zu approximierenden Lösung erfordert. Das Shortley-WellerSchema erfordert z.B. für seine maximale“ Konvergenzordnung m = 2 , daß u beschränkte ” vierte Ableitungen auf ganz Ω besitzt ( M4 (u) < ∞ ). Dies ist eine sehr einschneidende Forderung, wie wir im vorigen Kapitel gesehen haben. Sie kann i.a. nur für glatt berandete Gebiete sowie unter gewissen Zusatzbedingungen für spezielle Geometrien wie z.B. Rechtecke garantiert werden. Weiter erfordert sie auch hohe Glattheit der Daten f und g . Auf Gebieten mit einspringenden Ecken oder sonstwie reduzierter Regularität von u können diese Sätze nicht verwendet werden. In solchen realitätsnäheren Situationen werden sich die im nächsten Abschnitt behandelten Finite-Elemente-Verfahren“ als flexibler erweisen. ” 60 Differenzen-Verfahren für elliptische Probleme 2.3 Lösungsaspekte Wir diskutieren nun die Lösung der durch eine Differenzendiskretisierung entstehenden algebraischen Gleichungssysteme. Zugrunde gelegt wird die Situation des Modellproblems der 1. RWA des Laplace-Operators Lu := −∆u = f in Ω, u = g auf ∂Ω, (2.3.43) auf einem Gebiet Ω ⊂ R2 . Erweiterungen für Probleme mit variablen Koeffizienten, anderen Randbedingungen, Unsymmetrien sowie auf drei Raumdimensionen werden wieder in Bemerkungen berücksichtigt. Die zugehörigen algebraischen Systeme haben die Form Ax = b, (2.3.44) N Die Matrix A = (anm )N n,m=1 und der Vektor b = (bn )n=1 haben die Dimension N := Anzahl der inneren Gitterpunkte bzw. Knotenfreiheitsgrade. In der Praxis ist meist N ≫ 1000 , so daß neben dem Rechenaufwand auch der Speicherbedarf ein wichtiger Aspekt ist. Die Matrix ist extrem dünn besetzt und besitzt abhängig von der gewählten Numerierung der Gitterpunkte bzw. Knoten eine Bandstruktur. Für die Wahl eines geeigneten (d.h.: möglichst sparsamen) Lösungsverfahrens ist die zu erwartende Dimension N entscheidend. Wir orientieren die folgende Diskussion an der Modellsituation der Poisson-Gleichung auf dem Einheitsquadrat Ω = (0, 1)2 und der Diskretisierung mit dem üblichen 5-Punkte-Schema Ωh = Ωh ∪ ∂Ωh der Gitterweite h . Das Gebiet auf einem äquidistanten, kartesischen Gitter √ Ω = (0, 1)2 hat den Durchmesser dΩ = 2 . Wir wählen die Funktion u(x, y) = sin(πx) sin(πy) als Lösung der Randwertaufgabe −∆u = 2π 2 u =: f in Ω, u = 0 auf ∂Ω. (2.3.45) Es ist M4 (u) = π 4 . Die a priori Fehlerschranke (2.2.39) für die Shortley-Weller-Approximation liefert damit die (pessimistische) Fehlerschätzung max |u − uh | ≈ Ωh 1 2 4 2 24 dΩ π h ≈ 8h2 . (2.3.46) Zur Erreichung garantierter 3-stelliger (relativer) Genauigkeit, TOL = 10−3 , ist in diesem Fall also eine Gitterweite h ≈ 10−2 erforderlich. Dies führt auf ein (symmetrisches) Gleichungssystem der Dimension N ≈ 104 . Bemerkung 2.1: Die Fehlerabschätzung (2.3.46) ist in der Tat sehr pessimistisch. Der wirkliche Fehler ist ungefähr um einen Faktor 10−1 kleiner. Dies zeigt, daß unsere a priori Fehleranalyse selbst für ein so einfaches Modellproblem zu unscharf und für praktische Zwecke nur bedingt brauchbar ist. √ 2) In drei Raumdimensionen ist dΩ = 3 , und die a priori Fehlerabschätzung (2.3.46) liefert den Wert ≈ 12h2 , so daß hier mindestens auch h = 10−2 und damit N ≈ 106 erforderlich wäre. Die Struktur der Matrix A hängt von der gewählten Numerierung der Gitterpunkte ab. Die gängigen Alternativen sind: 2.3 Lösungsaspekte 61 Zeilenweise Numerierung: Die lexikographische Anordnung der Gitterpunkte, (xi , yj ) ≤ (xp , yq ) , wenn j ≤ q oder j = q, i ≤ p führt auf eine Bandmatrix mit Bandbreite 2m + 1 ≈ h−1 . 21 22 23 24 25 16 17 18 19 20 11 12 13 14 15 6 7 8 9 10 1 2 3 4 5 Abbildung 2.6: Lexikographische Nummerierung Diagonale Numerierung: Die sukzessive Numerierung diagonal zu den Koordinatenrichtungen führt auf eine Bandmatrix mit geringem Bandinhalt“ (⇒ Speicherersparnis beim Gaußschen ” Eliminationsverfahren). 11 16 20 7 12 17 23 25 21 24 4 8 13 18 22 2 5 9 14 19 1 3 6 10 15 Abbildung 2.7: Diagonale Nummerierung Schachbrett-Numerierung: Die versetzte zeilenweise- sowie spaltenweise Numerierung führt auf eine 2 × 2-Blockmatrix mit diagonalen Hauptblöcken. 11 21 6 16 1 24 12 25 13 9 22 10 23 19 7 20 8 4 17 5 18 15 3 14 2 Abbildung 2.8: Schachbrett-Nummerierung 62 Differenzen-Verfahren für elliptische Probleme a) Direkte Lösung: Prinzipiell wäre das klassische Gaußsche Eliminationsverfahren zur Lösung des Systems (2.3.44) geeignet. Zu seiner Durchführung benötigt man bei zeilenweiser Numerierung und Ausnutzung der Symmetrie etwa mN Speicherplätze (im folgenden abgekürzt als SP“) und m2 N arithmetische Operationen (im folgenden abgekürzt als OP“). Im Fal” ” le N ≈ 104 sind dies etwa 106 SP und 108 OP. Die kurze Überschlagsrechnung zeigt, daß direkte Lösungsmethoden für das Gleichungssystem (2.3.44) nur in speziellen Situationen in Frage kommen. Sie spielen eine Rolle bei geringer Problemgröße ( N ≤ 103 ) oder im Falle sehr uniformer Matrixeinträge (bei der Approximation von Differentialoperatoren mit konstanten Koeffizienten) ( N ≤ 105 ). Speziell für die 5-Punkte-Approximation des Laplace-Operators auf Rechtecken gibt es sehr effiziente direkte Lösungstechniken auf Grundlage der schnellen Fourier” Transformation“ ( N ≤ 107 ). Diese sind aber bei allgemeineren Problemstellungen meist nicht anwendbar und werden daher hier nicht weiter diskutiert. Bemerkung: Zur Illustration machen wir dieselbe Überschlagsrechnung auch für die entsprechende dreidimensionale Situation Ω = (0, 1)3 . Hier hat die Matrix A die Dimension N = m3 ≈ 106 und die Bandbreite 2m2 + 1 ≈ 104 . Folglich betrüge der benötigte Lösungsaufwand ≈ 1010 SP und ≈ 1014 OP, was jenseits der Kapazität normaler Arbeitsplatzrechner liegt. b) Iterative Lösung: Wie bereits erwähnt, übertragen sich die wichtigen Eigenschaften (B1), (B2) und (B3) des Differenzenschemas unabhängig von der gewählten Numerierung auf die jeweilige Matrix A . Diese ist (irreduzibel) diagonaldominant und von nichtnegativem Typ und folglich eine M-Matrix, d.h.: Es gilt elementweise A−1 ≥ 0 . Zusätzlich ist A oft auch symmetrisch und positiv definit. In diesem Falle sind die meisten gängigen iterativen Verfahren konvergent. Ausgehend von einer Defektkorrekturiteration dt = F − Axt , Cv t = dt , xt+1 = xt + v t , (2.3.47) mit einer regulären Matrix C ( Vorkonditionierer“) wird die Iteration zunächst als Fixpunkti” teration geschrieben Cxt+1 = Cxt + b − Axt ⇔ xt+1 = (I − C −1 A)xt + C −1 b. (2.3.48) Für den Fehler e(t) := x(t) − x gilt e(t) = (I − C −1 A)x(t−1) + C −1 b − x = (I − C −1 A)x(t−1) + C −1 b − (I − C −1 A)x − C −1 b (2.3.49) = (I − C −1 A)e(t−1) = · · · = (I − C −1 A)t e(0) . Dies zeigt, daß die Iteration konvergiert, wenn die Iterationsmatrix“ B := I − C −1 A eine ” Kontraktion ist, d.h.: ρ(B) := max{|λ|, λ Eigenwert von B} < 1 . Die Konvergenzrate“ der ” Iteration ist dann gegeben durch ρ := sup x(0) ∈RN lim t→∞ kx(t) − xk 1/t kx(0) − xk = ρ(B). (2.3.50) Es ist dann näherungsweise kx(t) − xk ≤ ρt kx(0) − xk. (2.3.51) Die Anzahl der zur Erreichung einer Reduktion des Anfangsfehlers um ε erforderlichen Iterati- 2.3 Lösungsaspekte 63 onsschritte ergibt sich damit zu tε ≈ ln(ε) . ln(ρ) (2.3.52) Der Vorkonditionierer“ C sollte folgende Bedingungen erfüllen: ” – einfache Invertierung (mit O(N ) OP und Speicherbedarf O(N ) SP); – möglichst kleines ρ(I − C −1 A) . Dies sind leider gegenläufige Zielsetzungen. Die einfachsten Verfahren dieses Typs verwenden ausgehend von der natürlichen Aufspaltung A = L + D + R die Vorkonditionierer: 1. (Gedämpftes) Richardson4 -Verfahren: 0 < θ ≤ 2λmax (A)−1 B = I − θA. (2.3.53) B = −D −1 (L + R). (2.3.54) C = θI, 2. Jacobi5 -Verfahren (Gesamtschrittverfahren): C = D, 3. Gauß-Seidel6 -Verfahren (Einzelschrittverfahren): C = D + L, B = −(D + L)−1 R. (2.3.55) 4. SOR-Verfahren ( Successive Over-Relaxation“): ω = ωopt ∈ (0, 2) ” C = D + ωL, B = (D + ωL)−1 {(1 − ω)D − ωR}. (2.3.56) 5. ILU-Verfahren ( Incomplete LU Decomposition“): ” C = L̃R̃, B = I − R̃−1 L̃−1 A. (2.3.57) Für eine symmetrische, positiv definite Matrix wird das ILU- zum ILLT -Verfahren ( In” complete Cholesky7 Decomposition“). Die ILU-Zerlegung erhält man mit Hilfe des üblichen, rekursiven Prozesses zur Bestimmung der LU-Zerlegung aus der Gleichung LU = A 4 Lewis Fry Richardson (1881-1953): englischer Mathematiker und Physiker; wirkte an verschiedenen Institutionen in England und Schottland; typischer “angewandter Mathematiker”; leistete Pionierbeiträge zur Modellierung und Numerik in der Wettervorhersage. 5 Carl Gustav Jakob Jacobi (1804-1851): deutscher Mathematiker; schon als Kind hochbegabt; wirkte in Königsberg und Berlin; Beiträge zu vielen Bereichen der Mathematik: zur Zahlentheorie, zu elliptischer Funktionen, zu partiellen Differentialgleichungen, zu Funktionaldeterminanten und zur theoretischen Mechanik. 6 Philipp Ludwig von Seidel (1821-1896): deutscher Mathematiker; Prof. in München; Beiträge zur Analysis (u.a. Methode der kleinsten Fehlerquadrate) owie Himmelsmechanik und Astronomie. 7 Andrè Louis Cholesky (1975-1918): französischer Mathematiker; Militärkarriere; Beiträge zur Numerischen Linearen Algebra. 64 Differenzen-Verfahren für elliptische Probleme durch Nullsetzung aller Matrixeinträge zu Indexpaaren {n, m} mit anm = 0 : n = 1, ..., N : ũnm = anm − ˜ lnn = 1, n−1 X ˜lni ũim (m = 1, ..., N ) i=1 n−1 o n X ˜lij ũjn ˜lin = ũ−1 ain − (i = n + 1, ..., N ) nn j=1 ˜lnm = 0, ũnm = 0, wenn anm = 0 . 6. ADI-Verfahren ( Alternating-Direction Implicit Iteration“): ” C = (Ax + ωI)(Ay + ωI), B = (Ay + ωI)−1 (ωI − Ax )(Ax + ωI)−1 (ωI − Ay ). (2.3.58) Das ADI-Verfahren ist für beliebige Wahl des Parameters ω > 0 konvergent. Wenn die Struktur der Matrix seine Anwendung zuläßt, ist es bei optimaler Wahl von ω mindestens so schnell wie das optimale SOR-Verfahren. Die Konvergenzraten dieser einfachen Iterationsverfahren verhalten sich in Abhängigkeit von der (gleichförmigen) Gitterweite wie ρ = ρ(I − C −1 A) = 1 − O(hr ), in Abhängigkeit von der Gitterweite h der Diskretisierung (bei fester Problemkonfiguration) mit einem geeigneten r ≥ 0 . Die Anzahl T der zur Gewinnung einer Dezimalstelle Genauigeit erforderlichen Iterationsschritte ist also ungefähr bestimmt durch ρT ≈ 10−1 ⇒ T≈− ln(10) ≈ h−r . ln(ρ) (2.3.59) Hierzu beachte man, daß ln(1 − chr ) = −chr + O(h2r ) . Da die Durchführung eines Iterationsschritts approximativ N ≈ h−2 OP (in zwei Raumdimensionen) kostet, ergibt sich ein Gesamtaufwand pro Dezimalstelle an Genauigkeit von ≈ h−2−r OP. Der für die Durchführung dieser Iterationsverfahren benötigte Speicherplatz entspricht etwa dem zur Speicherung der wesentlichen Elemente der Matrix A erforderlichen. Für das Jacobi- und Gauß-Seidel-Verfahren ist r = 2 und für das (optimale) SOR-Verfahren ist r = 1 . Das ILU- und das ADI-Verfahren liegen bei speziellen Konfigurationen etwa gleich auf zum SOR-Verfahren. Damit ergibt sich ein Gesamtlösungsaufwand von jeweils O(N 2 ) bzw. O(N 3/2 ) a.Op. für die einzelnen Verfahren. Ein wirklich effizientes“ Verfahren sollte ein möglichst kleines r aufweisen; optimal wäre r = 0 . ” Dies läßt sich durch den Einsatz von sog. Multi-Level-Techniken“ ( Mehrgitterverfahren“) er” ” reichen, welche später im Zusammenhang mit den Finite-Elemente-Diskretisierungen diskutiert werden. 2.3.1 Aufwandsanalyse: ein Beispiel Wir wollen das Konvergenzverhalten der bisher betrachteten Iterationsverfahren und deren sich daraus ergebende Effizienz anhand des obigen Modellproblems eingehender diskutieren. Dabei soll insbesondere die Bedeutung der Formel (2.3.59) für die Konvergenzrate illustriert werden. 2.3 Lösungsaspekte 65 Für die obige Modellsituation (5-Punkte-Differenzenoperator auf einem äquidistanden, kartesischen Gitter des Einheitsquadrats) lassen sich die Eigenwerte und zugehörigen Eigenvektoren der Systemmatrix A explizit angeben. Für k, l = 1, . . . , m ergibt sich mit der Bezeichnung Awkl = λkl wkl : λkl = h−2 {4 − 2 (cos(khπ) + cos(lhπ))}, w kl k, l = 1, . . . , m, = (sin(ikhπ) sin(jlhπ))i,j=1,...,m (h = 1/(m + 1)) . Also ist (für h ≪ 1) λmax = h−2 {4 − 4 cos (1 − h)π} ≈ 8h−2 , λmin = h−2 {4 − 4 cos (hπ)} = h−2 {4 − 4 (1 − 12 π 2 h2 + O(h4 ))} ≈ 2π 2 . und somit κ := cond2 (A) ≈ 4 π 2 h2 . (2.3.60) Die Eigenwerte der Jacobi-Matrix J = −D−1 (L + R) sind µkl = 1 2 (cos(khπ) + cos(lhπ)) (k, l = 1, . . . , m) Folglich wird ρJ = µmax = cos(hπ) = 1 − π2 2 h + O(h4 ) . 2 (2.3.61) Für die Iterationsmatrizen des Gauß-Seidel- und des (optimalen) SOR-Verfahrens gilt dann ρGS = ρ2GS = 1 − π 2 h2 + O(h4 ) , q 1 − 1 − ρ2J 1 − πh + O(h2 ) q = 1 − 2 πh + O(h2 ) . ρSOR = = 2) 1 + πh + O(h 1 + 1 − ρ2J Für die Iterationszahlen (pro Dezimalstelle Fehlerreduktion) ergibt sich also asymptotisch: TGS TSOR ln(10) 4, 6 ≈ π 2 h2 1 2N, ln(1 − ln(10) 2, 3 ≈− ≈ 2 2 ≈ 41 N , 2 2 ln(1 − π h ) π h √ 2, 3 ln(10) ≈ ≈ 13 N . ≈− ln(1 − 2πh) 2πh TJ ≈ − π2 2 2 h ) ≈ Der Vollständigkeit halber geben wir hier auch die entsprechenden Werte für das CG-Verfahren ( Verfahren der konjugierten Richtungen“): ” √ √ 3 ≈ N. TCG = 12 κ ln(20) ≈ πh 66 Differenzen-Verfahren für elliptische Probleme Das CG-Verfahren ist zwar langsamer als das optimale“ SOR-Verfahren, erfordert aber nicht ” die Bestimmung eines Iterationsparameters. Zum Vergleich der Effizienz der Iterationsverfahren muß natürlich auch der Aufwand pro Iterationsschritt berücksichtigt werden. Für die Anzahl OP der arithmetischen Operationen pro Iterationsschritt gilt (optimistische Schätzung) OPJ , OPGS , OPSOR ≈ 6 N , OPCG ≈ 10 N . Als Endresultat finden wir, daß zur Bestimmung der Lösung des diskretisierten Modellproblems das Jacobi-Verfahren, das Gauß-Seidel-Verfahren und das Gradientenverfahren O(N 2 ) OP benötigen. Das direkte Cholesky-Verfahren würde für die Berechnung der exakten“ Lösung ” (auf Rundungsfehlergenauigkeit) ebenfalls O(m2 N ) = O(N 2 ) OP benötigen, erscheint also dem Gauß-Seidel-Verfahren überlegen zu sein. Es ist jedoch zu berücksichtigen, daß letzteres nur O(N ) SP benötigt, im Gegensatz zu den O(mN ) = O(N 3/2 ) SP für das Cholesky-Verfahren. Die schnelleren, auf Mehrgitterkonzepten basierenden Iterationsverfahren sind dagegen dem einfachen direkten Löser asymptotisch klar überlegen. Für das Beispiel mit N = 104 ergibt sich überschlagsmäßig der folgende Gesamtaufwand GA“ zur sicheren Lösung des Systems (2.3.44) unter die Diskretisierungsgenauigkeit ( TOL = ” −3 10 , h = 10−2 , N = 104 ): GAJ (TOL) ≈ 4 · 3N 2 ≈ 1, 2 · 109 OP , GAGS (TOL) ≈ 4 · 1, 5N 2 ≈ 6 · 108 OP , GASOR (TOL) ≈ 4 · 2N 3/2 ≈ 8 · 106 OP , GACG (TOL) ≈ 4 · 10N 3/2 ≈ 4 · 107 OP . Für ein optimales“ Verfahren wie z.B. das Mehrgitterverfahren MG“ würde man hier wesent” ” lich bessere Werte erwarten: GAM G (TOL) ≈ 4 · 25N ≈ 106 OP . Bemerkung: In drei Raumdimensionen erhalten wir näherungsweise λmax ≈ 12h−2 , λmin ≈ 3π 2 , κ ≈ 8 , 3π 2 h2 und folglich im wesentlichen dieselben Abschätzungen für ρJ , ρGS und ρSOR sowie für die Iterationszahlen TJ , TGS , TSOR und TCG wie im zweidimensionalen Fall. Der Aufwand für die Durchführung eines Iterationsschritts ist hier OPJ , OPGS , OPSOR ≈ 8 N bzw. OPCG ≈ 12 N . Für den Gesamtlösungsaufwand ergibt dies dann: GAJ (TOL) ≈ 4 · 4N 2 ≈ 1, 6 · 1013 OP , GAGS (TOL) ≈ 4 · 2N 2 ≈ 8 · 1012 OP , GASOR (TOL) ≈ 4 · 3N 3/2 ≈ 1, 2 · 1010 OP , GACG (TOL) ≈ 4 · 12N 3/2 ≈ 4, 8 · 1010 OP . Der Aufwand des Mehrgitterverfahrens erhöht sich aber nur vergleichsweise unwesentlich auf GAM G (ε) ≈ 4 · 50N ≈ 2 · 108 OP . Zur Bewertung dieser Komplexitätsschätzungen muß man sich die Leistung heutiger Rechner vergegenwärtigen. Ein normaler Arbeitsplatzrechner leistet real etwa 200 MFlops (200 Millio- 2.3 Lösungsaspekte 67 nen Floating-Point“ Operationen pro Sekunde). Das SOR-Verfahren braucht dann auf einem ” solchen Rechner zur Lösung des Gleichungssystems (auf Diskretisierungsfehlergenauigkeit) etwa 1, 5 Minuten, wogegen das Mehrgitterverfahren nur“ 1 Sekunde benötigt. ” 68 Differenzen-Verfahren für elliptische Probleme 2.4 Übungen Übung 2.1: Man betrachte die Diskretisierung der 1. RWA des Laplace-Operators auf dem Einheitsquadrat des R2 mit dem 9-Punkte-Differenzenschema (sog. “Mehrstellenformel”) (9) −∆h uh (x, y) = f (x, y), (x, y) ∈ Ωh , mit dem “gestreckten” Differenzenoperator (9) ∆h u(x, y) := o 1 n − u(x ± 2h, y) + 16u(x ± h, y) − u(x, y ± 2h) + 16u(x, y ± h) − 60u(x, y) 12h2 und dem 9-Punkte-Differenzenschema (9) −∆h uh (x, y) = f (x, y) + 1 2 12 h ∆f (x, y), (x, y) ∈ Ωh mit dem “kompakten” Differenzenoperator n o ¯ (9) u(x, y) = 1 4u(x ± h, y) + 4u(x, y ± h) + u(x ± h, y ± h) − 20u(x, y) . ∆ h 6h2 Man zeige, daß dies Approximationen mit der Konsistenzordnung m = 4 sind. Übung 2.2: In vielen Fällen kann die asymptotische Konvergenzordnung eines Differenzenverfahrens nur experimentell bestimmt werden. Dazu werden bei bekannter exakter Lösung für zwei Schrittweiten h und h/2 die Fehler eh := u − uh und eh/2 := u − uh/2 berechnet und dann die Ordnung α über den formalen Ansatz ku − uh kh = hα mit einer geeigneten Gitternorm k · kh aus der folgenden Formel ermittelt: α= log(keh kh /keh/2 kh ) . log(2) a) Man rechtfertige diese Formel und überlege, wie man vorgehen kann, wenn keine exakte Lösung u bekannt ist. b) Man bestimme die inhärente Konvergenzordnungen der folgenden Zahlenfolgen: h = 2−1 33.627 26.570 −2 h=2 30.318 27.008 h = 2−3 29.100 27.883 −4 h=2 28.586 28.072 h = 2−5 28.351 28.117 Übung 2.3: Man betrachte die Diskretisierung der 1. RWA des Laplace-Operators auf dem Einheitsquadrat des R2 mit dem 9-Punkte-Differenzenschema (9) ∆h uh (x, y) = fh (x, y) := f (x, y) + 1 2 12 h ∆f (x, y), (x, y) ∈ Ωh , 2.4 Übungen 69 mit dem “kompakten” Differenzenoperator (9) ∆h u(x, y) = o 1 n 4u(x ± h, y) + 4u(x, y ± h) + u(x ± h, y ± h) − 20u(x, y) . 6h2 Diese Approximationen hat nach Aufgabe 3.3 die Konsistenzordnung m = 4 . a) Man zeige mit den Mitteln der Vorlesung die Fehlerabschätzung max |u(P ) − uh (P )| ≤ cM6 (u)h4 . P ∈Ωh b) (Zusatzaufgabe für Leute mit Ergeiz und Zeit) Im Falle eines allgemeinen, glattberandeten Gebiets Ω ⊂ R2 werde entlang der gekrümmten Randabschnitte die Shortley-WellerApproximation betrachtet: (9) −∆h uh = f + 1 2 12 h ∆f in Ωh , −∆∗h uh = f in Ω∗h , uh = g auf ∂Ωh . Man zeige hierfür mit den Mitteln der Vorlesung die Fehlerabschätzung max |u(P ) − uh (P )| ≤ c {M6 (u)h4 + M3 (u)h3 }. P ∈Ωh Übung 2.4: Sei Ah die zum 5-Punkte-Operator auf dem Einheitsquadrat gehörende N × N Matrix (bei zeilenweiser Nummerierung der Gitterpunkte mit m Punkten in jeder Zeile). Die N = m2 Eigenvektoren wνµ , ν, µ = 1, . . . , m , und die zugehörigen Eigenwerte λνµ von Ah sind gegeben durch: wνµ (x, y) = sin(νπx) sin(µπy), (x, y) ∈ Ωh , λνµ = 1 4 − 2(cos(νhπ) + cos(µhπ) . h2 Man zeige, daß für die Spektralkondition von Ah gilt: cond2 (Ah ) =: 4 λmax (Ah ) = 2 2 + O(1). λmin (Ah ) π h Übung 2.5: Eine Matrix A ∈ RN ×N heißt “M-Matrix”, wenn sie von nichtnegativem Typ und (−1) (−1) regulär ist und wenn ihre Inverse A−1 = (aij )N ≥ 0. i,j=1 elementweise nichtnegativ ist: aij Das 5-Punkte-Differenzenschema (bzw. das Shortley-Weller-Schema) zur Approximation der 1. RWA des Laplace-Operators führt z.B. auf eine solche M-Matrix. a) Man zeige, daß M-Matrizen “invers-monoton” sind, d.h.: Für Vektoren v, w ∈ RN gilt komponentenweise: Av ≥ Aw ⇒ v ≥ w. b) Ist ferner Ah w ≥ (1, . . . , 1)T für einen Vektor w ∈ RN , so folgt bzgl. der Maximumnorm bzw. Maximalen-Zeilensummen-Norm: kA−1 h k∞ ≤ kwk∞ . c) Man zeige mit Hilfe von (b), daß für die Systemmatrix Ah des 5-Punkte-Schemas auf dem 70 Differenzen-Verfahren für elliptische Probleme Einheitsquadrat die Abschätzung kA−1 h k∞ ≤ 1/8 gilt, und folgere hiermit für die l∞ -Kondition von Ah : −2 cond∞ (Ah ) := kAh k∞ kA−1 h k∞ ≤ h . Die l∞ -Kondition von Ah verhält sich also in Abhängigkeit von der Gitterweite h genauso wie die Spektralkondition. (Hinweis: Man versuche es mit der mit w(x, y) = x(1 − x)/2 + y(1 − y)/2 gebildeten Gitterfunktion.) Übung 2.6: Gegeben sei die 1. RWA des Laplace-Operators −∆u = f in Ω, u = 0 auf ∂Ω, auf dem Dreiecksgebiet Ω = {(x, y) ∈ R2 | x, y > 0, x + y < 1} . Man stelle zu einem äquidistanten, kartesischen Gitter das Gleichungssystem der 5-Punkte-Differenzenapproximation auf und vergleiche (a) die zeilenweise, (b) die diagonale und (c) die schachbrettartige Gitterpunktnumerierung in Bezug auf Matrixstruktur, Speicherplatzbedarf und Rechenaufwand bei der Lösung mit dem LR-Verfahren unter Ausnutzung der Bandstruktur. Übung 2.7: Zur Auffrischung der Kenntnise über iterative Lösungsverfahren: Eine Vereinfachung des Jacobi-Verfahrens zur Lösung eines linearen N ×N -Gleichungssystems Ax = b ist das sog. “Richardson-Verfahren”. Dabei wird ausgehend von einem beliebigen Startvektor x0 ∈ RN mit einem Dämpfungsparameter θ ∈ R wie folgt iteriert: xt+1 = xt − θ(Axt − b), t = 0, 1, 2, . . . . a) Im Falle, daß A nur reelle Eigenwerte λmin ≤ · · · ≤ λ ≤ · · · ≤ λmax besitzt, zeige man für den Spektralradius ρ(Bθ ) der zugehörigen Iterationsmatrix Bθ = I − θA die Gleichung ρ(Bθ ) = max |1 − θλmin |, |1 − θλmax | . b) Im Falle, daß zusätzlich alle Eigenwerte positiv sind, zeige man ρ(Bθ ) < 1 ⇔ 0<θ< 2 λmax . c) Für welchen Wert von θ wird ρ(Bθ ) in dieem Falle minimal? Übung 2.8: Betrachtet werde wieder das Modellproblem −∆u = f in Ω, u = 0 auf ∂Ω, auf dem Einheitsquadrat Ω ⊂ R2 . Die Systemmatrix des 5-Punkte-Diffrenzenoperators auf einem äquidistanten, kartesischen Punktgitter läßt sich schreiben als Summe der Anteile der beiden Differenzenquotienten in x- und y-Richtung: A = Ax + Ay . Bei lexikographischer Numerierung sind dabei Ax und Ay reguläre Tridiagonalmatrizen mit den Einträgen 2h−2 auf den Hauptdiagonalen und −h−2 verteilt auf den Nebendiagonalen. Das zugehörige Gleichungssystems 2.4 Übungen 71 AU = F besitzt damit die äquivalenten Formen (σI + Ax )U = (σI − Ay )U + F, (σI + Ay )U = (σI − Ax )U + F mit einem beliebigen Parmeterwert σ > 0. Dies legt das folgende zweistufige Iterationsverfahren (sog. “ADI-Verfahren” = “Alternating Direction Implicit Iteration”) nahe: (σI + Ax )U t+1/2 = (σI − Ay )U t + F, (σI + Ay )U t+1 = (σI − Ax )U t+1/2 + F. Man zeige die Konvergenz dieses Verfahrens. Für welche Wahl von σ wird die Konvergenz am schnellsten? (Hinweis: Man überlege sich, daß die Zerlegungsmatrizen Ax und Ay ein gemeinsames System von Eigenvektoren besitzen und folglich vertauschbar sind.) 72 Differenzen-Verfahren für elliptische Probleme 3 Finite-Elemente-Verfahren für elliptische Probleme In diesem Kapitel werden wir die modernen Finite-Elemente-(Galerkin)-Methoden zur Lösung elliptischer Randwertaufgaben diskutieren. Der Übersichtlichkeit halber werden wir uns dabei auf das Modellproblem der Poisson-Gleichung mit Dirichletschen Randbedingungen, d.h. auf die 1. RWA, beschränken: Lu := −∆u = f in Ω, u = g auf ∂Ω. (3.0.1) Das Definitionsgebiet Ω ∈ R2 wird zunächst wieder als glatt berandet oder als konvexes Polygongebiet vorausgesetzt. Die Problemdaten f, g sind ebenfalls glatt, so daß die im vorigen Kapitel beschriebenen Resultate anwendbar sind. Erweiterungen für Probleme mit variablen Koeffizienten oder anderen Randbedingungen sowie auf drei Raumdimensionen werden wieder in Bemerkungen berücksichtigt. 3.1 Allgemeine Projektionsverfahren Ausgangspunkt ist die variationelle Formulierung der Randwertaufgabe. Wir erinnern an den oben diskutierten Ansatz zu einer allgemeinen Lösungstheorie. Eine schwache bzw. verallgemeinerte Lösung der 1. RWA des Laplace-Operators (zu den Randdaten g ≡ 0 ) ist definiert als das (eindeutige) Minimum auf dem Sobolew-Raum H01 (Ω) des Energiefunktionals E(v) := 21 k∇vk2 − (f, v) → min. Wir verwenden hier und im folgenden wieder die Bezeichnungen Z 1/2 1/2 Z Z 2 |v(x)| dx |∇v(x)|2 dx v(x)w(x) dx, kvk := , k∇vk := . (v, w) := Ω Ω Ω Über den Variationsansatz d E(u + εϕ)|ε=0 = 0 dε ∀ϕ ∈ H01 (Ω) erhalten wir die äquivalente Variationsgleichung (Stationäritätsbedingung) u ∈ H01 (Ω) : (∇u, ∇ϕ) = (f, ϕ) ∀ϕ ∈ H01 (Ω). (3.1.2) Wir erinnern daran, daß das natürliche Skalarprodukt des Raumes H01 (Ω) gerade durch (∇v, ∇w) gegeben ist. Zum Nachweis der Definitheit dieses Ausdrucks haben wir die Poincarésche Ungleichung verwendet: kvk ≤ dΩ k∇vk, v ∈ H01 (Ω). (3.1.3) Bemerkung 3.1: Im Falle inhomogener Randbedingungen u|∂Ω = g geht man wie folgt vor. Wir nehmen an, daß die Randwerte als Spur einer Funktion ḡ ∈ H 1 (Ω) gegeben sind: g = ḡ|∂Ω . Für die Funktion v := u − ḡ ∈ H01 (Ω) gilt dann im Falle ∆ḡ ∈ L2 (Ω) : (∇v, ∇ϕ) = (f, ϕ) − (∆ḡ, ϕ) =: (f˜, ϕ) 73 ∀ϕ ∈ H01 (Ω), 74 Finite-Elemente-Verfahren für elliptische Probleme d.h.: Die Funktion v genügt einer Variationsgleichung der Art (3.1.2). Im folgenden können wir also o.B.d.A. stets homogene Dirichlet-Randbedingungen annehmen. Bemerkung 3.2: Im Fall von Neumannschen Randbedingungen ∂n u|∂Ω = g wird der SobolewRaum H 1 (Ω) (ohne Vorgabe von Randwerten) verwendet und die zugehörige variationelle Formulierung lautet u ∈ H 1 (Ω) : (∇u, ∇ϕ) = (f, ϕ) + (g, ϕ)∂Ω ∀ϕ ∈ H 1 (Ω). (3.1.4) Um die eindeutige Lösbarkeit zu sichern, muß in diesem Fall noch eine Zusatzbedingung gestellt werden, um konstante Lösungen auszuschließen, z.B.: die Normierungsbedingung (u, 1)Ω = 0 . Ferner muß die Verträglichkeitsbedingung (f, 1)+(g, 1)∂Ω = 0 erfüllt sein. Jede hinreichend glatte Lösung von (3.1.4) erfüllt dann neben der Differentialgleichung −∆u = f auch notwendig die in der variationellen Formulierung implizit enthaltene natürliche Randbedingung ∂n u|∂Ω = g (Beweis ähnlich wie im Fall der 1. RWA durch partielle Integration und Variation der Testfunktion). Eine ähnliche Konstruktion liefert auch die variationelle Formulierung im Fall der 3. RWA, d.h. für Robinsche Randbedingungen. Bemerkung 3.3: Nicht alle elliptischen Randwertaufgaben lassen sich über den Energieminimierungsansatz behandeln. Ein typisches Beispiel ist die Diffusions-Transport-Gleichung −∆u + ∂1 u = f in Ω, u = g auf ∂Ω. (3.1.5) Ihre variationelle Formulierung lautet (∇u, ∇ϕ) + (∂1 u, ϕ) = (f, ϕ) ∀ϕ ∈ H01 (Ω). (3.1.6) Diese besitzt ebenfalls eine eindeutige Lösung u ∈ H01 (Ω) , was sich weiter unten als Folgerung eines allgemeineren Resultats ergeben wird. Die folgende Diskussion wird in einem etwas abstrakteren Rahmen durchgeführt, welche an den obigen Beispielen orientiert ist und diese als Sonderfälle beinhaltet. Seien V ein Hilbert1/2 Raum mit Skalarprodukt (·, ·)V und zugehöriger Norm k·kV := (·, ·)V und a(·, ·) : V ×V → R eine beschränkte Bilinearform sowie l(·) : V → R eine beschränkte Linearform: |a(v, w)| ≤ αkvkV kwkV , |l(v)| ≤ γkvkV , v, w ∈ V. (3.1.7) Mit diesen Bezeichnungen betrachten wir die folgende allgemeine Variationsgleichung: Bestimme u ∈ V , so daß a(u, ϕ) = l(ϕ) ∀ϕ ∈ V. (3.1.8) Zum Nachweis, daß diese Aufgabe auch eine Lösung besitzt, postulieren wir, daß die Bilinearform a(·, ·) (stark) V -elliptisch“ ist, d.h.: ” a(v, v) ≥ κkvk2V , v ∈ V, (3.1.9) mit einer Konstante κ > 0 . Allgemeiner wird die Bilinearform a(·, ·) koerzitiv“ (oder regulär“) ” ” genannt, wenn 3.1 Allgemeine Projektionsverfahren sup ϕ∈V 75 a(v, ϕ) ≥ γ kvkV , kϕkV sup ϕ∈V a(ϕ, v) ≥ γ kvkV , kϕkV v ∈ V, (3.1.10) mit einer Konstante γ > 0 . Hilfssatz 3.1: (Lax1 -Milgram2 -Lemma) Unter den obigen Voraussetzungen besitzt die Gleichung (3.1.8) eine eindeutige Lösung u ∈ V , für welche die a priori Abschätzung gilt: kukV ≤ α klkV ∗ , κ (3.1.11) mit der Dualnorm“ klkV ∗ := sup{ϕ∈V, kϕk=1} |l(ϕ)| . ” Beweis: Für jedes feste v ∈ V definiert a(v, ·) ein lineares, stetiges Funktional auf V . Nach dem Rieszschen3 Darstellungssatz existieren Elemente Av ∈ V und f ∈ V , so daß a(v, ϕ) = (Av, ϕ)V , l(ϕ) = (f, ϕ)V , ϕ ∈ V. Die Zuordnung v 7→ Av definiert eine lineare Abbildung mit der Eigenschaft kAvkV ∗ ≤ αkvkV , d.h.: A ist beschränkt. Die Aufgabe (3.1.8) ist offenbar äquivalent zu der Gleichung Au = f . (3.1.12) Wir wollen zeigen, daß die Abbildung v ∈ V 7→ Tδ v := v − δ(Av−f ) ∈ V für einen geeigneten Wert δ > 0 eine Kontraktion auf ganz V ist. Dann besitzt die Fixpunktgleichung Tδ v = v eine eindeutige Lösung u ∈ V , welche wegen 0 = v − Tδ v = δ(Av − f ) dann auch (eindeutige) Lösung von (3.1.12) bzw. (3.1.8) ist. Die Kontraktionseigenschaft ergibt sich aus der Beziehung kv − δAvk2V = kvk2V − 2δ a(v, v) + δ2 kAvk2V ≤ (1 − 2δκ + δ2 α2 )kvk2V , für 0 < δ < 2κ/α2 . Q.E.D. 1 Peter D. Lax (1926-): US-amerikanischer Mathematiker ungarischer Abstammung; Prof. an der New York University und am Courant-Institut; wichtige Beiträge zur Analysis, insbesondere zu den partiellen Differentialgleichungen der Math. Physik, und zur Numerik. 2 A. N. Milgram (????-????): US-amerikanischer Mathematiker; Topologe. 3 Frigyes Riesz (1880-1956): ungarischer Mathematiker; Prof. in Szeged und Budapest; fundamentale Beiträge zur Funktionalanalysis, insbesondere der Fourier-Analysis im Hilbert-Raum als theoretische Grundlage der frühen Quantenmechanik. 76 Finite-Elemente-Verfahren für elliptische Probleme Die beiden obigen Beispiele zur 1. RWA passen in diesen Rahmen mit den Setzungen V := H01 (Ω) , l(v) := (f, ϕ) und a(v, w) := (∇v, ∇w), a(v, w) := (∇v, ∇w) + (∂1 v, w). Die Beschränktheit dieser Formen ergibt sich direkt mit Hilfe der Hölderschen und der Poincaréschen Ungleichung. Ihre V -Elliptizität ergibt sich unmittelbar: a(v, v) = k∇vk2 = kvk2V , bzw. unter Beachtung von v|∂Ω = 0 : a(v, v) = k∇vk2 + (∂1 v, v) = k∇vk2 + 12 (∂1 v 2 , 1) = k∇vk2 + 12 (n1 v 2 , 1)∂Ω = k∇vk2 = kvk2V . Durch geeignete Setzungen lassen sich auch die variationellen Formulierungen der 2. und 3. RWA in diesen abstrakten Rahmen einordnen. Zur Approximation der Variationsgleichung (3.1.2) werden endlich dimensionale Teilräume Vh ⊂ V (0 < h ≤ h0 ) ausgewählt, deren Feinheit durch einen Diskretisierungsparameter h (z.B.: Gitterweite) charakterisiert ist. (i) Im Fall einer symmetrischen Bilinearform a(·, ·) bestimmt das klassische Ritzsche4 Projek” tions-Verfahren“ Näherungslösungen uh ∈ Vh durch die Vorschrift E(uh ) = min E(vh ) vh ∈V (3.1.13) oder äquivalent durch die diskrete Variationsgleichung a(uh , ϕh ) = (f, ϕh ) ∀ϕh ∈ Vh . (3.1.14) Die (eindeutige) Existenz der diskreten Lösung uh ∈ Vh folgt mit demselben Argument wie beim kontinuierlichen Problem. Diese Analogie der Schlußweisen von kontinuierlicher und diskreter (endlich dimensionaler) Situation ist die charakteristische Stärke der Projektionsmethoden im Gegensatz zu den Differenzenverfahren. Die Bezeichnung Projektionsverfahren ist motiviert durch die Beziehung a(u − uh , ϕh ) = 0 ϕh ∈ Vh , (3.1.15) welche man durch Subtraktion der Gleichungen (3.1.2) und (3.1.14) erhält. Sie kann geometrisch dahingehend interpretiert werden, daß der Fehler eh := u − uh bzgl. des Skalarprodukts a(·, ·) senkrecht auf dem Ansatzraum Vh steht. Dies impliziert auch die sog. Bestapproxi” mationseigenschaft“ für den Approximationsfehler eh bzgl. der natürlichen Energie-Norm“ ” 4 Walter Ritz (1878-1909): schweizer Physiker; Prof. in Zürich und Göttingen; Beiträge zu Spektraltheorie in der Kernphysik und Elektro-Magnetismus. 3.1 Allgemeine Projektionsverfahren 77 k · ka := a(·, ·)1/2 , denn mit beliebigem ϕh ∈ Vh gilt: keh k2a = a(eh , eh ) = a(eh , u − ϕh ) + a(eh , ϕh − uh ) ≤ keh ka ku − ϕh ka bzw. keh ka ≤ inf ku − ϕh ka . ϕh ∈Vh (3.1.16) Da die Normen k · ka und k · kV auf V äquivalent sind, ist die Frage nach der Konvergenz des Projektionsverfahrens, keh kV → 0 (h → 0), (3.1.17) damit zurückgeführt auf die Frage der Approximierbarkeit von Funktionen u ∈ V durch Ansatzfunktionen ϕh ∈ Vh : inf ku − ϕh kV → 0 (h → 0). ϕh ∈Vh (3.1.18) (ii) Wenn die Bilinearform a(·, ·) nicht symmetrisch ist, wie beim obigen Diffusions-TransportProblem, kann die zugehörige RWA nicht mehr durch ein Minimierungsproblem charakterisiert werden. Das allgemeine Galerkinsche5 (Projektions)-Verfahren“ geht direkt von der Variations” gleichung (3.1.2) aus und bestimmt Näherungen durch die Beziehung a(uh , ϕh ) = (f, ϕh ) ∀ϕh ∈ Vh . (3.1.19) Wegen der V -Elliptizität der Bilinearform a(·, ·) auf dem endlich dimensionalen Teilraum Vh folgt unmittelbar die Existenz der (eindeutigen) Lösung uh ∈ Vh . Die Orthogonalitätsbeziehung (3.1.15) bleibt dabei gültig. Damit erschließen wir die Quasi-Best-Approximationseigenschaft (Übungsaufgabe) keh kV ≤ α min ku − ϕh kV . κ ϕ∈Vh (3.1.20) (iii) Eine noch allgemeinere Variante, bei der Ansatzraum Vhansatz und Testraum Vhtest unterschiedlich gewählt werden, u ∈ Vhansatz : a(uh , ϕh ) = (f, ϕh ) ∀ϕh ∈ Vhtest , (3.1.21) ist das sog. Petrow6 -Galerkin-Verfahren“. Wir werden später Beispiele für diesen unkonven” tionellen Ansatz kennenlernen. Zur praktischen Realisierung des Projektionsverfahrens muß die zunächst abstrakte Variationsgleichung (3.1.19) im Funktionenraum algebraisiert werden, d.h.: in ein äquivalentes algebraisches Gleichungssystem umgewandelt werden. Dazu wählen wir zunächst eine Basis 5 Boris Grigorievich Galerkin (1871-1945): russischer Bauingenieur und Mathematiker; Prof. in St. Petersburg; Beiträge zur Struktur-Mechanik, insbesondere zur Plattentheorie. 6 Georgi Iwanowitsch Petrow (1912-1987): russischer Ingenieur; 1965-1973 Direktor des Instituts für Raumfahrtforschung; Publ.: “Application of the Galerkin method and the problem of flow stability of a viscous liquid” (russ.), Prikl. Mat. Mekh. 4, 36-47 (1947) 78 Finite-Elemente-Verfahren für elliptische Probleme (i) {ϕh , i = 1, ..., N }, N := dim Vh , von Vh aus und machen für die zu bestimmende diskrete P (j) Lösung den Ansatz uh = N j=1 ξj ϕh . Wird dies in (3.1.19) eingesetzt und läßt man die Testfunktionen ϕh ∈ Vh alle Basisfunktionen durchlaufen, ergibt sich ein lineares (algebraisches) N × N -Gleichungssystem N X (j) (i) (i) ξj a(ϕh , ϕh ) = (f, ϕh ), i = 1, ..., N, j=1 für den Vektor ξ = (ξj )N j=1 der Entwicklungskoeffizienten, bzw. in kompakter Schreibweise Ah ξ = bh . (3.1.22) N Dabei sind die Koeffizientenmatrix Ah = (aij )N i,j=1 sowie die rechte Seite bh = (bi )i=1 durch die spezielle Wahl der Basis bestimmt: (j) (i) (j) bj = (f, ϕh ). aij = a(ϕh , ϕh ), Die Entwicklungskoeffizienten ξj können sehr unterschiedliche Bedeutung haben; z.B.: MonomKoeffizienten einer Polynomdarstellung, Fourier-Koeffizienten einer trigonometrischen Entwicklung, Knotenwerte einer stückweise polynomialen Funktion, u.s.w.. Die Eigenschaften der Bilinearform a(·, ·) übertragen sich direkt auf die zugehörige Matrix Ah . Ist a(·, ·) symmetrisch, so auch Ah , (j) (i) (i) (j) aij = a(ϕh , ϕh ) = a(ϕh , ϕh ) = aji , und die V -Elliptizität von a(·, ·) impliziert die Definitheit von Ah , denn für x ∈ Rn \ {0} gilt: (Ah x, x) = N X aij xi xj = i,j=1 N X (j) (i) a(ϕh , ϕh )xi xj i,j=1 N N N X X X (i) 2 (i) (j) xi ϕh > 0. xi ϕh ≥ κ =a xj ϕh , j=1 i=1 i=1 V 3.1.1 Beispiele von Galerkin-Ansatzräumen Wir wollen einige konkrete Realisierungen für den beschriebenen abstrakten Rahmen diskutieren. Bei der Wahl der Ansatzräume Vh ⊂ V = H01 (Ω) sowie der Basen zur Aufstellung der Gleichungssysteme (3.1.22) sind einige Bedingungen zu beachten: (j) (i) (i) – Die Berechnung der Matrixelemente aij = a(ϕh , ϕh ) sowie die der rechten Seite (f, ϕh ) sollte billig“ sein. ” – Aus Genauigkeitsgründen wird die Problemdimension in der Regel sehr groß sein: N ≫ 100 . Die Matrix Ah sollte daher möglichst dünn besetzt sein. – Die Matrix Ah sollte nicht zu schlecht konditioniert sein; akzeptabel sind z.B. beim vorliegenden Problem cond2 (Ah ) ≈ O(N ) − O(N 2 ) , wogegen cond2 (Ah ) ≈ O(N 4 ) − O(eN ) nicht praktikabel wären. Beispiele von solchen Ansätzen sind: 3.1 Allgemeine Projektionsverfahren 79 1) Globaler Polynomansatz: Auf einem Quadrat Ω = (0, 1)2 wird der Tensor-Produkt-Ansatz gemacht m X cij xi y j , h := 1/m, N = (m + 1)2 . Vh := Qm (Ω) := p(x, y) = i,j=0 Als Basen kommen dabei in Frage: a) Monombasis 1, x, y, x2 , xy, y 2 , ... ; die zugehörige Matrix A mit den Elementen aij = Z 0 1Z 1 0 ∇xi · ∇y j dx dy, 0 ≤ i, j ≤ m, verhält sich dann wie die bekannte Hilbert-Matrix mit exponentiell mit N wachsender Kondition cond2 (Ah ) = O(eN ) . Dieser Ansatz ist also praktisch unbrauchbar. b) Tensorprodukt-Basen L2 -orthogonaler Polynome wie z.B. Legendre-Polynome oder Tschebyscheff-Polynome; die zugehörige Matrix Ah mit den Elementen Z 1Z 1 (m) (m) ∇Li · ∇Lj dx dy, 0 ≤ i, j ≤ m, aij = 0 0 ist dann zwar voll besetzt, hat aber eine wesentlich günstigere Kondition, cond2 (Ah ) = O(N ) . Dieser Ansatz führt auf die sog. Spektral-Galerkin-Verfahren“, welche bei Problemen auf geo” metrisch einfachen (rechteckigen) Gebieten sehr leistungsfähig sind. Die Bezeichnung Spek” tralverfahren“ rührt daher, daß man die orthogonalen Polynome auch als Eigenfunktionen gewisser Differentialoperatoren 2. Ordnung charakterisieren kann. Wegen ihrer konzeptionellen Beschränkung auf einfache Geometrien wollen wir derartige Methoden hier nicht weiter diskutieren. Stichworte für Entwicklungen in Richtung auf eine Überwindung dieser Restriktion sind z.B. Spektral-Elemente-Methoden“ und h/p-Finite-Elemente-Methode“. ” ” 2) Globaler trigonometrischer Ansatz ( echte Spektralverfahren“): Wieder auf einem Quadrat ” Ω = (0, 1)2 wird der Tensor-Produkt-Ansatz gemacht m X cij sin(iπx) sin(jπy) , Vh := Tm (Ω) := t(x, y) = h := 1/m, N = (m + 1)2 . i,j=0 Als Basen verwendet man dabei die natürliche trigonometrische Basis {1, sin(nπx) sin(mπy), ...} . Die zugehörige Matrix Ah ist dann vergleichsweise gut konditioniert, cond2 (Ah ) = O(N ) . In diesem Fall gibt es mit der schnellen Fourier-Transformation ( FFT“) einen fast optimalen ” Algorithmus mit der Komplexität O(N ln(N )) zur Lösung des Gleichungssystems (3.1.22). Der Nachteil dieses in Spezielfällen sehr leistungsfähigen Ansatzes ist wieder seine Beschränktheit auf einfache Rechteckgeometrien und sog. separable“ Differentialoperatoren mit konstanten ” Koeffizienten. 3) Stückweise polynomialer Ansatz ( Finite Elemente“): Um das Problem der Approximation ” allgemeiner Gebiete zu lösen, werden Ansatzfunktionen (auch Formfunktionen“ genannt) ver” wendet, welche bzgl. einer Zerlegung von Ω in einfache Teilgebiete T , sog. Zellen“, stückweise ” polynomial sind. Gängige Beispiele von Zellen sind Dreiecke oder (konvexe) Vierecke in zwei bzw. Tetraeder oder (konvexe) Hexaeder in drei Dimensionen. Der Parameter h ist in diesem 80 Finite-Elemente-Verfahren für elliptische Probleme Fall etwa der maximale Zelldurchmesser. Wir illustrieren diesen Finite-Elemente-Ansatz anhand eines einfachen Beispiels. Die 1. RWA (3.1.2) sei auf einem (konvexen) polygonalen Gebiet Ω ⊂ R2 mit homogenen Randwerten u|∂Ω = 0 und rechter Seite f ∈ L2 (Ω) gestellt. Die zugehörige Lösung u ∈ H01 (Ω) ist dann auch im Sobolew-Raum H 2 (Ω) und genügt der a priori Abschätzung k∇2 uk ≤ cs kf k, (3.1.23) wobei cs = 1 im Falle eines konvexen Gebiets. Weiter sei eine Folge von Zerlegungen Th = {T } des Gebiets Ω in abgeschlossene Dreiecke T ( Triangulierung“) gegeben mit h := maxT diam(T ) → 0 . Wir stellen die folgenden ” Regularitätsbedingungen an diese Triangulierung: S i) Strukturregularität: Je zwei Dreiecke der Zerlegung Ω = {T ∈ Th } überlappen sich höchstens in gemeinsamen Eckpunkten oder in ganzen Seiten, d.h.: Sog. hängende“ Knoten ” sind hier nicht erlaubt. ii) Formregularität: Alle Dreicke der Triangulierungen T ∈ Th sind von ähnlicher Gestalt, d.h.: Für den Inkreisradius ρT und Umkreisradius hT eines jeden Dreiecks T gilt gleichmäßig für h → 0: max T ∈Th hT ≤ c1 ρT (3.1.24) iii) Größenregularität: Alle Dreiecke einer Triangulierung Th sind von gleicher Größenordnung, d.h.: Es gilt gleichmäßig für h → 0 : max hT ≤ c2 min hT . T ∈Th T ∈Th (3.1.25) T Ω Abbildung 3.1: Finite-Elemente: Dreiecks- bzw. Vierecksgitter Auf den Triangulierungen Th definieren wir Ansatzräume stückweise linearer Funktionen ( lineare finite Elemente“: Verallgemeinerung des Konzepts eines Polygonzugs auf höhere Raum” dimensionen): (1) Vh := {vh ∈ C(Ω)| vh|T ∈ P1 (T ), T ∈ Th , v|∂Ω = 0} . Dabei bezeichnet allgemein Pr (T ) den Vektorraum der Polynome bis zum Grad r ≥ 0 über (1) T . Man überlegt sich leicht, daß dadurch tatsächlich Teilräume Vh ⊂ H01 (Ω) erklärt sind. Sei 3.1 Allgemeine Projektionsverfahren 81 (1) N die Anzahl der inneren“ Knoten (Dreieckseckpunkte) der Triangulierung. Jedes vh ∈ Vh ” ist als stückweise lineare Funktion eindeutig durch Vorgabe ihrer Funktionswerte ( Knotenwer” te“) in den inneren“ Dreieckseckpunkten ( Knoten“) festgelegt. In den Eckpunkten auf dem ” ” (1) Gebietsrand ∂Ω ist vh = 0 wegen der Dirichlet-Randbedingung. In Vh gibt es daher eine natürliche Basis, die sog. Knotenbasis“ in Analogie zur Lagrange7 -Basis“ bei der eindimen” ” sionalen Lagrange-Interpolation. Jedem Knoten ai wird durch die Bedingung ϕih (aj ) = δij , (1) eindeutig eine Funktion ϕih ∈ Vh stellung j = 1, ..., N, (1) zugeordnet. Damit gilt dann für jedes vh ∈ Vh vh = N X die Dar- (i) vh (ai )ϕh . i=1 (i) {ϕh , (1) i = 1, ..., N } tatsächlich eine Basis von Vh Daraus folgt, daß jeder kontinuierlichen Funktion v ∈ C(Ω) durch die Vorschrift Ih v := N X ist. Umgekehrt läßt sich (i) v(ai )ϕh i=1 (1) eindeutig eine (stückweise lineare) Interpolierende“ Ih v ∈ Vh ” (1) vh für vh ∈ Vh . zuordnen. Offenbar ist Ih vh ≡ Dieser Diskretisierungsansatz erfüllt offensichtlich die oben formulierten Anforderungen an ein brauchbares Galerkin-Verfahren: Die resultierende Systemmatrix Ah ist dünn besetzt (wegen der geringen Überlappung der Träger der Basisfunktionen), und ihre Elemente sind sehr leicht zu berechnen. Wir werden die praktische Berechnung von A im Zusammenhang mit allgemeineren Finite-Elemente-Ansätze dieser Art noch eingehender diskutieren. Abbildung 3.2: Knotenbasisfunktionen: Lineare und bilineare Ansätze Für die Kondition der Matrix Ah werden wir später in zwei Dimensionen cond2 (Ah ) = O(h−2 ) = O(N ) zeigen (ähnlich wie bei der 5-Punkte-Differenzendiskretisierung). Wir reka7 Joseph Louis de Lagrange (1736-1813): französischer Mathematiker; 1766-87 Direktor der mathem. Klasse der Berliner Akademie, dann Prof. in Paris; bahnbrechende Arbeiten zur Variationsrechnung, zur komplexen Funktionentheorie sowie zur theor. Mechanik und Himmelsmechanik. 82 Finite-Elemente-Verfahren für elliptische Probleme (1) pitulieren für das Galerkin-Verfahren mit dem Finite-Elemente-Raum Vh Abschätzung für den Fehler eh := u − uh : k∇eh k = min (1) ϕh ∈Vh k∇(u − ϕh )k. die asymptotische (3.1.26) (1) Die Frage ist also, ob es ϕh ∈ Vh gibt, so daß k∇(u − ϕh )k → 0 (h → 0) . Wenn man nur weiß, daß u ∈ H01 (Ω) ist, dann kann man nur qualitative Konvergenz zeigen. Viel interessanter wäre es, wieder die Konvergenzgeschwindigkeit in Potenzen der Gitterweite h zu kennen. Hierzu ist aber natürlich mehr Regularität der Lösung u erforderlich. Für den stückweise linearen Ansatz werden wir später im Rahmen einer allgemeinen Theorie die folgende Interpolationsabschätzung zeigen: k∇(v − Ih v)k ≤ ci h k∇2 vk, v ∈ H01 (Ω) ∩ H 2 (Ω). (3.1.27) (Man vergleiche die analoge Abschätzung, welche in einer Dimension bei der Finite-ElementeApproximation eindimensionaler Sturm-Liouville-Probleme verwendet wird.) Unter den bisher formulierten Voraussetzungen läßt sich eine erste quantitative Konvergenzaussage für das FiniteElemente-Verfahren ableiten. Satz 3.1 (Konvergenzsatz): Für die Galerkin-Approximation des Modellproblems (3.1.2) mit linearen“ finiten Elementen gelten unter den obigen Voraussetzungen die Fehlerabschätzungen ” k∇eh k ≤ ci cs h kf k, keh k ≤ c2i c2s h2 kf k, (3.1.28) (3.1.29) mit den Konstanten ci , cs aus den Ungleichungen (3.1.27) und (3.1.23). Beweis: (i) Die Abschätzung des sog. Energienorm-Fehlers“ ergibt sich unmittelbar aus der ” Best-Approximationsbeziehung (3.1.26), der Interpolationsabschätzung (3.1.27) und der Regularitätsabschätzung (3.1.23): k∇eh k ≤ k∇(u − Ih u)k ≤ ci h k∇2 uk ≤ ci cs h kf k. (ii) Zum Beweis der Fehlerabschätzung in der L2 -Norm verwenden wir ein sog. Dualitätsargu” ment“ ( Aubin8 -Nitsche9 -Trick“). Sei z ∈ H01 (Ω) die (schwache) Lösung des Hilfsproblems ” −∆z = keh k−1 eh in Ω, z|∂Ω = 0. Diese ist dann auch in H 2 (Ω) , und es gilt die a priori Abschätzung k∇2 zk ≤ cs k∆zk = cs , 8 Jean-Pierre Aubin (1939-): französischer Mathematiker; Prof. an der Univ. Paris-Dauphine (2004) emeritiert); Beiträge zur Theorie partieller Differentialgleichungen und ihrer Numerik. 9 Joachim A. Nitsche (1926-1996): deutscher Mathematiker; Prof. in Freiburg; fundamentale Beiträge zur Theorie der Finite-Elemente-Methode. 3.1 Allgemeine Projektionsverfahren 83 wobei wieder cs = 1 auf konvexem Gebiet Ω . Nach Konstruktion folgt mit Hilfe der GalerkinOrthogonalität: keh k = (∇eh , ∇z) = (∇eh , ∇(z − Ih z)) ≤ k∇eh k k∇(z − Ih z)k ≤ ci h k∇eh k k∇2 zk ≤ ci cs h k∇eh k. Mit dem Ergebnis (i) ergibt sich damit die gewünschte Abschätzung. Q.E.D. Die im Beweis von Satz 3.1 verwendete Schlußweise über ein Dualitätsargument ist das“ ” zentrale Hilfsmittel bei der Konvergenzanalyse von Finite-Elemente-Verfahren. Dieses abstrakte Argument entspricht der allgemeinen Regel, daß sich die Analyse der Projektionsverfahren eng an die abstrakten Hilbertraum-Methoden zur Behandlung des kontinuierlichen Problems anlehnt. Das zentrale Hilfmittel bei der Untersuchung von Differenzenverfahren war dagegen das (diskrete) Maximumprinzip“, welches sich mehr an den klassischen Techniken für partielle Dif” ferentialgleichungen orientiert. Wir wollen diesen Vergleich Finite-Elemente-Method (FEM) ” Finite-Differenzen-Method (FDM)“ anhand des Resultats von Satz 3.1 noch etwas weiterführen. Die a-priori Fehlerabschätzung (3.1.29) für das Finite-Elemente-Verfahren ist zu vergleichen mit der Abschätzung (2.2.37) für das Differenzenverfahren (5-Punkte-Diskretisierung mit Shortley-Weller-Randapproximation auf polygonalen Gebieten): max |eh | ≤ Ω 2 1 2 24 dΩ M4 (u)h + O(h3 ), (3.1.30) mit der Schranke M4 (u) für die vierten Ableitungen von u . Beide Abschätzungen zeigen dieselbe asymptotische Konvergenzordnung O(h2 ) , was aufgrund der verwendeten Diskretisierungsansätze auch zu erwarten ist. Die Unterschiede liegen zum einen in der Art der Norm, in der der Fehler gemessen wird, und zum anderen in der benötigten Regularität der approximierten Lösung. Beim Differenzenverfahren erhält man wegen der Verwendung des Maximumprinzips punktweise Abschätzungen, wie sie auch der Anwender gern hat. (Der Ingenieur ist z.B. an der maximalen Auslenkung einer belasteten Brückenkonstruktion interessiert.) Dagegen liefert die Hilbert-Raum-Theorie für das Finite-Elemente-Verfahren zunächst nur Abschätzungen im quadratischen Mittel, was etwa lokale Ausreißer“ an kritischen Stellen nicht ausschließt. (Dem ” Brückenbauer genügt so etwas nicht, wenn Fehlerspitzen etwa in kritischen Lagerungspunkten der Brücke auftreten können.) Wir werden später die Frage diskutieren, ob und wie man auch für das Finite-Elemente-Verfahren Fehlerabschätzungen in der Maximumnorm herleiten kann. Die in der Abschätzung (3.1.30) geforderte hohe Regularität der Lösung ist ein sehr viel schwerwiegender Nachteil unserer Analyse des Differenzenverfahrens, da diese Regularitätsstufe i.a. auf Polygongebieten und unter realistischen Annahmen an die Problemdaten nicht erwartet werden kann. Wir bemerken, daß man für das Finite-Elemente-Verfahren mit wesentlich mehr technischem Aufwand optimale“ Maximumnorm-Fehlerabschätzungen der Form ” max |eh | ≤ cM2 (u) h2 | ln h| (3.1.31) Ω beweisen kann. Allerdings ist auch die abgeschwächte Annahme M2 (u) < ∞ i.a. noch zu restriktiv. Für das Finite-Elemente-Verfahren ist auch noch unter der Minimalvoraussetzung u ∈ H01 (Ω) wenigstens qualitative Konvergenz gesichert. Seinen eigentlichen Vorteil, nämlich die große Flexibilität bei der Approximation von komplizierten Geometrien auf unstrukturierten Gittern werden wir später im Zusammenhang mit der Frage nach adaptiver Gittersteuerung und Fehlerkontrolle erkennen. 84 Finite-Elemente-Verfahren für elliptische Probleme 3.1.2 Diskretes Maximumprinzip für Finite-Elemente-Approximationen Als nächstes wollen wir zeigen, daß Galerkin-Verfahren mit finiten Elementen als Ansatzfunktionen tatsächlich eng verwandt mit Differenzenverfahren sind. Die Elemente der Steifigkeits” matrix“ Ah des Finite-Elemente-Verfahrens für den Fall linearer“ Ansatzfunktionen auf einem ” Dreiecksgitter werden exakt bestimmt. Dazu wird zunächst ein einzelnes Dreieck T mit den Eckpunkten Pi (i = 1, 2, 3) betrachtet (siehe Bild). Die dem Eckpunkt Pi gegenüberliegende Seite sei mit Si und die zugehörige Höhe mit Hi bezeichnet. Die Seiten werden dabei als im Gegenuhrzeigersinn und die Höhen gegen den Eckpunkt orientierte Vektoren aufgefaßt. Weiter bezeichne ψi die (stückweise lineare) Knotenbasisfunktion zum Punkt Pi , welche auf T definiert ist durch ψi (Pk ) = δik , i, k = 1, 2, 3 . Abbildung 3.3: Dreiecksschema Es gilt ∇ψh ≡ konst. und wegen ψi (Pj ) = ψi (Pk ) = 0, i 6= j, k , hat ∇ψi in Richtung Si die Komponente Null. Folglich zeigt ∇ψi in Richtung Hi und hat wegen ψi (Pi ) = 1 den Betrag |Hi |−1 : Hi . ∇ψi = |Hi |2 Wir erhalten also (∇ψi , ∇ψj )T = |T | (Hi , Hj ) . |Hi |2 |Hj |2 Für den Winkel γij zwischen den Höhen Hi und Hj gilt cos(γij ) = (Hi , Hj ) |Hi | |Hj | und, da γij gleich dem Winkel θij zwischen den Seitenvektoren Si und Sj ist, auch (Man beachte die Orientierung von Si und Sj .): cos(γij ) = (Si , Sj ) |Si | |Sj | Damit folgt bei Beachtung von 2|T | = |Hi | |Si | die Beziehung (∇ψi , ∇ψj )T = |T | (Si , Sj ) (Si , Sj ) = . |Si | |Sj | |Hi | |Hj | 4|T | 3.1 Allgemeine Projektionsverfahren 85 Hieraus lesen wir ab, daß (∇ψi , ∇ψi )T > 0, (∇ψi , ∇ψj )T ≤ 0, i 6= j, (3.1.32) falls alle Winkel im Dreieck T kleiner oder gleich π/2 sind. Weiter ist nach Konstruktion 3 X j=1 bzw. N X j=1,j6=i Für die Elemente aij = P ψj ≡ 1, (∇ψi , 3 X j=1 ∇ψj )T = 0, |(∇ψi , ∇ψj )T | ≤ (∇ψi , ∇ψi )T , T ∈Th (∇ψj , ∇ψi )T aii > 0, i = 1, 2, 3. der Matrix Ah erhalten wir somit, daß aij ≤ 0 (i 6= j), wenn alle Dreiecksinnenwinkel in der Triangulierung kleiner oder gleich π/2 sind. Darüber hinaus gilt X X |ai0 j | < ai0 i0 für ein i0 . (3.1.33) |aij | ≤ aii , j6=i j6=i0 Die Steifigkeitsmatrix Ah ist in diesem Fall also (irreduzibel) diagonal-dominant“, von nicht” ” negativem Typ“ und eine M -Matrix“. Wir fassen die sich daraus ergebenden Konsequenzen in ” einem Satz zusammen. Satz 3.2 (Maximumprinzip für finite Elemente): Wenn alle Innenwinkel der Triangulierung Th kleiner oder gleich π/2 sind, genügt das Finite-Elemente-Schema mit stückweise linearen Ansatzfunktionen einem diskreten Maximumprinzip, d.h.: (n) (∇vh , ∇ϕh ) ≤ 0 (n = 1, ..., N ) ⇒ maxΩ vh ≤ max{0, max∂Ω vh }. (3.1.34) Ferner ist die Steifigkeitsmatrix Ah eine M -Matrix, d.h. es gilt A−1 h ≥ 0 sowie x ∈ RN , Ah x ≥ 0 ⇒ x ≥ 0. (3.1.35) Dieses Resultat kann so interpretiert werden, daß unter den gegebenen Voraussetzungen auch die Finite-Elemente-Diskretisierung ein diskretes Maximumprinzip“ erfüllt. Leider gilt die kri” tische Eigenschaft (3.1.32) praktisch nur in der oben beschriebenen Situation. Insbesondere Finite-Elemente-Ansätze höherer Ordnung erfüllen dies nicht (z.B. quadratische Ansätze nur auf gleichseitigen“ Triangulierungen). ” Bemerkung 3.4: Im Spezialfall einer gleichförmigen, kartesischen Triangulierung (mit Kantenlänge h ) des Einheitsquadrats erhalten wir aus der obigen expliziten Darstellung für die Matrixelemente aij = (∇ψi , ∇ψj ) die Beziehung: aii = 4, ai,i±1 = −1, ai,i±m = −1; 86 Finite-Elemente-Verfahren für elliptische Probleme alle anderen Elemente aij sind Null. In diesem Fall stimmt die Steifigkeitsmatrix AFh EM also bis auf den Faktor h−2 mit der Matrix AFh DM des 5-Punkte-Operators“ überein: ” AFh EM = h2 AFh DM . Für die Elemente des zugehörigen Lastvektors“ gilt entsprechend: ” Z f ψi dx ≈ h2 f (Pi ) + O(h4 ) = h2 bFi DM + O(h4 ). bFi EM = (3.1.36) (3.1.37) Ω Dies zeigt, daß aus algebraischer Sicht FEM und FDM eng verwandt sind. Für eine stückweise bi-linearen“ Ansatz auf einer gleichförmigen Quadratzerlegung erhält man ein Analogon zu ” einem kompakten 9-Punkte-Operator“ (siehe Abb. 3.4): ” Abbildung 3.4: Differenzensterne 3.1.3 Approximation krummer Ränder Zum Abschluß dieser einführenden Diskussion wollen wir noch darstellen, wie in der FEM krumme Ränder approximiert werden. Dazu sei angenommen, daß der Rand ∂Ω regulär genug ist, daß die schwache Lösung u ∈ V := H01 (Ω) auch in H 2 (Ω) ist und der a-priori Abschätzung kukH 2 ≤ cs kf k (3.1.38) genügt. i) Der konvexe Fall“: Sei Ω ⊂ R2 ein glatt berandetes, konvexes Gebiet. Dieses sei überdeckt ” durch eine reguläre Triangulierung Th = {T } , so daß alle Eckpunkte des Polygongebiets [ Ωh := {T ∈ Th } ⊂ Ω, auf dem Rand ∂Ω liegen. Die Länge der Polygonkanten von ∂Ω ist dann durch die Gitterweite h der Triangulierung Th beschränkt (siehe Abb. 3.5). Auf Ω wird nun zunächst der einfachste Finite-Elemente-Ansatz (mit linearen Formfunktionen) wie folgt definiert: (1) Vh := {vh ∈ C(Ω)| vh|T ∈ P1 (T ), T ∈ Th , vh|Ω\Ωh ≡ 0} ⊂ V = H01 (Ω). (1) Die zugehörigen Galerkin-Approximationen uh ∈ Vh sind durch die Variationsgleichung (∇uh , ∇ϕh ) = (f, ϕh ) ∀ϕh ∈ Vh (3.1.39) 3.1 Allgemeine Projektionsverfahren 87 bestimmt. Wegen der Teilraumbeziehung Vh ⊂ V gilt dann wieder für den Fehler eh := u − uh die Bestapproximationsbeziehung (3.1.26). Abbildung 3.5: Polygonale Approximation eines krumm berandeten Gebiets; Randstreifen Sh = ∪{ST } schraffiert. Satz 3.3 (FEM auf konvexem Gebiet): Für das Finite-Elemente-Schema (3.1.39) auf einem glatt berandeten, konvexen Gebiet Ω gelten die a-priori Konvergenzabschätzungen k∇eh k ≤ (ci +cΩ )cs h kf k, keh k ≤ (ci +cΩ )2 c2s h2 kf k, (3.1.40) (3.1.41) mit Stabilitäts- und Interpolationskonstanten cs , ci und einer Konstante cΩ . Beweis: (i) Sei Ih u ∈ Vh die natürliche Knoteninterpolierende von u , welche auf dem Streifen Sh = Ω \ Ωh zu Null gesetzt wird. Für diese gilt wieder auf jeder Zelle T ∈ Th (wird später gezeigt werden) k∇(u − Ih u)kT ≤ ci hT k∇2 ukT , (3.1.42) und folglich k∇(u − Ih u)kΩh ≤ ci hk∇2 ukΩh . Mit Hilfe der Approximationsbeziehung (3.1.26) ergibt sich somit k∇eh k2Ω ≤ c2i h2 k∇2 uk2Ωh + k∇uk2Sh . (3.1.43) Es bleibt, das Integral über den Randstreifen Sh zu behandeln. (ii) Für ein glatt berandetes Gebiet (d.h.: ∂Ω ist C 2 -parametrisiert.) ist nun |Sh | = O(h2 ) . Um dies zu sehen, nehmen wir an, daß der Randabschnitt ∂ΩT , welcher durch Γ von ∂Ω abgetrennt wird, als Graph einer Funktion ψ(s) der Bogenlänge über Γ aufgefaßt werden kann. Diese nehme ihr Maximum ψ0 für s = s0 an, so daß (ψ − ψ0 )(s0 ) = 0, (ψ − ψ0 )′ (s0 ) = 0. 88 Finite-Elemente-Verfahren für elliptische Probleme Durch Taylor-Entwicklung von ψ − ψ0 um s0 ergibt sich dann max |ψ(s)| = max |ψ(s) − ψ0 | ≤ δ := Γ Γ 1 2 max |ψ ′′ | h2T . Γ Folglich ist |Sh | ≤ ch2 . Damit ist bewiesen, daß k∇eh kΩ ≤ chkukH 2,p . (3.1.44) (iii) Zur Abschätzung des Integrals über Sh gehen wir ähnlich vor wie beim Beweis der Poincaréschen Ungleichung. Sei T ∈ Th ein Randdreieck und ST der zugehörige Teilabschnitt des Randstreifens Sh , welcher von der Kante Γ von T begrenzt ist. O.B.d.A. sei angenommen, daß ein Rechteck QT mit Γ als kurzer Seite und Länge L > 0 (unabhängig von h ) ganz in Ω enthalten ist (siehe Abb. 3.6). Abbildung 3.6: Schema der Randapproximation Sei nun weiter v ∈ C 1 (Ω) beliebig. Es bezeichne nΓ (x) den bzgl. Sh nach innen gerichteten Normaleneinheitsvektor zu Γ im Punkt x ∈ Γ mit Parameterwert s . Damit gilt für 0 ≤ t ≤ δ : Z t ∂r v(x + rnΓ (x)) dr, v(x + tnΓ (x)) = v(x) + 0 bzw. 2 2 |v(x + tnΓ (x))| ≤ 2|v(x)| + 2δ Z ψ(s) 0 |∇v(x + rnΓ (x))|2 dr. Wir integrieren dies zunächst über 0 ≤ t ≤ ψ(s) ≤ δ (Man beachte, daß für x ∈ Γ gilt x + ψ(s)nΓ (x) ∈ ∂ΩT .), Z ψ(s) 0 2 2 |v(x + tnΓ (x))| dt ≤ 2δ|v(x)| + 2δ 2 Z ψ(s) 0 und dann über x ∈ Γ und erhalten Z Z Z 2 2 2 |v(x)| dx ≤ 2δ |v(x)| ds + 2δ Γ ST |∇v(x + rnΓ (x))|2 dr, ST |∇v(x)|2 dx. Für das Randintegral rechts erhalten wir mit Hilfe der Spurabschätzung Z |v(x)|2 ds ≤ cΩ kvk2H 1 (QT ) Γ 3.1 Allgemeine Projektionsverfahren 89 mit einer von maxΓ |ψ ′ | abhängigen Konstante cΩ . Damit gewinnen wir schließlich die Abschätzung Z (3.1.45) |v(x)|2 dx ≤ cΩ h2 kvk2H 1 (Ω) , Sh mit einer generischen Konstante cΩ . Durch das übliche Stetigkeitsargument überträgt sich diese Abschätzung auf alle Funktionen v ∈ H 1 (Ω) . Wir wenden die Abschätzung (3.1.45) nun für die Funktion |∇u| ∈ H 1 (Ω) an und erhalten k∇uk2Sh ≤ cΩ h2 kuk2H 2 , so daß sich mit (3.1.43) schließlich das erste gewünschte Resultat ergibt: k∇ek ≤ ci hk∇2 uk + cΩ hkukH 2 ≤ (ci +cΩ )cs h kf k. (3.1.46) Zur Abschätzung des L2 -Fehlers wird wieder ein Dualitätsargument verwendet. Sei z ∈ H01 (Ω)∩ H 2 (Ω) die Lösung des Hilfsproblems −∆z = kek−1 e in Ω, z|∂Ω = 0. Wie im Fall eines Polygongebiets argumentieren wir nun wie folgt: kek = (∇e, ∇z) = (∇e, ∇(z − Ih z)) ≤ k∇ek k∇(z − Ih z)k. Mit Hilfe der Interpolationsabschätzung (3.1.42) sowie der Randstreifenabschätzung (3.1.45) für v := |∇z| folgt weiter kek ≤ k∇ek ci hk∇2 zk + cΩ hkzkH 2 ≤ (ci +cΩ )hk∇ek kzkH 2 . Hiermit folgt dann unter Verwendung des ersten Resultats (3.1.46) sowie der a-priori Schranke kzkH 2 ≤ cs auch die zweite gewünschte Ungleichung kek ≤ (ci +cΩ )2 c2s h2 kf k. Dies vervollständigt den Beweis. (3.1.47) Q.E.D. ii) Der nicht-konvexe Fall“: Sei Ω ⊂ R2 ein glatt berandetes, aber nicht notwendig konvexes ” Gebiet. Dieses sei wieder überdeckt durch S eine reguläre Triangulierung Th = {T } , so daß alle Eckpunkte des Polygongebiets Ωh := {T ∈ Th } auf dem Rand ∂Ω liegen (siehe Abb. 3.7). Die Länge der Polygonkanten von ∂Ωh ist dann durch die GitterweiteSh der Triangulierung Th beschränkt. Ist Ω nicht konvex, so ist Ωh 6⊂ Ω . Der auf Ωh = {T ∈ Th } definierte (1) Finite-Elemente-Raum Vh ist dann auch nicht in V enthalten, und die Approximation wird nicht-konform“ (bzgl. V = H01 (Ω) ) genannt. Die Analyse dieser Approximation gestaltet sich ” technisch etwas schwieriger als im konformen Fall. Doch auch hierfür kann man Konvergenz mit der optimalen Ordnung beweisen. 90 Finite-Elemente-Verfahren für elliptische Probleme Abbildung 3.7: Approximation nicht-konvexer Randteile Satz 3.4 (FEM auf nicht-konvexem Gebiet): Für das Finite-Elemente-Schema (3.1.39) auf einem glatt berandeten, nicht-notwendig konvexen Gebiet Ω gelten die a-priori Konvergenzabschätzungen k∇eh kΩ ≤ (ci +cΩ )cs hkf kΩ keh kΩ ≤ (ci +cΩ )2 c2s h2 kf kΩ , (3.1.48) (3.1.49) mit Stabilitäts- und Interpolationskonstanten cs , ci und einer Konstante cΩ . Beweis: Der Beweis wird in einer späteren Version dieses Skriptums gegeben werden. Q.E.D. 3.2 Allgemeine Finite-Elemente-Ansätze 91 3.2 Allgemeine Finite-Elemente-Ansätze Wir wollen nun Finite-Elemente-Ansatzräume allgemeineren Typs konstruieren und Fragen der praktischen Realisierung der Methode diskutieren. Zunächst wird Ω als ein Polygongebiet (Polyeder in 3-D) angenommen. Seien Th Zerlegungen von Ω in Dreiecke oder Vierecke (Tetraeder oder Hexaeder in 3-D), welche den im vorigen Abschnitt formulierten Bedingungen genügen. Für die folgenden Konstruktionen von Finite-Elemente-Ansätzen verwenden wir die Bezeichnungen n o n o X X Pr := p(x) = cij xi1 xj2 , Qr := q(x) = cij xi1 xj2 , 0≤i+j≤r 0≤i,j≤r für Polynom-Vektorräume im R2 (analog für solche im R3 ). Wir verwenden die Bezeichnungen Th = {T } Zerlegung von Ω, ∂Th = {Γ} Menge aller Kanten (bzw. Flächen), ∂ 2 Th = {a} Menge aller Eckpunkte ( Knoten“), ” sowie die folgende Symbolik für einige typische Knotenwertevorgaben: Abbildung 3.8: Funktionswerte vh (a) sowie vh (a), ∇vh (a) (links), Normalableitung ∂n vh (m) in Seitenmitten (Mitte), Funktionswerte vh (a), ∇vh (a), ∇2 vh (a) (rechts). Ein Finite-Elemente-Ansatz ist definiert durch Vorgabe eines Polynomraumes P (T ) ⊂ Pr (T ) oder P (T ) ⊂ Qr (T ) auf T ∈ Th sowie eines geeigneten Satzes von Knotenwerten“ (gegeben ” durch lineare Knotenfunktionale“), z.B.: ” {vh (a), vh (m), ∂n vh (m), ∇vh (a), (vh , 1)Γ , (vh , 1)T , . . . }, welcher Polynome aus P (T ) eindeutig bestimmt. Definition 3.1 (Unisolvenz): Ein Polynomraum P (T ) und ein zugehöriger Satz von linearen Knotenfunktionalen“ K(T ) heißen unisolvent“, wenn jedes p ∈ P (T ) eindeutig durch die ” ” Vorgabe von χ(p) für alle χ ∈ K(T ) bestimmt ist. Definition 3.2 (Lagrange- und Hermite-Ansatz): Man spricht bei einem FE-Ansatz P (T ) mit zugehörigem Satz von Knotenfunktionalen {χr , r = 1, ..., R} von Lagrange-Elementen“, ” wenn die Knotenfunktionale nur auf Funktionswerte zurückgreifen; werden auch Ableitungswerte verwendet, spricht man von Hermite10 -Elementen“. ” 10 Charles Hermite (1822-1901): französischer Mathematiker; Prof. an der École Polytechnique und der Sorbonne in Paris; Beiträge zur Zahlentheorie und zur Theorie elliptischer Funktionen; Beweis der Transzendenz von e . 92 Finite-Elemente-Verfahren für elliptische Probleme Notwendig für Unisolvenz ist offenbar dim P (T ) = #K(T ) und hinreichend, daß für ein p ∈ P (T ) aus χ(p) = 0 für alle χ ∈ K(T ) notwendig p ≡ 0 folgt. Dies wird in der Regel zum Nachweis von Unisolvenz verwendet. Definition 3.3 (Interpolation): Für jede Zelle T ∈ Th sei ein Polynomraum P (T ) mit Dimension R und ein Satz KT = {χr , r = 1, ..., R} von Knotenfunktionalen χr : H m (T ) → R (r = 1, ..., R), spezifiziert, welche unisolvent“ sind. Durch die Vorgabe ” χr (Ih v) = χr (v), r = 1, . . . , R, ist dann eindeutig eine Finite-Elemente-Interpolierende“ Ih v ∈ P (T ) definiert. ” Durch Zusammensetzen der zunächst zellweise definierten Formfunktionen vT ∈ P (T ) erhält man global definierte Funktionen vh : Ω → R, vh|T := vT , T ∈ Th , mit denen der Finite-Elemente-Ansatzraum Vh gebildet wird. Durch Gleichsetzen geeigneter Knotenwerte auf dem gemeinsamen Rand Γ = T ∩T ′ jeweils benachbarter Zellen wird Stetigkeit, Differenzierbarkeit und auf analogem Wege auch die Randbedingung vh|∂Ω = 0 implementiert. Die Dimension des endlich dimensionalen Teilraumes Vh ⊂ V ist dann gleich der Anzahl der Knotenfunktionalwerte zur eindeutigen Festlegung einer Funktion vh ∈ Vh . Definition 3.4 (Konformität): Ein Finite-Elemente-Ansatzraum Vh dieser Art heißt H01 ” konform“, wenn Vh ⊂ H01 (Ω), und andernfalls nicht-konform“. ” A) Dreieckselemente im R2 : Als erstes betrachten wir Finite-Elemente-Ansätze auf Triangulierungen von Polygongebieten. 1) Konstanter Ansatz: P (T ) = P0 , dim P (T ) = 1 . Mit konstanten Polynomansätzen kann offensichtlich für die Variationsgleichung (3.1.2) keine konforme Diskretisierung gewonnen werden. Diese spielen aber bei anderen Typen von variationellen Formulierungen, den sog. dual-gemischten“, eine Rolle ” 2) Linearer Ansatz: P (T ) = P1 , dim P (T ) = 3 . Der Polynomraum P1 (T ) und der Satz von Knotenfunktionalen {χi (p) = p(ai ), i = 1, 2, 3} sind unisolvent, denn für p ∈ P1 (T ) mit p(ai ) = 0 gilt notwendig p|∂T ≡ 0 und damit auch p ≡ 0 . Mit dem Ansatz (1) Vh = {vh : Ω → R| vh|T ∈ P1 , vh stetig in Eckpunkten, vh = 0 in Eckpunkten auf ∂Ω}. erhält man einen H01 -konformen Finite-Elemente-Raum. Denn der Sprung von [vh ] über eine gemeinsame Kante Γ zweier Dreiecke T1 und T2 ist in P1 (Γ) . Folglich ist vh stetig, da seine Restriktionen auf T1 und T2 gemeinsame Werte in den beiden Endpunkten von Γ haben. 3.2 Allgemeine Finite-Elemente-Ansätze 93 Einen nicht-konformen Ansatz erhält man durch (1) Ṽh = {vh : Ω → R| vh|T ∈ P1 , vh stetig in Kantenmitten, vh = 0 in Kantenmitten auf ∂Ω}. Die Unisolvenz folgt analog wie die des entsprechenden konformen Ansatzes. Dieses nichtkonforme lineare“ Element spielt z. B. eine Rolle bei der Diskretisierung der Navier-Stokes” Gleichungen in der Strömungsmechanik. 3) Quadratischer Ansatz: P (T ) = P2 , dim P (T ) = 6 . Der Polynomraum P2 (T ) und der Satz von Knotenfunktionalen {χi (p) = p(ai ), ψi (p) = p(mi ), i = 1, 2, 3} sind unisolvent. Für p ∈ P2 (T ) mit p(ai ) = p(mi ) = 0 gilt notwendig p|∂T ≡ 0 . Dies impliziert, daß ∇p(ai ) = 0 , woraus wegen ∂i p ∈ P1 (T ) wiederum ∇p ≡ 0 und schließlich p ≡ 0 folgt. Mit dem Ansatz (2) Vh = {vh : Ω → R| vh|T ∈ P2 , vh stetig in Eckpunkten und Kantenmitten, vh = 0 in solchen Punkten auf ∂Ω}. erhält man einen H01 -konformen Finite-Elemente-Raum. Denn der Sprung von [vh ] über eine gemeinsame Kante Γ zweier Dreiecke T1 und T2 ist in P2 (Γ) . Folglich ist vh stetig, da seine Restriktionen auf T1 und T2 gemeinsame Werte in den beiden Endpunkten und dem Mittelpunkt von Γ haben. R Alternativ zu den Werten in den Kantenmitten m kann man auch die −1 Mittelwerte |Γ| Γ vh ds über Kanten Γ ∈ ∂Th als Knotenwerte verwenden. Der nicht-konforme Ansatz (2) Ṽh = {vh : Ω → R| vh|T ∈ P2 , vh stetig in jeweils zwei Gauß-Punkten auf Kanten, vh = 0 in solchen Punkten auf ∂Ω} ist nicht unisolvent, denn es existieren nicht-triviale, stückweise quadratische Funktionen, welche in allen Knotenpunkten verschwinden. Man betrachte dazu auf jeder Kante die LegendrePolynomen L2 zweiten Grades, deren Nullstellen gerade die beiden Gauß-Punkte m1 , m2 sind. Sie können wegen ihrer Symmetrie zum Kantenmittelpunkt so normiert werden, daß sie in den Eckpunkten a gleiche Werte L2 (a) = 1 haben. Dann läßt sich eine Funktion L ∈ P2 (T ) finden, durch konforme Interpolation in Eckpunkten und Seitenmitten: L(a) = 1 , L(m) = L2 (m) . Auf jeder Kante ist dann L ≡ L2 , so daß sich ein Widerspruch zur Unisolvenz des Ansatzes ergibt. Eine weitere nicht-konforme Variante des quadratischen Elements (das sog. Morley11 -Platten” element“) erhält man bei Wahl der Knotenwerte {vh (a), ∂n vh (m)} . Dieser Ansatz ist wieder unisolvent. Für p ∈ P2 (T ) folgt aus p(ai ) = ∂n p(mi ) = 0, i = 1, 2, 3 , notwendig ∂τ p(mi ) = 0 und somit ∇p(mi ) = 0 . Wegen ∂i p ∈ P1 (T ) folgt ∇p ≡ 0 und damit auch p ≡ 0 . 11 L.S.D. Morley (????-????): englischer Ingenieur; Forscher an der Brunel University in Uxbridge, England; Beiträge zur FEM für nichtlineare Schalenmodelle. 94 Finite-Elemente-Verfahren für elliptische Probleme Das Morley-Element ist zwar nicht-konform bzgl. der H 1 - wie auch der H 2 -Norm, trotzdem kann es bei geeigneter Modifikation der variationellen Formulierungen, X uh ∈ VhM : (∇2 uh , ∇2 ϕh )T = (f, ϕh ) ∀ϕh ∈ VhM , T ∈Th sogar zur Approximation des biharmonischen Operators ∆2 u = f verwendet werden. 5) Kubischer Ansatz (sog. kubisches Membran-Element“: P (T ) = P3 , dim P (T ) = 10 . ” Mit dem Ansatz (3) Vh ={vh : Ω → R| vh|T ∈ P3 , vh stetig in Eckpunkten und in je zwei Gauß-Punkten auf Kanten, vh = 0 in solchen Punkten auf ∂Th }. ist H01 -konform. Denn der Sprung von [vh ] über eine gemeinsame Kante Γ zweier Dreiecke T1 und T2 ist in P3 (Γ) . Folglich ist vh stetig, da seine Restriktionen auf T1 und T2 gemeinsame Werte in den beiden Endpunkten und zwei Gauß-Punkten auf Γ haben. Alternativ zu den GaußPunkten auf den Kanten kann man auch in jedem Knoten die beiden partiellen Ableitungen, d.h. den Gradienten ∇vh (a) , als Knotenwerte verwenden. Auch damit erhält man einen H01 (3) (3) konformen Ansatzraum V̂h ; dieser ist offenbar echt kleiner als Vh (Übungsaufgabe). Zur Diskretisierung der biharmonischen Gleichung kann man wieder eine nicht-konforme Variante mit den Knotenwerten {vh (a), ∂n vh (m1 ), ∂n vh (m2 ), vh (z)} ( m1 , m2 zwei Gauß-Punkte auf Γ und z der Mittelpunkt von T ) verwenden. Ein H 2 -konformes Platten-Element erhält man durch den sog. Clough-Tocher-Ansatz“ als zusammengesetztes“ Element ( vh ∈ C 1 (T ) ” ” stückweise kubisch). 6) Quartischer Ansatz: P (T ) = P4 (T ) , dim P (T ) = 15 . Mit dem Satz von Knotenwerten {vh (a), ∇vh (a), vh (m1 ), vh (m2 )} (m1 , m2 die beiden GaußPunkte auf jeder Kante Γ ∈ ∂Th ) erhält man hier einen H 1 -konformen Ansatz (Übungsaufgabe). 3.2 Allgemeine Finite-Elemente-Ansätze 95 7) Quintischer Ansatz (sog. Argyris12 -Plattenelement“): P (T ) = P5 (T ) , dim P (T ) = 21 . ” Mit dem Satz von Knotenwerten {vh (a), ∇vh (a), ∇2 vh (a), ∂n vh (m)} erhält man hier sogar einen H 2 -konformen Ansatz (Übungsaufgabe). Dieses finite Element ist ein Beispiel für einen konformen Ansatz zur Lösung der biharmonischen Gleichung ∆2 u = f , für welche stetig differenzierbare Übergänge von Zelle zu Zelle erforderlich sind. B) Viereckselemente: Als nächstes betrachten wir Finite-Elemente-Ansätze auf (kartesischen) Rechteckszerlegungen. 1) Bi-linearer Ansatz: P (T ) = Q1 = span{1, x1 , x2 , x1 x2 } , dim P (T ) = 4 . Der Polynomraum Q1 (T ) und der Satz von Knotenfunktionalewn {χi (p) = p(ai ), i = 1, . . . , 4} sind unisolvent. Ein p ∈ Q1 (T ) ist entlang der Kanten von T linear. Aus p(ai ) = 0 folgt also p|∂T ≡ 0 und weiter ∇p(ai ) = 0 . Wegen ∂i p ∈ P1 (T ) impliziert dies ∇p ≡ 0 und schließlich p ≡ 0 . Der Ansatz (1) Vh = {vh : Ω → R| vh|T ∈ Q1 , vh stetig in Eckpunkten, vh = 0 in Eckpunkten auf ∂Ω} ist H01 -konform, da die Sprünge von vh entlang von Kanten linear sind. Der naheliegende nicht-konforme Ansatz (1) Ṽh = {vh : Ω → R| vh|T ∈ Q1 , vh stetig in Kantenmitten, vh = 0 in Kantenmitten auf ∂Ω} ist aber i.a. nicht unisolvent, da z.B. die Funktion vh (x1 , x2 ) = x1 x2 in den Kantenmitten des Quadrats T1 = [−1, 1] × [−1, 1] verschwindet. Auf T1 erhält man aber durch P (T ) = span{1, x1 , x2 , x21 − x22 } einen mit den Kantenmitten als Knotenfunktionale unisolventen Ansatz. RAlternativ zu den Funktionswerten in den Seitenmitten kann man auch die Mittelwerte (1) |Γ|−1 Γ vh ds über die Kanten als Knotenwerte verwenden. Dies ergibt aber einen von Ṽh verschiedenen Ansatzraum. 2) Bi-quadratischer Ansatz: P (T ) = Q2 = span{1, x1 , x2 , x21 , x1 x2 , x22 , x21 x2 , x1 x22 , x21 x22 } , dim P (T ) = 9 . Die Konstruktion eines zulässigen“ Satzes von Knotenwerten ist Übung. ” 3) Reduzierter bi-quadratischer Ansatz (sog. Wilson13 -Membran-Element“): ” P (T ) = P2 (T ) ⊕ span{x21 x2 , x1 x22 } , dim P (T ) = 8 . Dieser Ansatz wird mit den Knotenwerten 12 John Argyris (1916-2004): deutscher Bauingenieur; Prof. in Stuttgart; einer der Erfinder“ der Finite” Elemente-Methode. 13 E.L. Wilson (????-????): amerikanischer Ingenieur; Publ.: K. Bathe, E.L Wilson: Numerical Methods in Finite Element Analysis, Prentice-Hall, New Jersey, 1976. 96 Finite-Elemente-Verfahren für elliptische Probleme {vh (a), vh (m)} H 1 -konform. 4) Bi-kubischer Ansatz: P (T ) = Q3 = span{1, x1 , x2 , x21 , ..., x31 x32 } , dim P (T ) = 16 . Die Konstruktion eines zulässigen“ Satzes von Knotenwerten wird als Übung gestellt. ” 5) Reduzierter bi-kubischer Ansatz (sog. Adini14 -Platten-Element“): ” P (T ) = P3 (T ) ⊕ span{x31 x2 , x1 x32 } , dim P (T ) = 12 . Dieser Ansatz wird mit den Knotenwerten {vh (a), ∇vh (a)} unisolvent und H 1 -konform, ist aber nicht H 2 -konform. Viele der aufgeführten zwei-dimensionalen Finite-Elemente-Ansätzen haben natürliche Erweiterungen auf drei Dimensionen. Die gebräuchlichsten Beispiele sind: 1) Lineares Tetraederelement: P (T ) = span{1, x1 , x2 , x3 }, dim P (T ) = 4 . Mit den Funktionswerten in den Eckpunkten als Knotenwerte ist dieser Ansatz unisolvent und H 1 -konform. 2) Nicht-konf., lineares Tetraederelement: P (T ) = span{1, x1 , x2 , x3 }, dim P (T ) = 4 . Mit den Funktionswerten in den Flächenmitten als Knotenwerte ist dieser Ansatz unisolvent, aber nicht-konform. 3) Quadratisches Tetraederelement: P (T ) = span{1, x1 , x2 , x3 , x1 x2 , x1 x3 , x2 x3 , x21 , x22 , x23 } , dim P (T ) = 10 . Mit den Funktionswerten in den Ecken und den Kantenmitten als Knotenwerte ist dieser Ansatz unisolvent und H 1 -konform. 4) Kubisches Tetraederelement: P (T ) = P3 , dim P (T ) = 20 . Mit den Funktionswerten in den Ecken, in zwei Gauß-Punkten auf den Kanten und in den Seitenmitten als Knotenwerte ist dieser Ansatz unisolvent und H 1 -konform. 14 A. Adini (????-????): ???? 3.2 Allgemeine Finite-Elemente-Ansätze 97 5) Tri-lineares Quaderelement: P (T ) = span{1, x1 , x2 , x3 , x1 x2 , x1 x3 , x2 x3 , x1 x2 x3 }, dim P (T ) = 8 . Mit den Funktionswerten in den Eckpunkten als Knotenwerte ist dieser Ansatz unisolvent und H 1 -konform. Ein zugehöriges nicht-konformes Quaderelement erhält man durch den Ansatz P (T ) = span{1, x1 , x2 , x3 , x21 − x22 , x21 − x23 }, dim P (T ) = 6 . Mit den Funktionswerten in den Flächenmitten als Knotenwerte ist dieser Ansatz unisolvent. 6) Tri-quadratisches Quaderelement: P (T ) = span{1, x1 , x2 , x3 , ..., x21 x22 x23 }, dim P (T ) = 27 . Mit den Funktionswerten in den Eckpunkten, den Kantenmitten, den Seitenmitten und dem Mittelpunkt als Knotenwerte ist dieser Ansatz unisolvent und H 1 -konform. In allgemeinen Situationen können die Zellen bzgl. des Koordinatensystems gedreht oder gezerrt werden. Daraus folgt, daß es Fälle gibt, in denen man für zwei Zellen der Zerlegung Th nicht denselben Ansatz nehmen kann (z.B. das bi-lineare Viereckselement). Deshalb müssen wir uns bei der Definition von Finite-Elemente-Ansätzen von dem festen Koordinatensystem befreien. Dies induziert die Idee des Referenzelements“. Wir verwenden als Referenzelement ” ein natürliches Einheitselement T̂ (Einheitsdreieck, Einheitsviereck, ...) und definieren zunächst einen Polynomansatz P̂ (T̂ ) auf diesem Referenzelement. Sei σT eine (polynomiale) Transformation des Referenzelements auf das ( physikalische“) ” Element mit der Inversen σT−1 : T → T̂ . Der Ansatz auf der Zelle T ist dann gegeben durch P (T ) := {vh : T → R| vh (σT (·)) ∈ P̂ (T̂ )}. (3.2.50) Der Funktionenraum P (T ) ist nicht notwendig ein Raum von Polynomen, auch wenn P̂ (T̂ ) ein solcher ist. Dies liegt daran, daß im Allg. die inverse Abbildung σT−1 und damit die Funktion vh (x) = vh (σ(σ −1 (·))) nicht polynomial ist, z.B. im Fall (echt) bilinearer Abbildungen σT . Wenn man T aus T̂ durch eine Verschiebung, eine Rotation, eine Scherung und eine Skalierung gewinnen kann, so ist σT eine affin-lineare Transformation: σT (x̂) = BT x̂ + bT mit einer Matrix BT ∈ Rd×d und einem Verschiebungsvektor bT ∈ Rd . Dies ist möglich bei Dreiecken (in 2-D) bzw. Tetraedern (in 3-D) sowie bei Parallelogrammen (in 2-D) bzw. Parallelepipeden (in 3-D). Für allgemeine (konvexe) Vierecke (in 2-D) oder Hexaeder (in 3-D) benötigt man für die Transformation echt bi- bzw. tri-lineare Abbildungen. Wir gehen nun zum allgemeinen d-dimensionalen Fall über und betrachten Zerlegungen Th = 98 Finite-Elemente-Verfahren für elliptische Probleme {T } eines Gebiets Ω ⊂ Rd in d-Simplizes. Dabei ist ein (nicht degeneriertes) Simplex T ⊂ Rd die konvexe lineare Hülle von d + 1 linear unabhängigen Punkten ai ∈ Rd , i = 0, ..., d: n d T = x∈R |x= d X i λi a , d X i=0 i=0 o λi = 1, 0 ≤ λi ≤ 1 . (3.2.51) Das System {ai , i = 0, ..., d} heißt linear unabhängig, wenn die erzeugenden Vektoren {wi = ai − a0 , i = 1, ..., n} eine Basis des Rd bilden. Die einfachsten Beispiele sind wieder Dreiecke für d = 2 und Tetraeder für d = 3 . Sei T̂ das Einheitssimplex im Rd , welches von den Punkten e0 := 0 , ei = (δ1i , ..., δdi )T , i = 1, ..., d , aufgespannt wird. Hilfssatz 3.2 (Referenztransformation): Jedes (nicht degenerierte) Simplex T ⊂ Rd läßt sich mittels einer umkehrbaren affinen Abbildung x = σT (x̂) := BT x̂ + bT , BT ∈ Rd×d , bT ∈ Rd , (3.2.52) aus dem Einheitssimplex T̂ gewinnen: T = BT T̂ + bT . Dabei ist die Umkehrabbildung gegeben durch x̂ = σT−1 (x) = BT−1 x−BT−1 bT . Beweis: Wir lassen im folgenden den Zusatz T weg. Sei A ∈ Rd×d die reguläre Matrix, welche die Basis {wi = ai − a0 , i = 1, ..., d} auf die kartesische Einheitsbasis {ei , i = 1, ..., d} abbildet: ei = Awi , i = 1, ..., d . Man gewinnt ihre Elemente aνµ als Lösungen der Gleichungssysteme n X aνµ wµi = eiν , i = 1, ..., d , µ=1 für ν = 1, ..., d. Die Koeffizientenmatrix (wµi )di,µ=1 enthält die linear unabhängigen Vektoren wi , i = 1, ..., d, als Zeilenvektoren und ist folglich regulär. Die affine Abbildung x̂ = Ax − Aa0 ist Pd Simplex T auf das Einheitssimplex T̂ ab, denn für x = Pddann iumkehrbar und bildet das λ a ∈ T ist (Man beachte i=1 λi = 1 .) i=0 i Ax − Aa0 = und umgekehrt für x̂ = A−1 x̂ + a0 = Pd d X i=0 i i=0 λi e d X i=0 λi A(ai − a0 ) = d X λi ei ∈ T̂ , d X λi ai + (1 − i=0 ∈ T̂ λi A−1 ei + a0 = d X i=0 λi wi + a0 = i=0 Dies komplettiert den Beweis mit BT := A−1 und bT := a0 . d X i=1 λi )a0 ∈ T . Q.E.D. Bemerkung 3.5: Zu Hilfssatz 3.2 gibt es ein Analogon für Vierecks-Zerlegungen im R2 sowie Hexaeder-Zerlegungen im R3 . Zu jedem konvexen Viereck T ∈ R2 oder Hexaeder T ∈ R3 ( 6-Flächner“) existieren bi- bzw. tri-lineare Abbildungen σT : T̂ → T des Einheitsquadrats ” bzw. Einheitswürfels T̂ auf T . Dabei werden die Eckpunkte von T̂ auf die Eckpunkte von T sowie die Kanten bzw. Seitenflächen von T̂ auf die Kanten bzw. Seitenflächen von T abgebildet (jeweils in derselben Orientierung). 3.2 Allgemeine Finite-Elemente-Ansätze 99 Die Erzeugung von Finite-Elemente-Ansätzen über Transformation von einem Referenzelement hat auch den Zweck, auf allgemeinen Vierecks- oder Hexaeder-Zerlegungen konforme Ansätze zu gewinnen. Wir wollen das anhand des bilinearen Ansatzes diskutieren: (1) Vh = {vh : Ω → R| vh|T ∈ Q1 , vh stetig in Knoten, vh = 0 in Knoten auf ∂Ω}. Wir betrachten allgemeine Vierecke T und T ′ , die eine gemeinsame Kante Γ haben, und setzen P (T ) = P1 ⊕ span{x1 x2 }. Der Sprung von vh ist zwar gleich Null in den Endpunkten von Γ , doch ist er im Allg. nicht linear auf Γ , so daß die Stetigkeit über Γ nicht gesichert ist. Hierfür (1) muß erreicht werden, daß die Restriktion von vh ∈ Vh auf alle Kanten Γ ∈ ∂Th linear ist. (1) Dies kann durch Konstruktion von Vh mit Hilfe der bilinearen Transformationen σT : T̂ → T erreicht werden. Für eine bi-lineare Transformation σT : T̂ → T ist die Inverse σT−1 : T → T̂ i.a. nicht bi-linear. In diesem Fall ist der gemäß (3.2.50) erzeugte lokale Ansatzraum P (T ) auch kein Polynomraum. Dennoch ist v|Γ auf jeder Kante Γ ∈ ∂Th linear, so daß Stetigkeit in allen Eckpunkten auch automatisch globale Stetigkeit auf Ω sowie v|∂Ω = 0 garantiert. Dieser Transformationsansatz löst also das Problem der globalen Stetigkeit. Definition 3.5 (Parametrischer Ansatz): Der Ansatz P (T ) wird parametrisch“ genannt, ” wenn er durch Transformationen σT : T̂ → T von einem Referenzelement T̂ erzeugt wird. Er heißt isoparametrisch“, wenn die Transformation σT vom selben Polynomtyp wie die Ansatz” funktionen in P̂ (T̂ ) ist. Der Begriff des isoparametrischen“ Finite-Element-Ansatzes läßt sich auf höheren Polynomgrad ” r ≥ 2 übertragen. Dies wird wichtig bei der Approximation eines krummen Randes bei Verwendung von Ansätzen höherer Ordnung. (siehe Bild mit quadratischer“ Randapproximitation). ” Die einfache Polygonzugapproximation würde hier zu einer Ordnungsreduktion führen: k∇(u − uh )k ≤ c hr kukr + hkuk2 , im Gegensatz zur optimalen Abschätzung k∇(u − uh )k ≤ chr kukr . Abbildung 3.9: Parametrische Randapproximation 100 Finite-Elemente-Verfahren für elliptische Probleme 3.3 Interpolation mit finiten Elementen Dieser Abschnitt ist dem grundlegenden Aspekt bei der mathematischen Analyse der Methode der finiten Elemente gewidmet: Wie gut lassen sich hinreichend glatte Funktionen durch stückweise polynomiale approximieren? Wir gehen von der im vorigen Abschnitt anhand von Beispielen beschriebenen abstrakten Situation aus. Sei T ⊂ Rd eine Zelle eines Finite-Elemente-Gitters Th ; der Durchmesser von T wird wieder mit diam(T ) = hT und der Radius einer (maximalen) einbeschriebenen Kugel mit ρT bezeichnet. Wir betrachten im folgenden ausschließlich parametrische“ Finite-Elemente-Ansätze. Jedes ” T ∈ Th sei Bild eines Referenz-Einheitselements“ T̂ ⊂ Rd mit Durchmesser diam(T̂ ) = ĥ ≈ 1 ” und Inkugelradius ρ̂ > 0. Die zugehörigen Abbildungen σT : T̂ → T seien der Einfachheit halber als affin-linear angenommen: BT ∈ Rd×d , bT ∈ Rd . x = σT (x̂) = BT x̂ + bT , (3.3.53) Der Fall allgemeiner Vierecke mit erzeugenden bilinearen Transformationen wird gegebenenfalls in Bemerkungen berücksichtigt werden. Allgemeine Interpolationsaufgabe: Auf einem beliebigen, aber festen Element T (z.B. dem Einheitselement T̂ ) seien ein Vektorraum P (T ) von Polynomen über T mit dim P (T ) = R sowie ein System von linearen Knotenfunktionalen“ KT = {χr , r = 1, ..., R} gegeben, so daß ” die folgenden Bedingungen erfüllt sind: (i) Der Ansatz ist unisolvent: q ∈ P (T ) : χr (q) = 0 (r = 1, ..., R) ⇒ q = 0. (3.3.54) (ii) Für ein m ≥ 1 gilt Pm−1 ⊂ P (T ) . (iii) Die Knotenfunktionale aus KT sind stetig auf H m (T ) : |χr (v)| ≤ cb kvkm;T , v ∈ H m (T ), r = 1, ..., R. (3.3.55) Unter der Bedingung (i) ist die zugehörige Lagrangesche bzw. Hermitesche Interpolationsaufgabe eindeutig lösbar, d.h: Zu jeder Funktion v ∈ H m (T ) existiert ein eindeutig bestimmtes Interpolationspolynom“ IT v ∈ P (T ) mit den Eigenschaften ” χr (IT v) = χr (v), r = 1, ..., R. Wenn die Knotenfunktionale zu singulär“ sind, um für Funktionen aus H m (Ω) definiert zu ” sein (z.B. die Ableitung ∂nm−1 v(m) in einer Seitenmitte m ∈ ∂T ), kann auch ein stärkerer Sobolew-Raum H m,p (Ω) mit p > d verwendet werden. Wir werden diesen Fall hier aber nicht weiter verfolgen. Notation: Im folgenden verwenden wir eine gebräuchliche Multiindex“-Schreibweise für mehr” fach indizierte Größen. Für einen Indexvektor α = (α1 , ..., αd )T ∈ Zd mit ganzzahligen, nichtnegativen Komponenten setzen wir |α| := d X i=1 αi , xα := d Y i=1 xαi i , Dα := d Y i=1 ∂iαi , o n X Pk = q(x) = aα xα . |α|≤k 3.3 Interpolation mit finiten Elementen 101 Mit dieser Notation schreiben sich z.B. die Sobolew-Normen bzw. -Halbnormen über T in der Form 1/2 1/2 X X . kD α vk2T , |v|m;T = kD α vk2T kvkm;T = |α|=m 0≤|α|≤m Wir leiten nun eine Reihe von technischen Hilfssätzen ab, die am Schluß zu den gewünschten allgemeinen Abschätzungen für den Interpolationsfehler bei Finite-Elemente-Ansätze führen werden. Die dabei verwendete Schlußweise geht in diesem Zusammenhang auf Bramble und Hilbert (1971) zurück, weswegen die ganze Theorie auch Bramble-Hilbert-Theorie“ und das ” Hauptresultat Bramble-Hilbert-Lemma“ genannt werden. ” Hilfssatz 3.3 (Nullraum von Ableitungsoperatoren): Jede Funktion v ∈ H m (T ) mit der Eigenschaft Dα v = 0 , |α| = m, (3.3.56) ist fast überall gleich einem Polynom aus Pm−1 (T ) . T k Beweis: Aus den Voraussetzungen folgt D β D α v ≡ 0 für beliebiges β und somit v ∈ ∞ k=1 H (T ) . m Nach dem Sobolewschen Einbettungssatz ist damit v ∈ C (T ), so daß sich die Behauptung mit Hilfe klassischer“ Argumente ergibt. Q.E.D. ” Hilfssatz 3.4 (Polynomprojektion): Zu jeder Funktion v ∈ H m (T ) existiert ein eindeutig bestimmtes Polynom q ∈ Pm−1 (T ) mit der Eigenschaft Z Dα (v − q) dx = 0 , 0 ≤ |α| ≤ m − 1 . (3.3.57) T Beweis: Zur Lösung der Aufgabe machen wir den Ansatz X q(x) := ξ β xβ ∈ Pm−1 (T ) |β|≤m−1 mit unbekannten Koeffizienten ξ = (ξ β )|β|≤m−1 (bei lexikographischer Anordnung der Indexkomponenten). Dies führt auf das quadratische, lineare Gleichungssystem Z Z X β α β D α v dx , 0 ≤ |α| ≤ m − 1. ξ D x dx = T T 0≤|β|≤m−1 Dessen Koeffizientenmatrix M= Z Dα xβ dx T 0≤|α|,|β|≤m−1 ist regulär. Andernfalls gäbe es ein ξ = (ξ β )|β|≤m−1 6= 0 mit M ξ = 0 . Das damit gebildete P Polynom q(x) = 0≤|β|≤m−1 ξ β xβ ∈ Pm−1 (T ) hätte dann die Eigenschaft Z Dα q dx = 0 , T 0 ≤ |α| ≤ m − 1 , (3.3.58) 102 Finite-Elemente-Verfahren für elliptische Probleme woraus offensichtlich q ≡ 0 und damit der Widerspruch ξ ≡ 0 folgte. Also existiert ein eindeutig bestimmtes Polynom mit den verlangten Eigenschaften. Q.E.D. Hilfssatz 3.5 (Verallg. Poincarésche Ungleichung): Für jede Funktion v ∈ H m (T ) mit der Eigenschaft Z D α v dx = 0 , 0 ≤ |α| ≤ m − 1 , (3.3.59) T gilt mit einer Konstante c0 = c(d, m, T ) kvkm;T ≤ c0 |v|m;T . (3.3.60) Beweis: Angenommen, die Behauptung wäre falsch. Dann existierte eine Folge von Funktionen vk ∈ H m (T ) , k ∈ N mit den Eigenschaften 1 = kvk km;T ≥ k|vk |m;T , k ∈ N. (3.3.61) Aufgrund der Kompaktheit der Einbettung von H m (T ) in H m−1 (T ) konvergiert eine Teilfolge, welche wir wieder mit (vk )k∈N bezeichnen, in H m−1 (T ) gegen ein v ∈ H m−1 (T ): kvk − vkm−1;T → 0 (k → ∞). (3.3.62) Mit der Annahme folgt |vk |m;T → 0 (k → ∞) . Also ist (vk )k∈N Cauchy-Folge in H m (Ω) mit Limes ṽ ∈ H m (T ) . Wegen vk →H m−1 v muß ṽ = v sein. Damit folgt |v|m;T = 0. Nach Hilfssatz 3.3 ist also v ∈ Pm−1 (T ) und besitzt die Eigenschaft Z Z α D α vk dx = 0 , 0 ≤ |α| ≤ m − 1 . (3.3.63) D v dx = lim T k→∞ T Dies bedeutet aber wegen Hilfssatz 3.4 notwendig v ≡ 0, was im Widerspruch zur Annahme kvkm;T = limk→∞ kvk km;T = 1 steht. Q.E.D. Nach diesen Vorbereitungen können wir das zentrale Resultat dieses Abschnitts, das sog. Bramble15 -Hilbert16 -Lemma, beweisen. Satz 3.5 (Bramble-Hilbert-Lemma): Sei F (·) : H m (T ) → R ein beschränktes, sublineares Funktional, welches auf Pm−1 (T ) verschwindet, d.h.: (i) (ii) (iii) 15 |F (v)| ≤ c1 kvkm;T (Beschränktkeit), |F (u + v)| ≤ c2 {|F (u)| + |F (v)|} F (q) = 0, q ∈ Pm−1 (T ) (Sublinearität), (Annulierungseigenschaft). James H. Bramble (1932-): US-amerikanischer Mathematiker: Prof. an der Cornell University und der Texas A&M University; fundamentale Beiträge zur Theorie der Finite-Elemente-Methode und von Iterationsverfahren, insbesondere Mehrgitterverfahrens. 16 Stephen Hilbert (????-): US-amerikanischer Mathematiker: Prof. am Ithaca College, New York; bekannt durch das sog. “Bramble-Hilbert-Lemma”. 3.3 Interpolation mit finiten Elementen 103 Dann gilt mit der Konstante c0 aus Hilfssatz 3.5: |F (v)| ≤ c0 c1 c2 |v|m;T , v ∈ H m (T ). (3.3.64) Beweis: Für ein v ∈ H m (T ) gilt mit beliebigem q ∈ Pm−1 (T ) : |F (v)| = |F (v − q + q)| ≤ c2 {|F (v − q)| + |F (q)|} ≤ c1 c2 kv − qkm;T . Wir wählen nun q ∈ Pm−1 (T ) als das gemäß Hilfssatz 3.4 zu v gehörende Polynom, so daß gemäß Hilfssatz 3.5 folgt: kv − qkm;T ≤ c0 |v − q|m;T = c0 |v|m;T . Dies impliziert dann |F (v)| ≤ c3 |v|m;T , mit c3 := c0 c1 c2 , was zu beweisen war. Q.E.D. Korollar 3.1 (Allg. Interpolationssatz): Seien die obigen Voraussetzungen erfüllt. Für jede Funktion v ∈ H m (T ) und das zugehörige interpolierende Polynom IT v ∈ P (T ) gilt bzgl. einer beliebigen stetigen Halbnorm | · | auf H m (T ): |v − IT v| ≤ c |v|m;T (3.3.65) mit einer Konstante c = c(d, m, R, T, | · |). Beweis: O.B.d.A. sei |v| ≤ kvkm;T , v ∈ H m (T ) . Durch F (v) := |v − IT v| wird auf H m (T ) ein sublineares Funktional definiert. Die Interpolierende IT v besitzt die Darstellung IT v = R X χr (v)ϕ(r) r=1 mit der durch die Bedingung χr (ϕ(s) ) = δrs , (r, s = 1, ..., R) eindeutig bestimmten verallgemeinerten Lagrange-Basis {ϕ(r) , r = 1, ..., R} des Polynomraums P (T ) . Wegen der Beschränktheit der Knotenfunktionale χr folgt |F (v)| ≤ |v| + |IT v| ≤ |v| + R X r=1 |χr (v)| |ϕ(r) | ≤ (1 + Rcb max |ϕ(r) |) kvkm;T , r=1,...,R und damit die Beschränktheit von F (·) . Wegen IT q = q für q ∈ P (T ) gilt weiter F (q) = 0, q ∈ Pm (T ). Aus Satz 3.5 folgt damit die behauptete Abschätzung. Q.E.D. Beispiele von Halbnormen, für die das obige Resultat angewendet wird, sind etwa: 1. L2 -Norm über T : |v − IT v| := Z T |v − IT v|2 dx 1/2 . 104 Finite-Elemente-Verfahren für elliptische Probleme 2. L2 -Norm über den Rand ∂T : |v − IT v| := Z ∂T |v − IT v|2 dx 1/2 . 3. Mittelwert über eine Kante Γ ⊂ ∂T : Z |v − IT v| := (v − IT v) dx . Γ 4. Maximum-Norm über T : |v − IT v| := max |v − IT v|. T 5. Wert in einem Punkt P ∈ Ω : |v − IT v| := |(v − IT v)(P )|. Als nächstes greifen wir nun unser eigentliches Problem an, nämlich den Interpolationsfehler auf den einzelnen Zellen T der Zerlegung Th abzuschätzen. Wir tun dies für den representativen Spezialfall der klassischen Lagrange/Hermite-Interpolation, bei der die Knotenfunktionale χr als Punktfunktionale für Funktionswerte sowie Ableitungswerte in gewissen Knotenpunkten âr ∈ T̂ (r = 1, ..., R) gegeben sind. Sei T̂ das Referenzelement der Größe ĥ := diam(T̂ ) = 1 und Inkreisradius ρ̂ > 0 . Für eine einzelne Zelle T ∈ Th bezeichnen wir mit ar = Bâr + b die aus den Stützstellen âr ∈ T̂ durch Anwendung der Transformation σ(x̂) = B x̂ + b erzeugten Punkte ar ∈ T . Entsprechend seien hT := diam(T ) sowie ρT > 0 der Inkreisradius von T . Die Umkehrabbildung σ −1 : T → T̂ (−1) hat die Darstellung σ −1 (x) = B −1 x − B −1 b mit der inversen Matrix B −1 = (bij )di,j=1 . Unter Verwendung dieser Abbildung x = σ(x̂) werden für Funktionen v : T → R und ŵ : T̂ → R zugehörige Funktionen v̂ : T̂ → R und w : T → R definiert durch v̂(x̂) := v(x), w(x) := ŵ(x̂). (3.3.66) Entsprechend lassen sich die partiellen Ableitungen nach x̂ und x durch die jeweils anderen ausdrücken: d d X X (−1) bij ∂ˆj . bij ∂j , ∂i := ∂ˆi := j=1 j=1 Wir nehmen an, daß der Polynomansatz P̂ (T̂ ) unisolvent ist mit einem Satz von Knotenfunktionalen der Form D̂r v̂(âr ), r = 1, ..., R , wobei die Punkte âr auch mehrfach auftreten können und r die Ableitungsoperatoren die Gestalt D̂r = ∂ˆα mit geeigneten Multiindizes αr = (αri , ..., αrd ) haben. Der Ansatzraum P̂ (T̂ ) habe die Lagrange-Basis {ϕ̂r , r = 1, . . . , R} , d.h.: D̂r ϕˆs (âr ) = δrs . Wir nehmen weiter an, daß alle auftretenden Ableitungen D̂r auf H m (T̂ ) wohl definiert und stetig sind: |D̂r v̂(âr )| ≤ c kv̂km;T̂ , v̂ ∈ H m (T̂ ). Die lokalen Polynomräume P (T ) werden wieder erzeugt via Koordinatentransformation aus 3.3 Interpolation mit finiten Elementen 105 dem Ansatzraum P̂ (T̂ ) auf dem Referenzelement: P (T ) := {q : T → R| q(σ(·)) ∈ P̂ (T̂ )}. Dasselbe gilt für die zugehörigen Basen {ϕ(r) , r = 1, ..., R} von P (T ) ϕr (x) := ϕ̂r (σ −1 (x)) , x ∈ T. Für Funktionen v ∈ H m (Ω) erhält man dann durch Setzung IT v := R X s=1 D̂s v̂(âs )ϕs ∈ P (T ) eine zellweise Lagrange/Hermite-Interpolierende IT v ∈ P (T ) mit den Eigenschaften (Man beachte D̂r ϕ̂s (âr ) = δrs .): D̂r IT v(ar ) = R X D̂s v̂(âs )D̂r ϕs (ar ) = s=1 R X D̂s v̂(âs )D̂r ϕ̂s (âr ) s=1 = D̂r v̂(âr ) = D̂r v(ar ), r = 1, ..., R. Je nach Art der Ableitungsoperatoren D̂r läßt sich dies gegebenenfalls auch als eine Interpolation mit lokal auf den Einzelzellen T definierten Ableitungsoperatoren Dr bzgl. der (physikalischen) Variablen x ausdrücken; z.B. in den einfachsten Fällen Dr v(ar ) := v(ar ) bzw. Dr v(ar ) ≈ ∇v(ar ) . Wir beweisen nun den Hauptsatz dieses Abschnittes zur Lagrange/Hermite-Interpolation. Satz 3.6 (Spez. Interpolationssatz): Für jedes v ∈ H m (T ) und die zugehörige LagrangeHermite-Interpolierende IT v ∈ P (T ) auf der Zelle T ∈ Th gilt: |v − IT v|k;T ≤ cI hm T |v|m;T , ρkT 0 ≤ k ≤ m, (3.3.67) mit Durchmesser und Inkreisradius hT bzw. ρT von T und einer Konstante cI = cI (d, m, T̂ ) . Beweis: (i) Für eine Funktion f ∈ L1 (T ) bezeichnet fˆ ∈ L1 (T̂ ) die zugehörige Transformierte fˆ(x̂) := f (x), x̂ = σ −1 (x) = B −1 x − B −1 b ∈ T̂ . Die Transformation σ −1 hat die Funktionalmatrix ∇σ −1 = B −1 , so daß gilt: Z Z Z f (x) dx . fˆ(x̂) dx̂ = | det B −1 | fˆ(σ −1 (x)) dx = | det B|−1 T̂ T (3.3.68) (3.3.69) T (−1) Wir schätzen nun die Elemente bij sowie bij der Matrizen B und B −1 ab. Jedes x ∈ Rd mit |x| = ρ gestattet mit zwei Punkten ξ, η ∈ T die Darstellung x = ξ − η, wobei ξ etwa als Mittelpunkt der Inkugel von T gewählt werden kann. Dann sind ξ̂ = B −1 ξ − B −1 b, η̂ = B −1 η − B −1 b ∈ T̂ , und wir erhalten |B −1 x| = |B −1 ξ − B −1 b − B −1 η + B −1 b| = |ξ̂ − η̂| ≤ ĥ. (3.3.70) 106 Finite-Elemente-Verfahren für elliptische Probleme Da alle Matrizennormen auf Rd×d äquivalent sind, gilt mit einer Konstante c = c(d) max (−1) i,j=1,...,d |bij | ≤ c sup x∈Rd |B −1 x| |B −1 x| ĥ = c sup ≤c . |x| |x| ρ |x|=ρ (3.3.71) Analog wird bewiesen: max i,j=1,...,d |bij | ≤ c h . ρ̂ (3.3.72) (ii) Es seien nun T ∈ Th sowie v ∈ H m (T ) beliebig gegeben. Es ist IT v ∈ P (T ) die Interpolierende von v auf T und IT̂ v̂(·) = IT v(σ(·)) ∈ P (T̂ ) (3.3.73) die Interpolierende der Transformierten v̂ ∈ H m (T̂ ) auf T̂ . Nach Satz 3.1 gilt auf T̂ : |v̂ − IT̂ v̂|k;T̂ ≤ ĉ |v̂|m;T̂ , 0 ≤ k ≤ m, (3.3.74) mit einer festen Konstante ĉ = ĉ(d, m, T̂ ) . Durch Koordinatentransformation zwischen T̂ und T werden wir nun zeigen, daß |v − IT v|k;T ≤ c | det B|1/2 |v̂ − IT̂ v̂|k;T̂ , ρk |v̂|m;T̂ ≤ c hm | det B|−1/2 |v|m;T , mit Konstanten c = c(d, m, T̂ ). Diese beiden Beziehungen ergeben dann zusammen mit (3.3.74) die Behauptung. (iii) Für die Ableitungen von v bzw. v̂ gilt mit x̂ = σ −1 (x) = B −1 x − B −1 b : −1 ∂c i v(x̂) = ∂i v(x) = ∂i v̂(σ (x)) = ∂ˆi v̂(x̂) = ∂ˆi v(σ(x̂)) = d X d X ∂ˆj v̂(x̂) ∂i σj−1 (x) = d X j=1 j=1 ∂j v(x) ∂ˆi σj (x̂) = d X ∂j v(x)bji = d X j=1 j=1 j=1 (−1) ∂ˆj v̂(x̂) bji , und folglich |∂c i v(x̂)| ≤ c ĥ max |∂ˆj v̂(x̂)| ρ j=1,...,d |∂ˆi v̂(x̂)| ≤ c d ∂j v(x̂)bji , h max |d ∂j v(x̂)|. ρ̂ j=1,...,d Für allgemeine Ableitungen Dα bzw. D̂α der Ordnung k = |α| gewinnen wir durch k-malige Anwendung dieser Beziehungen: α v(x̂)| ≤ c d |D |D̂ α v̂(x̂)| ≤ c (−1) |α| |bij max d β v(x̂)| ≤ c |bij ||α| max |D i,j=1,...,d i,j=1,...,d | max |D̂ β v̂(x̂)| ≤ c max |β|=|α| |β|=|α| ĥ |α| ρ h |α| ρ̂ max |D̂β v̂(x̂)|, |β|=|α| d β v(x̂)| . max |D |β|=|α| 3.3 Interpolation mit finiten Elementen 107 Mit Hilfe dieser Abschätzungen und der Substitutionsformel (3.3.69) folgt nun Z Z α 2 α v(x̂)|2 dx̂ d |D v(x)| dx = | det B| |D T T̂ Z ĥ 2|α| ≤ c | det B| max |D̂ β v̂(x̂)|2 dx̂ ρ |β|=|α| T̂ Z Z h 2|α| α 2 d β v(x̂)|2 dx̂ max |D |D̂ v̂(x̂)| dx̂ ≤ c ρ̂ |β|=|α| T̂ T̂ Z h 2|α| |D β v(x)|2 dx . ≤ c | det B|−1 max ρ̂ |β|=|α| T Damit ist für 0 ≤ k ≤ m bewiesen: |v|k;T ≤ c | det B|1/2 ĥ k ρ |v̂|k;T̂ , |v̂|k;T ≤ c | det B|−1/2 h k ρ̂ |v|k;T . Anwendung dieser Beziehungen für v und v − IT v ergibt schließlich wegen 0 < ρ ≤ h ≤ 1 die behauptete Abschätzungen (3.3.67). Q.E.D. Bemerkung 3.6: Die Fehlerabschätzung (3.3.67) für die Polynominterpolation hat natürliche Verallgemeinerungen auf andere Halbnormen | · |T sowie auf andere Regularitätsstufen v ∈ H m,p (T ) , 1 ≤ p ≤ ∞ . Wir geben ohne Beweis das folgende allgemeine Resultat an: m−d/p |v − IT v|k,q;T ≤ ci hT k−d/q ρT |v|m,p;T , (3.3.75) für 0 ≤ k ≤ m, 1 ≤ p ≤ q ≤ ∞ , mit einer Konstante ci = ci (d, k, m, p, q, Tˆ) . Für spätere Zwecke sind hiervon insbesondere die Fälle p = q = 1 (für m ≥ 2) , p = q = ∞ sowie p = 2, q = ∞ (für k ≤ m + 2) von Interesse. Z.B. gilt für d = 2, m = 2, q = ∞, p = 2 : max |v − IT v| ≤ ci hT |v|2,2;T . T (3.3.76) Auf ähnliche Art wie im Beweis von Satz 3.6 gewinnt man durch Transformation auf das Einheitselement T̂ die folgende sog. inverse Beziehung“ für finite Elemente: ” Satz 3.7 (Inverse Beziehung): Unter den obigen Voraussetzungen gilt auf jeder Zelle T ∈ Th für Finite-Elemente-Funktionen v ∈ P (T ) mit einer Konstante c = c(d, ρT , k, s): |v|k;T ≤ c hsT |v|s;T , ρkT 0 ≤ s ≤ k ≤ m. (3.3.77) Beweis: Für Polynome q̂ ∈ P (T̂ ) gilt wegen der Äquivalenz von Normen auf dem (endlich dimensionalen) Quotientenraum P (T )/Pk−1 (T ) mit einer Konstante ĉ = ĉ(d, m, T̂ ) : |q̂|k;T̂ ≤ ĉ |q̂|s;T̂ , 0 ≤ s ≤ k ≤ m. Die Behauptung ergibt sich nun wieder durch Transformation auf die Zelle T . (3.3.78) Q.E.D. 108 Finite-Elemente-Verfahren für elliptische Probleme Bemerkung 3.7: Analoge Abschätzungen wie die in Satz 3.6 und Satz 3.7 gelten auch für Tensorprodukt-Polynomansätze auf Vierecken bzw. Hexaedern. Wir wollen diese Resultate auf die obigen konkreten Beispiele anwenden. In diesen sind alle formulierten Bedingungen erfüllt. Insbesondere gilt die uniform shape“ Bedingung ” hT sup max ≤ c. T ∈T h ρT h>0 (m−1) Dann folgt aus Satz 3.6 für die FE-Ansatzräume Vh die Interpolationsfehlerabschätzungen |v|m;T , |v − IT v|k;T ≤ c hm−k T ⊂ H01 (Ω) vom Polynomgrad m−1 ∈ N0 k = 0, ..., m, T ∈ Th , (3.3.79) mit Konstanten c = c(d, m, T̂ ). Manchmal möchte man den Interpolationsfehler auch über den Rand der Zelle oder punktweise abschätzen. Hierfür gilt m−1/2 k∇2 vkm;T , (3.3.80) k∇2 vkm;T . max |v − IT v| ≤ chm−1 T (3.3.81) kv − IT vk∂T ≤ chT und z.B. in zwei Dimensionen x∈T Als Folgerung aus diesem lokalen Abschätzungen erhalten wir die folgenden globale Approximationsabschätzungen |v − Ih v|k ≤ c hm−k |v|m , k = 0, ..., m. (3.3.82) ku − Ih uk + hk∇(u − Ih u)k ≤ ch2 k∇2 uk. (3.3.83) Für lineare“ finite Elemente gilt also speziell ” In diesem Fall ergibt die inverse“ Beziehung (3.3.77): ” k∇vh k ≤ h−1 kvh k, (1) vh ∈ Vh . (3.3.84) Entsprechend gilt für quadratische“ finite Elemente ” ku − Ih uk + hk∇(u − Ih u)k ≤ ch3 k∇3 uk, (3.3.85) und k∇2 vh k ≤ h−2 kvh k, (2) vh ∈ Vh . (3.3.86) Damit ist jetzt die theoretische Grundlage für die a priori Fehlerabschätzungen für das GalerkinFinite-Elemente-Verfahren aus Satz 3.1 geschaffen. 3.4 A priori Fehleranalyse 109 3.4 A priori Fehleranalyse Die in Abschnitt 3.3 hergeleiteten Abschätzungen für den Fehler bei der Interpolation mit stückweise polynomialen Funktionen sind die Basis für die a priori Fehleranalyse des FiniteElemente-Verfahrens. Wir formulieren die folgende Verallgemeinerung von Satz 3.1 für FEApproximationen allgemeiner Ordnung m ≥ 2 , (∇uh , ∇ϕh ) = (f, ϕh ) ∀ϕh ∈ Vh , (3.4.87) der Poisson-Gleichung. Dabei ist die sog. Ordnung“ eines FE-Verfahrens im wesentlichen durch ” den Polynomgrad der verwendeten Ansatzfunktionen bestimmt, d.h. durch die Beziehung Pm−1 ⊂ P (T ) für alle T ∈ Th . Korollar 3.2 (Allg. FE-Konvergenz): Für den Fehler eh := u−uh einer FE-Methode mit Ansatzräumen Vh ⊂ H01 (Ω) der Ordnung m ≥ 2 zur Approximation der Poisson-Gleichung gilt die a priori Fehlerabschätzung: keh k + hk∇eh k ≤ c hm k∇m uk . (3.4.88) Wir wollen eine Schwäche dieses Resultats nicht unerwähnt lassen. Im allgemeinen sind Lösungen u ∈ H01 (Ω) elliptischer Gleichungen zweiter Ordnung über Gebieten mit Polygonrand nicht aus H m (Ω) für m ≥ 3. An den Ecken von ∂Ω treten starke Singularitäten der Ableitungen von u auf. Die obige Voraussetzung u ∈ H m (Ω) ist also für m > 2 unrealistisch. Finite Elemente höherer Ordnung m > 2 können jedoch bei Gebieten mit hinreichend glattem Rand ∂Ω erfolgreich verwendet werden, denn in diesem Fall kann die Regularitätstheorie meist u ∈ H m (Ω) sichern. Dabei sind aber besondere Maßnahmen, wie z. B. die Verwendung isoparametrischer Ansätze, zur Approximation entlang des krummen Randes erforderlich. Wir haben gesehen, daß der Fehler z.B. bei linearen“ finiten Elementen gemessen in der L2 ” Norm eine verbesserte Konvergenzordnung O(h2 ) gegenüber der von O(h) in der Energie-Norm zuläßt. Es stellt sich die Frage, ob man durch weitere Abschwächung der Norm vielleicht noch höhere Konvergenzordnungen erzielen kann. Diese Hoffnung wird zunächst bestärkt durch die Beobachtung, daß dies für die L2 -Projektion durchaus der Fall ist. Die in Frage kommenden Normen werden illustrativ als negative“ Sobolew-Normen bezeichnet und sind in den einfachsten ” Fällen definiert durch kvk−1 := sup ϕ∈V (v, ϕ) , kϕk1 kvk−2 := sup ϕ∈V ∩H 2 (Ω) (v, ϕ) . kϕk2 wobei wieder V := H01 (Ω) . (1) Hilfssatz 3.6 (L2 -Projektion): Für die L2 -Projektion Ph : V → Vh auf den Raum Vh linearen“ finiten Elemente gilt die Fehlerabschätzungen ” ku − Ph uk−2 + hku − Ph uk−1 + h2 ku − Ph uk ≤ ch4 k∇2 uk . der (3.4.89) Beweis: Zunächst rekapitulieren wir die übliche Bestapproximationseigenschaft“ der L2 -Projektion: ” ku − Ph uk = min ku − ϕh k . (1) ϕh ∈Vh (3.4.90) 110 Finite-Elemente-Verfahren für elliptische Probleme Daraus folgt mit der lokalen Interpolationsabschätzung (3.3.79) die Beziehung ku − Ph uk ≤ ch2 k∇2 uk . (3.4.91) Mit einem beliebigen ϕ ∈ H01 (Ω) gilt entsprechend für k ∈ {1, 2} : (u − Ph u, ϕ) = (u − Ph u, ϕ − Ph ϕ) ≤ ku − Ph uk kϕ − Ph ϕk ≤ ch2+k k∇2 uk k∇k ϕk . Dies impliziert (u − Ph , ϕ) ≤ ch2+k k∇2 uk , kϕk k ϕ∈H 1 (Ω)∩H k (Ω) sup 0 was zu beweisen war. Q.E.D. Der Beweis von Hilfssatz 3.6 zeigt, daß eine weitere Erhöhung jenseits O(h4 ) der Approximati(1) onsordnung der L2 -Projektion auf den Ansatzraum Vh auch in einer noch schwächeren Norm (1) nicht mehr möglich ist. Für die Ritz-Projektion“ Rh : V → Vh ist in diesem Fall sogar O(h2 ) ” die Obergrenze für die erreichbare Ordnung. Dies zeigt der folgende Satz. (1) Satz 3.8 (Ritz-Projektion): Für die Ritz-Projektion Rh : V → Vh linearen“ finiten Elemente gilt die Abschätzung ” ku − Rh uk−1 ≥ c(f ) k∇(u − Rh u)k2 , auf den Raum der (3.4.92) mit einer positiven Konstante c(f ) > 0 . Beweis: Sei f ∈ H01 (Ω) . Für die Lösung u ∈ V der Gleichung −∆u = f gilt unter Ausnutzung der Galerkin-Orthogonalität“: ” (u − Rh u, f ) = (∇(u − Rh u), ∇u) = k∇(u − Rh u)k2 . Wegen sup ϕ∈V (u − Rh u, ϕ) (u − Rh u, f ) ≥ kϕk1 kf k1 impliziert dies die Behauptung. Q.E.D. Da die Energie-Fehlerabschätzung k∇(u − Rh u)k ≤ ch k∇2 uk bzgl. der Ordnung bestmöglich ist, folgt aus (3.4.92) die Unmöglichkeit einer Fehlerabschätzung mit einer Ordnung größer als zwei für lineare“ finite Elemente. ” 3.4.1 Punktweise Fehlerabschätzung In den vorangegangenen Abschnitten haben wir gesehen, daß die Methode der finiten Elemente als Projektionsmethode zunächst ganz natürlich zu a priori Abschätzungen in der Energienorm“ ” 3.4 A priori Fehleranalyse 111 k∇ek und dann über ein Dualitätsargument auch zu verbesserten Abschätzungen in der L2 Norm kek führt. Diese Konvergenzaussagen im quadratischen Mittel“ gestatten aber noch ” keinen unmittelbaren Schluß auf die punktweise Konvergenz des Verfahrens. Dieser Frage soll jetzt wieder anhand des einfachen Modellproblems Poisson-Gleichung“, ” −∆u = f in Ω, u = 0 auf ∂Ω, (3.4.93) auf einem (konvexen) Polygongebiet Ω ⊂ R2 nachgegangen werden. Wir beschränken uns da(1) bei auf die Approximation (3.4.87) mit stückweise linearen Ansätzen Vh ⊂ V auf regulären Triangulierungen. Wir rekapitulieren hierfür die a priori Fehlerabschätzung kek + hk∇ek ≤ ch2 k∇2 uk , (3.4.94) wobei die Konstante c wesentlich durch die Konstante in der Interpolationsfehlerabschätzung k∇(u − Ih u)kT ≤ ci h k∇2 ukT , T ∈ Th , (3.4.95) bestimmt ist. Wir erinnern daran, daß im vorliegenden Fall eines konvexen Grundgebiets jedes v ∈ V mit ∆v ∈ L2 (Ω) automatisch in H 2 (Ω) ist und der a priori Abschätzung genügt: k∇2 vk ≤ k∆vk. (3.4.96) Satz 3.9 (Sub-optimale L∞ -Norm-Fehlerabschätzung): Unter den obigen Voraussetzungen konvergiert die Methode der finiten Elemente punktweise mit der Ordnung O(h) : max |e| ≤ chk∇2 uk . (3.4.97) Ω (1) Beweis: Sei T ein beliebiges Dreieck aus Th . Für eine Funktion vh ∈ Vh Z −1 max |vh | ≤ c|T | |vh | dx. T gilt dann (3.4.98) T Dies folgt leicht mit Hilfe der Transformation auf die Referenzzelle T̂ ( dx ≈ |T |dx̂ ) und der dort geltenden Beziehung (Äquivalenz von Normen) Z max |v̂h | ≤ ĉ |v̂h | dx̂. T̂ T̂ (1) Mit der Knoteninterpolierenden Ih u ∈ Vh zu u ∈ V ∩ H 2 (Ω) gilt max |u − Ih u| ≤ chT k∇2 ukT . T Damit erschließen wir dann max |e| ≤ max |u − Ih u| + max |Ih e| T T T Z ≤ max |u − Ih u| + c|T |−1 |Ih e| dx T T Z −1 ≤ max |u − Ih u| + c|T | |e| dx ≤ chT k∇2 ukT + ch−1 T kekT . T T (3.4.99) 112 Finite-Elemente-Verfahren für elliptische Probleme Mit Hilfe der L2 -Fehlerabschätzung (3.4.94) folgt also die Behauptung. Q.E.D. Bemerkung 3.8: Unter der bloßen Annahme u ∈ V ∩H 2 (Ω) ist die Fehlerabschätzung (3.4.97) bzgl. der h-Potenz optimal. Um dies einzusehen, betrachte man z.B. auf dem Einheitskreis B1 = {x ∈ R2 | |x| < 1} die Funktionen uh (x) := (|x|2 + h4 )1/2 Offenbar ist uh ∈ H 2 (B1 ) , und es gilt Z 1/2 k∇2 uh kB1 ≤ c (|x|2 + h4 )−1 dx ≤ c | ln(h)|1/2 . B1 Wir nehmen nun an, daß unser Lösungsgebiet Ω den Kreis B1 enthält und die Funktionen uh geeignet zu Funktionen ūh ∈ H01 (Ω) ∩ H 2 (Ω) fortgesetzt sind. Ferner gehöre zu jeder der Triangulierungen Th ein Dreieck T0 mit Durchmesser h und dem Inkreismittelpunkt a0 = 0. Dann ist in den Eckpunkten ai und dem Mittelpunkt a0 von T0 stets ūh (ai ) ≥ h, ūh (a0 ) = h2 . Würde nun für die Ritz-Projektion ūhh ∈ Vh zu ūh mit einem ε > 0 gelten max |ūh − ūhh | ≤ ch1+ε k∇2 ūh kΩ , T0 so ergäbe sich für hinreichend kleines h im Widerspruch zur Linearität der ūhh auf T0 : |ūhh (a0 )| ≤ |ūhh (a0 ) − ūh (a0 )| + |ūh (a0 )| ≤ ch1+ε1 , 0 < ε1 < ε, |ūhh (ai )| ≥ |ūh (ai )| − |ūh (ai ) − ūhh (ai )| ≥ ch. Numerische Experimente zeigen, daß im Falle höherer Regularität von u (etwa u ∈ C 2 (Ω)) die optimale Ordnung O(h2 ) des L2 -Fehlers auch für die punktweise Konvergenz vorliegt. Ein ähnliches Phänomen haben wir bereits bei der Differenzenapproximation mit dem 5-PunkteOperator gesehen, bei dem sich auf gleichförmigen Gittern die Konvergenzordnung O(h) im Falle u ∈ C 3 (Ω) auf O(h2 ) im Falle u ∈ C 4 (Ω) erhöht. Für die Methode der finiten Elemente beweisen wir nun das folgende optimale Resultat auf allgemeinen regulären Gittern: Satz 3.10 (Optimale L∞ -Abschätzung): Im Falle u ∈ V ∩ C 2 (Ω) gilt die Konvergenzabschätzung sup |e| ≤ ch2 {| ln(h)| + 1} max |∇2 u|. Ω Ω (3.4.100) Beweis: Wir notieren zunächst die Interpolationsfehlerabschätzung sup |u − Ih u| + h sup |∇(u − Ih u)| ≤ ch2 sup |∇2 u| Ω Ω (3.4.101) Ω I) Für ein h > 0 sei T∗ ∈ Th beliebig, aber fest gewählt. O.B.d.A. wird im folgenden h ≤ (1) angenommen. Mit der Knoteninterpolierenden Ih u ∈ Vh 1 2 von u gilt wieder (siehe Beweis von 3.4 A priori Fehleranalyse 113 Satz 3.9) −1 max |e| ≤ c max |u − Ih u| + c|T∗ | T∗ T∗ ≤ ch2T∗ 2 −1 max |∇ u| + c|T∗ | T∗ Z T∗ |e| dx T∗ |e| dx. Z Damit ist die Abschätzung des L∞ -Fehlers zurückgeführt auf eine lokale L1 -Fehlerabschätzung. Mit der durch δh :≡ |T∗ |−1 sign(e) in T∗ , δh :≡ 0 sonst, definierten Funktion δh ∈ L2 (Ω) ( regularisierte“ Dirac17 -Funktion) gilt weiter ” Z −1 |T∗ | |e| dx = (δh , e). T∗ II) Im nächsten Schritt wird wieder ein Dualitätsargument verwendet. Wir betrachten das Hilfsproblem −∆gh = δh in Ω, gh = 0 auf ∂Ω. (3.4.102) Die Funktion gh kann als regularisierte“ Greensche Funktion angesehen werden. Damit erhalten ” wir Z |e| dx = (∇e, ∇gh ). (3.4.103) |T∗ |−1 T∗ Unter Verwendung der durch (1) (∇ghh , ∇ϕh ) = (∇gh , ∇ϕh ) ∀ϕh ∈ Vh , (1) definierten Ritz-Projektion“ ghh ∈ Vh von gh erhalten wir durch zweimalige Anwendung der ” Galerkin-Orthogonalität die Beziehung Z −1 (3.4.104) |e| dx = (∇e, ∇(gh − ghh )) = (∇(u − Ih u), ∇(gh − ghh )). |T∗ | T∗ Mit der Hölderschen Ungleichung folgt Z Z −1 |∇(gh − ghh )| dx. |T∗ | |e| dx ≤ max |∇(u − Ih u)| T∗ Ω (3.4.105) Ω Unter Beachtung der Interpolationsabschätzung (3.4.101) erhalten wir schließlich die Beziehung Z |∇(gh − ghh )| dx max |∇2 u|. (3.4.106) max |e| ≤ ch h + T∗ Ω Ω Die punktweise Abschätzung des Fehlers e ist also zurückgeführt auf eine globale L1 -Fehlerabschätzung für den Gradienten der Greenschen Funktion“: ∇(gh − ghh ) . Dieser wird unten ” 17 Paul Adrien Maurice Dirac (1902-1984): französischer Physiker und Mathematiker; Prof. in Cambridge; wichtige Beiträge zur Quanten Mechanik und Kosmologie, 1933 Nobel-Preis. 114 Finite-Elemente-Verfahren für elliptische Probleme weiter abgeschätzt. Dazu benötigen wir einige a priori Abschätzungen für gh , die im folgenden bereitgestellt werden. III) Sei x∗ der Inkreismittelpunkt von T∗ . Wir definieren die Gewichtsfunktion σ(x) := (|x − x∗ |2 + κ2 h2 )1/2 . Durch Nachrechnen verifiziert man leicht die Beziehungen ( 0 < h ≤ κh ≤ σ ≤ c, |∇σ| ≤ c∗ , |∇2 σ| ≤ cσ −1 , 1 2 ) kσ −1 k ≤ c | ln(h)|1/2 , mit von h und κ unabhängigen Konstanten. Für die Größen σ̄T := maxT σ und σ T := minT σ gilt daher σ̄T ≤ σ T + h max |∇σ| ≤ σ T + c∗ h, T und bei Wahl von κ := 2c∗ (unabhängig von h): σ̄T ≤ σ T + 12 σ̄T , und damit max T ∈Th σ̄T ≤ 2. σT (3.4.107) Hilfssatz 3.7 (Greensche Funktion): Für die regularisierte Greensche Funktion“ gh gel” ten die a priori Abschätzungen sup |gh | ≤ c | ln(h)|, (3.4.108) Ω k∇gh k + kσ∇2 gh k ≤ c | ln(h)|1/2 , 2 h −1 k∇ g k ≤ ch , (3.4.109) (3.4.110) mit von h ∈ (0, 12 ] unabhängigen Konstanten c. Beweis: (i) Die richtige“ Greensche Funktion g(·) = g(x∗ , ·) zum Aufpunkt x∗ erlaubt die ” Abschätzung (Beweis mit Hilfe des Maximumprinzips) |g(x)| ≤ c {| ln(|x − x∗ |)| + 1} . Konstruktionsgemäß folgt damit |gh (x)| = |(∇gh , ∇g)| = |(δh , g)Ω | ≤ ch−2 Z T∗ |g| dx ≤ c {| ln(h)| + 1} . Dies impliziert die Abschätzung (3.4.108). (ii) Zum Beweis von (3.4.110) verwenden wir die übliche a priori L2 /H 2 -Abschätzung k∇2 gh k ≤ ckδh k ≤ ch−1 . (iii) Als nächstes notieren wir die einfache a priori Abschätzung k∇2 gh k ≤ k∆gh k ≤ ch−1 . (3.4.111) 3.4 A priori Fehleranalyse 115 Weiter gilt k∇gh k2 = (δh , gh ) ≤ c max |gh | ≤ c | ln(h)|. Ω Dies impliziert den ersten Teil der Abschätzung (3.4.109). (iii) Schließlich setzen wir ξ := x − x∗ und finden wegen |ξi ∇2 gh | ≤ |∇2 (ξi gh )| + |∇gh | die Beziehung kσ∇2 gh k2 = ≤ 2 X i=1 kξi ∇2 gh k2 + κ2 h2 k∇2 gh k2 2 n X i=1 o k∇2 (ξi gh )k2 + k∇gh k2 + κ2 h2 k∇2 gh k2 . Mit Hilfe der üblichen a priori L2 /H 2 -Abschätzung (3.4.96) folgt k∇2 (ξi gh )k ≤ k∆(ξi gh )k ≤ kξi ∆gh k + k∇gh k ≤ kξi δh k + k∇gh k ≤ c + c | ln(h)|1/2 . Die vorausgehenden Abschätzungen implizieren dann o n kσ∇2 gh k ≤ c 1 + | ln(h)|1/2 , woraus (3.4.109) folgt. Dies vervollständigt den Beweis von (3.4.109). Q.E.D. IV) Wir kehren nun zum Beweis des Satzes zurück und schätzen wie folgt ab: Z |∇(gh − ghh )| dx ≤ kσ −1 k kσ∇(gh − ghh )k ≤ c | ln(h)|1/2 kσ∇(gh − ghh )k. Ω Durch Ausdifferenzieren folgt weiter kσ∇(gh − ghh )k2 = (∇(gh − ghh ), ∇(σ 2 (gh − ghh ))) − (∇(gh − ghh ), (gh − ghh )∇σ 2 ) =: E1 − E2 . Die Terme E1 und E2 werden im folgenden separat abgeschätzt. Im Hinblick auf die GalerkinOrthogonalität gilt E1 = (∇(gh − ghh ), ∇(σ 2 (gh − ghh ) − ψh )) (1) mit der Knoteninterpolierenden ψh := Ih {∇(σ 2 (gh − ghh ))} ∈ Vh . Dies wird weiter abgeschätzt durch X kσ∇(gh − ghh )kT kσ −1 ∇(σ 2 (gh − ghh ) − ψh )kT E1 ≤ T ∈Th ≤ 14 kσ∇(gh − ghh )k2 + c X T ∈Th kσ −1 ∇(σ 2 (gh − ghh ) − ψh )k2T . 116 Finite-Elemente-Verfahren für elliptische Probleme Mit Hilfe der Interpolationsfehlerabschätzung (3.4.99) werden die einzelnen Summanden wie folgt abgeschätzt: 2 2 h h kσ −1 ∇(σ 2 (gh − ghh ) − ψh )k2T ≤ σ −2 T k∇(σ (g − gh ) − ψh )kT Dies ergibt wegen (3.4.107): E1 ≤ h 1 4 kσ∇(g 2 2 2 h h 2 ≤ c σ −2 T hT k∇ (σ (g − gh ))kT 2 h h 2 h h 2 2 2 h 2 ≤ c σ −2 T hT kg − gh kT + kσ∇(g − gh )kT + kσ ∇ g kT 2 2 2 h 2 h h 2 ≤ c kgh − ghh k2T + c σ −2 T σ̄T hT k∇(g − gh )kT + kσ∇ g kT . − ghh )k2 + c kgh − ghh k2 + c h2 k∇(gh − ghh )k2 + kσ∇2 gh k2 . Die schon bekannten L2 -Fehlerabschätzungen liefern weiter E1 ≤ 41 kσ∇(gh − ghh )k2 + ch2 h2 k∇2 gh k2 + kσ∇2 gh k2 , sowie unter Beachtung der Abschätzungen von Hilfssatz 3.7 E1 ≤ 14 kσ∇(gh − ghh )k2 + ch2 | ln(h)|. Für den zweiten Term gilt wegen |∇σ 2 | ≤ cσ : E2 ≤ ckσ∇(gh − ghh )kkgh − ghh k ≤ 14 kσ∇(gh − ghh )k2 + ckgh − ghh k2 sowie mit den Argumenten von eben: E2 ≤ 41 kσ∇(gh − ghh )k2 + ch2 . Kombination der Abschätungen für E1 und E2 ergibt schließlich kσ∇(gh − ghh )k2 ≤ 12 kσ∇(gh − ghh )k2 + ch2 | ln(h)|, und damit die Behauptung. Q.E.D. Der logarithmische Term | ln(h)| in der Abschätzung (3.4.100) läßt sich auf allgemeinen Gittern nicht vermeiden. Dies wird durch numerische Tests und auch durch theoretische Analyse bestätigt. Auf gleichförmigen Gittern (Je zwei benachbarte Dreiecke bilden ein Parallelogramm.) erhält man unter der stärkeren Glattheitsbedingung u ∈ C 2+α (Ω) allerdings die optimale Konvergenzordnung O(h2 ). Vergleicht man dieses Resultat mit dem entsprechenden für die Differenzenapproximation mit dem 5-Punkte-Operator, so stellen wir eine deutliche Abschwächung der Regularitätsanforderungen um fast zwei Stufen fest. Auf Polygongebieten ist die Bedingung u ∈ H 2,∞ (Ω) für die schwache Lösung von (3.4.93) im allgemeinen unrealistisch. Bei den Ecken können die zweiten Ableitungen Singularitäten haben. Auf konvexen Polygongebieten ist gerade die Voraussetzung u ∈ H 2 (Ω) natürlich, d.h. stets erfüllt, wogegen u ∈ H 2,∞ (Ω1 ) nur auf Teilgebieten Ω′1 ⊂ Ω mit positivem Abstand zu den Eckpunkten gilt. In diesem Fall haben wir das folgende lokale“ Resultat: ” Satz 3.11 (Lokales Fehlerverhalten): Sei Ω1 ⊂ Ω ein Teilgebiet mit positivem Abstand δ1 zu den Eckpunkten von Ω und u ∈ H 2 (Ω) ∩ C 2 (Ω1 ). Dann gilt auf jedem zweiten Teilgebiet 3.4 A priori Fehleranalyse 117 Ω2 ⊂ Ω1 mit Abstand δ2 > δ1 zu den Eckpunkten die Fehlerabschätzung 2 2 2 sup |e| ≤ ch | ln(h)| sup |∇ u| + k∇ ukΩ . Ω2 (3.4.112) Ω1 Beweis: Der technisch aufwendige Beweis kann im Rahmen dieser Vorlesung nicht geführt werden. Q.E.D. Bemerkung 3.9: Zum Abschluß bemerken wir noch, daß sich für finite Elemente höherer Ordnung (Polynomgrad m − 1 ≥ 2) zu (3.4.100) analoge punktweise Fehlerabschätzungen unter der Voraussetzung u ∈ C m (Ω) herleiten lassen: sup |e| ≤ chm sup |∇m u|. Ω (3.4.113) Ω Bemerkenswerterweise tritt dabei ab Polynomordnung m − 1 = 2 der störende logarithmische Term | ln(h)| nicht auf. Dasselbe gilt auch für den niedrigsten Ansatzgrad m − 1 = 1 , wenn der maximale Fehlergradient betrachtet wird: sup |∇e| ≤ ch sup |∇2 u|. Ω Ω (3.4.114) 118 Finite-Elemente-Verfahren für elliptische Probleme 3.5 Implementierungsaspekte Im folgenden wollen wir einige Fragen im Zusammenhang mit der praktischen Realisierung von Finite-Elemente-Methoden diskutieren. Dazu betrachten wir als Modellfall die 1. RWA eines allgemeineren (elliptischen) Differentialoperators, Lu := −∇{a∇u} = f in Ω, u = 0 auf ∂Ω, (3.5.115) mit möglicherweise variablem Koeffizienten a = a(x) ≥ α > 0 auf einem (konvexen) Polygongebiet Ω ⊂ R2 . Die Diskretisierung erfolgt wieder auf Ansatzräumen Vh ⊂ H01 (Ω) zu einer Folge von (gleichmäßig) regulären Zerlegungen Th = {T } des Grundgebiets Ω ⊂ Rd (d = 2, 3), a(u, ϕ) = l(ϕ) ∀ϕh ∈ Vh . (3.5.116) mit den bilinearen bzw. linearen Formen a(u, ϕ) := (a∇uh , ∇ϕh ), l(ϕ) := (f, ϕh ). Die Aufstellung des zugehörigen linearen Gleichungssystems erfordert in der Regel die Anwendung numerischer Integration, was zu einem zusätzlichen Fehler führt. 3.5.1 Aufbau der Systemmatrizen und Vektoren Im Gegensatz zu den Differenzenverfahren auf strukturierten Gittern lassen sich die algebraischen Gleichungssysteme der Finite-Elemente-Verfahren auf allgemeinen Zerlegungen Th in der Regel nicht explizit per Hand“ aufstellen. ” (n) Mit der Knotenbasis {ϕh , n = 1, ..., N } des Finite-Elemente-Raumes Vh ⊂ H01 (Ω) sind N die Systemmatrizen A = (anm )N n,m=1 (”Steifigkeitsmatrix“) und M = (mnm )n,m=1 (”MassenN matrix“) sowie der Lastvektor“ b = (bn )n=1 gebildet gemäß ” (m) (n) anm = a(ϕh , ϕh ), (m) (n) mnm = (ϕh , ϕh ), (n) bn = l(ϕh ). Beide Matrizen sind konstruktionsgemäß symmetrisch und positiv-definit. Ihre größten und kleinsten Eigenwerte seien λmax (A) , λmin (A) bzw. λmax (M ) , λmin (M ) , und die zugehörigen Spektralkonditionen: λmax (M ) λmax (A) , κ2 (M ) = . κ2 (A) = λmin (A) λmin (M ) Wir rekapitulieren die folgenden Beziehungen zwischen einer Finite-Elemente-Funktion vh ∈ Vh N und ihrem zugehörigen Knotenvektor ξ = (ξn )N n=1 ∈ R : vh = N X n=1 (n) ξn ϕh , kvh k2 = hM ξ, ξi, a(vh , vh ) = hAξ, ξi, wobei h·, ·i das euklidische Skalarprodukt bezeichnet; die euklidische Vektornorm ist | · | . Der Knotenvektor ξ ist bestimmt durch das lineare Gleichungssystem Aξ = b (3.5.117) 3.5 Implementierungsaspekte 119 Zur Aufstellung des Systems (3.5.117) bedient man sich in der Praxis eines zell-orientierten Prozesses, des sog. Assemblierens“ (englischen assembling“). Dabei wird das Konzept der ” ” Element-(Last)-Vektoren“ und Element-(Steifigkeits)-Matrizen” verwendet. Für einen Kno” ” T )T mit tenvektor ξ ∈ RN und eine Zelle T ∈ Th ist dabei ξT = (ξ1T , ..., ξnT , ..., ξN ξnT := ξn (n) falls ϕh 6≡ 0 auf T, ξnT := 0 (n) falls ϕh ≡ 0 auf T. Die zugehörigen Element-Matrizen und -Vektoren haben die Form (m) (n) N AT = (aTnm )N n,m=1 := (a∇ϕh , ∇ϕh )T n,m=1 , (m) (n) N MT = (mTnm )N n,m=1 := (ϕh , ϕh )T n,m=1 , (n) N bT = (bTn )N n=1 := (f, ϕh )T n=1 . Dabei werden natürlich nur die wesentlichen, von Null verschiedenen Elemente von AT , MT und bT gespeichert. Die einzelnen Gesamtmatrizen und Vektoren werden dann gebildet durch Assemblierung der entsprechenden Element-Matrizen und -Vektoren gemäß : X X X A= AT , M = MT , b = bT . T ∈Th T ∈Th T ∈Th Entsprechend gilt hAξ, ξi = X T ∈Th hAT ξT , ξT i, hM ξ, ξi = X T ∈Th hMT ξT , ξT i. Die Element-Beiträge werden in der Regel durch Transformation auf ein Referenzelement berechnet. Wir diskutieren hier nur den Fall von Dreieckszerlegungen. Sei also wieder σT : T̂ → T die affin-lineare Abbildung des Einheitsdreiecks T̂ auf das Dreieck T : x = σT (x̂) = BT x̂ + bT , x̂ = σT−1 (x) = BT−1 x − BT−1 bT . Die charakteristischen Parameter von T sowie T̂ sind mit hT , ρT bzw. ĥ, ρ̂ bezeichnet. Für transformierte Funktionen v̂(x̂) = v(x) gilt dann Z Z v(x) dx = | det BT | v̂(x̂) dx̂, T T̂ woraus insbesondere | det BT | = |T ||T̂ |−1 ≈ hdT folgt. Ferner ist mit der Inversen BT−1 = (−1) (bij )dij=1 : d d X X (−1) ˆ ∂ˆj v̂(x̂)b . ∂ v̂(x̂)∂ x̂ = ∂c v(x̂) = ∂ v(x) = ∂ v̂(x̂) = j i j i i i ji j=1 j=1 c ˆ bzw. ∇v(x̂) = BT−T ∇v̂(x̂) . Die Elemente der Element-Matrizen AT und MT sowie des Element- 120 Finite-Elemente-Verfahren für elliptische Probleme Vektors bT transformieren sich wie folgt: Z Z (m) (n) T d(n) dx̂ d(m) ∇ϕ a∇ϕh ∇ϕh dx = | det BT | â∇ϕ anm = h h T̂ T Z ˆ ϕ̂(n) dx̂ =: | det BT | âTnm , ˆ ϕ̂(m) B −T ∇ = | det BT | âBT−T ∇ T h T̂ Z Z (m) (n) (m) (n) T ϕh ϕh dx = | det BT | ϕ̂h ϕ̂h dx̂ =: | det BT | m̂nm . mnm = Z T̂ ZT (n) (n) T f ϕh dx = | det BT | fˆϕ̂h dx̂ =: | det BT | b̂n . bn = T̂ T Die Werte âTnm , m̂Tnm und b̂Tn auf der Referenzzelle werden nun mit Hilfe von Quadraturformeln auf T̂ berechnet. Dazu werden wir weiter unten noch mehr Details angeben. Wichtig ist, daß diese Quadratur nur auf der Referenzzelle stattfindet und die tatsächlich verwendeten Größen anm , mnm und bn im wesentlichen durch Skalierung mit | det BT | gewonnen werden. 3.5.2 Konditionierung der Systemmatrix Wir wollen zunächst die Stabilität (für h → 0 ) der diskreten Finite-Elemente-Gleichung (3.5.117) gegenüber Störungen der Daten untersuchen. Diese treten z.B. auf durch die Fehler bei der Berechnung der Elemente anm und mnm bei Verwendung von numerischer Quadratur. Durch rein algebraische Argumente erhalten wir zunächst eine Stabilitätsabschätzung für allgemeine lineare Gleichungssysteme (siehe Skriptum Einführung in die Numerik“). ” Satz 3.12 (Allgemeiner Störungssatz): Seien Störungen δA der Matrix A und δb der rechten Seite b gegeben, so daß µ := κ2 (A)kδAk/kAk < 1 . Dann gilt die Fehlerabschätzung |δξ| κ2 (A) n kδAk |δb| o . ≤ + |ξ| 1 − µ kAk |b| (3.5.118) Zur quantitativen Auswertung dieser Abschätzung müssen wir die Spektralkondition der Steifigkeitsmatrix A in Abhängigkeit von der Gitterweite h abschätzen. Dazu nehmen wir an, daß die betrachtete Familie von Zerlegungen (Th )h>0 gleichmäßig form- und größen-regulär“ ist, ” d.h.: maxT ∈Th hT hT ≤ c, sup ≤ c. sup max h>0 minT ∈Th hT h>0 T ∈Th ρT Dann ergibt sich analog zum Differenzenverfahren das folgende allgemeine Resultat. Satz 3.13 (Konditionierung): Auf einer Folge von (gleichmäßig) regulären Zerlegungen Th gilt für die Spektralkonditionen der (symmetrischen und positiv definiten) Steifigkeitsmatrizen A und der Massenmatrizen M : κ2 (A) = O(h−2 ), κ2 (M ) = O(1) (h → 0). Beweis: (i) Für die größten und kleinsten Eigenwerte von M gilt λmin (M ) = min ξ∈RN hM ξ, ξi hM ξ, ξi ≤ max = λmax (M ) . 2 N |ξ| |ξ|2 ξ∈R (3.5.119) 3.5 Implementierungsaspekte 121 In der folgenden Argumentation werden wieder die Element-Matrizen MT . Ferner bezeichne dmin und dmax die kleinste bzw. die größte Anzahl von Zellen, die in einem Knoten der Zerlegung Th zusammentreffen. Mit dieser Notation ergibt sich: hM ξ, ξi = hM ξ, ξi = X T ∈Th X T ∈Th hMT ξT , ξT i ≥ hMT ξT , ξT i ≤ min ξ∈RN , T ∈Th max ξ∈RN , T ∈Th hMT ξT , ξT i X |ξT |2 ≥ min {λmin (MT )} dmin |ξ|2 , T ∈Th |ξT |2 T ∈Th hMT ξT , ξT i X |ξT |2 ≤ max {λmax (MT )} dmax |ξ|2 . T ∈Th |ξT |2 T ∈Th Mit Hilfe der Beziehung | det BT | ≈ hdT ergibt sich mit der (festen) Matrix M̂ := (m̂nm )N n,m=1 : λmax (MT ) = | det BT | λmax (M̂ ) ≤ chdT , λmin (MT ) = | det BT | λmin (M̂ ) ≥ chdT , und folglich κ2 (M ) = O(1) . (ii) Für die kleinsten und größten Eigenwerte von A gilt: hAξ, ξi hM ξ, ξi min = min vh ∈Vh hM ξ, ξi ξ∈RN |ξ|2 hM ξ, ξi hAξ, ξi max = max λmax (A) ≤ max vh ∈Vh |ξ|2 ξ∈RN hM ξ, ξi ξ∈RN λmin (A) ≥ min ξ∈RN a(vh , vh ) λmin (M ), kvh k2 a(vh , vh ) λmax (M ). kvh k2 Wir schätzen weiter ab durch min vh ∈Vh a(vh , vh ) a(v, v) ≥ min =: λmin (L) 2 2 1 kvh k v∈H0 (Ω) kvk mit dem kleinste Eigenwert des Differentialoperators L auf dem Gebiet Ω . Ferner ergibt sich mit Hilfe der inversen Beziehung“ für Finite-Elemente-Funktionen: ” X X −2 2 2 a(vh , vh ) ≤ kak∞ k∇vh k2T ≤ ckak∞ ρ−2 T kvh kT ≤ ckak∞ max ρT kvh k , T ∈Th T ∈Th T ∈Th bzw. λmax (A) ≤ c maxT ∈Th ρ2T λmax (M ) . Wir gewinnen so die Abschätzung λmin (L)λmin (M ) ≤ λmin (A) ≤ λmax (A) ≤ c max ρ−2 T λmax (M ). T ∈Th Also ist κ2 (A) ≤ c maxT ∈Th ρ−2 T , was im Hinblick auf die Gleichförmigkeitsannahmen an die Zerlegungsfolge den Beweis vervollständigt. Q.E.D. Bemerkung 3.10: Wir betonen, daß die Asymptotik O(h−2 ) der Kondition der Steifigkeitsmatrix durch die Ordnung des zugrunde liegenden Differentialoperators L bestimmt ist; sie hat nichts mit dem Polynomgrad m − 1 des Finite-Elemente-Ansatzes oder der Raumdimension d zu tun. In der Tat wurde der Beweis von Satz 3.13 allgemein für d ≥ 1 und für beliebigen Polynomgrad m − 1 ≥ 1 geführt. Die Abhängigkeit von ρ := minT ∈Th ρT kommt über die Verwendung der inversen Beziehung zur Abschätzung von λmax (A) ins Spiel. Dabei ergibt offenbar jede Ableitungsstufe in der Energieform a(·, ·) genau eine negative ρ-Potenz. Der Exponent −2 ist also gerade durch die Ordnung des betrachteten Differentialoperators bestimmt. Bei der Finite-Elemente-Diskretisierung von Differentialoperatoren höherer Ordnung 2r ≥ 2 verhält 122 Finite-Elemente-Verfahren für elliptische Probleme sich die Kondition der Steifigkeitsmatrix dementsprechend wie κ2 (A) = O(h−2r ) . Zum Beispiel treten in der Plattenstatik Randwertaufgaben vierter Ordnung (r = 2) mit dem biharmonischen Operator ∆2 auf. In diesem Fall verhält sich die Kondition der zugehörigen Steifigkeitsmatrix wie O(h−4 ) . Für eine Gitterweite der Größenordnung h ∼ 10−2 in zwei Dimensionen ergibt sich damit κ2 (A) ∼ 108 , was Rechnung in mindestens doppelt-genauer Arithmetik nahe legt. Die Fehlerabschätzung (3.5.118) ist am Extremfall einer Störung des Eigenvektors wmax in Richtung des Eigenvektors wmin orientiert. Sie erfassen also den ungünstigsten Fehlereinfluß, wie er in der Praxis kaum auftreten wird. Tatsächlich erweist sich (3.5.118) als viel zu pessimistisch zur realistischen Erfassung des Einflusses von Datenfehlern bei der Lösung der Finite-ElementeGleichungen Ax = b . Zur Verdeutlichung betrachten wir im folgenden ausschließlich den Fall von Störungen in der rechten Seite b , welche durch fehlerhafte Auswertung (z.B. durch numerische Quadratur) der gegebenen rechten Seite f der Differentialgleichung entstehen. Satz 3.14 (Spezieller Störungssatz): Auf einer Folge von (gleichmäßig) regulären Zerlegungen Th gilt die Fehlerabschätzung κ2 (M ) kf k |δb| |δξ| ≤ , |ξ| λ kuh k |b| (3.5.120) mit dem kleinsten Eigenwert λ der 1. RWA des Differentialoperators L auf Ω . Beweis: Aus der Identität A δξ = δb folgt |δξ| ≤ kA−1 k |δb| = λmin (A)−1 |δb| . Weiter ist hAz, zi hM z, zi hAz, zi ≥ min min 2 |z| |z|2 z∈RN hM z, zi z∈RN z∈RN a(vh , vh ) λmin (M ) ≥ λ λmin (M ) , = min vh ∈Vh kvh k2 λmin (A) = min und somit |δξ| ≤ λ−1 λmin (M )−1 |δb| . Mit Hilfe der Schwarzschen Ungleichung ergibt sich |b|2 = N X (n) (f, ϕh )2 = f, N X n=1 n=1 (n) (n) (f, ϕh )ϕh Wegen N X (n) (n) (f, ϕh )ϕh . ≤ kf k n=1 N N X X (n) (m) (n) (m) (n) (n) 2 (f, ϕh )(f, ϕh )(ϕh , ϕh ) = hM b, bi ≤ λmax (M ) |b|2 (f, ϕh )ϕh = n=1 n,m=1 folgt dann |b| ≤ λmax (M )1/2 kf k . Ferner gilt wegen hM ξ, ξi ≤ λmax (M )kξk2 : |ξ| ≥ λmax (M )−1/2 hM ξ, ξi1/2 = λmax (M )−1/2 kuh k . Wir kombinieren die obigen Beziehungen und erhalten |δξ| λmax (M ) |δb| kf k ≤ λ−1 , |ξ| λmin (M ) |b| kuh k was zu beweisen war. Q.E.D. 3.5 Implementierungsaspekte 123 Wir haben in Satz 3.13 gesehen, daß die Massenmatrix M eine gleichmäßig bzgl. h beschränkte Spektralkondition hat κ2 (M ) = O(1) (h → 0) . Ferner folgt aus der Konvergenz des Verfahrens die Beziehung kuh k = kuk + O(h) (h → 0). Damit erhalten wir aus Satz 3.14 die folgende asymptotische Abschätzung für die Fehlerfortpflanzung im Finite-Elemente-Galerkin-Verfahren |δξ| |δb| ≤ c(f, u, Ω) , |ξ| |b| (3.5.121) mit einer nur von f, u und Ω abhängigen Konstante c(f, u, Ω). Dies besagt, daß die FiniteElemente-Methode stabil ist (für h → 0 ) bzgl. Störungen der rechten Seite f . 3.5.3 Aufstellung der Systemmatrizen mit numerischer Integration Im folgenden analysieren wir den zusätzlichen Fehler, welcher bei näherungsweiser Berechnung der Matrix- und Vektorelemente anm und bn mittels numerischer Quadratur entsteht. Im Zuge der Matrix-Assemblierung müssen Integrale über Gitterzellen T ∈ Th , Z Z (j) (j) (i) (3.5.122) f (x)ϕh (x) dx, a(x)∇ϕh (x)∇ϕh (x) dx, T T (i) berechnet werden, wobei ϕh (x) die Knotenbasisfunktionen sind. Wenn die Datenfunktionen a(x), f (x) konstant oder auf der Zelle durch Polynome approximiert sind, so sind Integrale der Form Z xp1 xq2 dx, p, q ∈ N0 , T zu berechnen. Hierfür gibt es z.B. auf Dreiecken explizite Formeln. Sei T ein Dreieck in der (x, y)-Ebene mit den Eckpunkten (xi , yi ), i = 1, 2, 3 . Ist der Ursprung des Koordinatensystems im Schwerpunkt von T , d.h. x1 + x2 + x3 = y1 + y2 + y3 = 0 , so gilt z.B.: Z 1 d(x, y) = |T |, Z ZT y d(x, y) = 0, x d(x, y) = T T Z |T | 2 (x1 + x22 + x23 ), x2 d(x, y) = 12 ZT |T | xy d(x, y) = (x1 y1 + x2 y2 + x3 y3 ), 12 T Z |T | 2 y 2 d(x, y) = (y1 + y22 + y32 ). 12 T Nicht exakt berechenbare Integrale werden durch numerische Quadratur angenähert. Dazu dienen sog. Quadraturformeln“, welche analog wie auf 1-dimensionalen Intervallen auch auf ” 2- oder 3-dimensionalen Zellen über einen Interpolationsansatz erzeugt werden. Dies geschieht zunächst auf der Referenzzelle T̂ und ergibt dann durch Transformation T̂ → T = σT (T̂ ) = BT x̂ + bT auch Quadraturformeln auf den einzelnen Zellen T ∈ Th . Wir beschreiben diesen 124 Finite-Elemente-Verfahren für elliptische Probleme Prozess im folgenden nur für Quadratur basierend auf Lagrange-Interpolation. Auf der Referenzzelle T̂ seien ein Polynomraum P (T̂ ) mit S := dim P (T̂ ) sowie ein Satz von Stützpunkten {x̂s ∈ T̂ , s = 1, ..., S} gewählt, welche unisolvent sind. Die Stützpunkte x̂s brauchen nicht mit den Knotenpunkten des Finite-Elemente-Ansatzes übereinzustimmen. Seien weiter L̂s ∈ P (T̂ ) die zugehörigen Lagrangeschen Basispolynome, welche durch die Eigenschaft L̂s (x̂r ) = δsr charakterisiert sind. Dies erlaubt wieder die explizite Darstellung des zu einer stetigen Funktion v̂(x̂) gehörenden Interpolationspolynoms durch p(x̂) = S X v̂(x̂s )L̂s (x̂). s=1 Dies führt zu folgendem Ansatz für eine Quadraturformel auf T̂ : QT̂ (v̂) := S X ω̂s v̂(x̂s ), ω̂s := Z L̂s (x̂) dx̂. (3.5.123) T̂ s=1 Die Stützpunkte x̂s werden so gewählt, daß Polynome von möglichst hohem Grad durch die Formel exakt integriert werden. Dabei ist aus Stabilitätsgründen wieder darauf zu achten, daß die Gewichte ω̂s positiv sind. Definition 3.6 (Quadraturformel): Eine interpolatorische Quadraturformel der Art (3.5.123) auf einer Referenzzelle T heißt von der Ordnung r “, wenn durch sie Polynome bis zum Grad ” r − 1 (und nicht höher) exakt integriert werden. Sie wird zulässig“ für den Polynomansatz ” P (T ) genannt, wenn ihre Stützstellenmenge reichhaltig genug ist, so daß q ∈ P (T ) : ∇q(xs ) = 0 (s = 1, ..., S) ⇒ q ≡ konst. (3.5.124) Mit den Bezeichnungen xs := σT (x̂s ), ωs := | det BT | ω̂s (s = 1, ..., S), erhalten wir durch QT (v) := S X ωs v(xs ) := S X s=1 s=1 | det BT |ω̂s v̂(x̂s ) = | det BT | QT̂ (v̂) (3.5.125) Quadraturformeln QT (·) auf den einzelnen Zellen T ∈ Th . Die gebräuchlichsten solcher Formeln für Dreiecke sind in Abbildung 3.10 zusammengestellt. Dabei bedienen wir uns der gebräuchlichen Schreibweise mit sog. baryzentrischen Koordinaten“. Für ein d-Simplex T mit ” Eckpunkten {a0 , ..., ad } besitzt jeder Punkt x ∈ T eine eindeutige Darstellung als konvexe Linearkombination der Eckpunkte: x= d X i=0 λi ai , 0 ≤ λ ≤ 1, d X λi = 1. i=0 Die Koeffizienten {λ0 , ..., λd } sind dann die baryzentrischen Koordinaten von x im Simplex T . Zum Beispiel sind {1, 0, ..., 0} die baryzentrischen Koordinaten des Eckpunkts a0 und { 12 , ..., 21 } 3.5 Implementierungsaspekte 125 die des Mittelpunktes zT . Die einfachsten Quadraturformeln auf Dreiecken/Simplizes sind die Mittelpunktregel“ und die Trapezregel“ (siehe auch Abb. 3.10): ” ” d QT (v) := |T |v(zT ), X 1 QT (v) := v(ai ). |T | d+1 i=0 Abbildung 3.10: Beispiele von Quadraturformeln auf Dreiecken. Auf Vierecken bzw. Hexaedern werden sog. Tensorproduktformeln“ verwendet. Diese erhält ” man ebenfalls über Transformation von der Referenzzelle. Demgemäß lauten auf dem Quadrat/Quader mit Mittelpunkt zT und Eckpunkten {a1 , ..., a2d } die Mittelpunktregel sowie die 126 Finite-Elemente-Verfahren für elliptische Probleme (Tensorprodukt)-Trapezregel: 2d X 1 QT (v) := d |T | v(ai ). 2 QT (v) := |T |v(zT ), i=0 Zur Erzielung höherer Genauigkeit werden extrapolierte Trapez-Formeln (z.B. TensorproduktSimpson-Regel) oder Tensorprodukt-Gauß-Formeln verwendet, welche ähnlich wie im eindimensionalen Fall konstruiert sind. Ein der gebräuchlichsten Formeln für Quadrate ist die 4-PunktGauß-Formel 4 1X v(ξi ), QT (v) := 4 i=1 mit den Gauß-Punkten ξ1 = (η− , η− ), ξ2 = (η− , η+ ), ξ3 = (η+ , η− ) und ξ4 (η+ , η+ ), wobei p 1 η± := 2 (1 ± 1/3) . Satz 3.15 (Quadraturfehler): Für eine interpolatorische Quadraturformel QT (·) der Ordnung r ≥ d auf einer Zelle T ∈ Th angewendet auf eine Funktion v ∈ W r,1 (T ) gilt Z Z v dx − QT (v) ≤ cq hrT |∇r v| dx, (3.5.126) T T mit einer von T und v ∈ H r (T ) unbhängigen Quadraturkonstanten cq > 0 . Bemerkung 3.11: Die Vorausssetzung r ≥ d in Satz 3.15 dient zur Vereinfachung der Formulierung des Resultats. Wegen der Einbettung W d,1 (T ) ⊂ C(T̄ ) sind für Funktionen v ∈ W r,1 (T ) die für die Anwendung der Quadraturformel erforderlichen Punktwerte wohl definiert. Dies ist aber auch gerade die richtige“ Regularitätsstufe für die maximale Ausnutzung der Approxima” tionsgüte der Quadraturformel. Dies ist wichtig für die folgende Untersuchung des Einflusses des Quadraturfehlers auf den Gesamtfehler. Im Übrigen ist jede der gebräuchlichen Quadraturformeln (z.B. Mittelpunkts- oder Trapezregel) mindestens von der Ordnung r = 2 , so daß in zwei Dimensionen gar keine Einschränkung besteht. In drei Dimensionanen bedarf der Fall r = 2 eine gesonderte Betrachtung, die obwohl nicht schwer, hier nicht durchgeführt wird. Beweis: Der Beweis verwendet das Bramble-Hilbert-Lemma 3.5 in Verbindung mit dem Transformationsargument von Satz 3.6. Auf der Referenzzelle T̂ definieren wir das Fehlerfunktional Z F (v̂) := v̂(x̂) dx̂ − QT̂ (v̂). T̂ Zur Definition von F (·) benötigen wir Punktwerte von v̂ . Diese sind aufgrund des Sobolewschen Einbettungssatzes in zwei Dimensionen für v ∈ H 2,1 (Ω) und in drei Dimensionen für v ∈ H 3,1 (Ω) wohl definiert. Es gilt dann |F (v̂)| ≤ ckv̂kH r,1 . Ferner ist F (·) offensichtlich sublinear und verschwindet nach Voraussetzung auf Pr−1 . Nach der L1 -Variante des Bramble-Hilbert-Lemmas gilt dann ˆ r v̂k 1 . |F (v̂)| ≤ ck∇ L (T̂ ) 3.5 Implementierungsaspekte 127 Sei nun σT wieder die affin-lineare Transformation von T̂ auf die Zelle T . Dann gilt für eine Funktion v ∈ H r,1 (Ω) und ihre Transformierte v̂(x̂) := v(x), x = σT (x̂) : Z v(x) dx − QT (v) = | det BT | |F (v̂)|, T sowie −1 r r ˆ r v̂k 1 k∇ L (T̂ ) ≤ c| det BT | hT k∇ vkL1 (T ) . Kombination der letzten beiden Beziehungen ergibt die Behauptung. Q.E.D. Im folgenden werden wir uns auf die Quadratur auf Dreiecken bzw. Simplizes beschränken und nehmen außerdem an, daß der Polynomansatz ein voller Polynomraum ist: P (T̂ ) = Pm−1 (T̂ ) . Analoge Resultate gelten auch für die Quadratur auf Vierecken bzw. Hexaedern, doch erfordern deren Formulierung und Beweis eine aufwendigere Notation. Die Anwendung von Quadraturformeln zur Berechnung der Zellintegrale (3.5.122) ergibt eine gestörte Bilinearform und rechte Seite X X ah (u, ϕ) := QT (a∇u∇ϕ), lh (ϕ) := QT (f ϕ) T ∈Th T ∈Th sowie zugehörige gestörte Steifigkeitsmatrix- und Lastvektorelemente X X (i) (j) (i) QT (f ϕh ). QT (a∇ϕh ∇ϕh ), b̃j := ãij := T ∈Th T ∈Th Statt der exakten Finite-Elemente-Lösung uh ∈ Vh ist dann eine gestörte Approximation ũh ∈ Vh zu bestimmen durch ah (ũh , ϕh ) = lh (ϕh ) ∀ϕh ∈ Vh . (3.5.127) Satz 3.16 (Numerische Integration): Die Quadraturformel auf der Referenzzelle QT̂ (·) sei zulässig“ für den Finite-Elemente-Ansatz P (T̂ ) und von der Ordnung r ≥ d . Dann besitzen die ” gestörten Finite-Elemente-Gleichungen (3.5.127) eindeutige Lösungen ũh ∈ Vh . Ist a ∈ C r (Ω) , so gilt für das gestörte Finite-Elemente-Verfahren der Ordnung m ≥ 2 die Fehlerabschätzung ku − ũh k + hk∇(u − ũh )k ≤ c hmin{m,r+3−m} kukH m . (3.5.128) Zur Erzielung einer maximalen Konvergenzordnung ist also r ≥ 2m − 3 zu wählen. Beweis: (i) Koerzitivität: Auf einer Zelle T ∈ Th gilt unter Verwendung der Transformation T = σT (T̂ ) wegen a ≥ α > 0 : QT (a|∇vh |2 ) = S X ωs a(xs )|∇vh (xs )|2 ≥ α s=1 S X ≥α s=1 S X s=1 ωs |∇vh (xs )|2 = α S X s=1 ˆ h (x̂s )|2 | det BT | ω̂s |BT−1 ∇v̂ ˆ h (x̂s )|2 ≥ αc | det BT |h−2 | det BT | ω̂s kBT k−2 |∇v̂ T S X s=1 ˆ h (x̂s )|2 , ω̂s |∇v̂ 128 Finite-Elemente-Verfahren für elliptische Probleme wobei v̂h (x̂) = vh (x), x̂ = σT−1 (x) . Analog gilt ˆ h k2 ≥ c| det BT |−1 h2T k∇vh k2T . k∇v̂ T̂ Durch |||v̂h |||T̂ := S X s=1 ˆ h (x̂s )|2 ω̂s |∇v̂ 1/2 ist auf dem Quotientenraum P (T̂ )/P0 eine Norm definiert. Dazu muß nur noch die Definitheit ˆ h (x̂s ) = 0 (s = 1, ..., S) , so daß wegen gezeigt werden. Aus |||v̂h |||T̂ = 0 folgt offenbar ∇v̂ der vorausgesetzten Zulässigkeit“ der Quadraturformel notwendig v̂h ≡ konst. ist. Da auch ˆ h k auf P (T̂ )/P”0 eine Norm ist, gilt wegen der Äquivalenz aller Normen auf einem endlich k∇v̂ T̂ dimensionalen Vektorraum mit einer Konstante ĉ > 0 : ˆ hk . |||v̂h |||T̂ ≥ ĉ k∇v̂ T̂ Dies impliziert dann −2 ˆ 2 2 2 QT (a|∇vh |2 ) ≥ c| det BT |h−2 T |||v̂h |||T̂ ≥ c| det BT |hT k∇v̂h kT̂ ≥ c k∇vh kT , bzw. die gleichmäßige Koerzitivität der Bilinearformen ah (·, ·) : ah (vh , vh ) ≥ ck∇vh k2 , vh ∈ Vh . (3.5.129) (ii) Fehlerabschätzung: Mit Hilfe der Koerzitivitätsabschätzung (3.5.129) folgt für den Fehler ηh := uh − ũh ∈ Vh : c k∇ηh k2 ≤ ah (uh − ũh , ηh ) = ah (uh , ηh ) − ah (ũh , ηh ) ≤ (ah − a)(uh , ηh ) + (l − lh )(ηh ). Dies impliziert n |(a − a)(u , v )| |(l − l )(v )| o h h h h h . + vh ∈Vh k∇vh k k∇vh k k∇ηh k ≤ c max Zusammen mit der bekannten H 1 -Fehlerabschätzung k∇(u − uh )k ≤ chm kukH m folgt n |(a − a)(u , v )| |(l − l )(v )| o h h h h h . + vh ∈Vh k∇vh k k∇vh k k∇(u − ũh )k ≤ chm kukH m + c max Im nächsten Schritt werden wir zeigen, daß n |(a − a)(u , v )| |(l − l )(v )| o h h h h h ≤ c hmin{m,r−m+2} kukH m . + vh ∈Vh k∇vh k k∇vh k max (3.5.130) Dies impliziert dann den ersten Teil der Behauptung k∇(u − ũh )k ≤ chmin{m,r−m+2} kukH m . (3.5.131) 3.5 Implementierungsaspekte 129 (iii) Konsistenz: Als nächstes schätzen wir den Abstand“ zwischen a(·, ·) und ah (·, ·) sowie ” l(·) und lh (·) ab. Für uh , vh ∈ Vh folgt mit Hilfe der Abschätzung des Integrationsfehlers in Satz 3.15: X Z a∇uh ∇vh dx − QT (a∇uh ∇vh ) |(a − ah )(uh , vh )| ≤ T T ∈Th ≤ cq X hrT T ∈Th Z T |∇r (a∇uh ∇vh )| dx. Durch Ausdifferenzieren erhalten wir |(a − ah )(uh , vh )| ≤ c X T ∈Th hrT k∇uh kH r (T ) k∇vh kH r (T ) , wobei die Konstante c wesentlich durch Schranken für die Ableitungen der Koeffizientenfunktion a(x) bestimmt ist. Bei Beachtung von vh|T ∈ Pm−1 ergibt sich |(a − ah )(uh , vh )| ≤ c X T ∈Th hrT k∇uh kH m−2 (T ) k∇vh kH m−2 (T ) . Mit Hilfe der inversen Beziehung“ für finite Elemente gilt ” k∇vh kT , k∇vh kH m−2 (T ) ≤ ch2−m T womit folgt: |(a − ah )(uh , vh )| ≤ chr−m+2 X T ∈Th k∇uh k2H m−2 (T ) 1/2 k∇vh k. Die Terme in uh werden unter Verwendung der Knoteninterpolierenden Ih u ∈ Vh und mit Hilfe der inversen Beziehung sowie der lokalen Interpolationsabschätzungen wie folgt abgeschätzt: k∇uh kH m−2 (T ) ≤ kuh − Ih ukH m−1 (T ) + kIh u − ukH m−1 (T ) + kukH m−1 (T ) ≤ chT2−m kuh − Ih ukH 1 (T ) + chT k∇m ukT + kukH m−1 (T ) ku − Ih ukH 1 (T ) + kukH m (T ) ≤ chT2−m kuh − ukH 1 (T ) + ch2−m T ≤ chT2−m kuh − ukH 1 (T ) + kukH m (T ) . Zusammenfassen der bisherigen Abschätzungen ergibt |(a − ah )(uh , vh )| ≤ chr+2−m h2−m kuh − ukH 1 + kukH m k∇vh k, und unter Verwendung der bekannten H 1 -Fehlerabschätzung kuh − ukH 1 ≤ chm−1 kukH m : |(a − ah )(uh , vh )| ≤ chr+2−m kukH m k∇vh k. (3.5.132) Auf analoge Weise erschließen wir |(l − lh )(vh )| ≤ chr−m+2 k∇vh k kukH m . (3.5.133) Die Abschätzungen (3.5.132) und (3.5.133) ergeben (3.5.130) und damit das Resultat (3.5.131). (iv) L2 -Fehlerabschätzung: Zur Abschätzung des Fehlers in der L2 -Norm bedienen wir uns wieder 130 Finite-Elemente-Verfahren für elliptische Probleme eines Dualitätsarguments. Sei z ∈ V die (eindeutige) Lösung des Hilfsproblems −∇ · {a∇z} = uh − ũh in Ω, z = 0 auf ∂Ω. Wegen der angenommenen Glattheit von a und der Konvexität von Ω ist z ∈ H 2 (Ω) und genügt der a-priori Abschätzung kzkH 2 ≤ ckuh − ũh k. Sei zh ∈ Vh die Ritz-Projektion von z . Mit dieser Konstruktion erhalten wir mit Hilfe der Galerkin-Orthogonalität: kuh − ũh k2 = a(uh − ũh , z) = a(uh − ũh , zh ) = a(uh , zh ) − (a − ah )(ũh , zh ) − ah (ũh , zh ) = (l − lh )(zh ) − (a − ah )(ũh , zh ). Die beiden Störungsterme werden nun analog wie unter (iii) abgeschätzt. Zunächst gilt wieder mit Hilfe der inversen Beziehung: X hrT k∇ũh kH m−2 (T ) k∇zh kH m−2 (T ) |(a − ah )(ũh , zh )| ≤ c T ∈Th ≤ chr+3−m X T ∈Th k∇ũh k2H m−2 (T ) 1/2 X T ∈Th k∇zh k2H 1 (T ) 1/2 . Für die beiden Summen erhalten wir analog wie oben unter (iii): X T ∈Th sowie k∇ũh k2H m−2 (T ) X T ∈Th 1/2 k∇zh k2H 1 (T ) kũh − ukH 1 + kukH m , ≤ ch2−m T 1/2 ≤ ckzkH 2 ≤ ckuh − ũh k. Kombination dieser Abschätzungen und Berücksichtigung der schon bewiesenen H 1 -Fehlerabschätzung ergibt dann: |(a − ah )(ũh , zh )| ≤ chr−m+3 kuh − ũh kkukH m . (3.5.134) |(l − lh )(zh )| ≤ chr−m+3 kuh − ũh k. (3.5.135) Analog erschließen wir Kombinieren aller vorausgehenden Beziehungen ergibt kuh − ũh k ≤ chr−m+3 kukH m . Zusammen mit der bekannten L2 -Fehlerabschätzung für eh = u − uh erhalten wir schließlich ku − ũh k ≤ chmin{m,r−m+3} kukH m , was den Beweis vervollständigt. Q.E.D. 3.5 Implementierungsaspekte 131 Bemerkung 3.12: Die Aussage von Satz 3.16 kann so interpretiert werden, daß zur Vermeidung einer Reduzierung der Konvergenzordnung O(hm−1 ) in der Energie-Norm eine Quadraturformel der Ordnung r ≥ 2m − 3 verwendet werden sollte. Damit würden dann im Falle eines konstanten Koeffizienten a die Matrixelemente anm exakt berechnet werden. Für bloße Konvergenz ũh → u (h → 0) wäre die Wahl r ≥ max{d, m − 2} ausreichend, vorausgesetzt die Zulässigkeitsbedingung ist erfüllt. 132 Finite-Elemente-Verfahren für elliptische Probleme 3.6 A posteriori Fehleranalyse und Gittersteuerung Eine wichtige Rolle bei der Lösung von partiellen Differentialgleichungen spielen die beiden Aspekte Fehlerkontrolle und Gittersteuerung. Hat man eine approximative Lösung uh berechnet, ist es von Interesse, den Fehler zwischen dieser Näherung und der exakten Lösung u bzgl. eines geeigneten Maßes abzuschätzen. Zu diesem Zweck dienen sog. a-posteriori Fehlerschätzer“, ” welche im besten Fall ausschließlich von berechneten Größen und den Daten f abhängen. In diesem Abschnitt wollen wir einfache residuen-basierte Fehlerschätzer für das Modellproblem der 1. RWA des Laplace-Operators herleiten. Eine globale Verfeinerung des ganzen Rechengebietes ist in drei Dimensionen in der Regel nicht realisierbar, da der Speicherplatz auf den verfügbaren Rechnern dazu nicht ausreicht. Deshalb versucht man, nur dort lokal zu verfeinern, wo es die Lösungsstruktur bzw. die Genauigkeitsanforderungen verlangen. Unter optimaler Gittersteuerung wird dabei verstanden, möglichst wenige markierte Elemente des Gitters zu verfeinern, so daß der Fehler in möglichst wenigen Schritten unter eine vorgegebene Toleranz gedrückt wird. Die Wahl der zu verfeinernden Elemente trifft man aufgrund sog. lokaler Fehlerindikatoren“, aus denen sich der globale Fehlerschätzer ” zusammensetzt. Solche Gittersteuerungsmethoden werden wir im zweiten Teil dieses Abschnitts diskutieren. 3.6.1 Allgemeine a posteriori Fehlerabschätzung Aus der a priori Fehlerschätzung aus Abschnitt 3.4 konnten wir die Konvergenzordnung des Diskretisierungsfehlers eh = u − uh schon für verschiedene Normen herleiten: – Energienorm-Fehlerabschätzung: – L2 -Norm-Fehlerabschätzung: – L∞ -Abschätzung: k∇eh k ≤ ci cs h kukH 2 , keh k ≤ ci cs h2 kukH 2 , maxΩ |eh | ≤ ci cs h2 | ln(h)| M2 (u), mit lokalen Interpolationskonstanten ci und globalen Stabilitätskonstanten cs . Leider sind diese Abschätzungen für eine quantitative Fehlerkontrolle nicht zu gebrauchen, da die nötigen Informationen über die höheren Ableitungen der exakten Lösung u fehlen und insbesondere präzise Abschätzungen für die Stabilitätskonstanten cs i.a. nicht zur Verfügung stehen. Ist aber der Charakter einer lokalen Singularität der Lösung bekannt, wie z.B. im Fall von Ecken- oder ” Kantensingulariutäten“, so kann diese Information zur vorab Anpassung des Gitters verwendet werden. Dabei wird die Gitterweite h in Richtung auf die singuiläre Stelle hin systematisch verkleinert, etwa gemäß h(r) ≈ h0 r α wobei der Exponent α > 1 aus dem bekannten singulären Verhalten der Ableitungen der Lösung abgeleitet wird. In allgemeinen Situationen muß man sich aber heuristischer Methoden zur Bestimmung der Regularität der Lösung bedienen. Dies läuft (in Anlehnung an die traditionelle, abschneidefehlerbasierte Vorgehensweise bei Differenzenverfahren) auf die Schätzung der lokalen Glattheit der unbekannten Lösung aus der berechneten numerischen Approximation hinaus. Zum Beispiel kann man versuchen, auf einem Zellblock (etwa aus 2d Zellen) aus einer linearen Näherungslösung uh durch Anwendung eines Differenzenquotienten ∇2h zweiter Ordnung im Schwerpunkt zT einer 3.6 A posteriori Fehleranalyse und Gittersteuerung 133 Zelle T ∈ Th eine Schätzung der zweiten Ableitungen von u auf T zu gewinnen: max |∇2 u||T ≈ ηT := |∇2h uh (zT )||T . T (3.6.136) Auf der Basis dieses Indikators ließen sich dann Strategien zu lokaler Gitterverfeinerung oder -vergröberung aufstellen: Ist zum Beispiel ηT auf einer Zelle T ∈ Th überdurchschnittlich groß, so wird diese in Teilzellen zerlegt. Diese Strategie der ad hoc Gitteranpassung erfordert keinen großen Aufwand und funktioniert in der Praxis in vielen Fällen erstaunlich gut. Daher sind Varianten dieser Strategie derzeit auch in vielen kommerziellen Programmen realisiert, wenn diese überhaupt Gitteradaption beinhalten. Dabei gibt es aber die folgenden grundsätzlichen Schwächen: – Die Auswertung von (3.6.136) liefert keine Aussage über die tatsächliche Größe des Fehlers eh = u − uh . – Die auf den lokalen Indikatoren ηT basierende Gitterverfeinerungsstrategie geht davon aus, daß der gemessene“ Fehler in T auch dort entstanden ist und durch lokale Verfeinerung ” von T reduziert werden kann. Dies ist aber i.a. nicht richtig, da dabei das Phänomen der globalen Fehlerakkumulation“ (auch pollution effect“ genannt) vernachlässigt wird. ” ” Ziel der folgenden Diskussion ist es, über eine a posteriori Fehleranalyse via Dualitätsargumente systematisch auswertbare und zuverlässige Fehlerschätzer zu entwickeln, aus denen auch effiziente Kriterien zur lokalen Gitteranpassung abgeleitet werden können. Wir betrachten dazu wieder das Modellproblem −∆u = f in Ω, u = 0 auf ∂Ω, (3.6.137) auf einem (nicht notwendig konvexen) Polygon- oder Polyedergebiet Ω ⊂ Rd . Die durch die Variationsgleichung (∇u, ∇ϕ) = (f, ϕ) ∀ϕ ∈ V = H01 (Ω), (3.6.138) definierte schwache Lösung u ∈ H01 (Ω) wird durch ein Galerkin-Finite-Elemente-Verfahren approximiert. Wir konzentrieren uns im folgenden auf die Approximation mit linearen“ finiten ” (1) Elementen. Die Näherungslösung uh = Rh u ∈ Vh ⊂ V ist bestimmt durch die Gleichung (∇uh , ∇ϕh ) = (f, ϕh ) ∀ϕh ∈ Vh . (3.6.139) Bei der Schätzung des Fehlers eh muß man sich für ein geeignetes Fehlermaß“ entscheiden, ” welches sich am Bedarf der betrachteten Anwendung orientieren sollte. Beispiele sind etwa wie schon oben erwähnt die traditionellen Maße Energienorm“, L2 -Norm sowie L∞ -Norm. Weitere ” Beispiele sind: – Mittelwerte: – Linienintegrale: – Ableitungswerte: |(eh , ψ)Ω |, ψ ∈ C(Ω), |(eh , ψ)Γ |, |∂i eh (a)|, ψ ∈ C(∂Ω), a ∈ Ω. Um alle diese Sonderfälle im Rahmen einer einheitlichen Theorie behandeln zu können, führen wir zunächst den Begriff des Fehlerfunktionals“ ein. Dies ist ein (der Einfachheit halber als ” 134 Finite-Elemente-Verfahren für elliptische Probleme linear angenommenes) Funktional J(·) : V → R, bzgl. dem der Fehler eh geschätzt werden soll; d.h. gesucht ist eine berechenbare Schranke für J(eh ) = J(u) − J(uh ) . Zu einem solchen Fehlerfunktional gehört eine (eindeutige) duale ” Lösung“ z ∈ V , welche als Lösung des zugehörigen dualen Problems“ bestimmt ist: ” (∇ϕ, ∇z) = J(ϕ) ∀ϕ ∈ V. (3.6.140) Testen wir in (3.6.140) mit ϕ = eh ∈ V , so ergibt sich unter Berücksichtigung der GalerkinOrthogonalität die Fehleridentität J(eh ) = (∇eh , ∇z) = (∇eh , ∇(z − ψh )), ψh ∈ Vh . (3.6.141) Dies wird nun weiter mit Hilfe von elementweise partieller Integration umgeformt zu X J(eh ) = − (∆eh , z − ψh )T + (∂n eh , z − ψh )∂T T ∈Th = X (f + ∆uh , z − ψh )T − (∂n uh , z − ψh )∂T . T ∈Th Da z − ψh stetige Spuren entlang ∂T hat und in der obigen Summe jede Kante zweimal auftritt mit wechselnder Richtung der Normalableitung ∂n uh , erhalten wir X (3.6.142) J(eh ) = (f + ∆uh , z − ψh )T − 12 ([∂n uh ], z − ψh )∂T , T ∈Th wobei auf inneren“ Kanten [∂n uh ]|Γ := ∂n uh|T + ∂n′ uh|T ′ jeweils den Sprung der Normalablei” tung über Γ ⊂ ∂T zur Nachbarzelle bedeutet. Entlang von Kanten am Rand, Γ ⊂ ∂Ω , setzen wir [∂n uh ]|Γ := 2∂n uh . Diese Fehleridentität beinhaltet Information über die Abhängigkeit des Fehlerterms J(eh ) von den lokalen Residuen“ RT := (f + ∆uh )|T und r∂T := − 12 [∂n uh ]|∂T : ” ∂J(eh ) ≈ (z − ψh )|T , ∂RT ∂J(eh ) ≈ (z − ψh )|∂T . ∂r∂T (3.6.143) Damit können wir hoffen, auf das spezielle Zielfunktional J(eh ) bezogene Kriterien für lokale Gitterverfeinerung und damit Reduzierung dieser Residuen zu gewinnnen. Dabei mißt“ das ” Zellresiduum“ R(uh ) das Erfülltsein der Differentialgleichung durch die Näherungslösung uh ” und das Kantenresiduum“ r(uh ) deren Glattheit“. ” ” Von der exakten Fehlerdarstellung (3.6.142) können wir nun in mehreren Schritten weitere, gegebenenfalls leichter auswertbare Fehlerabschätzungen ableiten. Zunächst ist X (3.6.144) |J(eh )| ≤ (f + ∆uh , z − ψh )T − 21 ([∂n uh ], z − ψh )∂T , T ∈Th und weiter |J(eh )| ≤ X (f + ∆uh , z − ψh )T − 1 ([∂n uh ], z − ψh )∂T . 2 T ∈Th (3.6.145) 3.6 A posteriori Fehleranalyse und Gittersteuerung 135 Bei Beachtung von z−ψh|∂Ω = 0 folgt dann mit Hilfe der Hölderschen Ungleichung: |J(eh )| ≤ o X n kf + ∆uh kT kz − ψh kT + 21 k[∂n uh ]k∂T \∂Ω kz − ψh k∂T . (3.6.146) T ∈Th Die letzte Abschätzung schreiben wir in der kompakten Form X |J(eh )| ≤ η(uh ) := ρT (uh ) ωT (z) + ρ∂T (uh ) ω∂T (z) (3.6.147) T ∈Th mit den Zellresiduentermen“ ” ρT (uh ) := kf + ∆uh kT , −1/2 ρ∂T (uh ) := 12 hT k[∂n uh ]k∂T \∂Ω , und den Zellgewichten“ ” ωT (z) := kz − Ih zkT , 1/2 ω∂T (z) := hT kz − Ih zk∂T . Die Fehlerdarstellung (3.6.142) bzw. die Fehlerabschätzung (3.6.147) sind nicht unmittelbar auswertbar. Zwar sind die Residuenterme“ R(uh ) = f + ∆uh und r(uh ) = − 12 [∂n uh ] aus der ” Näherung uh berechenbar, doch die Wichtungsfaktoren z − ψh sind nur implizit über das duale Problem (3.6.140) gegeben und müssen gesondert bestimmt werden. Mit dieser kritischen Frage werden wir uns im Folgenden noch eingehender beschäftigen. Die Zellgewichte lassen sich bei Wahl ψh := Ih z mit Hilfe der lokalen Interpolationsfehlerabschätzungen aus Abschnitt 3.3 weiter abschätzen durch ωT (z) ≤ ci h3T max{|∇2 z|}. T (3.6.148) Hierbei muß natürlich vorausgesetzt werden, daß die duale Lösung z ∈ H 2,∞ (Ω) ist. Wir werden später sehen, wie man sich von dieser sehr einschränkenden Annahme in gewisser Weise befreien kann. Die Interpolationskonstante ci ist von verschiedenen Faktoren abhängig: Von dem Polynomgrad der verwendeten Interpolierenden, vom Referenzelement T̂ sowie von den Transformationen σT : T̂ → T . Sie stellt einen Unsicherheitsfaktor dar. Genaueres Nachrechnen ergibt eine Größenordnung von ci ≈ 0, 1 − 10 . Die a posteriori Fehlerabschätzung (3.6.147) ist zuverlässig“ im Sinne, daß sie eine siche” re obere Schranke für den Fehler |J(eh )| liefert, vorausgesetzt, es liegen zuverlässige Werte für die Gewichte ωT (z) und ω∂T (z) vor. Sie wäre auch effizient“, wenn für den zugehörigen ” Effektivitätsindex“ ( Überschätzungsfaktor“) gilt: ” ” Ieff := η(uh ) ≤ c0 |J(eh )| (h → 0). (3.6.149) Bemerkung 3.13: Es ist zu bemerken, daß bereits der Übergang von der Fehleridentität“ ” (3.6.142) zur Fehlerabschätzung“ (3.6.144) in gewissen Fällen zu einer groben Überschätzung ” des tatsächlichen Fehlers führen kann. Betrachten wir hierzu folgendes Beispiel: Auf dem Quadrat Ω = (−1, 1) × (−1, 1) gilt es, für die Poisson-Gleichung den Punktfehler im Ursprung zu finden: J(eh ) = eh (0) . Es ist möglich, die rechte Seite f und das Gitter Th so anti-symmetrisch bzgl. x = 0 zu konstruieren, daß u(0) = 0 = uh (0) . In diesem Fall wird aber in der Regel η(uh ) ≈ h2 > 0 sein, d.h.: Ieff = ∞ . 136 Finite-Elemente-Verfahren für elliptische Probleme 3.6.2 Spezielle a posteriori Fehlerschätzer Der oben abgeleitete allgemeine Fehlerschätzer wird nun für verschiedene spezielle Fehlerfunktionale ausgewertet. In den betrachteten Fällen lassen sich die Gewichte ωT (z), ω∂T (z) analytisch abschätzen. Wir beschränken uns hier auf die Betrachtung von P1 -Elementen. a) Energienorm-Fehlerschätzer: Zur Abschätzung des Energienormfehlers“ k∇eh k wählen wir das Fehlerfunktional ” J(ϕ) := k∇eh k−1 (∇ϕ, ∇eh ), so daß wir für ϕ = eh automatisch J(eh ) = k∇eh k haben. Für die zugehörige Lösung z ∈ V des dualen Problems (∇ϕ, ∇z) = J(ϕ) ∀ϕ ∈ V (3.6.150) gilt dann k∇zk2 = k∇eh k−1 (∇z, ∇eh ) ≤ k∇zk, woraus sich die folgende einfache a priori Abschätzung k∇zk ≤ 1 ergibt. Ausgehend von der allgemeinen Fehlerabschätzung (3.6.146) erhalten wir X k∇eh k ≤ kf + ∆uh kT kz − ψh kT + 12 k[∂n uh ]k∂T \∂Ω kz − ψh k∂T . T ∈Th Wir wählen nun ψh := Ih z als eine verallgemeinerte“ Knoteninterpolierende von z , für welche ” die folgende lokale Fehlerabschätzung gilt: 1/2 kz − Ih zkT + hT kz − Ih zk∂T ≤ c̃i hT k∇zkT̃ , (3.6.151) wobei T̃ := ∪{T ′ ∈ Th : T ′ ∩ T 6= ∅} . Damit folgt dann mit den Residuen ρT (uh ) und ρ∂T (uh ) : X −1/2 k∇eh k ≤ c̃i hT kf + ∆uh kT + 12 hT k[∂n uh ]k∂T \∂Ω k∇zkT̃ T ∈Th ≤ c Wegen X T ∈Th 1/2 1/2 X k∇zk2T̃ . h2T ρT (uh )2 + ρ∂T (uh )2 T ∈Th X T ∈Th k∇zk2T̃ ergibt sich schließlich das folgende Resultat: 1/2 ≤ ck∇zk ≤ c, Satz 3.17 (a posteriori Energienormfehler): Für den Fehler eh := u − uh gilt die a posteriori Abschätzung bzgl. der Energienorm: X 1/2 h2T ρT (uh )2 + ρ∂T (uh )2 . (3.6.152) k∇eh k ≤ ηE (uh ) := c T ∈Th 3.6 A posteriori Fehleranalyse und Gittersteuerung 137 Diese Abschätzung ist in folgendem Sinne “scharf“: X 1/2 h2T kf k2T . ηE (uh ) ≤ ck∇eh k + c (3.6.153) T ∈Th Beweis: Es bleibt, die Abschätzung (3.6.153) zu beweisen. Dazu verwenden wir folgende Regularitätsaussage: Für eine Funktion v ∈ H 1 (Ω) mit der Eigenschaft ∆v ∈ L2 (Ω) existiert ∂n v ∈ L2 (∂Ω) und genügt der Abschätzung k∂n vk∂Ω ≤ cΩ k∆vkΩ + k∇vkΩ . Wir wenden dies auf der Referenzzelle T̂ an und erhalten mit Hilfe des üblichen Transformationsarguments auf jeder einzelnen Zelle T ∈ Th für entsprechende Funktionen v ∈ H 1 (T ) die Abschätzung 2 (3.6.154) k∂n vk2∂T ≤ c∗ hT k∆vk2T + h−1 T k∇vkT , mit einer von h unabhängigen Konstanten c∗ . Auf jeder Zelle T ∈ Th ist uh|T ∈ P1 (T ) und folglich ρT (uh )2 = kf + ∆uh k2T = kf k2T . Für ein T ∈ Th sei T̃ := ∪{T ′ ∈ Th | T ′ und T haben gemeinsame Kante.} . Wegen der Stetigkeit von ∂h u über Zellkanten hinweg, ist [∂n uh ] = −[∂n eh ] . Mit Hilfe der Abschätzung (3.6.154) folgt damit wegen hT ≈ hT ′ für T ′ ∈ T̃ : X k∂n eh k2∂T ′ \∂Ω h2T ρ∂T (uh )2 = 14 hT k[∂n eh ]k2∂T \∂Ω ≤ chT ≤ c∗ hT X T ′ ∈T̃ T ′ ∈T̃ 2 hT ′ k∆eh k2T ′ + h−1 T ′ k∇eh kT ′ X = c∗ h2T kf k2T ′ + k∇eh k2T ′ . T ′ ∈T̃ Dies impliziert nach Summation über T ∈ Th die behauptete Abschätzung (3.6.153). Q.E.D. Bemerkung 3.14: Mit einer etwas aufwendigeren Argumentation kann man die folgende verschärfte a posteriori Abschätzung herleiten: X 1/2 h2T h2T k∇f k2T + ρ∂T (uh )2 . ηE (uh ) ≤ c T ∈Th Diese besagt, daß im Fehlerschätzer ηE (uh ) in der Regel der Einfluß der Gleichungsresiduen kf + ∆uh kT gegenüber den Regularitätsresiduen k[∂n uh ]k∂T \∂Ω vernachlässigt werden können. Dies ist in dieser Form allerdings nur richtig für lineare bzw. bilineare finite Elemente. b) L2 -Norm-Fehlerschätzer: Zur Abschätzung des L2 -Fehlers keh k wählen wir das Fehlerfunktional 138 Finite-Elemente-Verfahren für elliptische Probleme J(ϕ) := keh k−1 (ϕ, eh ), womit automatisch J(e) = keh k gilt. Die zugehörige Lösung z ∈ V des dualen Problems (∇ϕ, ∇z) = J(ϕ) ∀ϕ ∈ V (3.6.155) ist dann auf dem konvexen Gebiet Ω auch in H 2 (Ω), und es gilt die a priori Abschätzung k∇2 zk ≤ k∆zk = 1 . Ausgehend von der Fehlerabschätzung (3.6.146) erhalten wir wieder X keh k ≤ kf + ∆uh kT kz − ψh kT + 21 k[∂n uh ]k∂T \∂Ω kz − ψh k∂T . T ∈Th Wir können nun ψh := Ih z als die normale Knoteninterpolierende von z wählen: 1/2 kz − Ih zkT + hT kz − Ih zk∂T ≤ ci h2T k∇2 zkT . (3.6.156) Damit folgt dann wieder mit den oben definierten Residuen ρT (uh ) und ρ∂T (uh ) : X −1/2 h2T kf + ∆uh kT + 21 hT k[∂n uh ]k∂T \∂Ω k∇2 zkT keh k ≤ ci T ∈Th ≤ c Wegen X T ∈Th 1/2 X 1/2 h4T ρT (uh )2 + ρ∂T (uh )2 k∇2 zk2T . T ∈Th X T ∈Th k∇2 zk2T ergibt sich schließlich das folgende Resultat: 1/2 = k∇2 zk ≤ 1, Satz 3.18 (a posteriori L2 -Normfehler): Für den Fehler eh := u − uh gilt die a posteriori Abschätzung bzgl. der L2 -Norm: X 1/2 h4T ρT (uh )2 + ρ∂T (uh )2 . (3.6.157) keh k ≤ ηL2 (uh ) := c T ∈Th Diese Abschätzung ist ebenfalls scharf“ in folgendem Sinne: ” X 1/2 h4T kf k2T . ηL2 (uh ) ≤ ckeh k + c (3.6.158) T ∈Th Beweis: Der Beweis verläuft analog wie bei der Energienorm-Fehlerabschätzung. Diesmal basiert die Herleitung der Umkehrabschätzung (3.6.158) auf der zellweisen Beziehung 2 k∂n vk2∂T ≤ c∗ {hT k∆vk2T + h−3 T kvkT }, (3.6.159) welche ebenfalls durch Transformation von der Einheitszelle abgeleitet wird. Der Rest des Beweises sei als Übungsaufgabe gestellt. Q.E.D. 3.6 A posteriori Fehleranalyse und Gittersteuerung 139 c) Punktfehler-Schätzer: Zur Abschätzung des Fehlers eh (a) in einem festen Punkt P ∈ Ω würden wir gern das Fehlerfunktional J(ϕ) := ϕ(P ) wählen. Dieses ist auf stetigen Funktionen, aber nicht auf dem ganzen Lösungsraum V = H01 (Ω) definiert, so daß die oben entwickelte allgemeine Theorie nicht unmittelbar anwendbar wäre. Deshalb wählen wir eine Kugelumgebung Bε := {x ∈ Rd : |x − P | < ε} des Punktes P und arbeiten statt dessen mit dem regularisierten Funktional Z −1 ϕ dx, Jε (ϕ) := |Bε | Bε welches sicher auf ganz V definiert und beschränkt ist. Der Regularisierungsparameter ε wird üblicherweise gleich einer vorgegebenen Fehlertoleranz T OL gesetzt. Für hinreichend glatte Funktionen ϕ ist dabei (Fehler der Mittelpunktregel) |ϕ(P ) − Jε (ϕ)| ≤ c ε2 . (3.6.160) Wir betrachten den Fall d = 2 . Die Lösung zε ∈ V des zugehörigen dualen Problems (∇ϕ, ∇zε ) = Jε (ϕ) ∀ϕ ∈ V, (3.6.161) ist dann eine regularisierte“ Greensche Funktion und verhält sich wie ” −2 zε (x) ≈ log(|x−P | + ε), |∇2 zε | ≈ |x−P | + ε . Die Gewichte in der a posteriori Fehlerabschätzung (3.6.147) gestatten daher die Abschätzung ωT (zε ) + ω∂T (zε ) ≤ ch2T k∇2 zε kT ≤ c h3T d−2 T , mit dT := maxx∈T {|x−a| + ε} . Wir finden also als obere Schranke für den Punktfehler: |eh (P )| ≤ c X T ∈Th ρT (uh )h2T k∇2 zε kT + cε2 ≤ c X ρT (uh ) T ∈Th h3T + cε2 . d2T In diesem Fall ist aber die a-priori Bestimmung der Konstante c praktisch unmöglich. d) Ein hyper-singulärer Fall Einen kuriosen Sonderfall stellt die folgende Auswertungsgröße dar: Z Z Z ∆u dx = − f dx . ∂n u ds = J(u) := ∂Ω Ω Ω Dieser mittlere Normalfluß“ ließe sich offenbar auch direkt aus den Daten f berechnen. Zur ” Illustration wollen wir aber annehmen, daß diese Information nicht ausgenutzt wird, sondern statt dessen J(u) durch J(uh ) approximiert wird. Das Funktional J(·) ist wieder nicht auf dem ganzen Lösungsraum V definiert (wohl aber auf der reguläreren Lösung u ∈ V ∩ H 2 (Ω) ). Zur Anwendung unserer allgemeinen Theorie muß das Funktional daher zunächst regularisiert werden. Für das Folgende nehmen wir der Einfachheit halber an, daß Ω der Einheitskreis im R2 ist. Für ε = T OL setzen wir Sε := {x ∈ Ω, dist{x, ∂Ω} < ε} und erhalten für glattes ϕ : 140 Finite-Elemente-Verfahren für elliptische Probleme −1 Jε (ϕ) := ε Z ∂r ϕ dx = Z ∂Ω Sε ∂r ϕ ds + O(ε). Dabei ist ∂n auf Sε auf natürliche Weise durch Fortsetzung von ∂Ω definiert. Die Lösung zε ∈ V des zugehörigen dualen Problems (∇ϕ, ∇zε ) = Jε (ϕ) ∀ϕ ∈ V, ist dann gegeben durch zε = −1 in Ω\Sε , zε (x) = −ε−1 (1−|x|) Hieraus ergibt sich die Fehlerabschätzung X h2T ρT (uh )k∇2 zε kT ≈ |Jε (eh )| ≤ ci T ∈Th auf Sε . X ... , T ∩Sε 6=∅ d.h.: Die Zellen im Innern von Ω tragen nicht zum Gesamtfehler bei. Daher wäre die beste Strategie zur Gitterverfeinerung, in jedem Verfeinerungszyklus jeweils nur die Zellen entlang des Randes ∂Ω zu verfeinern. Dies setzt aber voraus, daß die Elemente des Lastvektors, bn = (n) (f, ϕh )Ω , exakt berechnet werden. Abbildung 3.11 zeigt ein automatisch verfeinertes Gitter nach 7 Verfeinerungszyklen sowie die numerisch bestimmte duale Lösung auf diesem Gitter. Die zugehörigen Ergebnisse sind in Tabelle 3.1 gelistet. Abbildung 3.11: Verfeinertes Gitter nach 7 Verfeinerungszyklen (links) und die auf diesem Gitter numerisch bestimmte Lösung (rechts). ηE optimale“ Strategie ” L N J(eh ) L N J(eh ) 1 1024 2.91 + 0 1 559 2.90 + 0 2 4096 1.50 + 0 2 1294 1.50 + 0 3 16384 3 3079 4 64768 7.49 − 1 4 7174 5 253858 3.77 − 1 7.48 − 1 5 16738 6 memory 1.73 − 1 exhausted 6 38146 3.62 − 1 1.67 − 1 6.93 − 2 Tabelle 3.1: Resultate mit dem Energienorm-Fehlerschätzer ηE (uh ) und der optimalen“ Strategie. ” 3.6 A posteriori Fehleranalyse und Gittersteuerung 141 Numerische Auswertung des a-posteriori Fehlerschätzers Wir wollen nun kurz die numerische Auswertung der Fehleridentität (3.6.142) diskutieren: X J(eh ) = η(uh ) := (3.6.162) (f + ∆uh , z − ψh )T − 12 ([∂n uh ], z − ψh )∂T . T ∈Th Wir wählen dazu ψh := Ih z , die Knoteninterpolierende von z . Die Qualität der Auswertung wird durch den sog. Effektivitätsindex“ gemessen: ” η(u ) h Ieff := . J(eh ) Alle Methoden der Auswertung von (3.6.162) bedienen sich einer numerischen Lösung zh ∈ Vh des dualen Problems, welche im einfachsten Fall durch direkte Diskretisierung von (3.6.162) mit Hilfe des vorliegenden Verfahrens gewonnen wird: (∇ϕh , ∇zh ) = J(ϕh ) ∀ϕh ∈ Vh . (3.6.163) Wir unterscheiden zwei Anwendungen der Fehleridentität (3.6.162): – Überprüfung der Genauigkeit einer auf dem Gitter Th berechneten Näherungslösung uh und Abbruchkriterium für einen Gitterverfeinerungsprozess: η(uh ) ≤ T OL ? – Grundlage zur Gewinnung von Kriterien ( Verfeinerungsindikatoren“ ηT ) zur lokalen Git” teranpassung. Die folgenden Strategien zur Auswertung von η(uh ) kommen in Betracht (hier beschrieben für den Fall d-linearer Ansätze auf Rechteckgittern im Rd ): 1. Die duale Lösung z wird durch eine Näherung höherer Ordnung approximiert. Zum Bei(2) spiel liefert die Approximation z ≈ zh mit der d-quadratischen Ritz-Projektion das gewünschte asymptotische Verhalten limT OL→0 Ieff = 1 . 2. Die duale Lösung z wird durch eine zellblockweise (je 2d Zellen) d-quadratische Inter(2) polierende der d-linearen Ritzapproximation approximiert: z ≈ Ih zh . In diesem Fall beobachtet man limT OL→0 Ieff < 1 (≈ 0.5 − 0.9). 3. Die Differenz z−Ih z wird in Anlehnung an die oben zitierte Interpolationsfehlerabschätzung mit Hilfe eines skalierten Differenzenquotienten der d-linearen Ritz-Proktion approximiert: |z −Ih z| ≈ ci,T h2T |∇2h zh | . Dies führt in der Regel auf eine grobe Überschätzung des Fehlers. In der Praxis wird meist die billige“ und ausreichend genaue Prozedur (2) verwendet. Dabei ” brauchen insbesondere keine Interpolationskonstanten ci spezifiziert zu werden. 3.6.3 Strategien zur Gittersteuerung Ziel ist es, den Fehler in dem durch das Fehlerfunktional J(·) beschriebenen Maß unter eine gewisse vorgegebene Toleranz |J(eh )| ≤ T OL zu bringen und dabei mit dem vorhandenen Speicher auszukommen. Es können also nur eine bestimmte Anzahl von Zellen N ≤ Nmax verwaltet 142 Finite-Elemente-Verfahren für elliptische Probleme werden. Die Gitterverfeinerung erfolgt dabei standardmäßig durch Kantenbisektion“, d.h. durch ” Unterteilung einer Zelle T in 2d Teilzellen. Bei Gittervergröberung werden mehrere Zellen zu einer Makrozelle zusammengefaßt. Wir werden im folgenden hauptsächlich Vierecks- oder Hexaedergitter betrachten. Bei Unterteilung einer Zelle entstehen sog. hängende“ Knoten auf den ” Zellrändern, so daß das neue Gitter zunächst nicht zulässig wäre. Diese Unzulässigkeit kann durch verschiedenen Methoden aufgehoben werden. Die meist gebräuchliche ist die Elimination der zu den hängenden Knoten gehörenden Freiheitsgraden durch lineare Interpolation, wodurch der entstehende diskrete Ansatzraum wieder konform wird: Vh ⊂ V (s. Abb. 3.12). Dabei wird der fiktive Knotenwert vh (P ) in einem hängenden Knoten P auf einer Kante Γ ⊂ ∂T mit Endpunkten P ′ , P ′′ durch die Interpolationsvorschrift vh (P ) := 21 {vh (P ′ )+vh (P ′′ )} festgelegt. Alle im folgenden gezeigten Beispielrechnungen bedienen sich dieser Technik. 4 x Abbildung 3.12: Verfeinertes Rechteckitter mit hängendem“ Knoten sowie die Basisfunktion ” zum Mittelknoten. Ausgangspunkt zur Gewinnung von Kriterien für die lokale Gitteranpassung ist eine aposteriori Fehlerschätzung der Form X |J(eh )| ≈ ηT , (3.6.164) T ∈Th mit lokalen Fehlerindikatoren“ ηT , welche durch Auswertung der Fehleridentität (3.6.142) mit ” Hilfe einer der oben beschriebenen Methoden gewonnen werden. Wir erhalten bei Verwendung von Methode (2): (2) (2) ηT := (f + ∆uh , Ih zh − zh )T − 12 ([∂n uh ], Ih zh − zh )∂T \∂Ω (3.6.165) und mit Methode (3): ηT := ci h2T {ρT (uh ) + ρ∂T (uh )} k∇2h zh kT . (3.6.166) Wir beschreiben im folgenden das allgemeine Schema eines auf lokalen Fehlerindikatoren ηT basierenden Gitteranpassungsprozesses: Nachdem über das Gebiet Ω ein Grobgitter T0 := Th0 mit einer Gitterweitenverteilung h0 gelegt worden ist, sei der Prozeß der adaptiven Gittersteuerung schon L-mal durchlaufen worden. Wir bestimmen nun auf dem Gitter TL := ThL die approximative Lösung uL ∈ VL := VhL . Ebenso wird die diskrete duale Lösung zL ∈ VL auf TL berechnet. Nun können die lokalen Fehlerindikatoren ηT gemäß (3.6.165) oder (3.6.166) für jede Zelle T ∈ TL ausgewertet werden. 3.6 A posteriori Fehleranalyse und Gittersteuerung 143 Wir bezeichnen mit NL ≈ dim(VL ) die Anzahl der Zellen des Gitters TL . Abbruchabfrage: Ist das Abbruchkriterium η(uh ) ≤ 21 T OL auf dem Gitter TL erfüllt, wird der Adaptionsprozess abgebrochen und zL als Näherung zu u akzeptiert, welche die Zielgröße J(u) durch J(uh ) mit der gewünschten Genauigkeit T OL approximiert. Andernfalls wird ein neuer Adaptionszyklus begonnen. Adaptionszyklus: Der Übergang vom Gitter TL zum nächsten Gitter TL+1 erfolgt nach einer der im folgenden beschriebenen Adaptionsstrategien“. Zunächst werden die Zellen T ∈ TL nach ” der Größe ihrer Indikatorwerte ηT angeordnet, {Ti , i = 1, ..., NL } : ηT,1 ≥ ... ≥ ηT,i ≥ ηT,i+1 ≥ ... ≥ ηT,NL . I) Fehlerbalancierungs-Strategie: Das Ziel ist, die Indikatorwerte so zu balancieren, daß ηT ≈ T OL , NL T ∈ TL . (3.6.167) Dann würde wie gewünscht gelten: |J(eL )| ≈ η(uL ) ≈ X T OL = T OL. NL T ∈TL Das Problem bei dieser Strategie ist zum einen, daß die Zahl NL sich während des Verfeinerungsprozesses ständig ändert, und zum anderen, daß die Balancierungsvorschrift (3.6.167) die delikate Wahl von Parametern 0 < α < β < 1 erfordert: α T OL T OL ≤ ηT ≤ β . NL NL Für die folgende Diskussion setzen wir der Einfachheit halber α = 1/2, β = 1 . Im ersten Schritt testet man, ob ηT,1 ≤ T OL/NL ist. Wenn ja“, ist das Abbruchkriterium erfüllt, wenn nein“, ” ” wird die Zelle T1 verfeinert. Dies führt zu einer Erhöhung von NL auf NL + 3 . Danach wäre es möglich, daß für alle übrigen Zellen TL,i gilt: T OL T OL ≤ ηT,i ≤ . NL + 3 NL Der Verfeinerungszyklus wäre also bereits nach dem ersten Schritt zu beenden und auf dem erhaltenen Gitter TL+1 eine neue Näherungslösung uL+1 zu berechnen. Dies wäre aber sehr ineffizient. Der Verfeinerungsprozeß sollte daher beschleunigt werden. Dazu überprüft man von dem Indikator ηT,1 ausgehend und beginnend mit j = 0 , ob ηT,i ≤ T OL . NL + 3j Ist dies nicht erfüllt, wird das Element Ti geteilt, die Zähler j und i um Eins erhöht, und man geht zum nächstkleineren ηT,i über. Ist die Bedingung allerdings erfüllt, hat man das neue Gitter TL+1 gefunden. Diese Balancierungsstrategie ist zwar potentiell optimal, jedoch mit aufwendigen Abfragen verbunden. Mögliche alternative Strategien, die einfacher sind, aber weniger gute Ergebnisse liefern, sind die folgenden. 144 Finite-Elemente-Verfahren für elliptische Probleme II) Fest-Raten-Strategie“: Ziel ist es, in jedem Adaptionszyklus die Anzahl der Gitterzellen ” NL mit einer festen Rate zu erhöhen oder den Fehlerschätzwert η(uL ) mit einer festen Rate zu verkleinern. Ausgangspunkt ist wieder eine Anordnung der Zellen von TL nach der Größe der zugehörigen Indikatorwerte. Zu vorgewählten Prozentsätzen X% und Y % werden die Zellen so gruppiert, daß (and der Zellanzahl orientierte Strategie) #{Ti , . . . , TN∗ } ≈ X NL , 100 #{TNL −N ∗ +1 , . . . , TNL } ≈ Y NL , 100 oder alternativ (am Schätzwert orientierte Strategie) N∗ X i=1 ηT,i ≈ Y η(uL ), NL X i=NL −N ∗ +1 ηT,i ≈ X η(uL ). Dann werden die Zellen Ti , . . . , TN∗ verfeinert und die Zellen TNL −N ∗ +1 , . . . , NL vergröbert. Exakte“ Gitteroptimierung ” Zum Abschluß wollen wir noch diskutieren, daß die Fehlerschätzung (3.6.147) X ρT (uh ) ωT (zh ) |J(eh )| ≈ η := (3.6.168) T ∈Th im Prinzip auch zur direkten Bestimmung eines optimalen“ Gitters mit Gitterweitenfunktion ” h = h(x) verwendet werden könnte. Dies wird als Nebenprodukt auch eine Rechtfertigung für die Äquilibrierungsstrategie“ liefern. Zu lösen sind die folgenden Optimierungsaufgaben: ” (OP I) Bei vorgegebener Fehlertoleranz TOL soll die zu deren Erreichung benötigte Anzahl von Zellen N (d.h. der numerische Aufwand) minimiert werden: N → M IN, η ≤ T OL. (3.6.169) (OP II) Bei vorgegebener maximalen Zellzahl Nmax (d.h. begrenzter Speicherkapazität) soll der Fehler (genauer der Fehlerschätzer) minimiert werden: η → M IN, N ≤ Nmax . (3.6.170) Wir diskutieren im folgenden nur die für die Praxis relevantere Fragestellung (OP II). Das Optimierungsproblem (OP I) läßt sich mit analogen Argumenten behandeln (Übungsaufgabe). Die grundlegende Annahme ist, daß die Größen ρT (uh ) sowie ωT (zh ) (nach geeigneter Skalierung) für T OL → 0 zunehmend bessere, lokale Approximationen gewisser kontinuierlicher Funktionen Φ(x) bzw. Ψ(x) sind: −3/2 −1 1 kh−1 h−1 T [∂n uh ]k∂T \∂Ω → Φu (xT ), T ρT (uh ) = hT kf + ∆uh kT + 2 hT o n −5/2 kz − I zk , h kz − I zk → Ψz (zT ), h−3 ωT (zh ) = max h−3 T h h ∂T T T (3.6.171) (3.6.172) wobei xT ein gemeinsamer Punkt einer Folge von Zellen T ist. Diese Annahme ist natürlich im strengen Sinne nicht realistisch, da auf allgemeinen Gitterfolgen (Th )h→0 ein sehr unre- 3.6 A posteriori Fehleranalyse und Gittersteuerung 145 gelmäßiges Konvergenzverhalten auftreten kann. Unter der obigen Annahme gilt mit der Funktion A(x) := Φ(x)Ψ(x) : Z X X h(x)2 A(x) dx. (3.6.173) h4T h−4 ρ (u ) ω (z ) ≈ ρT (uh ) ωT (zh ) = T T h h T Ω T ∈Th T ∈Th Für die Zellzahl N haben wir die Darstellung N = X X 1 = h2T h−2 T T ∈Th T ∈Th Z ≈ h(x)−2 dx. (3.6.174) Ω Damit können wir die Optimierungsaufgabe (OP II) näherungsweiser in kontinuierlicher Form schreiben als: Z Z 2 h(x)−2 dx = Nmax . (3.6.175) h(x) A(x) dx → M IN, N (h) := F (h) := Ω Ω Hierbei haben wir o.B.d.A. die Ungleichungsbedingung N ≤ Nmax durch eine Gleichungsbedingung N = Nmax ersetzt, da sich ein minimaler Fehler sicherlich unter maximaler Ausnutzung der möglichen Zellzahl ergibt. Dieses restringierte Optimierungsproblem wird nun mit dem Lagrange-Formalismus der Variationsrechnung gelöst. Dazu definieren wir die Lagrange” Funktion“ L(h, λ) := F (h) + λ {N (h) − Nmax } mit einem skalaren Lagrange-Parameter λ ∈ R. Jede Lösung des Optimierungsproblems ist dann notwendig stationärer Punkt (Sattelpunkt) von L . Zur Bestimmung eines solchen Sattelpunkts machen wir den Ansatz d L(h + tϕ, λ + tµ)|t=0 = 0 dt ∀ϕ ∈ C(Ω), ∀µ ∈ R. Auswertung dieser Beziehung ergibt Z Z 2 h(x)A(x)ϕ(x) dx − 2λ h−3 (x)ϕ(x) dx = 0 Ω Ω sowie µ bzw. notwendig Z −2 h(x) Ω −3 h(x)A(x) − λh dx − Nmax = 0 ∀µ ∈ R, h(x)−2 dx = Nmax . Ω h(x) = W := Z (x) = 0, Hieraus ergibt sich, daß und weiter Z Ω A −1/4 λ ∀ϕ ∈ C(Ω) , A(x)1/2 dx = λ1/2 Nmax . 146 Finite-Elemente-Verfahren für elliptische Probleme Damit erhalten wir einerseits den Lagrange-Parameter, λ= W 2 , Nmax und andererseits eine Gleichung für die gesuchte optimale“ Gitterweitenverteilung ” W 1/2 hopt (x) = A(x)−1/4 . Nmax (3.6.176) (3.6.177) Als Nebenprodukt dieser Rechnung ergibt sich für die optimale Gitterweite die Beziehung ηT = h4T AT = λ ≡ konst., (3.6.178) d.h.: Die an der Äquilibrierung der lokalen Fehlerindikatoren ηT orientierten Gittersteuerungsstrategien führen tatsächlich auf optimale Gitterweitenverteilungen. Wir erwähnen noch, daß das zu (OP I) duale“ Optimierungsproblem (OP II) auf die folgende ” Lösung führt: hopt (x) = T OL 1/2 W A(x)−1/4 . (3.6.179) Die Größe W ist bei den üblichen Fehlerfunktionalen wohl definiert; dies beinhaltet sogar so singuläre Fälle wie die Punktauswertung von Ableitungen J(u) = ∂i u(a) , A(x) ∼ |x − a|−3 . Erst die Auswertung von zweiten Ableitungen J(u) = ∂i2 u(a) macht hier Probleme. 3.6.4 Ein Testbeispiel Wir wollen die bisher erzielten Ergebnisse anhand eines konkreten Beispiels illustrieren. Dazu wird wieder das übliche Modellproblem betrachtet: −∆u = f in Ω, u = 0 auf ∂Ω. (3.6.180) Wir wollen den Punktwert ∂1 u(P ) für ein P ∈ Ω berechnen. Das zugehörige Funktional ist wieder nicht auf dem ganzen Lösungsraum V = H01 (Ω) definiert und muß regularisiert werden. Wir setzen dazu mit ε := T OL : Z −1 Jε (ϕ) := |Bε | ∂1 u dx . (3.6.181) Bε Testfall 1: Sei Ω := (−1, 1)2 und P = 0 (siehe Abb. 3.13). Die zu dem Funktional Jε (·) gehörige duale Lösung zε verhält sich dann wie |∇2 zε (x)| ≈ (|x| + ε)−3 . Dies impliziert, daß |∂1 eh (0)| ≈ ci X h4 T ρT (uh ), d3T T ∈Th (3.6.182) 3.6 A posteriori Fehleranalyse und Gittersteuerung 147 mit dT := |xT | + ε und dem Mittelpunkt xT von T . Wir wollen hierfür eine optimale Gitterweitenverteilung bestimmen. Ausgangspunkt ist die Äquilibrierungsbedingung ηT ≈ h4T T OL ≈ 3 N dT ⇒ 3/2 h2T ≈ dT T OL 1/2 N . Hieraus ergibt sich N= X h2T h−2 T = N 1/2 N 1/2 X −3/2 ≈ h2T dT T OL T OL T ∈Th T ∈Th und folglich Nopt ≈ T OL−1 . Bei Verwendung des Energienorm-Fehlerschätzers (3.6.152) zur Gitterverfeinerung ergibt sich dagegen die Gitterkomplexität Nopt ≈ T OL−2 . Dieses vorhergesagte Verhalten der verschiedenen Gitterverfeinerungsprozesse wird durch die numerischen Ergebnisse in Tabelle 3.2 gut bestätigt. TOL N L ηweight(uh ) Ieff 4−2 |∂1 eh (0)| 148 6 7.51e-1 5.92e-2 0.08 4−3 940 9 4.10e-1 1.42e-2 0.03 4−4 4912 12 4.14e-3 3.50e-3 0.65 4−5 20980 15 2.27e-4 9.25e-4 4.16 4−6 86740 17 5.82e-5 2.38e-4 4.16 Tabelle 3.2: Resulte der Berechnung von ∂1 u(0) unter Verwendung des gewichteten a posteriori Fehlerschätzers ηweight (uh ) für verschiedenen Verfeinerungslevel L ; der Effektivitätsindex“ ist ” definert durch Ieff := |ηweight (uh )/∂1 eh (0)|. Wir betonen, daß die richtige Wahl des Regularisierungsparameters ε = T OL in (3.6.181) für den Lösungsprozess wichtig ist. Die triviale Alternative ε = hmin ist automatisch realisiert, wenn zur Berechnung der Gewichte ωT (z) die numerisch bestimmte, diskrete, duale Lösung zh ∈ Vh verwendet wird (siehe Abb. 3.13). Dies kann bei sehr singulären“ Funktionalen zu ” starker lokaler Überverfeinerung, d.h. zu unnötig vielen Verfeinerungsschritten, führen. Abbildung 3.13: Verfeinerte Gitter und numerisch bestimmte duale Lösung zur Berechnung von ∂1 u(0) auf dem Quadrat bei Verwendung des a posteriori Fehlerschätzers ηweight (uh ) mit TOL = 4−4 . 148 Finite-Elemente-Verfahren für elliptische Probleme Testfall 2: Sei nun Ω das Rechteckgebiet Ω = (−1, 1) × (−1, 3) mit Schlitz bei (0, 0) (siehe Abb. 3.15). Die Präsenz der (einspringenden) scharfen Ecke mit Innenwinkel ω = 2π bewirkt in der schwachen Lösung eine Eckensingularität“ der Form s = ψ(θ)r 1/2 , d.h. eine Singularität ” im Gradienten. Wir wollen illustrieren, wie diese Eckensingularität mit der durch die Gewichte ωT (z) im Fehlerschätzer induzierten zusammenspielt. Wir sehen in Abb. 3.15, daß der gewichtete Fehlerschätzer Zellen sowohl bei der Schlitzspitze (zur Unterdrückung des Pollutionseffekts“), aber auch beim Auswertungspunkt konzentriert, ” während der Energienorm-Fehlerschätzer wesentlich stärker an der Schlitzspitze und natürlich gar nicht im Auswertungspunkt verfeinert. "ETA_weight" "ETA_E" 0.1 "ERROR" "ETA_weight" 0.01 e_x(-2.,.5) e_x(-2.,.5) 0.01 0.001 0.001 0.0001 1e-05 0.0001 1000 10000 Number of elements N 100000 1000 10000 Number of elements N Abbildung 3.14: Vergleich der Effizienz von ηE (uh ) und ηweight (uh ) auf dem Schlitzgebiet. Abbildung 3.15: Verfeinerte Gitter mit ungefähr 5000 Zellen zur Berechnung von ∂1 u(P ) , erzeugt mit dem gewichteten Fehlerschätzer ηweight (uh ) (mittig) sowie dem Energienorm-Fehlerschätzer ηE (uh ) (rechts). 3.7 Übungen 149 3.7 Übungen Übung 3.1: Man formuliere das Ritzsche Verfahren mit endlich dimensionalen Teilräumen geeigneter Sobolew-Raume H m (Ω) für die folgenden Aufgabenstellungen: a) Neumannsche RWA des Laplace-Operators: −∆u = f in Ω, ∂n u = g auf ∂Ω. b) Eigenwertproblem des Laplace-Operators: −∆u = λu in Ω, u = 0 auf ∂Ω. c) Dirichletsche RWA des “biharmonischen” Operators: −∆2 u = f in Ω, u = ∂n u = 0 auf ∂Ω. Dabei seien jeweils das Gebiet Ω sowie die Daten f, g als genügend regulär und kompatibel angenommen. Man versuche, hierfür analog zur Vorlesung “Bestapproximations”-Aussagen herzuleiten. Übung 3.2: Seien V ein Hilbert-Raum mit Skalarprodukt (·, ·)V und zugehöriger Norm k·kV und a(·, ·) sowie l(·) bilineare bzw. lineare Formen auf V mit den Eigenschaften |a(v, w)| ≤ αkvkV kwkV , |a(v, v)| ≥ κkvk2V , |l(v)| ≤ βkvkV , v, w ∈ V v, w ∈ V v∈V (Beschränktheit), (“V-Elliptizität”), (Beschränktheit). Dann hat die Variationsgleichung a(u, ϕ) = l(ϕ) ∀ϕ ∈ V nach dem Satz von Lax-Milgram eine eindeutige Lösung u ∈ V . Für endlich dimensionale Teilräume Vh ⊂ V werden approximative Lösungen uh ∈ Vh bestimmt durch die “GalerkinGleichungen” a(uh , ϕh ) = l(ϕh ) ϕh ∈ Vh . a) Man zeige hierfür die (eindeutige) Existenz der “diskreten” Lösungen uh ∈ Vh und die Fehlerabschätzung α inf ku − ϕh kV . ku − uh kV ≤ κ ϕh ∈Vh b) Man wende das Resultat von (a) zum Nachweis der Konvergenz der Galerkin-Approximation des Diffusions-Konvektions-Problems −∆u + ∂1 u = f in Ω, u = 0 auf ∂Ω, auf einem regulären Gebiet Ω ⊂ R2 mit rechter Seite f ∈ L2 (Ω) an. c) Man versuche das Resultat von (a) für den Fall zu verallgemeinern, daß die Biliearform a(·, ·) 150 Finite-Elemente-Verfahren für elliptische Probleme nicht V -elliptisch sondern nur “koerzitiv” ist, d.h.: a(v, ϕ) ≥ γkvk, ϕ∈V \{0} kϕkV sup a(ϕ, v) ≥ γkvk, ϕ∈V \{0} kϕkV sup v ∈ V. Worin bestehen hierbei die Probleme? Übung 3.3: Das Modellproblem −∆u = f in Ω, u|∂Ω = 0, auf dem Einheitsquadrat Ω = (0, 1)2 werde auf einem äquidistanten, kartesischen Gitter mit der Gitterweite h mit Hilfe der Finite-Elemente-Methode mit stückweise bilinearen Ansatzfunktionen diskretisiert. Man stelle die zugehörigen Systemmatrizen auf: a) mit exakter Integration, b) unter Verwendung der 2-dimensionalen “Tensorprodukt-Trapezregel” 4 QT (f ) := |T | X f (ai ), 4 ai Eckpunkte der Zelle T. i=1 Welche Besonderheit ergibt sich? Übung 3.4: Man überlege (etwa durch Konstruktion von Beispielen), in wie weit die folgenden Bedingungen an eine Folge von (im Sinne der Vorlesung regulären) Zerlegungen {Th }h>0 eines Gebiets Ω ⊂ R2 (in Dreiecke oder Vierecke) äquivalent sind: a) Die inneren Winkel aller Zellen T ∈ Th sind gleichmäßig für T ∈ Th und h > 0 von Null wegbeschränkt (“minimum angle condition”). b) Für die Inkreisradien ρT und Umkreisradien hT der Zellen T ∈ Th gilt (“uniform shape condition”): nh o T < ∞. sup T ∈Th , h>0 ρT c) Für die Seiten Γ ⊂ ∂T jeder Zelle T ∈ Th gilt max |Γ| ≤ c min |Γ| Γ⊂∂T Γ⊂∂T mit einer von T unabhängigen Konstante c. (1) Übung 3.5: Sei Vh ⊂ H 1 (Ω) der Raum der stückweise linearen finiten Elemente bzgl. einer regulären Triangulierung von Ω ⊂ R2 . Mit Hilfe des L2 -Skalarprodukts (·, ·) ist die sog. “L2 (1) Projektion” Ph : L2 (Ω) → Vh definiert durch die Vorschrift (1) (Ph u, ϕh ) = (u, ϕh ) ∀ϕh ∈ Vh . a) Man leite eine Fehlerabschätzung für die L2 -Norm ku − Ph uk her, zunächst unter der Annahme v ∈ H 2 (Ω) . Was würde man unter den schwächeren Regularitätsannahmen v ∈ H 1 (Ω) 3.7 Übungen 151 oder v ∈ L2 (Ω) erhalten? b) Welche verbesserte Abschätzung erhält man bzgl. der “negativen” Sobolew-Norm ku − Ph uk−1 := (u − Ph u, ϕ) ≤ ch? kvkH 2 ? k∇ϕk 1 ϕ∈H (Ω) sup 0 Übung 3.6: Man begründe anhand der eindimensionalen Poisson-Gleichung −u′′ (x) = f (x) in Ω = (0, 1), u(0) = u(1) = 0, (1) daß für die Ritz-Projektion Rh : H01 (Ω) → Vh eine Abschätzung wie in Aufgabe 6.3b nicht gelten kann. (Hinweis: Man verifiziere, daß in diesem Fall die Ritz-Projektion Rh u identisch mit der Knoteninterpolierenden Ih u ist.) Übung 3.7: Die Dirichletsche Randwertaufgabe −∆u = f in Ω, u = 0 auf ∂Ω, auf einem konvexen Polygongebiet Ω ⊂ R2 werde mit einem Galerkin-Verfahren mit An(1) satzräumen Vh ⊂ V := H01 (Ω) von linearen” finiten Elementen approximiert. Mit welcher ” Ordnung konvergieren i) der gewichtete Mittelwert über Ω ( ω ∈ H 1 (Ω) eine glatte Gewichtsfunktion): Z Z uω dx (h → 0) ? uh ω dx → Ω Ω ii) der quadratischen Mittelwert über einen glatten geschlossenen Weg Γ ⊂ Ω : Z Z u2 ds (h → 0) ? u2h ds → Γ Γ (Hinweis: Zur Erzielung eines optimalen Resultats verwende man die Variante des Spurlemmas für Funktionen in H 1,1 (Ω) und die Fehlerabschätzungen aus der Vorlesung.) Übung 3.8: Man untersuche, ob die folgenden Sätze von Funktionalen für die angegebenen Polynomräume “unisolvent” sind. Dabei bezeichnen ai die Ecken, mi die Seitenmitten sowie bij (j = 1, 2) jeweils zwei Gauß-Punkte auf der Kante Γi , i = 1, . . . , d + 1 , und z den Schwerpunkt des Elements T . i) T (kartesisches) Einheitsdreieck: P (T ) = P3 (T ), p(ai ), ∇p(ai ), p(z); P (T ) = P3 (T ), p(ai ), p(bij ), p(z); P (T ) = P5 (T ), p(ai ), ∇p(ai ), ∇2 p(ai ), ∂n p(mi ). 152 Finite-Elemente-Verfahren für elliptische Probleme ii) T (kartesisches) Einheitsquadrat: P (T ) = Q̃1 (T ) := P1 (T ) ⊕ span{x2 − y 2 }, 3 3 P (T ) = Q̃3 (T ) := P3 (T ) ⊕ span{x y, xy }, p(mi ); p(ai ), ∇p(ai ). Übung 3.9: Sei Ω ⊂ R2 ein Polygongebiet und Th = {T } eine Triangulierung von Ω . Man betrachte die beiden mit den kubischen Ansätzen aus Aufgabe 7.2 gebildeten Ansatzräumen (3) (3) Sh und S̃h und bestimme deren Dimensionen asymptotisch in Abhängigkeit von h auf gleichmäßigen Triangulierungen. Wieviele von Null verschiedene Elemente haben die zugehörigen Steifigkeitsmatrizen pro Zeile bei der Approximation der Laplace-Gleichung? Übung 3.10: Die Neumannsche Randwertaufgabe −∆u + u = f in Ω, ∂n u = 0 auf ∂Ω, auf einem konvexen Polygongebiet Ω ⊂ R2 soll mit einem Galerkin-Verfahren mit Ansatzräumen (1) Vh ⊂ V := H01 (Ω) von linearen” finiten Elementen approximiert werden. ” a) Man formuliere diese Approximation, d. h. die Ansatzräume Vh ⊂ V := H 1 (Ω) und die zugehörigen Variationsgleichungen. b) Man leite Fehlerabschätzhungen in der H 1 - und der L2 -Norm her. c) Wie muß dieser Ansatz im Fall eines krumm berandeten Gebiets und einer inhomogenen Neumann-Randbedingung ∂n u = g auf ∂Ω zur Erzielung einer konformen Approximation modifiziert werden? Übung 3.11: Die Randwertaufgabe −∆u = f in Ω, u|∂Ω = 0, auf einem Gebiet Ω ⊂ R2 mit (stückweise) kubisch (z. B. CAD-Daten mit kubischen SplineFunktionen) parametrisiertem C 2 -Rand ∂Ω soll mit einem (isoparametrischen) kubischen FiniteElemente-Ansatz diskretisiert werden. In diesem Fall hat die Lösung mindestens die Regularitätsstufe u ∈ H 3 (Ω) (i. Allg. aber u 6∈ H 4 (Ω) ), und es gilt die a priori Abschätzung kuk2+k ≤ ck∆ukk , k = 0, 1. a) Man gebe einen geeigneten Ansatzraum an. Welche Konvergenzordnungen sind dafür zu erwarten bzgl. der Energie-Norm (H 1 -Seminorm) und der L2 -Norm, und welche Regularität muß dabei jeweils für die Lösung u vorausgesetzt werden? b) Welche Fehlerordnung läßt sich mit Hilfe eines Dualitätsarguments für die Mittelwerte zeigen, d. h.: Z Z u dx u dx − ≤ ch? kuk? ? h Ω Ω Übung 3.12: Sei T ⊂ R2 ein Dreieck mit Durchmesser hT und Inkreisradius ρT mit hT ≤ cρT , und sei Ih v die lineare Interpolierende mit den Funktionswerten in den Eckpunkten von 3.7 Übungen 153 T als Knotenwerte. Man zeige mit den Mitteln der Vorlesung die Abschätzung 3/2 kv − Ih vk∂T ≤ chT k∇2 vkT . Hierdurch wird auch die Abschätzung 1/2 kv − Ih vk∂T ≤ chT k∇vkT nahegelegt. Kann diese gelten? Übung 3.13: Man gebe die bestmöglichen h-Potenzen in den folgenden Interpolationsfehlerabschätzungen für die Lagrange-Interpolation in P (T ) := P2 (T ) an: (i) (ii) (iii) (iv) k∇2 (v − IT v)kT ≤ ci h?T k∇3 vkT ; |(v − IT v)(a)| ≤ ci h?T k∇3 vkT ; k∂n (v − IT v)k∂T ≤ ci h? k∇3 vkT ; kv − IT vkT ≤ ci h?T k∇2 vkT . Übung 3.14: Zur Finite-Elemente-Approximation des sog. Plattenbiegeproblems” (Randwert” problem des biharmonischen” Operators) ” ∆2 u = f in Ω, u = ∂n u = 0 auf ∂Ω, wird wieder von einer zugehörigen variationellen Formulierung ausgegangen. Diese ist auf natürliche Weise im Sobolew-Raum V := H02 (Ω) = {v ∈ H 2 (Ω)| u|∂Ω = ∂n u|∂Ω = 0} definiert: Finde u ∈ V mit a(u, ϕ) := (∆u, ∆ϕ) = (f, ϕ) ∀ϕ ∈ V. Die Bilinearform ist a(·, ·) V -elliptisch, so daß die betrachtete RWA eine eindeutige schwache” ” Lösung u ∈ V besitzt. Auf einem Rechteck Ω ist diese schwache Lösung sogar in H 4 (Ω) und genügt der a priori Abschätzung kukH 4 ≤ ckf k. Für einen konformen Finite-Elemente-Ansatzraum Vh muß nun gelten Vh ⊂ V , d.h.: die stückweise polynomialen Ansatzfunktionen müßen global stetig differenzierbar sein. Das Grundgebiet Ω sei als konvex polygonal angenommen. a) Einen konformen Finite-Elemente-Ansatzraum Vh ⊂ V erhält man mit Hilfe des quintischen Argyris-Elements. Man gebe hierfür eine Fehlerabschätzung in der Energienorm” sowie in der ” L2 -Norm an. (Hinweis: Dualitätsargument.) b) Welche Spektral-Kondition in Abhängigkeit von der Gitterweite h ist für die zugehörige Steifigkeitsmatrix Ah zu erwarten? Übung 3.15: Die Steifigkeitsmatrix und der Lastvektor eines kubischen FE-Ansatzes zur Approximation der RWA −∆u = 0 in Ω, u|∂Ω = 0, auf einer Triangulierung von Ω ⊂ R2 werde mit Hilfe numerischer Quadratur berechnet. 154 Finite-Elemente-Verfahren für elliptische Probleme a) Von welcher Ordnung sollte die verwendete Quadraturformel sein, damit (i) Konvergenz des resultierenden Verfahrens bzgl. der Energienorm garantiert ist, und (ii) seine Ordnung optimal ist? Man gebe jeweils ein Verfahrensbeispiel (Quadraturformel) mit möglichst geringer Komplexität (Anzahl der Funktionsauswertungen) an. b) Zur Illustration der Notwendigkeit bzw. Nichtnotwendigkeit der in der Vorlesung abgeleiteten Bedingungen an die numerische Quadratur betrachte man die Approximation der 1. RWA des Laplace-Operators auf dem Einheitsquadrat mit bilinearen finiten Elementen auf einem äquidistanten, kartesischen Gitter. Welches Differenzenschema erhält man, wenn die Elemente der Systemmatrix mit der Mittelpunktsregel berechnet werden? Diese Situation ist durch die Theorie aus der Vorlesung nicht abgedeckt. Ist das resultierende Verfahren dennoch konvergent? Übung 3.16: Für die Systemmatrix Ah einer Finite-Elemente-Diskretisierung für die 1. RWA des Laplace-Operators −∆u = f in Ω, u = 0 auf ∂Ω, wurde in der Vorlesung für “quasi-gleichförmige” Triangulierungsfolgen (Th )h>0 die Kondition cond2 (Ah ) = O(h−2 ) gezeigt. (i) Man rekapituliere, was für eine Triangulierungsfolge “quasi-gleichförmig” bedeutet. (ii) Wie hängt die Kondition von Ah von den Inkreis- bzw. Inkugelradien der Zellen ab, wenn die Triangulierungsfolge nicht “formregulär” ist? (iii) Man untersuche die Abhängigkeit der Kondition der Systemmatrix cond2 (Ah ) der “5Punkte-Differenzendiskretisierung auf äquidistanten Tensorproduktgittern mit unterschiedlichen Gitterweiten hx 6= hy vom Seitenverhältnis hx /hy (“aspect ratio”). (Hinweis: Man verallgemeinere die in einer früheren Übungsaufgabe hergeleiteten expliziten Formeln für die Eigenwerte der 5-Punkte-Matrix für die vorliegende Situation.) Übung 3.17: Man rekapituliere den Beweis der Konditionsabschätzung cond2 (Ah ) = O(h−2 ) aus der Vorlesung für die Systemmatrix einer FE-Diskretisierung der 1. RWA (“Dirichletsche RWA”) des Laplace-Operators auf einer “quasi-gleichförmigen” Triangulierungsfolge für die FEDiskretisierung der 2. RWA (“Neumannsche RWA”): −∆u = f in Ω, ∂n u = 0 auf ∂Ω. Übung 3.18: Es werde die inhomogene Neumannsche RWA −∇ · (α∇u) + γu = f in Ω, n · (α∇u) = g auf ∂Ω, auf einem konvexen Polygongebiet Ω ⊂ R2 betrachtet. Die Daten α , γ , f und g seien glatt und ferner α, γ > 0 . Mit Hilfe der FEM mit stückweise linearen Ansatzfunktionen wird eine (1) Näherung uh ∈ Vh ⊂ H 1 (Ω) berechnet. a) Man gebe die zugehörige variationelle Formulierung an. b) Man leite eine a posteriori Fehlerabschätzung für den Energie-Norm-Fehler her: keh kE := (α∇eh , ∇eh )Ω + (γeh , eh )Ω 1/2 . c) Man leite eine a posteriori Fehlerabschätzung für den L2 -Norm-Fehler keh k2 her. 3.7 Übungen 155 Übung 3.19: Die 1. RWA des Laplace-Operators auf einem konvexen Polygongebiet Ω ⊂ R2 werde durch lineare” finite Elemente auf einer Triangulierung Th von Ω approximiert. Man ” zeige, daß die in der Vorlesung abgeleitete a posteriori Abschätzung für den L2 -Norm-Fehler, ku − uh k2 ≤ c ηL2 (uh ) mit dem Schätzer” ” ηL2 (uh ) := X T ∈Th 1/2 2 k[∂ u ]k , h4T kf + ∆uh k22;T + 21 h−1 n h 2;∂T \∂Ω T asymptotisch optimal ist, d.h.: ηL2 (uh ) ≤ cku − uh k2 + X T ∈Th h4T kf + ∆uh k22 1/2 . Dazu verwende man die Spur-Abschätzung” ” −3/2 1/2 k∂n vk2;∂T ≤ chT k∆vk2;T + hT kvk2;T , deren genaue h-Potenzen man mit Hilfe des üblichen Transformationsarguments aus der entsprechenden Ungleichung auf einer Einheitszelle” (Beweisskizze zur Wiederholung) erhält. ” Übung 3.20: In Anlehnung an die Argumentationsweise der Vorlesung (siehe auch das Skriptum) leite man eine Formel für eine Gitterweitenfunktion h(x) her, welche in folgendem Sinne “optimal” ist: N → min!, η(uh ) ≤ T OL, wobei N := Z h(x)−2 dx, η(uh ) := Ω Z h(x)2 A(x) dx. Ω Übung 3.21: Dem in der vorigen Aufgabe verwendeten Optimierungsargument liegt die Annahme zugrunde, daß sich die Zellresiduen im wesentlichen wie 1/2 ρT := kf + ∆uh kT + 12 hT k[∂n uh ]k∂T = O(hT ) verhalten. Man zeige, daß dies im Fall linearer Ansatzfunktionen auf einer quasi-gleichförmigen (regulär mit “uniform shape”- und “uniform-size”-Eigenschaft) Folge von Triangulierungen im R2 mit hT ∼ h tatsächlich der Fall ist. Dazu verwende man die bekannte a priori Fehlerabschätzung k∇(u − uh )k∞ ≤ chk∇2 uk∞ unter der Annahme u ∈ W 2,∞ (Ω) , sowie die gleichfalls bekannten lokalen Interpolationsfehlerabschätzungen und “inversen” Beziehungen für Finite-Elemente-Funktionen. (Bem.: Die Annahme der Quasi-Gleichförmigkeit ist natürlich unrealistisch, da ja im Endeffekt gerade lokal verfeinerte Gitter erzeugt werden sollen.) 156 Finite-Elemente-Verfahren für elliptische Probleme 4 Iterative Lösungsverfahren für FD- und FE-Gleichungen In diesem Kapitel werden iterative Lösungsverfahren für die durch Anwendung einer FiniteDifferenzen- oder Finite-Elemente-Diskretisierung entstehenden (linearen) Gleichungssysteme diskutiert. Dies sind neben den traditionellen Fixpunktiterationen vor allem sog. PCG-Verfahren“ ” (preconditioned conjugate gradient methods) und die modernen Mehrgittermethoden“. Zugrun” de gelegt wird dabei meist wieder das Modellproblem der 1. RWA des Laplace-Operators Lu := −∆u = f in Ω, u = g auf ∂Ω, (4.0.1) auf einem (konvexen) Polygongebiet Ω ⊂ R2 . Erweiterungen für Probleme mit variablen Koeffizienten, anderen Randbedingungen, Unsymmetrien sowie auf drei Raumdimensionen werden wieder in Bemerkungen berücksichtigt. Die zugehörigen algebraischen Systeme haben die Form Ax = b, (4.0.2) N mit Matrizen A = (anm )N n,m=1 und Vektoren b = (bn )n=1 der Dimension N . In der Praxis ist meist N ≫ 1000 , so daß neben dem Rechenaufwand auch der Speicherbedarf ein wichtiger Aspekt ist. Je nach der gewählten Numerierung der Gitterpunkte bzw. Knoten haben die Matrizen in der Regel Bandstruktur und sind extrem dünn besetzt. Ist das kontinuierliche Problem selbstadjungiert sowie definit, wie z.B. im Fall der 1. RWA des Laplace-Operators, so übertragen sich diese Eigenschaften bei FE-Diskretisierungen direkt auf die Systemmatrizen A . 4.1 Krylow-Raum-Methoden Wir diskutieren jetzt sog. Krylow1 -Raum-Methoden“, zu denen auch das klassische Verfahren ” der konjugierten Gradienten ( CG-Verfahren“) gehört. Im folgenden werden euklidisches Skalar” produkt und Norm auf RN mit hx, yi bzw. |x| bezeichnet. Die Koeffizientenmatrix A ∈ RN ×N sei zunächst als symmetrisch und positiv definit angenommen. Dann läßt sich die Gleichung (4.0.2) äquivalent charakterisieren durch ein quadratisches Minimierungsproblem: ⇔ Ax = b Q(x) = min Q(y) y∈RN (4.1.3) mit Q(y) := 21 hAy, yi − hb, yi. Wegen ∇2 Q ≡ A folgt aus der Positiv-Definitheit von A die Existenz eines eindeutig bestimmten Minimums von Q(·) , welches notwendig Lösung von (4.0.2) ist. Diese Konstruktion ist analog zu der beim Nachweis von schwachen“ Lösungen der 1. RWA des Laplace-Operators. ” Wir halten fest, daß der Gradient von Q in einem Punkt y ∈ Rn gegeben ist durch ∇Q(y) = 1 2 (A + AT )y − b = Ay − b . (4.1.4) Dies ist gerade der Defekt“ im Punkt y . Für jede symmetrische, positiv definite Matrix B ∈ ” RN ×N ist durch kykB := hBy, yi1/2 eine sog. Energie-Norm“ definiert. Mit dieser Notation ” 1 Aleksei Nikolaevich Krylov (1863-1945): russischer Mathematiker; Prof. an der Sov. Akademie der Wissensch. in St. Petersburg; Beiträge zu Fourier-Analysis und Differentialgleichungen, Anwendungen in der Schiffstechnik. 157 158 Iterative Lösungsverfahren für FD- und FE-Gleichungen gilt dann 2Q(y) = hAy, yi − 2hb, yi = hAy, yi − hb, yi − hAy, A−1 bi + hb, A−1 bi − hb, A−1 bi = hAy − b, y − A−1 bi − hb, A−1 bi = hA−1 (Ay − b), Ay − bi − hb, A−1 bi = |Ay − b|2A−1 − |b|2A−1 = hy − A−1 b, A(y − A−1 b)i − hAA−1 b, A−1 bi = |y − x|2A − |x|2A , d.h.: Die Minimierung des Funktionals Q(·) ist äquivalent zur Minimierung der Defektnorm |Ay − b|A−1 bzw. der Energie-Norm |y − x|A . Die sog. Abstiegsverfahren“ bestimmen nun ausgehend von einem geeigneten Startvektor ” x(0) ∈ Rn eine Folge von Iterierten x(t) , t ∈ N , durch x(t+1) = x(t) + αt d(t) . (4.1.5) Dabei sind die d(t) vorgegebene oder auch erst im Verlauf der Iteration berechnete Abstiegs” richtungen“, und die Schrittweiten“ αt ∈ R sind durch die Vorschrift bestimmt (sog. line ” ” search“): Q(x(t+1) ) = min Q(x(t) + αd(t) ) . (4.1.6) α∈R Die notwendige Optimalitätsbedingung d Q(x(t) + αd(t) ) = ∇Q(x(t) + αd(t) ) · d(t) = hAx(t) − b, d(t) i + αhAd(t) , d(t) i = 0 dα ergibt mit dem Residuum r (t) := b − Ax(t) = −∇Q(x(t) ) : αt = hr (t) , d(t) i . hAd(t) , d(t) i Das allgemeine Abstiegsverfahren lautet also wie folgt: Startwert: für t ≥ 0: x(0) ∈ RN , Iterierte x(t) , αt = Residuum r (t) = b − Ax(t) , hr (t) , d(t) i , hAd(t) , d(t) i Abstiegsrichtung d(t) , x(t+1) = x(t) + αt d(t) . Praktisch günstiger ist die folgende Schreibweise, bei der man eine Matrix-Vektor-Multiplikation spart, wenn man den Vektor Ad(t) abspeichert: Startwert: für t ≥ 0: x(0) ∈ Rn , r (0) := b − Ax(0) , Iterierte x(t) , αt = Residuum r (t) , hr (t) , d(t) i , hAd(t) , d(t) i Abstiegsrichtung d(t) , x(t+1) = x(t) + αt d(t) , r (t+1) = r (t) − αt Ad(t) . Die verschiedenen Abstiegsverfahren unterscheiden sich im wesentlichen durch die jeweilige 4.1 Krylow-Raum-Methoden 159 Wahl der Abstiegsrichtungen d(t) . Die einfachste Möglichkeit wäre, die Richtungen d(t) zyklisch die kartesischen Einheitsvektoren {e(1) , . . . , e(n) } durchlaufen zu lassen. Die so erhaltene iterative Methode wird Koordinatenrelaxation“ genannt. Ein voller Relaxationszyklus ist äquivalent ” zum Gauß-Seidel-Verfahren (Übungsaufgabe). Naheliegender ist die Wahl der Richtung des stärksten Abfalls von Q(·) im Punkt x(t) , d.h. des Gradienten bzw. Residuums, als Suchrichtung d(t) = −g(t) = −∇Q(x(t) ) = r (t) . Diese Gradientenverfahren“ ist aber relativ langsam (vergleichbar mit dem Jacobi-Verfahren). Je ” zwei aufeinander folgende Abstiegsrichtungen sind dabei orthogonal, (d(t+1) , d(t) ) = 0 , aber d(t+2) braucht nicht einmal annähernd orthogonal zu d(t) zu sein. Dies führt zu einem stark oszillatorischen Konvergenzverhalten des Gradientenverfahrens besonders bei Matrizen A mit weit auseinander liegenden Eigenwerten. Dies bedeutet etwa in Fall N = 2 , daß das Funktional Q(·) stark exzentrische Niveaulinien hat und sich die Iterierten in einem Zickzackkurs der Lösung annähern (siehe Bild). Abbildung 4.1: Niveaulinien des quadratischen Funktionals in zwei Dimensionen 4.1.1 Verfahren der konjugierten Richtungen (CG-Verfahren) Das Gradientenverfahren nutzt die Struktur des quadratischen Funktionals Q(·) , d.h. die Verteilung der Eigenwerte der Matrix A , nur lokal von einem Schritt zum nächsten aus. Es wäre günstiger, wenn bei der Wahl der Abstiegsrichtungen auch die bereits gewonnenen Informationen über die globale Struktur von Q(·) berücksichtigt würden, d.h. wenn etwa die Abstiegsrichtungen paarweise orthogonal wären. Dies ist die Grundidee des sog. Verfahrens der konjugierten Gra” dienten“ nach Hestenes2 und Stiefel3 ( conjugate gradient method“ oder kurz CG-Verfahren“), ” ” welches sukzessive eine Folge von Abstiegsrichtungen d(t) erzeugt, die bzgl. des Skalarprodukts (·, ·)A orthogonal sind ( A-orthogonal“). Zur Konstruktion dieser Folge macht man den Ansatz ” Kt = span{d(0) , ..., d(t−1) } und sucht, Iterierte in der Form x(t) = x(0) + t−1 X i=0 αi d(i) ∈ x(0) + Kt (4.1.7) zu bestimmen, so daß Q(x(t) ) = min Q(x(0) + y) . y∈Kt 2 Magnus R. Hestenes (1906-1991): US-amerikanischer Mathematiker; Prof. an der UCLA, USA, fundamentale Beiträge u.a. zur Numerischen Linearen Algebra. 3 Eduard Stiefel (1909-1978): schweizer Mathematiker; Prof. an der ETH Zürich; fundamentale Beiträge u.a. zur Numerischen Linearen Algebra. 160 Iterative Lösungsverfahren für FD- und FE-Gleichungen Dies ist äquivalent zu den Galerkin-Gleichungen“ ” hx(t) − x, d(t) iA = hAx(t) − b, d(j) i = 0, j = 0, ..., t − 1, (4.1.8) bzw. zu r (t) = b − Ax(t) ⊥ Kt . Setzt man den Ansatz (4.1.7) in (4.1.8) ein, so erhält man das Gleichungssystem t−1 X i=0 αi hAd(i) , d(j) i = hb − Ax(0) , dj i, j = 0, ..., t − 1, (4.1.9) mit der regulären Koeffizientenmatrix MA = (hAd(k) , d(j) i)t−1 j,k=0 . Eine natürliche Wahl der Ansatzräume Kt sind die sog. Krylow-Räume“ ” Kt (r (0) ; A) := span{r (0) , Ar (0) , ..., At−1 r (0) } zum Residuum r (0) = b − Ax(0) des Startvektors x(0) . Nach Konstruktion ist stets r (t) = b − Ax(t) = r (0) − r (0) + b − Ax(t) = r (0) + A(x(0) − x(t) ) ∈ r (0) + AKt (r (0) ; A) ⊂ Kt+1 (r (0) ; A). Da nach Konstruktion r (t) ⊥ Kt , ist also stets hr (t) , r (i) i = 0, i = 0, . . . , t − 1. Ferner folgt im Fall At r (0) ∈ Kt (r (0) ; A) notwendig r (t) = 0 bzw. Ax(t) = b . Ausgehend von der Formulierung (4.1.8) konstruiert das CG-Verfahren eine A-orthogonale Folge von Abstiegsrichtungen d(i) , die eine Basis des Krylow-Raumes Kt (r (0) ; A) bildet. Dies ließe sich etwa mit Hilfe des klassischen Gram4 -Schmidt5 -Algorithmus leisten, was aber numerisch sehr instabil ist. In Analogie zur vergleichbaren Situation bei der Konstruktion orthogonaler Polynome (z.B. die Legendre6 -Polynome) ist aber zu erwarten, daß dasselbe durch eine zweistufige Rekursion erreichbar ist. Ausgehend von einem Startpunkt x(0) mit Residuum (negativer Gradient) r (0) = b − Ax(0) seien Iterierte x(i) und zugehörige Abstiegsrichtungen d(i) (i = 0, ..., t − 1) bestimmt, so daß {d(0) , ..., d(t−1) } eine A-orthogonale Basis von Kt (d(0) ; A) ist. Zur Konstruktion des nächsten 4 Jørgen Pedersen Gram (1850-1916): dänischer Mathematiker, Mitarbeiter und später Eigentümer einer Versicherungsgesellschaft, Beiträge zur Algebra (Invariantentheorie), Wahrscheinlichkeitstheorie, Numerik und Forstwissenschaft; das u.a. nach ihm benannte Orthogonalisierungsverfahren geht aber wohl auf Laplace zurück und wurde bereits von Cauchy 1836 verwendet. 5 Erhard Schmidt (1876-1959): deutscher Mathematiker, Prof. in Berlin, Gründer des dortigen Instituts für Angewandte Mathematik 1920, nach dem Krieg Direktor des Mathematischen Instituts der Akademie der Wissenschaften der DDR; Beiträge zur Theorie der Integralgleichungen und der Hilbert-Räume sowie später zur Topologie. 6 Adrien-Marie Legendre (1752-1833): französischer Mathematiker; Mitglied der Pariser Akademie der Wissensch.; Beiträge zur Himmelsmechanik, Zahlentheorie und Geometrie. 4.1 Krylow-Raum-Methoden 161 d(t) ∈ Kt+1 (d(0) ; A) mit der Eigenschaft d(t) ⊥A Kt (d(0) ; A) machen wir den Ansatz d(t) = r (t) + t−1 X j=0 βjt−1 d(j) ∈ Kt+1 (d(0) ; A). (4.1.10) Dabei wird o.B.d.A. angenommen, daß r (t) = b − Ax(t) ∈ / Kt (d(0) ; A) ist, da andernfalls r (t) = 0 (t) bzw. x = x wäre. Zur Bestimmung der Koeffizienten βjt−1 beachten wir für i = 0, ..., t − 1 : 0 = hd(t) , Ad(i) i = hr (t) , Ad(i) i + t−1 X j=0 βjt−1 hd(j) , Ad(i) i = hr (t) + βit−1 d(i) , Ad(i) i . Für i < t − 1 ist hr (t) , Ad(i) i = 0 wegen Ad(i) ∈ Kt (d(0) ; A) und demnach βit−1 = 0 . Für i = t − 1 führt die Bedingung t−1 (t−1) 0 = hr (t) , Ad(t−1) i + βt−1 hd , Ad(t−1) i (4.1.11) zu den Formeln t−1 βt−1 := βt−1 =− hr (t) , Ad(t−1) i , hd(t−1) , Ad(t−1) i d(t) = r (t) + βt−1 d(t−1) . (4.1.12) Die nächsten Iterierten x(t+1) und r (t+1) = b − Ax(t+1) sind dann bestimmt durch αt = hr (t) , d(t) i , hd(t) , Ad(t) i x(t+1) = x(t) + αt d(t) , r (t+1) = r (t) − αt Ad(t) . (4.1.13) Dies sind die Rekursionsformeln des klassischen CG-Verfahrens. Wegen r (t) ⊥ Kt (r (0) ; A) und Kt (r (0) ; A) = span{d(0) , . . . , d(t−1) } ist hr (t) , d(i) i = 0, i = 0, . . . , t − 1. Damit lassen sich die Formeln für die Koeeffizienten αt und βt vereinfachen. Mit |r (t) |2 = hd(t) − βt−1 d(t−1) , r (t+1) + αt Ad(t) i = αt hd(t) , Ad(t) i , (4.1.14) |r (t+1) |2 = hr (t) − αt Ad(t) , r (t+1) i = −αt hAd(t) , r (t+1) i . (4.1.15) ergibt sich αt = |r (t) |2 , hd(t) , Ad(t) i βt = |r (t+1) |2 , |r (t) |2 (4.1.16) solange die Iteration nicht mit r (t) = 0 abbricht. Diese Konstruktion führt auf den folgenden 162 Iterative Lösungsverfahren für FD- und FE-Gleichungen CG-Algorithmus: Startwert: x(0) ∈ Rn , für t ≥ 0: αt = r (0) := b − Ax(0) , |r (t) |2 , hAd(t) , d(t) i x(t+1) = x(t) + αt d(t) , r (t+1) = r (t) − αt Ad(t) , βt = |r (t+1) |2 , |r (t) |2 d(t+1) = r (t+1) + βt d(t) . In jedem Iterationsschritt ist dabei eine Matrix-Vektor-Multiplikation und fünf Operationen der Mächtigkeit eines Skalarproduktbildung durchzuführen. Im Falle einer dünn besetzten Matrix vom Typ der Modellmatrix sind das etwa 10N arithmetische Operationen. Das CG-Verfahren erzeugt eine Basis von Abstiegsrichtungen, so daß es zwangsläufig nach spätestens t = N − 1 Schritten mit der Lösung x des Gleichungssystems (4.0.2) abbricht. Es handelt sich hierbei also formal um ein direktes“ Lösungsverfahren. Bei großer Dimension N ≥ 103 geht die A” Orthogonalität der Folge {d(0) , ..., d(t−1) } wegen des unvermeidlichen Rundungsfehlereinflusses schnell verloren, und das Verfahren wird zu einem nicht terminierenden, iterativen Prozess. Außerdem wäre die Durchführung von nahezu N − 1 Iterationsschritten wegen der damit verbundenen Zahl von O(N 2 ) arithmetischen Operationen viel zu hoch. Man wird also mit einer wesentlich geringeren Anzahl von t ≪ N Schritten auskommen müssen. Wir fassen die wichtigsten Eigenschaften des CG-Verfahrens in folgendem Satz zusammen. Satz 4.1 (CG-Konvergenz): Das CG-Verfahren bricht für jeden Startvektor x(0) ∈ RN nach spätestens N −1 Schritten mit x(t) = x ab. Für 0 ≤ t < N −1 gilt die Fehlerabschätzung 1 − 1/√κ t √ |e(0) |A , t ≥ 1, (4.1.17) |e(t) |A ≤ 2 1 + 1/ κ mit der Spektralkondition κ := κ2 (A) = λmax (A)/λmin (A) von A . Zur Reduzierung des Anfangsfehlers um den Faktor ε sind höchstens 2 1√ κ ln +1 (4.1.18) t(ε) ≤ 2 ε Iterationsschritte erforderlich. Dieses Resultat zeigt die Wichtigkeit der Kondition κ(A) für die Konvergenzgeschwindigkeit des CG-Verfahrens. Für das Modellproblem ist κ(A) = O(h−2 ) , was eine Gesamtlösungskomplexität von O(N 3/2 ) bedeutet. Das CG-Verfahren ist daher i.a. ähnlich effizient wie das optimale“ ” SOR-Verfahren, allerdings mit einer größeren Fehlerkonstanten. Im Gegensatz zu letzterem erfordert das CG-Verfahren aber nicht die Bestimmung eines optimalen Relaxationsparameters. Dafür ist das Resultat (4.1.17) auf den Fall einer symmetrischen, positiv definiten Matrix A beschränkt. Beweis: (i) Unter Beachtung der Beziehung |x(t) − x|A = min y∈x(0) +Kt |y − x|A , Kt := Kt (r (0) ; A) = span{d(0) , . . . , d(t−1) } = span{A0 r (0) , . . . , At−1 r (0) } 4.1 Krylow-Raum-Methoden 163 finden wir |x(t) − x|A = min |x(0) − x + p(A)r (0) |A . p∈Pt−1 Wegen r (0) = b − Ax(0) = A(x − x(0) ) folgt weiter |x(t) − x|A = min |[I − p(A)A](x(0) − x)|A p∈Pt−1 ≤ min |I + Ap(A)|A |x(0) − x|A ≤ p∈Pt−1 min p∈Pt , p(0)=1 |p(A)|A |x(0) − x|A , wobei die zu der Vektornorm | · |A assoziierte natürliche Matrizennorm der Einfachheit halber ebenfalls mit | · |A bezeichnet ist. Für beliebiges y ∈ RN haben wir mit einer Orthonormalbasis {w(1) , . . . , w(N ) } aus Eigenvektoren von A die Entwicklung y= N X γi w(i) , γi = hy, w(i) i , i=1 und folglich |p(A)y|2A = N X λi p(λi )2 γi2 i=1 wobei M := sup |p(µ)| , ≤ M 2 N X i=1 λi γi2 = M 2 |y|2A , λ := λmin (A), Λ := λmax (A) . λ≤µ≤Λ Dies impliziert dann |p(A)|A = sup y∈Rn , y6=0 |p(A)y|A ≤ M. |y|A (ii) Wir haben gefunden, daß |x(t) − x|A ≤ min p∈Pt , p(0)=1 sup |p(µ)| |x(0) − x|A . λ≤µ≤Λ Dies ergibt die Behauptung, wenn wir zeigen können, daß min p∈Pt , p(0)=1 1 − pλ/Λ t p . sup |p(µ)| ≤ 2 1 + λ/Λ λ≤µ≤Λ Dabei handelt es sich um ein Problem der Bestapproximation mit Polynomen bzgl. der Maximumnorm (Tschebyscheff7 -Approximation). Die Lösung p̄ ist gegeben durch p̄(µ) = Tt Λ + λ − 2µ Λ−λ Tt Λ + λ −1 Λ−λ , mit dem t-ten Tschebyscheff-Polynom Tt auf [−1, 1] . Dabei ist sup p̄(µ) = Tt λ≤µ≤Λ Λ + λ −1 Λ−λ . 7 Pafnuty Lvovich Tschebyscheff (russ.: Chebyshev) (1821-1894): russischer Mathematiker; Prof. in St. Petersburg; Beiträge zur Zahlentheorie, Wahrscjheinlichkeitstheorie und vor allem zur Approximationstheorie; entwickelte allgemeine Theorie orthogonaler Polsynome. 164 Iterative Lösungsverfahren für FD- und FE-Gleichungen Aus der Darstellung Tt (µ) = 1 2 µ+ p p t t µ2 − 1 + µ − µ2 − 1 , µ ∈ (−∞, ∞), für die Tschebyscheff-Polynome folgt über die Identität r √ √ √ κ+1 κ+1 2 κ ( κ ± 1)2 κ±1 κ + 1 2 −1= ± ± = = √ κ−1 κ−1 κ−1 κ−1 κ−1 κ∓1 die Abschätzung nach unten Tt Also wird Λ + λ Λ−λ = Tt √ √ √ 1 h κ + 1 t κ − 1 t i 1 κ + 1 t √ √ = ≥ + √ . κ−1 2 κ−1 κ+1 2 κ−1 κ + 1 √κ − 1 t sup p̄(µ) ≤ 2 √ , κ+1 λ≤µ≤Λ was (4.1.17) impliziert. (iii) Zur Herleitung von (4.1.18) fordern wir √κ − 1 t(ε) <ε ⇒ 2 √ κ+1 Wegen ln ist dies erfüllt für t(ε) ≥ x + 1 1√ 2 x−1 =2 √κ + 1 −1 ln √ t(ε) > ln . ε κ−1 2 1 1 1 1 1 + + + ... 3 x 3x 5 x5 ≥ 2 x κ ln(2/ε) . Q.E.D. 4.1.2 CG-Verfahren für unsymmetrische und indefinite Probleme Zur Lösung allgemeiner Gleichungssysteme Ax = b mit einer regulären, aber nicht notwendig symmetrisch und positiv definiten Matrix A ∈ Rn mit Hilfe des CG-Verfahrens kann man etwa zu dem äquivalenten System AT Ax = AT b (4.1.19) mit der positiv definiten Matrix AT A übergehen. Hierauf angewendet, schreibt sich das CGVerfahren wie folgt: Startwerte: für t ≥ 0: x(0) ∈ RN , αt = d(0) = r (0) = AT (b − Ax(0) ) , |r (t) |2 , |Ad(t) |2 x(t+1) = x(t) + αt d(t) , βt = |r (t+1) |2 , |r (t) |2 r (t+1) = r (t) − αt AT Ad(t) , d(t+1) = r (t+1) + βt d(t) . 4.1 Krylow-Raum-Methoden 165 Die Konvergenzgeschwindigkeit ist dabei charakterisiert durch κ(AT A) . Das ganze Verfahren beruht offenbar auf der Minimierung des Funktionals Q(y) := 1 2 hAT Ay, yi − hAT b, yi = 21 |Ay − b|2 − 12 |b|2 . (4.1.20) Da κ(AT A) ∼ κ(A)2 ist, muß man mit einer recht langsamen Konvergenz dieses quadrierten“ ” CG-Verfahrens für nicht symmetrische Systeme rechnen. Auf der Basis der Chrakterisierung (4.1.3) ist das beschriebene CG-Verfahren auf symmetrische, positiv definite Matrizen beschränkt. Geht man allerdings von der notwendigen ” Optimalitätsbedingung“ (4.1.8) aus, so ist dieser Ansatz auch für allgemeine Matrizen sinnvoll. Tatsächlich lassen sich auf diesem Wege leistungsfähige Verallgemeinerungen des CGVerfahrens auch für unsymmetrische und indefinite Matrizen ableiten. Dabei werden in der Galerkin-Formulierung (4.1.8) als Ansatzräume meist wieder die Krylow-Räume Kt = span{r (0) , Ar (0) , ..., At−1 r (0) } verwendet. Als Testräume“ treten gleichfalls Kt∗ = Kt oder auch ” Kt∗ = span{r (0) , AT r (0) , ..., (AT )t−1 r (0) } auf. Die resultierenden Verfahren GMRES, ORTHOMIN, CRS, bi-CG-stab u.s.w., haben dann jeweils die eine oder die andere Eigenschaft des normalen CG-Verfahrens, lassen aber keine so vollständige Konvergenzanalyse zu. 4.1.3 Vorkonditionierung (PCG-Verfahren) Die Fehlerabschätzuung für das CG-Verfahren garantiert eine besonders gute Konvergenz, wenn die Kondition der Matrix A nahe bei Eins liegt. Daher wird eine Vorkonditionierung“ vorge” nommen, d.h.: Das System Ax = b wird in ein äquivalentes umgeformt, Ãx̃ = b̃ , dessen Matrix à besser konditioniert ist. Sei C eine symmetrische, positiv definite Matrix, welche explizit in Produktform C = KK T (4.1.21) gegeben ist mit einer regulären Matrix K . Das System Ax = b wird dann in der äquivalenten Form geschrieben K −1 A (K T )−1 K T x = K −1 b . {z } | {z } | {z } | à x̃ b̃ (4.1.22) (K T )−1 ÃK T = (K T )−1 K −1 A(K T )−1 K T = C −1 A (4.1.23) Das CG-Verfahren wird nun auf das System Ãx̃ = b̃ angewendet. Die Beziehung zeigt, daß für C ≡ A die Matrix à ähnlich zu I, d.h. κ(Ã) = κ(I) = 1 wäre. Folglich wird man C −1 als möglichst gute Approximation von A−1 wählen, wobei natürlich die Zerlegung C = KK T bekannt sein muß. Das CG-Verfahren für das transformierte System Ãx̃ = b̃ kann 166 Iterative Lösungsverfahren für FD- und FE-Gleichungen in den ursprünglichen Größen A, b und x als PCG-Verfahren geschrieben werden: Startwert: x(0) ∈ RN , d(0) = r (0) = b − Ax(0) ρ(0) = C −1 r (0) , für t ≥ 0: αt = hr (t) , ρ(t) i , hAd(t) , d(t) i x(t+1) = x(t) + αt d(t) , r (t+1) = r (t) − αt Ad(t) , ρ(t+1) = C −1 r (t+1) , βt = hr (t+1) , ρ(t+1) i , hr (t) , ρ(t) i d(t+1) = r (t+1) + βt d(t) . Verglichen mit der einfachen CG-Iteration erfordert das PCG-Verfahren in jedem Schritt zusätzlich die Lösung des Systems Cρ(t+1) = r (t+1) , was unter Ausnutzung der Zerlegung C = KK T erfolgt. Zur Erzielung einer Komplexität von O(N ) a.Op. pro Schritt sollte die Dreiecksmatrix K eine ähnliche Besetzungsstruktur wie der untere Dreiecksanteil L von A haben. Ausgehend von den oben betrachteten einfachen Fixpunktiterationen werden in der Praxis die folgenden Vorkonditionierer verwendet: 1) Diagonal-Vorkonditionierung (Skalierung): C = D 1/2 D1/2 . Die Skalierung bewirkt, daß die Elemente von A auf etwa gleiche Größenordnung gebracht werden, insbesondere wird ãii = 1 . Dies reduziert die Kondition, denn es gilt: κ(A) ≥ max1≤i≤N aii . min1≤i≤N aii (4.1.24) Beispiel: Die Matrix A = diag{λ1 = ... = λN −1 = 1, λN = 10k } hat die Kondition cond2 (A) = 10k . Die skalierte Matrix à = D−1/2 AD −1/2 hat dagegen die optimale Kondition cond2 (Ã) = 1 . 2) SSOR-Vorkonditionierung: Mit einem Parameter ω wird gesetzt 1/2 1/2 + {z ωD −1/2 R}) . C = (D + ωL)D −1 (D + ωR) = (D + {z ωLD −1/2})(D | | K KT Offenbar besitzt die Dreiecksmatrix K dieselbe schwache Besetzung wie A . Pro Iterationsschritt erfordert das so vorkonditionierte Verfahren etwa doppelt so viel Aufwand wie das einfache Verfahren. Dagegen gilt für die Modellmatrix bei optimaler Wahl des Parameters ω (i.a. nicht leicht zu bestimmen!) p κ(Ã) = κ(A) . 3) ICCG-Verfahren (Incomplete Cholesky Conjugate Gradient): Die symmetrische, positiv definite Matrix A besitzt eine Cholesky-Zerlegung A = LLT mit einer unteren Dreiecksmatrix L = (lij )N i,j=1 . Die Elemente von L sind bestimmt durch die 4.1 Krylow-Raum-Methoden 167 Rekursionsformeln lii = lji = aii − i−1 X 2 lik k=1 i−1 X 1 aji − lii k=1 1/2 , ljk lik , i = 1, . . . , N , j = i + 1, . . . , N . Die Matrix L hat i.a. innerhalb der Hülle von A von Null verschiedene Elemente, erfordert also in der Regel weit mehr Speicherplatz als A selbst. Dies wird jedoch dadurch ausgeglichen, daß man nur eine ”unvollständige Cholesky-Zerlegung” vornimmt, d.h.: Im Cholesky-Algorithmus werden einige der lji willkürlich Null gesetzt, z.B.: ˜lji = 0 , wenn aji = 0 . Dies ergibt dann eine Zerlegung A = L̃L̃T + E (4.1.25) mit einer unteren Dreiecksmatrix L̃ = (˜lij )i,j=1,...,N , welche eine ähnliche (dünne) Besetzungsstruktur wie A besitzt. Man spricht von der ICCG(0)-Variante, wenn (4.1.25) gefordert wird. Werden im Fall einer Bandmatrix A weitere p Nebendiagonalen mit von Null verschiedenen Elementen in L̃ hinzugefügt bzw. weggestrichen, so nennt man dies die ICCG(+p) bzw. ICCG(−p)-Variante. Zur Vorkonditionierung verwendet die ICCG-Methode die Matrix C = KK T = L̃L̃T . (4.1.26) Obwohl keine strenge theoretische Begründung für den Erfolg dieses Ansatzes vorliegt, so zeigen doch numerische Tests an Modellproblemen, welchen Einfluß diese Konditionierung auf die Verteilung der Eigenwerte der Matrix à hat. Zwar wird die Konditionszahl κ(Ã) nicht deutlich kleiner als κ(A) , doch die Eigenwerte von à häufen sich im Gegensatz zu denen von A stark bei λ = 1 . Dies bewirkt, wie eine feinere Analyse zeigt, eine deutliche Beschleunigung der Konvergenz. 4) ADI-Vorkonditionierung: C = (Ax + ωI)(Ay + ωI)(ATy + ωI)(ATx + ωI) . Auch hier muß zur Bewahrung der Symmetrie von à eine symmetrisierte Variante des ADIMatrix verwendet werden. Eine gute Vorkonditionierung der Modellmatrix bewirkt eine Verbesserung der Konvergenzrate von ρ(A) = 1 − O(h) auf ρ(Ã) = 1 − O(h1/2 ) und damit auf die Lösungskomplexität O(N 5/4 ) . Besonders die ILU-Vorkonditionierung hat sich in der Praxis bei vielen Problemen als effizient und robust erwiesen. Sie reduziert zwar nicht die Kondition, doch bewirkt eine Konzentration der Eigenwerte um den Wert λ = 1 , was ebenfalls eine deutliche Beschleunigung der CG-Konvergenz mit sich bringt. 168 Iterative Lösungsverfahren für FD- und FE-Gleichungen 4.2 Mehrgitterverfahren Mehrgitterverfahren gehören zum Typ der (verallgemeinerten) Defektkorrekturiterationen und verwenden eine Folge von Subproblemen ähnlicher Struktur, aber sukzessive kleiner werdender Dimension. Sie sind speziell zugeschnitten auf die Lösung der Gleichungssysteme, wie sie bei der Diskretisierung partieller Differentialgleichungen mit Differenzen- oder Finite-ElementeVerfahren entstehen. Die Idee ist die eines allen diskreten Problemen zugrunde liegenden übergeordneten, kontinuierlichen Problems und der fortgesetzten Aufspaltung von Fehlern und Defekten auf den verschiedenen Gittern in niedrig- und hochfrequente Anteile, die separat behandelt werden. Bei richtiger Zusammenstellung der einzelnen Verfahrenskomponenten erhält man Idealfall das gewünschte optimale“ Lösungsverfahren der Komplexität O(N ) . ” Zum Einstieg betrachten wir das Gleichungssystem auf dem Gitter Th : Ah xh = bh (4.2.27) und approximieren die Lösung mit dem Richardson-Verfahren (t+1) xh (t) (t) (t) = xh + θh (bh − Ah xh ) = (Ih − θh Ah )xh + θh bh (4.2.28) mit einem Dämpfungsfaktor 0 < θh ≤ 1 . Die symmetrische, positiv definite Matrix Ah besitzt (i) ein Orthonormalsystem von Eigenvektoren {wh , i = 1, ..., Nh } zu den geordneten Eigenwerten λmin (Ah ) = λ1 ≤ ... ≤ λN = λmax (Ah ) =: Λh . Entwickelt man den Anfangsfehler in der Form (0) eh := (0) xh − xh = Nh X (i) εi wh , i=1 so gilt für die iterierten Fehler entsprechend (t) eh = (Ih − (0) θh Ah )t eh = Nh X i=1 t εi (Ih − θh Ah ) (i) wh = Nh X i=1 (i) εi (1 − θh λi )t wh . Folglich ist (t) |eh |2 = Nh X i=1 ε2i (1 − θh λi )2t . (4.2.29) Die Bedingung 0 < θh ≤ Λ−1 ist hinreichend für die Konvergenz der Richardson-Iteration. h Wegen |1 − θh λi | ≪ 1 für große λi und |1 − θh λ1 | ≈ 1 werden offenbar hoch-frequente“ ” Komponenten des Fehlers sehr schnell, aber niedrig-frequente“ nur sehr langsam gedämpft. ” (t) (t) (t) Dasselbe gilt auch für das Residuum rh = bh − Ah xh = Ah eh , d.h.: Bereits nach wenigen Iterationen gilt: [N/2] (t) |rh |2 ≈ X i=1 ε2i λ2i (1 − θh λi )2t , (4.2.30) wobei [N/2] := max{n ∈ N| n ≤ N/2} ist. Dies kann so interpretiert werden, daß der iterierte (t) Defekt rh auf dem Gitter Th glatt ist. Daher sollte er auf einem gröberen Gitter T2h mit Git- 4.2 Mehrgitterverfahren 169 terweite 2h gut approximierbar sein. Die resultierende Defektgleichung zur Berechnung der Kor(t) rektur zur Näherung xh auf Th würde dann wegen ihrer geringeren Dimension N2h ≈ Nh /4 auch weniger Aufwand kosten. Dieser Defektkorrekturproze in Verbindung mit sukzessiver Vergröberung kann weitergeführt werden bis zu einem gröbsten Gitter, auf dem die Defektgleichung dann exakt gelöst wird. Die wichtigsten Bestandteile eines solchen Mehrgitterprozesses sind die (0) (ν) Glättungsiteration“ xh = Shν (xh ) sowie geeignete Transferoperationen zwischen den Finite” Elemente-Räumen auf den verschiedenen Gittern. Die Glättungsoperation Sh (·) ist gewöhnlich gegeben in Form einer Fixpunktiteration (z.B. der Richardson-Iteration) (ν+1) xh (ν) (ν) = Sh (xh ) := (Ih − Ch−1 Ah )xh + Ch−1 bh , mit der Iterationsmatrix Sh := Ih − Ch−1 Ah . 4.2.1 Mehrgitteralgorithmus im Finite-Elemente-Kontext Zur Formalisierung des Mehrgitterprozesses betrachten wir nun eine Folge von Gittern Tl = Thl , l = 0, ..., L , zunehmender Feinheit h0 > ... > hl > ... > hL sowie zugehörige FE-Räume Vl := Vhl ⊂ V . Der Einfachheit halber sei angenommen, daß die FE-Räume hierarchisch geordnet sind, d.h.: V0 ⊂ V1 ⊂ ... ⊂ Vl ⊂ ... ⊂ VL . Diese Voraussetzung erleichtert die Analyse des Mehrgitterprozesses, ist aber nicht entscheidend für sein Funktionieren. Zwischen den Funktionen vl ∈ Vl und den zugehörigen Knotenwertevektoren yl ∈ RNl gilt der übliche Zusammenhang vl (an ) = yl,n , n = 1, ..., Nl . Wie üblich schreiben wir das kontinuierliche Problem und sein FE-Analogon in kompakter Form als a(u, ϕ) = (f, ϕ) ∀ϕ ∈ V, (4.2.31) bzw. auf dem feinsten Gitter TL als a(uL , ϕL ) = (f, ϕL ) ∀ϕL ∈ VL . (4.2.32) Dabei sind a(u, ϕ) := (Lu, ϕ) die zum (elliptischen) Operator L gehörende “Energie-Form“ und (f, ϕ) das L2 -Skalarprodukt auf dem Lösungsgebiet Ω . Die exakte“ diskrete Lösung uL ∈ VL ” genügt der a priori Fehlerabschätzung ku − uL k ≤ c h2L kf k . (4.2.33) Ziel ist es, einen Lösungsprozess zu finden, der eine Approximation ũL ≈ uL liefert mit kuL − ũL k ≤ c h2L kf k. (4.2.34) Ist der dazu erforderliche Aufwand O(NL ) und zwar gleichmäßig bzgl. L , so nennt man diesen Prozess komplexitäts-optimal“. Wir werden sehen, daß der Mehrgitteralgorithmus bei richtiger ” Wahl der Verfahrenskomponenten in diesem Sinne optimal“ ist. ” (0) Sei uL ∈ VL eine Schätzung für die exakte Lösung uL ∈ VL auf Gitterlevel L . Zunächst (0) (0) (0) wird uL geglättet“. Dazu werden ausgehend von ūL := uL z.B. ν Schritte des Richardson” Verfahrens durchgeführt. In variationeller Schreibweise lautet dies: (k) (k−1) (ūL , ϕL ) = (ūL (k−1) , ϕL ) + θL (f, ϕL ) − a(ūL , ϕL ) ∀ϕL ∈ VL , (4.2.35) 170 Iterative Lösungsverfahren für FD- und FE-Gleichungen wobei θL = λmax (Ah )−1 . Mit der geglätteten Approximation wird der Defekt dL ∈ VL gebildet (ohne ihn wirklich zu berechnen): (ν) (dL , ϕL ) := (f, ϕL ) − a(ūL , ϕL ), ϕL ∈ VL . (4.2.36) Wegen VL−1 ⊂ VL erhält man auf dem nächst gröberen Gitter TL−1 die Defektgleichung ( Grobgittergleichung“) ” (ν) a(qL−1 , ϕL−1 ) = (dL , ϕL−1 ) = (f, ϕL−1 ) − a(ūL , ϕL−1 ) ∀ϕL−1 . (4.2.37) Die Korrektur qL−1 ∈ VL−1 wird nun entweder exakt berechnet (etwa mit einem direkten“ ”(R) (0) Löser) oder nur näherungsweise mit Hilfe einer Defektkorrekturiteration qL−1 → qL−1 unter (R) Verwendung der noch gröberen Gitter TL−2 , ..., T0 . Das Ergebnis qL−1 ∈ VL−1 wird dann als (ν) Element von VL interpretiert und zur Korrektur von ūL verwendet: (R) (ν) ¯(0) ū L := ūL + ωL qL−1 . (4.2.38) ¯L zu Dabei wird der Dämpfungsparameter ωL ∈ (0, 1) verwendet, um das Residuum von ū minimieren. Auf diesen in der Praxis sehr nützlichen Trick wollen wir hier nicht weiter eingehen. ¯L wird nun nochmals µ-mal nachgeglättet“. Ausgehend Die erhaltene korrigierte Näherung ū ” (0) ¯ ¯ von ūL := ūL wird etwa wieder mit dem Richardson-Verfahren iteriert: (k) (k−1) ¯L , ϕL ) = (ū ¯L (ū ¯(k−1) , ϕL ) + θL (f, ϕL ) − a(ū , ϕL ) L ∀ϕL ∈ VL . (1) (4.2.39) (µ) ¯L akzeptiert. Damit Das Ergebnis wird schließlich als die nächste Mehrgitteriterierte uL := ū haben wir einen Schritt des Mehrgitterverfahrens (einen Zyklus“) auf dem Gitterlevel L be” schrieben. Jeder solche Zyklus beinhaltet also neben ν + µ Richardson-Schritten (auf Level L), welche jeweils eine Inversion der Massematrix erfordern, die Lösung des Grobgitterproblems“ ” (4.2.37). Wir wollen nun den beschriebenen Mehrgitteralgorithmus in etwas abstrakterer Form darstellen, um seine Struktur besser zu verstehen und ihn auch leichter analysieren zu können. Zu den Matrizen Al = Ahl auf den Gittern Tl sind Operatoren Al : Vl → Vl assoziiert durch (Al vl , wl ) = a(vl , wl ) = hAl yl , zl i ∀vl , wl ∈ Vl . (4.2.40) Weiter seien Sl (·) die zugehörigen Glättungsoperationen mit (linearen) Iterationsoperatoren Sl . Beim Richardson-Verfahren ist der Iterationsoperator Sl = Il − θl Al . Schließlich führen wir noch Transferoperatoren zwischen aufeinander folgenden Räumen ein: rll−1 : Vl → Vl−1 (Restriktion), pll−1 : Vl−1 → Vl (Prolongation). Im Finite-Elemente-Kontext ist natürlicherweise rll−1 = Pl−1 die L2 -Projektion und pll−1 = id. die natürliche Einbettung. Wir beschreiben nun den Mehrgitterprozeß zur Berechnung der Lösung des Sytems A L uL = f L auf dem feinsten“ Gitter TL . ” (4.2.41) 4.2 Mehrgitterverfahren 171 (t) (0) Mehrgitterprozeß: Ausgehend von einem Startwert uL ∈ VL werden Iterierte uL durch den folgenden rekursiven Prozeß (t) (t+1) = M G(L, uL , fL ) uL (4.2.42) (t) erzeugt. Sei also die t-te Mehrgitteriterierte uL bestimmt. Grobgitterlösung: Für l = 0 bedeutet M G(0, ·, g0 ) stets die exakte Lösung des Systems A0 v0 = g0 (z.B. mit Hilfe eines direkten Lösungsverfahrens), d.h.: v0 = M G(0, ·, g0 ) = A−1 0 g0 . (4.2.43) Rekursion: Sei für ein 1 ≤ l ≤ L das System Al vl = gl zu lösen. Mit Parameterwerten ν, µ ≥ 1 ist dann (1) (0) M G(l, vl , gl ) := vl ≈ vl (4.2.44) rekursiv definiert durch die folgenden Schritte: (i) Vorglättung: (0) v̄l := Slν (vl ) ; (4.2.45) dl := gl − Al v̄l , ; (4.2.46) d˜l−1 := rll−1 dl ; (4.2.47) (ii) Defektbildung: (iii) Restriktion: (0) (iv) Defektgleichung: Ausgehend von ql−1 := 0 wird für 1 ≤ r ≤ R iteriert: (r−1) (r) ql−1 := M G(l − 1, ql−1 , d˜l−1 ) ; (4.2.48) (4.2.49) (v) Prolongation: (R) ql := pll−1 ql−1 ; (4.2.50) (vi) Korrektur: Mit einem Dämpfungsparameter ωl ∈ (0, 1] wird gesetzt: v̄¯l := v̄l + ωl ql ; (4.2.51) (vii) Nachglättung: (1) vl := Slµ (v̄¯l ) ; (4.2.52) 172 Iterative Lösungsverfahren für FD- und FE-Gleichungen Im Falle l = L wird schließlich gesetzt: (t+1) uL (1) := vl . (4.2.53) (t+1) (t) Schematische Darstellung des Mehrgitterschritts uL → uL (t) (t) (t) : (t) uL → ūL = SLν (uL ) → dL = fL − AL ūL ↓ d˜L−1 = rLL−1 dL−1 ˜ qL−1 = Ã−1 L−1 dL−1 (Restriktion) (R-malige Defektkorrektur) ↓ q̃L = pL L−1 qL−1 (Prolongation) (t+1) (t) ¯(t) ¯(t) = SLµ (ū ū L ) L = ūL + ωL q̃L → uL Wenn die Defektgleichung AL−1 qL−1 = d˜L−1 auf dem gröberen Gitter TL−1 exakt“ gelöst wird ” (z.B. durch Gauß-Elimination), spricht man von einer Zweigittermethode“: In der Regel wird ” der Prozeß aber rekursiv zum Mehrgitterverfahren bis zum gröbsten Gitter fortgesetzt. Dabei kann der vollständige Mehrgitterzyklus auf verschiedene Art organisiert werden. Seine Struktur ist im wesentlichen durch den Parameter R bestimmt, der festlegt, wie oft der Defektkorrekturprozeß auf jedem Gitterlevel durchgeführt wird. In der Praxis spielen nur die Fälle R = 1 oder R = 2 eine Rolle. Dem entsprechen der im schematischen Bild gezeigte sog. V-Zyklus“ und ” der sog. W-Zyklus“. Dabei stehen die Punkte •“ für Glättung und Defektkorrektur auf den ” ” Gittern Tl , und die Linie −“ für den Transfer zwischen aufeinander folgenden Gitterniveaus. ” v4 v3 v2 v1 v0 v4 v3 v2 v1 v0 Abbildung 4.2: Schema eines Mehrgitterverfahrens mit V- (oben links) F- (oben rechts) und W-Zyklus (unten). Der V-Zyklus ist sehr effizient (wenn er funktioniert), krankt aber oft an Instabilitäten, welche durch Irregularitäten im Problem (starke Unsymmetrien, Eckensingularitäten, Gitterunregelmäßigkeiten u.s.w.) hervorgerufen werden. Der W-Zyklus ist dagegen sehr robust, aber auch 4.2 Mehrgitterverfahren 173 teurer. Methoden mit R ≥ 3 sind gewöhnlich zu ineffizient. Ein guter Kompromiß zwischen VZyklus und W-Zyklus stellt der sog. F-Zyklus“ dar. Dieser wird gewöhnlich auf Gitter TL ” (0) (0) gestartet mit einem beliebigen Startvektor uL (meist uL = 0 ). Wird dieser Prozeß allerdings zur Lösung eines nicht linearen Problems im Rahmen einer Newton-Iteration angewendet, so kann dieser Startwert zu ungenau sein, und die ganze Iteration divergiert. In einem solchen Fall startet man zur Generierung einer hinreichend genauen Anfangsapproximation den Mehrgitterprozess gewöhnlich auf dem gröbsten Gitter T0 . Wir beschreiben dieses sog. geschachtelte“ ” Mehrgitter-Schema ( nested multigrid“) für das lineare Problem. ” Geschachteltes MG: Ausgehend von dem Startwert u0 := A−1 0 f0 auf dem gröbsten Gitter T0 werden für l = 1, ..., L rekursiv Näherungen ũl ≈ ul berechnet nach der Vorschrift: (0) ul = pll−1 ũl−1 (t) (t−1) ul = M G(l, ul , fl ), t = 1, ..., tl , (t ) (tl ) kul − ul k ≤ ĉ h2l kf k, ũl = ul l . Es gibt nicht den“ Mehrgitteralgorithmus. Die erfolgreiche Realisierung des Mehrgitterkon” zepts erfordert eine sorgfältige Balance der verschiedenen Bestandteile wie Glätter Sl und Gitteroperatoren Al sowie der Gittertransfers rll−1 und pll−1 jeweils für das zu lösende Problem. Im folgenden werden wir diese Verfahrenskomponenten im Rahmen des Finite-Elemente-Kontexts diskutieren. i) Glätter: Glätter“ sind üblicherweise einfache Fixpunktiterationen, die auch als Löser“ ” ” verwendet werden können, aber mit einer sehr schlechten Konvergenzrate. Sie werden auf jedem Gitterniveau nur ein paarmal angewendet (ν, µ ∼ 1 − 4), um die hochfrequenten Fehleranteile auszudämpfen. Wir betrachten im folgenden nur das klassische Richardson-Verfahren, Sl := Il − θl Al , θl = λmax (Al )−1 , (4.2.54) welches aber nur bei sehr gutartigen“ Problemen funktioniert. Leistungsfähiger und robuster ” sind das Gauß-Seidel- und das ILU-Verfahren. Diese funktionieren auch noch gut, wenn das Problem gewisse Pathologien beinhaltet. Im Fall eines starken Advektionsterms besitzt die Systemmatrix bei Numerierung der Knotenpunkte in Transportrichtung einen dominanten unteren Dreicksanteil L , für den die Gauß-Seidel-Methode exakt“ ist. Für Probleme mit degenerierten ” Koeffizienten in einer Raumrichtung sowie auf stark anisotropen Gittern besitzt die Systemmatrix einen dominaten Tridiagonalanteil, für den wiederum die ILU-Iteration exakt ist. Für echt indefinite Probleme werden spezielle, der jeweiligen Struktur des Problems angepaßte Glätter verwendet, deren Diskussion aber außerhalb des Rahmens dieser Vorlesung liegt. Auf lokal verfeinerten Gittern darf die Glättung im Wesentlichen nur auf den jeweils neu hinzugekommenen Zellen operieren, da sonst der arithmetische Aufwand pro Gitterlevel zu groß wird. ii) Gittertransfers: Im Kontext einer Finite-Elemente-Diskretisierung mit geschachtelten Ansatzräumen V0 ⊂ V1 ⊂ ... ⊂ Vl ⊂ ... ⊂ VL ist die generische Wahl für die Prolongation pll−1 : Vl−1 → Vl die zellweise Einbettung und für die Restriktion rll−1 : Vl → Vl−1 die L2 Projektion. Bei anderen Diskretisierungen (z.B. Differenzenschemata) verwendet man geeignete Interpolationsprozesse (z.B. bilineare Interpolation). iii) Grobgitteroperatoren: Die Operatoren Al auf den verschiedenen Gitterniveaus müssen nicht notwendig zur selben Diskretisierung des Ausgangsproblems gehören. Dies wird z.B. wichtig 174 Iterative Lösungsverfahren für FD- und FE-Gleichungen bei der Berücksichtigung von gitterweitenabhängiger künstlicher Diffusion ( upwinding“) zur ” Behandlung von Transporttermen. Wir beschränken uns hier aber auf den Idealfall, daß alle Al durch dieselben FE-Diskretisierungen auf der Gitterhierarchie {Tl }l=0,...,L erzeugt sind. In diesem Fall gilt die für die theoretische Analyse nützliche Beziehung (Al−1 vl−1 , wl−1 ) = a(vl−1 , wl−1 ) = a(pll−1 vl−1 , pll−1 wl−1 ) = (Al pll−1 vl−1 , pll−1 wl−1 ) = (rll−1 Al pll−1 vl−1 , wl−1 ) , d.h.: Al−1 = rll−1 Al pll−1 . iv) Korrekturschritt: Im Korrekturschritt wird ein Dämpfungsparameter ωl ∈ (0, 1] verwendet, der im einfachsten Fall ωl = 1 gesetzt ist. Es hat sich als sehr wirksam erwiesen, ihn so zu wählen, daß der Defekt Al v̄¯l − d˜l−1 minimal wird. Dies führt auf die Formel ωl = (Al v̄¯l , d˜l−1 − Al v̄¯l ) . kAl v̄¯l k2 (4.2.55) In der folgenden Analyse werden wir der Einfachheit halber stets ωl = 1 setzen. 4.2.2 Konvergenz- und Aufwandsanalyse Die klassische Analyse des Mehrgitteralgorithmus basiert auf seiner Interpretation als eine Defektkorrekturiteration und dem Konzept einer rekursiven Anwendung des Zweigitterverfahrens. Zur Vereinfachung nehmen wir an, daß nur Vorglättung angewendet wird (d.h.: ν > 0, µ = 0) und daß im Korrekturschritt keine Dämpfung erfolgt (d.h.: ωl = 1 ). Der Zweigitterprozeß läßt sich dann in der folgenden Form schreiben: (t+1) uL (t) (t) −1 L−1 = SLν (uL ) + pL fL − AL SLν (uL ) L−1 AL−1 rL (t) −1 L−1 ν (t) = SLν (uL ) + pL L−1 AL−1 rL AL uL − SL (uL ) . (t) (t) Für den Iterationsfehler eL := uL − uL gilt daher (t+1) eL ν (t) −1 L−1 = I L − pL L−1 AL−1 rL AL SL (uL ) − uL . (4.2.56) Die Glättungsoperation ist gegeben in der (affin-linearen) Form SL (vL ) := SL vL + gL und erfüllt als Fixpunktiteration die Bedingung SL (uL ) = uL . Daraus erschließt man rekursiv, daß (t) (t) (t) SLν (uL ) − uL = SL SLν−1 (uL ) − uL = ... = SLν eL . Mit dem sog. Zweigitteroperator“ ” −1 L−1 ν ZGL (ν) := (IL − pL L−1 AL−1 rL AL )SL 4.2 Mehrgitterverfahren 175 gilt daher (t+1) eL (t) = ZGL (ν)eL . (4.2.57) Satz 4.2 (Zweigitterkonvergenz): Für hinreichend häufige Glättung, ν > 0 , ist der Zweigitteralgorithmus konvergent mit einer bzgl. L gleichmäßigen L2 -Konvergenzrate: kZGL (ν)k ≤ ρZG (ν) = c ν −1 < 1 . (4.2.58) ν L −1 L−1 ZGL (ν) = (A−1 L − pL−1 AL−1 rL )AL SL (4.2.59) −1 L−1 ν L kZGL (ν)k ≤ kA−1 L − pL−1 AL−1 rL kkAL SL k . (4.2.60) Beweis: Wir schreiben und schätzen ab: Der erste Term rechts beschreibt die Qualität der Approximation der Feingitterlösung auf dem gröberen Gitter, während der zweite Term den Glättungseffekt enthält. Die Idee für die weitere Analyse ist nun, zu zeigen, daß der Glätter SL (·) die sog. Glättungseigenschaft“, ” kAL SLν vL k ≤ cs ν −1 h−2 L kvL k , vL ∈ VL , (4.2.61) und die Grobgitterkorrektur die sog. Approximationseigenschaft“ besitzt, ” −1 L−1 2 L k(A−1 L − pL−1 AL−1 rL )vL k ≤ ca hL kvL k , vL ∈ VL , (4.2.62) mit positiven Konstanten cs , ca gleichmäßig bzgl. L . Kombination dieser beiden Abschätzungen ergibt dann die behauptete Ungleichung (4.2.58). Für hinreichend häufige Glättung ist ρZG := cν −1 < 1 , und der Zweigitteralgorithmus konvergiert gleichmäßig bzgl. L . Alle im folgenden auftretenden Konstanten sind unabhängig von L . (i) Glättungseigenschaft: Der selbstadjungierte Operator Al besitzt reelle, positive Eigenwerte 0 < λ1 ≤ ... ≤ λi ≤ ... ≤ λNL =: ΛL mit einem zugehörigen L2 -Orthonormalsystem von Eigenfunktionen {w(1) , ..., w(NL ) } , so daß sich jedes vL ∈ VL in der Form vL = NL X γi w(i) , γi = (vL , w(i) ) (4.2.63) i=1 darstellen läßt. Für den Richardson-Iterationsoperator SL := IL − θL AL : VL → VL , θL = Λ−1 L , (4.2.64) gilt dann AL SLν vL = NL X i=1 λi ν (i) w , γi λi 1 − ΛL (4.2.65) 176 Iterative Lösungsverfahren für FD- und FE-Gleichungen und folglich kAL SLν vL k2 = NL X i=1 λi 2ν γi2 λ2i 1 − ΛL NL λi 2ν o X γi2 1≤i≤NL ΛL ΛL i=1 n λ 2 2ν o λ i i = Λ2L max 1− kvL k2 . 1≤i≤NL ΛL ΛL ≤ Λ2L max n λ 2 i 1− Mit Hilfe der Beziehung (Übungsaufgabe) max {x2 (1 − x)2ν } ≤ (1 + ν)−2 (4.2.66) kAL SLν vL k2 ≤ Λ2l (1 + ν)−2 kvL k2 . (4.2.67) 0≤x≤1 ergibt sich Die Beziehung ΛL ≤ ch−2 L liefert dann schließlich die behauptete Ungleichung für den RichardsonIterationsoperator kAL SLν k ≤ cs ν −1 h−2 L , ν ≥ 1. (4.2.68) (ii) Approximationseigenschaft: Wir erinnern daran, daß im vorliegenden Kontext geschachtelter FE-Räume Prolongationen und Restriktionen gegeben sind durch pL L−1 = id. (Identität), rLL−1 = PL−1 (L2 -Projektion). Ferner erfüllt der Operator AL : VL → VL definitionsgemäß (AL vL , ϕL ) = a(vL , ϕL ), vL , ϕL ∈ VL . Für ein beliebiges, aber fest gewähltes fL ∈ VL gilt demnach für die Funktionen vL := A−1 L fL −1 L−1 und vL−1 := AL−1 rL fL : a(vL , ϕL ) = (fL , ϕL ) ∀ϕL ∈ VL , a(vL−1 , ϕL−1 ) = (fL , ϕL−1 ) ∀ϕL−1 ∈ VL−1 . Der Funktion vL ∈ VL ordnen wir eine Funktion v ∈ V ∩ H 2 (Ω) zu als Lösung der Randwertaufgabe Lv = fL in Ω, v = 0 auf ∂Ω, (4.2.69) bzw. in schwacher“ Formulierung ” a(v, ϕ) = (fL , ϕ) ∀ϕ ∈ V . (4.2.70) 4.2 Mehrgitterverfahren 177 Dafür gilt die a priori Abschätzung k∇2 vk ≤ ckfL k. (4.2.71) Dann ist a(vL , ϕL ) = (fL , ϕL ) = a(v, ϕL ), ϕL ∈ VL , a(vL−1 , ϕL−1 ) = (fL , ϕL−1 ) = a(v, ϕL−1 ), ϕL−1 ∈ VL−1 , d.h.: vL und vL−1 sind gerade die Ritz-Projektionen von v auf VL bzw. VL−1 . Für diese gelten die L2 -Fehlerabschätzungen kvL − vk ≤ ch2L k∇2 vk, kvL−1 − vk ≤ ch2L−1 k∇2 vk. (4.2.72) Damit erhalten wir wegen hL−1 ≤ 4hL und der a priori Abschätzung (4.2.71): kvL − vL−1 k ≤ ch2L k∇2 vk ≤ ch2L kfL k . (4.2.73) Dies bedeutet mit der obigen Setzung, daß −1 L−1 2 L kA−1 L fL − pL−1 AL−1 rL fL k ≤ chL kfL k . (4.2.74) Damit folgt die gewünschte Abschätztung 2 L −1 L−1 kA−1 L − pL−1 AL−1 rL k ≤ chL . (4.2.75) Dies vervollständigt den Beweis. Q.E.D. Das Resultat für den Zweigitteralgorithmus wird nun verwendet zum Nachweis der Konvergenz des vollen Mehrgitteralgorithmus. Satz 4.3 (Mehrgitterkonvergenz): Es sei angenommen, daß der Zweigitteralgorithmus konvergiert mit einer L2 -Konvergenzrate ρZG (ν) → 0 für ν → ∞ , gleichmäßig bzgl. L . Dann konvergiert für hinreichend häufige Glättung der Mehrgitteralgorithmus mit R ≥ 2 (W-Zyklus) mit einer von L unabhängigen L2 -Konvergenzrate ρM G < 1 , (t) (t) kuL − M G(L, uL , fL )k ≤ ρM G kuL − uL k. (4.2.76) Beweis: Der Beweis wird durch Induktion nach dem Gitterlevel L geführt. Wir betrachten nur den relevanten Fall R = 2 (W-Zyklus) und werden uns der Einfachheit halber nicht bemühen, die auftretenden Konstanten zu optimieren. Sei ν so groß, daß die Konvergenzrate des Zweigitteralgorithmus ρZG ≤ 18 ist. Wir wollen zeigen, daß dann die Konvergenzrate des Mehrgitteralgorithmus ρM G ≤ 14 ist, gleichmäßig bzgl. L . Für L = 1 ist dies dann offenbar richtig. Sei nun auch ρM G ≤ 14 für Gitterlevel L − 1 . Auf Gitterlevel L gilt dann ausgehend von der Iterierten (2) (t) uL mit der approximativen Lösung qL−1 (nach 2-maliger Anwendung der Grobgitterkorrektur) und der exakten Lösung q̂L−1 der Defektgleichung auf Level L − 1 : (t+1) uL (t) (t) (2) = M G(L, uL , fL ) = ZG(L, uL , fL ) + pL L−1 (qL−1 − q̂L−1 ) (4.2.77) 178 Iterative Lösungsverfahren für FD- und FE-Gleichungen Nach Induktionsvoraussetzung ist (Man beachte, daß der Startwert der Mehrgitteriteration auf L−1 Level L − 1 gleich Null ist und ρ̂L−1 = A−1 L−1 rL dL ): (t) (2) L−1 ν kq̂L−1 − qL−1 k ≤ ρ2M G kq̂L−1 k = ρ2M G kA−1 L−1 rL AL SL (uL − uL )k . (t) (4.2.78) (t) Kombination der letzten Beziehungen ergibt für den Iterationsfehler eL := uL − uL : (t) (t+1) ν L−1 (4.2.79) A S k keL k . r keL k ≤ ρZG + ρ2M G kA−1 L L L−1 L Die Norm rechts ist bereits im Zusammenhang mit der Konvergenz des Zweigitteralgorithmus −1 L−1 ν L abgeschätzt worden. Mit dem Zweigitteroperator ZGL = (A−1 L − pL−1 AL−1 rL )AL SL gilt −1 L−1 −1 L−1 ν ν L ν ν A−1 L−1 rL AL SL = SL − (AL − pL−1 AL−1 rL )AL SL = SL − ZGL und somit ν ν L−1 kA−1 L−1 rL AL SL k ≤ kSL k + kZGL k ≤ 1 + ρZG ≤ 2 . (4.2.80) Damit erhalten wir schließlich (t+1) keL (t) k ≤ ρZG + 2ρ2M G keL k . (4.2.81) Mit Hilfe der Annahme über ρZG und der Induktionsannahme folgt (t+1) keL k≤ 1 8 was den Induktionsbeweis vervollständigt. (t) (t) 1 + 2 16 keL k ≤ 14 keL k , (4.2.82) Q.E.D. Für gutartige“ Probleme (symmetrischer, positiv definiter Operator, glatte Koeffizienten, ” quasi-gleichförmige Gitter u.s.w.) erreicht man in der Regel Mehrgitterkonvergenzraten im Bereich ρM G = 0, 1 − 0, 3 . Die obige Analyse ist nur für den W-Zyklus gültig, da im Beweisteil (ii) R ≥ 2 benötigt wird. Der V-Zyklus kann nicht auf Basis nur einer Zweigitteranalyse behandelt werden. In der Literatur finden sich allgemeinere Ansätze, die Konvergenz von Mehrgitterverfahren auch in weniger regulären Situationen garantieren. Als nächstes diskutieren wir die numerische Komplexität des Mehrgitteralgorithmus. Dabei werden die folgenden Bezeichnungen verwendet: OP (T ) = Anzahl der a.Op. zur Durchführung einer Operation T, R = Anzahl der Defektkorrekturschritte auf den einzelnen Gitterniveaus, (d = Raumdimension), Nl = dim Vl ≈ h−d l κ = max Nl−1 /Nl , 1≤l≤L C0 = OP (A−1 0 )/N0 , Cs = max {OP (Sl )/Nl }, Cd = max {OP (dl )/Nl }, Cr = max {OP (rl )/Nl }, Cp = max {OP (pl )/Nl }. 1≤l≤L 1≤l≤L 1≤l≤L 1≤l≤L In der Praxis ist meist κ ≈ 2−d , Cs ≈ Cd ≈ Cr ≈ Cp ≈ #{anm 6= 0} und C0 N0 ≪ NL . 4.2 Mehrgitterverfahren 179 Satz 4.4 (Mehrgitterkomplexität): Unter der Bedingung q := Rκ < 1 gilt für einen Mehrgitterzyklus M GL : OP (M GL ) ≤ CL NL mit CL = (4.2.83) (ν + µ)Cs + Cd + Cr + Cp + C0 q L , 1−q Der Mehrgitteralgorithmus liefert die NL -dimensionale diskrete Lösung uL ∈ VL auf dem Gitter TL im Rahmen der Diskretisierungsgenauigkeit O(h2L ) bzgl. der L2 -Norm mit O(NL ln(NL )) a.Op. und hat damit (fast) optimale Komplexität. Beweis: Wir setzen Cl := OP (M Gl )/Nl . Ein Mehrgitterschritt beinhaltet die R-fache Anwendung desselben Algorithmus auf dem nächst gröberen Gitter. Bei Beachtung von Nl−1 ≤ κNl gilt mit Ĉ := (ν + µ)Cs + Cd + Cr + Cp : CL NL = OP (M GL ) ≤ ĈNL + R · OP (M GL−1 ) = ĈNL + R · CL−1 NL−1 ≤ ĈNL + qCL−1 NL , und folglich CL ≤ Ĉ + qCL−1 . Rekursive Anwendung dieser Beziehung liefert CL ≤ Ĉ(1 + q + q 2 + ... + q L−1 ) + q L C0 ≤ Ĉ + q L C0 . 1−q Dies impliziert die behauptete Abschätzung (4.2.83). Die Komplexität des Gesamtalgorithmus ergibt sich dann aus den Beziehungen −2/d ρtM G ≈ h2L ≈ NL , t≈− ln(NL ) . ln(ρM G ) Dies vervollständigt den Beweis. Q.E.D. Wir bemerken, daß im Beweis der Aussage (4.2.83) die Bedingung q := Rκ = R max Nl−1 /Nl < 1 1≤l≤L wesentlich ist. Dies besagt für den W-Zyklus (R = 2), daß sich beim Übergang vom Gitter Tl−1 zum nächst feineren Tl die Anzahl der Gitterpunkte (bzw. Freiheitsgrade) hinreichend stark erhöhen muß, etwa wie bei einer gleichförmigen Verfeinerung Nl ≈ 4Nl−1 . Bei einem adaptiv gesteuerten Verfeinerungsprozeß mit teilweise nur lokaler Gitterverfeinerung ist dies meist nicht erfüllt; selbst bei Verwendung der Fest-Raten“-Strategie ist z.B. oft nur ” Nl ≈ 2Nl−1 . In solchen Fällen muß der Mehrgitterprozeß zur Aufwandsersparnis modifiziert werden. Dies geschieht dadurch, daß die kostenintensive Glättung sowie die anderen Operationen nur jeweils auf den beim Übergang von Tl−1 zu Tl neu hinzugekommenen Gitterpunkten durchgeführt werden. Bei der Implementierung eines Mehrgitteralgorithmus auf lokal verfeinerten Gittern ist viel Fingerspitzengefühl erforderlich, wenn der resultierende Gesamtalgorithmus komplexitäts-optimal sein soll. 180 Iterative Lösungsverfahren für FD- und FE-Gleichungen Für das geschachtelte MG-Schema erhält man sogar im strengen Sinne optimale“ Lösungs” komplexität O(NL ) , da auf jedem Gitterniveau bestmögliche Startwerte verwendet werden. Satz 4.5 (Geschachteltes Mehrgitterverfahren): Das geschachtelte MG-Schema ist komplexitäts-optimal, d.h.: Es liefert die diskrete Lösung uL ∈ VL auf dem feinsten Gitter TL im Rahmen der Diskretisierungsgenauigkeit O(h2L ) bzgl. der L2 -Norm mit einem Aufwand von O(NL ) a.Op. Beweis: Die Genauigkeitsanforderung für die Mehrgitteriteration auf Gitterlevel TL ist (t) keL k ≤ ĉh2L kf k. (4.2.84) (i) Wir wollen zunächst zeigen, daß (4.2.84) beim geschachtelten MG-Schema unter den Voraussetzungen des Mehrgitterkonvergenzsatzes 4.3 auf jedem Level L mit einer (hinreichend (t) (t) großen) festen Zahl t∗ von Mehrgitterschritten erreichbar ist. Sei eL := uL − uL wieder der (t) (t) (0) Iterationsfehler auf Level L . Nach Annahme ist e0 = 0, t ≥ 1 . Im Fall uL := uL−1 gilt dann (0) (t) (t) keL k ≤ ρtM G keL k = ρtM G kuL−1 − uL k (t) ≤ ρtM G kuL−1 − uL−1 k + kuL−1 − uk + ku − uL k (t) ≤ ρtM G keL−1 k + ch2L kf k . Rekursive Anwendung dieser Beziehung für L ≥ l ≥ 1 ergibt dann (wegen hl = 2L−l hL ) (t) (t) keL k ≤ ρtM G ρtM G keL−2 k + ch2L−1 kf k + ch2L kf k .. . (t) t 2 2t 2 Lt 2 ≤ ρLt M G ke0 k + cρM G hL + cρM G hL−1 + ... + cρM G h1 kf k 2·2 2·L = c2−2 h2L ρtM G 22 + ρ2t + ... + ρLt kf k M G2 M G2 ≤ c2−2 h2L kf k 22 ρtM G , 1 − 22 ρtM G vorausgesetzt 22 ρtM G < 1 . Offenbar gibt es also ein t∗ , so daß (4.2.84) für t ≥ t∗ erfüllt ist, und zwar gleichmäßig bzgl. L . (ii) Wir kommen nun zur Aufwandsanalyse. Satz 4.4 besagt, daß ein Zyklus des einfachen“ ” Mehrgitteralgorithmus M G(l, ·, ·) auf dem l-ten Level Wl ≤ c∗ Nl a.Op. benötigt (gleichmäßig bzgl. l ). Sei nun Ŵl die Anzahl der a.Op. des geschachtelten Schemas auf Gitterlevel l . Dann gilt konstruktionsgemäß: ŴL ≤ ŴL−1 + t∗ WL . Durch Iteration dieser Beziehung erhalten wir mit κ := max1≤l≤L Nl−1 /Nl < 1 : ŴL ≤ t∗ c∗ {NL + ... + N0 } ≤ ct∗ c∗ NL {1 + ... + κL } ≤ was zu beweisen war. ct∗ c∗ NL , 1−κ Q.E.D. 4.3 Übungen 181 4.3 Übungen Übung 4.1: Das allgemeine “Abstiegsverfahren” zur iterativen Lösung des Gleichungssystems Ax = b mit symmetrischer, positiv-definiter Matrix A ∈ RN ×N lautet: Startwert: für t ≥ 0: x(0) ∈ Rn , r (0) := b − Ax(0) , Abstiegsrichtung αt = d(t) , hr (t) , d(t) i , hAd(t) , d(t) i x(t+1) = x(t) + αt d(t) , r (t+1) = r (t) − αt Ad(t) . Die sog. “Koordinatenrelaxation” erhält man durch zyklische Wahl der Abstiegsrichtungen d(t) aus den kartesischen Einheitsvektoren {e(1) , . . . , e(N ) } . Man zeige, daß jeder N -Zyklus der Koordinatenrelaxition äquivalent ist zum üblichen Gauß-Seidel-Verfahren. Bemerkung: Für eine typische FE-Matrix hat die zyklische Koordinatenrelaxation also das Konvergenzverhalten: |x(tN ) − x| ≤ cq t , q ≈ 1 − cond2 (A)−1 ≈ 1 − h2 . Übung 4.2: Die erste RWA des Laplace-Operators −∆u = f in Ω, u = 0 auf ∂Ω, auf einem regulären” Gebiet Ω ⊂ R2 werde mit einem FE-Verfahren mit stückweise linea” ren Ansatzfunktionen auf einer Folge von quasi-gleichförmigen Gittern (d.h. größen- und formregulär) der Weite h diskretisiert. Dies führt auf lineare Gleichungssysteme Ax = b mit symmetrischen, positiv definiten (N × N )-Matrizen A , wobei N die Anzahl der Knotenpunkte ist. Welchen arithmetischen Aufwand (ausgedrückt in Potenzen von h) erfordert dabei die Lösung dieser Gleichungssysteme mit dem CG-Verfahren mit der Genauigkeit des Diskretisierungsfehlers gemessen in der Energie-Norm” k∇(u − uh )k ? Dazu verwende man die folgende bekannte ” Fehlerabschätzung für das CG-Verfahren: √ 1 − 1/ κ t t 0 √ , |x − x |A ≤ 2q |x − x |A , q := 1 + 1/ κ mit der diskreten Energienorm” kxkA := (Ax, x)1/2 und der Spektralkondition κ := cond2 (A) ” von A . (Hinweis: Man verwende die bekannte Beziehung für die Spektralkondition von A sowie die aus der obigen Fehlerabschätzung abgeleitete Abschätzung für die Anzahl der Iterationsschritte. Der Aufwand pro CG-Schritt entspricht etwas der zweimaligen Defektberechnung x → d := Ax − b .) Übung 4.3: Man versuche, den Beweis der Konvergenz des Zweigitterverfahrens ZG aus der Vorlesung für den Fall zu verallgemeinern, daß die Restriktion rll−1 : Vl → Vl−1 mit Hilfe lokaler, bilinearer Interpolation (anstelle der L2 -Projektion) auf dem Gitter Tl−1 definiert ist. Wo ist dabei das Problem, und wie kann man damit fertig werden? 182 Iterative Lösungsverfahren für FD- und FE-Gleichungen Übung 4.4: Die FE-Diskretisierung des Konvektions-Diffusionsproblems −∆u + ∂1 u = f in Ω, u = 0 auf ∂Ω, führt auf unsymmetrische Systemmatrizen Ah . In diesem Fall erfordert die Analyse des Mehrgitterverfahrens einige Modifikationen. Man übertrage den Beweis aus der Vorlesung für die Konvergenz des Zweigitteralgorithmus, wenn als Glätter wieder das Richardson-Verfahren xht+1 = xth − θt (Ah xth − bh ), t = 0, 1, 2, . . . , mit den Dämpfungsparametern θt := 12 kAh k−1 verwendet wird. Übung 4.5: Zur Lösung der 1. RWA der Laplace-Gleichung −∆u = f in Ω, u = 0 auf ∂Ω, auf dem Einheitsquadrat Ω = (0, 1)2 werde auf einer Folge äquidistanter, kartesischer Gitter Tl mit Gitterweiten hl = 2−l mit Hilfe bilinearer finiter Elemente approximiert. Die diskrete Gleichung auf Gitterlevel l werde dabei mit einem MG-Verfahren gelöst, wobei das RichardsonVerfahren zur Glättung, die natürliche Einbettung zur Prolongation und die lokale bilineare Interpolation zur Restriktion verwendet werden. Die Anzahl der Vor- und Nachglättungsschritte sei ν = 2 und µ = 0 . Wieviele a.Op. kosten dann ungefähr ein V-Zyklus und ein W-Zyklus ausgedrückt in Vielfachen der Dimension Nl = dim Vl ? 5 Verfahren für parabolische Probleme Wir diskutieren zunächst wieder die klassischen Differenzenapproximationen zur Lösung parabolischer Anfangs-Randwert-Aufgaben. Der Übersichtlichkeit halber beschränken wir uns dabei auf das Modellproblem der Wärmeleitungsgleichung in zwei Ortsdimensionen mit Dirichletschen Randbedingungen, d.h. auf die 1. ARWA: ∂t u + Lu = f in Ω × (0, T ), u|∂Ω = 0, u|t=0 = u0 , (5.0.1) mit einem elliptischen Operator L , der hier exemplarisch als L := −a∆ mit einer Konstanten a > 0 gewählt wird. Das Definitionsgebiet Ω ∈ R2 wird wieder als glatt berandet oder als konvexes Polygongebiet vorausgesetzt. Die Problemdaten f, g, u0 sind ebenfalls glatt und kompatibel, so daß die Lösung ebenfalls als glatt angenommen werden kann. Erweiterungen für Probleme mit weniger regulären Daten oder anderen Randbedingungen sowie auf den dreidimensionalen Fall werden gegebenenfalls in Bemerkungen berücksichtigt. Gelegentlich wird auch das eindimensionale Analogon von (5.0.1) betrachtet. Als Basis von Finite-Elemente-Diskretisierungen dient wieder die variationelle Formulierung von (5.0.1): (∂t u, ϕ) + a(u, ϕ) = (f, ϕ) ∀ϕ ∈ V, t > 0, u|t=0 = 0, (5.0.2) mit dem üblichen Sobolew-Raum V := H01 (Ω) und der symmetrischen und positiv definiten Energie-Form“ a(u, ϕ) := (a∇u, ∇ϕ)Ω . ” Bei der Diskretisierung von instationären Problemen gibt es drei verschiedene Vorgehensweisen, die wir im folgenden kurz beschreiben wollen. i) Linienmethode“: Zunächst wird eine Diskretisierung bzgl. der Ortsvariablen vorgenom” men, d.h.: mit Hilfe eines Finite-Differenzen- oder Finite-Elemente-Ansatzes werden diskrete“ ” Funktionen uh (t) = uh (·, t) bestimmt aus der Gleichung u̇h (t) + Ah uh (t) = fh (t), t ≥ 0, uh (0) = u0h . (5.0.3) Im Falle eines Differenzenverfahrens auf einem Ortsgitter {xi }i=1,...,N ist die diskrete Funktion N → RN die uh (t) = (un (t))N n=1 der Vektor der Knotenwerte un (t) ≈ u(xn , t) , Ah = Ah : R zum verwendeten Differenzenoperator korrespondierende Matrix und fh = bh = (f (xn ))N n=1 . Beim Finite-Elemente-Ansatz ist uh (t) ∈ Vh eine Finite-Elemente-Funktion, Ah =: Vh → Vh das durch (Ah vh , ϕh ) = a(vh , ϕh ), vh , ϕh ∈ Vh , definierte diskrete Analogon zum Differentialoperators L und fh = Ph f ∈ Vh die L2 -Projektion der rechten Seite f auf Vh . Die Aufgabe (5.0.3) lautet demgemäß in variationeller Form wie folgt: (u̇h (t), ϕh ) + a(uh (t), ϕh ) = (f, ϕh ) ∀ϕh ∈ Vh , t ∈ I, uh (0) = Ph u0 . (5.0.4) (n) Nach Einführung einer Knotenbasis {ϕh , n = 1, ..., N = dim(Vh )} geht dieses Problem über in ein System für den Vektor Uh (t) = (Un (t))N n=1 der zugehörigen Knotenwerte, Mh U̇h (t) + Ah Uh (t) = bh (t), t ≥ 0, 183 Uh (0) = Uh0 , (5.0.5) 184 Verfahren für parabolische Probleme mit der Steifigkeitsmatrix“ und Massenmatrix“ ” ” (n) (m) Ah = (a(ϕh , ϕh ))N n,m=1 , (n) (m) Mh = ((ϕh , ϕh ))N n,m=1 der Finite-Elemente-Basis. In beiden Fällen, (5.0.3) oder (5.0.5), handelt es sich um ein System von (linearen) gewöhnlichen Differentialgleichungen. Dieses wird nun mit einem der üblichen Schemata bzgl. der Zeit diskretisiert. Nach Wahl einer (zunächst konstanten) Zeitschrittweite k werden zu den “diskreten“ Zeitleveln tm = mk Approximationen Uhm = (Unm )N n=1 zu u(·, tm ) bestimmt. Wir sprechen von einem Einschritt-“ bzw. einem Zweischrittverfahren“, wenn Uhm ” ” aus den vorausgehenden Werten gemäß einer Formel der Form Uhm = F (Uhm , Uhm−1 ) bzw. Uhm = F (Uhm , Uhm−1 , Uhm−2 ) berechnet wird. Im Falle Uhm = F (Uhm−1 ) bzw. Uhm = F (Uhm−1 , Uhm−2 ) heißt die Methode explizit“. Zur Durchführung einer nicht expliziten, d.h. impliziten“, Me” ” thode müssen in jedem Zeitschritt Gleichungssysteme gelöst werden. Die hohe Dimension des Systems, N = #{Gitterpunkte an } bzw. N = dim(Vh ) , mit N ∼ 103 − 108 impliziert im Hinblick auf die Lösungsökonomie Einschränkungen bei der Wahl der Verfahren. Es kommen in der Regel nur Schemata einfacher Struktur, d.h. mit wenigen Matrix-Vektor-Multiplikationen, und niedriger Ordnung r = 1 − 4 in Frage. Eine weitere wesentliche Einschränkung besteht in der generischen Steifheit des Systems. Die Systemmatrix Ah hat in Abhängigkeit von der (gleichförmigen) Gitterfeinheit h die Kondition κ2 (Ah ) ≈ h−2 . Bei expliziten Zeitschrittschemata sind also einschneidende Schrittweitenrestriktionen einzuhalten, welche deren Verwendung in der Regel verbietet. Der formale Vorteil der expliziten Verfahren, daß in den einzelnen Zeitschritten keine impliziten Gleichungssysteme zu lösen sind, wird besonders in höheren Raumdimensionen (d = 2, 3) durch die hohe Zahl von durchzuführenden Zeitschritten (besonders bei Verwendung lokal verfeinerter Ortsgitter) schnell aufgehoben. Beispiel numerischer Instabilität: Wir wollen dies anhand einer einfachen Modellsituation illustrieren. Die eindimensionale, homogene Version der ARWA (5.0.1) ∂t u − ∂x2 u = 0 in Ω = (0, 1), u|∂Ω = 0, u|t=0 = u0 (5.0.6) wird auf einem äquidistanten Gitter 0 = x0 < ... < xn < ... < xN +1 = 1 mit Hilfe zentraler Differenzenquotienten 2. Ordnung, n o ∂x2 u(xn , t) ≈ h−2 Un−1 (t) − 2Un (t) + Un+1 (t) . diskretisiert. Die Vektorfunktion Uh (t) = (Un (t))N n=1 genügt dann dem System gewöhnlicher Differentialgleichungen U̇n (t) − h−2 {Un−1 (t) − 2Un (t) + Un+1 (t)} = 0 , wobei bei Berücksichtigung der Randbedingungen U0 ≡ UN +1 ≡ 0 gesetzt ist. Die Anfangswerte 185 sind naturgemäß Un (0) = u0 (xn ). Dies kann kompakt geschrieben werden als U̇h + Ah Uh (t) = 0 , t ≥ 0, mit der (N × N )-Matrix Ah = h−2 −2 1 0 1 Uh (0) = U 0 , 0 −2 .. .. . . (5.0.7) .. . . −2 1 1 −2 Diese Matrix hat, wie wir bereits wissen, die Eigenwerte 0 < λ1 ≤ ... ≤ λN = 4 + O(h2 ), h2 (5.0.8) d.h.: Das nach Ortsdiskretisierung entstandene System (5.0.7) wird für kleines h zunehmend steif mit Steifigkeitsrate κ = O(h−2 ). Beim expliziten Euler1 -Schema ( Polygonzugmethode“) ” ist z.B. aus Stabilitätsgründen die Schrittweitenbedingung −λn k ∈ [−2, 0] ⇒ k ≤ 21 h2 (5.0.9) einzuhalten. Diese Schrittweitenbeschränkung für explizite Verfahren hat entscheidende praktische Bedeutung. Wir wollen das Phänomen der numerischen Instabilität illustrieren. Dazu betrachten wir als einfachstes explizites Zeitschrittschema das klassische Euler-Verfahren (Polygonzugmethode) mit äquidistanter Schrittweite k . Dies führt auf die folgenden Differenzengleichungen für die Approximationen Unm ≈ u(xn , tm ) : Unm+1 = Unm + Für k = h2 ist dann k m m m U − 2U + U n n+1 . h2 n−1 (5.0.10) m m Unm+1 = Un−1 − Unm + Un+1 . Im Fall oszillierender Anfangsdaten u0n = (−1)n ergibt sich Un1 = (−1)n−1 − (−1)n + (−1)n+1 = −3(−1)n = −3Un0 , und bei Fortsetzung dieses Arguments: Unm = (−3)m Un0 , m ≥ 1, n = 1, ..., N. (5.0.11) Dieses Verhalten bedeutet numerische Instabilität“. Es mag unrealistisch erscheinen, eine oszil” lierende Anfangsbedingung der Art Un0 = (−1)n anzunehmen, doch bedingt durch Rundungs- 1 Leonhard Euler (1707-1783), geb. in Basel: universeller Mathematiker und Physiker; bedeutendster und produktivster Mathematiker seiner Zeit; wirkte in Berlin und St. Petersburg; Arbeiten zu allen mathemischen Gebieten seiner Zeit. 186 Verfahren für parabolische Probleme fehler könnte gelten Un0 = Vn0 + ε(−1)n (5.0.12) mit glatten“ exakten Anfangsdaten V 0 . Wegen der Linearität der betrachteten Differenzen” gleichungen folgt Unm = Vnm + ε(−3)m (−1)n , (5.0.13) so daß die anfänglich kleinen Anfangsstörungen schnell anwachsen. Z.B. ist diese für ε = 10−15 > 3−32 bereits nach nur 32 Zeitschritten auf Größe ≈ 1 angewachsen und zwar unabhängig von der Größe von h . ii) Rothe-Methode“: Bei der Rothe2 -Methode wird die Differentialgleichung als gewöhnliche ” Differentialgleichung für eine Hilbertraum-wertige Funktion U (t) ∈ V aufgefaßt und zunächst mit einem A-stabilen Verfahren in der Zeit diskretisiert. Bei Verwendung z.B. des impliziten Euler-Schemas ergibt sich eine Folge von speziellen Randwertaufgaben U m + kLU m = U m−1 + kf m , m ≥ 1, U 0 (x) = u0 (x) . Diese Probleme werden nun nacheinander auf möglicherweise wechselnden, dem Lösungsverlauf angepaßten Ortsgittern diskretisiert. Das Problem ist dabei der adäquate Transfer der jeweiligen Startlösung U m−1 vom alten auf das neue Ortsgitter. Hier zeigt sich wieder der systematische Vorteil einer Finite-Elemente-Galerkin-Methode, bei der sich ganz automatisch als richtige Wahl die L2 -Projektion von U m−1 auf das neue Gitter ergibt. iii) Globale Orts-Zeit-Diskretisierung: Ähnlich wie bei den Transportproblemen könnte auch bei der Wärmeleitungsgleichung eine simultane Diskretisierung (etwa mit einem FiniteElemente-Galerkin-Verfahren) auf einem unstrukturierten Gitter der ganzen (x, t)-Ebene erfolgen. Dieser theoretisch durchaus attraktive Ansatz wird aber bei höher dimensionalen Problemen wegen der globalen Kopplung aller Unbekannten sehr rechenaufwendig und spielt daher bei parabolischen Problemen in der Praxis keine wesentliche Rolle. Im folgenden Abschnitt werden wir Differenzenapproximationen in Verbindung mit der Linienmethode betrachten. Die Rothe-Methode wird in Verbindung mit Finite-Elemente-Verfahren im Ort diskutiert. Dies mündet dann auch ohne Probleme in Galerkin-Diskretisierungen simultan in Ort und Zeit, den sog. unstetigen“ oder stetigen“ Galerkin-Verfahren (sog. dG(r)-“ ” ” ” oder cG(r)-Verfahren“). ” 2 Erich Rothe (1895-1988): deutscher Mathematiker; Promotion und Habilitation in Berlin (1928), danach Assistent in Breslau, nach dem Krieg Prof. an der University of Michigan, USA. 5.1 Differenzenverfahren für parabolische Probleme 187 5.1 Differenzenverfahren für parabolische Probleme 5.1.1 Zeitschrittverfahren Wir beginnen mit der Diskussion der Linienmethode“ zur Diskretisierung von parabolischen ” ARWAn der Art ∂t u + Lu = f in QT := Ω × I, u|∂Ω = 0, u|t=0 = u0 , (5.1.14) mit L := −a∆ auf einem beschränkten (regulär berandeten) Gebiet Ω ⊂ R2 und einem Zeitintervall I = [0, T ] . Der Einfachheit halber wird die rechte Seite f gelegentlich zu Null gesetzt. Ortsdiskretisierung von (5.1.14) mit einem der üblichen Differenzenverfahren (z.B. dem 5Punkte-Operator mit geeigneter Randapproximation) führt auf ein System gewöhnlicher Differentialgleichungen U̇h (t) + Ah Uh (t) = 0, t > 0, Uh (0) = U 0 , (5.1.15) für den Vektor Uh (t) ∈ RN der Knotenwerte. Da die Eigenwerte der Systemmatrix Ah alle reell sind (oder wenigstens nahe an der rellen Achse liegen), käme zur stabilen Integration des Systems (5.1.15) jede A(0)-stabile Formel in Frage. Dabei muß aber der hohe numerische Aufwand bei der Durchführung komplizierter impliziter Verfahren hoher Ordnung berücksichtigt werden. Durch Übertragung der klassischen Zeitschrittformeln für gewöhnliche Differentialgleichungen auf das System (5.1.15) erhalten wir unter Benutzung der oben eingeführten Bezeichnungen die folgenden einfachsten Einschrittverfahren: 1) Explizites Euler-Verfahren (Polygonzugmethode): k−1 {Uhm − Uhm−1 } + Ah Uhm−1 = f m−1 , m ≥ 1, 2) Implizites Euler-Verfahren: k−1 {Uhm − Uhm−1 } + Ah Uhm = f m , m ≥ 1, 3) Crank3 -Nicolson4 -Verfahren (Trapezregel): k−1 {Uhm − Uhm−1 } + 12 Ah (Uhm + Uhm−1 ) = 21 k(f m + f m−1 ), m ≥ 1, und die Zweischrittverfahren: 4) BDF(2)-Verfahren (Rückwärtsdifferenzenformel): m 1 −1 2 k {3Uh − 4Uhm−1 + Uhm−2 } + Ah Uhm = f m, m ≥ 2, 5) Mittelpunkts-Verfahren: m 1 −1 2 k {Uh 3 − Uhm−2 } + Ah Uhm−1 = f m−1 , m ≥ 2, John Crank (1916-): englischer Mathematiker; Prof. an der Brunel University, Uxbridge, England; Beiträge zur Numerik partieller Differentialgleichungen, bekannt durch das Crank-Nicolson-Verfahren“. ” 4 Phyllis L. Nicolson (1917-1968): englische Physikerin; Lecturer an der Univ. Leeds und an der Univ. Manchester; bekannt durch das Crank-Nicolson-Verfahren“. ” 188 Verfahren für parabolische Probleme 6) Simpson-Verfahren: m 1 −1 2 k {Uh − Uhm−2 } + 32 Ah {Uhm + 4Uhm−1 + Uhm−2 } = f m−1 , m ≥ 2. Als Startwerte werden gewöhnlich (im Fall glatter Anfangsdaten) einfach die Restriktionen Un0 = u0 (an ) verwendet. Bei den Zweischrittverfahren wird der zweite erforderliche Startwert Uh1 durch Anwendung einer Einschrittformel entsprechender Ordnung gewonnen. Wegen ihrer inhärenten Instabilität (triviales Stabilitätsgebiet) kommen die Mittelpunktsformel und die Simpson-Formel für die praktische Anwendung nicht in Frage. Wie bei der Analyse von Differenzenverfahren üblich verwenden wir den Abschneidefehler“ ” m = (τ m )N τh,k n n=1 der Differenzenformeln. Diesen erhält man wieder durch formales Auswerten der Differenzenformeln auf der exakten Lösung: m := um − F (um , um−1 , um−2 ). k τh,k Bei einer Ortsdiskretisierung der Ordnung p verhält sich der Abschneidefehler dann gemäß m τh,k = O(hp + kq ), wobei q die Ordnung“ des Zeitschrittverfahrens ist. Von der Fehleranalyse der Zeitschrittverfah” ren für gewöhnliche Differentialgleichungen wissen wir bereits, daß die einfachen Euler-Verfahren die Ordnung q = 1 und das Crank-Nicolson- sowie das BDF(2)-Verfahren die Ordnung q = 2 haben. Später werden wir noch Verfahren der Ordnung q = 3, 4 kennenlernen. Bei der Analyse dieser Zeitschrittschemata für parabolische Probleme ist die genaue Abhängigkeit des Abschneidefehlers von der örtlichen und zeitlichen Regularität der Lösung interessant. Hilfssatz 5.1 (Konsistenz): Für die ARWA (5.1.14) genügen die Abschneidefehler der betrachteten Differenzenverfahren den folgenden (scharfen) Abschätzungen: i) Explizites und implizites Euler-Verfahren: m | ≤ max |τhm | + 21 k max |∂t2 u| ; max |τh,k Q̄T Q̄T Q̄T (5.1.16) ii) Crank-Nicolson-Verfahren: m | ≤ max |τhm | + max |τh,k max |∂t3 u| ; (5.1.17) m | ≤ max |τhm | + 32 k2 max |∂t3 u| . max |τh,k (5.1.18) Q̄T Q̄T 1 2 12 k Q̄T iii) BDF(2)-Verfahren: Q̄T Q̄T Q̄T Dabei ist τhm = O(h2 ) der Abschneidefehler der Ortsdiskretisierung. Beweis: Der Abschneidefehler der Ortsdiskretisierung genügt im allgemeinen der Abschätzung |τhm | = |Lum − Lh um | ≤ ch2 M4m (u), wobei Lh der Ortsdifferenzenoperator ist und M4 (u) := maxΩ̄ |∇4 um | . Speziell in einer Raum- 5.1 Differenzenverfahren für parabolische Probleme 189 dimension mit Ω = (0, 1) gilt |τhm | = |∂x2 um − Lh um | ≤ 4 m 1 2 12 h max |∂x u |. [0,1] i) Für die explizite Euler-Formel gilt |k −1 m (u − u m−1 m−1 ) + Lh u Z −1 | = k Z = k−1 Z ≤ k−1 ≤ k−1 Z tm tm−1 tm tm−1 tm tm−1 tm tm−1 ∂t u dt + Lh um−1 ∂t u dt − ∂t um−1 − Lum−1 + Lh um−1 ∂t u − ∂t um−1 ds + |Lum−1 − Lh um−1 | (t − tm−1 ) dt max |∂t2 u| + |τhm−1 | [tm−1 ,tm ] Es folgt m | ≤ 12 k max |∂t2 u| + max |τhm−1 |. max |τh,k Q̄T Q̄T Q̄T Dieselbe Abschätzung gilt auch für die implizite Euler-Formel. ii) Für die Crank-Nicolson-Formel gilt |k −1 m m−1 (u − u )+ m 1 2 Lh (u +u m−1 Z −1 )| = k tm tm−1 ∂t u dt − 12 (∂t um + ∂t um−1 ) + 12 (Lum − Lh um ) + 21 (Lum−1 − Lh um−1 ) Z tm −1 1 (t − t )(t − t ) dt ≤k max |∂t3 u| m m−1 2 + tm−1 m−1 m 1 |) 2 (|τh | + |τh [tm−1 ,tm ] Wir erhalten damit m max |τh,k |≤ Q̄T 1 2 12 k max |∂t3 u| + max |τhm |. Q̄T Q̄T iii) Für die BDF(2)-Formel gilt m 1 −1 2 k {3u − 4um−1 + um−2 + Lh um } = 12 k−1 {3um − 4um−1 + um−2 − 2k∂t um } + Lh um − Lum . Taylor-Entwicklung um tm liefert 3um − 4um−1 + um−2 − 2k∂t um = 43 k3 ∂t3 u(·, η m ) 190 Verfahren für parabolische Probleme mit gewissen Zwischenstellen η m ∈ [tm−2 , tm ] . Damit erhalten wir m | ≤ 32 k2 max |∂t3 u| + max |τhm |. max |τh,k Q̄T Q̄T Q̄T Dies vervollständigt den Beweis. Q.E.D. Die Lösung der ARWA (5.1.14) besitzt die explizite Darstellung u(x, t) = ∞ X u0n v (n) (x)e−λn t , n=1 (x, t) ∈ QT , (5.1.19) mit den Eigenwerten und (orthonormierten) Eigenfunktionen des regulären elliptischen“ Ope” rators −a∆ : V ⊂ L2 (Ω) → L2 (Ω) , 0 < λ1 < ... ≤ λn ≤ ... (n ∈ N), v (n) (x) ∈ V : −a∆v (n) = λn v (n) , und den Entwicklungskoeffizienten der Startwerte u0 (x) = ∞ X u0n v (n) (x) , u0n = (u0 , v (n) )Ω . n=0 Diese Darstellung läßt sich wegen der gleichmäßigen Konvergenz der Reihen wie folgt umformen: u(x, t) = = = ∞ X ∞ X u0n v (n) (x) n=1 ∞ X i i i λn t (−1) i! ∞ ∞ iX X it (−1) u0n λin v (n) (x) = i! n=1 i=0 i=0 ∞ ∞ ∞ X i i X X it 0 i (n) i it (−1) ∆ un ∆ v (x) = u0n v (n) (x) (−1) i! n=1 i! n=1 i=0 i=0 ∞ X i1 0 t∆ 0 i (−1) i=0 i! (−t∆) u (x) =: e u (x). Die Definition der Operatorfunktion et∆ über eine konvergente Taylor-Reihe läßt sich auf beliebige analytische Funktionen übertragen. Wir betonen, daß eine solche kompakte Lösungsdarstellung nur im Fall zeitlich konstanter Koeffizienten a möglich ist. Auf dem diskreten Zeitgitter gilt dann u(·, tm ) = ek∆ u(·, tm−1 ), m ∈ N. (5.1.20) Dies legt es nahe, den Zeitschritt tm−1 → tm mit Hilfe einer rationalen Approximation R(z) ≈ ez der Exponentialfunktion der Ordnung“ q + 1 anzusetzen, ” P (z) = ez + O(|z|q+1 ), z ≤ 0, (5.1.21) R(z) = Q(z) mit geeigneten Polynomen P ∈ Pr und Q ∈ Ps , wobei natürlich Q auf z ∈ R− keine Nullstellen haben darf. Das Diskretisierungsschema lautet dann Uhm = R(−kAh )Uhm−1 bzw. Q(−kAh )Uhm = P (−kAh )Uhm−1 . (5.1.22) 5.1 Differenzenverfahren für parabolische Probleme 191 Die oben betrachteten Einschrittverfahren lassen sich in diesen Rahmen einordnen gemäß: Expliziter Euler“ : ” Impliziter Euler“ : ” Crank-Nicolson“ : ” R(z) = 1 + z , R(z) = (1 − z)−1 , R(z) = (1 + 21 z)(1 − 12 z)−1 . Durch die Ordnungsbedingung ez Qrs (z) − Prs (z) = O(|z|r+s+1 ), z ≤ 0, (5.1.23) für den Ansatz Prs ∈ Pr , Qrs ∈ Ps wird man auf die sog. Padé5 -Schemata“ geführt. Diese ” sind eindeutig bestimmt und werden gewöhnlich in der sog. Padé-Tafel“ dargestellt: ” 1 1 1−z+ z 2 2 1+z 1 1 1+ z 2 1 1− z 2 1 1+ z 3 2 1 1− z+ z 2 3 6 1 1+z+ z 2 2 1 2 1 1+ z+ z 2 3 6 1 1− z 3 1 1 1+ z+ z 2 2 12 1 1 1− z+ z 2 2 12 ... ... ... ... 1 1 1 1−z 1 1 1+x+ z 2 + z 3 2 6 1 3 1 1 1+ z+ z 2 + z 3 4 4 24 1 1− z 4 ... ... ... ... ... 1 1 3 1 z 1+ z+ z 2 + 2 10 120 1 1 2 1 3 1− z+ z − z 2 10 120 ... ... ... ... . Offensichtlich sind alle bisher betrachteten Einschrittschemata Padé-Formeln und damit in diesem Sinne ordnungsoptimal. Aus der Padé-Tafel erhalten wir nun weitere Zeitschrittverfahren höherer Ordnung. Dabei kommen aus Ökonomiegründen nur die diagonalen“ oder subdiago” ” nalen“ Padé-Schemata in Frage; z.B. die folgenden impliziten Verfahren 3. bzw. 4. Ordnung: (I + (I + 13 kAh )Uhm = (I − 32 kAh + 61 k2 A2h )Uhm−1 1 2 kAh + m 1 2 2 12 k Ah )Uh = (I − 1 2 kAh + m−1 1 2 2 12 k Ah )Uh (q = 3), (q = 4). Wir bemerken für die weitere Analyse, daß eine rationale Approximation R(z) der Exponentialfunktion (der Ordnung r ≥ 1 ) die folgende Eigenschaft hat: |R(z)| ≤ eδz , −1 ≤ z ≤ 0, (5.1.24) mit einem geeigneten δ > 0 . Die Wirkung der Zeitschrittschemata des Typs (5.1.22) läßt sich mit Hilfe der Spektralzerlegung der Matrix Ah wieder beschreiben durch: Uhm = N X n=1 5 Uj0 R(−kλn )m v (n) , m ≥ 1, Henri Eugène Padé (1785-1836): französischer Mathematiker; Prof. in Poitiers und Bordeaux; entwickelte die sog. Padé-Approximation. 192 Verfahren für parabolische Probleme bzw. (mit der Euklidischen Vektornorm | · | ) |Uhm |2 = N X n=1 |Un0 |2 |R(−kλn )|2m . Ihr qualitatives Verhalten läßt sich also weitgehend durch die Eigenschaften der verwendeten rationalen Funktion R(z) charakterisieren. Wir stellen einige wichtige Bedingungen für die folgende Analyse zusammen. (i) Die A-Stabilität |R(z)| ≤ 1 , z ≤ 0. sichert die Stabilität“ der Zeititeration supm≥0 |Uhm | < ∞ . ” (ii) Die strenge A-Stabilität |R(z)| ≤ 1 − ck , z ≤ −1, sichert die Beschränktheit der diskreten Lösung auch im Fall inhomogener rechter Seiten, supm≥0 |Uhm | < c supm≥0 |f m | . (iii) Die starke A-Stabilität |R(z)| ≤ κ < 1 , z ≤ −1 , sichert die (exponentielle) Dämpfung hochfrequenter“ Lösungsanteile und macht das Verfahren ” robust gegenüber lokalen Störungen der Daten ( Glättungseigenschaft“). ” (iv) Zur korrekten Wiedergabe von Schwingungsprozessen (im Ort oszillierenden Lösungen) sollte R(±i) ∼ 1 sein, um diese Schwingungen möglichst wenig zu dämpfen ( numerischen Dissipativität“). ” Offensichtlich können nur implizite Verfahren die gelisteten Eigenschaften haben. Das implizite Euler-Schema (und genauso alle sub-diagonalen Padé-Schemata) ist stark A-stabil (mit √ Limes κ = 0 ), neigt aber zur Überdämpfung: |(1 + i)−1 | = 1/ 2 . Dagegen ist das CrankNicolson-Schema (und genauso alle diagonalen Padé-Schemata) nur einfach A-stabil, 1 − 21 z = 1, lim z→−∞ 1 + 1 z 2 besitzt aber praktisch auch keine numerische Dissipation: |(1 − i/2)(1 + i/2)−1 | = 1 . Die fehlende starke A-Stabilität hat nachteilige Konsequenzen im Fall von irregulären Anfangswerten u0 (z.B.: lokalen Temperaturspitzen). Die durch diese Anfangsdaten induzierten hochfrequenten Fehleranteile werden durch das Crank-Nicolson-Schema nur unzureichend ausgedämpft, so daß sich ein unphysikalisches Lösungsverhalten zeigen kann. Es sei daran erinnert, daß der kontinuierliche Differentialoperator stark dämpfend ist: ku(t)k ≤ e−λmin t ku0 k , t ≥ 0, mit dem kleinsten Eigenwert des Ortsoperators, λmin > 0 . Bei Verwendung des Crank-Nicolson-Schemas für Rechnungen über lange Zeiträume sollte es stabilisiert werden, um wenigstens strenge A-Stabilität zu sichern. Dies kann ohne Reduktion 5.1 Differenzenverfahren für parabolische Probleme 193 der Konsistenzordnung durch einen leichten k-abhängigen Schift erfolgen: I + 21 (1 + ck)kAh Uhm = I − 21 (1 − ck)kAh Uhm−1 . (5.1.25) Verfahren höherer Ordnung erfordern die Invertierung der Operatorfunktion Q(−kAh ) . Dies ist in der Regel zu teuer. Einerseits ist die Besetzungstruktur von Q(−kAh ) selbst bei Polynomgrad j = 2 bereits deutlich dichter als die von Ah , andererseits würde das Arbeiten mit der Linearfaktorzerlegung Q(z) = (z − µ)(z − µ̄) die Verwendung (kostspieliger) komplexer Arithmetik erfordern. Geeignet wärenQdagegen Schemata, bei denen das Nennerpolynom in reelle Linearfaktoren zerfällt: Q(z) = sj=1 (z − µj ), µj ∈ R . Durch diesen Ansatz sollten sich systematisch Verfahren mit günstigeren Eigenschaften als die der einfachen Basisschemata gewinnen lassen. Ein Beispiel für einen solchen Ansatz ist die parameter-abhängige rationale Funktion (1 + αθ ′ z)(1 + βθz)2 = ez + O(|z|3 ), (1 − αθz)2 (1 − βθ ′ z) Rθ (z) = z ≤ 0, √ mit θ = 1 − 12 2 = 0, 292893..., θ ′ = 1 − 2θ und beliebigen Werten α ∈ ( 12 , 1], β = 1 − α . Das auf dieser rationalen Funktion basierende Schema ist wegen |Rθ (z)| < 1 , z < 0 , β < 1. α lim |Rθ (z)| = z→−∞ stark A-stabil. Die Entwicklung Rθ (z) = 1 + z + 12 z 2 {1 − (α − β)(2θ 2 − 4θ + 1)} + 16 r(θ, α)z 3 + O(|z|4 ) zeigt, daß für die obige Parameterwahl von der Ordnung O(k2 ) ist. Für die Güte dieser Approximation im Vergleich zu der des Crank-Nicolson-Schemas ist die Größe der führenden Fehlerkonstante r(α) bestimmend. Eine Taylor-Entwicklung ergibt 2 3 r(θ, α) = (18θ ′ + 24θ 3 )α3 + (42θ 2 θ ′ + 12θθ ′ + 30θ ′ )α2 β 2 3 2 3 + (12θ 3 + 30θ 2 θ ′ + 24θθ ′ + 6θ ′ )αβ 2 + (6θ 2 θ ′ + 12θθ ′ + 6θ ′ ). Im betrachteten Bereich {0, 5 < α ≤ 1} ist |r(θ, α)| ≤ 0, 5 . Damit ist die Fehlerkonstante dieser 1 der Approximation nur in akzeptablem Maß größer als die entsprechende Fehlerkonstante 12 Trapezregel. Das zugehörige Verfahren läßt sich in Form eines Teilschrittschemas schreiben (hier für den inhomogenen Fall), Teilschritt-θ-Verfahren (Fractional-Step-θ-Method): (I + αθkAh )U m−1+θ = (I − βθkAh )U m−1 + θkfhm−1 , ′ (I + βθ kAh )U m−θ ′ = (I − αθ kAh )U m−1+θ (I + αθkAh )U m = (I − βθkAh )U m−θ + ′ + θ kfhm−θ , θkfhm−θ . (5.1.26) (5.1.27) (5.1.28) Jeder der Teilschritte hat die Form eines geschifteten Crank-Nicolson-Schritts, so daß der Gesamtaufwand pro Zeitschritt dem von drei Crank-Nicolson-Schritten entspricht. Für den speziellen Wert α = (1 − 2θ)(1 − θ)−1 = 0, 585786... 194 Verfahren für parabolische Probleme ist αθ = βθ ′ , so daß die zu invertierenden Matrizen in den drei Teilschritten übereinstimmen, was z.B. bei der direkten Lösung der Gleichungssysteme ausgenutzt werden kann. Eine genaue Analyse des Abschneidefehlers des FS-Schemas zeigt, daß seine führende Fehlerkonstante nur wenig größer als die von drei kombinierten Crank-Nicolson-Schritten ist: τkm = ĉk2 + O(k3 ), ĉF S ∼ ĉ3×CN . Dies bedeutet, daß das FS-Schema gegenüber dem CN-Schema bzgl. Genauigkeit und Aufwand gleichwertig ist, aber über eine höhere Robustheit verfügt. Das FS-Schema hat sich in der Praxis als besonders geeignet zur Behandlung von parabolischen Problemen mit nicht notwendig regulären Daten und geringer natürlicher Eigendissipation erwiesen. 5.1.2 Stabilität und Konvergenz Wir wollen nun die Stabilität und Konvergenz von Diskretisierungen der Wärmeleitungsgleichung untersuchen. Dabei bedienen wir uns exemplarisch verschiedener Techniken, die alle diskrete Analoga von Analysemethoden beim kontinuierlichen Problem sind. i) Maximumprinzipmethode“ ” Eine einfache, direkte Variante der Maximumprinzipmethode kann bei gewissen expliziten Differenzenschemata angewendet werden. Die Ortsdiskretisierung führe auf eine M-Matrix Ah . Für die explizite Euler-Formel Uhm = Uhm−1 − kAh Uhm−1 gilt dann wegen der Diagonaldominanz von Ah : |Unm | = |1 − kann ||Unm−1 | + k kann ||Unm−1 | + ≤ |1 − X ν6=n |anν ||Uνm−1 | kann max |Uνm−1 |. ν Unter der Schrittweitenbedingung 2 k ≤ max{a−1 nn } ∼ ch (5.1.29) n folgt daher die L∞ -Stabilität des Verfahrens max |Unm | ≤ max |Unm−1 | ≤ ... ≤ max |Un0 |, n n n m ≥ 1. (5.1.30) Im Fall des 5-Punkte-Schemas ist ann = 4h−2 , so daß die Stabilitätsbedingung (5.1.29) die Form k ≤ 41 h2 (5.1.31) erhält. Satz 5.1 (Explizites Euler-Verfahren): Unter der Schrittweitenbedingung (5.1.29) gilt für 5.1 Differenzenverfahren für parabolische Probleme 195 das explizite Euler-Verfahren die Konvergenzabschätzung m 2 m 1 max |Uh − u(·, tm )| ≤ T 2 k max |∂t u| + max |τh | . QT Q̄T Q̄T (5.1.32) mit dem örtlichen Abschneidefehler τhm = O(hq ) . Beweis: Der Fehler em := u(·, tm ) − U m genügt der Gleichung m k−1 (em − em−1 ) + Ah em = τh,k mit dem Abschneidefehler m | ≤ 12 k max |∂t2 u| + max |τhm | . max |τh,k Q̄T Q̄T Q̄T Das bei der Herleitung der Stabilitätsbedingung (5.1.29) verwendete Argument liefert m | max |em | ≤ max |em−1 | + k max |τh,k Ω̄ Ω̄ Q̄T Durch Iteration dieser Abschätzung folgt weiter wegen e0 = 0 : max |em | ≤ k Ω̄ ≤ m X µ |τh,k | µ=1 2 m 1 2 tm k max |∂t u| + tm max |τh |. Q̄T Q̄T Dies impliziert die behauptete Fehlerabschätzung. Q.E.D. Eine wichtige Eigenschaft des kontinuierlichen Wärmeleitungsoperators ist seine inverse ” Monotonie“, d.h.: Lösungen zu nicht-negativen Anfangsdaten und rechter Seite bleiben nichtnegativ. Diese Eigenschaft überträgt sich auf die diskretisierten Probleme, wenn die Systemmatrix Ah M-Matrix ist. (i) Für das explizite Euler-Verfahren folgt unter der Schrittweitenbedingung (5.1.29) aus Unm−1 ≥ 0 und fnm ≥ 0 notwendig auch X Unm = (1 − kann )Unm−1 + k |anν |Uνm−1 + kfnm ≥ 0. ν6=n (ii) Für das implizite Euler-Verfahren ist im Falle Unm−1 ≥ 0 und fnm ≥ 0 (Ih + kAh )Uhm = Uhm−1 + kfhm ≥ 0. Da mit Ah natürlich auch Ih + kAh M-Matrix ist, gilt (Ih + kAh )−1 ≥ 0 . Es folgt Uhm ≥ 0 . In beiden Fällen ist also auch das diskrete Schema invers-monoton“. Dies ist i.a. für das Crank” Nicolson-Schema nicht der Fall. ii) Von Neumannsche Methode“ (Fourier-Methode) ” Wir beschränken uns auf den örtlich eindimensionalen Fall mit Ω = (−π, π) , ∂t u − ∂x2 u = 0 in QT , 196 Verfahren für parabolische Probleme mit periodischen“ Dirichlet-Randbedingungen ” u(−π, t) = u(π, t), t ≥ 0. In diesem Fall kann die Lösung der ARWA nach trigonometrischen Funktionen entwickelt werden (Fourier-Entwicklung). In komplexer Schreibweise lautet dies u(x, t) = ∞ X 2 a0ν eiνx eν t , (5.1.33) ν=0 mit den Entwicklungskoeffizienten a0ν der Anfangsbedingung. Auf einem äquidistanten Punktgitter {xn = −π + nh, n = 0, ..., N = 2π/h} machen wir für die diskrete Lösung Uhm = {Unm , n = 0, ..., N }, m ≥ 0, den analogen Entwicklungsansatz Unm = N X iνnh am ν e =: N X a0ν ωνm eiβν n (5.1.34) ν=0 ν=0 mit βν := νh und zu bestimmenden Parametern ων ∈ C . Wir fragen nach der Stabilität für m → ∞ der Differenzendiskretisierung bzgl. der diskreten Spektralnorm kUhm kh := N X n=1 2 |am n| 1/2 . Die Wirkung des (linearen) Differenzenschemas kann für jede einzelne Fourier-Komponente separat untersucht werden. Gesucht sind Bedingungen an k und h , unter denen |ων | ≤ 1 ist für alle möglichen βν . Dann liegt Stabilität vor in dem Sinne, daß kUhm k2h = N X n=1 |a0n |2 |ων |2m ≤ N X n=1 |a0n |2 = kUh0 k2h . (5.1.35) Wir führen diese Analyse wieder exemplarisch für das explizite Euler-Schema durch. Mit r := kh−2 gilt m m Unm+1 = rUn−1 + (1 − 2r)Unm + rUn+1 . Einsetzen von Unm := ω m eiβn ergibt ω m+1 eiβn = rω m eiβ(n−1) + (1 − 2r)ω m eiβn + rω m eiβ(n+1) , und nach Vereinfachung ω = re−iβ + (1 − 2r) + reiβ . Es liegt Stabilität vor, wenn |ω| ≤ 1 für beliebiges β . Unter Ausnutzung der Beziehungen eiβ = cos(β) + i sin(β), cos(β) = 1 − 2 sin2 ( 12 β), folgt ω = r eiβ + e−iβ + (1 − 2r) = r (cos(β) + i sin(β) + cos(β) − i sin(β)) + (1 − 2r) = r 2 − 4 sin2 ( 12 β) + (1 − 2r) = 1 − 4r sin2 ( 12 β). 5.1 Differenzenverfahren für parabolische Probleme 197 Stabilität liegt vor für −1 ≤ 1 − 4r sin2 ( 21 β) ≤ 1 ∀β, was äquivalent ist zu r sin2 ( 12 β) ≤ 12 . Dies führt auf die schon bekannte Stabilitätsbedingung k ≤ 21 h2 . (5.1.36) Die Fourier-Methode kann auch für exotischere“ Differenzenformeln angewendet werden. ” Wir demonstrieren dies anhand des klassischen Du Fort6 -Frankel7 -Verfahren“: ” 1 1 m m Unm+1 − Unm−1 − 2 Un−1 = 0. (5.1.37) − (Unm+1 + Unm−1 ) + Un+1 2k h Sein Abschneidefehler verhält sich wie max |τnm | = O(k2 /h + k2 + h2 ). n,m (5.1.38) Die von Neumannsche Stabilitätsanalyse liefert für die Verstärkungsfaktoren die Darstellung ( r := k/h2 ) p 2r cos(β) ± 1 − 4r 2 sin2 (β) . (5.1.39) ω= 1 + 2r Dies impliziert , daß |ω| ≤ 1 für alle β , d.h.: Das DuFord-Frankel-Schema ist unbedingt stabil. Analog zeigt man, daß das sog. Richardson-Verfahren“ ” 1 1 m m (Unm+1 − Unm−1 ) − 2 (Un−1 − 2Unm + Un−1 )=0 (5.1.40) 2k h unbedingt instabil ist. Obwohl es die optimale“ Konsistenzordnung O(h2 + k2 ) besitzt, ist ” es also praktisch unbrauchbar. Dies ist nicht verwunderlich, da dieses Schema ein Derivat der Mittelpunktsregel mit dem Stabilitätspolynom π(z, hλ) und den Wurzeln z1,2 = hλ ± (h2 λ2 + 1)1/2 ist. Die von Neumann’sche Fourier-Methode zur Stabilitätsanalyse von Differenzenschemata ist auf den Fall periodischer Dirichlet-Randbedingungen bzw. den Grenzfall von Ganzraum-Proble” men“ ( Ω = R1 ) beschränkt und erfordert äquidistante Ortsgitter. Für allgemeinere Ortsdiskretisierungen anwendbar ist die im folgenden präsentierte Spektralmethode“. ” iii) Spektral-Methode: Die symmetrische, positiv definite Matrix Ah habe die Eigenwerte und zugehörigen (l2 -orthonormierten) Eigenvektoren 0 < λ1 ≤ ... ≤ λN , 6 {w(n) , n = 1, ..., N }. E.C. Du Fort (????-????): ????; Publ. mit S.P. Frankel: Stability conditions in the numerical tratment of parabolic differential equations, Math. Tables and other Aids to Comput. (jetzt Math. Comput.) 7, 135-152 (1953). 7 S.P. Frankel (????-????): ???? 198 Verfahren für parabolische Probleme Jede Gitterfunktion besitzt dann eine Entwicklung der Form Uhm = N X an w(n) , n=1 an = hUhm , w(n) i. Dabei ist das Skalarprodukt h·, ·i für eine FD-Diskretisierung im Ort wieder ein diskretes Analogon der kontinuierlichen L2 -Norm, hv, wi := N X h2n vn wn , n=1 und für eine FE-Diskretisierung gerade diese: hv, wi := (v, w)Ω . Entsprechend sind die zugehörigen Normen kuk := hv, vi1/2 definiert. Wir analysieren im folgenden isoliert den Zeitschrittfehler im Rahmen der Linienmethode. Satz 5.2 (Glättungseigenschaft): Jedes stark A-stabile Einschrittschema vom Typ (5.1.22) der Ordnung r besitzt die Glättungseigenschaft: kUhm − um hk≤c kr 0 ku k, trm h m > 0. (5.1.41) Beweis: Nach Voraussetzung ist supz≥0 |R(−z)| ≤ 1 , limz→∞ |R(−z)| ≤ ω < 1 und |R(−z) − e−z | ≤ c|z|r+1 , 0 ≤ z ≤ 1. O.B.d.A. nehmen wir an, daß |R(−z)| ≤ ω < 1 für z ≥ 1 . Wir verwenden wieder das Spektralargument von oben. Mit den Eigenwerten 0 < λ1 ≤ ... ≤ λN von Ah und einem zugehörigen Orthonormalsystem {w(n) , n = 1, ..., N } von Eigenvektoren gilt wieder für den Anfangswert u0h = N X αn w(n) n=1 die Abschätzung ( τn := kλn ) |Uhm − 2 um h| = N X n=1 = 2 α2n R(−kλn )m − e−mkλn X τn ≤1 ... + X ... . τn >1 Für die erste Summe rechts gilt mit einem geeigneten δ > 0 : X τn ≤1 ... = 2 2 m−1 X X R(−τn )m−1−µ e−µτn α2n R(−τn ) − e−τn τn ≤1 ≤c X τn ≤1 µ=0 τn2r+2 m2 e−2δ(m−1)τn α2n ≤ cm−2r |u0h |2 . 5.1 Differenzenverfahren für parabolische Probleme 199 Für die zweite Summe rechts gilt entsprechend mit einem δ > 0 : o n X X ... ≤ 2 α2n |R(−τn )|2m + e−2mτn τn >1 τn >1 ≤ ce−δm X τn >1 α2n ≤ cm−2r |u0h |2 . Kombination dieser beiden Abschätzungen liefert wegen m = tm /k : 2 |Uhm − um h| ≤c k2r 0 2 |uh | . t2r m Dies vervollständigt den Beweis. (5.1.42) Q.E.D. Das populäre Crank-Nicolson-Schema Uhm = (Ih + 21 kAh )−1 (Ih − 21 kAh )Uhm−1 besitzt als nicht stark A-stabiles Schema nicht die volle Glättungseigenschaft. Wir wollen diesen Defekt anhand einer Modellbetrachtung erläutern. Sei Uh0 = N X α0n v (n) ⇒ n=1 Uhm = N X α0n n=1 1 − kλ /2 m n v (n) . 1 + kλn /2 Die Lösungskomponente zur höchsten Frequenz Λ = λN verhält sich wie ωm = 1 − kΛ/2 m 1 + kΛ/2 ∼ e−tm Λ , was dem Abfall der exakten“ Lösung entspricht. ” (i) Für kΛ < 2 (⇔ k ∼ h2 ) ist |ω| ≤ e−δ , δ > 0, was den korrekten exponentiellen Abfall e−δm impliziert. (ii) Im Fall kΛ ∼ k/h2 ∼ 4/h (⇔ k ∼ h) ist ω∼− 1 − h/2 , 1 + h/2 was oszillierendes Verhalten (−1)m e−hm impliziert. Zur Dämpfung dieser Oszillationen in den hochfrequenten“ Komponenten können folgende ” Strategien verwendet werden: a) Mittelbildung: Ũh1 = 0 1 4 {Uh + 2Uh1 + Uh2 } = N X n=1 α0n n1 4 + 1 1 − 21 kλn 1 1 − 12 kλn 2 o (i) w . + 2 1 + 21 kλn 4 1 + 12 kλn 200 Verfahren für parabolische Probleme Auswertung des Ausdrucks in der Klammer ergibt 1 + kλn + 12 k2 λ2n + 2 − 21 k2 λ2n + 1 − kλn + 41 k2 λ2n 1 = 1 1 2 4(1 + 2 kλn ) (1 + 2 kλn )2 und somit Ũh1 = N X αn . (1 + 21 kλn )2 n=1 b) Euler-Dämpfung: Der Zeitschrittprozeß wird mit zwei impliziten Euler-Schritten mit halber Schrittlänge gestartet. Dies ergibt Ũh1 = N X n=1 α0n 1 1 + 12 kλn 2 w(n) . Satz 5.3 (Gedämpftes Crank-Nicolson-Verfahren): Das durch zwei Euler-Schritte gedämpfte Crank-Nicolson-Verfahren besitzt die Glättungseigenschaft: kUhm − um hk≤c Beweis: Für z ≥ 0 gilt 1 z3 −z 1 − 2 z , ≤c e − 1 1 + 2z 1 + 12 z k2 0 ku k. t2m h −z e − Wir verwenden dies in der folgenden Abschätzung: 2 kUhm − um hk = N X n=1 α2n (5.1.43) 1 z2 ≤c . 1+z 1+z o2 2 n 1 − 1 kλ m 1 n −mkλn 2 − 2 e 1 + 21 kλn 1 + 12 kλn Wir bezeichnen den Inhalt der äußeren Klammer mit σnm und setzen τn := kλn . Es gilt n σnm = e−(m−2)τn e−2τn − 1 − 1 τ m 2 o n 2 o 1 1 −(m−2)τn 2 n − + e − 2 1 + 12 τn 1 + 12 τn 1 + 21 τn 1 1 e−τn + = e−(m−2)τn e−τn − 1 + 21 τn 1 + 12 τn 1 2 m−3 M −3−µ X 1 − 12 τn 1 −µτn 1 − 2 τn e . + e−τn − 1 + 12 τn 1 + 21 τn µ=0 1 + 12 τn i) Fall τn ≤ 2 : 1 1 − 21 τn − 2 τn . ≤ e 1 + 21 τn Dies sieht man wie folgt: Wegen ez ≥ z gilt −1 + ze−z ≤ 0 . Die Funktion f (z) := 1 − z − (1 + z)e−z hat die Eigenschaften f (0) = 0 und f ′ (z) = −1 + ze−z ≤ 0 und folglich f (z) ≤ 0 . 5.1 Differenzenverfahren für parabolische Probleme 201 Damit erschließen wir |σnm | m−3 o n X 3 −mτn /2 −mτn 2 e−µτn /2 τn + τi e ≤c e µ=0 n 1 − e−(m−2)τn /2 o ≤ c e−mτn τn2 + τn3 e−mτn /2 1 − e−τn /2 2 c k ≤ 2 =c 2 . m tm ii) Fall τn > 2 : 1 − τ /2 n ≤ e−2/τn . 1 + τn /2 Damit erschließen wir: n 1o |σnm | ≤ c e−mτn + e−2(m−2)/τn 2 τn m 2 1 o n 1 ≤ c (mτn )2 e−mτn 2 + e−2m/τn m τ n m2 1 k2 ≤c 2 =c 2 . m tm Zusammenfassung der Resultate (i) und (ii) liefert nun: 2 kUhm − um hk ≤c N k4 X 2 αn . t4m (5.1.44) n=1 Dies vervollständigt den Beweis. Q.E.D. Auch die Spektralmethode ist auf den Fall parabolischer Probleme mit zeitunabhängigen, selbstadjungierten Operatoren wie dem Laplace-Operator ∆ beschränkt. Die weitreichendste Analysetechnik ist die sog. Energie-Methode“ (Hilbertraum-Methode), welche auch für Pro” bleme mit unsymmetrischen Operatoren mit zeitabhängigen Koeffizienten anwendbar ist. Wir demonstrieren diese Technik hier aber nur für die vorliegende Modellsituation. iv) Energie-Methode: Wir betrachten das populäre Crank-Nicolson-Schema. Für Funktionen (vn )N n=1 auf einem äquidistanten Quadratgitter sind (v, w)h := hd N X n=1 vn wn , 1/2 kvkh := (v, v)h , diskrete Analoga des L2 -Skalarprodukts und der zugehörigen L2 -Norm. 202 Verfahren für parabolische Probleme Satz 5.4 (Crank-Nicolson-Verfahren): Das Crank-Nicolson-Verfahren hat für hinreichend glatte Lösung u den globalen Diskretisierungsfehler max ku − Uh kh ≤ c(u) T {h2 + k2 } , Q̄T (5.1.45) mit einer Konstante c(u) ≈ maxQ̄T {|∂t3 u| + a|∇4 u|} . Beweis: Für den Fehler em := um − U m gilt m k−1 (em − em−1 ) + 12 Ah (em + em−1 ) = τh,k . Multiplikation dieser Identität mit em + em−1 und Summation über m ergibt m , em + em−1 )h . k−1 {kem k2h − kem−1 k2h } + 12 (Ah (em + em−1 ), em + em−1 )h = (τh,k Der kleinste Eigenwert von Ah ist λ > 0 . Damit erschließen wir m 2 kh , k−1 {kem k2h − kem−1 k2h } + 21 λkem + em−1 k2h ≤ 12 λkem + em−1 k2h + 12 λ−1 kτh,k bzw. m 2 kem k2h ≤ kem−1 k2h + 21 λ−1 kkτh,k kh . Wir summieren nun über µ = m, ..., 1 und erhalten kem k2h ≤ ke0 k2h + 12 λ−1 k m X µ=1 µ 2 kτh,k kh . Mit e0 = 0 und der obigen Abschätzung für den Abschneidefehler folgt schließlich die Behauptung. Q.E.D. 5.2 FE-Galerkin-Verfahren für parabolische Probleme 203 5.2 FE-Galerkin-Verfahren für parabolische Probleme Wir diskutieren nun die Rothe-Methode zur Lösung des Problems ∂t u − ∆u = f in QT = Ω × [0, T ], (5.2.46) mit den Nebenbedingungen u|t=0 = u0 und u|∂Ω = 0 . Da die folgende Analyse exemplarischen Charakter hat, betrachten wir nur das implizite Euler-Schema. Dieses lautet angewendet auf das kontinuierliche Problem (5.2.46) −1 (U m − U m−1 ) − ∆U m = f¯m , km U 0 := u0 , (5.2.47) wobei die rechte Seite im zeitlichen Mittel ausgewertet wird gemäß Z tm m −1 ¯ f (t) dt = f m + O(km ). f := km tm−1 Die Zeitschrittweite km := tm − tm−1 darf hier variieren, um eine möglichst gute Anpassung an die Lösungseigenschaften zu erreichen. Mechanismen zur adaptiven Wahl der Zeitschrittweiten auf der Basis von a posteriori Fehlerabschätzungen werden weiter unten diskutiert. Die einzelnen Zeitschritte seien mit Hilfe eines FE-Verfahrens mit Ansatzräumen Vhm ⊂ V auf möglicherweise von Zeit zu Zeit wechselnden Gittern Tm h diskretisiert: (Uhm , ϕ) + km (∇Uhm , ∇ϕ) = (Uhm−1 , ϕ) + km (f¯m , ϕ) ∀ϕ ∈ Vhm . (5.2.48) Die Varianz der Ortsdiskretisierungen im Verlaufe der Zeititeration ermöglicht die dynamische adaptive Anpassung der Ortsgitter an die momentane Lösungsstruktur. In Operatorschreibweise lautet das Schema (5.2.47) m m−1 m + km Phm f¯m , (Ihm + km Am h )Uh = Ph Uh Uh0 = Ph0 u0 , (5.2.49) mit der L2 -Projektion Phm auf Vhm . Bezüglich der üblichen Knotenbasen {ϕm,n h , n = 1, ..., Nm = m m dim Vh } der Räume Vh läßt sich dies als lineares Gleichungssystem zur Bestimmung der zuNm schreiben. Dazu führen wir zusätzlich zu Massemagehörigen Knotenwertevektoren xm h ∈R trizen, Steifigkeitsmatrizen und Lastvektoren Nm m,j , ϕ ) Mhm := (ϕm,i , h h i,j=1 Nm m,i m,j Am , h := (∇ϕh , ∇ϕh ) i,j=1 Nm ¯m m,j bm h := (f , ϕh ) j=1 m−1 und Vhm ein: auf dem Gitter Tm h noch Transfermatrizen zwischen den Räumen Vh Nm−1 ,Nm m,n Mhm−1,m := (ϕm−1,j , ϕ ) . h h j,n=1 Damit schreibt sich Nm−1 (Uhm−1 , ϕm,n h )= X j=1 m−1,m m−1 xm−1 (ϕm−1,j , ϕm,n xh j h h ) = Mh 204 Verfahren für parabolische Probleme und folglich m−1,m m−1 m xh + km Mhm bm (Mhm + km Am h. h )xh = Mh (5.2.50) Wir wollen dieses Verfahren im folgenden im Hinblick auf Stabilität, Konvergenz sowie a priori und a posteriori Fehlerabschätzung untersuchen. 5.2.1 A priori Konvergenzabschätzungen Der natürliche Ansatz zur Analyse von FE-Diskretisierungen ist die Energie-Methode“. Wir ” geben zunächst einen einfachen Beweis für das implizite Euler-Verfahren unter realistischen Annahmen an die Regularität der Lösung. Wir setzen hm := maxm diam(K), K∈Th k = max km 1≤m≤M m mit um := u(·, t ) . m und em m h := Uh − u Satz 5.5 (Implizites Euler-Verfahren): Für das implizite Euler-Schema in Verbindung mit einer FE-Diskretisierung 2. Ordnung gelten die folgenden Fehlerabschätzungen: i) Für beliebig variierende Ortsdiskretisierung: max 1≤m≤M kem hk ≤ cT 1/2 max 0≤m≤M −1/2 2 {km hm k∇2 um k} Z M X 2 km +c m=1 tm tm−1 k∇∂t uk2 dt 1/2 ; (5.2.51) ii) Im Spezialfall Vhm = Vh gleich für alle m : max 1≤m≤M kem h k ≤ cT 1/2 max 0≤m≤M {h2m k∇2 um k} Z M X 2 +c km m=1 tm tm−1 k∇∂t uk2 dt 1/2 . (5.2.52) 4/3 Die Konvergenzordnung in (5.2.51) ist nicht optimal. Unter der Bedingung hm ≤ ckm ergibt sich aber die zeit-optimale Konvergenzordnung O(km ) . Das optimale Resultat (5.2.52) läßt −1 ≤ κ sich auch unter den weniger einschränkenden Bedingungen Vhm−1 ⊂ Vhm oder h2m km hinreichend klein beweisen. Beweis: Wir bezeichnen mit Rhm u ∈ Vhm die elliptische“ Ritz-Projektion der kontinuierlichen ” Lösung um zum Zeitlevel tm auf den Finite-Elemente-Raum Vhm , definiert durch (∇Rhm v, ∇ϕh ) = (∇v, ∇ϕh ) ∀ϕh ∈ Vhm . (5.2.53) Für deren Fehler gilt kv − Rhm vk + hm k∇(v − Rhm v)k ≤ ch2m k∇2 vk. (5.2.54) Wir betrachten nun zunächst die Differenz ηhm := Uhm − Rhm um . Für beliebiges ϕh ∈ Vhm ist dann unter Ausnutzung der Identität (Uhm − Uhm−1 , ϕh ) + km (∇Uhm , ∇ϕh ) = km (f¯m , ϕh ) 5.2 FE-Galerkin-Verfahren für parabolische Probleme 205 und der Projektionseigenschaft von Rhm : (ηhm − ηhm−1 , ϕh ) + km (∇ηhm , ∇ϕh ) = km (f¯m , ϕh ) − (Rhm um −Rhm−1 um−1 , ϕh ) − km (∇Rhm um , ∇ϕh ) = km (f¯m , ϕh ) − (Rm um −Rm−1 um−1 , ϕh ) h h m − km (∇u , ∇ϕh ). Wir setzen nun ϕh := ηhm und erhalten mit Hilfe der Identität (a − b)a = 12 a2 − 12 b2 + 21 (a − b)2 die Beziehung m 2 1 2 kηh k − 12 kηhm−1 k2 + 12 kηhm − ηhm−1 k2 + km k∇ηhm k2 = km (f¯m , η m ) − (Rm um − Rm−1 um−1 , η m ) − km (∇um , ∇η m ) h h h h h = km (f¯m , ηhm ) − (um − um−1 , ηhm ) − km (∇um , ∇ηhm ) + + (5.2.55) (u − Rhm um , ηhm ) − (um−1 − Rhm−1 um−1 , ηhm−1 ) (um−1 − Rhm−1 um−1 , ηhm−1 − ηhm ). m Weiter haben wir km (f¯m , ηhm ) − (um − um−1 , ηhm ) − km (∇um , ∇ηhm ) Z tm (f − ∂t u, ηhm ) dt − km (∇um , ∇ηhm ) = = = Z tm−1 tm tm−1 Z tm tm−1 ≤ (∇u, ∇ηhm ) dt − km (∇um , ∇ηhm ) (5.2.56) (t − tm−1 )(∇∂t u, ∇ηhm ) dt km k∇ηhm k2 + 1 2 4 km Z tm tm−1 k∂t ∇uk2 dt sowie (um−1 − Rhm−1 um−1 , ηhm−1 − ηhm ) ≤ 12 kηhm−1 − ηhm k2 + ch4m k∇2 um−1 k2 (5.2.57) −1 m−1 − ηhm k2 + ckm h4m k∇2 um−1 k2 kηh (um−1 − Rhm−1 um−1 , ηhm−1 − ηhm ) ≤ km (5.2.58) oder i) Wir betrachten zunächst den Fall allgemein variierender Ortsdiskretisierung. Kombination der Beziehungen (5.2.55), (5.2.56) und (5.2.57) und Absorption von Termen in die linke Seite ergibt m 2 1 2 kηh k − 21 kηhm−1 k2 ≤ (um − Rhm um , ηhm ) − (um−1 − Rhm−1 um−1 , ηhm−1 ) Z tm 1 2 + 4 km k∂t ∇uk2 dt + ch4m k∇2 um−1 k2 . tm−1 206 Verfahren für parabolische Probleme Wir wenden diese Abschätzung rekursiv für m, m − 1, ..., 1 an und finden kηhm k2 ≤ kηh0 k2 + 2(um − Rhm um , ηhm ) − 2(u0 − Rh0 u0 , ηh0 ) Z tµ m n o X kµ2 +c k∂t ∇uk2 dt + ch4µ k∇2 uµ−1 k2 tµ−1 µ=1 bzw. kηhm k2 ≤ kηh0 k2 + 12 kηhm k2 + 21 kum − Rhm um k2 − (u0 − Rh0 u0 , ηh0 ) Z tµ m X 2 −1 4 kµ k∂t ∇uk2 dt + ctm max {km hµ k∇2 uµ k2 }. +c 0≤µ≤m tµ−1 µ=1 Mit Hilfe der Abschätzung kuµ − Rhµ uµ k + kuµ − Phµ uµ k ≤ ch2µ k∇2 uµ k, µ = 1, ..., m, (5.2.59) folgt 2 2 m m m m m m kem h k ≤ kηh k + ku − Rh u k ≤ kηh k + chm k∇ u k, kηh0 k 0 ≤ ku − Rh0 u0 k 0 + ku − Ph0 u0 k ≤ ch20 k∇2 u0 k (5.2.60) (5.2.61) und damit schließlich die Fehlerabschätzung (5.2.51): 2 kem h k ≤ ctm max {kµ−1 h4µ k∇2 uµ k2 } + 0≤µ≤m c m X kµ2 µ=1 Z tµ tµ−1 k∇∂t uk2 dt. (5.2.62) ii) Wir nehmen nun an, daß Vhm = Vh bzw. Rhm = Rh für m = 1, ..., M . Kombination der Beziehungen (5.2.55), (5.2.56) und (5.2.58) und Absorption von Termen in die linke Seite ergibt m 2 1 2 kηh k − 12 kηhm−1 k2 ≤ (um − Rhm um , ηhm ) − (um−1 − Rhm−1 um−1 , ηhm−1 ) Z tm −1 m−1 2 + 14 km − ηhm k2 + ckm h4m k∇2 um−1 k2 . k∂t ∇uk2 dt + km kηh tm−1 Wir wenden diese Abschätzung rekursiv für m, m − 1, ..., 1 an und finden: kηhm k2 ≤ kηh0 k2 + 2(um − Rhm um , ηhm ) − 2(u0 − Rh0 u0 , ηh0 ) Z tµ m n o X 2 k∂t ∇uk2 dt + km h4µ k∇2 uµ−1 k2 + kµ−1 kηhµ−1 − ηhµ k2 kµ +c µ=1 tµ−1 bzw. mit den Abschätzungen (5.2.59), (5.2.60) und (5.2.61), 2 kem h k ≤ ctm max 0≤µ≤m {h2µ k∇2 uµ k2 } + m X µ=1 kµ−1 kηhµ−1 − ηhµ k2 +c m X µ=1 kµ2 Z tµ tµ−1 k∂t ∇uk2 dt. (5.2.63) 5.2 FE-Galerkin-Verfahren für parabolische Probleme 207 m Im letzten Schritt schätzen wir die mittlere Summe rechts ab. Jetzt kann ϕh = ϕm h := ηh − m−1 ηh ∈ Vh als Testfunktion verwendet werden, und wir erhalten wie oben m−1 2 2 m 2 2 1 1 k + 12 km k∇ϕm kϕm h k h k + 2 km k∇ηh k − 2 km k∇ηh = km (f¯m , ϕm ) − (Rm um −Rm−1 um−1 , ϕm ) − km (∇Rm um , ∇ϕm ) h h h h h h m m−1 m m = km (f¯m , ϕm , ϕm h ) − (u − u h ) − km (∇u , ∇ϕh ) + (um − um−1 − Rh (um + um−1 ), ϕm h ). Weiter haben wir m m−1 m m km (f¯m , ϕm , ϕm h ) − (u − u h ) − km (∇u , ∇ϕh ) = = = Z tm tm−1 Z tm tm−1 Z tm tm−1 ≤ m m (f − ∂t u, ϕm h ) dt − km (∇u , ∇ϕh ) m m (∇u, ∇ϕm h ) dt − km (∇u , ∇ϕh ) (t − tm−1 )(∇∂t u, ∇ϕm h ) dt m 2 1 2 km k∇ϕh k + 1 2 2 km Z tm tm−1 k∂t ∇uk2 dt sowie m 2 2 m m−1 2 1 (um − um−1 − Rh (um − um−1 ), ϕm )k h ) ≤ 4 kϕh k + chm k∇(u − u Z tm 2 2 ≤ 14 kϕm k∇∂t uk2 dt. h k + chm km tm−1 Kombination dieser Abschätzungen und Absorption von Termen in die linke Seite ergibt Z tm m−1 2 m 2 m 2 2 2 k∇∂t uk2 dt. kϕh k + km k∇ηh k − km k∇ηh k ≤ {km + chm km } tm−1 Wir wenden diese Abschätzung wieder rekursiv für m, m − 1, ..., 1 an und finden m X µ=1 2 kµ−1 kϕm h k + k∇ηhm k2 k∇ηh0 k2 ≤ +c m X µ=1 {kµ + Mit k∇ηh0 k2 ≤ ch40 k∇2 u0 k2 folgt schließlich m X µ=1 kµ−1 kηhµ − ηhµ−1 k2 ≤ ch40 k∇2 u0 k2 +c m X µ=1 {kµ + h2µ } Z h2µ } tµ tµ−1 Z tµ tµ−1 k∂t ∇uk2 dt. k∂t ∇uk2 dt. (5.2.64) Wir setzen dies in (5.2.63) ein und erhalten die behauptete Abschätzung (5.2.52): 2 2 2 µ 2 kem h k ≤ ctm max {hµ k∇ u k } + 0≤µ≤m was den Beweis vervollständigt. m X µ=1 kµ−1 kηhµ−1 − ηhµ k2 + c m X µ=1 kµ2 Z tµ tµ−1 k∂t ∇uk2 dt, Q.E.D. 208 Verfahren für parabolische Probleme Hilfssatz 5.2 (A-priori Schranke): Für die Lösung der ARWA (5.2.46) gilt die a priori Abschätzung Z −1 max k∇ uk + T T 2 [0,T ] 0 k∇∂t uk2 dt 1/2 ≤ c k∇2 u0 k + c max {kf k + k∂t f k}. [0,T ] (5.2.65) Beweis: Der Beweis verwendet die Energie-Technik“, wird hier aber nicht ausgeführt. Q.E.D. ” Wir wollen noch die Frage nach der inversen Monotonie“ der Orts-Zeit-Diskretisierung dis” kutieren. Unter bestimmten Bedingungen an das Ortsgitter (z.B. alle Innenwinkel einer Triangulierung ω ≤ π/2 ) ist die Steifigkeitsmatrix Ah eine M-Matrix. Die Systemmatrix Mh +kAh muß aber nicht automatisch M-Matrix sein. Um dies dennoch sicherzustellen, werden die Elemente von Mh , m,j mij = (ϕm,i h , ϕh ), mit Hilfe der Trapezregel ausgewertet. Bei stückweise linearen Ansätzen liefert dies eine Diagonalmatrix M̃h = Mh + O(h2 ) mit positiven Diagonalelementen, so daß M̃h + kAh M-Matrix wird. Dieser Mass-Lumping“ genannte Prozeß erhält die Konvergenzordnung des Gesamtsche” mas und stellt seine inverse Monotonie“ sicher (Übungsaufgabe). ” 5.2.2 Fehlerkontrolle und Schrittweitensteuerung Zur Herleitung von a posteriori Fehlerabschätzungen erweist sich eine globale Betrachtung simultan in Ort und Zeit (ohne die bisherige Aufspaltung in Orts- und Zeitdiskretisierung) als angemessen. Wir führen dazu das Konzept der unstetigen Galerkin-Verfahren“ für parabolische ” ARWAn ein, als deren einfachster Spezialfall das implizite Euler-Verfahren (5.2.48) erscheinen wird. Die Vorgehensweise entspricht der bereits von den gewöhnlichen AWAn her bekannten, ergänzt um die Aspekte der Ortsdiskretisierung. m Ausgehend von oben formulierten Diskretisierungen Tm h = {Kn } des Ortsgebiets Ω̄ und 0 = t0 < ... < tµ < ... < tM = T des Zeitintervalls I = [0, T ] führen wir die folgenden Bezeichnungen ein (Man beachte, daß die Zeitschrittweite nicht bzgl. des Orts variiert.): Im := (tm−1 , tm ], k := max m=1,...,M km , km = tm − tm−1 , hm := maxm hK , v m± := lim v(·, tm ± s), Qm n := s↓0 Knm × Im , h := K∈Th max m=1,...,M hm , [v]m := v m+ − v m− , m ∂Qm n := ∂Kn × Im , Qm := Ω × Im . Die ARWA (5.2.46) läßt sich äquivalent schreiben in der Form M Z X m=1 m−1 Im {(∂t u, ϕ) + (∇u∇ϕ)} dt + ([u] (m−1)+ ,ϕ Z ) = (f, ϕ) dt (5.2.66) I für beliebige in der Zeit stetige Testfunktion ϕ(·, t) ∈ V , wobei die Anfangsbedingung durch die Setzung u0− := u0 berücksichtigt ist. Jede (glatte) Lösung von (5.2.46) erfüllt offenbar die Beziehung (5.2.66), und umgekehrt muß jede Lösung von (5.2.66) in den Teilintervallen Im der 5.2 FE-Galerkin-Verfahren für parabolische Probleme 209 Wärmeleitungsgleichung genügen und bei tm auch stetig sein. Damit folgt dann wieder, daß es sich um eine Lösung der ARWA handeln muß. Dieses Problem wird nun mit einem GalerkinAnsatz auf dem ganzen Orts-Zeit-Zylinder QT diskretisiert. Dazu führen wir die folgenden Finite–Elemente–Räume ein: Vh = {v : Q̄T → R| vt∈Im (·, t) ∈ Vhm , vt∈Im (x, ·) ∈ Pr (Im ), (x, t) ∈ QT }. Die Funktionen in Vh sind also bzgl. des Ortes stückweise in Vhm (d.h. linear oder bilinear und stetig) und bzgl. der Zeit stückweise polynomial vom Grad r (und unstetig). Der GalerkinAnsatz sucht dann Approximationen Uh ∈ Vh zu bestimmen durch die Vorschrift M Z X m=1 Im (m−1)+ {(∂t Uh , ϕh ) + (∇Uh , ∇ϕh )} dt + ([Uh ]m−1 , ϕh Z ) = (f, ϕh ) dt (5.2.67) I für beliebige Testfunktion ϕh ∈ Vh mit dem Anfangswert Uh0− = Ph0 u0 ( Ph0 die L2 -Projektion auf Vh0 ). Da die Testfunktionen unstetig in der Zeit sein dürfen, zerfällt dieses formal zeitlich global gekoppelte System in lokale Teilprobleme auf jedem Zeitstreifen Qm = Ω × Im . Dieses Schema wird unstetiges Galerkin-Verfahren“ (abgekürzt dG(r)-Verfahren“) genannt. Wir wol” ” len im folgenden nur den einfachsten Fall r = 0 , d.h. das dG(0)-Verfahren, betrachten. In diesem Fall reduziert sich das globale Schema (5.2.67) auf die folgende Sequenz von lokalen Gleichungen auf den Zeitintervallen Im , m = 1, ..., M : Z Z m−1 (f, ϕh ) dt (5.2.68) {(∂t Uh , ϕh ) + (∇Uh , ∇ϕh )} dt + ([Uh ] , ϕh ) = Im Im für beliebiges ϕh ∈ Vhm . Mit der Setzung Uhm := Uhm,− ergibt sich wegen ∂t Uh ≡ 0 auf Im : km (∇Uhm , ∇ϕh ) + (Uhm − Uhm−1 , ϕ) = km (f¯m , ϕh ) (5.2.69) für beliebiges ϕh ∈ Vhm . Dies ist gerade das implizite Euler-Verfahren (5.2.48), welches sich also in diesem Rahmen als dG(0)-Verfahren interpretieren läßt. Diese Sicht ändert zwar nichts am Verfahren selbst, bietet jedoch einen systematischen Zugang zu seiner Fehleranalyse. Bemerkung 5.1: Die dG(r)-Verfahren höheren Grades r ≥ 1 entsprechen keinem der oben diskutierten Zeitschritt-Schemata, sie sind vielmehr Varianten gewisser impliziter Runge8 Kutta9 -Verfahren. Wir bemerken aber, daß sich auch das populäre Crank-Nicolson-Verfahren in den Rahmen der Galerkin-Verfahren einordnen läßt. Dazu macht man einen modifizierten Ansatz mit bzgl. der Zeit stückweise linearen, aber diesmal global stetigen Funktionen. Der Raum der Testfunktionen ist dagegen derselbe wie beim dG(0)-Verfahren. Dies wird dann ein Petrow-Galerkin-Verfahren“ (sog. cG(1)-Verfahren), welches sich ähnlich analysieren läßt wie ” das dG(0)-Verfahren: (Uhm , ϕh ) + 12 km (∇(Uhm + Uhm−1 ), ∇ϕh ) = (Uhm−1 , ϕh ) + km (f¯m , ϕh ), (5.2.70) für beliebige Testfunktion ϕh ∈ Vhm . 8 Carle David Tolmé Runge (1856-1927): deutscher Mathematiker; Prof. in Hannover und Göttingen; Beiträge zur Spektraltheorie mit Anwendungen in der Atom-Physik. 9 Martin Wilhelm Kutta (1867-1944): deutscher Mathematiker; Prof. in Stuttgart; Beiträge zur Aerodynamik und zur Numerik von Differentialgleichungen. 210 Verfahren für parabolische Probleme Wir wollen jetzt eine a posteriori Fehlerabschätzung für das dG(0)-Verfahren ableiten, welche als Basis für eine simultane Anpassung des Ortsgitters und der Zeitschrittweite an den Lösungsverlauf dienen kann. Dazu setzen wir eh := Uh − u . Ein typisches Beispiel ist die Kontrolle des + L2 -Fehlers zum Endzeitpunkt J(eh ) := keN h k. Satz 5.6 (A-posteriori Fehlerschranke): Für das dG(0)-Verfahren gilt bei Kontrolle des + örtlichen L2 -Fehlers zum Endzeitpunkt, J(eh ) := keN h k , die a posteriori Fehlerabschätzung J(eh ) ≤ η(Uh ) := ci m X X µ=1 ρµn (Uh ) ωnµ (z), (5.2.71) µ Kn ∈Tµ h mit den Residuentermen ρµn (Uh ) := kR(Uh )kQµn + hn−1/2 k[∂n Uh ]k∂K×I µ + kµ−1/2 k[Uh ]µ−1 kKnµ , R(Uh ) := f − ∂t Uh + ∆Uh , und einer Interpolationskonstante“ ci . Mit der Lösung z des ” dualen Problems“ ” −∂t z − ∆z = 0 z|∂Ω = 0, z|t=tm = kem+ k−1 em+ . in Ω × [0, tm ], (5.2.72) haben die Gewichte ωnµ (z) die Gestalt: ωnµ (z) := kµ k∂t zkQµn + kµ2 k∂t2 zkQµn + h2n k∇2 zkQµn . Beweis: Das erste Standbein“ des Beweises ist ein (parabolisches) Dualitätsargument. Wir ” führen zunächst für ein festes tm ∈ I das (kontinuierliche) duale Problem“ ein: ” −∂t z − ∆z = ψ in Qm := Ω × [0, tm ], z|∂Ω , zt=tm = χ, (5.2.73) ∀ϕ ∈ V. (5.2.74) bzw. in semi-variationeller Formulierung −(∂t z, ϕ) + (∇z, ∇ϕ) = (ψ, ϕ) Umschreiben in die Form (5.2.66) ergibt m nZ X µ=1 Iµ µ+ {−(ϕ, ∂t z) + (∇ϕ, ∇z)} dt + (ϕ o Z , [z] ) = µ (ϕ, ψ) dt [0,tm ] für beliebige in der Zeit stetige Testfunktion ϕ(·, t) ∈ V , wobei die Anfangsbedingung wieder durch die Vorschrift z m+ := χ berücksichtigt ist. Durch partielle Integration in der Zeit wird dies umgeformt zu m nZ X µ=1 Iµ µ−1 {(∂t ϕ, z) + (∇ϕ, ∇z)} dt + ([ϕ] ,z (µ−1)+ Z o m+ ) = (ϕ , χ) + (ϕ, ψ) dt (5.2.75) [0,tm ] für beliebige in der Zeit (stückweise) differenzierbare Testfunktion ϕ(·, t) ∈ V . Das zweite Standbein“ des Beweises ist die Galerkin-Orthogonalität des Fehlers des dG(0)” Verfahrens. Durch Vergleich der beiden Gleichungen (5.2.66) für u und (5.2.67) für Uh erhalten 5.2 FE-Galerkin-Verfahren für parabolische Probleme 211 wir für den Fehler eh := Uh − u die Galerkin-Orthogonalität“: ” Z M X (m−1)+ m−1 ) =0 {(∂t eh , ϕh ) + (∇eh ∇ϕh )}, dt + ([eh ] , ϕh (5.2.76) Im m=1 für beliebige stetige Testfunktion ϕh (·, t) ∈ Vh . Wir wählen nun in (5.2.75) die spezielle Testfunktion ϕ := eh und erhalten m nZ X µ=1 Iµ Z o , χ) + {(∂t eh , z) + (∇eh , ∇z)} dt + ([eh ]µ−1 , z (µ−1)+ ) = (em+ h (eh , ψ) dt. [0,tm ] Unter Ausnutzung von (5.2.76) erhalten wir damit die allgemeine Fehleridentität: (em+ h , χ) + Z (eh , ψ) dt = [0,tm ] m nZ X Iµ µ=1 {(∂t eh , z − zh ) + (∇eh , ∇(z − zh ))} dt o + ([eh ]µ−1 , (z − zh )(µ−1)+ ) (5.2.77) mit einer beliebigen Approximation zh ∈ Vh zur dualen Lösung z . Wir setzen nun im dualen Problem tm = T , ψ := 0 und χ := keN + k−1 eN + . Aus der allgemeinen Fehleridentität (5.2.77) folgt kem+ h k= m nZ X Iµ µ=1 o {(∂t eh , z − zh ) + (∇eh , ∇(z − zh ))} dt + ([eh ]µ−1 , (z − zh )(µ−1)+ ) (5.2.78) mit einer beliebigen Approximation zh ∈ Vh zur dualen Lösung z . Wir nutzen nun die Lösungseigenschaften von u und integrieren auf jeder Zelle Knm partiell bzgl. des Orts: kem+ h k = m X X nZ µ=1 Iµ µ Kn ∈Tµ h {(∂t u − ∂t Uh , z − zh )Knµ − (∆u − ∆Uh , z − zh )Knµ o − (∂n (Uh − u), z − zh )∂Knµ } dt + ([Uh − u]µ−1 , (z − zh )(µ−1)+ )Knµ . Dies ergibt kem+ h k= m X X nZ µ µ=1 Kn ∈Tµ Iµ {(R(Uh ), z − zh )Knµ − 12 ([∂n Uh ], z − zh )∂Knµ } dt h o + ([Uh ]µ−1 , (z − zh )(µ−1)+ )Knµ , mit dem Residuum R(Uh ) := f − ∂t Uh + ∆Uh und dem Sprung [∂n Uh ] von ∂n Uh über die Zellkanten. Durch Anwendung der Hölder’schen Ungleichung erhalten wir kem+ h k≤ m X X n kR(Uh )kQµn kz − zh kQµn µ µ=1 Kn ∈Tµ h o + 12 k[∂n Uh ]k∂Qµn kz − zh k∂Qµn } dt + k[Uh ]µ−1 kKnµ k(z − zh )(µ−1)+ kKnµ , (5.2.79) 212 Verfahren für parabolische Probleme Wir wählen nun für zh die natürliche Interpolierende Ih,k z ∈ Vh , welche zellweise definiert ist durch die Vorschrift Z −1 Ih,k z|Iµ = kµ z dt, Ih,k z|Knµ = konstante Interpolation von z. (5.2.80) Iµ Dann gelten die Interpolationsabschätzungen (Beweis mit Hilfe einer Variante des BrambleHilbert-Lemmas) kz − Ih,k zkQµn ≤ ci ωnµ (z), hn1/2 kz − Ih,k zk∂Qµn ≤ ci ωnµ (z), kµ1/2 k(z − Ih,k z)(µ−1)+ kKnµ ≤ ci ωnµ (z), (5.2.81) (5.2.82) (5.2.83) wobei ωnµ (z) := kµ k∂t zkQµn + kµ2 k∂t2 zkQµn + h2n k∇2 zkQµn . Die Interpolationskonstante“ ci , welche in die a posteriori Fehlerabschätzung (5.2.71) eingeht, ” hat dabei in der Regel die Größe ci ∼ 0, 1−1 . Einsetzen dieser Abschätzungen in (5.2.79) und Anwendung der Schwarz’schen Ungleichung ergeben kem+ h k ≤ ci m X n X µ µ=1 Kn ∈Tµ h o µ −1/2 µ−1 µ µ kR(Uh )kQµn + h−1/2 k[∂ U ]k + k k[U ] k n h ∂Qn h n µ Kn ωn (z), Dies impliziert die Behauptung. Q.E.D. Zur konkreten Auswertung der a posteriori Fehlerabschätzung (5.2.71) müssen die Gewichte berechnet werden. Dazu wird analog zum stationären, elliptischen Fall das duale Problem (5.2.72) numerisch auf dem aktuellen Gitter gelöst. Mit der resultierenden diskreten dualen Lösung zh wird dann approximiert gemäß: ωnm (z) ωnµ (z) ≈ ω̃nµ := kµ kkµ−1 [zh ]µ−1 kKnµ + h2n k∇2h zh kQµn , (5.2.84) wobei ∇2h zh ∼ ∇2 z ein geeigneter Differenzenqotient ist. Auf der Basis der approximativen a posteriori Fehlerabschätzung kem+ h k ≈ η̃(Uh ) := ci m X X ρµn (Uh ) ω̃nµ (z) (5.2.85) µ µ=1 Kn ∈Tµ h können nun simultan das Ortsgitter und die Zeitschrittweite adaptiert werden. Dabei werden in einem iterativen Prozess die Ortsresiduen + h−1/2 k[∂n Uh ]k∂Qµn , ρm,1 n n (Uh ) := kR(Uh )kQµ n und Zeitresiduen −1/2 ρm,2 k[Uh ]µ−1 kKnµ , n (Uh ) := kµ durch Anpassen von hn und km balanciert, bis η̃(Uh ) ≤ T OL für eine vorgegebene Fehlertoleranz TOL. 5.2 FE-Galerkin-Verfahren für parabolische Probleme 213 Analoge Resultate gelten für andere Fehlermaße, z.B. den globalen L2 -Fehler auf QT : 1/2 Z keh k2 dt J(eh ) := keh kQT = . (5.2.86) I In diesem Fall gilt die a posteriori Fehlerabschätzung (5.2.85) mit dem dualen Problem −1/2 −∂t z − ∆z = keh kQT eh in Ω × [0, tm ], z|∂Ω = 0, z|t=tm = 0. (5.2.87) Die Wirksamkeit der adaptiven Steuerung der Ortsgitterweite auf der Basis dieser a posteriori Fehlerabschätzungen wird anhand eines einfachen Beispiels demonstriert. Beispiel 5.1: Wir lösen die inhomogene Wärmeleitungsgleichung ∂t u − ∆u = f in QT , u|∂Ω = 0, u|t=0 = u0 , (5.2.88) auf dem Einheitsquadrat Ω = (0, 1)2 . Als exakte“ Lösung wird angesetzt: ” T 1 u(x, t) := , x0 := 12 + 14 cos(2πt), 21 + 14 sin(2πt) , 0 2 1 + α|x − x | woraus sich Anfangswert und rechte Seite ergeben zu u0 (x) := u(x, 0), f (x, t) := ∂t u(x, t) − ∆u(x, t). Diese Lösungsfunktion beschreibt einen Hügel“ im Gebiet (0, 1)2 , der während des Zeitinter” valls I = [0, 1] einmal im Kreis um den Punkt ( 12 , 12 ) herumläuft. Die Größe bzw. Steigung des Hügels läßt sich durch Wahl des Parameters α steuern. Für den Test wird α = 50 gesetzt. 214 Verfahren für parabolische Probleme Abbildung 5.1: Gittersequenzen bei Kontrolle des Endzeit-L2 -Fehlers keM kΩ ; Quelle: R. Hartmann, A posteriori Fehlerschätzung ... für die Wärmeleitungsgleichung“, Diplomarbeit 1998. ” Abbildung 5.2: Gittersequenzen bei Kontrolle des globalen L2 -Fehlers kekΩ×I (unten); Quelle: R. Hart- mann, A posteriori Fehlerschätzung ... bei Galerkin-Verfahren für die Wärmeleitungsgleichung“, Di” plomarbeit 1998. 5.3 Verallgemeinerungen und Lösungsaspekte 215 5.3 Verallgemeinerungen und Lösungsaspekte Wir haben als Modellfall die Wärmeleitungsgleichung ∂t u − a∆u = f in QT = Ω × [0, T ], (5.3.89) mit homogenen Dirichlet-Randbedingungen u|∂Ω = 0 und einem konstanten Diffusionskoeffi” zienten“ a > 0 betrachtet. i) Verallgemeinerungen: Wir lassen nun zu, daß der Koeffizient a = a(x, t) vom Ort und von der Zeit abhängt. Das Problem schreibt sich dann in der Form ∂t u − ∇ · {a∇u} = f in QT = Ω × [0, T ]. (5.3.90) Die oben betrachteten Zeitschrittverfahren lassen sich in der Regel leicht auf diesen allgemeineren Fall übertragen. Wir wollen dies anhand des Crank-Nicolson-Verfahren diskutieren: 1 m m−1 m−1 m = 2 fh + fhm−1 , (5.3.91) Uh k−1 Uhm − Uhm−1 + 12 Am h Uh + Ah mit der Ortsdiskretisierung Ah (t) des Operators −∇ · (a(·, t)∇) . Dabei werden für Funktionen w(t) die abkürzenden Bezeichnungen wm := w(tm ) , wm−1/2 := w(tm−1/2 ) und tm−1/2 := 1 2 (tm + tm−1 ) verwendet. Dies entspricht der sog. ”Sehnentrapezregel“; Anwendung der ”Tangententrapezregel“ führt auf das Schema: m−1/2 m−1/2 k−1 Uhm − Uhm−1 + 12 Ah . Uhm + Uhm−1 = fh (5.3.92) Beide Verfahrensvarianten sind unbedingt stabil und von der Konvergenzordnung O(k2 + h2 ) . Zu Ihrer Analyse ist das elegante Spektralargument aus dem vorigen Abschnitt leider nicht mehr geeignet, da der Operator Ah (t) nun mit der Zeit variiert. Statt dessen verwendet man die flexiblere Energietechnik“ und behält im wesentlichen dieselben Aussagen wie im autonomen Fall, ” allerdings mit wesentlich mehr Aufwand. Im (praktisch wichtigen) nichtlinearen Fall a = a(u(t)) wird zweckmäßigerweise die Tangententrapezform des Crank-Nicolson-Schemas verwendet: k−1 Uhm − Uhm−1 + Ah m 1 2 (Uh Hier ist auch die BDF(2)-Formel gut anwendbar: m−1/2 . + Uhm−1 ) = fh 2k−1 3Uhm − 4Uhm−1 + Uhm−2 + Ah (Uhm ) = fhm . (5.3.93) (5.3.94) Eine Stabilitäts- und Konvergenzanalyse steht aber außerhalb des Rahmens dieser Vorlesung. ii) Berechnung der Startwerte: Bei der Durchführung jedes Zeitschritts ist die rechte Seite aufzubauen, welche die Information vom vorausgehenden Zeitlevel beinhaltet. Dabei ist unter Umständen eine L2 -Projektion auf das aktuelle Gitter vorzunehmen. a) Anfangswert: Die Auswertung des Anfangswerts Uh0 kann meist durch einfache, lokale Interpolation (oder Restriktion) des kontinuierlichen Anfangswerts u0 auf das Gitter erfolgen. Im Fall eines irregulären Anfangswerts, etwa u0 ∈ / C(Ω̄) , ist jedoch Vorsicht geboten. Zur Gewährleistung der vollen Glättungseigenschaft“ der Diskretisierung (im Ort sowie in der Zeit) sollte ” 216 Verfahren für parabolische Probleme Uh0 als L2 -Projektion ausgewertet werde gemäß: (Uh0 , ϕh ) = (u0 , ϕh ) ϕh ∈ Vh . (5.3.95) b) Ortsgitterwechsel: Verändert sich die Ortsdiskretisierung vom Zeitlevel tm−1 zum Zeitlevel tm , so muß die vorausgehende Näherung Uhm−1 ∈ Vhm−1 auf das neue Gitter transferiert werden. Im FE-Kontext geschieht dies zwangsläufig gemäß (Uhm−1 , ϕh ) ∀ϕh ∈ Vhm , (5.3.96) was gleichbedeutend mit der Auswertung der L2 -Projektion Phm Uhm−1 ∈ Vhm ist. Dieser unscheinbare Schritt kann unter Umständen die teure“ Komponente des ganzen Lösungsprozesses ” und Tm sein. Dies ist dann der Fall, wenn die beiden Gitter Tm−1 h völlig unabhängig vonh einander erzeugt werden. Zur Auswertung von (5.3.96) müssen Zellintegrale über Produkte von Knotenbasisfunktionen berechnet werden: Z ϕm−1,j ϕm,n dx. h h m Kn Normalerweise geschieht dies mit Hilfe von Quadraturformeln. Da die Funktion ϕm−1,j auf der h Zelle Knm aber in der Regel nur stückweise glatt ist, wäre das zu ungenau. Der dadurch in jedem Zeitschritt eingeschleppte Fehler würde im Verlaufe der Rechnung akkumulieren und das Ergebnis stark verfälschen. Die Verwendung von Quadraturformeln besonders hoher Ordnung (z.B. 3 × 3-Gauß-Formeln) behebt diese Schwierigkeit nicht, da letztere zur Erreichung ihrer hohen Genauigkeit natürlich auch eine entsprechend hohe Regularität des Integranden benötigen. Gerade diese ist aber im betrachteten Fall nicht gegeben. Es gibt im wesentlichen drei Wege zur Lösung dieses technischen Problems: - Es werden summierte“ Quadraturformeln auf den einzelnen Zellen Knm verwendet; etwa ” durch Unterteilung in 4 − 16 Unterzellen. Dies erhöht zwar nicht die Ordnung der Integration, vermindert aber die relevante Fehlerkonstante. - Die Integration wird für den stückweise polynomialen Integranden exakt“ durchgeführt. Dazu ” ist die Bestimmung aller Teilstücke von Knm erforderlich, auf denen ϕm−1,j glatt ist. Dies wird h bei, unstrukturierten Gittern in 3-D allerdings sehr aufwendig. - Gehören die Gitter Tm−1 und Tm h zu einer Familie von hierarchisch verfeinerten Gittern, h kann diese strukturelle Information zur effizienten Berechnung der Integrale verwendet werden, da die Lage der kritischen Knicklinien von ϕm−1,j durch die reguläre Verfeinerung bestimmt h ist. iii) Lösungskomplexität: Wir betrachten wieder den Modellfall der homogenen Wärmeleitungsgleichung auf dem Einheitsquadrat Ω = (0, 1)2 ⊂ R2 , ∂t u − ∆u = 0 in QT , (5.3.97) welche auf einem äquidistanten Gitter mit dem 5-Punkte-Differenzenoperator diskretisiert sei. (i) Explizite Verfahren (etwa das explizite Euler-Schema) erfordern in jedem Zeitschritt eine Matrix-Vektor-Multiplikation mit einem arithmetischen Aufwand O(N ) . Die Stabilitätsbedingung k ≤ ch2 erzwingt etwa M ∼ h−2 ∼ N Zeitschritte pro Zeiteinheit. Dies bedeutet einen 5.3 Verallgemeinerungen und Lösungsaspekte 217 Gesamtaufwand von O(N 2 ) OP. (ii) Implizite Verfahren erfordern in jedem Zeitschritt die Lösung eines linearen Gleichungssystems, erlauben aber größere Zeitschritte. Zur Überbrückung einer Zeiteinheit sind aus Genauigkeitsgründen in der Regel M ∼ h−1 Zeitschritte erforderlich. Wir diskutieren exemplarisch das Crank-Nicolson-Verfahren. Bei zeilenweiser Numerierung der Gitterpunkte haben die resultierenden Gleichungssysteme (Ih + 21 akAh )U m = (Ih − 12 akAh )U m−1 (5.3.98) die Koeffizientenmatrix Lh := Ih + 12 akAh , wobei wieder Bm −Im −Im Bm −Im Ah = −Im Bm .. . . . N . .. . Bm −1 4 −1 = . . m . −1 4 .. .. . . 4 −1 mit der m×m-Einheitsmatrix Im . Die Eigenwerte dieser Matrix sind gegeben durch: λkl (Lh ) = 1 + 21 akh−2 {4 − 2(cos(khπ) + cos(lhπ))}, k, l = 1, ..., m. Damit ergibt sich ihre Spektralkondition zu cond2 (Lh ) = 1 + 4akh−2 λmax (Lh ) ∼ . λmin (Lh ) 1 + akπ 2 (5.3.99) Wir haben also unterschiedlich kritische Konditionierung abhängig von der Relation zwischen k und h . Im Hinblick auf eine Balancierung von Orts- und Zeitfehler ist die Wahl k ∼ h sinnvoll. In diesem Fall ist dann κ2 (Lh ) = O(h−1 ). (5.3.100) Im parabolischen Fall ist in der Regel die Konditionierung der zu lösenden impliziten Gleichungssysteme also weniger kritisch als bei elliptischen Problemen. Bei Einhaltung der (natürlich unrealistischen) Schrittweitenrelation k ∼ h2 wird sogar κ2 (Lh ) = O(1) , und der Lösungsaufwand der impliziten Verfahren nähert sich dem der expliziten. Zur Lösung des Systems (5.3.98) können alle oben diskutierten Methoden verwendet werden. Da sich im autonomen Fall die Matrix Lh von Zeitschritt zu Zeitschritt nicht ändert, bietet sich die direkte Lösung mit Hilfe einer einmaligen Cholesky-Zerlegung zu Beginn der Rechnung an (wenn dies speichertechnisch möglich ist). Dieser Ansatz erfordert es aber, den Zeitschritt k konstant zu halten, was in den meisten praktischen Fällen nicht ökonomisch ist. Im allgemeinen muß in jedem Zeitschritt eine neue“ Matrix invertiert werden, was die Verwendung ” iterativer Lösungsverfahren impliziert. Dabei steht mit Uhm−1 ein meist recht guter Startwert zur Verfügung. Bei Verwendung eines Mehrgitterverfahrens bietet sich daher die Organisation im F-Zyklus an. Häufig ist wegen der vergleichsweise moderaten Konditionierung der Matrizen Lh (bei kleiner Zeitschrittweite) zu ihrer Invertierung ein normales CG-Verfahren ausreichend schnell, so daß sich der Einsatz der komplizierten Mehrgitteriteration erübrigt. Dies hängt aber sehr von der jeweiligen konkreten Situation ab. 218 Verfahren für parabolische Probleme iv) Splitting-Methoden (ADI-Verfahren): In höheren Raumdimensionen ist die Lösung der Gleichungssysteme in jedem Zeitschritt eines impliziten Verfahrens kostspielig und kann Rechnungen über sehr lange Zeitintervalle T ≫ 1 unmöglich machen. Der Übergang zu expliziten Schemata ist in der Regel wegen der damit verbundenen Zeitschrittrestriktion auch nicht sinnvoll. In dieser Situation stellen die sog. Splitting” Methoden“ eine attraktive Alternative dar. Diese zerlegen die Lösung der vollen d-dimensionalen Gleichungssysteme in eine Folge von tridiagonalen Systemen (wie im 1-dimensionalen Fall), welche mit optimaler O(N )-Komplexität gelöst werden können. Ein Vertreter dieses Verfahrenstyps ist das ADI-Verfahren“ (Alternating Direction Implicit Iteration) nach Peaceman-Rachford, ” welches wir bereits im Zusammenhang mit iterativen Lösungsverfahren für spezielle separable“ ” Gleichungssysteme kennengelernt haben. Bei mehrdimensionalen, parabolischen Problemen wird es nun als Diskretisierungsverfahren eingesetzt. Wir betrachten wieder die Wärmeleitungsgleichung auf dem Einheitsquadrat Ω = (0, 1)2 , ∂t u − a∆u = 0 in QT , (5.3.101) welche auf einem äquidistanten Gitter mit dem 5-Punkte-Differenzenoperator diskretisiert sei. Bei zeilenweiser Numerierung der Gitterpunkte haben die aus dem Crank-Nicolson-Verfahren resultierenden Gleichungssysteme die Gestalt (Ih + 12 akAh )U m = (Ih − 21 akAh )U m−1 . (5.3.102) Der Differenzenoperator Ah wird auf dem kartesischen Tensorprodukt-Gitter in seine Bestandteile bzgl. der einzelnen Koordinatenrichtungen zerlegt gemäß Ah = Ah,1 + Ah,2 . Entsprechend erhält das Gleichungssystem (5.3.102) des Crank-Nicolson-Schemas die Form (Ih + 12 ak(Ah,1 + Ah,2 ))U m = (Ih − 12 ak(Ah,1 + Ah,2 ))U m−1 m−1/2 Die Ah,i sind Tridiagonalmatrizen. Es wird dann unter Einführung von Zwischenwerten Uh wie folgt iteriert: m−1/2 (Ih + 12 akAh,1 )Uh = (Ih − 21 akAh,2 )Uhm−1 m−1/2 (Ih + 12 akAh,2 )Uhm = (Ih − 21 akAh,1 )Uh . Die ADI-Methode kann als ein Mehrschritt-Differenzenschema interpretiert werden, wobei allerdings die Zwischenwerte keine physikalische Relevanz haben. In jedem Teilschritt müssen Gleichungssysteme mit Tridiagonalgestalt gelöst werden. Wir wissen bereits von der Diskussion der iterativen Lösungsverfahren, daß der ADI-Algorithmus für jeden Wert des Parameters ak > 0 gegen die Lösung Uh∞ des Gleichungssystems Ah Uh∞ = 0 konvergiert. Dies ist auch physikalisch“ sinnvoll, da ja im homogenen Fall ( f ≡ 0 ) auch für die exakte Lösung gilt ” u(t) → 0 (t → ∞) . Damit erweist sich das ADI-Verfahren automatisch als unbedingt numerisch m−1/2 erhalten wir stabil. Durch Elimination des Zwischenwertes Uh (I + 21 kAh,1 )(I + 12 kAh,2 )Uhm = (I − 12 kAh,1 )(I − 21 kAh,2 )Uhm−1 . (5.3.103) 5.3 Verallgemeinerungen und Lösungsaspekte 219 Der Abschneidefehler dieser Differenzenformel erlaubt die Abschätzung n o m |τh,k | ≤ c k2 max |∂t3 u| + h2 max |∇4 u| . Q̄T Q̄T (5.3.104) Eine Konvergenzanalyse ist leicht möglich, wenn wir wieder annehmen, daß die Zerlegungsmatrizen Ah,1 und Ah,2 kommutieren, d.h.: Ah,1 Ah,2 = Ah,2 Ah,1 . In diesem Fall besitzen sie ein gemeinsames ONS von Eigenvektoren {v (n) , n = 1, ..., N } zu Eigenwerten λn = λn (Ah,1 ) und µn = µn (Ah,2 ) . Die Koeffizienten in der Entwicklung Uhm = N X (n) αm ν v ν=1 werden dann durch das ADI-Schema wie folgt fortgepflanzt αm n = (1 − 21 kλn )(1 − 12 kµn ) m−1 αn . (1 + 21 kλn )(1 + 12 kµn ) (5.3.105) Hieraus folgt wieder, analog zum Crank-Nicolson-Schema, direkt die unbedingte Stabilität des ADI-Schemas. Für die Fourier-Koeffizienten αn (t) der örtlich semi-diskreten Approximation uh (t) gilt αn (tm ) = e−k(λn +µn ) αn (tm−1 ). (5.3.106) Aus der Beziehung für z = z1 + z2 , zi ≤ 0 , 1 + 21 z1 1 + 21 z2 z1 · = e + O(|z1 |3 ) ez2 + O(|z2 |3 ) = ez + O(|z|3 ) 1 1 1 − 2 z1 1 − 2 z2 (5.3.107) erhält man durch Adaption des Arguments, welches bei der Konvergenzanalyse der Padé-Verfahren verwendet wurde, den folgenden Satz. Satz 5.7 (ADI-Verfahren): Angewendet auf die 5-Punkte-Diskretisierung der Wärmeleitungsgleichung auf dem Einheitsquadrat ist das ADI-Verfahren für jede Zeitschrittweite k stabil und mit 2. Ordnung konvergent: m m 2 3 2 4 kUh − u kh ≤ c k max |∂t u| + h max |∇ u| . (5.3.108) Q̄T Q̄T Beweis: Der Beweis bedient sich wieder der Spektralmethode. Q.E.D. Der ADI-Ansatz ist generell auf (kartesischen) Tensorproduktgittern in beliebigen Raumdimensionen möglich, wenn der zugrunde liegende Differentialoperator separabel“ ist, d.h. additiv ” in eindimensionale Operatoren zerfällt, wie z.B. der Operator Lu = −∂12 u − ∂22 u + ∂1 u + ∂2 u + u. In allgemeineren Situationen (z.B. bei Auftreten gemischter Ableitungen ∂1 ∂2 u oder auf unstrukturierten Gittern) sind additive Zerlegungen von Ah in tridiagonale Teilmatrizen nicht mehr möglich, und der Wert des ADI-Ansatzes wird zweifelhaft. 220 Verfahren für parabolische Probleme 5.4 Übungen Übung 5.1: Das implizite Euler-Verfahren angewendet auf eine FE-Diskretisierung des (homogenen) Wärmeleitungsproblems ∂t u − ∆u = 0, t ≥ 0, u|t=0 = u0 , u|∂Ω = 0, mit linearen oder bilinearen Ansatzfunktionen führt auf eine Folge von linearen Systemen Mh U m + kAh U m = Mh U m−1 , m ≥ 1, U 0 = Ph u0 , mit der zugehörigen Massematrix Mh und Steifigkeitsmatrix Ah . Man zeige: a) Die Auswertung der Elemente der Massematrix mit der Trapezregel ergibt eine Diagonalmatrix (sog. “Masse-Lumping”). b) Auf Triangulierungen ohne stumpfe Innenwinkel ist die durch Masse-Lumping entstehende Systemmatrix M̃h + kAh diagonal-dominant und vom nicht-negativen Typ, d.h. eine M-Matrix. c) Anspruchsvolle Zusatzaufgabe: Der Lumping-Prozeß bewirkt einen Zusatzfehler der Größe |Ũ m − U m | = O(h2 ) . Übung 5.2: Man leite eine Bedingung für die L2 –Stabilität sowie die L∞ -Stabilität des Wärmeleitungsproblems aus Aufgabe 13.1 auf dem Einheitswürfel im R3 her. Die Ortsdiskretisierung erfolge mit dem 7-Punkte-Differenzenoperator auf einem (äquidistanten) kartesischen Gitter mit Gitterweite h . (Hinweis: Man übertrage die Argumentation aus der Vorlesung von zwei auf drei Raumdimensionen.) Übung 5.3: Die Wärmeleitungsgleichung ∂t u − a∆u = f, t ≥ 0, ut=0 = u0 , u|∂Ω = 0, auf einem Polygongebiet Ω ⊂ R2 mit Wärmeleitkoeffizient a > 0 werde im Ort mit einem linearen Finite-Elemente-Ansatz auf einer quasi-gleichförmigen Folge von Triangulierungen der Gitterweite h und in der Zeit mit dem impliziten Euler-Schema mit Schrittweite k diskretisiert: Mh U m + kAh U m = Mh U m−1 + kbm , m ≥ 1, U 0 = Ph u0 . Man untersuche die Abhängigkeit der Konditionierung der zugehörigen Systemmatrix Mh +kAh von den Diskretisierungsparametern h und k . (Hinweis: Man betrachte zunächst den Spezialfall, daß Ω das Einheitsquadrat mit einem gleichförmigen Rechteckgitter ist und die Massematrix Mh unter Anwendung der Trapezregel (“Masse-Lumping”) nur näherungsweise berechnet wird.) 6 Verfahren für hyperbolische Probleme Wir diskutieren zunächst wieder die klassischen Differenzenapproximationen zur Lösung hyperbolischer Anfangs-Randwert-Aufgaben (ARWAn). Der Übersichtlichkeit halber beschränken wir uns dabei auf das Modellproblem der Wellengleichung in einer Ortsdimension mit Dirichletschen Randbedingungen, d.h. auf die 1. ARWA: ∂t2 u − c2 ∂x2 u = f in QT := (0, 1) × [0, T ], u(0, t) = u(1, t) = 0, 0 (6.0.1) 0 u(x, 0) = u , ∂t u(x, 0) = v , bzw. deren örtlich zweidimensionales Analogon ∂t2 u − c2 ∆u = f u|∂Ω = 0, in QT := Ω × [0, T ], 0 (6.0.2) 0 u|t=0 = u , ∂t u|t=0 = v . Das Definitionsgebiet Ω wird wieder als glatt berandet oder als konvexes Polygongebiet vorausgesetzt. Die Problemdaten f, u0 , v 0 sind ebenfalls glatt und kompatibel, so daß die Lösung ebenfalls als glatt angenommen werden kann. Unsere theoretischen Überlegungen haben gezeigt, daß bei hyperbolischen Problemen Irregularitäten in den Anfangsdaten oder der rechten Seite entlang der Charakteristiken fortgepflanzt werden. Im Gegensatz zu den elliptischen und parabolischen Problemen besitzen hyperbolische keinerlei Glättungseigenschaft“. Lokale Störungen ” (bzw. Wellen) werden ungedämpft fortgeplanzt. Insbesondere gilt das Prinzip der Energieer” haltung“, d.h.: Für f ≡ 0 bleibt die Gesamtenergie (Summe aus kinetischer und elastischer Energie) in der Zeit erhalten: k∂t u(t)k2 + c2 k∇u(t)k2 = kv 0 k2 + c2 k∇u0 k2 . (6.0.3) Diese charakteristische Eigenschaft sollten auch Diskretisierungen der Wellengleichung besitzen. 6.1 Differenzenverfahren für hyperbolische Probleme Wir beginnen mit der örtlich eindimensionalen, homogenen Wellengleichung ∂t2 u − c2 ∂x2 u = 0 in QT := (0, 1) × [0, T ], u(0, t) = u(1, t) = 0, (6.1.4) u(x, 0) = u0 , ∂t u(x, t) = v 0 . Auf einem (äquidistanten) Orts-Zeit-Gitter {xn = nh, tm = mk} mit Ortsgitterweite h sowie Zeitschrittweite k lautet die natürliche, zentrale Differenzenapproximation 2. Ordnung m−1 m−1 k−2 {Unm − 2Unm−1 + Unm−2 } − c2 h−2 {Un−1 − Unm−1 + Un+1 } (6.1.5) zur Bestimmung der Approximationen Unm ∼ u(xn , tm ) . Dies ist eine (explizite) Zweischrittformel“. ” Die Startwerte Un0 und Un1 werden aus den Anfangsbedingungen berechnet gemäß: Un0 := u0 (xn ), 221 222 Verfahren für hyperbolische Probleme sowie unter Beachtung von u(xn , k) = u(xn , 0) + k∂t u(xn , 0) + 21 k2 ∂t2 u(xn , 0) + ... = u0 (xn ) + kv 0 (xn ) + 12 c2 k2 ∂x2 u0 (xn ) + ... durch Un1 = u0 (xn ) + kv 0 (xn ) + 12 c2 k2 h−2 {u0 (xn−1 ) − 2u0 (xn ) + u0 (xn+1 )}. Mit dem Quotienten σ := k/h gilt für den zugehörigen Abschneidefehler: τh,k = {∂t2 u − c2 ∂x2 u} + 1 2 2 12 h (σ − c−2 )∂t4 u + 1 4 4 360 h (σ − c−4 )∂t6 u + .... Offenbar ist τh,k ≡ 0 für σ = c−1 , d.h.: Die explizite Differenzenformel m−1 m−1 Unn = Un−1 + Un+1 − Unm−2 ist eine exakte“ Differenzendarstellung der Wellengleichung. Das Abhängigkeitsgebiet der Dif” ferenzenformel hängt offenbar von der Schrittweitenrelation σ = k/h ab. 1. Fall 0 < σ ≤ c−1 : Abhängigkeitsgebiet der Differenzenformel enthält das der Differentialgleichung; 2. Fall σ = c−1 : Übereinstimmung“; ” 3. Fall σ > c−1 : Abhängigkeitsgebiet der Differenzenformel ist enthalten in dem der Differentialgleichung. Satz 6.1 (Courant1 -Friedrichs2 -Lewy3 ): Notwendig für die Konvergenz Unm → u(xn , tm ) (h, k → 0), für beliebige Anfangsdaten ist die Schrittweitenbedingung ( CFL-Bedingung“) ” k σ := ≤ c−1 . h (6.1.6) (6.1.7) Beweis: Sei σ > c−1 . Wenn in irgendeinem festen Gitterpunkt (xn , tm ) für eine spezielle Anfangsbedingung Unm → u(xn , tm ) konvergiert für h, k → 0 , so können wir diese Anfangsdaten außerhalb des Abhängigkeitsintervalls von (xn , tm ) bzgl. der Differenzenformel beliebig ändern, ohne daß Unm verändert wird. In diesem Fall kann also Unm nicht gegen die veränderte Lösung ũ(xn , tm ) konvergieren. Q.E.D. Bemerkung 6.1: Wir weisen darauf hin, daß für spezielle Anfangsdaten durchaus (theoretische) Konvergenz auch für σ > c−1 eintreten kann; in diesem Fall liegt aber numerische Instabilität vor. Die Schrittweitenbedingung (6.1.7) ist weniger restriktiv als die entsprechende Bedingung k ≤ 12 ah2 bei der Wärmeleitungsgleichung. Im folgenden werden wir die Konvergenz des Differenzenschemas (6.1.5) untersuchen. Dabei bedienen wir uns der Spektraltechnik, die wir bereits bei parabolischen Problemen kennengelernt 6.1 Differenzenverfahren für hyperbolische Probleme 223 haben. Der örtliche Differenzenoperator Ah Unm := − c2 m } {U m − 2Unm + Un+1 h2 n−1 (6.1.8) m ( U0m = UN +1 = 0 ) ist symmetrisch und positiv definit bzgl. des diskreten Skalarprodukts (v, w)h := h2 N X vn wn , n=1 1/2 kvkh := (v, v)h . Seine Eigenwerte seien 0 < λ1 ≤ ... ≤ λN ∼ 4c2 /h2 mit einem zugehörigen Orthonormalsystem {w(n) , n = 1, ..., N } von Eigenvektoren. Insbesondere gilt (Ah v, v)h ≥ λkvk2h (6.1.9) mit einer von h unabhängigen Konstante λ > 0 . Satz 6.2 (CFL-Bedingung): Die explizite Differenzenformel (6.1.5) ist genau dann numerisch stabil, wenn die CFL-Bedingung k/h ≤ c−1 erfüllt ist. Im Falle einer hinreichend glatten Lösung gilt dann die Konvergenzabschätzung max kUhm − u(·, tm )kh ≤ c(u)T 2 {k2 + h2 }. [0,T ] (6.1.10) Beweis: i) Für die Entwicklungskoeffizienten in Uhm = N X (n) am nw n=1 gilt m−1 =0 + k2 λn am−1 + am−2 am n n n − 2an bzw. 2 m−1 am + am−2 = 0. n + (k λn − 2)an n (6.1.11) Diese homogene Differenzengleichung hat die allgemeine Lösung m m am n = c1 r1 + c2 r2 mit den Wurzeln ri des charakteristischen Polynoms ρ(r) = r 2 + (k2 λn − 2)r + 1 : p 2 − k2 λn ± (2 − k2 λn )2 − 4 r1,2 = . 2 Im Fall k2 λn ≤ 4 ist |r1,2 | ≤ 1 , d.h.: Es liegt Stabilität vor. Im Fall k2 λn > 4 ist |r2 | > 1 , d.h.: Es besteht Instabilität. Offenbar gilt für h → 0 : k 2 λn ≤ 4 ⇔ σ ≤ c−1 . (6.1.12) 224 Verfahren für hyperbolische Probleme ii) Sei nun k2 λn ≤ 4 und die Lösung u glatt. Wir betrachten den Fehler der Ortsdiskretisierung getrennt von dem der Zeitdiskretisierung: m m m em n := u(xn , tm ) − Un = u(xn , tm ) − uh (xn , tm ) + uh (xn , tm ) − Un =: εh (xn , tm ) + En . Für den Ortsdiskretisierungsfehler εh gilt ε0h = ∂t ε0h = 0 und ∂t2 εh + Ah εh = O(h2 ). Wir multiplizieren diese Identität mit ∂t εh , 2 2 1 2 dt k∂t εh kh + (Ah εh , εh )h = (O(h ), ∂t εh )h , und integrieren über [0, t] : k∂t εh (t)k2h Dies impliziert + (Ah εh (t), εh (t))h = kεh (0)k2h + (Ah εh (0), εh (0))h + Z t (O(h2 ), ∂s εh )h ds. 0 max k∂t εh k2h + (Ah εh , εh )h ≤ t O(h2 ) max k∂t εh kh [0,t] [0,t] bzw. nach Aufintegrieren bzgl. der Zeit: max kεh kh ≤ c t2 h2 . [0,t] (6.1.13) Der Faktor t2 läßt sich hier nicht vermeiden, da bei der Wellengleichung (im Gegensatz zur Wärmeleitungsgleichung) lokale Störungen nicht ausgedämpft werden. iii) Für den Zeitdiskretisierungsfehler gilt k−2 {E m − 2E m−1 + E m−2 } + Ah E m−1 = O(k2 ). (6.1.14) Die Konstante in O(k2 ) hängt dabei von den Zeitableitungen von uh (t) bis zur Ordnung 4 ab. Diese lassen sich durch die entsprechenden Zeitableitungen von u beschränken, was hier jedoch nicht ausgeführt werden soll. Für die n-te Fourier-Komponente Enm = (E m , w(n) )h gilt Enm − 2Enm−1 + Enm−2 + k2 λn Enm−1 = (O(k4 ), w(n) )h , gleichmäßig bzgl. n . Das charakteristische Polynom dieser Differenzengleichung ist ρ(r) = r 2 + (k2 λn − 2)r + 1 mit Wurzeln |r1,2 | = 1 . Die a priori Abschätzung für Lösungen inhomogener Differenzengleichungen aus Hilfssatz 6.1 liefert also: n o |Enm | ≤ c max |Enν | + m2 max O(k4 ) µ=0,1 bzw. kE m k2h = m X ν=1 ν=2,...,m |Enν |2 ≤ c kE 0 k2h + kE 1 k2h + ct4m k4 . 6.1 Differenzenverfahren für hyperbolische Probleme 225 Offenbar ist E 0 = 0 und E 1 = uh (t1 ) − U 1 = uh (t1 ) − u0 − ku1 − 12 k2 Ah u0 = −ε(t1 ) + u(t1 ) − u0 − ku1 − 12 k2 c2 ∂x2 u(0) + O(k2 h2 ) = −ε(t1 ) + u(t1 ) − u0 − ku1 − 12 k2 ∂t2 u(0) + O(k2 h2 ) = O(k3 + k2 h2 ) + O(k3 ). Dies führt auf kE m k2h ≤ c t2m {h2 + k2 }2 . (6.1.15) Kombination der Abschätzungen (6.1.13) und (6.1.15) vervollständigt schließlich den Beweis. Q.E.D. Hilfssatz 6.1 (Differenzengleichungen): Die Folge {ym }m∈N genüge der linearen, inhomogenen Differenzengleichung R X aν ym+ν = gm , ν=0 m ≥ 0. (6.1.16) Wenn alle Nullstellen λν des charakteristischen Polynoms ρ(z) := R X aν z ν ν=0 Betrag |λν | ≤ 1 haben, gilt die a priori Abschätzung max |yν | ≤ cR max |yν | + m2 max |gν | , R≤ν≤m 0≤ν≤R 0≤ν≤m m ≥ R. Beweis: ohne (6.1.17) Q.E.D. Bemerkung 6.2: Die bisher erhaltenen Aussagen bleiben gültig, wenn man das explizite Differenzenschema auf das reine Anfangswertproblem ( Cauchy-Problem“) der Wellengleichung an” wendet. In diesem Fall ist man auf explizite Verfahren angewiesen, da zur Verwendung impliziter Formeln die notwendigen Randwerte fehlen. Bei der ARWA der Wellengleichung kann man sich von der einschränkenden CFL-Bedingung durch Verwendung impliziter Differenzenformeln befreien, etwa der Art =0 k−2 {Uhm − 2Uhm−1 + Uhm−2 } + αAh Uhm + (1 − 2α)Ah Uhm−1 + αAm−2 h mit einem Parameter α ∈ [0, 1] . Diese Formel hat den Abschneidefehler o n 1 (σ 2 − 1) − ασ 2 }∂x4 u + O(h2 ) ; τh = h2 { 12 (6.1.18) Sie ist also für beliebiges α von zweiter Ordnung. Für ein implizites Differenzenschema enthält ihr Abhängigkeitsbereich offensichtlich den der Differentialgleichung. 226 Verfahren für hyperbolische Probleme Satz 6.3 (Konvergenz impliziter Verfahren): Die implizite Differenzenformel (6.1.18) ist im Falle α ≥ 1/4 unbedingt stabil und im Fall 0 < α < 1/4 stabil für 1 0<σ≤ √ ; c 1 − 4α (6.1.19) Für andere σ ist sie instabil. Im stabilen Fall gilt die Konvergenzabschätzung max kUhm − u(·, tm )kh ≤ c(u)T {k2 + h2 }. [0,T ] (6.1.20) Beweis: Für die Entwicklungskoeffizienten in Uhm = N X (n) am nw n=1 gilt m−1 m−1 am + am−2 + k2 λn {αam + αam−2 } = 0. n − 2an n n + (1 − 2α)an n Das charakteristische Polynom dieser Differenzenformel hat die Wurzeln ρ(r) = (1 + αk2 λn )r 2 + k2 λn (1 − 2α) − 2 r + (1 + k2 λn α) r1,2 = 2 − k2 λn (1 − 2α) ± p (k2 λn (1 − 2α) − 2)2 − 4(1 + k2 λn α)2 . 2(1 + αk2 λn ) Wir haben zwei Fälle zu unterscheiden: a) Stabiler Fall: (k2 λn (1 − 2α) − 2)2 ≤ 4(1 + k2 λn α)2 ⇒ |r1,2 | = 1. (6.1.21) (k2 λn (1 − 2α) − 2)2 > 4(1 + k2 λn α)2 ⇒ |r2 | > 1. (6.1.22) b) Instabiler Fall Der Kette äquivalenter Ungleichungen k2 λn (1 − 2α) − 2 ≤ k2 λn − 2αk2 λn ≤ 4 + 2αk2 λn k2 λn − 4αk2 λn ≤ 4 4k2 c2 (1 − 4α) ≤ 4 h2 k2 (1 − 4α) ≤ c−2 h2 2 + 2k2 λn α 6.1 Differenzenverfahren für hyperbolische Probleme 227 entnehmen wir die Bedingungen α ≥ 1/4 oder 0 < α < 1/4, 1 σ≤ √ . c 1 − 4α (6.1.23) Dagegen ist k2 λn (1 − 2α) − 2 ≥ −2 − 2k2 λn α k2 λn − 2αk2 λn ≥ −2αk2 λn k2 λn ≥ 0, stets erfüllt. Dies beweist den die Stabilität betreffenden Teil des Satzes. Die Konvergenzabschätzung wird dann ähnlich wie im expliziten Fall gezeigt. Wir lassen die Details weg. Q.E.D. In zwei Raumdimensionen ist der Abhängigkeitsbereich der Wellengleichung kegelförmig (z.B. Kreiskegel bei kreisförmigem Grundgebiet). Die obigen Aussagen für den eindimensionalen Fall gelten sinngemäß auch in zwei Dimensionen. Bei Ortsdiskretisierung mit dem 5-PunkteOperator Ah lautet das Analogon des expliziten Schemas (6.1.5) (6.1.24) k−2 Uhm − 2Uhm−1 + Uhm−2 + c2 Ah Uhm−1 = 0 und hat die Stabilitätsbedingung 1 σ≤√ . 2c √ In drei Raumdimensionen verschärft sich diese Bedingung zu σ ≤ ( 3c)−1 . (6.1.25) 228 Verfahren für hyperbolische Probleme 6.2 Finite-Elemente-Verfahren für hyperbolische Probleme Als Basis von Finite-Elemente-Diskretisierungen dient wieder die variationelle Formulierung von (6.0.2): (∂t2 u, ϕ) + (a∇u, ∇ϕ) = (f, ϕ) ∀ϕ ∈ V, t > 0, u|t=0 = 0, (6.2.26) mit dem üblichen Sobolew-Raum V := H01 (Ω) . Im Sinne der Rothe-Methode“ könnten diese ” Gleichung nun zunächst wieder mit einem Differenzenschema 2. Ordnung in der Zeit und anschließend die einzelnen Zeitschritte mit FE-Ansätzen im Ort diskretisiert werden. Dies führt wie bei den Differenzenverfahren zwangsläufig auf Zwei-Schritt-Schemata, mit denen die Energieerhaltung nicht zu bewerkstelligen ist. Wir wollen daher jetzt einen anderen Weg beschreiten, der etwas näher an der Vorgehensweise bei parabolischen Problemen ist. Durch Einführung der zusätzlichen Unbekannten v = ∂t u geht die Wellengleichung über in das System ∂t u − v = 0, ∂t v − c2 ∆u = f, mit den natürlichen Randbedingungen u|∂Ω = v|∂Ω = 0 sowie den Anfangsbedingungen u|t=0 = u0 und v|t=0 = v 0 . In variationeller Form schreibt sich dies wie (∂t v, ϕ) − (v, ψ) = 0 ∀ψ ∈ V, t ∈ [0, T ], (∂t u, ψ) + c2 (∇u, ∇ϕ) = (f, ϕ), ∀ϕ ∈ V, mit den Anfangsbedingungen u|t=0 = u0 und v|t=0 = v 0 . Dieses System von Differentialgleichungen ist wieder hyperbolisch“, da alle Eigenwerte der Koeffizientenmatrix rein imaginär ” sind. Zur Diskretisierung wäre also ein Zeitschrittverfahren günstig, bei dem die imaginäre Achse gerade der Rand des Stabilitätsgebiets ist. Das Crank-Nicolson-Verfahren besitzt diese Eigenschaft. Zur Diskretisierung dieses Systems verwenden wir das Rothe-Verfahren, d.h.: Zunächst wird bzgl. der Zeit diskretisiert. Dazu verwenden wir auf einem Zeitgitter 0 = t0 < t1 < ... < tm < ... < tM = T, mit Schrittweiten km = tm − tm−1 das Crank-Nicolson-Schema: (um −um−1 , ψ) − 12 km (v m +v m−1 , ψ) = 0, (v m −v m−1 , ϕ) + 12 km (c2 ∇(um +um−1 ), ∇ϕ) =0, für alle Testfunktionen ϕ und ψ mit Anfangswerten u0 und v 0 . Bei diesem Zeitschrittverfahren bleibt die totale Energie in jedem einzelnen Zeitschritt erhalten. Dazu setzen wir im variationellen Schema ϕ := um − um−1 und ψ := v m − v m−1 und kombinieren die beiden resultierenden Gleichungen zu m 2 1 2 kv k + 12 kc∇um k2 = m−1 2 1 k 2 kv + 12 kc∇um−1 k2 . (6.2.27) Die einzelnen Probleme in jedem Zeitschritt tm−1 → tm werden nun mit Hilfe eines FEVerfahrens diskretisiert. Dazu werden zu jedem Zeitlevel tm FE-Ansatzräume Vhm ⊂ V = 6.2 Finite-Elemente-Verfahren für hyperbolische Probleme 229 H01 (Ω) auf Gittern Tm H der üblichen Art gewählt. Im folgenden betrachten wir zunächst den Fall, daß die Gitter und Ansatzräume zu allen Zeitpunkten dieselben sind. Die allgemeine Situation von mit der Zeit variierenden Ortsgittern ist in Abb. 6.1 skizziert. Abbildung 6.1: Raum-Zeit-Gitter mit “hängenden Knoten“ Zu dem FE-Ansatz gehören wieder die Masse- und Steifigkeitsmatrizen (i) (i) (j) Mh = (mij )ij = (ϕh , ϕh ) ij , (i) (j) Ah = (aij )ij = (c2 ∇ϕh , ∇ϕh ) ij , wobei {ϕh , i = 1, ..., N } die Knotenbasis von Vh ist. Dabei wird angenommen, daß beide Unbekannte uh sowie vh in demselben Ansatzraum Vh bestimmt werden. Dies ist wegen der physikalisch vorgegebenen Randbedingung v|∂Ω = ∂t u|∂Ω = 0 sinnvoll. Eigentlich bräuchte vh im Hinblick auf die gewählte variationelle Formulierung aber nur in L2 (Ω) gewählt zu werden. m m Bezeichnen wir nun die zugehörigen Knotenwertvektoren von um h und vh ebenfalls mit uh m und vh , so erhält das Zeitschrittschema die Gestalt Mh (Uhm − Uhm−1 ) + 12 km Mh (Vhm − Vhm−1 ) = 0, Mh (Vhm − Vhm−1 ) + 12 km Ah (Uhm + Uhm−1 ) = 0. Dies kann nun so umgeformt werden, daß ein System von zwei sukzessive lösbaren Problemen entsteht: 2 2 (Mh + 14 km Ah )Uhm = Mh Uhm−1 + km Mh Vhm−1 − 41 km Ah Uhm−1 , Mh Vhm = Mh Vhm−1 − 21 km Ah (Uhm + Uhm−1 ). In jedem Zeitschritt sind also eine (modifizierte) Ritz-Projektion sowie eine L2 -Projektion durchzuführen. Die Konvergenzanalyse dieses Verfahrens kann wieder mit Hilfe der oben schon beschriebenen Energie-Technik“ erfolgen, was hier aber nicht ausgeführt werden soll. ” 230 Verfahren für hyperbolische Probleme 6.3 Verallgemeinerungen und Lösungsaspekte Bei der Anwendung unbedingt stabiler, impliziter Differenzenschemata müssen in jedem Zeitschritt lineare Gleichungssysteme mit Koeffizientenmatrizen der Form Ih +αk2 Ah gelöst werden. Deren Kondition verhält sich im Falle k ∼ h wie κ2 (Ah ) ∼ 1. (6.3.28) Auf solchen gleichförmigen Gittern sind implizite Verfahren also verhältnismäßig kostengünstig. Dies ändert sich aber, wenn das Ortsgitter zur Anpassung an irreguläre Lösungsstrukturen lokal verfeinert wird. 6.4 Übungen 6.4 Übungen Übung 6.1: Übung 6.2: 231 232 Verfahren für hyperbolische Probleme Index 5-Punkte-Operator, 48, 57, 64, 83 7-Punkte-Operator, 50 9-Punkte-Operator gestreckter, 48 kompakter, 48, 84 2 L -Norm-Fehler, 130 L2 -Norm-Fehlerschätzer, 135 L2 -Projektion, 107, 148, 227 L∞ -Norm-Fehler, 109, 130 M -Matrix, 83 V -elliptisch, 72 dG(0)-Verfahren, 208 dG(r)-Verfahren, 207 h/p-Finite-Elemente-Methode, 77 A-orthogonal, 157 A-Stabilität, 190 starke, 190, 196 strenge, 190 Abhängigkeitsbereich, 39, 225 Ableitung schwache, 24 verallgemeinerte, 24 Abschneidefehler, 46, 186, 217, 223 Abstiegsrichtung, 156 Abstiegsverfahren, 156 Adaptionsstrategie, 141 ADI-Verfahren, 63, 216, 217 Adini (????-????), 93 Adini-Plattenelement, 93 Allgemeiner Störungssatz, 118 Anfangs-Randwert-Aufgabe, 32 Approximationseigenschaft, 173 Argyris (1916-2004), 92 Argyris-Plattenelement, 92 Assemblierung, 117 Aubin (????-????), 80 Aubin-Nitsche-Trick, 80 Banach (1892-1945), 2 Bandmatrix, 52, 60 Baryzentrische Koordinaten, 122 BDF-Verfahren, 185, 186 Bestapproximationseigenschaft, 74, 107 Bestimmtheitsbereich, 39 Biharmonischer Operator, 7, 21, 91, 120, 151 Bramble (1932-), 100 Bramble-Hilbert-Lemma, 100, 124, 210 Cauchy (1789-1857), 11 Cauchy-Problem, 11, 223 CFL-Bedingung, 220, 221 CG-Verfahren, 157, 160, 179, 215 quadriertes, 163 Charakteristik, 12 Charakteristisches Polynom, 223 Cholesky (1975-1918), 63 Cholesky-Zerlegung, 63, 215 Courant (1888-1972), 220 Crank (1916-), 185 Crank-Nicolson-Verfahren, 186, 190, 200, 207, 213, 215, 216, 226 gedämpftes, 198 Sehnentrapezform, 213 Tangententrapezform, 213 Dämpfung, 172 Defekt, 155 Defektgleichung, 169 Defektkorrektur-Iteration, 61 Diagonaldominanz erweiterte , 52 irreduzible, 53 Differentialgleichung 2. Ordnung, 10 gewöhnliche, 10 lineare, 9 nichtlineare, 9, 15 Differentialoperator elliptischer, 12 hyperbolischer, 12 parabolischer, 12 Differenzenappoximation, 45 Differenzengleichung, 223 Differenzenoperatoren, 45 Differenzenverfahren A(0)-stabil, 185 explizit, 182 implizit, 182 Diffusions-Transport-Gleichung, 72 Dirac (1902-1984), 111 Dirac-Funktion, 111 Direkte Methode, 18 Dirichlet (1805-1859), 15 Divergenz, 1 Du Fort (????-????), 195 Du Fort-Frankel-Verfahren, 195 Duale Lösung, 132 Duales Problem, 132 233 234 Dualitätsargument, 80, 208 Eckensingularität, 23, 43, 146 Effektivitätsindex, 133, 139 Eigenwerte, 68 Eigenwertproblem, 31 Einschrittverfahren, 182 Element-(Last)-Vektor, 117 Element-(Steifigkeits)-Matrix, 117 Energie, 39 Energie-Form, 167, 181 Energie-Methode, 36, 199 Energie-Norm, 18, 74, 155 Energieerhaltung, 219 Energiefunktional, 71 Energienorm-Fehler, 80, 130 Energienorm-Fehlerschätzer, 134 Erhaltungsgleichung, 40 Euklid (ca. 355-290 v. Chr.), 1 Euklidische Vektornorm, 1 Euklidisches Produkt, 1 Euler (1707-1783), 183 Explizites Euler-Verfahren, 185, 192 F-Zyklus, 171, 215 Fehler lokaler, 114 Fehlerbalancierungs-Strategie, 141 Fehlerfunktional, 131 Fehlerindikator, 140 Fest-Raten-Strategie, 142 Finite Elemente, 77 bi-kubisch, 93, 94 bi-linear, 92 bi-quadratisch, 92 isoparametrisch, 96 konform, 89 konstant, 89 kubisch, 91, 150 linear, 78, 89, 93 nicht-konform, 89 parametrisch, 96 quadratisch, 90, 93 quartisch, 91 quintisch, 92 tri-linear, 94 tri-quadratisch, 94 Finite-Elemente-Interpolierende, 89 Finite-Elemente-Raum, 207 INDEX Fixpunktiteration, 62 Formfunktion, 77 Formregularität, 78 Fourier (1768-1830), 31 Fourier-Entwicklung, 31 Frankel (????-????), 195 Friedrichs (1901-1982), 220 Galerkin (1871-1945), 75 Galerkin-Gleichungen, 158 Galerkin-Orthogonalität, 208 Galerkin-Verfahren, 75 Gauß-Seidel-Verfahren, 63 Gaußsches Eliminationsverfahren, 61 Gauß (1777-1855), 2 Geschachteltes Mehrgitterverfahren, 171 Gitterfeinheit, 45 Gitternumerierung diagonale, 60 Schachbrett, 61 zeilenweise, 60 Gitteroptimierung, 142 Gittersteuerung, 139 Gittertransfer, 171 Glätter, 171 Glättungseigenschaft, 36, 173, 190, 196, 198, 213 Glättungsiteration, 167 Größenregularität, 78 Gradient, 1 Gradientenverfahren, 157 Gram (1850-1916), 158 Gram-Schmidt-Algorithmus, 158 Green (1793-1841), 2 Greensche Funktion, 17, 111, 112 Greensche Identität, 56 Grobgitteroperatoren, 171 Grobgitterproblem, 168 Hängender Knoten, 227 Hölder (1859-1937), 2 Höldersche Ungleichung, 2, 27 Hadamard (1865-1963), 9 Halbbandbreite, 52 Halbgruppen-Methode, 36 Hauptteil, 12, 13 Hermite (1822-1901), 88 Hermite-Element, 88 Hestenes (1906-1991), 157 INDEX Hilbert (1862-1943), 2 Hilbert (????-), 100 ILU-Verfahren, 63 Implizites Euler-Verfahren, 185, 186, 202, 207 Integralformel von Green, 2 Integralsatz von Gauß, 2 Interpolationsabschätzung, 101, 103 Interpolationskonstante, 208, 210 Interpolierende, 79 Inverse Beziehung, 105 Inverse Monotonie, 54, 193 inverse Monotonie, 68 Iterationsmatrix, 62 Jacobi (1804-1851), 62 Jacobi-Verfahren, 62 Jordan (1838-1922), 11 Kantenresiduum, 132 Kegelschnitt, 12 klassische Lösung, 32 Knoten, 78 Knotenbasis, 79 Knotenbasisfunktion, 79 Knotenfunktional, 88 Knotenwert, 78, 88 Koerzitivität, 72 Konditionierung, 118, 151 Konditionszahl, 68 Konformität, 89 Konsistenz, 46, 186 Konsistenzordnung, 46 Kontinuitätsgleichung, 5 Konvergenz, 57 Konvergenzordnung, 46, 67 Konvergenzrate, 62 Koordinatenrelaxation, 157 Kovalevskaya (1850-1891), 15 Kronecker (1823-1891), 56 Kronecker-Symbol, 56 Krylov (1879-1955), 155 Krylow-Raum, 158 Krylow-Raum-Methode, 155 Kutta (1867-1944), 207 Lösung klassische, 16 schwache, 19, 43 235 Lösungskomplexität, 214 Lagrange (1736-1813), 79 Lagrange-Basis, 79 Lagrange-Element, 88 Lagrange-Hermite-Interpolation, 103 Lagrange-Interpolation, 79 Laplace (1749-1827), 1 Laplace-Operator, 1, 13, 30, 43, 48, 59, 155 Lastvektor, 116, 201 Lax (????-), 73 Lax-Milgram-Lemma, 73 Lebesgue (1875-1941), 23 Lebesgue-Raum, 26 Legendre (1752-1833), 158 Legendre-Polynom, 158 Lewy (????-????), 220 Line Search, 156 Linienmethode, 181, 185 M-Matrix, 54, 68, 193, 206 Mass-Lumping, 206 Massematrix, 116, 182, 201, 227 Matrix diagonal-dominant, 83 von nicht-negativem Typ, 52, 83 Matrizennorm, 1 Maximumnorm, 2 Maximumprinzip, 20, 112 diskretes, 53 elliptisches, 20 für finite Elemente, 83 parabolisches, 34 Maximumprinzipmethode, 192 Mehrgitter-Zyklus, 168 Mehrgitterverfahren, 166, 215 Mehrstellenformel, 67 Milgram (????-????), 73 Minimalfolge, 18 Mittelpunktregel, 123 Mittelpunkts-Verfahren, 185 Monombasis, 77 Morley (????-????), 90 Morley-Plattenelement, 90 Multiindex, 98 Nabla-Operator, 1 Nachglättung, 169 Navier (1785-1836), 5 Navier-Stokes-Gleichungen, 5 236 Neumann, von (1903-1957), 16 Nicolson (1917-1968), 185 Nitsche (1926-1996), 80 Normaleneinheitsvektor, 1 Numerische Dissipativität, 190 Numerische Integration, 121, 125, 151 Operator kompakt, 31 positiv-definit, 31 symmetrisch, 31 Orthonormalsystem, 173 Orts-Zeit-Diskretisierung, 184 Padé (1785-1836), 189 Padé-Schema, 189 Padé-Tafel, 189 Parallelogrammidentität, 18 Parseval (1755-1836), 37 Parsevalsche Identität, 37 Partielle Ableitung, 1 PCG-Verfahren, 163 Petrow (1912-1987), 75 Petrow-Galerkin-Verfahren, 75, 207 Plattengleichung, 7 Poincaré (1854-1912), 3 Poincarésche Ungleichung, 3, 27, 42, 43, 100 Poisson (1781-1840), 4 Poisson-Gleichung, 4, 7, 13, 15, 71, 109 Pollution-Effekt, 146 Polygonzugmethode, 183 Projektionsmethode, 74 Prolongation, 168, 169 Punktfehler-Schätzer, 137 Punktgitter, 45 Quadraturfehler, 124 Quadraturformel, 122 Rückwärtsdifferenzenformel, 185 Randbedingungen Dirichletsche, 15, 32, 71 natürliche, 72 Neumannsche, 16, 32, 72 Robinsche, 16, 32, 72 Randwertaufgabe, 15, 42 Referenzelement, 94, 102, 117 Referenztransformation, 95 Rellichscher Auswahlsatz, 30 INDEX Residuum, 132 Restriktion, 168, 169 Reynolds (1842-1912), 5 Richardson (1881-1953), 62 Richardson-Verfahren, 62, 166, 168, 180, 195 Riemann (1826-1866), 16 Riesz (1880-1956), 73 Rieszscher Darstellungssatz, 73 Ritz (1878-1909), 74 Ritz-Projektion, 108, 202, 227 Ritzsche Projektions-Verfahren, 74 Robin 1855-1897, 16 Rothe (1895-1988), 184 Rothe-Methode, 184, 201, 226 Runge (1856-1927), 207 Runge-Kutta-Verfahren, 207 Satz Geschachteltes Mehrgitterverfahren, 178 Mehrgitterkomplexität, 177 Mehrgitterkonvergenz, 175 von Cauchy-Kovalevskaya, 15 von Lax-Milgram, 147 Schlitzgebiet, 23 Schmidt (1876-1959), 158 Schnelle Fourier-Transformation, 61 Schrittweitensteuerung, 206 Seidel, von (1821-1896), 63 Separabilität, 216 Shortley (1910-), 49 Shortley-Weller-Approximation, 49, 53, 58, 60, 67, 81 Simplex, 95 Simpson-Verfahren, 186 Sobolew (1908-1989), 19 Sobolew-Raum, 18, 24, 26, 71 Sobolewsche Ungleichung, 29, 44 Sobolow-Raum, 43 SOR-Verfahren, 63 Spektral-Elemente-Methode, 77 Spektral-Galerkin-Verfahren, 77 Spektral-Methode, 36, 195 Spektral-Theorie, 30 Spektralkondition, 160, 215 Spektralnorm, 194 Spektralverfahren, 77 Spezieller Störungssatz, 120 Splitting-Methode, 216 INDEX Spur-Abschätzung, 28 Spur-Lemma, 28 Stabilität, 46 Startwert, 213 Steifigkeitsmatrix, 116, 182, 201, 227 Stiefel (1909-1978), 157 Stokes (1819-1903), 5 Strukturregularität, 78 Taylor (1685-1731), 10 Taylor-Reihe, 10 Teilschritt-θ-Verfahren, 191 Tensorprodukt-Basis, 77 Tensorprodukt-Gauß-Formel, 124 Tensorprodukt-Simpson-Regel, 124 Tensorprodukt-Trapezregel, 148 Tensorproduktformel, 123 Transfermatrix, 201 Trapezregel, 123 Triangulierung, 78 Tschebyscheff (1821-1894), 161 Tschebyscheff-Approximation, 161 Typeneinteilung, 10, 41 Unisolvenz, 88, 98, 149, 153 Unstetiges Galerkin-Verfahren, 207 V-Zyklus, 170 Variablenseparation, 33 Variationelle Formulierung, 72, 181, 226 Variationsgleichung, 6, 72, 74 Verfeinerungstrategie Fehleräquilibrierung, 142 Verträglichkeit, 46 Vieta (1540-1603), 13 Vietascher Wurzelsatz, 13 Von Neumannsche Methode, 193 Von Neumannsche Stabilitätsanalyse, 195 Vorglättung, 169 Vorkonditionierung, 62, 163 ADI, 165 Diagonal, 164 ICCG, 164 SSOR, 164 W-Zyklus, 170 Wärmeleitungsgleichung, 4, 5, 14, 32, 181, 211 Wellengleichung, 4, 7, 14, 38, 219, 226 Weller (????-????), 49 237 Wilson (????-????), 93 Wilson-Plattenelelement, 93 Wohl-gestellt, 9, 15 Zeilensummenkriterium schwaches, 53 Zeitschrittverfahren, 185 Zeitschrittweite, 182, 206, 219 Zelle, 77 Zellgewicht, 133 Zellresiduum, 132 Zusammenhang, 52 Zweigittermethode, 170 Zweigitteroperator, 172 Zweischrittformel, 219 Zweischrittverfahren, 182