Numerik Partieller Differentialgleichungen

Transcrição

Numerik Partieller Differentialgleichungen
Numerische Mathematik 2
(Numerik Partieller Differentialgleichungen)
Rolf Rannacher
Institut für Angewandte Mathematik
Universität Heidelberg
Vorlesungsskriptum WS 2007/2008
12. Februar 2008
ii
Adresse des Autors:
Institut für Angewandte Mathematik
Universität Heidelberg
Im Neuenheimer Feld 293/294
D-69120 Heidelberg, Deutschland
[email protected]
http://www.numerik.uni-hd.de
Inhaltsverzeichnis
Literaturverzeichnis
vi
0 Einleitung
1
0.1
Notation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1
0.2
Ableitung von partiellen Differentialgleichungen . . . . . . . . . . . . . . . . . . .
3
0.3
Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4
0.4
Numerische Methoden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7
1 Theorie partieller Differentialgleichungen
9
1.1
Typeneinteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10
1.2
Elliptische Probleme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
15
1.2.1
Existenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
16
1.2.2
Eindeutigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
20
1.2.3
Stetige Abhängigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
21
1.2.4
Regularität . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
22
Hilfsmittel aus der Theorie von Funktionenräumen . . . . . . . . . . . . . . . . .
24
1.3.1
Sobolew-Räume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
24
1.3.2
Eigenschaften von Lebesgue- und Sobolew-Räumen . . . . . . . . . . . . .
27
1.3.3
Elemente der Spektraltheorie elliptischer Operatoren . . . . . . . . . . . .
31
1.4
Parabolische Probleme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
33
1.5
Hyperbolische Probleme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
39
1.6
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
41
1.3
2 Differenzen-Verfahren für elliptische Probleme
2.1
2.2
2.3
2.4
45
Allgemeine Differenzenapproximationen . . . . . . . . . . . . . . . . . . . . . . .
45
2.1.1
Konsistenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
46
Eigenschaften der Differenzengleichungen . . . . . . . . . . . . . . . . . . . . . .
51
2.2.1
Das Konvergenzverhalten von Differenzenverfahren . . . . . . . . . . . . .
55
Lösungsaspekte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
60
2.3.1
Aufwandsanalyse: ein Beispiel . . . . . . . . . . . . . . . . . . . . . . . . .
64
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
68
iii
iv
INHALTSVERZEICHNIS
3 Finite-Elemente-Verfahren für elliptische Probleme
3.1
73
Allgemeine Projektionsverfahren . . . . . . . . . . . . . . . . . . . . . . . . . . .
73
3.1.1
Beispiele von Galerkin-Ansatzräumen . . . . . . . . . . . . . . . . . . . .
78
3.1.2
Diskretes Maximumprinzip für Finite-Elemente-Approximationen . . . . .
84
3.1.3
Approximation krummer Ränder . . . . . . . . . . . . . . . . . . . . . . .
86
3.2
Allgemeine Finite-Elemente-Ansätze . . . . . . . . . . . . . . . . . . . . . . . . .
91
3.3
Interpolation mit finiten Elementen . . . . . . . . . . . . . . . . . . . . . . . . . . 100
3.4
A priori Fehleranalyse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
3.4.1
3.5
3.6
3.7
Punktweise Fehlerabschätzung . . . . . . . . . . . . . . . . . . . . . . . . 110
Implementierungsaspekte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
3.5.1
Aufbau der Systemmatrizen und Vektoren . . . . . . . . . . . . . . . . . . 118
3.5.2
Konditionierung der Systemmatrix . . . . . . . . . . . . . . . . . . . . . . 120
3.5.3
Aufstellung der Systemmatrizen mit numerischer Integration . . . . . . . 123
A posteriori Fehleranalyse und Gittersteuerung . . . . . . . . . . . . . . . . . . . 132
3.6.1
Allgemeine a posteriori Fehlerabschätzung . . . . . . . . . . . . . . . . . . 132
3.6.2
Spezielle a posteriori Fehlerschätzer . . . . . . . . . . . . . . . . . . . . . 136
3.6.3
Strategien zur Gittersteuerung . . . . . . . . . . . . . . . . . . . . . . . . 141
3.6.4
Ein Testbeispiel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149
4 Iterative Lösungsverfahren für FD- und FE-Gleichungen
4.1
4.2
4.3
Krylow-Raum-Methoden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157
4.1.1
Verfahren der konjugierten Richtungen (CG-Verfahren) . . . . . . . . . . 159
4.1.2
CG-Verfahren für unsymmetrische und indefinite Probleme . . . . . . . . 164
4.1.3
Vorkonditionierung (PCG-Verfahren) . . . . . . . . . . . . . . . . . . . . . 165
Mehrgitterverfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168
4.2.1
Mehrgitteralgorithmus im Finite-Elemente-Kontext . . . . . . . . . . . . . 169
4.2.2
Konvergenz- und Aufwandsanalyse . . . . . . . . . . . . . . . . . . . . . . 174
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181
5 Verfahren für parabolische Probleme
5.1
157
183
Differenzenverfahren für parabolische Probleme . . . . . . . . . . . . . . . . . . . 187
5.1.1
Zeitschrittverfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187
5.1.2
Stabilität und Konvergenz . . . . . . . . . . . . . . . . . . . . . . . . . . . 194
INHALTSVERZEICHNIS
5.2
v
FE-Galerkin-Verfahren für parabolische Probleme . . . . . . . . . . . . . . . . . . 203
5.2.1
A priori Konvergenzabschätzungen . . . . . . . . . . . . . . . . . . . . . . 204
5.2.2
Fehlerkontrolle und Schrittweitensteuerung . . . . . . . . . . . . . . . . . 208
5.3
Verallgemeinerungen und Lösungsaspekte . . . . . . . . . . . . . . . . . . . . . . 215
5.4
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 220
6 Verfahren für hyperbolische Probleme
221
6.1
Differenzenverfahren für hyperbolische Probleme . . . . . . . . . . . . . . . . . . 221
6.2
Finite-Elemente-Verfahren für hyperbolische Probleme . . . . . . . . . . . . . . . 228
6.3
Verallgemeinerungen und Lösungsaspekte . . . . . . . . . . . . . . . . . . . . . . 230
6.4
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 231
Index
233
vi
INHALTSVERZEICHNIS
Literaturverzeichnis
[1] R. Rannacher: Numerische Mathematik 0 (Einf. in die Numerische Mathematik),
Vorlesungsskriptum, Universität Heidelberg,
http://numerik.uni-hd.de/∼lehre/notes/
[2] R. Rannacher: Numerische Mathematik 1 (Numerik Gew. Differentialgleichungen),
Vorlesungsskriptum, Universität Heidelberg,
http://numerik.uni-hd.de/∼lehre/notes/
(I) Theorie partieller Differentialgleichungen
[3] G. Hellwig: Partielle Differentialgleichungen,
B.G. Teubner 1960.
[4] A. Friedman: Partial Differential Equations,
Holt, Rinehart und Winston 1970.
[5] F. John: Partial Differential Equations,
Springer 1978.
[6] J. Wloka: Partielle Differentialgleichungen, Sobolewräume und Randwertaufgaben,
B.G. Teubner 1982.
[7] W. R. Strauss: Partial Differential Equations: An Introduction,
John Wiley 1992.
[8] M. Renardy, R. Rogers: An Introduction to Partial Differential Equations,
Springer 1993.
[9] A. Tveito, R. Winther: Introduction to Partial Differential Equations: A Computational
Approach, Springer 1998.
(II) Numerik partieller Differentialgleichungen
[10] R. D. Richtmeyer, K. W. Morton: Difference Methods for Initial Value Problems,
Interscience 1967.
[11] G. Strang, G. J. Fix: An Analysis of the Finite Element Method,
Prentice-Hall 1973.
[12] A. R. Mitchell: Computational Methods in Partial Differential Equations,
John Wiley 1976.
[13] A. R. Mitchell, R. Wait: The Finite Element Method in Partial Differential Equations,
John Wiley 1977.
[14] P. G. Ciarlet: The Finite Element Method for Elliptic Problems,
North-Holland 1978.
[15] A. R. Mitchell, D. F. Griffiths: The Finite Difference Method in Partial Differential Equations, John Wiley 1980.
vii
viii
LITERATURVERZEICHNIS
[16] O. Axelsson, V. A. Barker: Finite Element Solution of Boundary Value Problems, Theory
and Computation, Academic Press 1984.
[17] V. Thome: Galerkin Finite Element Methods for Parabolic Problems,
Springer 1984.
[18] W. Hackbusch: Theorie und Numerik elliptischer Differentialgleichungen,
B. G. Teubner 1986.
[19] C. Johnson: Numerical Solution of Partial Differential Equations by the Finite Element
Method, Cambridge University Press 1987.
[20] H. R. Schwarz: Methode der finiten Elemente,
B. G. Teubner 1991.
[21] W. Hackbusch: Iterative Lösung großer schwachbesetzter Gleichungssysteme,
B. G. Teubner 1991.
[22] F. Brezzi, M. Fortin: Mixed and Hybrid Finite Element Methods,
Springer 1991.
[23] D. Braess: Einführung in die Methode der Finiten Elemente,
Springer 1991.
[24] Ch. Großmann, H.-G. Roos: Numerik partieller Differentialgleichungen,
B. G. Teubner 1992.
[25] H. Goering, H.-G. Roos, L. Tobiska: Finite-Elemente-Methode,
Akademie-Verlag 1993.
[26] S. C. Brenner, L. R. Scott: The Mathematical Theory of Finite Element Methods,
Springer 1994.
[27] A. Quarteroni, A. Valli: Numerical Approximation of Partial Differential Equations,
Springer 1994.
[28] K. Eriksson, D. Estep, P. Hansbo, C. Johnson: Computational Differential Equations,
Cambridge University Press 1996.
[29] P. Knabner, L. Angermann: Numerik partieller Differentialgleichungen,
Springer 2000.
0 Einleitung
Gegenstand dieser Vorlesung sind numerische Algorithmen zur näherungsweisen Lösung von
partiellen Differentialgleichungen. In der Regel lassen sich für die in der Praxis auftretenden
partiellen Differentialgleichungen keine Lösungen in analytischer Form angeben. Man ist also auf
numerische Approximation angewiesen. Dabei wird das kontinuierliche Ausgangsproblem durch
ein diskretes“, d.h. endlich dimensionales, ersetzt und dieses dann mit Hilfe des Computers
”
gelöst.
0.1 Notation
Wir stellen zuächst einige der im folgenden verwendeten Begriffe und abkürzenden Bezeichnungen zusammen.
i) Unabhängige Variable: Wir betrachten (offene beschränkte) Gebiete Ω ⊂ Rd für d = 1, 2, 3
mit Rand ∂Ω. Der äußere Normaleneinheitsvektor zu ∂Ω ist n. Punkte im Rd sind x =
(x1 , ..., xd )T oder im R3 auch (x, y, z)T . Die Zeitvariable ist t. Für d-dimensionale Vektoren a, b wird das übliche euklidische1 Produkt mit (a, b) oder auch mit a · b bezeichnet.
Die euklidische Vektornorm ist kak := (a, a)1/2 und die zugehörige natürliche Matrizennorm
kAk := maxx∈Rd {kAxk, kxk = 1}.
ii) Funktionen: Wir betrachten im allgemeinen skalare Funktionen u = u(x) oder u = u(x, t)
für Argumente x ∈ Rd bzw. t ∈ R. In einigen Fällen treten auch vektorwertige Funktionen auf
u = (u1 , ..., ud )T , die im allgemeinen wie skalare Funktionen bezeichnet werden. Analog werden
Skalarprodukte und Normen über ein Gebiet Ω unterschiedslos für skalare wie für vektorwertige
Funktionen verwendet.
iii) Ableitungen: Für Funktionen u(t) , u(x) bzw. u(x, t) werden totale sowie partielle Ableitungen abgekürzt geschrieben als
dt u :=
du
,
dt
∂t u :=
∂u
,
∂t
∂x u :=
∂u
,
∂x
∂i u :=
∂u
,
∂xi
u.s.w.
und analog auch für höhere Ableitungen, z.B.: ∂tp u und ∂xq u . Mit dem Nabla-Operator ∇ werden der Gradient einer skalaren Funktion sowie die Divergenz einer Vektorfunktion geschrieben
als grad u = ∇u := (∂1 u, ..., ∂d u)T und div u = ∇ · u := ∂1 u1 + ... + ∂d ud . Zu einem Vektor
β ∈ Rd wird die Ableitung in Richtung β mit ∂β u := β · ∇u bezeichnet. Entsprechend ist z.B.
∂n u = n · ∇u die Ableitung in Richtung der äußeren Normalen entlang des Gebietsrandes ∂Ω .
Kombination von Divergenz- und Gradientenbildung ergibt den sog. Laplace2 -Operator“
”
∇ · (∇u) = ∆u = ∂12 u + ... + ∂d2 u.
Mit dem Symbol ∇m u bezeichnen wir den Tensor aller partiellen Ableitungen der Ordnung m
von u ; z.B. in zwei Dimensionen ∇2 u = (∂xi ∂yj u)i+j=2 .
1
Euklid (ca. 355-290 v. Chr.): griechischer Philosoph und Mathematiker; wirkte in Alexandria; sein mehrbändigen Lehrbuch “Die Elemente” faßte die Grundlagen der klassischen Geometrie zusammen; von ihm stammt das
klassische mathematische Ausdrucksschema “Voraussetzung - Behauptung - Beweis”.
2
Pierre Simon Marquis de Laplace (1749-1827): französischer Mathematiker und Astronom; Prof. in Paris;
begründete u.a. die Wahrscheinlichkeitsrechnung.
1
2
Einleitung
iv) Integralsätze: Für stückweise glatt berandete Gebiete Ω ⊂ Rd und hinreichend glatte Funktionen u, v gelten der klassische Integralsatz von Gauß3
Z
Z
n · u do,
(0.1.1)
∇ · u dx =
∂Ω
Ω
sowie als Folgerung die Integralformel von Green4
Z
Z
Z
u∆v dx.
u∂n v do −
∇u · ∇v dx =
(0.1.2)
Ω
∂Ω
Ω
v) Funktionenräume: Auf Punktmengen Ω ∈ Rd verwenden wir die üblichen Vektorräume von
stetigen bzw. stetig differenzierbaren Funktionen
C(Ω),
C m (Ω),
C0∞ (Ω).
Der Raum C(Ω) ist, versehen mit der Maximumnorm
kuk∞;Ω := max |u(x)|,
x∈Ω
vollständig, d.h. ein Banach-Raum5 . Weiter ist L2 (Ω) der Raum der auf Ω meßbaren und im
Lebesgueschen Sinne quadratintegrablen Funktionen. Versehen mit dem Skalarprodukt und der
zugehörigen Norm
Z
u(x)v(x) dx,
(u, v)Ω :=
Ω
1/2
kukΩ = (u, u)Ω ,
ist L2 (Ω) vollständig, d.h. ein Hilbert-Raum6 . Wenn der Definitionsbereich Ω aus dem Zusammenhang klar ist, wird er in der Bezeichnung von Skalarprodukten und Normen meist weggelassen; z.B.: kuk = kukΩ . Weitere Funktionenräume werden später an den Stellen eingeführt,
wo sie gebraucht werden.
vi) Ungleichungen: Wir listen einige der im folgenden häufig verwendeten Ungleichungen für
Funktionen aus den oben definierten Funktionenräumen. Für Funktionen u, v ∈ L2 (Ω) gilt die
Höldersche7 Ungleichung“
”
Z
Z
1/2 Z
1/2
|u(x)|2 dx
u(x)v(x) dx ≤
|v(x)|2 dx
,
(0.1.3)
Ω
3
Ω
Ω
Carl Friedrich Gauß (1777-1855): bedeutender deutscher Mathematiker, Astronom und Physiker; wirkte in
Göttingen.
4
George Green (1793-1841): englischer Mathematiker; Autodidakt und Besitzer einer Mühle; Beiträge zur
Potentialtheorie.
5
Stefan Banach (1892-1945): polnischer Mathematiker; Prof. in Lvov; begründete die Funktionalanalysis.
6
David Hilbert (1862-1943): bedeutender deutscher Mathematiker; wirkte in Königsberg und Göttingen; begründete u. a. den axiomatischen Aufbau der Mathematik; zum Wesen der Axiomatik (in der Geometrie) sagte
er “Man muß jederzeit anstelle von Punkten, Geraden, Ebenen - Tische, Stühle, Bierseidel sagen können”.
7
Ludwig Otto Hölder (1859-1937): deutscher Mathematiker; Prof. in Tübingen; Beiträge zunächst zur Theorie
der Fourier-Reihen und später vor allem zur Gruppentheorie; fand 1884 die nach ihm benannte Ungleichung.
0.2 Ableitung von partiellen Differentialgleichungen
3
bzw. in kompakter Schreibweise: |(u, v)|Ω ≤ kukΩ kvkΩ . Für Funktionen u ∈ C(Ω) ∩ C 1 (Ω) mit
den Eigenschaften u|∂Ω = 0 und |∇u| ∈ L2 (Ω) gilt die Poincarésche8 Ungleichung“
”
1/2
1/2
Z
Z
|∇u(x)|2 dx
|u(x)|2 dx
,
(0.1.4)
≤ dΩ
Ω
Ω
bzw. in kompakter Schreibweise: kukΩ ≤ dΩ k∇ukΩ , wobei dΩ := diam(Ω) .
0.2 Ableitung von partiellen Differentialgleichungen
Partielle Differentialgleichungen werden meist als mathematische Modelle zur Beschreibung physikalischer Vorgänge abgeleitet. Ziel ist es, die Eigenschaften dieser Vorgänge durch die Gleichungen möglichst vollständig zu erfassen und davon ausgehend dann ihren Ablauf vorherzusagen.
Bei der Konstruktion solcher Gleichungen geht man häufig nach recht formalen Regeln vor und
verwendet Analogieschlüsse. Völlig unterschiedliche physikalische Prozesse lassen sich häufig
durch Gleichungen sehr ähnlicher Gestalt beschreiben.
i) Harmonische (d.h. schwingende“) Ausbreitungsvorgänge sind z.B. die Ausbreitung einer Was”
serwelle (lokale Störung der Wasseroberfläche) oder eines Geräuschs (lokale Störung der Luftdichte). Es erscheint sinnvoll, diese im einfachsten Fall durch eine Funktion u = u(x, t) im Ort
x und der Zeit t der Form u(x, t) = sin(x) sin(t) zu beschreiben. Diese genügt der Differentialgleichung
∂t2 u = ∂x2 u.
(0.2.5)
Es zeigt sich, daß diese sog. Wellengleichung“ tatsächlich die in der Natur auftretenden Schwin”
gungsvorgänge beschreibt. Sie ist der Prototyp einer hyperbolischen“ Differentialgleichung.
”
ii) Andere Ausbreitungsvorgänge sind dadurch gekennzeichnet, daß lokale Störungen nicht schwingend, sondern diffundierend“ und sich abschwächend fortgepflanzt werden, z.B.: Temperatur”
ausbreitung in einem Leiter (Wärmeleitung) oder Verteilung einer Dichtekonzentration in einer
Flüssigkeit (Stofftransport). Zur Beschreibung solcher Vorgänge dienen Funktionen der Form
u(x, t) = sin(x) e−t . Diese genügen der Differentialgleichung
∂t u = ∂x2 u.
(0.2.6)
Es zeigt sich, daß diese sog. Wärmeleitungsgleichung“ tatsächlich die in der Natur auftreten”
den Diffusionsvorgänge beschreibt. Sie ist der Prototyp einer parabolischen“ Differentialglei”
chung. In Fall zweier Raumdimensionen, u = u(x, y, t) , lautet die Wärmeleitungsgleichung unter
Berücksichtigung von externen Wärmequellen
∂t u = ∂x2 u + ∂y2 u = ∆u + f.
(0.2.7)
8
Jules Henri Poincaré (1854-1912): französischer Mathematiker; Prof. an der École Polytechnique und der
Sorbonne in Paris; eins der letzten mathematischen Universalgenies; fundamentale Beiträge zu allen Bereichen
der Mathematik, zur Himmelsmechanik, Strömungsmechanik und Wissenschaftsphilosophie.
4
Einleitung
iii) Der Grenzzustand für t → ∞ eines Diffusionsprozesses u(x, y, t) , z.B. beschrieben durch
die Wärmeleitungsgleichung (0.2.7), ist als Lösung der sog. Poisson9 -Gleichung“
”
−∆u = −∂x2 u − ∂y2 u = f,
(0.2.8)
gegeben. Diese ist der Prototyp einer elliptischen“ Differentialgleichung.
”
0.3 Beispiele
Die folgenden Beispiele aus verschiedenen Wissenschaftsdisziplinen vermitteln einen Eindruck
von der Vielfältigkeit der auftretenden Probleme.
1. Erhaltungsgleichungen
Die Grundgleichungen der (klassischen) Kontinuumsmechanik basieren auf dem physikalischen
Grundprinzip der Erhaltung“, d.h.: Zustandsgrößen wie z.B. Massedichte ρ(x, t), innere Ener”
gie bzw. Temperatur T (x, t), Impuls ρ(x, t)~v (x, t), u.s.w., werden als Dichtefunktionen beschrieben, deren Integrale über beliebige bewegte Kontrollvolumen“ sich beim Fehlen von äußeren
”
Einflüssen nicht verändern. Für die zeitliche Veränderung der Masse mV (t) eines solchen mit
dem Geschwindigkeitsfeld v = (v1 , v2 , v3 ) bewegten Volumens V (t) gilt (sog. Reynoldsches10
”
Transporttheorem“)
Z
Z
{∂t ρ + ∇ · (ρv)} dx.
(0.3.9)
ρ(x, t) dx =
0 = dt mV (t) = dt
V (t)
V (t)
Da dies für beliebige Volumen V (t) gelten soll, ergibt sich für stetige Dichtefunktionen die
folgende Erhaltungsgleichung 1. Ordnung (sog. Kontinuitätsgleichung“):
”
∂t ρ + ∇ · (ρv) = 0.
(0.3.10)
Auf analogem Wege erhält man aus dem Erhaltungssatz für die Temperatur unter Berücksichtigung von Quelltermen und Wärmediffusion in einem ruhenden Medium ( ~v ≡ 0) die folgende
Erhaltungsgleichung 2. Ordnung (sog. Wärmeleitungsgleichung“):
”
∂t T − ∇ · (a∇T ) = ∇ · q,
(0.3.11)
Physikalische Anschauung erfordert, daß Lösungen zu diesen Gleichungen bei physikalisch sinnvollen Anfangs- und Randbedingungen stets positiv sind: ρ > 0, T > 0 . Wir werden sehen, daß
dies tatsächlich der Fall ist. Die entsprechenden Erhaltungssätze für Impuls und Drehimpuls
führen unter geeigneten zusätzlichen Annahmen zusammen mit der Kontinuitätsgleichung auf
9
Siméon Denis Poisson (1781-1840): französischer Mathematiker und Physiker; Prof. in Paris; Beiträge zur
mathematischen Formulierung der Physik, zum Magnetismus, zur Himmelsmechanik und Wahrscheinlichkeitsrechnung; einer der Begründer der Potentialtheorie.
10
Osborn Reynolds (1842-1912): englischer Ingenieur und Mathematiker; Prof. in Manchester; Beiträge zur
Theorie des Elektro-Magnetismus und der Strömungslehre, Fundamente der Turbulenzbeschreibung und der hydrodynamischen Stabilität.
0.3 Beispiele
5
die bekannten Navier11 -Stokes12 -Gleichungen“ für inkompressible, Newtonsche Fluide mit kon”
stanter Dichte und Temperatur ( ρ ≡ konst., T ≡ konst.):
∂t v − ν∆v + v · ∇v + ∇p = f,
∇ · v = 0.
(0.3.12)
Diese werden hier aber nur der Vollständigkeit halber formuliert und im Laufe dieser Vorlesung
nicht näher betrachtet.
2. Variationsgleichungen
Die Grundgleichungen der (klassischen) Elastizitätstheorie basieren auf dem physikalischen Grundprinzip der Energieminimierung“, d.h.: Der von einem elastischen Körper unter statischer
”
äußerer Belastung eingenommene Zustand ist so betimmt, daß er die potentielle Gesamtenergie des Systems minimiert. Zur Beschreibung eines elastischen Systems werden in der linearen
Theorie die folgenden Größen verwendet: der Verschiebungsvektor u , der Verzerrungstensor
ε(u) := 12 (∇u + ∇uT ) , der flächenorientierte (symmetrische) Spannungstensor σ und die Volumenkraft f . Die Spannungen σ sind die Reaktionskräfte des Körpers auf von außen erzwungene
Verzerrungen ε(u) und werden idealisierend in einer linearen Beziehung angenommen, dem sog.
(elastischen) Materialgesetz“, σ = Aε(u) , mit dem symmetrischen und positiv definiten Elasti”
zitätstensor A . Die potentielle Gesamtenergie des belasteten, elastischen Körpers schreibt sich
dann in der Form:
Z
Z
Z
Z
1
1
f u dx =
f u dx.
(0.3.13)
σ : ε(u) dx −
Aε(u) : ε(u) dx −
E(u) =
2 Ω
2 Ω
Ω
Ω
Die sich unter der äußeren Belastung einstellende Verschiebung in einen neuen Gleichgewichtszustand u∗ verleiht dann E(·) einen minimalen Wert unter allen zulässigen Verschiebungen,
d.h. solchen mit denselben Randwerten. Für einen solchen optimalen Zustand u∗ gilt dann
notwendig
d
E(u∗ + εϕ)|ε=0 = 0,
dε
für beliebige zulässige“ Variationen ϕ . Auswertung dieser Beziehung liefert die sog. Variati”
”
onsgleichung“
(Aε(u), ε(ϕ))Ω = (f, ϕ)Ω
∀ zulässigen“ ϕ.
”
(0.3.14)
Dabei bedeutet zulässig“ für eine Testfunktion ϕ, daß sie hinreichend glatt ist und entlang des
”
Randes ∂Ω verschwindet. Nimmt man an, daß das Minimum u hinreichend glatt ist, so folgt
durch partielle Integration
(∇ · Aε(u) + f, ϕ)Ω = 0 ∀ zulässigen“ ϕ,
”
11
Claude Louise Marie Henri Navier (1785-1836): französischer Bauingenieur und Mathematiker; Prof. an der
École Polytechnique in Paris; Beiträge zum Brückenbau (erste Theorie der Hängebrücke), Elastizitätstheorie und
Strömungsmechanik.
12
Sir Georg Gabriel Stokes (1819-1903): englischer Mathematiker und Physiker; Prof. in Cambridge; Beiträge
zur Differential- und Integralrechnung, zur Hydrodynamik und zur Theorie des Lichts, Spektralanalyse und
Fluoreszenz.
6
Einleitung
und hieraus das Differentialgleichungssystem 2. Ordnung (in kompakter sowie ausführlicher
Schreibweise)
−∇ · Aε(u) = f
⇔
−
d
d X
X
∂i Aijkl εkl (u) = fj
(j = 1, ..., d).
(0.3.15)
i=1 k,l=1
Der wohl einfachste (mehrdimensionale) Spezialfall eines elastisch deformierten Körpers ist
die eingespannte Membran“ in einem (beschränkten) Gebiet Ω ⊂ R2 (Trommelfell). Hier wird
”
eine Belastung nur in vertikaler Richtung zugelassen f~ = (0, 0, f ) und entsprechend auch nur
die Auslenkung in vertikaler Richtung ~u = (0, 0, u) berücksichtigt. Der Elastizitätstensor ist
diagonal und wird hier der Einfachheit halber zu A = aI gesetzt. Dann nimmt das obige
Funktional der potentiellen Gesamtenergie die Form an
E(u) = 12 ak∇uk2Ω − (f, u)Ω ,
(0.3.16)
und die zugehörige Differentialgleichung ( Poisson-Gleichung“) lautet
”
−a∆u = f,
in Ω.
(0.3.17)
Da die Membran am Rand eingespannt sein soll, muß weiter u|∂Ω = 0 sein.
In einer elastischen Membran wirken als Gegenkräfte zur Belastung reine Federkräfte (in
vertikaler Richtung) und keine Biegemomente. Dies ist begründet durch die Vernachlässigung
der Dicke der Membran. Flache Körper mit (konstanter) positiver, aber geringer Dicke werden als Platten“ bezeichnet. Im Rahmen der linearen Kirchhoffschen Plattentheorie“ werden
”
”
zwar Biegemomente berücksichtigt, aber nur vertikale Verschiebungen zugelassen ( Kirchhoff”
Hypothese“). Im Fall kleiner Verschiebungen (gegenüber der Plattendicke) erhält dann die potentielle Gesamtenergie die Form
E(u) = 12 Dk∆uk2Ω + (1 − σ)D (∂12 u, ∂22 u)Ω − k∂1 ∂2 uk2Ω − (f, u)Ω ,
mit Materialparametern σ ∈ (0, 1), D > 0 . Die zulässigen Funktionen müssen in diesem Fall quadratintegrable zweite Ableitungen besitzen. Durch den Variationsansatz wie oben erhält man als
notwendige (und hinreichende) Bedingung für ein Energieminimum die sog. Plattengleichung“
”
D∆2 u = f.
(0.3.18)
Aus naheliegenden Gründen wird der Operator 4. Ordnung ∆2 auch biharmonischer Opera”
tor“ genannt. Ist die Platte am Gebietsrand eingespannt“, so müssen die Randbedingungen
”
u|∂Ω = 0, ∂n u|∂Ω = 0 erfüllt sein. Wir merken an, daß ein identisches Modell bei der Beschreibung viskoser, inkompressibler Strömungen in zwei Raumdimensionen als Gleichung für die sog.
Stromfunktion“ ϕ auftritt; das Geschwindigkeitsfeld ergibt sich dabei durch Rotationsbildung
”
u := (∂y ϕ, −∂x ϕ)T .
3. Schwingungsgleichungen
Wenn der elastische Körper unter Belastung zeitliche Schwingungen ausführen kann, so wird die
zugehörige Auslenkung eine Funktion des Orts und der Zeit, u(x, t), und genügt im Rahmen
0.4 Numerische Methoden
7
der linearen Theorie der sog. elastische Schwingungsgleichung“
”
∂t2 u − ∇ · Aε(u) = f.
(0.3.19)
Die Gleichung für die frei schwingende Membran ist die klassische Wellengleichung“
”
∂t2 u = a∆u.
(0.3.20)
Diese beschreibt allgemein die Ausbreitung von Wellen in schwingfähigen Medien (z.B. Schallwelle in einem Gas, Auslenkung einer elastischen Membran oder die Amplitude eines elektrischen
Feldes). Sie wird üblicherweise zusammen mit Randbedingungen“ u|∂Ω = 0 sowie Anfangsbe”
”
dingungen“ u|t=0 = u0 , ∂t u|t=0 = u1 betrachtet.
0.4 Numerische Methoden
Aus den oben skizzierten Wegen zur Herleitung von partiellen Differentialgleichungen gewinnt
man unmittelbar Ansätze zu deren Diskretisierung.
1. Differenzenverfahren
Ersetzt man die Ableitungen in den Differentialgleichungen (0.2.5), (0.2.6), (0.2.7) und (0.2.8)
durch geeignete Differenzenquotienten bezüglich eines regulären Punktegitters, gewinnt man
lineare Gleichungen für die zugehörigen diskreten“ Funktionswerte. Dies ist eine sog. Differen”
”
zenapproximation“ der Differentialgleichung. Die Eigenschaften solcher Differenzengleichungen,
d.h. ihre Lösbarkeit und Approximationsgüte, werden weiter unten eingehend behandelt.
2. Finite-Volumen-Verfahren
Die lokale Erhaltungseigenschaft (0.3.9) führt dadurch auf ein numerisches Verfahren, daß man
für die Lösung einen bzgl. einer endlichen Zerlegung des Gebiets Ω in Teilvolumina (z.B. Dreiecke oder Vierecke) stückweise konstanten Ansatz macht und die Gültigkeit der Erhaltungseigenschaften dafür auf jedem der sog. Kontrollvolumen fordert. Dies führt auf ein algebrai”
”
sches Gleichungssystem für die zugehörigen Zellmittelwerte. Dieser Diskretisierungsansatz wird
Finite-Volumen-Methode“ genannt. Derartige Methoden finden hauptsächlich im Bereich der
”
numerischen Strömungsmechanik Anwendung. Wegen ihrer eingeschränkten Anwendbarkeit und
schwierigen Analysierbarkeit werden wir uns mit dieser Methodenklasse in dieser Vorlesung nicht
weiter befassen.
3. Variationsmethoden ( Methode der finiten Elemente“)
”
Die Variationsgleichung (0.3.14) führt durch Einschränkung auf einen endlich dimensionalen
Teilraum Vh des Lösungsraums des kontinuierlichen Variationsproblems auf eine diskrete Variationsaufgabe
(Aε(uh ), ε(ϕh ))Ω = (f, ϕh )Ω
∀ zulässigen“ ϕh ∈ Vh .
”
(0.4.21)
8
Einleitung
Dies ist äquivalent zu einem linearen (quadratischen) Gleichungssystem für die Entwicklungskoeffizienten der diskreten Lösung uh bzgl. einer geeignet gewählten Basis des Ansatzraumes Vh .
Sind die Funktionen in Vh stückweise polynomial bzgl. einer Zerlegung des Gebiets Ω z.B. in
Dreiecke oder Vierecke gewählt, liegt eine sog. Finite-Elemente-Methode“ vor. Diese Methoden
”
werden unten sehr ausführlich behandelt.
1 Theorie partieller Differentialgleichungen
In diesem Kapitel wird eine Einführung in die Theorie der partiellen Differentialgleichungen
gegeben, soweit sie für deren numerische Behandlung relevant ist. Wir betrachten zunächst
lineare Differentialgleichungen zweiter Ordnung der Form
Lu := −
d
X
aij ∂i ∂j u +
d
X
aj ∂j u + au = f,
(1.0.1)
j=1
i,j=1
mit gegebenen Koeffizientenfunktionen aij , aj , a und rechter Seite f . Wenn diese Funktionen
nicht zusätzlich von der unbekannten Lösung u abhängen, nennt man die Gleichung linear“.
”
Wegen der Vertauschbarkeit der Reihenfolge der Ableitungen kann o.B.d.A. aij = aji angenommen werden. Für allgemeine nichtlineare Gleichungen
F (x, u, ∇u, ∇2 u) = 0
(1.0.2)
gibt es keine einheitliche Lösungstheorie. Wir beschränken uns im folgenden daher im wesentlichen auf lineare Probleme.
Differentialgleichungen werden in der Regel auf (beschränkten oder halbbeschränkten) Gebieten Ω ⊂ Rd betrachtet. Dazu kommen dann noch Bedingungen entlang des Randes ∂Ω. Die
geeignete Wahl dieser Randbedingungen“ ist eine sehr delikate Sache und erfordert eingehende
”
Berücksichtigung der speziellen Eigenschaften des Differentialoperators. Diesen wird der nächste
Abschnitt gewidmet sein.
Damit eine Differentialgleichung mit den zugehörigen Randbedingungen ein sinnvolles Modell
eines realen physikalischen Vorgangs ist, sind eine Reihe von Forderungen zu stellen:
i) Existenz von Lösungen in einem möglicherweise verallgemeinerten Sinne; unter einer klassi”
schen“ Lösung versteht man eine solche, für die alle auftretenden Ableitungen im Gebietsinnern
im strengen Sinne definiert sind und die bis an den Rand stetig ist, d.h.: u ∈ C 2 (Ω) ∩ C(Ω).
ii) Eindeutigkeit der Lösungen möglicherweise unter Hinzunahme von weiteren physikalisch motivierten Bedingungen.
iii) Stetige Abhängigkeit von den Daten wegen der meist inexakten Verfügbarkeit von Koeffizienten und Randdaten in den physikalischen Modellen; Lösungen sollten sich unter kleinen
Datenstörungen auch nur wenig ändern.
Eine Aufgabe, welche diesen Minimalforderungen genügt, nennt man wohl-gestellt“ (im Sinne
”
von Hadamard1 ).
Bei Anfangs- oder Randwertaufgaben gewöhnlicher Differentialgleichungen war die Regularität der Lösung kein besonderes Thema, da sich die Regularität der Daten direkt auf die
entsprechende der Lösung überträgt. Bei partiellen Differentialgleichungen ist dies nicht immer
der Fall und bedarf für verschiedene Typen von Differentialgleichungen gesonderter Untersuchung.
1
Jacque Salomon Hadamard (1865-1963): französischer Mathematiker; Prof. in Bordeaux und Paris; viele
wichtige Beiträge zur komplexen Analysis und speziellen Funktionen, zur analytische Zahlentheorie, zur Variationsrechnung und zu den Differentialgleichungen der mathematischen Physik.
9
10
Theorie partieller Differentialgleichungen
1.1 Typeneinteilung
Partielle Differentialgleichungen lassen sich in drei Haupttypen einteilen: die elliptischen“, die
”
parabolischen“ und die hyperbolischen“ Gleichungen. Wir werden das dieser Unterteilung
”
”
zugrunde liegende Prinzip anhand einer leicht überschaubaren Situation erläutern. Dies sind die
linearen, skalaren Gleichungen 2. Ordnung in zwei Variablen:
Lu = a11 ∂x2 u + 2a12 ∂x ∂y u + a22 ∂y2 u + a1 ∂x u + a2 ∂y u + au = f
mit konstanten Koeffizienten aij . Dabei sollen nicht alle drei Koeffizienten a11 , a12 , a22 der
Ableitungen zweiter Ordnung gleichzeitig Null sein. Diese Gleichung wird auf einem Gebiet
Ω ⊂ R2 betrachtet.
Ausgangspunkt ist ein direkter Lösungsansatz, wie er auch bei gewöhnlichen Differentialgleichungen angewendet werden kann. Für die Anfangswertaufgabe
u′ (t) = f (t, u(t)),
t ≥ 0,
u(0) = u0 ,
erhält man aus der Vorgabe u(0) = u0 durch sukzessives Differenzieren von f (t, x) Formeln für
alle Ableitungen von u :
u(i) (0) =
di−1
f (0, u0 ) =: f (i−1) (0, u0 ),
dti−1
i = 1, 2, 3, ... .
Wenn die Ableitungen f (i−1) nicht zu schnell wachsen (für f (t, x) = sin(x) sind sie z.B.
gleichmäßig beschränkt), konvergiert die Taylor2 -Reihe
u(t) = u0 +
∞ i
X
t
i=1
i!
f (i−1) (0, u0 )
für alle t ≥ 0 absolut und stellt die (eindeutige) Lösung der Anfangswertaufgabe dar.
y
Ω
n
Γ
x
Abbildung 1.1: Konfiguration der allgemeinen partiellen Differentialgleichung
2
Brook Taylor (1685-1731): englischer Mathematiker und Schüler Newtons; die nach ihm benannte Reihenentwicklung war im Kern bereits Gregory, Newton, Leibniz und Johann Bernoulli bekannt.
1.1 Typeneinteilung
11
Wir versuchen, diese Konstruktion auf partielle Differentialgleichungen zu übertragen. Dazu
sei Γ ein Jordan3 -Kurvenstück in Ω mit beliebig oft differenzierbarer Parametrisierung Γ =
{(x(τ ), y(τ )), τ ∈ [0, 1]} . Entlang Γ seien für die Lösung u(x, y) der Differentialgleichung die
Funktionswerte u sowie ihre Ableitungen ∂n u in Normalenrichtung n zu Γ vorgegeben. Dies
entspricht der Tatsache, daß wir es mit einer Differentialgleichung 2. Ordnung zu tun haben.
Mit u und ∂n u ist der ganze Gradient ∇u = (∂x u, ∂y u)T entlang Γ bekannt. Wir wollen
versuchen, aus diesen Vorgaben alle weiteren Ableitungen von u entlang Γ zu bestimmen, um
damit wieder einen Taylor-Reihenansatz für u in einer Umgebung von Γ zu machen. Zu diesem
Zweck führen wir die Abkürzungen ein:
p := ∂x u,
q := ∂y u,
r := ∂x2 u,
s := ∂x ∂y u,
t := ∂y2 u.
Differentiation von p und q entlang Γ , d.h. bzgl. des Parameters τ , ergibt
∂τ p = ∂x p∂τ x + ∂y p∂τ y = r∂τ x + s∂τ y,
∂τ q = ∂x q∂τ x + ∂y q∂τ y = s∂τ x + t∂τ y.
mit den bekannten tangentialen Ableitungen ∂τ x und ∂τ y entlang Γ. Zusammen mit der Differentialgleichung Lu = f ergibt dies ein 3 × 3-Gleichungssystem für die drei gesuchten Ableitungen r, s, t:
a11 r + 2a12 s + a22 t = f − a1 p − a2 q − au
∂τ xr + ∂τ ys
= ∂τ p
∂τ xs + ∂τ yt = ∂τ q
mit entlang Γ bekannter rechter Seite. Die Determinante der Koeffizientenmatrix B erhält man
durch Entwicklung nach der ersten Zeile zu
det B = a11 ∂τ y 2 − 2a12 ∂τ x∂τ y + a22 ∂τ x2 .
Wir unterscheiden jetzt zwei Fälle.
i) Fall det B 6= 0 entlang ganz Γ:
In diesem Fall sind alle zweiten Ableitungen r, s, t von u durch Vorgabe von u, ∂n u entlang
Γ (eindeutig) bestimmbar. Durch weitere Differentiation des Gleichungssystems nach x und y
erhält man wieder ein System für die dritten Ableitungen ∂x r, ∂x s, ∂x t sowie ∂y r, ∂y s, ∂y t jeweils
mit derselben Koeffizientenmatrix. Durch weiteres Differenzieren lassen sich so alle höheren
Ableitungen von u entlang Γ bestimmen. Durch den Reihenansatz
u(x, y) =
X (x − x0 )i (y − y0 )j
∂xi ∂yj u(x0 , y0 )
(i + j)!
i+j≥0
bzgl. eines Punktes (x0 , y0 ) ∈ Γ erhält man dann in einer Umgebung der Kurve Γ eine Lösung
der Differentialgleichung, die auf Γ die vorgegebenen Werte annimmt. Diese nennt man Lösung
der Cauchyschen4 Anfangswertaufgabe“ der Differentialgleichung bzgl. der Anfangskurve“ Γ.
”
”
3
Marie Ennemond Camille Jordan (1838-1922): französischer Mathematiker; Prof. in Paris; Beiträge zur Algebra, Gruppentheorie, Analysis und Topologie.
4
Augustin Louis Cauchy (1789-1857): Ingenieur, Physiker und bedeutendster französischer Mathematiker seiner
Zeit; wirkte an der École Polytechnique und der Sorbonne in Paris; gilt als Begründer der modernen Analysis und
12
Theorie partieller Differentialgleichungen
ii) Fall det B = 0 in einem Punkt (x0 , y0 ) ∈ Γ:
Die quadratische Gleichung
a11 ∂τ y 2 − 2a12 ∂τ x∂τ y + a22 ∂τ x2 = 0
bestimmt gewisse Richtungen ∂τ y/∂τ x = dy/dx bzw. ∂τ x/∂τ y = dx/dy von Kurven (mit
Graph y = y(x) oder x = x(y) ) durch den Punkt (x0 , y0 ). Zu deren Bestimmung sei etwa
angenommen, daß a11 6= 0 und ∂τ x 6= 0. Dann besitzt die Gleichung
dy 2
dx
die Lösungen
dy dx
+/−
−
=
2a12 dy a22
+
=0
a11 dx
a11
a12
1
±
a11 a11
q
a212 − a11 a22 .
Diese entsprechen Steigungen von Kurven durch den Punkt (x0 , y0 ) ∈ Γ , entlang welcher die
höheren Ableitungen von u sich nicht aus den Vorgaben entlang Γ bestimmen lassen. Entlang
dieser kritischen, auch charakteristisch“ genannten Kurven (sog. Charakteristiken“ des Dif”
”
ferentialoperators L) läßt sich also die Lösung der Differentialgleichung nicht aus den obigen
Vorgaben konstruieren. Entlang solcher Kurven können Unstetigkeiten in der Lösung oder ihres Gradienten auftreten. Es ist also sehr wichtig, die Existenz von Charakteristiken und deren
Gestalt für den zu betrachtenden Differentialoperator vor Ansatz eines numerischen Verfahrens genau zu bestimmen. Offensichtlich hängt die Existenz von Charakteristiken allein von
den Koeffizienten der höchsten Ableitungen des Operators L , d.h. seinem sog. Hauptteil“
”
a11 ∂x2 u + 2a12 ∂x ∂y u + a22 ∂y2 u , ab. Diesem wird die quadratische Form
q(x, y) := a11 x2 + 2a12 xy + a22 y 2
zugeordnet. Die Gleichung q(x, y) = 0 beschreibt Kegelschnitte in der (x, y)-Ebene:

< 0 :
2
a12 − a11 a22 = 0 :

>0:
Ellipse,
P arabel,
Hyperbel.
Von dieser rein formalen Charakterisierung stammen die obigen Bezeichnungen für die drei
Typen von partiellen Differentialgleichungen. Die Klassifikation eines Differentialoperators als
elliptisch“, parabolisch“ oder hyperbolisch“ wird für jeden einzelnen Punkt (x0 , y0 ) sepa”
”
”
rat vorgenommen. Im Falle variabler Koeffizienten aij = aij (x, y) oder im nichtlinearen Fall
aij (u(x, y)) kann der Typ einer Gleichung also im Lösungsgebiet wechseln. Wir werden im folgenden nur Gleichungen eines einheitlichen Typs betrachten; in vielen Anwendungen spielt aber
gerade der Typwechsel eine wichtige Rolle.
Als nächstes wollen wir die prototypischen Vertreter von (linearen) elliptischen, parabolischen und hyperbolischen Differentialgleichungen ableiten. Dies wird uns erneut auf die obige
Typenunterteilung führen. Dazu schreiben wir den Hauptteil L0 des Differentialoperators in
der Funktionentheorie.
1.1 Typeneinteilung
13
Matrix-Vektor-Form:
L0 =
a11 ∂x2
+ 2a12 ∂x ∂y +
a22 ∂y2
=
∂x
∂y
!T
a11 a12
a21 a22
!
∂x
∂y
!
= ∇T A∇
Die symmetrische Matrix A besitzt zwei reelle Eigenwerte λ, µ und ein zugehöriges Orthonormalsystem von Eigenvektoren {ξ, η} . Mit der Spaltenmatrix Q := [ξ, η] gilt
QQT = I,
QT AQ = D = diag(λ, µ).
Damit können wir schreiben:
L0 = ∇T QDQT ∇ = (QT ∇)T D(QT ∇)
!T
!
!
ξ1 ∂x + ξ2 ∂y
λ 0
ξ1 ∂x + ξ2 ∂y
=
0 µ
η1 ∂x + η2 ∂y
η1 ∂x + η2 ∂y
bzw.
L0 = λ(ξ1 ∂x + ξ2 ∂y )2 + µ(η1 ∂x + η2 ∂y )2 ,
oder mit den Richtungsableitungen ∂ξ = ξ · ∇ und ∂η = η · ∇ :
L0 = λ∂ξ2 + µ∂η2 .
Die Eigenwerte erhält man als Nullstellen des charakteristischen Polynoms
det(A − zI) = (a11 − z)(a22 − z) − a212 = z 2 − (a11 + a22 )z + a11 a22 − a212
= (z − λ)(z − µ) = z 2 − (λ + µ)z + λµ.
Durch Koeffizientenvergleich findet man ( Vietascher5 Wurzelsatz).
”
λ + µ = a11 + a22 ,
λµ = a11 a22 − a212 .
a) Elliptischer“ Fall a212 − a11 a22 < 0 :
”
Beide Eigenwerte λ, µ sind ungleich Null und haben dasselbe Vorzeichen. Die Lösungen der
charakteristischen Gleichung sind nicht reell, d.h.: Es existieren keine charakteristischen Kurven
durch den Punkt (x0 , y0 ). In diesem Fall ist der Konstruktionsprozeß für die höheren Ableitungen
von u durchführbar. Die Normalform eines elliptischen Operators L ist im Fall λ = µ = 1 :
Lu = ∂ξ2 u + ∂η2 u + ψ(ξ, η, u, ∂ξ u, ∂η u)
Der Hauptteil“ dieses Operators ist also gerade der Laplace-Operator“ ∆ , der sich somit als
”
”
prototypischer Vertreter elliptischer Differentialoperatoren 2. Ordnung erweist. Wir werden uns
daher im Folgenden hauptsächlich mit der zugehörigen Poisson-Gleichung beschäftigen:
∂x2 u + ∂y2 u = f.
(1.1.3)
5
Francois Viete, lat. Franciscus Vieta (1540-1603): französischer Mathematiker; Arbeiten über algebraische
Gleichungen und sphärische Trigonometrie; gab trigonometrische Tafeln heraus und führte die systematische
Buchstabenrechnung ein.
14
Theorie partieller Differentialgleichungen
b) Parabolischer“ Fall: a212 − a11 a22 = 0
”
Einer der Eigenwerte ist Null; der zweite ist dann notwendig ungleich Null. Es existiert genau
eine charakteristische Richtung im Punkt (x0 , y0 ) mit der Steigung dy/dx = a12 /a11 . Die
Normalform eines parabolischen Operators L ist im Fall λ = 1, µ = 0 :
Lu = ∂ξ2 u + ψ(ξ, η, u, ∂ξ u, ∂η u).
Der Hauptteil dieses Operators ist im linearen Fall gerade der sog. Wärmeleitungsoperator“,
”
der prototypische Vertreter parabolischer Differentialoperatoren 2. Ordnung. Wir werden uns
daher im folgenden mit der zugehörigen Wärmeleitungsgleichung beschäftigen:
∂t u − ∂x2 u = f.
(1.1.4)
c) Hyperbolischer“ Fall: a212 − a11 a22 > 0
”
Beide Eigenwerte sind ungleich Null, haben aber verschiedene Vorzeichen. Es existieren zwei
charakteristische
Richtungen im Punkt (x0 , y0 ) mit den Steigungen (dy/dx)± = a12 /a11 ±
p
−1
2
a11 a12 − a11 a22 . Die Normalform eines hyperbolischen Differentialoperators L ist im Fall
λ = 1, µ = −1 :
Lu = ∂ξ2 u − ∂η2 u + ψ(ξ, η, u, ∂ξ u, ∂η u).
Der Hauptteil dieses Operators ist der sog. Wellenoperator“, der prototypische Vertreter hy”
perbolischer Differentialoperatoren 2. Ordnung. Wir werden uns daher im folgenden mit der
zugehörigen Wellengleichung beschäftigen:
∂t2 u − ∂x2 u = f.
(1.1.5)
Wir haben gesehen, daß die Cauchysche Anfangswertaufgabe“ durch Reihenansatz lösbar
”
ist, wenn die Anfangskurve“ Γ nirgends mit einer Charakteristik des Differentialoperators
”
zusammenfällt. Andernfalls kann die Situation eintreten, daß zu beiden Seiten der Kurve Γ
eine Lösung existiert, diese aber nicht auf Γ stetig-differenzierbar fortsetzbar ist. Im folgenden
werden wir die für die drei Gleichungstypen geeigneten Randbedingungen diskutieren und dabei
ganz unterschiedliche Ergebnisse erhalten.
1.2 Elliptische Probleme
15
1.2 Elliptische Probleme
Wir haben gesehen, daß für (im ganzen Lösungsgebiet Ω ) elliptische Differentialoperatoren die
Cauchysche Anfangswertaufgabe“ für jede (analytische) Anfangskurve“ Γ ⊂ Ω lösbar ist. Die
”
”
Verallgemeinerung dieser Aussage für nichtlineare Differentialoperatoren der Art
L(u) = ∂x2 u − F (x, y, u, ∂x u, ∂y u, ∂y2 u)
(1.2.6)
ist der berühmte Satz von Cauchy-Kovalevskaya6 Dieser sehr allgemeine Existenzsatz für elliptische Differentialgleichungen ist aber für die Praxis nur von geringer Bedeutung. Die über
einen lokalen Reihenansatz konstruierte Lösung u hängt nämlich i.a. nicht stetig von den vorgegebenen Anfangswerten entlang Γ ab. Dies ist aber eine unverzichtbare Bedingung an ein
physikalisch sinnvolles Modell.
Beispiel: In der Halbebene Ω = {(x, y) ∈ R2 : x > 0} seien entlang der Randkurve Γ =
{(0, y) ∈ R2 } die Randwerte u(0, y) = u00 (y) = 0, ∂x u(0, y) = u10 (y) = 0 gegeben. Die zugehörige Lösung der Poisson-Gleichung ∆u = 0 ist u ≡ 0. Mit ε > 0 seien die Randdaten nun gestört
zu
u0ε (y) = 0, u1ε (y) = ε sin(y/ε),
wobei limε→0 u1ε (y) = 0 . Die zugehörige gestörte Lösung der Poisson-Gleichung (nachrechnen!)
uε (x, y) = ε2 sin(y/ε) sinh(x/ε),
sinh(z) = 12 (ez − e−z ),
konvergiert aber für ε → 0 nicht gegen Null. Es zeigt sich, daß in diesem Fall entlang der
Anfangskurve Γ nicht gleichzeitig Werte für u und ∂n u vorgegeben werden dürfen, wenn man
an physikalisch sinnvollen Lösungen interessiert ist.
Wir haben gesehen, daß man bei der Wahl von Randbedingungen für elliptische Operatoren
vorsichtig sein muß, wenn das resultierende Randwertproblem wohl-gestellt sein soll. Sei also
Ω ⊂ R2 ein beschränktes Gebiet mit hinreichend glattem Rand ∂Ω. Wir wollen dabei Ränder
mit einer glatten Parametrisierung (mindestens zweimal stetig differenzierbar) oder ein Polygongebiet (mit endlich vielen Ecken) zulassen. Als prototypischen Modellfall betrachten wir die
Poisson-Gleichung“
”
−∆u = f
auf Ω.
(1.2.7)
Es gibt drei Typen von Randbedingungen und zugehörige Randwertaufgaben ( RWAn“):
”
7
a) Dirichletsche Randbedingungen ( 1. RWA“): u = g auf ∂Ω .
”
6
Sofia Vasilyevna Kovalevskaya (1850-1891): russische Mathematikerin, eine der ersten Frauen mit Universitätskarriere; 1869 Studium in Heidelberg als “Gasthörerin”, da hier für Frauen ein offizielles Universitätsstudium noch nicht möglich war; ab 1871 Studium in Berlin bei Weierstraß und danach in Göttingen; eine ihrer
ersten Veröffentlichungen enthält den nach ihr benannten “Existenzsatz”; konnte damals als Frau aber keine Universitätsanstellung in Deutschland bekommen, trotz Fürsprache von Weierstraß; auf Betreiben Mittag-Lefflers
ab 1884 Stelle als “Privatdozent” in Stockholm; leistete Beiträge zur Analysis und zur Theorie von Differentialgleichungen der Physik; Anekdotisches: In ihrer Autobiografie steht, daß sie bereits als 11-Jährige durch die
Lektüre von Seiten aus Ostrogradskis Vorlesungskriptum über Differential- und Integralrechnung, mit denen ihr
Kinderzimmer tapeziert war, mit der Analysis in Berührung gekommen war.
7
Johann Peter Gustav Lejeune Dirichlet (1805-1859) geb. in Düren (damals bei Frankreich): wirkte in Berlin
und als Prof. in Göttingen (Nachfolger von Gauß ); wichtige Beiträge zur Zahlentheorie, Analysis und Differentialgleichungen (“Dirichletsches Prinzip”).
16
Theorie partieller Differentialgleichungen
b) Neumannsche8 Randbedingungen ( 2. RWA“): ∂n u = g auf ∂Ω .
”
9
c) Robinsche Randbedingungen ( 3. RWA“): ∂n u + αu = g auf ∂Ω .
”
Die Randfunktionen g werden i.a. als glatt und α ≥ 0 angenommen. Alle diese RWAn sind, wie
wir zum Teil zeigen werden, unter geeigneten Zusatzbedingungen an die Daten wohl gestellt.
n
Ω
Ω
Abbildung 1.2: Konfiguration der elliptischen Randwertaufgabe
1.2.1 Existenz
Die Frage nach der Existenz von Lösungen der 1. RWA ist wesentlich schwieriger als bei AWAn
gewöhnlicher Differentialgleichungen. Als Vorbereitung für analoge Argumente im Zusammenhang mit den Diskretrisierungsverfahren wollen wir zwei völlig unterschiedliche Zugänge zu
dieser Frage diskutieren, den klassischen“, potentialtheoretischen und den modernen“, funk”
”
tionalanalytischen. Der Einfachheit halber wird nur der Fall homogener“ Randbedingungen
”
u|∂Ω = 0 betrachtet.
i) Potentialtheoretische Methode:
Zunächst ist der Begriff einer klassischen“ Lösung für die Dirichletschen Randbedingung zu
”
präzisieren. Wir verstehen darunter eine Funktion u ∈ C 2 (Ω) ∩ C(Ω), welche im Innern von
Ω der Differentialgleichung und entlang des Randes ∂Ω der Randbedingung genügt. Ferner
soll ihr Gradient (möglicherweise im uneigentlichen Riemannschen10 Sinne) quadratintegrabel
sein: |∇u| ∈ L2 (Ω). Zur Konstruktion solcher klassischer Lösungen postulieren wir zunächst die
Existenz einer Funktion G(x, y) auf Ω × Ω ,
G ∈ C 2 ({Ω × Ω} \ {x = y}) ∩ C({Ω × Ω} \ {x = y}),
8
John von Neumann (1903-1957): US-amerikanischer Mathematiker ungarischer Abstammung; wirkte
hauptsächlich am Institute for Advanced Studies in Princeton (zus. mit A. Einstein u.a.) und gilt als mathematisches Genie; lieferte fundamentale Beiträge zu den mathematischen Grundlagen der Quantenmechanik, zur
Operatortheorie, zur Spieltheorie, zur Gruppentheorie und zur Theorie der partiellen Differentialgleichungen;
Pionier der Automatentheorie und theoretischen Informatik.
9
Victor Gustave Robin (1855-1897: französischer Mathematiker; lehrte an der Sorbonne in Paris; Beiträge zur
Potentialtheorie unf Thermodynamik; hat die nach ihm benannte 3. Randbedingung anscheinend selbst gar nicht
benutzt.
10
Bernhard Riemann (1826-1866): deutscher Mathematiker; Professor in Göttingen als Nachfolger Dirichlets;
Mitbegründer der Funktionentheorie und der modernen Geometrie; einer der bedeutendsten Mathematiker des
19. Jh.s, von großem Einfluß auch auf die theoretische Physik.
1.2 Elliptische Probleme
17
mit den Eigenschaften
−∆x G(·, y) = 0 in Ω \ {y},
G(·, y) = 0
auf ∂Ω \ {y},
(1.2.8)
für beliebiges festes y ∈ Ω . Für x = y habe G(x, y) eine dimensionsabhängige Singularität, die
so beschaffen ist, daß sich −∆x G(·, y) wie die Dirac-Distribution verhält, d.h.: Für v ∈ C(Ω)
gilt mit den Kugelumgebungen Bε := {y ∈ Ω : |x| ≤ ε} , ε > 0 :
Z
x ∈ Ω : lim
−∆x G(x, y) v(y) dy = v(x),
(1.2.9)
ε→0 Ω\Bε
Z
x ∈ ∂Ω : lim
∂n G(x, y) v(y) dy = v(x).
(1.2.10)
ε→0
∂Ω\Bε
Eine solches G(x, y) wird Greensche Funktion (1. Art)“ genannt. Wir machen damit den
”
Lösungsansatz
Z
Z
∂n G(x, y)g(y) doy .
G(x, y)f (y) dy +
u(x) :=
Ω
∂Ω
Die formulierten Eigenschaften der Greenschen Funktion erlauben es, zu zeigen, daß dieser Ansatz tatsächlich eine klassische Lösung der 1. RWA liefert. Diese Rechnung ist aufwendig und
kann z.B. im Buch von Hellwig nachgelesen werden. Die Konstruktion einer Greenschen Funktion für allgemeine Gebiete im Rd ist schwer. Im Fall d = 2 folgt ihre Existenz aber mit Hilfe des
Riemannschen Abbildungssatzes aus der Theorie komplexer Funktionen (siehe Hellwig). Für sehr
spezielle Konfigurationen, wie z.B. Halbebenen oder Kreise, läßt sich die Greensche Funktion
explizit angeben.
Beispiel: Auf dem Kreis Ω := {x ∈ R2 : |x| < R} ist durch
o
R
R2
1 n
log(|x − y|) + log( ) − log(| 2 x − y|) ,
2π
|x|
|x|
o
1 n
log(|y|) − log(R) , x = 0.
G(x, y) = −
2π
G(x, y) = −
x 6= 0,
(1.2.11)
(1.2.12)
eine Greensche Funktion mit den obigen Eigenschaften gegeben.
Die Existenz Greenscher Funktionen läßt sich für sehr allgemeine Gebiete Ω nachweisen,
auch für die anderen RWAn. Das Konzept der klassischen“ Lösung ist in vielen Anwendungsfällen
”
zu restriktiv, z.B. wenn die rechte Seite f nicht regulär genug ist, um eine C 2 -Lösung zuzulassen. Die Greensche Funktion selbst ist ein Extremfall in dieser Hinsicht. Als nächstes werden
wir eine Abschwächung dieser Anforderungen kennenlernen, welche mehr Flexibilität bietet und
für die man vergleichweise leicht die Existenz von Lösungen garantieren kann.
ii) Funktionalanalytische Methode:
Wir haben bereits früher gesehen, daß eine enge Beziehung zwischen der Poisson-Gleichung und
der Minimierung des zugehörigen Energiefunktionals besteht. Dies kann man zum Nachweis der
Existenz von Lösungen ausnutzen. Wir betrachten das Funktional
Z
Z
1
2
f v dx
E(v) :=
|∇v| dx −
2 Ω
Ω
18
Theorie partieller Differentialgleichungen
auf dem Vektorraum Ṽ der zulässigen“ Funktionen:
”
Ṽ0 := {v : Ω → R : v ∈ C 1 (Ω) ∩ C(Ω), v|∂Ω = 0, |∇v| ∈ L2 (Ω)}.
Dieser Raum wird mit der natürlichen Energie-Norm“
”
kvkE := k∇vkΩ ,
v ∈ Ṽ0 ,
versehen. Daß dies wirklich eine Norm ist, folgt aus den entsprechenden Eigenschaften der L2 Norm k · k = k · kΩ . Aus der Poincaréschen Ungleichung
kvkΩ ≤ dΩ k∇vkΩ ,
v ∈ Ṽ0 ,
mit dΩ := diam(Ω) folgt weiter, daß diese Norm stärker ist als die L2 -Norm. In kompakter
Schreibweise ist E(v) = 12 k∇vk2 − (f, v). Wir verwenden jetzt eine Argumentation aus der
Variationsrechnung, die dort als die direkte Methode“ bekannt ist.
”
i) Wir zeigen zunächst, daß E(·) nach unten beschränkt ist. Für v ∈ Ṽ0 folgt mit Hilfe der
Hölderschen und der Poincaréschen Ungleichung
E(v) ≥ 12 k∇vk2 − kf k kvk ≥ 12 k∇vk2 − dΩ kf k k∇vk.
Anwendung der Ungleichung ab ≤ 12 a2 + 21 b2 liefert weiter
dΩ kf k k∇vk ≤ 12 k∇vk2 + 12 d2Ω kf k2 ,
und folglich
E(v) ≥ − 12 d2Ω kf k2 > −∞,
v ∈ Ṽ0 .
ii) Sei nun (uk )k∈N ⊂ Ṽ0 eine Minimalfolge“ des Funktionals E(·) , d.h.:
”
E(uk ) → inf E(v) =: d > −∞.
v∈Ṽ
Wir wollen zeigen, daß (uk )k∈N eine Cauchy-Folge bzgl. der Energie-Norm ist. Wichtiges Hilfsmittel dazu ist die sog. Parallelogrammidentität“
”
kv − wk2E + kv + wk2E = 2kvk2E + 2kwk2E ,
die man durch direktes Nachrechnen verifiziert. Für beliebige Indizes n, m ∈ N gilt folglich
kun − um k2E = 2kun k2E + 2kum k2E − 4k 12 (un + um )k2E
= 4E(un ) + 4(f, un ) + 4E(um ) + 4(f, um ) − 8E( 12 (un + um ))
− 8(f, 12 (un + um ))
= 4E(un ) + 4E(um ) − 8E( 21 (un + um )).
Wegen
lim {E(un ) + E(um )} = 2d,
n,m→∞
E( 12 (un + um )) ≥ d,
folgt damit
lim sup kun − um k2E ≤ 0,
n,m→∞
1.2 Elliptische Probleme
19
d.h.: (un )n∈N ist wie behauptet eine Cauchy-Folge.
Die Cauchy-Folge (un )n∈N besitzt i.a. keinen Limes im normierten (unvollständigen) Raum
Ṽ0 . Durch Vervollständigung von Ṽ0 erhält man den sog. Sobolew-Raum“ H01 (Ω). Die Ele”
mente von H01 (Ω) sind zunächst als Äquivalenzklassen von Cauchy-Folgen (analog wie bei der
Konstruktion der reelen Zahlen aus den rationalen) definiert; sie lassen sich aber wieder als Funktionen interpretieren. Sie sind L2 -Funktionen, deren erste Ableitungen (im Distributionssinne)
wieder in L2 liegen und die in einem abgeschwächten Sinn auf ∂Ω verschwinden (siehe die angegebene Literatur zur Theorie partieller Differentialgleichungen). Wir werden unten in Abschnitt
1.3 die Eigenschaften dieser Sobolew11 -Räume“ genauer diskutieren. Der Limes u ∈ H01 (Ω)
”
der Folge (un )n∈N wird als die schwache“ oder auch variationelle“ Lösung der 1. RWA des
”
”
Laplace-Operators bezeichnet. Als Minimalpunkt des Funktionals E(·) genügt sie, wie wir schon
früher gesehen haben, notwendig der Beziehung
(∇u, ∇ϕ) = (f, ϕ) ∀ϕ ∈ H01 (Ω).
(1.2.13)
Umgekehrt gilt für eine Funktion u ∈ H01 (Ω) , welcher dieser Variationsgleichung genügt, mit
jeder anderen Funktion v ∈ H01 (Ω)
E(v) − E(u) = 12 k∇vk2 − (f, v) − 12 k∇uk2 + (f, u)
= 21 k∇vk2 − (∇u, ∇v) − 12 k∇uk2 + (∇u, ∇u)
= 12 k∇vk2 − (∇u, ∇v) + 12 k∇uk2 = 21 k∇(v − u)k2 ≥ 0.
Folglich ist u automatisch auch Minimum des Energiefunktionals und somit schwache Lösung.
Wenn die schwache Lösung u regulärer ist, etwa sogar die Regularität einer klassischen
Lösung besitzt, so kann partiell integriert werden, und wir finden
(−∆u, ϕ) + (∂n u, ϕ)∂Ω = (f, ϕ)
∀ϕ ∈ H01 (Ω)
bzw. wegen der Randbedingung ϕ|∂Ω = 0
(−∆u − f, ϕ) = 0
∀ϕ ∈ H01 (Ω).
Hieraus folgt mit den üblichen Argumenten, daß −∆u = f , d.h.: u ist sogar klassische Lösung
der RWA. Umgekehrt erfüllt natürlich jede klassische Lösung u ∈ C 2 (Ω) ∩ C 1 (Ω̄) die Variationsgleichung
(∇u, ∇ϕ) − (f, ϕ) = (−∆u − f, ϕ) + (∂n u, ϕ)∂Ω = 0 ∀ϕ ∈ H01 (Ω).
Damit ist der schwache“ Lösungsbegriff verträglich mit dem ursprünglichen klassischen“. Der
”
”
Nachweis höherer Regularität der schwachen Lösung u ∈ H01 (Ω) ist allerdings schwierig und
kann im Rahmen dieser Vorlesung nur andiskutiert werden (siehe wieder die empfohlene Literatur).
Wir wollen noch kurz diskutieren, wie das obige Argument verwendet werden kann, um die
11
Sergei Lvovich Sobolew (1908-1989): russischer Mathematiker; wirkte zunächst in Leningrad (St. Petersburg)
und dann am berühmten Steklov-Institut für Mathematik der Akademie der Wissenschaften in Moskau; fundamentale Beiträge zur Theorie der partiellen Differentialgleichungen, Konzept der verallgemeinerten (distributionellen)
Lösung, Sobolew-Räume; beschäftigte sich auch mit numerischen Methoden, numerische Quadratur.
20
Theorie partieller Differentialgleichungen
Existenz von schwachen Lösungen der 1. RWA auch im Fall inhomogener Randdaten u|∂Ω = g
zu sichern. Dazu nehmen wir an, daß die Randfunktion g als Spur“ einer auf ganz Ω definierten
”
Funktion ĝ ∈ C 2 (Ω) ∩ C(Ω) gegeben ist, d.h.: g = ĝ|∂Ω . Dann wäre die Funktion v := u − ĝ
Lösung der RWA
−∆v = f − ∆ĝ in Ω, v|∂Ω = 0.
Hierfür garantiert nun die variationelle Methode die Existenz einer (eindeutigen) schwachen
Lösung v ∈ H01 (Ω) mit der Eigenschaft
(∇v, ∇ϕ) = (f, ϕ) + (∇ĝ, ∇ϕ)
∀ϕ ∈ H01 (Ω).
Die schwache Lösung der ursprünglichen RWA ergibt sich dann als u := v + ĝ .
1.2.2 Eindeutigkeit
Die Eindeutigkeitsforderung an Lösungen dieser RWAn ist leicht zu gewährleisten. Wir diskutieren hier nur die 1. RWA. Die entsprechenden Argumente für die 2. und die 3. RWA seien als
Übung gestellt.
(i) Besonders einfach ist der Beweis für die schwachen Lösungen. Seien also u(1) , u(2) ∈ H01 (Ω)
zwei schwache Lösungen der 1. RWA, d.h.:
(∇u(i) , ∇ϕ) = (f (i) , ϕ)
∀ϕ ∈ H01 (Ω).
Dann gilt für die Differenz w := u(1) − u(2)
(∇w, ∇ϕ) = 0
∀ϕ ∈ H01 (Ω).
Mit ϕ := w folgt k∇wk = 0 und folglich w ≡ konst. bzw. w ≡ 0 wegen der Randbedingung.
(ii) Die Eindeutigkeit von klassischen Lösungen folgt unmittelbar aus der gerade bewiesenen
Eindeutigkeit von schwachen Lösungen, da jede klassische Lösung ja auch schwache Lösung ist.
Eine direktere Argumentation ergibt sich mit Hilfe des sog. Maximumprinzips“ .
”
Hilfssatz 1.1 (Maximumprinzip): Für den elliptischen Operator
Lu := −∆u + au
mit a ≥ 0 auf einem Gebiet Ω ∈ Rd gilt das sog. Maximumprinzip“, d.h.: Eine Funktion
”
u ∈ C 2 (Ω) ∩ C(Ω) mit der Eigenschaft Lu ≤ 0 hat in Ω kein positives Maximum. Dies
bedeutet, daß entweder u ≤ 0 auf ganz Ω ist, oder
max u ≤ max u.
Ω
∂Ω
(1.2.14)
Beweis: Wir führen den Beweis nur für den Fall, daß a > 0 auf Ω . Der allgemeine Fall
a ≥ 0 erfordert eine aufwendigere Argumentation (siehe z.B. das Buch von Hellwig). Ferner sei
d = 2. Angenommen, die Funktion u habe im Fall u 6≤ 0 in einem Punkt z ∈ Ω ein positives
Maximum, u(z) > 0. Dann ist notwendig
∇u(z) = 0,
∂x2 u(z) ≤ 0, ∂y2 u(z) ≤ 0.
1.2 Elliptische Probleme
21
Damit folgt 0 ≥ Lu(z) = −∆u(z)+au(z) ≥ au(z) , was wegen a > 0 den Widerspruch u(z) ≤ 0
erzwingt.
Q.E.D.
Das Maximumprinzip für elliptische Operatoren 2. Ordnung ist die natürliche Verallgemeinerung der simplen Tatsache, daß in einer Raumdimension aus u′′ (x) ≥ 0 die Konvexität von
u folgt.
y
u"(x) > 0
u(x)
Ω
x
Abbildung 1.3: Maximumprinzip in einer Dimension
Aussagen vom Typ des obigen Maximumprinzips lassen sich für sehr allgemeine (auch nichtlineare) elliptische Operatoren 2. Ordnung herleiten. Wir betonen, daß das Maximumprinzip i.a.
für elliptische Operatoren höherer Ordnung (z.B. den biharmonischen Operator“ ∆2 u ) und für
”
elliptische Systeme (z.B. die Gleichungen der linearen Elastizitätstheorie) nicht mehr gilt.
Als erste, einfache Anwendung des Maximumprinzips erhalten wir einen alternativen Beweis
für die Eindeutigkeit (klassischer) Lösungen der 1. RWA des Laplace-Operators. Sind u(1) , u(2)
zwei Lösungen, so gilt für die Differenz w := u(1) − u(2) wieder
−∆w = 0 in Ω,
w = 0 auf ∂Ω.
Anwendung des Maximumprinzips auf w sowie −w impliziert dann, daß notwendig w ≤
0, −w ≤ 0 , d.h.: w ≡ 0.
1.2.3 Stetige Abhängigkeit
(i) Die Frage nach der stetigen Abhängigkeit der Lösungen der 1. RWA wollen wir wieder
sowohl mit Hilfe des klassischen Ansatzes als auch mit der variationellen Methode angehen.
Seien zunächst u(1) , u(2) zwei Lösungen (klassisch oder variationell) der 1. RWA des LaplaceOperators zu unterschiedlichen rechten Seiten f (1) , f (2) . Für die Differenz w = u(1) − u(2) folgt
dann
k∇wk2 = (f (1) − f (2) , w) ≤ kf (1) − f (2) kΩ kwk.
Unter Ausnutzung der Poincaréschen Ungleichung folgt daraus
k∇wk ≤ dΩ kf (1) − f (2) k,
d.h. die Stetigkeit der Lösung (in der Energie-Norm) gegenüber Störungen der rechten Seite.
22
Theorie partieller Differentialgleichungen
(ii) Als nächstes betrachten wir Störungen der Randdaten. Dazu verwenden wir wieder das
Maximumprinzip. Seien dazu u(1) , u(2) zwei Lösungen zu den Randdaten g(1) , g(2) . Für die
Differenz w := u(1) − u(2) gilt dann
−∆w = 0 in Ω,
w = g := g(1) − g(2) auf ∂Ω.
Mit dem Maximumprinzip erschließen wir hieraus, daß w ≡ 0 (was natürlich i.a. nicht eintritt)
oder
max w ≤ max g, max −w ≤ max −g.
∂Ω
Ω
Ω
∂Ω
Dies impliziert maxΩ |w| ≤ max∂Ω |g|.
Schließlich ergibt sich mit Hilfe des Maximumprinzips noch, daß eine Lösung der 1. RWA
des Laplace-Operators zu nichtnegativer rechter Seite und ebensolchen Randdaten,
−∆u ≥ 0 in Ω,
u ≥ 0 auf ∂Ω,
notwendig überall nicht-negativ ist: u ≥ 0 . Dies gilt dann z.B. auch für die zugehörige Greensche Funktion: g(·, ·) ≥ 0. Durch schärfere Argumente kann man darüber hinaus zeigen, daß die
Greensche Funktion im Innern des Definitionsgebiets Ω positiv ist. Dies bedeutet u.a., daß bei
einem elliptischen Problem lokale Störungen in den Daten die Lösung im gesamten Lösungsgebiet verändern. Es liegt also gewissermaßen eine unendliche Ausbreitungsgeschwindigkeit“ von
”
Information vor. Dies ist charakteristisch für elliptische Randwertaufgaben.
1.2.4 Regularität
Auf glatt berandeten Gebieten Ω besteht, ähnlich wie bei gewöhnlichen Differentialgleichungen,
für (lineare) partielle Differentialgleichungen vom elliptischen Typ die Regel, daß sich die Regularität der Daten (rechte Seite und Randwerte) auf natürliche Weise auf die Lösung überträgt.
Der Rand ∂Ω sei aus der Klasse C 2 (2-mal stetig differenzierbar parametrisierbar). Dann besitzt
die schwache Lösung u ∈ H01 (Ω) im Falle f ∈ L2 (Ω) zweite Ableitungen mit der Regularität
|∇2 u| ∈ L2 (Ω) , und es gilt die a priori Abschätzung
2
X
k=0
k∇k uk2
1/2
≤ ckf k.
(1.2.15)
Diese Aussage bleibt gültig, wenn Ω ein konvexes Polygongebiet oder ein konvexer Polyeder
ist. Ist darüber hinaus f Hölder-stetig, so ist die schwache Lösung u ∈ H01 (Ω) sogar klassische
Lösung. Höhere Regularitätseigenschaften von ∂Ω und f übertragen sich entsprechend auf u .
Im Fall von Gebieten mit Ecken, insbesondere einspringenden“ Ecken (Innenwinkel ω > π)
”
treten allerdings dort Irregularitäten in der Lösung auf; z. B. ist die in ebenen Polarkoordinaten
(r, θ) ausgedrückte Funktion
2
u(r, θ) = r 3 sin( 23 θ)
auf der gelochten Ebene R2 \ {0} harmonisch, d.h. ∆u ≡ 0 . Auf dem Tortenstück“
”
Ω := {(x, y) ∈ R2 | 0 < r < 1, 0 < θ < 32 π}
mit einer rechtwinkligen einspringenden Ecke ist ∇u ∈ L2 (Ω)2 , und u ist daher (klassische)
1.2 Elliptische Probleme
23
Lösung der Poisson-Gleichung ∆u = 0 zu den Randbedingungen
u(r, θ) = 0 für θ ∈ {0, 32 π},
u(r, θ) = sin( 32 ) für r = 1.
Wir sehen an diesem Beispiel, daß klassische“ Lösungen elliptischer Gleichungen nicht unbe”
dingt regulär bis zum Rand ∂Ω zu sein brauchen. Für allgemeinen Innenwinkel ω ∈ (0, 2π] (Der
Fall ω = 2π entpricht einem sog. Schlitzgebiet“.) erhält man analoge klassische Lösungen in
π
”
der Form u(r, θ) = r ω sin( ωπ θ) . Für ω > π , d.h. für eine einspringende“ Ecke hat die Lösung
”
bei r = 0 singuläre erste Ableitungen. Diese sog. Eckensingularitäten“ sind gut analysiert und
”
abschätzbar. Sie haben einen signifikanten, negativen Einfluß auf die Approximationsgüte von
Diskretisierungen und erfordern besondere Vorkehrungen.
24
Theorie partieller Differentialgleichungen
1.3 Hilfsmittel aus der Theorie von Funktionenräumen
In diesem Abschnitt stellen wir einige Aussagen über Räume verallgemeinert differenzierbarer
Funktionen, sog. Sobolew-Räume“, zusammen, soweit sie später bei der Analyse von Diskreti”
sierungsverfahren benötigt werden.
1.3.1 Sobolew-Räume
Sei Ω ein Gebiet im Rd (d = 2, 3) mit Rand ∂Ω . Der Rand wird als ausreichend“ glatt ange”
nommen, was von der betrachteten Situation abhängt; diesbezügliche Einschränkungen werden
von Fall zu Fall angegeben. Wir nehmen generell an, daß ∂Ω eine Lipschitz-stetige Parametrisierung besitzt und überall bis auf endlich viele Punkte oder Kanten eine wohl-definierte äußere
Normale n besitzt.
Auf einem solchen Gebiet Ω definieren wir zunächst für Funktionen aus C(Ω) (Vektorraum
der stetigen Funktionen auf dem Abschluß Ω ) das sog. L2 -Skalarprodukt und die zugehörige
Norm
Z
Z
u(x)v(x) dx,
(u, v)Ω :=
Ω
kuk0;Ω :=
Ω
|u(x)|2 dx
1/2
.
Wenn Verwechslungen ausgeschlossen sind, wird auch die kürzere Notation (·, ·) = (·, ·)Ω sowie
k · k = k · k0 = k · k0;Ω verwendet. Die Vervollständigung von C(Ω) bzgl. der Norm k · k0;Ω liefert den Lebesgueschen12 Hilbert-Raum“ L2 (Ω) der auf Ω im Lebesgueschen Sinne meßbaren
”
und quadratintegrablen Funktionen. Eine Funktion“ v ∈ L2 (Ω) ist dann dadurch charakte”
risiert, daß es eine Folge glatter Funktionen (vk )k∈N ⊂ C(Ω) gibt, welche bzgl. der L2 -Norm
Cauchy-Folge ist und fast überall“ (im Lebesgueschen Sinne) gegen v konvergiert. Mit einem
”
einfachen Approximationsargument läßt sich zeigen, daß sich L2 (Ω) auch als Vervollständigung
des Raumes der Testfunktionen“ (Begriff aus der Distributionen-Theorie)
”
C0∞ (Ω) := {v ∈ C ∞ (Ω) : Trg(v) := {x ∈ Ω, v(x) 6= 0} ⊂ Ω kompakt}
gewinnen läßt. Auf analoge Weise gewinnt man für 1 ≤ p < ∞ die sog. Lp -Räume“ Lp (Ω) als
”
Vervollständigung von C(Ω) bzgl. der Norm
Z
1/p
kvkLp (Ω) :=
|v(x)|p dx
.
Ω
Der Fall p = ∞ bedarf einer gesonderten Betrachtung. Der Lebesgue-Raum L∞ (Ω) besteht
aus allen auf Ω definierten, im Lebesgueschen Sinne meßbaren und wesentlich beschränkten“
”
Funktionen; seine Norm ist
kvkL∞ (Ω) := ess supx∈Ω |v(x)|.
Man beachte, daß sich L∞ (Ω) nicht als Vervollständigung von C(Ω) bzgl. der Norm k·k∞;Ω gewinnen läßt, denn dies ergibt wieder C(Ω) . Wenn Mißverständnisse ausgeschlossen sind, werden
die Lp -Normen auch kurz mit k · kp = k · kLp = k · kLp (Ω) bezeichnet.
Die funktionalanalytische Methode zum Nachweis der Existenz von schwachen“ Lösungen
”
12
Henri Léon Lebesgue (1875-1941): französischer Mathematiker, Professor am Collège de France in Paris,
lieferte grundlegende Beiträge zur modernen Integrationstheorie (“Lebesgue-Intgeral”)
1.3 Hilfsmittel aus der Theorie von Funktionenräumen
25
der Poisson-Gleichung
−∆u = f in Ω,
u|∂Ω = 0,
(1.3.16)
bedient sich als natürlichen Lösungsraum“ des Sobolew-Raums H01 (Ω) . Dieser ist Teilraum
”
des Sobolew-Raums H 1 (Ω) , welchen man erhält z.B. durch Vervollständigung des Vektorraums
C 1 (Ω) bzgl. der sog. H 1 -Norm
kvk1 := kvk20 + k∇vk20
1/2
.
Entsprechend ist H01 (Ω) definiert als der Abschluß von C0∞ (Ω) in H 1 (Ω) .
Die Definition des Sobolew-Raums H 1 (Ω) als Vervollständigung von C 1 (Ω) besagt zunächst,
daß seine Elemente als Äquivalenzklassen von Cauchy-Folgen (vk )k∈N ⊂ C 1 (Ω) bzgl. der H 1 Norm definiert sind. Dies ist ein sehr unhandliches Konzept, mit dem man schlecht arbeiten
kann. Daher werden diesen Äquivalenzklassen Funktionen auf Ω zugeordnet durch folgende
Konstruktion:
{(vk )k∈N } 7→ v ∈ H 1 (Ω) :
v := lim vk ,
k→∞
∇v := lim ∇vk ,
k→∞
wobei die Konvergenz jeweils im L2 -Sinne zu verstehen ist. Umgekehrt existiert dann für jede
solche Funktion v ∈ H 1 (Ω) eine approximierende Folge glatter“ Funktionen (vk )k∈N mit kv −
”
vk k1 → 0 (k → ∞) . Auf diesem Wege, d.h. durch Konstruktion einer solchen approximierenden
Folge wird auch für eine gegebene Funktion v ∈ L2 (Ω) gegebenenfalls v ∈ H 1 (Ω) gezeigt. Die
Limiten ∂i v := limk→∞ ∂i vk werden verallgemeinerte“ (oder auch schwache“) Ableitungen
”
”
von v genannt. Sie sind i.a. nicht stetig oder beschränkt und existieren nur im L2 -Sinne, d.h.
im Lebesgueschen Sinn fast überall“. Zum Nachweis, daß eine in fast allen Punkten x ∈ Ω
”
definierte Funktion v in H 1 (Ω) liegt, geht man üblicherweise wie folgt vor: Zunächst wird
aus Kenntnis der Struktur von v eine Folge approximierender glatter“ Funktionen (vk )k∈N ⊂
”
C 1 (Ω) konstruiert, welche für k → ∞ samt ihrer ersten Ableitungen (fast überall) punktweise
gegen v konvergieren. Kann dann noch gezeigt werde, daß
lim kvk k1;Ω < ∞,
so folgt (nach dem Satz von der dominierten Konvergenz“ der Maß-Theorie), daß (vk )k∈N eine
”
Cauchy-Folge bzgl. der H 1 -Norm ist und den Limes v besitzt; d.h. v ∈ H 1 (Ω) .
Beispiel 1.1: (i) L2 -Funktionen: Sei Ω zunächst die gepunktete Kreisscheibe
Ω0 = {x ∈ R2 : 0 < |x| < 1}.
Auf Ω0 ist die Funktion u(x) = ln(|x|) stetig, aber unbeschränkt. Auf der vollen Kreisscheibe
Ω = {x ∈ R2 : |x| < 1} ist u(x) = ln(|x|) aber als Funktion in L2 (Ω) erklärt. Dies wird klar
bei Betrachtung der approximierenden, stetigen Funktionen
ln(|x|) für k−1 < |x| < 1,
uk (x) :=
ln(k−1 ) für 0 ≤ |x| ≤ k−1 .
Man rechnet leicht nach, daß (uk )k∈N eine Cauchy-Folge bzgl. der L2 -Norm auf Ω ist und in
allen Punkten x ∈ Ω (bis auf x = 0 ) uk (x) → u(x) (k → ∞) gilt.
26
Theorie partieller Differentialgleichungen
Wir betrachten nun die Funktion u(x) := |x|−1 , welche ebenfalls auf Ω0 stetig und unbeschränkt
ist. In diesem Fall bilden die approximierenden Funktionen
−1
|x|
für k−1 < |x| < 1,
uk (x) :=
k für 0 ≤ |x| ≤ k−1 ,
wegen
kuk k2Ω
= 2π
Z
k −1
2
k r dr + 2π
Z
1
r −1 dr = 2π
k −1
0
1
2
+ ln(k) → ∞
(k → ∞)
keine Cauchy-Folge bzgl. der L2 -Norm, d.h.: Dieses u ist zu singulär, um als L2 -Funktion auf Ω
erklärt zu sein. Bei der analogen Betrachtung auf der Einheitskugel im R3 ergibt sich dagegen,
daß u(x) = |x|−1 in diesem Fall sehr wohl in L2 (Ω) liegt. Die Zugehörigkeit von Funktionen mit
lokalen Singularitäten zum Lebesgue-Raum L2 (Ω) hängt also von der jeweiligen Raumdimension
ab. Wir werden denselben Effekt auch beim Sobolew-Raum H 1 (Ω) finden.
(ii) H 1 -Funktionen: Wir betrachten wieder die Funktion u(x) = ln(|x|) auf der punktierten
Kreisscheibe Ω0 ⊂ R2 . Ihr Gradient ∇u(x) = |x|−2 x verhält sich bei Annäherung an x = 0
wie |∇u(x)| ≈ |x|−1 . Im Hinblick auf das eben diskutierte Beispiel ist ∇u also nicht zu einer L2 Funktion auf die volle Kreisscheibe Ω fortsetzbar. Folglich ist u auch nicht in H 1 (Ω) . Wir sehen,
daß insbesondere die Greensche Funktion zum Laplace-Operator in zwei Raumdimensionen nicht
im Energie-Raum“ H 1 (Ω) liegt. Man beachte, daß v(x) = ln(x) in drei Raumdimensionen
”
aber sehr wohl in H 1 (Ω) liegt; der kritische Grenzfall ist hier die stärker singuläre Funktion
u(x) = |x|−1 .
Als zweites Beispiel zeigen wir, daß H 1 -Funktionen in mehr als einer Dimension nicht beschränkt sein müssen. Auf Ω0 sei die Funktion
u(x) = ln(ln(|x|−1 ) + 1)
betrachtet. Da | ln ln(r −1 )| für r → 0 langsamer wächst als | ln(r)| , ist u sicherlich zu einer
L2 -Funktion auf Ω fortsetzbar. Wir berechnen nun den Gradienten
∇u(x) = −
x
|x|2 (ln(|x|−1 )
+ 1)
.
Die zugehörigen abgeschnittenen“ Funktionen
”
ln(ln(|x|−1 ) + 1) für k−1 < |x| < 1,
uk (x) :=
ln(ln(k) + 1)
für 0 ≤ |x| ≤ k−1 ,
haben die stückweise“ definierten Gradienten
”
(
x
∇uk (x) :=
|x|2 (ln(|x|−1 )+1)
0
für k−1 < |x| < 1,
für 0 ≤ |x| ≤ k−1 ,
1.3 Hilfsmittel aus der Theorie von Funktionenräumen
27
welche überall (bis auf x = 0 ) gegen ∇u konvergieren. Aus der Abschätzung
2
Z
1
Z
2
r dr = 2π
r
1
1
dr
2
−1
−1
r
(ln(r
)
+
1)
r(ln(r
) + 1)2
k −1
k −1
1
2π
2π
=
≤ 2π
−1 = 2π −
−1
ln(r ) + 1 k
ln(k) + 1
k∇uk k = 2π
(1.3.17)
(1.3.18)
ersehen wir ferner, daß (∇uk )k∈N bzgl. der L2 -Norm eine Cauchy-Folge ist. Folglich ist u zu
einer Funktion im Sobolew-Raum H 1 (Ω) fortsetzbar. Mit der eben verwendeten Abschneide”
technik“ erhalten wir approximierende Funktionen uk , welche i.a. nur stückweise stetig differenzierbar sind, d.h. nicht im strengen Sinne in C 1 (Ω) liegen und somit nicht direkt in das oben
formulierte Approximationskonzept für H 1 -Funktionen passen. Dieser Mangel kann behoben
werden, in dem man statt abzuschneiden regularisiert, z.B. gemäß
uk (x) = ln(ln((|x| + k)−1 ) + 1).
Diese uk ∈ C 1 (Ω) bilden dann ebenfalls eine approximierende Folge von u bzgl. der H 1 -Norm.
Eine ähnliche Modifikation (schon bei der Definition der Sobolew-Räume) muß auch vorgenommen werden, um spezielle Gebiete Ω mit schlitz-artigen“ Randeinsprüngen einbeziehen zu
”
können. Solche Schlitz-Gebiete“ spielen eine wichtige Rolle z.B. in der Baumechanik, wenn die
”
Ausbreitung von Rissen in Bauteilen beschrieben werden soll.
Analog zu dem Sobolew-Raum H 1 (Ω) erster Ordnung“ quadrat-integrabler Funktionen
”
kann man auch Sobolew-Räume H m,p (Ω) höherer Ordnung m ∈ N , bestehend aus p-integrablen
Funktionen (1 ≤ p < ∞) , definieren. Diese erhält man durch Vervollständigung des Raumes
C m (Ω) bzgl. der Norm
kvkH m,p (Ω) := kvkpLp (Ω) + ... + k∇m vkpLp (Ω)p
1/p
.
Der Fall p = ∞ bedarf wieder einer gesonderten Betrachtung. Die Räume H m,∞ (Ω) werden
über die Gleichsetzung H m,∞ (Ω) := W m,∞ (Ω) als Räume sog. verallgemeinert differenzier”
barer“ Funktionen mit distributionellen Ableitungen in L∞ (Ω) definiert. Wir wollen auf diese
Begiffsbildungen nicht weiter eingehen und verweisen statt dessen auf die einschlägige Literatur
über Sobolew-Räume (z.B.: Wloka (1982)).
1.3.2 Eigenschaften von Lebesgue- und Sobolew-Räumen
Wir wollen im folgenden einige wichtige Eigenschaften von Lebesgue- und Sobolew-Räumen
zusammenstellen, welche später bei der Analyse numerischer Verfahren benötigt werden.
Sei 1 < p < ∞ und q := p/(p − 1) . Dann gilt für Funktionen u ∈ Lp (Ω) und v ∈ Lq (Ω)
die allgemeine Höldersche Ungleichung“
”
Z
Z
1/p Z
1/q
p
|u(x)| dx
|v(x)|q dx
,
(1.3.19)
u(x)v(x) dx ≤
Ω
Ω
Ω
bzw. in Kurzform |(u, v)Ω | ≤ kukLp (Ω) kvkLq (Ω) . Für die Grenzfälle p = ∞ bzw. q = 1 gilt
|(u, v)Ω | ≤ kukL∞ (Ω) kvkL1 (Ω) .
(1.3.20)
28
Theorie partieller Differentialgleichungen
Die variationelle Methode zum Nachweis von schwachen“ Lösungen der Poisson-Gleichung
”
basierte auf der Eigenschaft der bilinearen Form (∇u, ∇v)Ω , auf dem Teilraum H01 (Ω) ⊂ H 1 (Ω)
ein Skalarprodukt zu sein.
Hilfssatz 1.2 (Poincarésche Ungleichung): Für Funktionen v ∈ H01 (Ω) gilt die sog. Poin”
carésche Ungleichung“
kvkΩ ≤ dΩ k∇vkΩ ,
(1.3.21)
mit dem Durchmesser dΩ := diam(Ω) des Gebiets Ω .
Beweis: Wir geben den Beweis nur in zwei Raumdimensionen. In höheren Dimensionen verläuft
die Argumentation ganz analog. Sei Q eine Quadrat der Kantenlänge L = dΩ , in welchem das
Gebiet Ω enthalten ist. O.B.d.A. sei das Koordinatensystem so verschoben und gedreht, daß
Q = (0, L)×(0, L) . Für irgendein v ∈ H01 (Ω) sei (vk )k∈N ⊂ C0∞ (Ω) eine approximierende Folge.
Mit v̂k bezeichnen wir die trivialen Fortsetzungen der vk auf Q :
vk (x) für x ∈ Ω,
v̂k (x) :=
0
für x ∈ Q \ Ω.
Diese sind dann ebenfalls in C0∞ (Q) . Wir setzen nun w := v̂k . Zunächst gilt in Punkten
(x, y) ∈ Q :
Z x
∂ξ w(ξ, y) dξ,
w(x, y) = w(0, y) +
0
und folglich, bei Beachtung von w(0, y) = 0 ,
2
|w(x, y)| ≤ L
Z
L
0
|∂ξ w(ξ, y)|2 dξ
Integration zunächst über y ∈ (0, L) und danach über x ∈ (0, L) ergibt
Z
0
LZ L
0
2
|w(x, y)| dy dx ≤ L
2
Z
0
LZ L
0
|∂ξ w(ξ, y)|2 dξ dy.
Dies bedeutet
kwkQ ≤ Lk∇wkQ .
und wegen w = v̂k ≡ 0 auf Q \ Ω :
kvk kΩ ≤ Lk∇vk kΩ .
Für k → ∞ überträgt sich diese Beziehung durch Stetigkeit auf v ∈ H01 (Ω) .
Q.E.D.
Die variationelle Methode liefert auch die Existenz von Lösungen der 1. RWA des LaplaceOperators, wenn die Randwertvorgaben inhomogen sind. Im allgemeinen Fall findet man eine
schwache Lösung v ∈ H 1 (Ω) . Wir haben gesehen, daß H 1 -Funktionen Singularitäten haben
können. Es stellt sich also die Frage, in welchem Sinne die Randwerte von der schwachen“
”
Lösung überhaupt angenommen werden.
1.3 Hilfsmittel aus der Theorie von Funktionenräumen
29
Hilfssatz 1.3 (Spur-Lemma): Für Funktionen v ∈ C 1 (Ω) gilt die sog. Spur-Abschätzung“
”
kvkL2 (∂Ω) ≤ c(Ω) kvkH 1 (Ω)
(1.3.22)
mit einer Ω-abhängigen Konstante c(Ω) .
Beweis: Zuerst betrachten wir den Spezialfall des Einheitsquadrats Ω = (0, 1) × (0, 1) . Sei
v ∈ C 1 (Ω) . Für Punkte (0, y) ∈ ∂Ω gilt
Z x
∂ξ v(ξ, y) dξ + v(x, y), x ∈ [0, 1].
v(0, y) = −
0
und folglich
2
|v(0, y)| ≤
Z
1
0
Z
2
|∂ξ v(ξ, y)| dξ + |v(x, y)| ≤ 2
1
0
|∂ξ v(ξ, y)|2 dξ + 2|v(x, y)|2 .
Integration zunächst über y ∈ (0, 1) und dann über x ∈ (0, 1) liefert
Z
0
1
2
|v(0, y)| dy ≤ 2
Z
0
1Z 1
0
2
|∂ξ v(ξ, y)| dξ dy + 2
Z
0
1Z 1
0
|v(x, y)|2 dy dx.
Dieselbe Argumentation kann auch für die drei anderen Randkomponenten von Ω angewendet
werden. Zusammenfassung der sich ergebenden Abschätzungen ergibt dann
kvk2L2 (∂Ω) ≤ 8kuk2H 1 (Ω) .
Die gezeigte Argumentation für das Einheitsquadrat läßt sich ohne Probleme für allgemeine
Polygongebiete modifizieren. Im allgemeineren Fall eines krumm berandeten Gebiets Ω erhält
man dasselbe Resultat mit Hilfe lokaler Transformationen, welche krumme Randstücke lokal
gerade transformieren, so daß wieder das obige Argument angewendet werden kann. Q.E.D.
Mit Hilfe des Spurlemmas können wir Funktionen v ∈ H 1 (Ω) eine Spur“ v|∂Ω ∈ L2 (∂Ω)
”
zuordnen, was die Frage nach der Annahme von Randwerten durch die schwache Lösung der 1.
RWA beantwortet. Sei v ∈ H 1 (Ω) und (vk )k∈N ⊂ C 1 (Ω) eine approximierende Folge. Aufgrund
der Spurabschätzung gilt dann
kvk − vl kL2 (∂Ω) ≤ c(Ω) kvk − vl kH 1 (Ω) ,
k, l ∈ N.
Da die Norm auf der rechten Seite für k, l → ∞ gegen Null konvergiert, folgt, daß die Spuren
vk|∂Ω (k ∈ N) auf ∂Ω eine Cauchy-Folge im Lebesgue-Raum L2 (∂Ω) bilden. Deren Limes
v|∂Ω ∈ L2 (∂Ω) wird dann als die Spur“ der Funktion v ∈ H 1 (Ω) bezeichnet. In diesem Sinne
”
nehmen schwache H 1 -Lösungen vorgegebene Randwerte an.
Das Variationsargument liefert zunächst nur die Existenz einer schwachen“ Lösung u ∈
”
der Poisson-Gleichung. Um zu sehen, daß diese im Fall glatter“ Daten auch klassische“
”
”
Lösung ist, zeigt man (mit einigem Aufwand) u ∈ H m (Ω) für sukzessive ansteigendes m ≥ 2 .
Hieraus kann dann geschlossen werden, daß u auch bis zur gewünschten Stufe klassisch differenzierbar ist. Dazu bedient man sich einer sog. Sobolewschen Ungleichung“. Zur Motivation
”
sei zunächst der eindimensionale Fall betrachtet.
H 1 (Ω)
Beispiel 1.2: Wir betrachten das Intervall Ω = (0, 1) ⊂ R1 . Für eine Funktion u ∈ C 1 (Ω)
30
Theorie partieller Differentialgleichungen
impliziert der Fundamentalsatz der Differential- und Integralrechnung, daß
Z x
u′ (ξ) dξ, x, y ∈ Ω.
u(x) = u(y) +
y
Daraus folgt nach Integration über y ∈ [0, 1] :
sup |u(x)| ≤
x∈Ω
Z
0
1
′
|u | dξ +
Z
1
0
|u| dξ = kukH 1,1 (Ω) ,
mit der Norm des Sobolew-Raums H 1,1 (Ω) . Dies bedeutet, daß in einer Raumdimension eine
H 1,1 -Funktion beschränkt ist. Darüber hinaus ist sie sogar stetig (genauer im L2 -Sinne äquivalent zu einer stetigen Funktion), was man mit Hilfe des üblichen Approximationsarguments
erschließt. Hierfür reicht schon die L1 -Integrabilität der ersten Ableitung aus.
In höheren Dimensionen ist die Situation komplizierter. Wir haben schon am Beispiel der
Funktion v(x) = ln(ln(|x|−1 )+1) gesehen, daß Funktionen in H 1 (Ω) (im R2 ) i.a. unbeschränkt
sein können und man ihnen folglich auch nicht überall Punktwerte zuordnen kann. Dies ist aber
möglich für Funktionen in Sobolew-Räumen höherer Ordnung. Wir präsentieren hier als Beispiel
den folgenden Sobolewsche Einbettungssatz“.
”
Hilfssatz 1.4 (Sobolewsche Ungleichung): Für Funktionen v ∈ C 2 (Ω) gilt in zwei Raumdimensionen die Abschätzung
sup |v(x)| ≤ c(Ω) kvkH 2 (Ω)
(1.3.23)
x∈Ω
mit einer Ω-abhängigen Konstante c(Ω) .
Beweis: Für den nicht trivialen Beweis verweisen wir auf die einschlägige Literatur über SobolewRäume (z.B.: Wloka (1982)).
Q.E.D.
Analog wie schon vorher bei der Spurabschätzung dient die Sobolewsche Ungleichung (1.3.23)
zur Definition von Punktwerten von Funktionen in Sobolew-Räumen. Für ein v ∈ H 2 (Ω) sei wieder (vk )k∈N ⊂ C 2 (Ω) eine approximierende Folge. Mit der Sobolewschen Ungleichung (1.3.23)
erschließen wir, daß (vk )k∈N auch Cauchy-Folge bzgl. der Maximumnorm ist. Folglich können
für v ∈ H 2 (Ω) Punktwerte definiert werden durch
v(x) := lim vk (x),
k→∞
x ∈ Ω.
In diesem Sinne besteht also eine ( stetige“) Einbettung H 2 (Ω) ֒→ C(Ω) . Die Abschätzung
”
(1.3.23) läßt sich (im R2 ) übertragen auf die Normen der Sobolew-Räume H 2,1 (Ω) und H 1,p (Ω)
für p > 2 . Folglich bestehen die stetigen Einbettungen
H 2,1 (Ω) ∪ H 1,p (Ω) ֒→ C(Ω),
p > 2, im R2 .
Weitere Sobolewsche Ungleichungen führen auf die stetigen Einbettungen
H 1 (Ω) ֒→ Lp (Ω) (1 ≤ p < ∞) im R2 ,
H 1 (Ω) ֒→ L6 (Ω) im R3 .
(1.3.24)
1.3 Hilfsmittel aus der Theorie von Funktionenräumen
31
Von fundamentaler Bedeutung ist der sog. Rellichsche Auswahlsatz“. Wir formulieren hier nur
”
eine einfache Variante, welche weiter unten benötigt wird.
Hilfssatz 1.5 (Rellichscher Auswahlsatz): Die natürliche Einbettung des Sobolew-Raumes
H 1 (Ω) in L2 (Ω) ist kompakt, d.h.: Aus jeder bzgl. der H 1 -Norm beschränkten Folge (vk )k∈N ⊂
H 1 (Ω) ⊂ L2 (Ω) läßt sich eine Teilfolge auswählen, welche in L2 (Ω) gegen einen Limes v
konvergiert. Dieser Limes ist dann auch wieder in H 1 (Ω) .
Beweis: Für den Beweis wird auf die Literatur verwiesen; z.B. Wloka (1982).
Q.E.D.
Der Rellichsche Auswahlsatz ist das Sobolew-Raum-Analogon des Auswahlsatzes von Arzelà-Ascoli für gleichgradig stetige“ Folgen stetiger Funktionen (siehe das Vorlesungsskriptum
”
Numerische Mathematik I).
1.3.3 Elemente der Spektraltheorie elliptischer Operatoren
Eine der wichtigsten Anwendungen des Rellichschen Auswahlsatzes findet sich in der Spektral”
Theorie“ elliptischer Differentialoperatoren, speziell des Laplace-Operators. Wir wollen deren
Elemente hier kurz entwickeln. Dabei haben wir vor allem deren Anwendung in der Lösungstheorie für parabolische ARWAn im Auge. Ferner werden wir später die numerische Lösung von
Eigenwertaufgaben des Laplace-Operators mit Hilfe von Finite-Elemente-Verfahren untersuchen,
wobei Resultate der Spektraltheorie benötigt werden.
Wir haben gesehen, daß für jede rechte Seite f ∈ L2 (Ω) eine eindeutige schwache“ Lösung
”
u ∈ H01 (Ω) der 1. RWA des Laplace-Operators existiert:
−∆u = f
in Ω,
u|∂Ω = 0.
(1.3.25)
Diese ist bestimmt durch die variationelle Beziehung
(∇u, ∇ϕ) = (f, ϕ) ∀ϕ ∈ H01 (Ω).
(1.3.26)
Die Zuordnung f 7→ Sf := u definiert dann einen linearen Operator S : L2 (Ω) 7→ L2 (Ω) , der in
diesem Sinne als die L2 -Inverse“ des Laplace-Operators auf Ω unter Dirichlet-Randbedingungen
”
bezeichnet werden kann. Der Beziehung
k∇uk20 = (f, u) ≤ kf k0 kuk0 ≤ dΩ kf k0 k∇uk0
entnehmen wir, daß
kSf k0 ≤ dΩ k∇Sf k0 ≤ d2Ω kf k0 ,
d.h.: Der Lösungsoperator S : L2 (Ω) 7→ L2 (Ω) ist beschränkt und wegen der kompakten Einbettung H 1 (Ω) ֒→ L2 (Ω) sogar kompakt. Wir haben schon gesehen, daß der Laplace-Operator
als Operator im Hilbert-Raum L2 (Ω) symmetrisch und positiv-definit ist:
(−∆u, v) = (∇u, ∇v) = (u, −∆v),
2
(−∆u, u) = k∇uk20 ≥ d−2
Ω kuk0 .
Dies gilt für Funktionen u, v ∈ D(∆) im Definitionsbereich der L2 -Realisierung“ des Laplace”
Operators, welcher definiert ist durch
D(∆) := v ∈ H01 (Ω) : |(∇v, ∇ϕ)| ≤ c(v)kϕk0 , ϕ ∈ H01 (Ω) ⊂ L2 (Ω).
32
Theorie partieller Differentialgleichungen
Für glatt berandete Gebiete oder konvexe Polygongebiete Ω kann man zeigen, daß D(∆) =
H01 (Ω) ∩ H 2 (Ω) . Im Fall einspringender Ecken ist dagegen D(∆) 6⊂ H 2 (Ω) .
Wir haben damit eine Realisierung des Laplace-Operator im Hilbert-Raum L2 (Ω) konstruiert, welche auf ihrem Definitionsbereich D(∆) symmetrisch ist, diesen ein-eindeutig auf ganz
L2 (Ω) abbildet, also bijektiv ist und deren Inverse S = (−∆)−1 kompakt ist. Damit ist der
Rahmen für die Anwendung abstrakter Resultate der Funktionalanalysis kompakter Operatoren
geschaffen. Für das Eigenwertproblem des Laplace-Operators
−∆w = λw
in Ω,
w|∂Ω = 0,
(1.3.27)
mit Eigenfunktion w ∈ H01 (Ω) und Eigenwert λ ∈ R gelten die folgenden Aussagen:
– Es existieren nur relle, positive Eigenwerte 0 < λ1 ≤ ... ≤ λi ≤ ... , welche sich im Endlichen nicht häufen können. Die zugehörigen Eigenräume E(λi ) sind endlich dimensional.
– Es existiert ein vollständiges Orthonormalsystem von Eigenfunktionen {wi )i∈N ⊂ L2 (Ω) ,
d.h.: Für jedes u ∈ L2 (Ω) gilt die L2 -konvergente Fourier13 -Entwicklung“
”
∞
X
(u, wi ) wi .
(1.3.28)
u=
i=1
– Mit Hilfe der Eigenwerte λi (ihrer Vielfachheiten entsprechend oft gezählt) und zugehörigen (orthonormierten) Eigenfunktionen wi lassen sich allgemeine Funktionen des LaplaceOperators definieren. Sei Φ(z) eine meromorphe Funktion, so daß die Eigenwerte λi keine
Pole sind. Dann wird durch
Φ(−∆)u :=
∞
X
Φ(λi )(u, wi ) wi
(1.3.29)
i=1
ein linearer Operator in L2 (Ω) erklärt. Wenn Φ(z) beschränkt ist, wird auch Φ(−∆)
beschränkt und ist auf ganz L2 (Ω) erklärt.
Diese Aussagen zeigen die starke Parallelität zwischen kompakten Operatoren bzw. von (dicht
definierten) Operatoren mit kompakter Inverser im Hilbert-Raum und durch (n × n)-Matrizen
dargestellte linearen Abbildungen des Rn .
13
Jean-Baptiste Baron de Fourier (1768-1830): französischer Mathematiker und Physiker; Mitglied der Pariser
Akademie lehrte an der École Polytechniqe; begleitete Napoleon auf seinem Feldzug nach Ägypten; zählt zu den
bedeutendsten Mathematikern des 19. Jahrhunderts; fand bei seinen Arbeiten zur Theorie der Wärmeleitung die
Darstellbarkeit periodischer Funktionen durch triginometrische Reihen.
1.4 Parabolische Probleme
33
1.4 Parabolische Probleme
Die sog. eindimensionale Wärmeleitungsgleichung“
”
∂t u = ∂x2 u,
(1.4.30)
oder allgemeiner in höheren Ortsdimensionen
∂t u − ∆u = f,
(1.4.31)
wird üblicherweise auf Zylindern QT := Ω × I des Orts/Zeit-Raumes betrachtet. Dabei sind
Ω ⊂ Rd ein Ortsgebiet und I := (0, T ] ein Zeitintervall. Im örtlich eindimensionalen Fall
(d = 1) ist die natürliche Anfangskurve Γ = {(x, t) ∈ R2 : t = 0} gerade Charakteristik, so
daß das zugehörige Cauchysche Anfangswertproblem i.a. nicht lösbar ist. Entlang Γ dürfen, wie
wir noch sehen werden, nur Anfangsbedingungen an u selbst gestellt werden: u|t=0 = u0 (x).
Entlang eines nicht-charakteristischen örtlichen“ Randes {(x, t) ∈ Rd+1 : x ∈ ∂Ω, t > 0} gilt
”
dagegen dasselbe wie im elliptischen Fall, d.h.: Die zugehörige Anfangswertaufgabe ist lösbar,
doch dürfen nur u oder ∂n u vorgeschrieben werden, wenn man stetige Abhängigkeit von den
Randdaten gewährleisten will.
Analog zum elliptischen Fall bieten sich drei verschiedene Typen von Randbedingungen
entlang des örtlichen Randes ∂Ω × I für die Anfangs-Randwert-Aufgabe (kurz ARWA“) der
”
Wärmeleitungsgleichung an. Zusätzlich zu der Anfangsbedingung
u|t=0 = u0
(1.4.32)
wird gefordert:
a) Dirichletsche Randbedingungen ( 1. ARWA“): u = g auf ∂Ω × I ;
”
b) Neumannsche Randbedingungen ( 2. ARWA“): ∂n u = g auf ∂Ω × I ;
”
c) Robinsche Randbedingungen ( 3. ARWA“): ∂n u + αu = g auf ∂Ω × I .
”
Die Randfunktionen g werden i.a. als glatt und α ≥ 0 angenommen. Alle diese ARWAn sind,
wie wir zum Teil zeigen werden, unter geeigneten Zusatzbedingungen an die Daten ebenfalls wohl
gestellt. Unter einer klassischen Lösung“ verstehen wir eine Funktion u ∈ C(Q̄T ) ∩ C 2 (QT ) ,
”
welche der Differentialgleichung sowie den Anfangs- und Randbedingungen genügt. Ähnlich
wie bei elliptischen Problemen gibt es auch im parabolischen Fall den Begriff der schwachen
”
Lösung“, den wir hier aber wegen seiner Kompliziertheit nicht definieren wollen.
Zunächst diskutieren wir die Eindeutigkeitsfrage. Seien u(1) , u(2) wieder zwei klassische (analog zum elliptischen Fall definiert) Lösungen der 1. ARWA des Wärmeleitungsoperators, für die
k∇u(i) (t)kΩ existiert und beschränkt ist. Für die Differenz w := u(1) − u(2) gilt dann
∂t w − ∆w = 0 in Ω × I,
w|t=0 = 0, w|∂Ω = 0.
Multiplikation mit w , Integration über Ω und anschließende partielle Integration im Ort ergeben analog zum elliptischen Fall
0 = (∂t w, w) − (∆w, w) = 12 dt kwk2 + k∇wk2 .
Dies impliziert, daß kw(t)k ≤ kw(0)k = 0 für t ≥ 0, und somit die Eindeutigkeit der Lösung
34
Theorie partieller Differentialgleichungen
und darüber hinaus deren stetige Abhängigkeit von den Anfangsdaten.
Die Existenzfrage läßt sich im Prinzip mit ähnlichen Methoden behandeln wie im elliptischen
Fall. Wir wollen das hier aus Zeitgründen nicht weiter verfolgen. Im örtlich eindimensionalen
Spezialfall Ω = (−∞, ∞) und f ≡ 0 läßt sich die Lösung der Anfangswertaufgabe explizit
angeben:
Z ∞
2
√ 1 e−(x−s) /4t u0 (s) ds.
(1.4.33)
u(x, t) =
4πt
−∞
Dies wird durch Nachrechnen verifiziert, wobei speziell auf die Existenz der auftretenden Integralterme zu achten ist. Man beachte, daß durch den Ansatz
s(x, t) =
2
√ 1 e−x /4t
4πt
eine spezielle Lösung der Wärmeleitungsgleichung gegeben ist.
Im Fall allgemeinerer, beschränkter Ortsgebiete Ω ⊂ Rd gewinnt man eine zu (1.4.33) korrespondierende Lösungsdarstellung mit Hilfe der Methode der Variablenseparation“. Einsetzen
”
des Lösungsansatzes u(x, t) = v(x)ψ(t) in die Wärmeleitungsgleichung ergibt
ψ ′ (t)v(x) = ψ(t)∆v(x)
∆v(x)
ψ ′ (t)
=
≡ konst. ,
ψ(t)
v(x)
⇒
für alle Argumente (x, t) ∈ QT . Die Separationsfaktoren v(·) ∈ C(Ω) ∩ C 2 (Ω) , v|∂Ω = 0 , und
ψ(·) ∈ C(I) sind also notwendig Lösungen der Eigenwertprobleme
−∆v(x) = λv(x) , x ∈ Ω ,
−ψ ′ (t) = λψ(t) , t ≥ 0 ,
unter den Nebenbedingungen v|∂Ω = 0 bzw. ψ(0) = 1 , mit Parametern λ ∈ R. Die Eigenwertaufgabe für v(x) besitzt, wie schon oben diskutiert, eine abzählbare Folge von Lösungen λj > 0
und vj :
−∆vj = λj vj (j = 1, 2, 3, ...)..
Die Eigenfunktionen (vj )j∈N bilden ein vollständiges Orthonormal-System im Raum L2 (Ω) der
auf Ω Lebesgue-meßbaren und quadratintegrablen Funktionen.
Die zugehörigen Lösungen für ψ(t) sind ψj (t) = e−λj t . Die Anfangsfunktion besitzt die
(verallgemeinerte) Fourier-Entwicklung:
0
u (x) =
∞
X
u0j vj (x) ,
u0j
=
j=0
Z
u0 (x)vj (x) dx .
I
Durch Superposition der Einzellösungen für j ∈ N ,
u(x, t) :=
∞
X
u0j vj (x)e−λj t ,
(1.4.34)
j=1
erhalten wir folglich eine Lösung der Wärmeleitungsgleichung, welche den Randbedingungen
und insbesondere den Anfangsbedingungen genügt. (Zum Nachweis überprüfe man die Konvergenz der Reihen der jeweils nach x sowie t abgeleiteten Einzellösungen.) Im eindimensionalen
1.4 Parabolische Probleme
35
Spezialfall Ω = (0, 1) ⊂ R1 ist gerade
vj (x) = αj sin(jπx) ,
λj = j 2 π 2 ,
Z
αj =
sin2 (jπx) dx
I
−1/2
(j ∈ N),
und die Lösungsdarstellung erhält die explizite Form
u(x, t) =
∞
X
u0j αj sin(jπx)e−aj
2 π2 t
(1.4.35)
j=1
Anhand dieser Lösungsdarstellungen lassen sich einige wichtige Eigenschaften der ARWA der
Wärmeitungsgleichung ablesen. Wie bei AWAn gewöhnlicher Differentialgleichungen entwickelt
sich die Lösung ausgehend vom Anfangswert in der Zeit. Der adäquate numerische Ansatz wird
also wieder ein Teilschrittverfahren in der Zeit sein. Im Ort pflanzen sich Störungen wie im
elliptischen Fall unendlich schnell“ fort. Irregularitäten in den Anfangs- oder Randdaten werden
”
sofort ausgeglättet, d.h.: im Innern des Zylindergebiets QT := Ω×(0, T ] ist die Lösung (im Falle
glatter rechter Seite f ) stets glatt.
Im folgenden wollen wir einige qualitative Eigenschaften von Lösungen der Wärmeleitungsgleichung diskutieren. Die Wärmeleitungsgleichung wird u.a. verwendet, um (ihrem Namen entsprechend) Wärmeausbreitungs- bzw. allgemein instationäre Diffusionsvorgänge zu beschreiben.
Es ist daher wichtig, garantieren zu können, daß ihre Lösungen bei kompatiblen Daten auch stets
positiv sind. Dies wird durch ein (dem elliptischen Fall ähnliches) Maximumprinzip geleistet.
t
T
Ω x (0, T]
Ω x (0, T]
x
Ω x {0}
Abbildung 1.4: Parabolisches Raum-Zeit-Gebiet
Satz 1.1 (Parabolisches Maximumprinzip): Für jede klassische Lösung der WärmeleitungsUngleichung
∂t u − ∆u ≤ 0
in Ω,
(1.4.36)
gilt das sog. Maximumprinzip“, d.h.: Sie nimmt im (halboffenen) Zylinder QT := Ω × (0, T ]
”
kein striktes Maximum an.
Beweis: Wir geben den Beweis nur für eine Raumdimension. Die Verallgemeinerung für höhere
Dimensionen ist dann evident. Für eine Lösung u der Wärmeleitungs-Ungleichung setzen wir
36
Theorie partieller Differentialgleichungen
vε := u − εt, mit beliebigem ε > 0. Da vε stetig auf Q̄T ist, nimmt es in einem Punkt
(x0 , t0 ) ∈ Q̄T sein Maximum an. Angenommen, (x0 , t0 ) ∈ QT . Dann gilt ∂x2 vε (x0 , t0 ) ≤ 0 , und
folglich
∂t vε (x0 , t0 ) ≤ ∂t vε (x0 , t0 ) − ∂x2 vε (x0 , t0 ) = ∂t u(x0 , t0 ) − ε − ∂x2 u(x0 , t0 ) ≤ −ε.
Aus Stetigkeitsgründen ist dann auch ∂t vε (x0 , t) ≤ − 12 ε für t0 −h ≤ t ≤ t0 , mit einem geeigneten
h > 0. Hiermit folgern wir, daß
Z t0
∂t vε (x0 , t) dt ≤ − 12 εh < 0.
vε (x0 , t0 ) − vε (x0 , t0 − h) =
t0 −h
Dies führt auf den Widerspruch vε (x0 , t0 ) < vε (x0 , t0 − h). Also nimmt vε notwendig sein
Maximum für t = 0 an. Da ε > 0 beliebig klein gewählt werden darf, gilt diese Aussage auch
für den (stetigen) Grenzfall ε = 0 , d.h. für die Lösung u .
Q.E.D.
Als Konsequenz des parabolischen“ Maximumprinzips sehen wir insbesondere, daß eine Lösung
”
der (homogenen) Wärmeleitungsgleichung
∂t u − ∆u = 0 in Ω,
u = 0 auf ∂Ω,
(1.4.37)
zu nicht-negativen Anfangsdaten u0 ≥ 0 (u|∂Ω = 0) nicht-negativ bleibt für alle t ≥ 0 :
u0 ≥ 0
⇒
0 ≤ u(x, t) ≤ maxΩ u0 ,
(x, t) ∈ QT .
(1.4.38)
Ferner sind wieder klassische“ Lösungen u ∈ C(Q̄T ) ∩ C 2 (QT ) eindeutig bestimmt.
”
Satz 1.2 (Globale Beschränktheit): Für jede Lösung der inhomogenen Wärmeleitungsgleichung (1.4.31) gilt die a priori Abschätzung
ku(t)k ≤ e−λt ku0 k + λ−1 sup kf k,
(1.4.39)
[0,t]
mit dem kleinsten Eigenwert λ > 0 des elliptischen Operators −∆ auf Ω zu homogenen
Dirichlet-Randbedingungen.
Beweis: Wir betrachten die beiden Hilfsprobleme
∂t v − ∆v = 0 in QT ,
∂t w − ∆w = f in QT ,
v|∂Ω = 0, v|t=0 = u0 ,
w|∂Ω = 0, w|t=0 = 0.
(1.4.40)
(1.4.41)
Offenbar ist dann u = v + w wegen der Linearität des Wärmeleitungsoperators (Superpositionsprinzip). Wir schätzen nun die beiden Lösungsanteile v und w separat ab.
(i) Multiplikation von (1.4.40) mit v und Integration im Ort ergibt
2
1
2 dt kvk
+ k∇vk2 = 0.
Wir multiplizieren dies mit e2λt und finden
2λt
1
kvk2 + e2λt k∇vk2 − λe2λt kvk2 = 0.
2 dt e
1.4 Parabolische Probleme
37
Wegen λkvk2 ≤ k∇vk2 impliziert dies dt e2λt kvk2 ≤ 0 , und Integration bzgl. t ergibt
e2λt kv(t)k2 ≤ ku0 k2
bzw. wieder
kv(t)k ≤ e−λt ku0 k.
(ii) Multiplikation von (1.4.41) mit w und Integration im Ort ergibt
2
1
2 dt kwk
+ k∇wk2 = (f, w) ≤ 12 λkwk2 + 21 λ−1 kf k2 .
Mit Hilfe von λkwk2 ≤ k∇wk2 folgern wir
dt kwk2 + k∇wk2 ≤ λ−1 kf k2 .
Wir multiplizieren diese Ungleichung nun mit eλt und finden
dt eλt kwk2 + eλt k∇wk2 − λeλt kwk2 ≤ λ−1 eλt kf k2 ,
bzw.
dt eλt kwk2 ≤ λ−1 eλt kf k2 .
Integration bzgl. t ergibt
λt
2
−1
Z
t
eλs kf k2 ds,
Z t
kw(t)k2 ≤ λ−1 e−λt
eλs kf k2 ds.
e kw(t)k ≤ λ
0
0
Die Abschätzung
−λt
e
Z
t
0
impliziert dann kw(t)k ≤
behauptete Abschätzung.
λ−1 max
[0,t] kf k .
eλs ds ≤ λ−1 .
Kombination der Resultate für v und w liefert die
Q.E.D.
Als Folgerung aus diesem Satz ersehen wir insbesondere, daß bei einem parabolischen Problem der Einfluß der Anfangsdaten exponentiell mit der Zeit abklingt. Weiter interessiert das
Lösungsverhalten für Anfangsdaten u0 mit minimaler Regularität.
Satz 1.3 (Glättungseigenschaft): Für jede Lösung der homogenen Wärmeleitungsgleichung
(1.4.31) mit f ≡ 0 gelten die a priori Abschätzungen
k∂t u(t)k + k∆u(t)k ≤ k∆u0 k,
k∂t u(t)k + k∆u(t)k ≤ t
−1
0
ku k,
t ≥ 0,
t > 0,
(1.4.42)
(1.4.43)
vorausgesetzt, der Anfangswert u0 besitzt die erforderliche Regularität.
Beweis: Wir bedienen uns zum Beweis der sog. Spektral-Methode“, welche aber auf symmetri”
sche und autonome (d.h. nicht explizit von der Zeit abhängige) Operatoren beschränkt ist. Alternative Zugänge sind die Halbgruppen-Methode“, welche nicht die Symmetrie des Operators
”
38
Theorie partieller Differentialgleichungen
erfordert, sowie die Energie-Methode“, welche im allgemeinen Fall und sogar für nichtlineare
”
Probleme anwendbar ist. Aus der Lösungsdarstellung (1.4.34) mit dem Orthonormalsystem von
Eigenfunktionen {vj }j∈N des Laplace-Operators,
u(x, t) :=
∞
X
u0j vj (x)e−λj t ,
j=1
folgern wir
∂t u(x, t) = ∆u(x, t) := −
∞
X
u0j λj vj (x)e−λj t .
j=1
Aufgrund der (verallgemeinerten) Parsevalschen14 Identität gilt demnach
k∂t uk2 = k∆uk2 =
∞
X
(u0j )2 λ2j e−2λj t .
j=1
Als erstes Resultat entnehmen wir dieser Beziehung, daß
k∂t uk2 = k∆uk2 ≤
∞
X
j=1
(u0j )2 λ2j = k∆u0 k2 .
Hieraus folgt wegen xe−x ≤ 1, x ≥ 0, :
k∂t uk2 = k∆uk2 = t−2
∞
∞
X
X
(u0j )2 = t−2 ku0 k2 ,
(u0j )2 (λj t)2 e−2λj t ≤ t−2
j=1
j=1
was den Beweis vervollständigt.
Q.E.D.
Als Folgerung aus diesem Satz finden wir nochmal bestätigt, daß die Wärmeleitungsgleichung
die Glättungseigenschaft“ besitzt, d.h.: Irregularitäten in den Anfangsdaten werden für t > 0
”
ausgeglättet. Durch Weiterführung der Argumentation im Beweis von Satz 1.3 lassen sich analog
beliebig hohe Ableitungen der Lösung abschätzen:
k∂tp u(t)k + k∇2p u(t)k ≤ c(p) k∆p u0 k,
t ≥ 0,
(1.4.44)
t > 0, p ∈ N.
(1.4.45)
sowie
k∂tp u(t)k + k∇2p u(t)k ≤ c(p) t−p ku0 k,
14
Mare-Antoine Parseval des Chênes (1755-1836): französischer Mathematiker; Privatgelehrter; Beiträge zu
Reihen, insbesondere Fourier-Reihen.
1.5 Hyperbolische Probleme
39
1.5 Hyperbolische Probleme
Die Wellengleichung
∂t2 u − ∆u = 0
(1.5.46)
wird in der Regel wieder auf einem Zylindergebiet QT := Ω × I mit einem (meist beschränkten)
Gebiet Ω ⊂ Rd und einem Intervall I = (0, T ] betrachtet. Die Frage nach der Wohlgestelltheit
zugehöriger Anfangs-Randwertaufgaben wollen wir nur für den örtlich eindimensionalen Fall
diskutieren. Die charakteristischen Steigungen der (örtlich) eindimensionalen Wellengleichung
∂t2 u = ∂x2 u
(1.5.47)
sind gerade gegeben durch dt/dx = ±1, d.h.: die Charakteristiken sind alle Geraden in der (x, t)Ebene mit der Steigung ±1. Die natürliche Anfangskurve Γ := {(x, t) : x ∈ Ω, t = 0} ist also
keine Charakteristik, so daß gemäß der Theorie die zugehörige Cauchysche Anfangswertaufgabe
bei Vorgabe von Werten u(x, 0) = u0 (x) und ∂t u(x, 0) = u1 (x) lösbar ist. Diese Lösung läßt
sich im Fall einer Raumdimension leicht angeben. Wir betrachten den Sonderfall Ω = R1 .
t
t0
(x0, t0)
B(x0, t0)
A(x0, t0)
x
x0
Abbildung 1.5: Hyperbolisches Raum-Zeit-Gebiet
Die Koordinatentransformation ξ = x + t, η = x − t überführt die Wellengleichung in die
Form
∂ξ ∂η u = 0.
Diese hat die Lösungen der Form
u(ξ, η) = F (ξ) + G(η)
mit beliebigen, hinreichend glatten Funktionen F (·) und G(·). Die allgemeine Lösung der Wellengleichung lautet demnach
u(x, t) = F (x + t) + G(x − t).
Zur Erfüllung der Anfangsvorgaben auf Γ muß nun gelten:
F (x) + G(x) = u0 (x),
F ′ (x) − G′ (x) = u1 (x).
40
Theorie partieller Differentialgleichungen
Hieraus entnehmen wir, daß
F (x + t) + G(x + t) + F (x − t) + G(x − t) = u0 (x + t) + u0 (x − t),
Z x+t
F (x + t) − G(x + t) − F (x − t) + G(x − t) =
u1 (s) ds,
(1.5.48)
(1.5.49)
x−t
und folglich,
u(x, t) =
1
2
n
0
0
u (x + t) + u (x − t) +
Z
x+t
x−t
o
u1 (s) ds .
Dies ist die (eindeutige) klassische Lösung der Wellengleichung zu den vorgegebenen Anfangsdaten u0 (x), u1 (x) . Eine analoge Konstruktion ist auch in höheren Raumdimensionen möglich.
Die Form der Lösung u(x, t) zeigt, daß bei einem hyperbolischen Problem die Ausbreitungsgeschwindigkeit von Information endlich ist. Lokale Störungen pflanzen sich entlang der Charakteristiken (Geraden mit Steigung ±1 ) fort. Insbesondere erzeugen unstetige Anfangsdaten
notwendig auch unstetige Lösungen. Dies erfordert im Falle irregulärer Anfangs- oder Randdaten
einen neuartigen Lösungsbegriff, der auch Unstetigkeiten zuläßt. Für jeden Punkt (x0 , t0 ) ∈ QT
gibt es demnach einen Abhängigkeitsbereich“ A(x0 , t0 ) sowie einen Bestimmtheitsbereich“
”
”
B(x0 , t0 ) , innerhalb deren sich das Anfangswertproblem unabhängig vom restlichen Bereich
lösen läßt:
A(x0 , t0 ) := {x ∈ R : |x − x0 | ≤ t0 },
B(x0 , t0 ) := {(x, t) ∈ R × R+ : |x − x0 | ≤ t}.
Die Eindeutigkeit von Lösungen der Wellengleichung erschließt man wieder am leichtesten
mit Hilbertraum-Argumenten“. Sei u(x, t) eine klassische Lösung der ARWA
”
∂t2 u = ∆u in Ω,
u|t=0 = u0 , ∂t u|t=0 = u1 , u|∂Ω = 0,
(1.5.50)
mit endlicher Energie“ (kinetische + potentielle Energie)
”
E(t) := k∂t u(t)k2Ω + k∇u(t)k2Ω < ∞.
Multiplikation der Differentialgleichung mit ∂t u , Integration über Ω und anschließende partielle
Integartion ergibt
0 = (∂t2 u − ∆u, ∂t u) = 12 dt k∂t uk2 + k∇uk2 .
Dies impliziert, daß
k∂t u(t)k2 + k∇u(t)k2 = ku1 k2 + k∇u0 k2 ,
(1.5.51)
d.h. die Lösung ist eindeutig und hängt bzgl. der natürlichen Energie-Norm stetig von den
Anfangsdaten ab. Ferner bleibt die Gesamtenergie E(t) im System in der Zeit erhalten. Dies
entspricht der Vorstellung, daß bei einem Schwingungsprozeß, etwa der Schwingung eines elastischen Körpers oder einer Schallwelle, bei Vernachlässigung von Dämpfung im Verlaufe der Zeit
keine Energie verloren geht. Ein gutes“ Diskretisierungsverfahren für die Wellengleichung sollte
”
diese kritische Eigenschaft möglichst gut wiedergeben.
1.6 Übungen
41
1.6 Übungen
Übung 1.1: Gegeben sei die Anfangswertaufgabe (AWA) einer skalaren gew. Differentialgleichung
u′ (t) = f (t, u(t)), t ≥ t0 , u(t0 ) = u0 ,
mit einer analytischen Funktion f (t, x) mit gleichmäßig beschränkten Ableitungen
sup k∂tj ∂xk f (t, ·)k∞ ≤ K < ∞,
j,k≥0
t ≥ t0 ,
(z.B. die Funktion f (t, x) := sin(x) ). Man zeige, daß man durch den Taylor-Ansatz
u(t) = u0 +
∞
X
f (k−1) (t0 , u0 )
k=1
k!
(t − t0 )k
mit f (r) (t0 , u0 ) := (d/dt)r f (t, u(t))|t=t0 eine globale (d.h. für alle t ≥ t0 existierende) Lösung
der AWA erhält.
Übung 1.2: In der Vorlesung wurde die Typeneinteilung von linearen Differentialoperatoren 2.
Ordnung mit der Aufgabe motiviert, aus gegebenen Werten u(x0 , y0 ) und ∂n u(x0 , y0 ) entlang
einer Kurve Γ die Lösung u(x, y) über einen Taylor-Reihenansatz zu bestimmen. Diese Konstruktion wurde allerdings nur bis zu den drei zweiten Ableitungen ∂x2 u(x0 , y0 ) , ∂x ∂y u(x0 , y0 )
und ∂y2 u(x0 , y0 ) durchgeführt und hing von der Regularität einer gewissen Matrix A ab. Man
zeige, daß nach Bestimmung der zweiten Ableitungen die Konstruktion der vier dritten Ableitungen ∂x3 u(x0 , y0 ) , ∂x2 ∂y u(x0 .y0 ) , ∂x ∂y2 u(x0 , y0 ) und ∂y3 u(x0 , y0 ) auf dieselbe Matrix A führt.
Diese Aussage gilt auch für die weiteren, höheren Ableitungen. Die Vorgenommene Klassifizierung des Differentialoperators als elliptisch, parabolisch oder hyperbolisch basierend auf der
Konstruierbarkeit der Lösung aus den Randdaten ist also sinnvoll.
Übung 1.3: Man bestimme den Typ der Differentialgleichungen
a)
∂x ∂y u − ∂x u = 0,
b)
∂x2 u + ∂x ∂y u + y∂y2 u + 4u = 0,
c)
2(∂x + ∂y )2 u + ∂y u = 0.
(Hinweis: Das in der Vorlesung angegebene Kriterium für den Typ einer Gleichung kann auch
bei variablen Koeffizienten separat in jedem einzelnen Ortspunkt verwendet werden.)
Übung 1.4: Eine (skalare) lineare partielle Differentialgleichung (PDE) 2. Ordnung der Form
a11 ∂12 u + a12 ∂1 ∂2 u + a21 ∂2 ∂1 u + a22 ∂22 u = f
läßt sich durch Setzung u1 := ∂1 u, u2 := ∂2 u in ein System von PDE 1. Ordung umformen:
∂2 u1 − ∂1 u2 = 0,
a11 ∂1 u1 + a12 ∂1 u2 + a21 ∂2 u1 + a22 ∂2 u2 = f.
42
Theorie partieller Differentialgleichungen
Man zeige, daß sich die in der Vorlesung für (skalare) lineare PDE 2. Ordnung durchgeführte
Typeneinteilung analog auch für Systeme 1. Ordnung der allgemeinen Form
b111 ∂1 u1 + b112 ∂1 u2 + b121 ∂2 u1 + b122 ∂2 u2 = f1 ,
b211 ∂1 u1 + b212 ∂1 u2 + b221 ∂2 u1 + b222 ∂2 u2 = f2 ,
vornehmen läßt (mit analogen Resultaten). Ziel ist dabei die Bestimmung von Kurven Γ ⊂ R2 ,
bei denen die Vorgabe von Anfangswerten für u1 und u2 entlang Γ die Konstruktion aller
Ableitungen von u1 und u2 , beginnend mit den zweiten Ableitungen ∂12 u1 , ∂1 ∂2 u1 , ∂22 u1 ,
∂12 u2 , ∂1 ∂2 u2 , ∂22 u2 und damit einen Taylor-Reihenansatz für die Lösung erlaubt. (Bem.: Wenn
die Konstruktion von u1 und u2 auf diesem Wege möglich ist, erhält man für die gegebene PDE
2. Ordnung dann durch weitere Vorgabe von u entlang Γ aus der Kenntnis von ∂1 u = u1 und
∂2 u = u2 im ganzen Lösungsgebiet dort auch eine Lösung u durch einfaches Aufintegrieren.)
Übung 1.5: In der Vorlesung wurde die Poincarésche Ungleichung
Z
Z
2
2
k∇u(x)k2 dx, dG := diam(G),
|u(x)| dx ≤ dG
G
G
nur für Funktionen u ∈ V0 (G) formuliert, d.h. welche auf dem ganzen Rand ∂G null sind. Der
Beweis funktioniert aber auch für Funktionen, die nur entlang eines Teils Γ ⊂ ∂G des Randes
mit Länge |Γ| =
6 0 null sind, d.h. auf dem Raum
V0 (Γ; G) := {v ∈ C 1 (G) ∩ C(G) : ∇v ∈ L2 (G)n , v|Γ = 0}.
(i) Man führe den Beweis dieser Verallgemeinerung der Poicaréschen Ungleichung für das Einheitsquadrat Q = (0, 1)2 ⊂ R2 und den Randteil Γ := {x = (x1 , 0) : 0 ≤ x1 ≤ 1} .
(ii) Kann die Poincareśche Ungleichung gültig bleiben, wenn der Randteil Γ ⊂ ∂G trivial ist,
etwa nur aus einem Punkt besteht? Man untersuche diese Frage anhand der in (i) gegebenen
Situation mit Γ := {(0, 0)} . Welche Konsequenzen hat die Antwort auf diese Frage für die
1. RWA des Laplace-Operators? (Hinweis: Man betrachte die Folge der Funktionen uk (r, θ) =
r 1/k .)
Übung 1.6: Auf einem beschränkten Gebiet Ω ⊂ Rn mit glattem Rand ∂Ω werden die folgende (a) zweite und (b) dritte Randwertaufgabe betrachtet:
(a)
(b)
− ∆u + au = f in Ω,
− ∆u + au = f in Ω,
∂n u = g auf ∂Ω,
∂n u + αu = g auf ∂Ω,
mit Konstanten a > 0 und α ≥ 0 . Man zeige, daß diese RWAn jeweils höchstens eine “klassische” Lösung u ∈ C 2 (Ω) ∩ C 1 (Ω) haben können. Welches Problem ergibt sich im Fall a = 0 ,
d.h. für den reinen Laplace-Operator?
Übung 1.7: Für die klassische Lösung der Randwertaufgabe
−∆u = 1 in Ω,
u = 0 auf ∂Ω,
auf einem glatt berandetem Gebiet Ω ⊂ Q1 := {(x, y) ∈ R2 | 0 < x, y < 1} zeige man mit Hilfe
des Maximumprinzips die Einschließung 0 ≤ u(x) ≤ 18 . (Hinweis: Man vergleiche u mit der
1.6 Übungen
43
quadratischen Funktion v = 41 x(1 − x) + 14 y(1 − y) .)
Übung 1.8: Der Laplace-Operator ∆ = div grad hat für Funktionen u = u(r, θ) in Polarkoordinaten (r, θ) ∈ [0, ∞) × [0, 2π] die folgende Form:
∆u = (∂r2 + r −1 ∂r + r −2 ∂θ2 )u.
(i) Für ein ω ∈ (0, 2π] sei Sω := {(r, θ) : r > 0, θ ∈ (0, ω)} der zugehörige Sektor der (x, y)Ebene. Man zeige, daß die auf dem Gebiet G := Sω ∩ K1 (0) definierte Funktion
sω (r, θ) := r π/ω sin(θπ/ω)
harmonisch ist, d.h. ∆sω ≡ 0 , und den Randbedingungen sω (r, 0) = sω (r, ω) = 0 sowie
sω (1, θ) = sin(θπ/ω) genügt.
(ii) Man zeige, daß im Fall π < ω ≤ 2π , d.h. im Fall eines stumpfen Innenwinkels, die ersten
Ableitungen dieser Funktion zwar unbeschränkt aber noch (uneigentlich) quadrat-integrabel
sind, daß ihre zweiten Ableitungen aber nicht mehr quadrat-integrabel sind. Wie sieht das bei
spitzen Innenwinkeln, d.h. 0 < ω < π , aus?
Dieses Beispiel zeigt, daß klassische Lösungen von elliptischen RWAn auch zu glatten Daten am
Gebietsrand nicht regulär zu sein brauchen.
Übung 1.9: Man untersuche, ob die folgenden Funktionen auf dem Einheitsquadrat Ω =
{(x, y) ∈ R2 | 0 < x, y < 1} im Sobolew-Raum H 1 (Ω) liegen:
a) u(x, y) = |x − y|1/2 ,
1/2
b) u(x, y) = sin ln(1/r) , r = x2 + y 2
.
(Hinweis: Man untersuche die “uneigentliche” Riemann-Integrabilität der Ableitungen.)
Übung 1.10: Man zeige, daß für Funktionen u ∈ H 1 (Ω) unter der Mittelwertbedingung
Z
u(x) dx = 0
Ω
ebenfalls die Poincarésche Ungleichung gilt (mit einer Konstante cΩ ):
kukΩ ≤ cΩ k∇ukΩ .
(Hinweis: Zum Beweis gibt es zwei alternative Wege: Modifikation des direkten Beweises aus der
Vorlesung unter Verwendung von “Randwerten” u|Γ = 0 , oder Widerspruchsargument unter
Verwendung des Rellichschen Auswahlsatzes.)
Übung 1.11: Auf welchem der folgenden Gebiete ist die RWA
−∆u = 0 in Ω,
u|∂Ω = 0,
wohl gestellt, d.h. besitzt eine eindeutige schwache Lösung u ∈ H01 (Ω) (mit Begründung)?
44
Theorie partieller Differentialgleichungen
a) gepunktete Kreisscheibe
Ω = {x ∈ R2 | 0 < |x| < 1} ⊂ R2 ;
b) geschlitzte Kreisscheibe
Ω = {x ∈ R2 | |x| < 1} \ Γ,
Γ := {x ∈ R2 | −
1
2
≤ x1 ≤ 21 , x2 = 0 } ⊂ R2 .
Übung 1.12: Man gebe eine variationelle Formulierung der folgenden Randwertaufgabe an:
−∆u + u = f in Ω,
∂n u + u|∂Ω = g,
und begründe, daß deren Lösung im Falle ausreichender Glattheit die RWA löst.
Übung 1.13: Welche von den folgenden Sobolewschen Ungleichungen sind richtig?
a)
b)
c)
d)
kukL∞ (Ω) ≤ c kukH 2 (Ω) ,
u ∈ H 2 (Ω), Ω ⊂ R3 ;
kukL∞ (Ω) ≤ c kukH 1 (Ω) ,
u ∈ H 1 (Ω), Ω ⊂ R2 ;
kukL∞ (Ω) ≤ c kukH 1,1 (Ω) ,
kukL1 (∂Ω) ≤ c kukH 1,1 (Ω) ,
u ∈ H 1,1 (Ω), Ω ⊂ R1 ;
u ∈ H 1,1 (Ω), Ω ⊂ R2 .
Man erkläre die Bedeutung der verwendeten Funktionenräume und Normen.
2 Differenzen-Verfahren für elliptische Probleme
In diesem Kapitel werden wir zunächst die klassischen Differenzenapproximationen zur Lösung
elliptischer Randwertaufgaben diskutieren. Der Übersichtlichkeit halber beschränken wir uns dabei auf das Modellproblem der Poisson-Gleichung in zwei Raumdimensionen mit Dirichletschen
Randbedingungen, d.h. auf die 1. RWA:
Lu := −∆u = f
in Ω,
u = g auf ∂Ω.
(2.0.1)
Das Definitionsgebiet Ω ⊂ R2 wird zunächst wieder als glatt berandet oder als konvexes Polygongebiet vorausgesetzt. Die Problemdaten f, g sind ebenfalls glatt, so daß die im vorigen
Kapitel beschriebenen Resultate anwendbar sind. Erweiterungen für Probleme mit variablen
Koeffizienten oder anderen Randbedingungen sowie auf den dreidimensionalen Fall werden gegebenenfalls in Bemerkungen berücksichtigt.
2.1 Allgemeine Differenzenapproximationen
Zur Definition einer sog. Differenzenapproximation“ der RWA wird das Lösungsgebiet Ω durch
”
ein endliches (nicht notwendig äquidistantes oder kartesisches) Punktgitter überdeckt. Wir definieren disjunkte Punktmengen
Ωh := { innere” Gitterpunkte in Ω},
”
∂Ωh := { Rand-Gitterpunkte” nahe bei ∂Ω},
”
und setzen Ωh := Ωh ∪ ∂Ωh . Welche Punkte zu ∂Ωh gehören, hängt von der Eigenart der
gewählten Differenzenapproximation ab; im folgenden werden verschiedene Beispiele betrachtet.
Der Parameter h > 0 beschreibt wie üblich die Feinheit” des Gitters Ωh , d.h. so etwas wie den
”
mittleren Abstand benachbarter Gitterpunkte. Die Gitterpunkte in ∂Ωh seien ähnlich dicht verteilt wie die in Ωh . Die Differentialgleichung wird nun in den Punkten in Ωh betrachtet und jede
Ableitung durch einen Differenzenquotient ersetzt. Diese Differenzenappoximation greift dabei
auch auf Randpunkte in ∂Ωh zurück. So ergibt sich ein Differenzenschema zur Bestimmung
einer diskreten Lösung uh : Ωh → R der allgemeinen Gestalt
Lh uh (P ) = fh (P ) für P ∈ Ωh ,
uh (P ) = gh (P ) für P ∈ ∂Ωh ,
(2.1.2)
wobei fh und gh geeignete Approximationen der rechten Seite f bzw. der Randwerte g sind
(im einfachsten Fall etwa gh (P ) = g(P ) ). Auf natürliche Weise verstehen wir die Anwendung
des Operators Lh auch auf die kontinuierliche Lösung u ∈ C(Ω) . Zur Konstruktion konkreter Differenzenoperatoren definieren wir zu jedem Punkt eine Umgebung von (verschiedenen)
Punkten
N (P ) := {Qi , i = 0, ..., rP } (Konvention: Q0 := P ),
auf denen eine Differenzenapproximation des Laplace-Operators definiert ist. Der Differenzenoperator hat dann die Form
X
Lh uh (P ) =
σ(P, Q)uh (Q),
(2.1.3)
Q∈N (P )
mit gewissen Koeffizienten σ(P, Q). Diese sind so zu bestimmen, daß die folgenden Forderungen
erfüllt sind:
45
46
Differenzen-Verfahren für elliptische Probleme
i) Konsistenz: Das Schema ist konsistent”, d.h.: Für den Abschneidefehler”
”
”
τh (P ) := Lh u(P ) − fh (P ),
P ∈ Ωh ,
gilt
max |τh (P )| → 0 (h → 0).
(2.1.4)
P ∈Ωh
Wünschenswert wäre eine möglichst hohe Konsistenzordnung“ m ≥ 1 , d.h.:
”
max |τh (P )| = O(hm ).
(2.1.5)
P ∈Ωh
Wir werden uns im folgenden üblicherweise meist mit m = 2 begnügen. Aus Ökonomiegründen
wird man rP von moderater Größe wählen ( rP ≈ 4 − 24 in zwei Raumdimensionen).
ii) Stabilität: Das Differenzenschema ist wohl-gestellt, d.h.: Es bestimmt eindeutige diskrete Lösungen (uh (P ))P ∈Ωh , welche gleichmäßig bzgl. h stetig von den Daten des Problems
abhängen. Dazu wäre z.B. eine Stabilitätsabschätzung des folgenden Typs zu beweisen:
(2.1.6)
max |uh (P )| ≤ cstab max |Lh uh (P )| + max |uh (P )| ,
P ∈Ωh
P ∈Ωh
P ∈∂Ωh
mit einer von h unabhängigen Konstante cstab > 0 .
iii) Verträglichkeit: Der Differenzenoperator Lh soll analoge charakteristische Eigenschaften
wie der kontinuierliche L besitzen; z.B.: Symmetrie, Definitheit, Maximumprinzip, u.s.w.
Das Hauptziel der Konvergenzanalyse von Differenzenschemata ist der Nachweis, daß eine
Konsistenzordnung m auch eine Konvergenzordnung m des Fehlers eh := u − uh impliziert:
max |eh (P )| = O(hm ),
(2.1.7)
P ∈Ωh
vorausgesetzt, die Lösung u ist ausreichend regulär.
2.1.1 Konsistenz
Für den Fall fh (P ) = f (P ) betrachten wir o.B.d.A. den Punkt P = Q0 = 0 und die Punktumgebung N (P ) = {Qi = (xi , yi ), i = 0, ..., rP } . Taylorentwicklung ergibt:
u(Qi ) = u(P ) + xi ∂x u(P ) + yi ∂y u(P ) + 21 x2i ∂x2 u(P ) + xi yi ∂x ∂y u(P ) + 12 yi2 ∂y2 u(P ) + · · · .
Wir wollen aus diesem Ansatz die Koeffizienten σi := σ(P, Qi ) im Differenzenoperator so bestimmen, daß eine vorgegebene Konsistenzordnung garantiert ist. Mit dem Ansatz τh (P ) = O(hm )
erhält man durch Koeffizientenvergleich als notwendige und hineichende Bedingung für Konsistenz:
(B0) Konsistenz: Für die Koeffizienten des Differenzenschemas gilt:
rP
X
i=0
σi =
rP
X
i=0
xi σi =
rP
X
i=0
y i σi =
rP
X
i=0
xi yi σi = 0,
1
2
rP
X
i=0
x2i σi =
1
2
rP
X
i=0
yi2 σi = 1.
(2.1.8)
2.1 Allgemeine Differenzenapproximationen
47
Aus diesen Beziehungen sind die Koeffizienten σi , i = 0, ..., rP , im Differenzenoperator Lh zu
bestimmen. Für Konsistenz sind also im allgemeinen Fall eines völlig unstrukturierten Gitters
mindestens 6 Punkte in N (P ) erforderlich. Die Konsistenz des Differenzenschemas ist offenbar
äquivalent dazu, daß der Differenzenoperator exakt” ist für quadratische Polynome:
”
u ∈ P2 :
Lh u(P ) = Lu(P ),
P ∈ Ωh .
(2.1.9)
Da man in der Regel Diskretisierungen auf Folgen von Gittern mit Gitterweiten h → 0 betrachtet, führt man skalierte Parameter ξi = h−1 xi , ηi = h−1 yi ein, um sich von der h-Abhängigkeit
in den Koeffizienten zu befreien. Wegen
1 2
2h
rP
X
ξi2 σi = 12 h2
i=0
rP
X
ηi2 σi = 1,
i=0
ist σi = 0 oder σi ∼ h−2 . Wenn also eine Lösung für (σ0 , . . . , σrP ) existiert, dann ergibt sich für
den Konsistenzfehler
τh (P ) = (Lh u − Lu)(P ) = O(h3 ξi3 σi + . . .) = O(h).
(2.1.10)
Auch bei ganz irregulärer Gitterpunktsanordnung erhält man somit schon mindestens eine Konsistenzordnung m = 1 . Es gibt mehrere Möglichkeiten, die Ordnung zu erhöhen:
– Man nimmt mehr Gitterpunkte in die Menge N (P ) auf.
– Man ordnet das Gitter regulär an, um in der Taylor-Entwicklung des Abschneidefehlers
Weghebeffekte zu erzielen.
Wir werden uns nun im folgenden mit regulären, speziell äquidistanten, kartesischen Gittern
beschäftigen. Der Einfachheit halber sollen die Gitterpunkte äquidistant entlang von Parallelen zu den Koordinatenachsen angeordnet sein. Dabei bezeichnet R2h das gesamte den R2
überdeckende Punktgitter. Die Schnittpunkte der Gitterlinien mit dem Rand ∂Ω bilden dabei natürliche Stützpunkte für die Approximation der Randwerte. Die Gitterweite“ h hat auf
”
solchen Gittern eine natürliche Bedeutung.
Ω
Ωh
0
P
innere Knoten
✱
Ωh
Pseudo-Randknoten
Ω
Randknoten
h
h
Abbildung 2.1: Gitter für Differenzenapproximation
48
Differenzen-Verfahren für elliptische Probleme
Die einfachste Approximation ∆h ≈ ∆ des Laplace-Operators verwendet zentrale Differenzenquotienten 2. Ordnung in jeder der Koordinatenrichtungen. Man erhält den sog. 5-Punkte”
Operator“:
n
o
1
(5)
∆h uh (x, y) := 2 u(x ± h, y) + u(x, y ± h) − 4u(x, y)
h
für innere Gitterpunkte P = (x, y) ∈ Ωh . Wir verwenden hier die Konvention, daß ... ± h”
”
abkürzend für die Summe der beiden Terme ... + h” und ... − h” steht. Die Konsistenzordnung
”
”
dieser Differenzenapproximation ist wegen der Äquidistanz des Gitters und der symmetrischen
Plazierung der Stützpunkte m = 2 :
(5)
|∆h u(P ) − ∆u(P )| ≤ 16 M4 (u)h2 ,
(2.1.11)
wobei M4 (u) := maxΩ {|∂xi ∂yj u|, i + j = 4} . Diese Aussage bleibt gültig, wenn das Gitter nur in
jeder einzelnen der Koordinatenrichtungen äquidistant ist. Dagegen ginge die Konsistenzordnung
auf m = 1 zurück, wenn das Gitter zwar kartesisch, aber innerhalb einer Koordinatenrichtung
nicht äquidistant wäre. Höhere Approximationsordnungen lassen sich z.B. auf einem gleichförmigen Gitter durch Hinzunahme von weiteren Punkten in der Umgebung des Auswertungspunkts
(x, y) erzielen:
i) Approximation der zweiten Ableitungen im Laplace-Operator durch zentrale Differenzenquotienten auf jeweils 5 Punkten ergibt den gestreckten“ 9-Punkte-Operator:
”
n
o
1
(9)
−
u(x
±
2h,
y)
+
16u(x
±
h,
y)
−
u(x,
y
±
2h)
+
16u(x,
y
±
h)
−
60u(x,
y)
.
∆h uh (x, y) =
12h2
Dieser Differenzenoperator hat offensichtlich die Konsistenzordnung m = 4 , doch hat die zugehörige Koeffizientenmatrix wegen des Vorzeichenwechsels ungünstige Eigenschaften.
ii) Der kompakte“ 9-Punkte-Operator verwendet neben dem Auswertungspunkt (x, y) die 8
”
direkten Nachbarpunkte (x ± h, y), (x ± h, y ± h), (x, y ± h) :
n
o
¯ (9) uh (x, y) = 1 4u(x ± h, y) + 4u(x, y ± h) + u(x ± h, y ± h) − 20u(x, y) .
∆
h
6h2
Dieses Schema hat zunächst auch nur die Ordnung m = 2 , doch kann man es durch eine Modifikation bei der Auswertung der rechten Seite auf die Ordnung m = 4 bringen (Übungsaufgabe):
f (x, y) → f (x, y) +
1 2 (5)
12 h ∆h f (x, y).
(2.1.12)
Approximation entlang des Randes: Bei der Approximation am (möglicherweise gekrümmten) Rand des Gebiets gibt es verschiedene Möglichkeiten, die, wie wir später sehen werden,
durchaus auf unterschiedliche Approximationsordnungen führen. Wir betrachten wieder den 5Punkte-Operator und definieren zunächst die folgenden Gitterpunktmengen:
[
N (P ) \ Ωh .
Ωh := {P ∈ R2h | N (P ) ⊂ Ω}, ∂Ωh :=
P ∈Ωh
i) Konstante Randwertextrapolation: In Punkten von Ωh wird der 5-Punkte-Operator angesetzt,
und in Punkten P ∈ ∂Ωh werden die Randwerte uh (P ) = g(P 0 ) verwendet. Dabei ist P 0 der
P entlang einer der Koordinatenachsen am nächsten gelegene Punkt auf ∂Ω . Dies ergibt entlang
des Randes nur eine Approximationsordnung m = 1 .
2.1 Allgemeine Differenzenapproximationen
49
Ω
P0
P
Abbildung 2.2: Schema der konstanten Randapproximation
ii) Lineare Randwertinterpolation: Jeder Punkt P ∈ ∂Ωh liegt in x- und/oder y-Richtung
zwischen zwei Punkten P0 ∈ ∂Ω und P1 ∈ Ωh mit Abständen 0 ≤ αh < h zu P0 und h zu
P1 . Man setzt dann (lineare Interpolation):
uh (P ) :=
1 g(P0 ) + αuh (P1 ) .
1+α
(2.1.13)
Damit wird eine implizite Kopplung der Randwerte an die inneren“ Lösungswerte bewirkt.
”
Diese Randwertapproximation hat die Ordnung m = 2 .
Ω
P0
P
P1
Abbildung 2.3: Schema der linearen Randapproximation
iii) Shortley1 -Weller2 -Approximation: Wir definieren die folgenden Punktmengen:
[
N (P ) \ Ωh ,
Ω0h := {P ∈ R2h | N (P ) ⊂ Ω}, ∂Ω∗h :=
P ∈Ω0h
Ωh := Ω0h ∪ ∂Ω∗h ,
∂Ωh := {Schnittpunkte der Gitterlinien mit ∂Ω}.
In Punkten P ∈ Ωh wird wieder der normale 5-Punkte-Operator und in den fiktiven“ Rand”
punkten P ∈ ∂Ω∗h der modifizierte 5-Punkte-Operator verwendet (siehe die schematische Darstellung):
n 2
2
2
2
uh (x, y) −
uh (x + h, y) −
uh (x − αh, y)
α β
1+α
α(1 + α)
o
2
2
uh (x, y + h) −
uh (x, y − βh) = f (x, y) ,
−
1+β
β(1 + β)
−∆∗h uh (x, y) := h−2
1
2
George Shortley (1910-: ????
R. Weller (????-????): ????
+
50
Differenzen-Verfahren für elliptische Probleme
gemäß
−∆∗h uh = f
auf ∂Ω∗h ,
(2.1.14)
mit den Werten uh (P ) := g(P ) auf ∂Ωh . Für diesen Differenzenoperator gilt
|∆∗h u(P ) − ∆u(P )| ≤ 23 M3 (u)h,
(2.1.15)
wobei M3 (u) := maxΩ {|∂xi ∂yj u|, i + j = 3} .
(x, y+h)
h
h Gitterweite
αh
(x, y)
(x+2h, y)
h
(x- αh, y)
(x+h, y)
(x, y) Stützpunkt
0 < α, β ≤ 1, αβ < 1
βh
(x, y- βh)
Abbildung 2.4: Schema der Shortley-Weller-Approximation
Die Verwendung dieser Differenzenapproximationen führt auf Schemata der Form
L h uh = f h
in Ωh ,
Rh uh = gh
auf ∂Ωh ,
(2.1.16)
wobei der Randoperator“ Rh die jeweilige Randwertapproximation beschreibt. Dabei wer”
den die echten Randwerte von uh auf ∂Ωh unter Umständen implizit mit Werten im Innern
verkoppelt. In diesem Fall sind alle Werte uh (P ), P ∈ Ωh , zu bestimmen. Der Differenzenoperator Lh steht für den normalen 5-Punkte-Operator in Ωh und gegebenfalls den modifizierten
Shortley-Weller-Operator auf ∂Ω∗h . Im einfachsten Fall der trivialen Randwertapproximation
Rh uh = uh können die Randwerte uh (P ) = gh (P ), P ∈ ∂Ωh , direkt eliminiert werden. Wir
werden im folgenden nur diesen Fall weiter diskutieren.
Bemerkung: Die obigen Differenzenschemata haben natürliche Analoga in drei Raumdimensionen. Man spricht dann aus naheliegendem Grund vom 7-Punkte-Operator“. Dessen Abschnei”
defehler genügt der Abschätzung
(7)
|∆h u(P ) − ∆u(P )| ≤ 14 M4 (u)h2 .
(2.1.17)
2.2 Eigenschaften der Differenzengleichungen
51
2.2 Eigenschaften der Differenzengleichungen
Ausgangspunkt der folgenden Untersuchungen ist das Differenzenschema der Gestalt
X
Lh uh (P ) :=
σ(P, Q)uh (Q) = fh (P ), P ∈ Ωh ,
(2.2.18)
Q∈N (P )
uh (P ) = gh (P ), P ∈ ∂Ωh ,
(2.2.19)
mit geeigneten Approximationen fh (·) zu f und gh (·) zu g . Wir definieren die Koeffizenten
σ(P, Q) := 0 für Punkte Q 6∈ N (P ). Für P ∈ Ωh gilt dann
X
X
σ(P, Q)uh (Q) = fh (P ) −
σ(P, Q)gh (Q).
(2.2.20)
Q∈Ωh
Q∈∂Ωh
Bei (beliebiger) Numerierung der Gitterpunkte etwa gemäß Ωh = {Pn , n = 1, ..., N } , ∂Ωh =
{Pn , n = N + 1, ..., N + M } ergibt sich ein quadratisches Gleichungssystem für den Vektor der
(inneren) Knotenwerte U = (Un )N
n=1 , Un := uh (Pn ) :
AU = F,
(2.2.21)
N
mit A = (Anm )N
n,m=1 , F = (Fn )n=1 , wobei
Anm := σ(Pn , Pm ),
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
Fn := fh (Pn ) −
NX
+M
σ(Pn , Pm )gh (Pm ).
m=N +1
h=
1
m+1
N = m2
Gitterweite
innere“ Gitterpunkte
”
h
h
Abbildung 2.5: Differenzengitter
Beispiel ( Modellproblem”): Im Fall des Einheitsquadrats Ω
”
5-Punkte-Operator bei zeilenweiser Durchnumerierung des Gitters
dünn-besetzte Matrix der Dimension N = m2 :




Bm −Im
4







 −1
1 
 −Im Bm −Im


A= 2 
N
Bm = 
.. 



h 
. 
−Im Bm





.. ..

.
.
= (0, 1)2 ergibt sich für den
Ωh = {Pij }m+1
i,j=0 die folgende








4 −1

.  m
−1
4 .. 




.. ..

.
.
−1
52
Differenzen-Verfahren für elliptische Probleme
mit der m×m-Einheitsmatrix Im . Die rechte Seite ist F := (f (x11 ), . . . , f (xmm ))T . Die Matrix
A ist eine dünn besetzte Bandmatrix mit der Halbbandbreite m , symmetrisch und (irreduzibel)
diagonal-dominant. Damit ist sie auch regulär und positiv definit.
Bemerkung: In drei Raumdimensionen hat die entsprechende Matrix die Dimension N = m3
und die Halbbandbreite m2 . Ansonsten hat sie dieselben Eigenschaften wie in zwei Dimensionen.
Im allgemeinen Fall ist für moderates rP die Matrix A dünn besetzt, aber häufig wegen
der Randwertapproximation nicht symmetrisch. Dies wäre ein schwerwiegender Nachteil, etwa
bei der Approximation von Eigenwertaufgaben zum Laplace-Operator. Um die Regularität von
A bzw. die Lösbarkeit der Differenzengleichung garantieren zu können, formulieren wir die
folgenden Strukturbedingungen in numerierungs-unabhängiger Form:
(B1) Erweiterte Diagonaldominanz: Für Punkte P ∈ Ωh gilt:
X
|σ(P, Q)| ≤ |σ(P, P )| ,
(i)
(2.2.22)
Q∈Ωh , Q6=P
und für Punkte P ∈ Ω∗h := {Q ∈ Ωh : N (Q) ∩ ∂Ωh 6= ∅} :
X
(ii)
Q∈Ωh , Q6=P
|σ(P, Q)| < |σ(P, P )| .
(2.2.23)
(B2) Nicht-negativer Typ: Für Punkte P ∈ Ωh und Q ∈ Ωh \ {P } gilt:
σ(P, P ) > 0,
σ(P, Q) ≤ 0 .
(2.2.24)
(B3) Zusammenhang: Es ist ∂Ωh 6= ∅ , und mit N (P ) := {Q ∈ Ωh , σ(P, Q) 6= 0} gilt für jede
echte Teilmenge Sh ⊂ Ωh :
[
N (P ) ∩ (Ωh \ Sh ) 6= ∅ .
(2.2.25)
P ∈Sh
Die ersten beiden Bedingungen (B1) und (B2) werden von vielen Differenzenschemata, insbesondere solchen höherer als zweiter Ordnung (z.B.: der gestreckte” 9-Punkte-Operator), nicht
”
erfüllt. Die hier betrachteten 5-Punkte-Schemata mit Randapproximation genügen ihnen aber.
Wir zeigen im folgenden, wie bei den einzelnen Randapproximationen die Bedingung (B1ii)
erfüllt ist.
i) Konstante Randwertextrapolation: Für P ∈ Ω∗h gilt
X
|σ(P, Q)| ≤ 3h−2 =
Q∈Ωh , Q6=P
3
4
|σ(P, P )| ,
ii) Lineare Randwertinterpolation: Für P ∈ Ω∗h gilt
X
−2 7 −2
α
h ≤ 2h ≤
|σ(P, Q)| ≤ 3 + 1+α
Q∈Ωh , Q6=P
7
8
|σ(P, P )| ,
2.2 Eigenschaften der Differenzengleichungen
53
iii) Shortley-Weller-Randwertapproximation: Für P ∈ Ω∗h gilt
X
Q∈Ωh , Q6=P
|σ(P, Q)| ≤
2
1+α
+
2
1+β
h−2 ≤
2
α
1
2
+
2
β
h−2 =
1
2
|σ(P, P )| .
Die dritte Bedingung (B3) sichert die Kopplung eines jeden inneren Gitterpunktes P ∈ Ωh
mit allen anderen, insbesondere mit den Randpunkten. Die Eigenschaft des kontinuierlichen
Problems, daß sich eine kleine Störung in einem Punkt global bemerkbar macht, spiegelt sich
hier wider.
Die obigen Eigenschaften des Differenzenschemas korrespondieren zu den bereits bekannten
der zugehörigen Koeffizientenmatrix A . Unabhängig von der gewählten Numerierung der Gitterpunkte implizieren die Bedingungen (B1) und (B3) zunächst die einfache Diagonaldominanz von
A , darüber hinaus aber auch die stärkere irreduzible Diagonaldominanz” (analog dem schwa”
”
chen Zeilensummenkriterium“ für die Konvergenz des Jacobi- oder des Gauß-Seidel-Verfahrens).
Die Bedingung (B2) entspricht einer analogen für A .
Um Existenz und Eindeutigkeit einer Lösung für das allgemeine Differenzenschema garantieren zu können, geht man ähnlich wie im Kontinuierlichen vor und nutzt ein diskretes Analogon
des Maximumprinzips”.
”
Satz 2.1 (Diskretes Maximumprinzip): Wenn die Bedingungen (B1i), (B2) und (B3) erfüllt
sind, genügt das zugehörige Differenzenschema einem diskreten Maximumprinzip“, d.h.: Git”
terfunktionen uh mit der Eigenschaft
Lh uh (P ) ≤ 0,
P ∈ Ωh ,
(2.2.26)
haben in Ωh kein positives Maximum. Genauer gilt uh ≤ 0 auf Ωh oder
max uh ≤ max uh .
∂Ωh
Ωh
(2.2.27)
Beweis: Wir nehmen an, daß (2.2.26) für ein uh erfüllt ist, und führen den Beweis indirekt. Es
gebe also einen Punkt P0 ∈ Ωh , so daß
M := uh (P0 ) = max uh > 0,
Ωh
max uh < M.
∂Ωh
Ausgehend von Lh uh (P ) ≤ 0 , folgt mit Bedingung (B2):
X σ(P ,Q) X σ(P ,Q)
0
0 uh (Q)
u
(Q)
=
uh (P0 ) ≤ −
h
σ(P0 ,P0 )
σ(P0 ,P0 )
Q6=P0
Q6=P0
X σ(P ,Q) X σ(P ,Q) 0 uh (P0 ) +
0 {uh (Q) − uh (P0 )}.
=
σ(P0 ,P0 )
σ(P0 ,P0 )
Q6=P0
Q6=P0
Weiter gilt wegen Bedingung (B1i)
X σ(P ,Q) 0 ≤ 1,
σ(P0 ,P0 )
Q6=P0
54
Differenzen-Verfahren für elliptische Probleme
und folglich ( uh (P0 ) = M )
M ≤M+
X
σ(P0 ,Q) {uh (Q) − M }.
σ(P0 ,P0 )
Q∈N (P0 )\{P0 }
Da nach Voraussetzung uh (Q) ≤ M ist, muss also uh (Q) = M in allen Punkten Q ∈ N (P0 )
(d.h. solchen mit σ(P0 , Q) 6= 0 ) sein, da sonst ein Widerspruch entsteht. Anwendung derselben
Schlußweise für alle Punkte in N (P0 ) liefert
[
uh (Q) = M, Q ∈
N (P ).
P ∈N (P0 )
Mit Hilfe der Bedingung (B3) erschließen wir dann durch sukzessive Fortsetzung dieses Arguments, daß uh ≡ M auf Ωh . Nach Voraussetzung ist ∂Ωh 6= ∅ , so daß es wegen (B3) einen
Punkt Q ∈ ∂Ωh ∩ N (P ) mit einem inneren“ Punkt P ∈ Ωh geben muß. Für diesen folgt dann
”
uh (Q) = M , was im Widerspruch zur Annahme max∂Ωh uh < M steht.
Q.E.D.
Das diskrete Maximumprinzip hat eine Reihe von wichtigen Folgerungen für die obigen Differenzenschemata.
Korollar 2.1 (Eindeutigkeit): Unter den Voraussetzungen (B1), (B2) und (B3) besitzt das
Differenzenschema (2.2.18), (2.2.19) genau eine Lösung uh . Im Falle fh ≥ 0 folgt aus gh ≥ 0
auch uh ≥ 0 .
Beweis: i) Wegen der Äquivalenz von (2.2.18), (2.2.19) zu dem Gleichungssystem Ah U = Fh
(1)
(2)
genügt es, die Eindeutigkeit zu zeigen. Seien also uh und uh zwei Lösungen:
(i)
L h uh = f h
(1)
in Ωh ,
(i)
uh = gh
auf ∂Ωh .
(2)
Für die Differenz wh := uh − uh gilt dann
Lh wh = 0
in Ωh ,
wh = 0 auf ∂Ωh .
Nun wird das diskrete Maximumprinzip auf Lh wh ≤ 0 sowie auf Lh (−wh ) ≤ 0 angewendet.
Ersteres ergibt wh ≤ 0 und letzteres wh ≥ 0 und folglich wh ≡ 0 .
ii) Sei nun fh ≥ 0 und gh ≥ 0 . Dann impliziert das diskrete Maximumprinzip angewendet für
−uh , daß entweder uh ≥ 0 oder minΩh uh = − maxΩh (−uh ) ≥ − max∂Ωh (−gh ) = min∂Ωh gh ,
was zu beweisen war.
Q.E.D.
Im nächsten Abschnitt werden wir das diskrete Maximumprinzip verwenden, um die stetige
Abhängigkeit der Lösungen von den Problemdaten zu zeigen. Dies wird sich als Nebenprodukt
einer sehr viel stärkeren Stabilitätsungleichung ergeben.
Korollar 2.2 (Inverse Monotonie): Unter den Voraussetzungen (B1), (B2) und (B3) ist die
zum Differenzenoperator Lh bei beliebiger Numerierung der Gitterpunkte gehörende Koeffizientenmatrix A eine sog. M-Matrix” (invers-monotone Matrix), d.h.: Ihre Inverse A−1 ist
”
elementweise nicht negativ:
A−1 ≥ 0.
(2.2.28)
2.2 Eigenschaften der Differenzengleichungen
55
Beweis: Die Matrix A wird wie üblich geschrieben als Summe A = L + D + R einer linken unteren Dreiecksmatrix L , einer Diagonalmatrix D und einer rechten oberen Dreiecksmatrix R .
Die Bedingungen (B1), (B2) und (B3) implizieren, wie oben bereits bemerkt, die (irreduzible)
Diagonaldominanz von A und damit 1) die Regularität von A und D und 2) die Kontraktivität spr(J) < 1 der Jacobi-Matrix J := −D−1 (L + R) . Dann existiert eine (natürliche)
Matrizennorm k · k , bzgl. derer kJk < 1 ist. Hiermit folgt die Existenz der Reihe (im Sinne der
Matrizenkonvergenz)
∞
X
J k = (I − J)−1 .
k=0
Bedingung (B2) garantiert, daß (elementweise) J = −D−1 (L + R) ≥ 0 und folglich auch
A−1 D = (D −1 A)−1 = (I + D −1 (L + R))−1 = (I − J)−1 =
∞
X
k=0
Wegen D−1 ≥ 0 impliziert dies A−1 ≥ 0 .
J k ≥ 0.
Q.E.D.
Die Matrix A−1 ordnet der rechten Seite fh und den Randwerten gh eindeutig den Lösungsvektor U der Differenzengleichung zu:
A−1 : {fh , gh } → U = A−1 F (fh , gh ).
Damit ist A−1 das algebraische Äquivalent der kontinuierlichen Greenschen Funktion G(·, ·) :
Z
Z
∂n G(x, y)g(y) dy.
G(x, y)f (y) dy −
G : {f, g} → u(x) =
∂Ω
Ω
Als Folgerung des Maximumprinzips ist G(x, y) ≥ 0, x 6= y , was analog zur gerade gezeigten
Eigenschaft A−1 ≥ 0 ist.
2.2.1 Das Konvergenzverhalten von Differenzenverfahren
Die Grundlage der Fehleranalyse für die oben eingeführten Differenzenschemata ist wie im Fall
von Differenzenverfahren für gewöhnliche Differentialgleichungen eine asymptotische Stabilitätsabschätzung. Wir formulieren diese im folgenden Satz für ein allgemeines Differenzenschema
Lh uh = fh
in Ωh ,
uh = gh
auf ∂Ωh .
(2.2.29)
Wir setzen im folgenden stets voraus, daß dieses Schema konsistent ist.
Satz 2.2 (Stabilität): Das Differenzenschema (2.2.29) sei konsistent und genüge den Bedingungen (B1), (B2) und (B3). Dann gilt für jede Gitterfunktion uh die Stabilitätsabschätzung
max |uh (P )| ≤ 14 d2Ω max |Lh uh (P )| + max |uh (P )| ,
P ∈Ωh
wobei dΩ := diam(Ω) .
Ωh
P ∈∂Ωh
(2.2.30)
56
Differenzen-Verfahren für elliptische Probleme
Beweis: Wir argumentieren im folgenden ähnlich wie auf der kontinuierlichen Ebene. Durch die
folgende Vorschrift für beliebiges, festes Q ∈ Ωh
Lh Gh (·, Q) = h−2 δ(·, Q)
in Ωh ,
Gh (·, Q) = δ(·, Q)
auf ∂Ωh ,
(2.2.31)
wird ein diskretes Analogon Gh (P, Q) : Ωh × Ωh → R zur kontinuierlichen Greenschen Funktion
(des Laplace-Operators) definiert. Dabei ist δ(P, Q) das übliche Kronecker3 -Symbol”. Aus
”
dem diskreten Maximumprinzip folgt, daß Gh (P, Q) ≥ 0 .
Für eine Gitterfunktion vh gilt dann die diskrete Greensche Identität”
”
X
X
Gh (P, Q)Lh vh (Q) +
Gh (P, Q)vh (Q), P ∈ Ωh .
vh (P ) = h2
Q∈Ωh
(2.2.32)
Q∈∂Ωh
Um dies zu sehen, bezeichnen wir die rechte Seite von (2.2.32) mit wh und erhalten mit den
Eigenschaften der Greenschen Funktion
Lh wh = Lh vh
in Ωh ,
wh = vh
auf ∂Ωh .
Die Eindeutigkeit der Lösungen des Diffenzenschemas impliziert dann wh ≡ vh .
Aus der diskreten Greenschen Identität folgt für jede Gitterfunktion vh
X
X
Gh (P, Q) max |Lh vh | +
Gh (P, Q) max |vh |, P ∈ Ωh .
|vh (P )| ≤ h2
Q∈Ωh
Ωh
Q∈∂Ωh
∂Ωh
(2.2.33)
i) Wegen der Konsistenz des Schemas gilt für die Gitterfunktion wh ≡ 1 notwendig Lh wh ≡ 0 ,
so daß aus der Greenschen Identität folgt:
X
X
X
Gh (P, Q)Lh wh (Q) +
1 = h2
Gh (P, Q)wh (Q) =
Gh (P, Q) .
(2.2.34)
Q∈Ωh
Q∈∂Ωh
Q∈∂Ωh
Dies impliziert eine Schranke für die zweite Summe in (2.2.33).
ii) Jeder Punkt P0 ∈ Ωh ist Mittelpunkt eines Ω enthaltenden Kreises mit Radius dΩ . O.b.d.A.
sei hier P0 = 0 . Für die Funktion w(P ) := 14 |P |2 gilt in Punkten P ∈ Ωh :
Lh w(P ) = Lh w(P ) + ∆w(P ) − ∆w(P ) = M3 (w)O(h) − ∆w(P ) = −1,
da M3 (w) = 0. Wir definieren nun die Gitterfunktion
X
Gh (P, Q).
vh (P ) := h2
Q∈Ωh
Durch elementares Nachrechnen verifiziert man, daß
Lh vh = 1
in Ωh ,
vh = 0 auf ∂Ωh ,
Lh (vh + w) = 0
in Ωh ,
vh + w ≤ 14 d2Ω
auf ∂Ωh .
3
Leopold Kronecker (1823-1891): deutscher Mathematiker; wirkte in Berlin als “Privatgelehrter”; betrieb die
Arithmetisierung der Mathematik; wichtiger Vertreter des “Konstruktivismus”, welcher die generelle Verwendung
des Widerspruchsbeweises und des “aktual Unendlichen” in Form z.B. der allgemeinen reellen Zahlen ablehnt.
2.2 Eigenschaften der Differenzengleichungen
57
Aus dem diskreten Maximumprinzip folgt dann wegen w ≥ 0 notwendig
max vh ≤ max (vh + w) ≤ max (vh + w) = max w ≤ 14 d2Ω ,
Ωh
∂Ωh
∂Ωh
Ωh
und somit
h2
X
Q∈Ωh
Gh (P, Q) ≤ 14 d2Ω ,
P ∈ Ωh .
(2.2.35)
Die Abschätzungen (2.2.34) und (2.2.35) ergeben zusammen mit (2.2.33) die Behauptung. Q.E.D.
Als unmittelbare Folgerung aus Satz 2.2 erhalten wir (in Analogie zum kontinuierlichen Fall)
die stetige Abhängigkeit der Lösung von den Daten. Das wichtigste Resultat ist eine a priori
Konvergenzabschätzung für das Differenzenschema (2.2.29).
Korollar 2.3 (Konvergenz): Unter den Voraussetungen von Satz 2.2 gilt für das Differenzenschema (2.2.29) die a priori Konvergenzabschätzung
max |eh (P )| ≤ 14 d2Ω max |τh (P )| + max |eh (P )|,
P ∈Ωh
P ∈Ωh
P ∈∂Ωh
(2.2.36)
mit dem Fehler eh = u − uh und dem Abschneidefehler τh (P ) := Lh u(P ) + ∆u(P ) .
Beweis: Für den Fehler eh gilt die Differenzengleichung
Lh eh (P ) = τh (P )
P ∈ Ωh ,
so daß die Stabilitätsungleichung (2.2.30) unmittelbar die Behauptung liefert.
Q.E.D.
Die Abschätzung (2.2.36) garantiert wieder, daß für ein gutes“ Differenzenschema der globale
”
Diskretisierungsfehler mit derselben Ordnung wie der lokale Abschneidefehler konvergiert. Wir
wollen diese allgemeinen Resultate für die obigen speziellen Diskretisierungen anwenden. Dabei
wird wieder die folgende Bezeichnung für Normschranken der exakten Lösung verwendet:
Mm (u) := max{|∂xi ∂yj u|, i + j = m}.
Ω
Korollar 2.4 (Konvergenz): Unter den Voraussetungen von Satz 2.2 gilt für den Fehler den
5-Punkte-Operator mit konstanter Randwertextrapolation die a priori Fehlerabschätzung
max |eh (P )| ≤
P ∈Ωh
2
1 2
24 dΩ M4 (u)h
+ M1 (u)h.
Beweis: Für den Abschneidefehler gilt
max |τh | ≤ 16 M4 (u)h2 ,
Ωh
und in Randgitterpunkten
max |eh | = max |u(P ) − u(P ⋆ )| ≤ M1 (u)h.
∂Ωh
∂Ωh
(2.2.37)
58
Differenzen-Verfahren für elliptische Probleme
Die Stabilitätsabschätzung (2.2.30) impliziert damit die Behauptung.
Q.E.D.
Der ordnungsreduzierende Effekt der mangelhaften Randwertapproximation kann durch die
oben beschriebene lineare Randwertinterpolation“ behoben werden. Für das so modifizierte
”
5-Punkte-Schema erhält man ähnlich wie eben die a priori Fehlerabschätzung
max |eh (P )| ≤
P ∈Ωh
2
1 2
12 dΩ M4 (u)h
+ 21 M2 (u)h2 .
(2.2.38)
Korollar 2.5 (Konvergenz): Unter den Voraussetungen von Satz 2.2 gilt für den modifizierten 5-Punkte-Operator nach Shortley-Weller die a priori Fehlerabschätzung
max |eh (P )| ≤
P ∈Ωh
2
1 2
24 dΩ M4 (u)h
+ 31 M3 (u)h3 .
(2.2.39)
Beweis: Für den Fehler eh gelten die Beziehungen
−∆h eh = τh in Ωh ,
−∆∗h eh = τh∗ auf ∂Ω∗h ,
eh = 0 auf ∂Ωh .
Für die Abschneidefehler gilt
|τh∗ | ≤ 32 M3 (u)h.
max
∗
max |τh | ≤ 16 M4 (u)h2 ,
Ωh
∂Ωh
In diesem Fall können wir nicht direkt die Stabilitätsungleichung (2.2.30) anwenden, da sie nur
auf eine reduzierte Konvergenzordnung O(h) führen würde. Statt dessen modifizieren wir in
geeigneter Weise den Beweis dieser Abschätzung. Mit den Bezeichnungen des Beweises von Satz
2.2 ergibt die Greensche Identität ( eh = 0 auf ∂Ωh )
X
X
Gh (P, Q)τh (Q) + h2
eh (P ) = h2
Gh (P, Q)τh∗ (Q)
Q∈Ω0h
Q∈∂Ω∗h
und folglich
|eh (P )| ≤ h2
X
Q∈Ω0h
Gh (P, Q) max |τh | + h2
Ω0h
X
Q∈∂Ω∗h
|τh∗ | .
Gh (P, Q) max
∗
∂Ωh
Wie im Beweis von Satz 2.2 folgt
X
X
Gh (P, Q) ≤ 14 d2Ω .
Gh (P, Q) ≤ h2
h2
Q∈Ω0h
(2.2.40)
(2.2.41)
Q∈Ωh
Wir wollen jetzt zeigen, daß
X
Q∈∂Ω∗h
Gh (P, Q) ≤
1
2
.
Dazu definieren wir die Gitterfunktion wh durch
wh = 1 in Ωh ,
wh = 0 auf ∂Ωh .
(2.2.42)
2.2 Eigenschaften der Differenzengleichungen
59
Für diese verifiziert man durch Nachrechnen
−∆h wh = 0 in Ω0h ,
−∆∗h wh ≥ 2h−2 auf ∂Ω∗h .
Mit Hilfe der Greenschen Identität folgt damit
X
X
1 = h2
Gh (P, Q)(−∆∗h )wh (Q) ≥ 2
Gh (P, Q),
Q∈∂Ω∗h
was (2.2.42) impliziert. Dies vervollständigt den Beweis.
Q∈∂Ω∗h
Q.E.D.
Bemerkung: In drei Raumdimensionen gelten Satz 2.2 und Korollar 2.3 mit der Konstante 61 d2Ω . Hiermit und der zugehörigen Abschätzung (2.1.17) für den Konsistenzfehler ergeben
sich dann auch die a priori Fehlerabschätzungen der Korollare 2.4 und 2.4 mit der führenden
1 2
dΩ .
Konstante 24
Bemerkung: Wir betonen, daß die Konvergenz der betrachteten Differenzenschemata eine vergleichsweise hohe Regularität der zu approximierenden Lösung erfordert. Das Shortley-WellerSchema erfordert z.B. für seine maximale“ Konvergenzordnung m = 2 , daß u beschränkte
”
vierte Ableitungen auf ganz Ω besitzt ( M4 (u) < ∞ ). Dies ist eine sehr einschneidende Forderung, wie wir im vorigen Kapitel gesehen haben. Sie kann i.a. nur für glatt berandete Gebiete
sowie unter gewissen Zusatzbedingungen für spezielle Geometrien wie z.B. Rechtecke garantiert werden. Weiter erfordert sie auch hohe Glattheit der Daten f und g . Auf Gebieten mit
einspringenden Ecken oder sonstwie reduzierter Regularität von u können diese Sätze nicht verwendet werden. In solchen realitätsnäheren Situationen werden sich die im nächsten Abschnitt
behandelten Finite-Elemente-Verfahren“ als flexibler erweisen.
”
60
Differenzen-Verfahren für elliptische Probleme
2.3 Lösungsaspekte
Wir diskutieren nun die Lösung der durch eine Differenzendiskretisierung entstehenden algebraischen Gleichungssysteme. Zugrunde gelegt wird die Situation des Modellproblems der 1. RWA
des Laplace-Operators
Lu := −∆u = f
in Ω,
u = g auf ∂Ω,
(2.3.43)
auf einem Gebiet Ω ⊂ R2 . Erweiterungen für Probleme mit variablen Koeffizienten, anderen
Randbedingungen, Unsymmetrien sowie auf drei Raumdimensionen werden wieder in Bemerkungen berücksichtigt. Die zugehörigen algebraischen Systeme haben die Form
Ax = b,
(2.3.44)
N
Die Matrix A = (anm )N
n,m=1 und der Vektor b = (bn )n=1 haben die Dimension N := Anzahl
der inneren Gitterpunkte bzw. Knotenfreiheitsgrade. In der Praxis ist meist N ≫ 1000 , so daß
neben dem Rechenaufwand auch der Speicherbedarf ein wichtiger Aspekt ist. Die Matrix ist
extrem dünn besetzt und besitzt abhängig von der gewählten Numerierung der Gitterpunkte
bzw. Knoten eine Bandstruktur. Für die Wahl eines geeigneten (d.h.: möglichst sparsamen)
Lösungsverfahrens ist die zu erwartende Dimension N entscheidend.
Wir orientieren die folgende Diskussion an der Modellsituation der Poisson-Gleichung auf
dem Einheitsquadrat Ω = (0, 1)2 und der Diskretisierung mit dem üblichen 5-Punkte-Schema
Ωh = Ωh ∪ ∂Ωh der Gitterweite h . Das Gebiet
auf einem äquidistanten, kartesischen Gitter
√
Ω = (0, 1)2 hat den Durchmesser dΩ = 2 . Wir wählen die Funktion u(x, y) = sin(πx) sin(πy)
als Lösung der Randwertaufgabe
−∆u = 2π 2 u =: f
in Ω,
u = 0 auf ∂Ω.
(2.3.45)
Es ist M4 (u) = π 4 . Die a priori Fehlerschranke (2.2.39) für die Shortley-Weller-Approximation
liefert damit die (pessimistische) Fehlerschätzung
max |u − uh | ≈
Ωh
1 2 4 2
24 dΩ π h
≈ 8h2 .
(2.3.46)
Zur Erreichung garantierter 3-stelliger (relativer) Genauigkeit, TOL = 10−3 , ist in diesem Fall
also eine Gitterweite h ≈ 10−2 erforderlich. Dies führt auf ein (symmetrisches) Gleichungssystem
der Dimension N ≈ 104 .
Bemerkung 2.1: Die Fehlerabschätzung (2.3.46) ist in der Tat sehr pessimistisch. Der wirkliche
Fehler ist ungefähr um einen Faktor 10−1 kleiner. Dies zeigt, daß unsere a priori Fehleranalyse
selbst für ein so einfaches Modellproblem zu unscharf und für praktische Zwecke nur bedingt
brauchbar ist.
√
2) In drei Raumdimensionen ist dΩ = 3 , und die a priori Fehlerabschätzung (2.3.46) liefert
den Wert ≈ 12h2 , so daß hier mindestens auch h = 10−2 und damit N ≈ 106 erforderlich
wäre.
Die Struktur der Matrix A hängt von der gewählten Numerierung der Gitterpunkte ab. Die
gängigen Alternativen sind:
2.3 Lösungsaspekte
61
Zeilenweise Numerierung: Die lexikographische Anordnung der Gitterpunkte, (xi , yj ) ≤ (xp , yq ) ,
wenn j ≤ q oder j = q, i ≤ p führt auf eine Bandmatrix mit Bandbreite 2m + 1 ≈ h−1 .
21 22 23
24
25
16
17 18
19
20
11
12 13
14
15
6
7
8
9
10
1
2
3
4
5
Abbildung 2.6: Lexikographische Nummerierung
Diagonale Numerierung: Die sukzessive Numerierung diagonal zu den Koordinatenrichtungen
führt auf eine Bandmatrix mit geringem Bandinhalt“ (⇒ Speicherersparnis beim Gaußschen
”
Eliminationsverfahren).
11 16 20
7
12 17
23 25
21
24
4
8 13 18
22
2
5
9
14
19
1
3
6
10
15
Abbildung 2.7: Diagonale Nummerierung
Schachbrett-Numerierung: Die versetzte zeilenweise- sowie spaltenweise Numerierung führt auf
eine 2 × 2-Blockmatrix mit diagonalen Hauptblöcken.
11
21
6
16
1
24 12
25
13
9 22 10
23
19
7
20
8
4 17
5
18
15
3
14
2
Abbildung 2.8: Schachbrett-Nummerierung
62
Differenzen-Verfahren für elliptische Probleme
a) Direkte Lösung: Prinzipiell wäre das klassische Gaußsche Eliminationsverfahren zur Lösung
des Systems (2.3.44) geeignet. Zu seiner Durchführung benötigt man bei zeilenweiser Numerierung und Ausnutzung der Symmetrie etwa mN Speicherplätze (im folgenden abgekürzt
als SP“) und m2 N arithmetische Operationen (im folgenden abgekürzt als OP“). Im Fal”
”
le N ≈ 104 sind dies etwa 106 SP und 108 OP. Die kurze Überschlagsrechnung zeigt, daß
direkte Lösungsmethoden für das Gleichungssystem (2.3.44) nur in speziellen Situationen in
Frage kommen. Sie spielen eine Rolle bei geringer Problemgröße ( N ≤ 103 ) oder im Falle sehr
uniformer Matrixeinträge (bei der Approximation von Differentialoperatoren mit konstanten
Koeffizienten) ( N ≤ 105 ). Speziell für die 5-Punkte-Approximation des Laplace-Operators auf
Rechtecken gibt es sehr effiziente direkte Lösungstechniken auf Grundlage der schnellen Fourier”
Transformation“ ( N ≤ 107 ). Diese sind aber bei allgemeineren Problemstellungen meist nicht
anwendbar und werden daher hier nicht weiter diskutiert.
Bemerkung: Zur Illustration machen wir dieselbe Überschlagsrechnung auch für die entsprechende dreidimensionale Situation Ω = (0, 1)3 . Hier hat die Matrix A die Dimension N = m3 ≈ 106
und die Bandbreite 2m2 + 1 ≈ 104 . Folglich betrüge der benötigte Lösungsaufwand ≈ 1010 SP
und ≈ 1014 OP, was jenseits der Kapazität normaler Arbeitsplatzrechner liegt.
b) Iterative Lösung: Wie bereits erwähnt, übertragen sich die wichtigen Eigenschaften (B1),
(B2) und (B3) des Differenzenschemas unabhängig von der gewählten Numerierung auf die jeweilige Matrix A . Diese ist (irreduzibel) diagonaldominant und von nichtnegativem Typ und
folglich eine M-Matrix, d.h.: Es gilt elementweise A−1 ≥ 0 . Zusätzlich ist A oft auch symmetrisch und positiv definit. In diesem Falle sind die meisten gängigen iterativen Verfahren
konvergent. Ausgehend von einer Defektkorrekturiteration
dt = F − Axt ,
Cv t = dt ,
xt+1 = xt + v t ,
(2.3.47)
mit einer regulären Matrix C ( Vorkonditionierer“) wird die Iteration zunächst als Fixpunkti”
teration geschrieben
Cxt+1 = Cxt + b − Axt
⇔
xt+1 = (I − C −1 A)xt + C −1 b.
(2.3.48)
Für den Fehler e(t) := x(t) − x gilt
e(t) = (I − C −1 A)x(t−1) + C −1 b − x
= (I − C −1 A)x(t−1) + C −1 b − (I − C −1 A)x − C −1 b
(2.3.49)
= (I − C −1 A)e(t−1) = · · · = (I − C −1 A)t e(0) .
Dies zeigt, daß die Iteration konvergiert, wenn die Iterationsmatrix“ B := I − C −1 A eine
”
Kontraktion ist, d.h.: ρ(B) := max{|λ|, λ Eigenwert von B} < 1 . Die Konvergenzrate“ der
”
Iteration ist dann gegeben durch
ρ :=
sup
x(0) ∈RN
lim
t→∞
kx(t) − xk 1/t
kx(0) − xk
= ρ(B).
(2.3.50)
Es ist dann näherungsweise
kx(t) − xk ≤ ρt kx(0) − xk.
(2.3.51)
Die Anzahl der zur Erreichung einer Reduktion des Anfangsfehlers um ε erforderlichen Iterati-
2.3 Lösungsaspekte
63
onsschritte ergibt sich damit zu
tε ≈
ln(ε)
.
ln(ρ)
(2.3.52)
Der Vorkonditionierer“ C sollte folgende Bedingungen erfüllen:
”
– einfache Invertierung (mit O(N ) OP und Speicherbedarf O(N ) SP);
– möglichst kleines ρ(I − C −1 A) .
Dies sind leider gegenläufige Zielsetzungen. Die einfachsten Verfahren dieses Typs verwenden
ausgehend von der natürlichen Aufspaltung A = L + D + R die Vorkonditionierer:
1. (Gedämpftes) Richardson4 -Verfahren: 0 < θ ≤ 2λmax (A)−1
B = I − θA.
(2.3.53)
B = −D −1 (L + R).
(2.3.54)
C = θI,
2. Jacobi5 -Verfahren (Gesamtschrittverfahren):
C = D,
3. Gauß-Seidel6 -Verfahren (Einzelschrittverfahren):
C = D + L,
B = −(D + L)−1 R.
(2.3.55)
4. SOR-Verfahren ( Successive Over-Relaxation“): ω = ωopt ∈ (0, 2)
”
C = D + ωL,
B = (D + ωL)−1 {(1 − ω)D − ωR}.
(2.3.56)
5. ILU-Verfahren ( Incomplete LU Decomposition“):
”
C = L̃R̃,
B = I − R̃−1 L̃−1 A.
(2.3.57)
Für eine symmetrische, positiv definite Matrix wird das ILU- zum ILLT -Verfahren ( In”
complete Cholesky7 Decomposition“). Die ILU-Zerlegung erhält man mit Hilfe des üblichen, rekursiven Prozesses zur Bestimmung der LU-Zerlegung aus der Gleichung LU = A
4
Lewis Fry Richardson (1881-1953): englischer Mathematiker und Physiker; wirkte an verschiedenen Institutionen in England und Schottland; typischer “angewandter Mathematiker”; leistete Pionierbeiträge zur Modellierung
und Numerik in der Wettervorhersage.
5
Carl Gustav Jakob Jacobi (1804-1851): deutscher Mathematiker; schon als Kind hochbegabt; wirkte in Königsberg und Berlin; Beiträge zu vielen Bereichen der Mathematik: zur Zahlentheorie, zu elliptischer Funktionen, zu
partiellen Differentialgleichungen, zu Funktionaldeterminanten und zur theoretischen Mechanik.
6
Philipp Ludwig von Seidel (1821-1896): deutscher Mathematiker; Prof. in München; Beiträge zur Analysis
(u.a. Methode der kleinsten Fehlerquadrate) owie Himmelsmechanik und Astronomie.
7
Andrè Louis Cholesky (1975-1918): französischer Mathematiker; Militärkarriere; Beiträge zur Numerischen
Linearen Algebra.
64
Differenzen-Verfahren für elliptische Probleme
durch Nullsetzung aller Matrixeinträge zu Indexpaaren {n, m} mit anm = 0 :
n = 1, ..., N :
ũnm = anm −
˜
lnn = 1,
n−1
X
˜lni ũim
(m = 1, ..., N )
i=1
n−1
o
n
X
˜lij ũjn
˜lin = ũ−1 ain −
(i = n + 1, ..., N )
nn
j=1
˜lnm = 0, ũnm = 0, wenn anm = 0 .
6. ADI-Verfahren ( Alternating-Direction Implicit Iteration“):
”
C = (Ax + ωI)(Ay + ωI),
B = (Ay + ωI)−1 (ωI − Ax )(Ax + ωI)−1 (ωI − Ay ).
(2.3.58)
Das ADI-Verfahren ist für beliebige Wahl des Parameters ω > 0 konvergent. Wenn die
Struktur der Matrix seine Anwendung zuläßt, ist es bei optimaler Wahl von ω mindestens
so schnell wie das optimale SOR-Verfahren.
Die Konvergenzraten dieser einfachen Iterationsverfahren verhalten sich in Abhängigkeit von
der (gleichförmigen) Gitterweite wie
ρ = ρ(I − C −1 A) = 1 − O(hr ),
in Abhängigkeit von der Gitterweite h der Diskretisierung (bei fester Problemkonfiguration)
mit einem geeigneten r ≥ 0 . Die Anzahl T der zur Gewinnung einer Dezimalstelle Genauigeit
erforderlichen Iterationsschritte ist also ungefähr bestimmt durch
ρT ≈ 10−1
⇒
T≈−
ln(10)
≈ h−r .
ln(ρ)
(2.3.59)
Hierzu beachte man, daß ln(1 − chr ) = −chr + O(h2r ) . Da die Durchführung eines Iterationsschritts approximativ N ≈ h−2 OP (in zwei Raumdimensionen) kostet, ergibt sich ein
Gesamtaufwand pro Dezimalstelle an Genauigkeit von ≈ h−2−r OP. Der für die Durchführung
dieser Iterationsverfahren benötigte Speicherplatz entspricht etwa dem zur Speicherung der wesentlichen Elemente der Matrix A erforderlichen. Für das Jacobi- und Gauß-Seidel-Verfahren
ist r = 2 und für das (optimale) SOR-Verfahren ist r = 1 . Das ILU- und das ADI-Verfahren
liegen bei speziellen Konfigurationen etwa gleich auf zum SOR-Verfahren. Damit ergibt sich ein
Gesamtlösungsaufwand von jeweils O(N 2 ) bzw. O(N 3/2 ) a.Op. für die einzelnen Verfahren. Ein
wirklich effizientes“ Verfahren sollte ein möglichst kleines r aufweisen; optimal wäre r = 0 .
”
Dies läßt sich durch den Einsatz von sog. Multi-Level-Techniken“ ( Mehrgitterverfahren“) er”
”
reichen, welche später im Zusammenhang mit den Finite-Elemente-Diskretisierungen diskutiert
werden.
2.3.1 Aufwandsanalyse: ein Beispiel
Wir wollen das Konvergenzverhalten der bisher betrachteten Iterationsverfahren und deren sich
daraus ergebende Effizienz anhand des obigen Modellproblems eingehender diskutieren. Dabei
soll insbesondere die Bedeutung der Formel (2.3.59) für die Konvergenzrate illustriert werden.
2.3 Lösungsaspekte
65
Für die obige Modellsituation (5-Punkte-Differenzenoperator auf einem äquidistanden, kartesischen Gitter des Einheitsquadrats) lassen sich die Eigenwerte und zugehörigen Eigenvektoren
der Systemmatrix A explizit angeben. Für k, l = 1, . . . , m ergibt sich mit der Bezeichnung
Awkl = λkl wkl :
λkl = h−2 {4 − 2 (cos(khπ) + cos(lhπ))},
w
kl
k, l = 1, . . . , m,
= (sin(ikhπ) sin(jlhπ))i,j=1,...,m
(h = 1/(m + 1)) .
Also ist (für h ≪ 1)
λmax = h−2 {4 − 4 cos (1 − h)π} ≈ 8h−2 ,
λmin = h−2 {4 − 4 cos (hπ)} = h−2 {4 − 4 (1 − 12 π 2 h2 + O(h4 ))} ≈ 2π 2 .
und somit
κ := cond2 (A) ≈
4
π 2 h2
.
(2.3.60)
Die Eigenwerte der Jacobi-Matrix J = −D−1 (L + R) sind
µkl =
1
2
(cos(khπ) + cos(lhπ))
(k, l = 1, . . . , m)
Folglich wird
ρJ = µmax = cos(hπ) = 1 −
π2 2
h + O(h4 ) .
2
(2.3.61)
Für die Iterationsmatrizen des Gauß-Seidel- und des (optimalen) SOR-Verfahrens gilt dann
ρGS = ρ2GS = 1 − π 2 h2 + O(h4 ) ,
q
1 − 1 − ρ2J
1 − πh + O(h2 )
q
= 1 − 2 πh + O(h2 ) .
ρSOR =
=
2)
1
+
πh
+
O(h
1 + 1 − ρ2J
Für die Iterationszahlen (pro Dezimalstelle Fehlerreduktion) ergibt sich also asymptotisch:
TGS
TSOR
ln(10)
4, 6
≈
π 2 h2
1
2N,
ln(1 −
ln(10)
2, 3
≈−
≈ 2 2 ≈ 41 N ,
2
2
ln(1 − π h )
π h
√
2, 3
ln(10)
≈
≈ 13 N .
≈−
ln(1 − 2πh)
2πh
TJ ≈ −
π2 2
2 h )
≈
Der Vollständigkeit halber geben wir hier auch die entsprechenden Werte für das CG-Verfahren
( Verfahren der konjugierten Richtungen“):
”
√
√
3
≈ N.
TCG = 12 κ ln(20) ≈
πh
66
Differenzen-Verfahren für elliptische Probleme
Das CG-Verfahren ist zwar langsamer als das optimale“ SOR-Verfahren, erfordert aber nicht
”
die Bestimmung eines Iterationsparameters.
Zum Vergleich der Effizienz der Iterationsverfahren muß natürlich auch der Aufwand pro
Iterationsschritt berücksichtigt werden. Für die Anzahl OP der arithmetischen Operationen pro
Iterationsschritt gilt (optimistische Schätzung)
OPJ , OPGS , OPSOR ≈ 6 N ,
OPCG ≈ 10 N .
Als Endresultat finden wir, daß zur Bestimmung der Lösung des diskretisierten Modellproblems das Jacobi-Verfahren, das Gauß-Seidel-Verfahren und das Gradientenverfahren O(N 2 )
OP benötigen. Das direkte Cholesky-Verfahren würde für die Berechnung der exakten“ Lösung
”
(auf Rundungsfehlergenauigkeit) ebenfalls O(m2 N ) = O(N 2 ) OP benötigen, erscheint also dem
Gauß-Seidel-Verfahren überlegen zu sein. Es ist jedoch zu berücksichtigen, daß letzteres nur
O(N ) SP benötigt, im Gegensatz zu den O(mN ) = O(N 3/2 ) SP für das Cholesky-Verfahren.
Die schnelleren, auf Mehrgitterkonzepten basierenden Iterationsverfahren sind dagegen dem einfachen direkten Löser asymptotisch klar überlegen.
Für das Beispiel mit N = 104 ergibt sich überschlagsmäßig der folgende Gesamtaufwand
GA“ zur sicheren Lösung des Systems (2.3.44) unter die Diskretisierungsgenauigkeit ( TOL =
” −3
10 , h = 10−2 , N = 104 ):
GAJ (TOL) ≈ 4 · 3N 2 ≈ 1, 2 · 109 OP ,
GAGS (TOL) ≈ 4 · 1, 5N 2 ≈ 6 · 108 OP ,
GASOR (TOL) ≈ 4 · 2N 3/2 ≈ 8 · 106 OP ,
GACG (TOL) ≈ 4 · 10N 3/2 ≈ 4 · 107 OP .
Für ein optimales“ Verfahren wie z.B. das Mehrgitterverfahren MG“ würde man hier wesent”
”
lich bessere Werte erwarten: GAM G (TOL) ≈ 4 · 25N ≈ 106 OP .
Bemerkung: In drei Raumdimensionen erhalten wir näherungsweise
λmax ≈ 12h−2 ,
λmin ≈ 3π 2 ,
κ ≈
8
,
3π 2 h2
und folglich im wesentlichen dieselben Abschätzungen für ρJ , ρGS und ρSOR sowie für die
Iterationszahlen TJ , TGS , TSOR und TCG wie im zweidimensionalen Fall. Der Aufwand für die
Durchführung eines Iterationsschritts ist hier OPJ , OPGS , OPSOR ≈ 8 N bzw. OPCG ≈ 12 N .
Für den Gesamtlösungsaufwand ergibt dies dann:
GAJ (TOL) ≈ 4 · 4N 2 ≈ 1, 6 · 1013 OP ,
GAGS (TOL) ≈ 4 · 2N 2 ≈ 8 · 1012 OP ,
GASOR (TOL) ≈ 4 · 3N 3/2 ≈ 1, 2 · 1010 OP ,
GACG (TOL) ≈ 4 · 12N 3/2 ≈ 4, 8 · 1010 OP .
Der Aufwand des Mehrgitterverfahrens erhöht sich aber nur vergleichsweise unwesentlich auf
GAM G (ε) ≈ 4 · 50N ≈ 2 · 108 OP .
Zur Bewertung dieser Komplexitätsschätzungen muß man sich die Leistung heutiger Rechner
vergegenwärtigen. Ein normaler Arbeitsplatzrechner leistet real etwa 200 MFlops (200 Millio-
2.3 Lösungsaspekte
67
nen Floating-Point“ Operationen pro Sekunde). Das SOR-Verfahren braucht dann auf einem
”
solchen Rechner zur Lösung des Gleichungssystems (auf Diskretisierungsfehlergenauigkeit) etwa
1, 5 Minuten, wogegen das Mehrgitterverfahren nur“ 1 Sekunde benötigt.
”
68
Differenzen-Verfahren für elliptische Probleme
2.4 Übungen
Übung 2.1: Man betrachte die Diskretisierung der 1. RWA des Laplace-Operators auf dem
Einheitsquadrat des R2 mit dem 9-Punkte-Differenzenschema (sog. “Mehrstellenformel”)
(9)
−∆h uh (x, y) = f (x, y),
(x, y) ∈ Ωh ,
mit dem “gestreckten” Differenzenoperator
(9)
∆h u(x, y) :=
o
1 n
−
u(x
±
2h,
y)
+
16u(x
±
h,
y)
−
u(x,
y
±
2h)
+
16u(x,
y
±
h)
−
60u(x,
y)
12h2
und dem 9-Punkte-Differenzenschema
(9)
−∆h uh (x, y) = f (x, y) +
1 2
12 h ∆f (x, y),
(x, y) ∈ Ωh
mit dem “kompakten” Differenzenoperator
n
o
¯ (9) u(x, y) = 1 4u(x ± h, y) + 4u(x, y ± h) + u(x ± h, y ± h) − 20u(x, y) .
∆
h
6h2
Man zeige, daß dies Approximationen mit der Konsistenzordnung m = 4 sind.
Übung 2.2: In vielen Fällen kann die asymptotische Konvergenzordnung eines Differenzenverfahrens nur experimentell bestimmt werden. Dazu werden bei bekannter exakter Lösung für zwei
Schrittweiten h und h/2 die Fehler eh := u − uh und eh/2 := u − uh/2 berechnet und dann die
Ordnung α über den formalen Ansatz ku − uh kh = hα mit einer geeigneten Gitternorm k · kh
aus der folgenden Formel ermittelt:
α=
log(keh kh /keh/2 kh )
.
log(2)
a) Man rechtfertige diese Formel und überlege, wie man vorgehen kann, wenn keine exakte
Lösung u bekannt ist.
b) Man bestimme die inhärente Konvergenzordnungen der folgenden Zahlenfolgen:
h = 2−1
33.627
26.570
−2
h=2
30.318
27.008
h = 2−3
29.100
27.883
−4
h=2
28.586
28.072
h = 2−5
28.351
28.117
Übung 2.3: Man betrachte die Diskretisierung der 1. RWA des Laplace-Operators auf dem
Einheitsquadrat des R2 mit dem 9-Punkte-Differenzenschema
(9)
∆h uh (x, y) = fh (x, y) := f (x, y) +
1 2
12 h ∆f (x, y),
(x, y) ∈ Ωh ,
2.4 Übungen
69
mit dem “kompakten” Differenzenoperator
(9)
∆h u(x, y) =
o
1 n
4u(x
±
h,
y)
+
4u(x,
y
±
h)
+
u(x
±
h,
y
±
h)
−
20u(x,
y)
.
6h2
Diese Approximationen hat nach Aufgabe 3.3 die Konsistenzordnung m = 4 .
a) Man zeige mit den Mitteln der Vorlesung die Fehlerabschätzung
max |u(P ) − uh (P )| ≤ cM6 (u)h4 .
P ∈Ωh
b) (Zusatzaufgabe für Leute mit Ergeiz und Zeit) Im Falle eines allgemeinen, glattberandeten Gebiets Ω ⊂ R2 werde entlang der gekrümmten Randabschnitte die Shortley-WellerApproximation betrachtet:
(9)
−∆h uh = f +
1 2
12 h ∆f
in Ωh ,
−∆∗h uh = f in Ω∗h ,
uh = g auf ∂Ωh .
Man zeige hierfür mit den Mitteln der Vorlesung die Fehlerabschätzung
max |u(P ) − uh (P )| ≤ c {M6 (u)h4 + M3 (u)h3 }.
P ∈Ωh
Übung 2.4: Sei Ah die zum 5-Punkte-Operator auf dem Einheitsquadrat gehörende N × N Matrix (bei zeilenweiser Nummerierung der Gitterpunkte mit m Punkten in jeder Zeile). Die
N = m2 Eigenvektoren wνµ , ν, µ = 1, . . . , m , und die zugehörigen Eigenwerte λνµ von Ah
sind gegeben durch:
wνµ (x, y) = sin(νπx) sin(µπy), (x, y) ∈ Ωh ,
λνµ =
1
4
−
2(cos(νhπ)
+
cos(µhπ)
.
h2
Man zeige, daß für die Spektralkondition von Ah gilt:
cond2 (Ah ) =:
4
λmax (Ah )
= 2 2 + O(1).
λmin (Ah )
π h
Übung 2.5: Eine Matrix A ∈ RN ×N heißt “M-Matrix”, wenn sie von nichtnegativem Typ und
(−1)
(−1)
regulär ist und wenn ihre Inverse A−1 = (aij )N
≥ 0.
i,j=1 elementweise nichtnegativ ist: aij
Das 5-Punkte-Differenzenschema (bzw. das Shortley-Weller-Schema) zur Approximation der 1.
RWA des Laplace-Operators führt z.B. auf eine solche M-Matrix.
a) Man zeige, daß M-Matrizen “invers-monoton” sind, d.h.: Für Vektoren v, w ∈ RN gilt komponentenweise:
Av ≥ Aw ⇒ v ≥ w.
b) Ist ferner Ah w ≥ (1, . . . , 1)T für einen Vektor w ∈ RN , so folgt bzgl. der Maximumnorm
bzw. Maximalen-Zeilensummen-Norm:
kA−1
h k∞ ≤ kwk∞ .
c) Man zeige mit Hilfe von (b), daß für die Systemmatrix Ah des 5-Punkte-Schemas auf dem
70
Differenzen-Verfahren für elliptische Probleme
Einheitsquadrat die Abschätzung
kA−1
h k∞ ≤ 1/8
gilt, und folgere hiermit für die l∞ -Kondition von Ah :
−2
cond∞ (Ah ) := kAh k∞ kA−1
h k∞ ≤ h .
Die l∞ -Kondition von Ah verhält sich also in Abhängigkeit von der Gitterweite h genauso wie
die Spektralkondition. (Hinweis: Man versuche es mit der mit w(x, y) = x(1 − x)/2 + y(1 − y)/2
gebildeten Gitterfunktion.)
Übung 2.6: Gegeben sei die 1. RWA des Laplace-Operators
−∆u = f in Ω,
u = 0 auf ∂Ω,
auf dem Dreiecksgebiet Ω = {(x, y) ∈ R2 | x, y > 0, x + y < 1} . Man stelle zu einem äquidistanten, kartesischen Gitter das Gleichungssystem der 5-Punkte-Differenzenapproximation auf und
vergleiche (a) die zeilenweise, (b) die diagonale und (c) die schachbrettartige Gitterpunktnumerierung in Bezug auf Matrixstruktur, Speicherplatzbedarf und Rechenaufwand bei der Lösung
mit dem LR-Verfahren unter Ausnutzung der Bandstruktur.
Übung 2.7: Zur Auffrischung der Kenntnise über iterative Lösungsverfahren: Eine Vereinfachung des Jacobi-Verfahrens zur Lösung eines linearen N ×N -Gleichungssystems Ax = b ist das
sog. “Richardson-Verfahren”. Dabei wird ausgehend von einem beliebigen Startvektor x0 ∈ RN
mit einem Dämpfungsparameter θ ∈ R wie folgt iteriert:
xt+1 = xt − θ(Axt − b),
t = 0, 1, 2, . . . .
a) Im Falle, daß A nur reelle Eigenwerte λmin ≤ · · · ≤ λ ≤ · · · ≤ λmax besitzt, zeige man für
den Spektralradius ρ(Bθ ) der zugehörigen Iterationsmatrix Bθ = I − θA die Gleichung
ρ(Bθ ) = max |1 − θλmin |, |1 − θλmax | .
b) Im Falle, daß zusätzlich alle Eigenwerte positiv sind, zeige man
ρ(Bθ ) < 1
⇔
0<θ<
2
λmax
.
c) Für welchen Wert von θ wird ρ(Bθ ) in dieem Falle minimal?
Übung 2.8: Betrachtet werde wieder das Modellproblem
−∆u = f in Ω,
u = 0 auf ∂Ω,
auf dem Einheitsquadrat Ω ⊂ R2 . Die Systemmatrix des 5-Punkte-Diffrenzenoperators auf einem äquidistanten, kartesischen Punktgitter läßt sich schreiben als Summe der Anteile der beiden
Differenzenquotienten in x- und y-Richtung: A = Ax + Ay . Bei lexikographischer Numerierung
sind dabei Ax und Ay reguläre Tridiagonalmatrizen mit den Einträgen 2h−2 auf den Hauptdiagonalen und −h−2 verteilt auf den Nebendiagonalen. Das zugehörige Gleichungssystems
2.4 Übungen
71
AU = F besitzt damit die äquivalenten Formen
(σI + Ax )U = (σI − Ay )U + F,
(σI + Ay )U = (σI − Ax )U + F
mit einem beliebigen Parmeterwert σ > 0. Dies legt das folgende zweistufige Iterationsverfahren
(sog. “ADI-Verfahren” = “Alternating Direction Implicit Iteration”) nahe:
(σI + Ax )U t+1/2 = (σI − Ay )U t + F,
(σI + Ay )U t+1 = (σI − Ax )U t+1/2 + F.
Man zeige die Konvergenz dieses Verfahrens. Für welche Wahl von σ wird die Konvergenz am
schnellsten? (Hinweis: Man überlege sich, daß die Zerlegungsmatrizen Ax und Ay ein gemeinsames System von Eigenvektoren besitzen und folglich vertauschbar sind.)
72
Differenzen-Verfahren für elliptische Probleme
3 Finite-Elemente-Verfahren für elliptische Probleme
In diesem Kapitel werden wir die modernen Finite-Elemente-(Galerkin)-Methoden zur Lösung
elliptischer Randwertaufgaben diskutieren. Der Übersichtlichkeit halber werden wir uns dabei
auf das Modellproblem der Poisson-Gleichung mit Dirichletschen Randbedingungen, d.h. auf die
1. RWA, beschränken:
Lu := −∆u = f
in Ω,
u = g auf ∂Ω.
(3.0.1)
Das Definitionsgebiet Ω ∈ R2 wird zunächst wieder als glatt berandet oder als konvexes Polygongebiet vorausgesetzt. Die Problemdaten f, g sind ebenfalls glatt, so daß die im vorigen
Kapitel beschriebenen Resultate anwendbar sind. Erweiterungen für Probleme mit variablen
Koeffizienten oder anderen Randbedingungen sowie auf drei Raumdimensionen werden wieder
in Bemerkungen berücksichtigt.
3.1 Allgemeine Projektionsverfahren
Ausgangspunkt ist die variationelle Formulierung der Randwertaufgabe. Wir erinnern an den
oben diskutierten Ansatz zu einer allgemeinen Lösungstheorie. Eine schwache bzw. verallgemeinerte Lösung der 1. RWA des Laplace-Operators (zu den Randdaten g ≡ 0 ) ist definiert als das
(eindeutige) Minimum auf dem Sobolew-Raum H01 (Ω) des Energiefunktionals
E(v) := 21 k∇vk2 − (f, v) → min.
Wir verwenden hier und im folgenden wieder die Bezeichnungen
Z
1/2
1/2
Z
Z
2
|v(x)| dx
|∇v(x)|2 dx
v(x)w(x) dx, kvk :=
, k∇vk :=
.
(v, w) :=
Ω
Ω
Ω
Über den Variationsansatz
d
E(u + εϕ)|ε=0 = 0
dε
∀ϕ ∈ H01 (Ω)
erhalten wir die äquivalente Variationsgleichung (Stationäritätsbedingung)
u ∈ H01 (Ω) :
(∇u, ∇ϕ) = (f, ϕ)
∀ϕ ∈ H01 (Ω).
(3.1.2)
Wir erinnern daran, daß das natürliche Skalarprodukt des Raumes H01 (Ω) gerade durch (∇v, ∇w)
gegeben ist. Zum Nachweis der Definitheit dieses Ausdrucks haben wir die Poincarésche Ungleichung verwendet:
kvk ≤ dΩ k∇vk,
v ∈ H01 (Ω).
(3.1.3)
Bemerkung 3.1: Im Falle inhomogener Randbedingungen u|∂Ω = g geht man wie folgt vor.
Wir nehmen an, daß die Randwerte als Spur einer Funktion ḡ ∈ H 1 (Ω) gegeben sind: g = ḡ|∂Ω .
Für die Funktion v := u − ḡ ∈ H01 (Ω) gilt dann im Falle ∆ḡ ∈ L2 (Ω) :
(∇v, ∇ϕ) = (f, ϕ) − (∆ḡ, ϕ) =: (f˜, ϕ)
73
∀ϕ ∈ H01 (Ω),
74
Finite-Elemente-Verfahren für elliptische Probleme
d.h.: Die Funktion v genügt einer Variationsgleichung der Art (3.1.2). Im folgenden können wir
also o.B.d.A. stets homogene Dirichlet-Randbedingungen annehmen.
Bemerkung 3.2: Im Fall von Neumannschen Randbedingungen ∂n u|∂Ω = g wird der SobolewRaum H 1 (Ω) (ohne Vorgabe von Randwerten) verwendet und die zugehörige variationelle Formulierung lautet
u ∈ H 1 (Ω) :
(∇u, ∇ϕ) = (f, ϕ) + (g, ϕ)∂Ω
∀ϕ ∈ H 1 (Ω).
(3.1.4)
Um die eindeutige Lösbarkeit zu sichern, muß in diesem Fall noch eine Zusatzbedingung gestellt
werden, um konstante Lösungen auszuschließen, z.B.: die Normierungsbedingung (u, 1)Ω = 0 .
Ferner muß die Verträglichkeitsbedingung (f, 1)+(g, 1)∂Ω = 0 erfüllt sein. Jede hinreichend glatte Lösung von (3.1.4) erfüllt dann neben der Differentialgleichung −∆u = f auch notwendig die
in der variationellen Formulierung implizit enthaltene natürliche Randbedingung ∂n u|∂Ω = g
(Beweis ähnlich wie im Fall der 1. RWA durch partielle Integration und Variation der Testfunktion). Eine ähnliche Konstruktion liefert auch die variationelle Formulierung im Fall der 3. RWA,
d.h. für Robinsche Randbedingungen.
Bemerkung 3.3: Nicht alle elliptischen Randwertaufgaben lassen sich über den Energieminimierungsansatz behandeln. Ein typisches Beispiel ist die Diffusions-Transport-Gleichung
−∆u + ∂1 u = f
in Ω,
u = g auf ∂Ω.
(3.1.5)
Ihre variationelle Formulierung lautet
(∇u, ∇ϕ) + (∂1 u, ϕ) = (f, ϕ)
∀ϕ ∈ H01 (Ω).
(3.1.6)
Diese besitzt ebenfalls eine eindeutige Lösung u ∈ H01 (Ω) , was sich weiter unten als Folgerung
eines allgemeineren Resultats ergeben wird.
Die folgende Diskussion wird in einem etwas abstrakteren Rahmen durchgeführt, welche an
den obigen Beispielen orientiert ist und diese als Sonderfälle beinhaltet. Seien V ein Hilbert1/2
Raum mit Skalarprodukt (·, ·)V und zugehöriger Norm k·kV := (·, ·)V und a(·, ·) : V ×V → R
eine beschränkte Bilinearform sowie l(·) : V → R eine beschränkte Linearform:
|a(v, w)| ≤ αkvkV kwkV ,
|l(v)| ≤ γkvkV ,
v, w ∈ V.
(3.1.7)
Mit diesen Bezeichnungen betrachten wir die folgende allgemeine Variationsgleichung: Bestimme
u ∈ V , so daß
a(u, ϕ) = l(ϕ)
∀ϕ ∈ V.
(3.1.8)
Zum Nachweis, daß diese Aufgabe auch eine Lösung besitzt, postulieren wir, daß die Bilinearform
a(·, ·) (stark) V -elliptisch“ ist, d.h.:
”
a(v, v) ≥ κkvk2V ,
v ∈ V,
(3.1.9)
mit einer Konstante κ > 0 . Allgemeiner wird die Bilinearform a(·, ·) koerzitiv“ (oder regulär“)
”
”
genannt, wenn
3.1 Allgemeine Projektionsverfahren
sup
ϕ∈V
75
a(v, ϕ)
≥ γ kvkV ,
kϕkV
sup
ϕ∈V
a(ϕ, v)
≥ γ kvkV ,
kϕkV
v ∈ V,
(3.1.10)
mit einer Konstante γ > 0 .
Hilfssatz 3.1: (Lax1 -Milgram2 -Lemma) Unter den obigen Voraussetzungen besitzt die Gleichung (3.1.8) eine eindeutige Lösung u ∈ V , für welche die a priori Abschätzung gilt:
kukV ≤
α
klkV ∗ ,
κ
(3.1.11)
mit der Dualnorm“ klkV ∗ := sup{ϕ∈V, kϕk=1} |l(ϕ)| .
”
Beweis: Für jedes feste v ∈ V definiert a(v, ·) ein lineares, stetiges Funktional auf V . Nach
dem Rieszschen3 Darstellungssatz existieren Elemente Av ∈ V und f ∈ V , so daß
a(v, ϕ) = (Av, ϕ)V ,
l(ϕ) = (f, ϕ)V ,
ϕ ∈ V.
Die Zuordnung v 7→ Av definiert eine lineare Abbildung mit der Eigenschaft
kAvkV ∗ ≤ αkvkV ,
d.h.: A ist beschränkt. Die Aufgabe (3.1.8) ist offenbar äquivalent zu der Gleichung
Au = f .
(3.1.12)
Wir wollen zeigen, daß die Abbildung
v ∈ V 7→ Tδ v := v − δ(Av−f ) ∈ V
für einen geeigneten Wert δ > 0 eine Kontraktion auf ganz V ist. Dann besitzt die Fixpunktgleichung
Tδ v = v
eine eindeutige Lösung u ∈ V , welche wegen 0 = v − Tδ v = δ(Av − f ) dann auch (eindeutige)
Lösung von (3.1.12) bzw. (3.1.8) ist. Die Kontraktionseigenschaft ergibt sich aus der Beziehung
kv − δAvk2V = kvk2V − 2δ a(v, v) + δ2 kAvk2V
≤ (1 − 2δκ + δ2 α2 )kvk2V ,
für 0 < δ < 2κ/α2 .
Q.E.D.
1
Peter D. Lax (1926-): US-amerikanischer Mathematiker ungarischer Abstammung; Prof. an der New York
University und am Courant-Institut; wichtige Beiträge zur Analysis, insbesondere zu den partiellen Differentialgleichungen der Math. Physik, und zur Numerik.
2
A. N. Milgram (????-????): US-amerikanischer Mathematiker; Topologe.
3
Frigyes Riesz (1880-1956): ungarischer Mathematiker; Prof. in Szeged und Budapest; fundamentale Beiträge
zur Funktionalanalysis, insbesondere der Fourier-Analysis im Hilbert-Raum als theoretische Grundlage der frühen
Quantenmechanik.
76
Finite-Elemente-Verfahren für elliptische Probleme
Die beiden obigen Beispiele zur 1. RWA passen in diesen Rahmen mit den Setzungen V :=
H01 (Ω) , l(v) := (f, ϕ) und
a(v, w) := (∇v, ∇w),
a(v, w) := (∇v, ∇w) + (∂1 v, w).
Die Beschränktheit dieser Formen ergibt sich direkt mit Hilfe der Hölderschen und der Poincaréschen Ungleichung. Ihre V -Elliptizität ergibt sich unmittelbar:
a(v, v) = k∇vk2 = kvk2V ,
bzw. unter Beachtung von v|∂Ω = 0 :
a(v, v) = k∇vk2 + (∂1 v, v) = k∇vk2 + 12 (∂1 v 2 , 1)
= k∇vk2 + 12 (n1 v 2 , 1)∂Ω = k∇vk2 = kvk2V .
Durch geeignete Setzungen lassen sich auch die variationellen Formulierungen der 2. und 3. RWA
in diesen abstrakten Rahmen einordnen.
Zur Approximation der Variationsgleichung (3.1.2) werden endlich dimensionale Teilräume
Vh ⊂ V
(0 < h ≤ h0 )
ausgewählt, deren Feinheit durch einen Diskretisierungsparameter h (z.B.: Gitterweite) charakterisiert ist.
(i) Im Fall einer symmetrischen Bilinearform a(·, ·) bestimmt das klassische Ritzsche4 Projek”
tions-Verfahren“ Näherungslösungen uh ∈ Vh durch die Vorschrift
E(uh ) = min E(vh )
vh ∈V
(3.1.13)
oder äquivalent durch die diskrete Variationsgleichung
a(uh , ϕh ) = (f, ϕh ) ∀ϕh ∈ Vh .
(3.1.14)
Die (eindeutige) Existenz der diskreten Lösung uh ∈ Vh folgt mit demselben Argument wie
beim kontinuierlichen Problem. Diese Analogie der Schlußweisen von kontinuierlicher und diskreter (endlich dimensionaler) Situation ist die charakteristische Stärke der Projektionsmethoden
im Gegensatz zu den Differenzenverfahren. Die Bezeichnung Projektionsverfahren ist motiviert
durch die Beziehung
a(u − uh , ϕh ) = 0 ϕh ∈ Vh ,
(3.1.15)
welche man durch Subtraktion der Gleichungen (3.1.2) und (3.1.14) erhält. Sie kann geometrisch dahingehend interpretiert werden, daß der Fehler eh := u − uh bzgl. des Skalarprodukts
a(·, ·) senkrecht auf dem Ansatzraum Vh steht. Dies impliziert auch die sog. Bestapproxi”
mationseigenschaft“ für den Approximationsfehler eh bzgl. der natürlichen Energie-Norm“
”
4
Walter Ritz (1878-1909): schweizer Physiker; Prof. in Zürich und Göttingen; Beiträge zu Spektraltheorie in
der Kernphysik und Elektro-Magnetismus.
3.1 Allgemeine Projektionsverfahren
77
k · ka := a(·, ·)1/2 , denn mit beliebigem ϕh ∈ Vh gilt:
keh k2a = a(eh , eh ) = a(eh , u − ϕh ) + a(eh , ϕh − uh ) ≤ keh ka ku − ϕh ka
bzw.
keh ka ≤ inf ku − ϕh ka .
ϕh ∈Vh
(3.1.16)
Da die Normen k · ka und k · kV auf V äquivalent sind, ist die Frage nach der Konvergenz des
Projektionsverfahrens,
keh kV → 0
(h → 0),
(3.1.17)
damit zurückgeführt auf die Frage der Approximierbarkeit von Funktionen u ∈ V durch Ansatzfunktionen ϕh ∈ Vh :
inf ku − ϕh kV → 0 (h → 0).
ϕh ∈Vh
(3.1.18)
(ii) Wenn die Bilinearform a(·, ·) nicht symmetrisch ist, wie beim obigen Diffusions-TransportProblem, kann die zugehörige RWA nicht mehr durch ein Minimierungsproblem charakterisiert
werden. Das allgemeine Galerkinsche5 (Projektions)-Verfahren“ geht direkt von der Variations”
gleichung (3.1.2) aus und bestimmt Näherungen durch die Beziehung
a(uh , ϕh ) = (f, ϕh ) ∀ϕh ∈ Vh .
(3.1.19)
Wegen der V -Elliptizität der Bilinearform a(·, ·) auf dem endlich dimensionalen Teilraum Vh
folgt unmittelbar die Existenz der (eindeutigen) Lösung uh ∈ Vh . Die Orthogonalitätsbeziehung
(3.1.15) bleibt dabei gültig. Damit erschließen wir die Quasi-Best-Approximationseigenschaft
(Übungsaufgabe)
keh kV ≤
α
min ku − ϕh kV .
κ ϕ∈Vh
(3.1.20)
(iii) Eine noch allgemeinere Variante, bei der Ansatzraum Vhansatz und Testraum Vhtest unterschiedlich gewählt werden,
u ∈ Vhansatz :
a(uh , ϕh ) = (f, ϕh ) ∀ϕh ∈ Vhtest ,
(3.1.21)
ist das sog. Petrow6 -Galerkin-Verfahren“. Wir werden später Beispiele für diesen unkonven”
tionellen Ansatz kennenlernen.
Zur praktischen Realisierung des Projektionsverfahrens muß die zunächst abstrakte Variationsgleichung (3.1.19) im Funktionenraum algebraisiert werden, d.h.: in ein äquivalentes
algebraisches Gleichungssystem umgewandelt werden. Dazu wählen wir zunächst eine Basis
5
Boris Grigorievich Galerkin (1871-1945): russischer Bauingenieur und Mathematiker; Prof. in St. Petersburg;
Beiträge zur Struktur-Mechanik, insbesondere zur Plattentheorie.
6
Georgi Iwanowitsch Petrow (1912-1987): russischer Ingenieur; 1965-1973 Direktor des Instituts für Raumfahrtforschung; Publ.: “Application of the Galerkin method and the problem of flow stability of a viscous liquid”
(russ.), Prikl. Mat. Mekh. 4, 36-47 (1947)
78
Finite-Elemente-Verfahren für elliptische Probleme
(i)
{ϕh , i = 1, ..., N }, N := dim Vh , von Vh aus und machen für die zu bestimmende diskrete
P
(j)
Lösung den Ansatz uh = N
j=1 ξj ϕh . Wird dies in (3.1.19) eingesetzt und läßt man die Testfunktionen ϕh ∈ Vh alle Basisfunktionen durchlaufen, ergibt sich ein lineares (algebraisches)
N × N -Gleichungssystem
N
X
(j)
(i)
(i)
ξj a(ϕh , ϕh ) = (f, ϕh ),
i = 1, ..., N,
j=1
für den Vektor ξ = (ξj )N
j=1 der Entwicklungskoeffizienten, bzw. in kompakter Schreibweise
Ah ξ = bh .
(3.1.22)
N
Dabei sind die Koeffizientenmatrix Ah = (aij )N
i,j=1 sowie die rechte Seite bh = (bi )i=1 durch
die spezielle Wahl der Basis bestimmt:
(j)
(i)
(j)
bj = (f, ϕh ).
aij = a(ϕh , ϕh ),
Die Entwicklungskoeffizienten ξj können sehr unterschiedliche Bedeutung haben; z.B.: MonomKoeffizienten einer Polynomdarstellung, Fourier-Koeffizienten einer trigonometrischen Entwicklung, Knotenwerte einer stückweise polynomialen Funktion, u.s.w.. Die Eigenschaften der Bilinearform a(·, ·) übertragen sich direkt auf die zugehörige Matrix Ah . Ist a(·, ·) symmetrisch,
so auch Ah ,
(j)
(i)
(i)
(j)
aij = a(ϕh , ϕh ) = a(ϕh , ϕh ) = aji ,
und die V -Elliptizität von a(·, ·) impliziert die Definitheit von Ah , denn für x ∈ Rn \ {0} gilt:
(Ah x, x) =
N
X
aij xi xj =
i,j=1
N
X
(j)
(i)
a(ϕh , ϕh )xi xj
i,j=1
N
N
N
X
X
X
(i) 2
(i)
(j)
xi ϕh > 0.
xi ϕh ≥ κ
=a
xj ϕh ,
j=1
i=1
i=1
V
3.1.1 Beispiele von Galerkin-Ansatzräumen
Wir wollen einige konkrete Realisierungen für den beschriebenen abstrakten Rahmen diskutieren. Bei der Wahl der Ansatzräume Vh ⊂ V = H01 (Ω) sowie der Basen zur Aufstellung der
Gleichungssysteme (3.1.22) sind einige Bedingungen zu beachten:
(j)
(i)
(i)
– Die Berechnung der Matrixelemente aij = a(ϕh , ϕh ) sowie die der rechten Seite (f, ϕh )
sollte billig“ sein.
”
– Aus Genauigkeitsgründen wird die Problemdimension in der Regel sehr groß sein: N ≫
100 . Die Matrix Ah sollte daher möglichst dünn besetzt sein.
– Die Matrix Ah sollte nicht zu schlecht konditioniert sein; akzeptabel sind z.B. beim vorliegenden Problem cond2 (Ah ) ≈ O(N ) − O(N 2 ) , wogegen cond2 (Ah ) ≈ O(N 4 ) − O(eN )
nicht praktikabel wären.
Beispiele von solchen Ansätzen sind:
3.1 Allgemeine Projektionsverfahren
79
1) Globaler Polynomansatz: Auf einem Quadrat Ω = (0, 1)2 wird der Tensor-Produkt-Ansatz
gemacht
m
X
cij xi y j , h := 1/m, N = (m + 1)2 .
Vh := Qm (Ω) := p(x, y) =
i,j=0
Als Basen kommen dabei in Frage:
a) Monombasis 1, x, y, x2 , xy, y 2 , ... ; die zugehörige Matrix A mit den Elementen
aij =
Z
0
1Z 1
0
∇xi · ∇y j dx dy,
0 ≤ i, j ≤ m,
verhält sich dann wie die bekannte Hilbert-Matrix mit exponentiell mit N wachsender Kondition
cond2 (Ah ) = O(eN ) . Dieser Ansatz ist also praktisch unbrauchbar.
b) Tensorprodukt-Basen L2 -orthogonaler Polynome wie z.B. Legendre-Polynome oder Tschebyscheff-Polynome; die zugehörige Matrix Ah mit den Elementen
Z 1Z 1
(m)
(m)
∇Li · ∇Lj dx dy, 0 ≤ i, j ≤ m,
aij =
0
0
ist dann zwar voll besetzt, hat aber eine wesentlich günstigere Kondition, cond2 (Ah ) = O(N ) .
Dieser Ansatz führt auf die sog. Spektral-Galerkin-Verfahren“, welche bei Problemen auf geo”
metrisch einfachen (rechteckigen) Gebieten sehr leistungsfähig sind. Die Bezeichnung Spek”
tralverfahren“ rührt daher, daß man die orthogonalen Polynome auch als Eigenfunktionen gewisser Differentialoperatoren 2. Ordnung charakterisieren kann. Wegen ihrer konzeptionellen
Beschränkung auf einfache Geometrien wollen wir derartige Methoden hier nicht weiter diskutieren. Stichworte für Entwicklungen in Richtung auf eine Überwindung dieser Restriktion sind
z.B. Spektral-Elemente-Methoden“ und h/p-Finite-Elemente-Methode“.
”
”
2) Globaler trigonometrischer Ansatz ( echte Spektralverfahren“): Wieder auf einem Quadrat
”
Ω = (0, 1)2 wird der Tensor-Produkt-Ansatz gemacht
m
X
cij sin(iπx) sin(jπy) ,
Vh := Tm (Ω) := t(x, y) =
h := 1/m, N = (m + 1)2 .
i,j=0
Als Basen verwendet man dabei die natürliche trigonometrische Basis
{1, sin(nπx) sin(mπy), ...} .
Die zugehörige Matrix Ah ist dann vergleichsweise gut konditioniert, cond2 (Ah ) = O(N ) .
In diesem Fall gibt es mit der schnellen Fourier-Transformation ( FFT“) einen fast optimalen
”
Algorithmus mit der Komplexität O(N ln(N )) zur Lösung des Gleichungssystems (3.1.22). Der
Nachteil dieses in Spezielfällen sehr leistungsfähigen Ansatzes ist wieder seine Beschränktheit
auf einfache Rechteckgeometrien und sog. separable“ Differentialoperatoren mit konstanten
”
Koeffizienten.
3) Stückweise polynomialer Ansatz ( Finite Elemente“): Um das Problem der Approximation
”
allgemeiner Gebiete zu lösen, werden Ansatzfunktionen (auch Formfunktionen“ genannt) ver”
wendet, welche bzgl. einer Zerlegung von Ω in einfache Teilgebiete T , sog. Zellen“, stückweise
”
polynomial sind. Gängige Beispiele von Zellen sind Dreiecke oder (konvexe) Vierecke in zwei
bzw. Tetraeder oder (konvexe) Hexaeder in drei Dimensionen. Der Parameter h ist in diesem
80
Finite-Elemente-Verfahren für elliptische Probleme
Fall etwa der maximale Zelldurchmesser.
Wir illustrieren diesen Finite-Elemente-Ansatz anhand eines einfachen Beispiels. Die 1. RWA
(3.1.2) sei auf einem (konvexen) polygonalen Gebiet Ω ⊂ R2 mit homogenen Randwerten u|∂Ω =
0 und rechter Seite f ∈ L2 (Ω) gestellt. Die zugehörige Lösung u ∈ H01 (Ω) ist dann auch im
Sobolew-Raum H 2 (Ω) und genügt der a priori Abschätzung
k∇2 uk ≤ cs kf k,
(3.1.23)
wobei cs = 1 im Falle eines konvexen Gebiets.
Weiter sei eine Folge von Zerlegungen Th = {T } des Gebiets Ω in abgeschlossene Dreiecke T ( Triangulierung“) gegeben mit h := maxT diam(T ) → 0 . Wir stellen die folgenden
”
Regularitätsbedingungen an diese Triangulierung:
S
i) Strukturregularität: Je zwei Dreiecke der Zerlegung Ω = {T ∈ Th } überlappen sich
höchstens in gemeinsamen Eckpunkten oder in ganzen Seiten, d.h.: Sog. hängende“ Knoten
”
sind hier nicht erlaubt.
ii) Formregularität: Alle Dreicke der Triangulierungen T ∈ Th sind von ähnlicher Gestalt, d.h.:
Für den Inkreisradius ρT und Umkreisradius hT eines jeden Dreiecks T gilt gleichmäßig für
h → 0:
max
T ∈Th
hT
≤ c1
ρT
(3.1.24)
iii) Größenregularität: Alle Dreiecke einer Triangulierung Th sind von gleicher Größenordnung,
d.h.: Es gilt gleichmäßig für h → 0 :
max hT ≤ c2 min hT .
T ∈Th
T ∈Th
(3.1.25)
T
Ω
Abbildung 3.1: Finite-Elemente: Dreiecks- bzw. Vierecksgitter
Auf den Triangulierungen Th definieren wir Ansatzräume stückweise linearer Funktionen
( lineare finite Elemente“: Verallgemeinerung des Konzepts eines Polygonzugs auf höhere Raum”
dimensionen):
(1)
Vh := {vh ∈ C(Ω)| vh|T ∈ P1 (T ), T ∈ Th , v|∂Ω = 0} .
Dabei bezeichnet allgemein Pr (T ) den Vektorraum der Polynome bis zum Grad r ≥ 0 über
(1)
T . Man überlegt sich leicht, daß dadurch tatsächlich Teilräume Vh ⊂ H01 (Ω) erklärt sind. Sei
3.1 Allgemeine Projektionsverfahren
81
(1)
N die Anzahl der inneren“ Knoten (Dreieckseckpunkte) der Triangulierung. Jedes vh ∈ Vh
”
ist als stückweise lineare Funktion eindeutig durch Vorgabe ihrer Funktionswerte ( Knotenwer”
te“) in den inneren“ Dreieckseckpunkten ( Knoten“) festgelegt. In den Eckpunkten auf dem
”
”
(1)
Gebietsrand ∂Ω ist vh = 0 wegen der Dirichlet-Randbedingung. In Vh gibt es daher eine
natürliche Basis, die sog. Knotenbasis“ in Analogie zur Lagrange7 -Basis“ bei der eindimen”
”
sionalen Lagrange-Interpolation. Jedem Knoten ai wird durch die Bedingung
ϕih (aj ) = δij ,
(1)
eindeutig eine Funktion ϕih ∈ Vh
stellung
j = 1, ..., N,
(1)
zugeordnet. Damit gilt dann für jedes vh ∈ Vh
vh =
N
X
die Dar-
(i)
vh (ai )ϕh .
i=1
(i)
{ϕh ,
(1)
i = 1, ..., N } tatsächlich eine Basis von Vh
Daraus folgt, daß
jeder kontinuierlichen Funktion v ∈ C(Ω) durch die Vorschrift
Ih v :=
N
X
ist. Umgekehrt läßt sich
(i)
v(ai )ϕh
i=1
(1)
eindeutig eine (stückweise lineare) Interpolierende“ Ih v ∈ Vh
”
(1)
vh für vh ∈ Vh .
zuordnen. Offenbar ist Ih vh ≡
Dieser Diskretisierungsansatz erfüllt offensichtlich die oben formulierten Anforderungen an
ein brauchbares Galerkin-Verfahren: Die resultierende Systemmatrix Ah ist dünn besetzt (wegen
der geringen Überlappung der Träger der Basisfunktionen), und ihre Elemente sind sehr leicht zu
berechnen. Wir werden die praktische Berechnung von A im Zusammenhang mit allgemeineren
Finite-Elemente-Ansätze dieser Art noch eingehender diskutieren.
Abbildung 3.2: Knotenbasisfunktionen: Lineare und bilineare Ansätze
Für die Kondition der Matrix Ah werden wir später in zwei Dimensionen cond2 (Ah ) =
O(h−2 ) = O(N ) zeigen (ähnlich wie bei der 5-Punkte-Differenzendiskretisierung). Wir reka7
Joseph Louis de Lagrange (1736-1813): französischer Mathematiker; 1766-87 Direktor der mathem. Klasse
der Berliner Akademie, dann Prof. in Paris; bahnbrechende Arbeiten zur Variationsrechnung, zur komplexen
Funktionentheorie sowie zur theor. Mechanik und Himmelsmechanik.
82
Finite-Elemente-Verfahren für elliptische Probleme
(1)
pitulieren für das Galerkin-Verfahren mit dem Finite-Elemente-Raum Vh
Abschätzung für den Fehler eh := u − uh :
k∇eh k = min
(1)
ϕh ∈Vh
k∇(u − ϕh )k.
die asymptotische
(3.1.26)
(1)
Die Frage ist also, ob es ϕh ∈ Vh gibt, so daß k∇(u − ϕh )k → 0 (h → 0) . Wenn man nur weiß,
daß u ∈ H01 (Ω) ist, dann kann man nur qualitative Konvergenz zeigen. Viel interessanter wäre
es, wieder die Konvergenzgeschwindigkeit in Potenzen der Gitterweite h zu kennen. Hierzu ist
aber natürlich mehr Regularität der Lösung u erforderlich. Für den stückweise linearen Ansatz
werden wir später im Rahmen einer allgemeinen Theorie die folgende Interpolationsabschätzung
zeigen:
k∇(v − Ih v)k ≤ ci h k∇2 vk,
v ∈ H01 (Ω) ∩ H 2 (Ω).
(3.1.27)
(Man vergleiche die analoge Abschätzung, welche in einer Dimension bei der Finite-ElementeApproximation eindimensionaler Sturm-Liouville-Probleme verwendet wird.) Unter den bisher
formulierten Voraussetzungen läßt sich eine erste quantitative Konvergenzaussage für das FiniteElemente-Verfahren ableiten.
Satz 3.1 (Konvergenzsatz): Für die Galerkin-Approximation des Modellproblems (3.1.2) mit
linearen“ finiten Elementen gelten unter den obigen Voraussetzungen die Fehlerabschätzungen
”
k∇eh k ≤ ci cs h kf k,
keh k ≤
c2i c2s h2 kf k,
(3.1.28)
(3.1.29)
mit den Konstanten ci , cs aus den Ungleichungen (3.1.27) und (3.1.23).
Beweis: (i) Die Abschätzung des sog. Energienorm-Fehlers“ ergibt sich unmittelbar aus der
”
Best-Approximationsbeziehung (3.1.26), der Interpolationsabschätzung (3.1.27) und der Regularitätsabschätzung (3.1.23):
k∇eh k ≤ k∇(u − Ih u)k ≤ ci h k∇2 uk ≤ ci cs h kf k.
(ii) Zum Beweis der Fehlerabschätzung in der L2 -Norm verwenden wir ein sog. Dualitätsargu”
ment“ ( Aubin8 -Nitsche9 -Trick“). Sei z ∈ H01 (Ω) die (schwache) Lösung des Hilfsproblems
”
−∆z = keh k−1 eh in Ω,
z|∂Ω = 0.
Diese ist dann auch in H 2 (Ω) , und es gilt die a priori Abschätzung
k∇2 zk ≤ cs k∆zk = cs ,
8
Jean-Pierre Aubin (1939-): französischer Mathematiker; Prof. an der Univ. Paris-Dauphine (2004) emeritiert);
Beiträge zur Theorie partieller Differentialgleichungen und ihrer Numerik.
9
Joachim A. Nitsche (1926-1996): deutscher Mathematiker; Prof. in Freiburg; fundamentale Beiträge zur Theorie der Finite-Elemente-Methode.
3.1 Allgemeine Projektionsverfahren
83
wobei wieder cs = 1 auf konvexem Gebiet Ω . Nach Konstruktion folgt mit Hilfe der GalerkinOrthogonalität:
keh k = (∇eh , ∇z) = (∇eh , ∇(z − Ih z))
≤ k∇eh k k∇(z − Ih z)k ≤ ci h k∇eh k k∇2 zk ≤ ci cs h k∇eh k.
Mit dem Ergebnis (i) ergibt sich damit die gewünschte Abschätzung.
Q.E.D.
Die im Beweis von Satz 3.1 verwendete Schlußweise über ein Dualitätsargument ist das“
”
zentrale Hilfsmittel bei der Konvergenzanalyse von Finite-Elemente-Verfahren. Dieses abstrakte
Argument entspricht der allgemeinen Regel, daß sich die Analyse der Projektionsverfahren eng
an die abstrakten Hilbertraum-Methoden zur Behandlung des kontinuierlichen Problems anlehnt. Das zentrale Hilfmittel bei der Untersuchung von Differenzenverfahren war dagegen das
(diskrete) Maximumprinzip“, welches sich mehr an den klassischen Techniken für partielle Dif”
ferentialgleichungen orientiert. Wir wollen diesen Vergleich Finite-Elemente-Method (FEM) ”
Finite-Differenzen-Method (FDM)“ anhand des Resultats von Satz 3.1 noch etwas weiterführen.
Die a-priori Fehlerabschätzung (3.1.29) für das Finite-Elemente-Verfahren ist zu vergleichen mit der Abschätzung (2.2.37) für das Differenzenverfahren (5-Punkte-Diskretisierung mit
Shortley-Weller-Randapproximation auf polygonalen Gebieten):
max |eh | ≤
Ω
2
1 2
24 dΩ M4 (u)h
+ O(h3 ),
(3.1.30)
mit der Schranke M4 (u) für die vierten Ableitungen von u . Beide Abschätzungen zeigen dieselbe asymptotische Konvergenzordnung O(h2 ) , was aufgrund der verwendeten Diskretisierungsansätze auch zu erwarten ist. Die Unterschiede liegen zum einen in der Art der Norm, in der
der Fehler gemessen wird, und zum anderen in der benötigten Regularität der approximierten
Lösung. Beim Differenzenverfahren erhält man wegen der Verwendung des Maximumprinzips
punktweise Abschätzungen, wie sie auch der Anwender gern hat. (Der Ingenieur ist z.B. an
der maximalen Auslenkung einer belasteten Brückenkonstruktion interessiert.) Dagegen liefert
die Hilbert-Raum-Theorie für das Finite-Elemente-Verfahren zunächst nur Abschätzungen im
quadratischen Mittel, was etwa lokale Ausreißer“ an kritischen Stellen nicht ausschließt. (Dem
”
Brückenbauer genügt so etwas nicht, wenn Fehlerspitzen etwa in kritischen Lagerungspunkten
der Brücke auftreten können.) Wir werden später die Frage diskutieren, ob und wie man auch
für das Finite-Elemente-Verfahren Fehlerabschätzungen in der Maximumnorm herleiten kann.
Die in der Abschätzung (3.1.30) geforderte hohe Regularität der Lösung ist ein sehr viel schwerwiegender Nachteil unserer Analyse des Differenzenverfahrens, da diese Regularitätsstufe i.a.
auf Polygongebieten und unter realistischen Annahmen an die Problemdaten nicht erwartet
werden kann. Wir bemerken, daß man für das Finite-Elemente-Verfahren mit wesentlich mehr
technischem Aufwand optimale“ Maximumnorm-Fehlerabschätzungen der Form
”
max |eh | ≤ cM2 (u) h2 | ln h|
(3.1.31)
Ω
beweisen kann. Allerdings ist auch die abgeschwächte Annahme M2 (u) < ∞ i.a. noch zu
restriktiv. Für das Finite-Elemente-Verfahren ist auch noch unter der Minimalvoraussetzung
u ∈ H01 (Ω) wenigstens qualitative Konvergenz gesichert. Seinen eigentlichen Vorteil, nämlich
die große Flexibilität bei der Approximation von komplizierten Geometrien auf unstrukturierten Gittern werden wir später im Zusammenhang mit der Frage nach adaptiver Gittersteuerung
und Fehlerkontrolle erkennen.
84
Finite-Elemente-Verfahren für elliptische Probleme
3.1.2 Diskretes Maximumprinzip für Finite-Elemente-Approximationen
Als nächstes wollen wir zeigen, daß Galerkin-Verfahren mit finiten Elementen als Ansatzfunktionen tatsächlich eng verwandt mit Differenzenverfahren sind. Die Elemente der Steifigkeits”
matrix“ Ah des Finite-Elemente-Verfahrens für den Fall linearer“ Ansatzfunktionen auf einem
”
Dreiecksgitter werden exakt bestimmt.
Dazu wird zunächst ein einzelnes Dreieck T mit den Eckpunkten Pi (i = 1, 2, 3) betrachtet
(siehe Bild). Die dem Eckpunkt Pi gegenüberliegende Seite sei mit Si und die zugehörige
Höhe mit Hi bezeichnet. Die Seiten werden dabei als im Gegenuhrzeigersinn und die Höhen
gegen den Eckpunkt orientierte Vektoren aufgefaßt. Weiter bezeichne ψi die (stückweise lineare)
Knotenbasisfunktion zum Punkt Pi , welche auf T definiert ist durch ψi (Pk ) = δik , i, k = 1, 2, 3 .
Abbildung 3.3: Dreiecksschema
Es gilt ∇ψh ≡ konst. und wegen ψi (Pj ) = ψi (Pk ) = 0, i 6= j, k , hat ∇ψi in Richtung
Si die Komponente Null. Folglich zeigt ∇ψi in Richtung Hi und hat wegen ψi (Pi ) = 1 den
Betrag |Hi |−1 :
Hi
.
∇ψi =
|Hi |2
Wir erhalten also
(∇ψi , ∇ψj )T = |T |
(Hi , Hj )
.
|Hi |2 |Hj |2
Für den Winkel γij zwischen den Höhen Hi und Hj gilt
cos(γij ) =
(Hi , Hj )
|Hi | |Hj |
und, da γij gleich dem Winkel θij zwischen den Seitenvektoren Si und Sj ist, auch (Man
beachte die Orientierung von Si und Sj .):
cos(γij ) =
(Si , Sj )
|Si | |Sj |
Damit folgt bei Beachtung von 2|T | = |Hi | |Si | die Beziehung
(∇ψi , ∇ψj )T = |T |
(Si , Sj )
(Si , Sj )
=
.
|Si | |Sj | |Hi | |Hj |
4|T |
3.1 Allgemeine Projektionsverfahren
85
Hieraus lesen wir ab, daß
(∇ψi , ∇ψi )T > 0,
(∇ψi , ∇ψj )T ≤ 0,
i 6= j,
(3.1.32)
falls alle Winkel im Dreieck T kleiner oder gleich π/2 sind. Weiter ist nach Konstruktion
3
X
j=1
bzw.
N
X
j=1,j6=i
Für die Elemente aij =
P
ψj ≡ 1,
(∇ψi ,
3
X
j=1
∇ψj )T = 0,
|(∇ψi , ∇ψj )T | ≤ (∇ψi , ∇ψi )T ,
T ∈Th (∇ψj , ∇ψi )T
aii > 0,
i = 1, 2, 3.
der Matrix Ah erhalten wir somit, daß
aij ≤ 0
(i 6= j),
wenn alle Dreiecksinnenwinkel in der Triangulierung kleiner oder gleich π/2 sind. Darüber
hinaus gilt
X
X
|ai0 j | < ai0 i0 für ein i0 .
(3.1.33)
|aij | ≤ aii ,
j6=i
j6=i0
Die Steifigkeitsmatrix Ah ist in diesem Fall also (irreduzibel) diagonal-dominant“, von nicht”
”
negativem Typ“ und eine M -Matrix“. Wir fassen die sich daraus ergebenden Konsequenzen in
”
einem Satz zusammen.
Satz 3.2 (Maximumprinzip für finite Elemente): Wenn alle Innenwinkel der Triangulierung Th kleiner oder gleich π/2 sind, genügt das Finite-Elemente-Schema mit stückweise linearen Ansatzfunktionen einem diskreten Maximumprinzip, d.h.:
(n)
(∇vh , ∇ϕh ) ≤ 0 (n = 1, ..., N )
⇒
maxΩ vh ≤ max{0, max∂Ω vh }.
(3.1.34)
Ferner ist die Steifigkeitsmatrix Ah eine M -Matrix, d.h. es gilt A−1
h ≥ 0 sowie
x ∈ RN , Ah x ≥ 0
⇒
x ≥ 0.
(3.1.35)
Dieses Resultat kann so interpretiert werden, daß unter den gegebenen Voraussetzungen auch
die Finite-Elemente-Diskretisierung ein diskretes Maximumprinzip“ erfüllt. Leider gilt die kri”
tische Eigenschaft (3.1.32) praktisch nur in der oben beschriebenen Situation. Insbesondere
Finite-Elemente-Ansätze höherer Ordnung erfüllen dies nicht (z.B. quadratische Ansätze nur
auf gleichseitigen“ Triangulierungen).
”
Bemerkung 3.4: Im Spezialfall einer gleichförmigen, kartesischen Triangulierung (mit Kantenlänge h ) des Einheitsquadrats erhalten wir aus der obigen expliziten Darstellung für die
Matrixelemente aij = (∇ψi , ∇ψj ) die Beziehung:
aii = 4,
ai,i±1 = −1,
ai,i±m = −1;
86
Finite-Elemente-Verfahren für elliptische Probleme
alle anderen Elemente aij sind Null. In diesem Fall stimmt die Steifigkeitsmatrix AFh EM also
bis auf den Faktor h−2 mit der Matrix AFh DM des 5-Punkte-Operators“ überein:
”
AFh EM = h2 AFh DM .
Für die Elemente des zugehörigen Lastvektors“ gilt entsprechend:
”
Z
f ψi dx ≈ h2 f (Pi ) + O(h4 ) = h2 bFi DM + O(h4 ).
bFi EM =
(3.1.36)
(3.1.37)
Ω
Dies zeigt, daß aus algebraischer Sicht FEM und FDM eng verwandt sind. Für eine stückweise
bi-linearen“ Ansatz auf einer gleichförmigen Quadratzerlegung erhält man ein Analogon zu
”
einem kompakten 9-Punkte-Operator“ (siehe Abb. 3.4):
”
Abbildung 3.4: Differenzensterne
3.1.3 Approximation krummer Ränder
Zum Abschluß dieser einführenden Diskussion wollen wir noch darstellen, wie in der FEM krumme Ränder approximiert werden. Dazu sei angenommen, daß der Rand ∂Ω regulär genug ist,
daß die schwache Lösung u ∈ V := H01 (Ω) auch in H 2 (Ω) ist und der a-priori Abschätzung
kukH 2 ≤ cs kf k
(3.1.38)
genügt.
i) Der konvexe Fall“: Sei Ω ⊂ R2 ein glatt berandetes, konvexes Gebiet. Dieses sei überdeckt
”
durch eine reguläre Triangulierung Th = {T } , so daß alle Eckpunkte des Polygongebiets
[
Ωh := {T ∈ Th } ⊂ Ω,
auf dem Rand ∂Ω liegen. Die Länge der Polygonkanten von ∂Ω ist dann durch die Gitterweite
h der Triangulierung Th beschränkt (siehe Abb. 3.5).
Auf Ω wird nun zunächst der einfachste Finite-Elemente-Ansatz (mit linearen Formfunktionen) wie folgt definiert:
(1)
Vh
:= {vh ∈ C(Ω)| vh|T ∈ P1 (T ), T ∈ Th , vh|Ω\Ωh ≡ 0} ⊂ V = H01 (Ω).
(1)
Die zugehörigen Galerkin-Approximationen uh ∈ Vh
sind durch die Variationsgleichung
(∇uh , ∇ϕh ) = (f, ϕh ) ∀ϕh ∈ Vh
(3.1.39)
3.1 Allgemeine Projektionsverfahren
87
bestimmt. Wegen der Teilraumbeziehung Vh ⊂ V gilt dann wieder für den Fehler eh := u − uh
die Bestapproximationsbeziehung (3.1.26).
Abbildung 3.5: Polygonale Approximation eines krumm berandeten Gebiets; Randstreifen Sh =
∪{ST } schraffiert.
Satz 3.3 (FEM auf konvexem Gebiet): Für das Finite-Elemente-Schema (3.1.39) auf einem glatt berandeten, konvexen Gebiet Ω gelten die a-priori Konvergenzabschätzungen
k∇eh k ≤ (ci +cΩ )cs h kf k,
keh k ≤
(ci +cΩ )2 c2s h2 kf k,
(3.1.40)
(3.1.41)
mit Stabilitäts- und Interpolationskonstanten cs , ci und einer Konstante cΩ .
Beweis: (i) Sei Ih u ∈ Vh die natürliche Knoteninterpolierende von u , welche auf dem Streifen
Sh = Ω \ Ωh zu Null gesetzt wird. Für diese gilt wieder auf jeder Zelle T ∈ Th (wird später
gezeigt werden)
k∇(u − Ih u)kT ≤ ci hT k∇2 ukT ,
(3.1.42)
und folglich
k∇(u − Ih u)kΩh ≤ ci hk∇2 ukΩh .
Mit Hilfe der Approximationsbeziehung (3.1.26) ergibt sich somit
k∇eh k2Ω ≤ c2i h2 k∇2 uk2Ωh + k∇uk2Sh .
(3.1.43)
Es bleibt, das Integral über den Randstreifen Sh zu behandeln.
(ii) Für ein glatt berandetes Gebiet (d.h.: ∂Ω ist C 2 -parametrisiert.) ist nun |Sh | = O(h2 ) .
Um dies zu sehen, nehmen wir an, daß der Randabschnitt ∂ΩT , welcher durch Γ von ∂Ω
abgetrennt wird, als Graph einer Funktion ψ(s) der Bogenlänge über Γ aufgefaßt werden kann.
Diese nehme ihr Maximum ψ0 für s = s0 an, so daß
(ψ − ψ0 )(s0 ) = 0,
(ψ − ψ0 )′ (s0 ) = 0.
88
Finite-Elemente-Verfahren für elliptische Probleme
Durch Taylor-Entwicklung von ψ − ψ0 um s0 ergibt sich dann
max |ψ(s)| = max |ψ(s) − ψ0 | ≤ δ :=
Γ
Γ
1
2
max |ψ ′′ | h2T .
Γ
Folglich ist |Sh | ≤ ch2 . Damit ist bewiesen, daß
k∇eh kΩ ≤ chkukH 2,p .
(3.1.44)
(iii) Zur Abschätzung des Integrals über Sh gehen wir ähnlich vor wie beim Beweis der Poincaréschen Ungleichung. Sei T ∈ Th ein Randdreieck und ST der zugehörige Teilabschnitt des
Randstreifens Sh , welcher von der Kante Γ von T begrenzt ist. O.B.d.A. sei angenommen,
daß ein Rechteck QT mit Γ als kurzer Seite und Länge L > 0 (unabhängig von h ) ganz in Ω
enthalten ist (siehe Abb. 3.6).
Abbildung 3.6: Schema der Randapproximation
Sei nun weiter v ∈ C 1 (Ω) beliebig. Es bezeichne nΓ (x) den bzgl. Sh nach innen gerichteten
Normaleneinheitsvektor zu Γ im Punkt x ∈ Γ mit Parameterwert s . Damit gilt für 0 ≤ t ≤ δ :
Z t
∂r v(x + rnΓ (x)) dr,
v(x + tnΓ (x)) = v(x) +
0
bzw.
2
2
|v(x + tnΓ (x))| ≤ 2|v(x)| + 2δ
Z
ψ(s)
0
|∇v(x + rnΓ (x))|2 dr.
Wir integrieren dies zunächst über 0 ≤ t ≤ ψ(s) ≤ δ (Man beachte, daß für x ∈ Γ gilt
x + ψ(s)nΓ (x) ∈ ∂ΩT .),
Z
ψ(s)
0
2
2
|v(x + tnΓ (x))| dt ≤ 2δ|v(x)| + 2δ
2
Z
ψ(s)
0
und dann über x ∈ Γ und erhalten
Z
Z
Z
2
2
2
|v(x)| dx ≤ 2δ |v(x)| ds + 2δ
Γ
ST
|∇v(x + rnΓ (x))|2 dr,
ST
|∇v(x)|2 dx.
Für das Randintegral rechts erhalten wir mit Hilfe der Spurabschätzung
Z
|v(x)|2 ds ≤ cΩ kvk2H 1 (QT )
Γ
3.1 Allgemeine Projektionsverfahren
89
mit einer von maxΓ |ψ ′ | abhängigen Konstante cΩ . Damit gewinnen wir schließlich die Abschätzung
Z
(3.1.45)
|v(x)|2 dx ≤ cΩ h2 kvk2H 1 (Ω) ,
Sh
mit einer generischen Konstante cΩ . Durch das übliche Stetigkeitsargument überträgt sich diese
Abschätzung auf alle Funktionen v ∈ H 1 (Ω) .
Wir wenden die Abschätzung (3.1.45) nun für die Funktion |∇u| ∈ H 1 (Ω) an und erhalten
k∇uk2Sh ≤ cΩ h2 kuk2H 2 ,
so daß sich mit (3.1.43) schließlich das erste gewünschte Resultat ergibt:
k∇ek ≤ ci hk∇2 uk + cΩ hkukH 2 ≤ (ci +cΩ )cs h kf k.
(3.1.46)
Zur Abschätzung des L2 -Fehlers wird wieder ein Dualitätsargument verwendet. Sei z ∈ H01 (Ω)∩
H 2 (Ω) die Lösung des Hilfsproblems
−∆z = kek−1 e
in Ω,
z|∂Ω = 0.
Wie im Fall eines Polygongebiets argumentieren wir nun wie folgt:
kek = (∇e, ∇z) = (∇e, ∇(z − Ih z)) ≤ k∇ek k∇(z − Ih z)k.
Mit Hilfe der Interpolationsabschätzung (3.1.42) sowie der Randstreifenabschätzung (3.1.45) für
v := |∇z| folgt weiter
kek ≤ k∇ek ci hk∇2 zk + cΩ hkzkH 2 ≤ (ci +cΩ )hk∇ek kzkH 2 .
Hiermit folgt dann unter Verwendung des ersten Resultats (3.1.46) sowie der a-priori Schranke
kzkH 2 ≤ cs auch die zweite gewünschte Ungleichung
kek ≤ (ci +cΩ )2 c2s h2 kf k.
Dies vervollständigt den Beweis.
(3.1.47)
Q.E.D.
ii) Der nicht-konvexe Fall“: Sei Ω ⊂ R2 ein glatt berandetes, aber nicht notwendig konvexes
”
Gebiet. Dieses sei wieder überdeckt durch
S eine reguläre Triangulierung Th = {T } , so daß alle
Eckpunkte des Polygongebiets Ωh := {T ∈ Th } auf dem Rand ∂Ω liegen (siehe Abb. 3.7).
Die Länge der Polygonkanten von ∂Ωh ist dann durch die GitterweiteSh der Triangulierung
Th beschränkt. Ist Ω nicht konvex, so ist Ωh 6⊂ Ω . Der auf Ωh = {T ∈ Th } definierte
(1)
Finite-Elemente-Raum Vh ist dann auch nicht in V enthalten, und die Approximation wird
nicht-konform“ (bzgl. V = H01 (Ω) ) genannt. Die Analyse dieser Approximation gestaltet sich
”
technisch etwas schwieriger als im konformen Fall. Doch auch hierfür kann man Konvergenz mit
der optimalen Ordnung beweisen.
90
Finite-Elemente-Verfahren für elliptische Probleme
Abbildung 3.7: Approximation nicht-konvexer Randteile
Satz 3.4 (FEM auf nicht-konvexem Gebiet): Für das Finite-Elemente-Schema (3.1.39) auf
einem glatt berandeten, nicht-notwendig konvexen Gebiet Ω gelten die a-priori Konvergenzabschätzungen
k∇eh kΩ ≤ (ci +cΩ )cs hkf kΩ
keh kΩ ≤
(ci +cΩ )2 c2s h2 kf kΩ ,
(3.1.48)
(3.1.49)
mit Stabilitäts- und Interpolationskonstanten cs , ci und einer Konstante cΩ .
Beweis: Der Beweis wird in einer späteren Version dieses Skriptums gegeben werden. Q.E.D.
3.2 Allgemeine Finite-Elemente-Ansätze
91
3.2 Allgemeine Finite-Elemente-Ansätze
Wir wollen nun Finite-Elemente-Ansatzräume allgemeineren Typs konstruieren und Fragen der
praktischen Realisierung der Methode diskutieren. Zunächst wird Ω als ein Polygongebiet (Polyeder in 3-D) angenommen. Seien Th Zerlegungen von Ω in Dreiecke oder Vierecke (Tetraeder
oder Hexaeder in 3-D), welche den im vorigen Abschnitt formulierten Bedingungen genügen. Für
die folgenden Konstruktionen von Finite-Elemente-Ansätzen verwenden wir die Bezeichnungen
n
o
n
o
X
X
Pr := p(x) =
cij xi1 xj2 , Qr := q(x) =
cij xi1 xj2 ,
0≤i+j≤r
0≤i,j≤r
für Polynom-Vektorräume im R2 (analog für solche im R3 ). Wir verwenden die Bezeichnungen
Th = {T } Zerlegung von Ω,
∂Th = {Γ} Menge aller Kanten (bzw. Flächen),
∂ 2 Th = {a}
Menge aller Eckpunkte ( Knoten“),
”
sowie die folgende Symbolik für einige typische Knotenwertevorgaben:
Abbildung 3.8: Funktionswerte vh (a) sowie vh (a), ∇vh (a) (links), Normalableitung ∂n vh (m)
in Seitenmitten (Mitte), Funktionswerte vh (a), ∇vh (a), ∇2 vh (a) (rechts).
Ein Finite-Elemente-Ansatz ist definiert durch Vorgabe eines Polynomraumes P (T ) ⊂ Pr (T )
oder P (T ) ⊂ Qr (T ) auf T ∈ Th sowie eines geeigneten Satzes von Knotenwerten“ (gegeben
”
durch lineare Knotenfunktionale“), z.B.:
”
{vh (a), vh (m), ∂n vh (m), ∇vh (a), (vh , 1)Γ , (vh , 1)T , . . . },
welcher Polynome aus P (T ) eindeutig bestimmt.
Definition 3.1 (Unisolvenz): Ein Polynomraum P (T ) und ein zugehöriger Satz von linearen
Knotenfunktionalen“ K(T ) heißen unisolvent“, wenn jedes p ∈ P (T ) eindeutig durch die
”
”
Vorgabe von χ(p) für alle χ ∈ K(T ) bestimmt ist.
Definition 3.2 (Lagrange- und Hermite-Ansatz): Man spricht bei einem FE-Ansatz P (T )
mit zugehörigem Satz von Knotenfunktionalen {χr , r = 1, ..., R} von Lagrange-Elementen“,
”
wenn die Knotenfunktionale nur auf Funktionswerte zurückgreifen; werden auch Ableitungswerte
verwendet, spricht man von Hermite10 -Elementen“.
”
10
Charles Hermite (1822-1901): französischer Mathematiker; Prof. an der École Polytechnique und der Sorbonne
in Paris; Beiträge zur Zahlentheorie und zur Theorie elliptischer Funktionen; Beweis der Transzendenz von e .
92
Finite-Elemente-Verfahren für elliptische Probleme
Notwendig für Unisolvenz ist offenbar dim P (T ) = #K(T ) und hinreichend, daß für ein p ∈
P (T ) aus χ(p) = 0 für alle χ ∈ K(T ) notwendig p ≡ 0 folgt. Dies wird in der Regel zum
Nachweis von Unisolvenz verwendet.
Definition 3.3 (Interpolation): Für jede Zelle T ∈ Th sei ein Polynomraum P (T ) mit
Dimension R und ein Satz KT = {χr , r = 1, ..., R} von Knotenfunktionalen
χr : H m (T ) → R
(r = 1, ..., R),
spezifiziert, welche unisolvent“ sind. Durch die Vorgabe
”
χr (Ih v) = χr (v),
r = 1, . . . , R,
ist dann eindeutig eine Finite-Elemente-Interpolierende“ Ih v ∈ P (T ) definiert.
”
Durch Zusammensetzen der zunächst zellweise definierten Formfunktionen vT ∈ P (T ) erhält
man global definierte Funktionen
vh : Ω → R,
vh|T := vT ,
T ∈ Th ,
mit denen der Finite-Elemente-Ansatzraum Vh gebildet wird. Durch Gleichsetzen geeigneter
Knotenwerte auf dem gemeinsamen Rand Γ = T ∩T ′ jeweils benachbarter Zellen wird Stetigkeit,
Differenzierbarkeit und auf analogem Wege auch die Randbedingung vh|∂Ω = 0 implementiert.
Die Dimension des endlich dimensionalen Teilraumes Vh ⊂ V ist dann gleich der Anzahl der
Knotenfunktionalwerte zur eindeutigen Festlegung einer Funktion vh ∈ Vh .
Definition 3.4 (Konformität): Ein Finite-Elemente-Ansatzraum Vh dieser Art heißt H01 ”
konform“, wenn Vh ⊂ H01 (Ω), und andernfalls nicht-konform“.
”
A) Dreieckselemente im R2 : Als erstes betrachten wir Finite-Elemente-Ansätze auf Triangulierungen von Polygongebieten.
1) Konstanter Ansatz: P (T ) = P0 , dim P (T ) = 1 .
Mit konstanten Polynomansätzen kann offensichtlich für die Variationsgleichung (3.1.2) keine
konforme Diskretisierung gewonnen werden. Diese spielen aber bei anderen Typen von variationellen Formulierungen, den sog. dual-gemischten“, eine Rolle
”
2) Linearer Ansatz: P (T ) = P1 , dim P (T ) = 3 .
Der Polynomraum P1 (T ) und der Satz von Knotenfunktionalen {χi (p) = p(ai ), i = 1, 2, 3} sind
unisolvent, denn für p ∈ P1 (T ) mit p(ai ) = 0 gilt notwendig p|∂T ≡ 0 und damit auch p ≡ 0 .
Mit dem Ansatz
(1)
Vh
= {vh : Ω → R| vh|T ∈ P1 , vh stetig in Eckpunkten, vh = 0 in Eckpunkten auf ∂Ω}.
erhält man einen H01 -konformen Finite-Elemente-Raum. Denn der Sprung von [vh ] über eine
gemeinsame Kante Γ zweier Dreiecke T1 und T2 ist in P1 (Γ) . Folglich ist vh stetig, da seine
Restriktionen auf T1 und T2 gemeinsame Werte in den beiden Endpunkten von Γ haben.
3.2 Allgemeine Finite-Elemente-Ansätze
93
Einen nicht-konformen Ansatz erhält man durch
(1)
Ṽh
= {vh : Ω → R| vh|T ∈ P1 , vh stetig in Kantenmitten, vh = 0 in Kantenmitten auf ∂Ω}.
Die Unisolvenz folgt analog wie die des entsprechenden konformen Ansatzes. Dieses nichtkonforme lineare“ Element spielt z. B. eine Rolle bei der Diskretisierung der Navier-Stokes”
Gleichungen in der Strömungsmechanik.
3) Quadratischer Ansatz: P (T ) = P2 , dim P (T ) = 6 .
Der Polynomraum P2 (T ) und der Satz von Knotenfunktionalen {χi (p) = p(ai ), ψi (p) = p(mi ),
i = 1, 2, 3} sind unisolvent. Für p ∈ P2 (T ) mit p(ai ) = p(mi ) = 0 gilt notwendig p|∂T ≡ 0 .
Dies impliziert, daß ∇p(ai ) = 0 , woraus wegen ∂i p ∈ P1 (T ) wiederum ∇p ≡ 0 und schließlich
p ≡ 0 folgt. Mit dem Ansatz
(2)
Vh
= {vh : Ω → R| vh|T ∈ P2 , vh stetig in Eckpunkten und Kantenmitten,
vh = 0 in solchen Punkten auf ∂Ω}.
erhält man einen H01 -konformen Finite-Elemente-Raum. Denn der Sprung von [vh ] über eine
gemeinsame Kante Γ zweier Dreiecke T1 und T2 ist in P2 (Γ) . Folglich ist vh stetig, da seine
Restriktionen auf T1 und T2 gemeinsame Werte in den beiden Endpunkten und dem Mittelpunkt von Γ haben.
R Alternativ zu den Werten in den Kantenmitten m kann man auch die
−1
Mittelwerte |Γ|
Γ vh ds über Kanten Γ ∈ ∂Th als Knotenwerte verwenden.
Der nicht-konforme Ansatz
(2)
Ṽh
= {vh : Ω → R| vh|T ∈ P2 , vh stetig in jeweils zwei Gauß-Punkten auf Kanten,
vh = 0 in solchen Punkten auf ∂Ω}
ist nicht unisolvent, denn es existieren nicht-triviale, stückweise quadratische Funktionen, welche in allen Knotenpunkten verschwinden. Man betrachte dazu auf jeder Kante die LegendrePolynomen L2 zweiten Grades, deren Nullstellen gerade die beiden Gauß-Punkte m1 , m2 sind.
Sie können wegen ihrer Symmetrie zum Kantenmittelpunkt so normiert werden, daß sie in den
Eckpunkten a gleiche Werte L2 (a) = 1 haben. Dann läßt sich eine Funktion L ∈ P2 (T ) finden,
durch konforme Interpolation in Eckpunkten und Seitenmitten: L(a) = 1 , L(m) = L2 (m) . Auf
jeder Kante ist dann L ≡ L2 , so daß sich ein Widerspruch zur Unisolvenz des Ansatzes ergibt.
Eine weitere nicht-konforme Variante des quadratischen Elements (das sog. Morley11 -Platten”
element“) erhält man bei Wahl der Knotenwerte {vh (a), ∂n vh (m)} . Dieser Ansatz ist wieder
unisolvent. Für p ∈ P2 (T ) folgt aus p(ai ) = ∂n p(mi ) = 0, i = 1, 2, 3 , notwendig ∂τ p(mi ) = 0
und somit ∇p(mi ) = 0 . Wegen ∂i p ∈ P1 (T ) folgt ∇p ≡ 0 und damit auch p ≡ 0 .
11
L.S.D. Morley (????-????): englischer Ingenieur; Forscher an der Brunel University in Uxbridge, England;
Beiträge zur FEM für nichtlineare Schalenmodelle.
94
Finite-Elemente-Verfahren für elliptische Probleme
Das Morley-Element ist zwar nicht-konform bzgl. der H 1 - wie auch der H 2 -Norm, trotzdem
kann es bei geeigneter Modifikation der variationellen Formulierungen,
X
uh ∈ VhM :
(∇2 uh , ∇2 ϕh )T = (f, ϕh ) ∀ϕh ∈ VhM ,
T ∈Th
sogar zur Approximation des biharmonischen Operators ∆2 u = f verwendet werden.
5) Kubischer Ansatz (sog. kubisches Membran-Element“: P (T ) = P3 , dim P (T ) = 10 .
”
Mit dem Ansatz
(3)
Vh
={vh : Ω → R| vh|T ∈ P3 , vh stetig in Eckpunkten und in je
zwei Gauß-Punkten auf Kanten, vh = 0 in solchen Punkten auf ∂Th }.
ist H01 -konform. Denn der Sprung von [vh ] über eine gemeinsame Kante Γ zweier Dreiecke T1
und T2 ist in P3 (Γ) . Folglich ist vh stetig, da seine Restriktionen auf T1 und T2 gemeinsame
Werte in den beiden Endpunkten und zwei Gauß-Punkten auf Γ haben. Alternativ zu den GaußPunkten auf den Kanten kann man auch in jedem Knoten die beiden partiellen Ableitungen,
d.h. den Gradienten ∇vh (a) , als Knotenwerte verwenden. Auch damit erhält man einen H01 (3)
(3)
konformen Ansatzraum V̂h ; dieser ist offenbar echt kleiner als Vh (Übungsaufgabe).
Zur Diskretisierung der biharmonischen Gleichung kann man wieder eine nicht-konforme Variante mit den Knotenwerten {vh (a), ∂n vh (m1 ), ∂n vh (m2 ), vh (z)} ( m1 , m2 zwei Gauß-Punkte
auf Γ und z der Mittelpunkt von T ) verwenden. Ein H 2 -konformes Platten-Element erhält
man durch den sog. Clough-Tocher-Ansatz“ als zusammengesetztes“ Element ( vh ∈ C 1 (T )
”
”
stückweise kubisch).
6) Quartischer Ansatz: P (T ) = P4 (T ) , dim P (T ) = 15 .
Mit dem Satz von Knotenwerten {vh (a), ∇vh (a), vh (m1 ), vh (m2 )} (m1 , m2 die beiden GaußPunkte auf jeder Kante Γ ∈ ∂Th ) erhält man hier einen H 1 -konformen Ansatz (Übungsaufgabe).
3.2 Allgemeine Finite-Elemente-Ansätze
95
7) Quintischer Ansatz (sog. Argyris12 -Plattenelement“): P (T ) = P5 (T ) , dim P (T ) = 21 .
”
Mit dem Satz von Knotenwerten {vh (a), ∇vh (a), ∇2 vh (a), ∂n vh (m)} erhält man hier sogar einen
H 2 -konformen Ansatz (Übungsaufgabe). Dieses finite Element ist ein Beispiel für einen konformen Ansatz zur Lösung der biharmonischen Gleichung ∆2 u = f , für welche stetig differenzierbare Übergänge von Zelle zu Zelle erforderlich sind.
B) Viereckselemente: Als nächstes betrachten wir Finite-Elemente-Ansätze auf (kartesischen)
Rechteckszerlegungen.
1) Bi-linearer Ansatz: P (T ) = Q1 = span{1, x1 , x2 , x1 x2 } , dim P (T ) = 4 . Der Polynomraum
Q1 (T ) und der Satz von Knotenfunktionalewn {χi (p) = p(ai ), i = 1, . . . , 4} sind unisolvent. Ein
p ∈ Q1 (T ) ist entlang der Kanten von T linear. Aus p(ai ) = 0 folgt also p|∂T ≡ 0 und weiter
∇p(ai ) = 0 . Wegen ∂i p ∈ P1 (T ) impliziert dies ∇p ≡ 0 und schließlich p ≡ 0 . Der Ansatz
(1)
Vh
= {vh : Ω → R| vh|T ∈ Q1 , vh stetig in Eckpunkten, vh = 0 in Eckpunkten auf ∂Ω}
ist H01 -konform, da die Sprünge von vh entlang von Kanten linear sind.
Der naheliegende nicht-konforme Ansatz
(1)
Ṽh
= {vh : Ω → R| vh|T ∈ Q1 , vh stetig in Kantenmitten, vh = 0 in Kantenmitten auf ∂Ω}
ist aber i.a. nicht unisolvent, da z.B. die Funktion vh (x1 , x2 ) = x1 x2 in den Kantenmitten
des Quadrats T1 = [−1, 1] × [−1, 1] verschwindet. Auf T1 erhält man aber durch P (T ) =
span{1, x1 , x2 , x21 − x22 } einen mit den Kantenmitten als Knotenfunktionale unisolventen Ansatz. RAlternativ zu den Funktionswerten in den Seitenmitten kann man auch die Mittelwerte
(1)
|Γ|−1 Γ vh ds über die Kanten als Knotenwerte verwenden. Dies ergibt aber einen von Ṽh
verschiedenen Ansatzraum.
2) Bi-quadratischer Ansatz: P (T ) = Q2 = span{1, x1 , x2 , x21 , x1 x2 , x22 , x21 x2 , x1 x22 , x21 x22 } ,
dim P (T ) = 9 . Die Konstruktion eines zulässigen“ Satzes von Knotenwerten ist Übung.
”
3) Reduzierter bi-quadratischer Ansatz (sog. Wilson13 -Membran-Element“):
”
P (T ) = P2 (T ) ⊕ span{x21 x2 , x1 x22 } , dim P (T ) = 8 . Dieser Ansatz wird mit den Knotenwerten
12
John Argyris (1916-2004): deutscher Bauingenieur; Prof. in Stuttgart; einer der Erfinder“ der Finite”
Elemente-Methode.
13
E.L. Wilson (????-????): amerikanischer Ingenieur; Publ.: K. Bathe, E.L Wilson: Numerical Methods in Finite
Element Analysis, Prentice-Hall, New Jersey, 1976.
96
Finite-Elemente-Verfahren für elliptische Probleme
{vh (a), vh (m)} H 1 -konform.
4) Bi-kubischer Ansatz: P (T ) = Q3 = span{1, x1 , x2 , x21 , ..., x31 x32 } , dim P (T ) = 16 .
Die Konstruktion eines zulässigen“ Satzes von Knotenwerten wird als Übung gestellt.
”
5) Reduzierter bi-kubischer Ansatz (sog. Adini14 -Platten-Element“):
”
P (T ) = P3 (T ) ⊕ span{x31 x2 , x1 x32 } , dim P (T ) = 12 . Dieser Ansatz wird mit den Knotenwerten
{vh (a), ∇vh (a)} unisolvent und H 1 -konform, ist aber nicht H 2 -konform.
Viele der aufgeführten zwei-dimensionalen Finite-Elemente-Ansätzen haben natürliche Erweiterungen auf drei Dimensionen. Die gebräuchlichsten Beispiele sind:
1) Lineares Tetraederelement: P (T ) = span{1, x1 , x2 , x3 }, dim P (T ) = 4 . Mit den Funktionswerten in den Eckpunkten als Knotenwerte ist dieser Ansatz unisolvent und H 1 -konform.
2) Nicht-konf., lineares Tetraederelement: P (T ) = span{1, x1 , x2 , x3 }, dim P (T ) = 4 .
Mit den Funktionswerten in den Flächenmitten als Knotenwerte ist dieser Ansatz unisolvent,
aber nicht-konform.
3) Quadratisches Tetraederelement: P (T ) = span{1, x1 , x2 , x3 , x1 x2 , x1 x3 , x2 x3 , x21 , x22 , x23 } ,
dim P (T ) = 10 . Mit den Funktionswerten in den Ecken und den Kantenmitten als Knotenwerte
ist dieser Ansatz unisolvent und H 1 -konform.
4) Kubisches Tetraederelement: P (T ) = P3 , dim P (T ) = 20 .
Mit den Funktionswerten in den Ecken, in zwei Gauß-Punkten auf den Kanten und in den
Seitenmitten als Knotenwerte ist dieser Ansatz unisolvent und H 1 -konform.
14
A. Adini (????-????): ????
3.2 Allgemeine Finite-Elemente-Ansätze
97
5) Tri-lineares Quaderelement: P (T ) = span{1, x1 , x2 , x3 , x1 x2 , x1 x3 , x2 x3 , x1 x2 x3 },
dim P (T ) = 8 . Mit den Funktionswerten in den Eckpunkten als Knotenwerte ist dieser Ansatz
unisolvent und H 1 -konform.
Ein zugehöriges nicht-konformes Quaderelement erhält man durch den Ansatz
P (T ) = span{1, x1 , x2 , x3 , x21 − x22 , x21 − x23 }, dim P (T ) = 6 . Mit den Funktionswerten in den
Flächenmitten als Knotenwerte ist dieser Ansatz unisolvent.
6) Tri-quadratisches Quaderelement: P (T ) = span{1, x1 , x2 , x3 , ..., x21 x22 x23 },
dim P (T ) = 27 . Mit den Funktionswerten in den Eckpunkten, den Kantenmitten, den Seitenmitten und dem Mittelpunkt als Knotenwerte ist dieser Ansatz unisolvent und H 1 -konform.
In allgemeinen Situationen können die Zellen bzgl. des Koordinatensystems gedreht oder
gezerrt werden. Daraus folgt, daß es Fälle gibt, in denen man für zwei Zellen der Zerlegung
Th nicht denselben Ansatz nehmen kann (z.B. das bi-lineare Viereckselement). Deshalb müssen
wir uns bei der Definition von Finite-Elemente-Ansätzen von dem festen Koordinatensystem
befreien. Dies induziert die Idee des Referenzelements“. Wir verwenden als Referenzelement
”
ein natürliches Einheitselement T̂ (Einheitsdreieck, Einheitsviereck, ...) und definieren zunächst
einen Polynomansatz P̂ (T̂ ) auf diesem Referenzelement.
Sei σT eine (polynomiale) Transformation des Referenzelements auf das ( physikalische“)
”
Element mit der Inversen σT−1 : T → T̂ . Der Ansatz auf der Zelle T ist dann gegeben durch
P (T ) := {vh : T → R| vh (σT (·)) ∈ P̂ (T̂ )}.
(3.2.50)
Der Funktionenraum P (T ) ist nicht notwendig ein Raum von Polynomen, auch wenn P̂ (T̂ ) ein
solcher ist. Dies liegt daran, daß im Allg. die inverse Abbildung σT−1 und damit die Funktion
vh (x) = vh (σ(σ −1 (·))) nicht polynomial ist, z.B. im Fall (echt) bilinearer Abbildungen σT .
Wenn man T aus T̂ durch eine Verschiebung, eine Rotation, eine Scherung und eine Skalierung
gewinnen kann, so ist σT eine affin-lineare Transformation:
σT (x̂) = BT x̂ + bT
mit einer Matrix BT ∈ Rd×d und einem Verschiebungsvektor bT ∈ Rd . Dies ist möglich bei
Dreiecken (in 2-D) bzw. Tetraedern (in 3-D) sowie bei Parallelogrammen (in 2-D) bzw. Parallelepipeden (in 3-D). Für allgemeine (konvexe) Vierecke (in 2-D) oder Hexaeder (in 3-D) benötigt
man für die Transformation echt bi- bzw. tri-lineare Abbildungen.
Wir gehen nun zum allgemeinen d-dimensionalen Fall über und betrachten Zerlegungen Th =
98
Finite-Elemente-Verfahren für elliptische Probleme
{T } eines Gebiets Ω ⊂ Rd in d-Simplizes. Dabei ist ein (nicht degeneriertes) Simplex T ⊂ Rd
die konvexe lineare Hülle von d + 1 linear unabhängigen Punkten ai ∈ Rd , i = 0, ..., d:
n
d
T = x∈R |x=
d
X
i
λi a ,
d
X
i=0
i=0
o
λi = 1, 0 ≤ λi ≤ 1 .
(3.2.51)
Das System {ai , i = 0, ..., d} heißt linear unabhängig, wenn die erzeugenden Vektoren {wi =
ai − a0 , i = 1, ..., n} eine Basis des Rd bilden. Die einfachsten Beispiele sind wieder Dreiecke für
d = 2 und Tetraeder für d = 3 . Sei T̂ das Einheitssimplex im Rd , welches von den Punkten
e0 := 0 , ei = (δ1i , ..., δdi )T , i = 1, ..., d , aufgespannt wird.
Hilfssatz 3.2 (Referenztransformation): Jedes (nicht degenerierte) Simplex T ⊂ Rd läßt
sich mittels einer umkehrbaren affinen Abbildung
x = σT (x̂) := BT x̂ + bT ,
BT ∈ Rd×d , bT ∈ Rd ,
(3.2.52)
aus dem Einheitssimplex T̂ gewinnen: T = BT T̂ + bT . Dabei ist die Umkehrabbildung gegeben
durch x̂ = σT−1 (x) = BT−1 x−BT−1 bT .
Beweis: Wir lassen im folgenden den Zusatz T weg. Sei A ∈ Rd×d die reguläre Matrix, welche
die Basis {wi = ai − a0 , i = 1, ..., d} auf die kartesische Einheitsbasis {ei , i = 1, ..., d} abbildet:
ei = Awi , i = 1, ..., d . Man gewinnt ihre Elemente aνµ als Lösungen der Gleichungssysteme
n
X
aνµ wµi = eiν ,
i = 1, ..., d ,
µ=1
für ν = 1, ..., d. Die Koeffizientenmatrix (wµi )di,µ=1 enthält die linear unabhängigen Vektoren
wi , i = 1, ..., d, als Zeilenvektoren und ist folglich regulär. Die affine Abbildung x̂ = Ax − Aa0
ist
Pd Simplex T auf das Einheitssimplex T̂ ab, denn für x =
Pddann iumkehrbar und bildet das
λ
a
∈
T
ist
(Man
beachte
i=1 λi = 1 .)
i=0 i
Ax − Aa0 =
und umgekehrt für x̂ =
A−1 x̂ + a0 =
Pd
d
X
i=0
i
i=0 λi e
d
X
i=0
λi A(ai − a0 ) =
d
X
λi ei ∈ T̂ ,
d
X
λi ai + (1 −
i=0
∈ T̂
λi A−1 ei + a0 =
d
X
i=0
λi wi + a0 =
i=0
Dies komplettiert den Beweis mit BT := A−1 und bT := a0 .
d
X
i=1
λi )a0 ∈ T .
Q.E.D.
Bemerkung 3.5: Zu Hilfssatz 3.2 gibt es ein Analogon für Vierecks-Zerlegungen im R2 sowie
Hexaeder-Zerlegungen im R3 . Zu jedem konvexen Viereck T ∈ R2 oder Hexaeder T ∈ R3
( 6-Flächner“) existieren bi- bzw. tri-lineare Abbildungen σT : T̂ → T des Einheitsquadrats
”
bzw. Einheitswürfels T̂ auf T . Dabei werden die Eckpunkte von T̂ auf die Eckpunkte von T
sowie die Kanten bzw. Seitenflächen von T̂ auf die Kanten bzw. Seitenflächen von T abgebildet
(jeweils in derselben Orientierung).
3.2 Allgemeine Finite-Elemente-Ansätze
99
Die Erzeugung von Finite-Elemente-Ansätzen über Transformation von einem Referenzelement hat auch den Zweck, auf allgemeinen Vierecks- oder Hexaeder-Zerlegungen konforme
Ansätze zu gewinnen. Wir wollen das anhand des bilinearen Ansatzes diskutieren:
(1)
Vh
= {vh : Ω → R| vh|T ∈ Q1 , vh stetig in Knoten, vh = 0 in Knoten auf ∂Ω}.
Wir betrachten allgemeine Vierecke T und T ′ , die eine gemeinsame Kante Γ haben, und setzen
P (T ) = P1 ⊕ span{x1 x2 }. Der Sprung von vh ist zwar gleich Null in den Endpunkten von Γ ,
doch ist er im Allg. nicht linear auf Γ , so daß die Stetigkeit über Γ nicht gesichert ist. Hierfür
(1)
muß erreicht werden, daß die Restriktion von vh ∈ Vh auf alle Kanten Γ ∈ ∂Th linear ist.
(1)
Dies kann durch Konstruktion von Vh mit Hilfe der bilinearen Transformationen σT : T̂ → T
erreicht werden.
Für eine bi-lineare Transformation σT : T̂ → T ist die Inverse σT−1 : T → T̂ i.a. nicht bi-linear.
In diesem Fall ist der gemäß (3.2.50) erzeugte lokale Ansatzraum P (T ) auch kein Polynomraum.
Dennoch ist v|Γ auf jeder Kante Γ ∈ ∂Th linear, so daß Stetigkeit in allen Eckpunkten auch
automatisch globale Stetigkeit auf Ω sowie v|∂Ω = 0 garantiert. Dieser Transformationsansatz
löst also das Problem der globalen Stetigkeit.
Definition 3.5 (Parametrischer Ansatz): Der Ansatz P (T ) wird parametrisch“ genannt,
”
wenn er durch Transformationen σT : T̂ → T von einem Referenzelement T̂ erzeugt wird. Er
heißt isoparametrisch“, wenn die Transformation σT vom selben Polynomtyp wie die Ansatz”
funktionen in P̂ (T̂ ) ist.
Der Begriff des isoparametrischen“ Finite-Element-Ansatzes läßt sich auf höheren Polynomgrad
”
r ≥ 2 übertragen. Dies wird wichtig bei der Approximation eines krummen Randes bei Verwendung von Ansätzen höherer Ordnung. (siehe Bild mit quadratischer“ Randapproximitation).
”
Die einfache Polygonzugapproximation würde hier zu einer Ordnungsreduktion führen:
k∇(u − uh )k ≤ c hr kukr + hkuk2 ,
im Gegensatz zur optimalen Abschätzung
k∇(u − uh )k ≤ chr kukr .
Abbildung 3.9: Parametrische Randapproximation
100
Finite-Elemente-Verfahren für elliptische Probleme
3.3 Interpolation mit finiten Elementen
Dieser Abschnitt ist dem grundlegenden Aspekt bei der mathematischen Analyse der Methode
der finiten Elemente gewidmet: Wie gut lassen sich hinreichend glatte Funktionen durch stückweise polynomiale approximieren? Wir gehen von der im vorigen Abschnitt anhand von Beispielen beschriebenen abstrakten Situation aus. Sei T ⊂ Rd eine Zelle eines Finite-Elemente-Gitters
Th ; der Durchmesser von T wird wieder mit diam(T ) = hT und der Radius einer (maximalen)
einbeschriebenen Kugel mit ρT bezeichnet.
Wir betrachten im folgenden ausschließlich parametrische“ Finite-Elemente-Ansätze. Jedes
”
T ∈ Th sei Bild eines Referenz-Einheitselements“ T̂ ⊂ Rd mit Durchmesser diam(T̂ ) = ĥ ≈ 1
”
und Inkugelradius ρ̂ > 0. Die zugehörigen Abbildungen σT : T̂ → T seien der Einfachheit halber
als affin-linear angenommen:
BT ∈ Rd×d , bT ∈ Rd .
x = σT (x̂) = BT x̂ + bT ,
(3.3.53)
Der Fall allgemeiner Vierecke mit erzeugenden bilinearen Transformationen wird gegebenenfalls
in Bemerkungen berücksichtigt werden.
Allgemeine Interpolationsaufgabe: Auf einem beliebigen, aber festen Element T (z.B. dem
Einheitselement T̂ ) seien ein Vektorraum P (T ) von Polynomen über T mit dim P (T ) = R
sowie ein System von linearen Knotenfunktionalen“ KT = {χr , r = 1, ..., R} gegeben, so daß
”
die folgenden Bedingungen erfüllt sind:
(i) Der Ansatz ist unisolvent:
q ∈ P (T ) : χr (q) = 0 (r = 1, ..., R)
⇒
q = 0.
(3.3.54)
(ii) Für ein m ≥ 1 gilt Pm−1 ⊂ P (T ) .
(iii) Die Knotenfunktionale aus KT sind stetig auf H m (T ) :
|χr (v)| ≤ cb kvkm;T ,
v ∈ H m (T ), r = 1, ..., R.
(3.3.55)
Unter der Bedingung (i) ist die zugehörige Lagrangesche bzw. Hermitesche Interpolationsaufgabe eindeutig lösbar, d.h: Zu jeder Funktion v ∈ H m (T ) existiert ein eindeutig bestimmtes
Interpolationspolynom“ IT v ∈ P (T ) mit den Eigenschaften
”
χr (IT v) = χr (v),
r = 1, ..., R.
Wenn die Knotenfunktionale zu singulär“ sind, um für Funktionen aus H m (Ω) definiert zu
”
sein (z.B. die Ableitung ∂nm−1 v(m) in einer Seitenmitte m ∈ ∂T ), kann auch ein stärkerer
Sobolew-Raum H m,p (Ω) mit p > d verwendet werden. Wir werden diesen Fall hier aber nicht
weiter verfolgen.
Notation: Im folgenden verwenden wir eine gebräuchliche Multiindex“-Schreibweise für mehr”
fach indizierte Größen. Für einen Indexvektor α = (α1 , ..., αd )T ∈ Zd mit ganzzahligen, nichtnegativen Komponenten setzen wir
|α| :=
d
X
i=1
αi ,
xα :=
d
Y
i=1
xαi i ,
Dα :=
d
Y
i=1
∂iαi ,
o
n
X
Pk = q(x) =
aα xα .
|α|≤k
3.3 Interpolation mit finiten Elementen
101
Mit dieser Notation schreiben sich z.B. die Sobolew-Normen bzw. -Halbnormen über T in der
Form
1/2
1/2
X
X
.
kD α vk2T
, |v|m;T =
kD α vk2T
kvkm;T =
|α|=m
0≤|α|≤m
Wir leiten nun eine Reihe von technischen Hilfssätzen ab, die am Schluß zu den gewünschten allgemeinen Abschätzungen für den Interpolationsfehler bei Finite-Elemente-Ansätze führen
werden. Die dabei verwendete Schlußweise geht in diesem Zusammenhang auf Bramble und
Hilbert (1971) zurück, weswegen die ganze Theorie auch Bramble-Hilbert-Theorie“ und das
”
Hauptresultat Bramble-Hilbert-Lemma“ genannt werden.
”
Hilfssatz 3.3 (Nullraum von Ableitungsoperatoren): Jede Funktion v ∈ H m (T ) mit der
Eigenschaft
Dα v = 0 ,
|α| = m,
(3.3.56)
ist fast überall gleich einem Polynom aus Pm−1 (T ) .
T
k
Beweis: Aus den Voraussetzungen folgt D β D α v ≡ 0 für beliebiges β und somit v ∈ ∞
k=1 H (T ) .
m
Nach dem Sobolewschen Einbettungssatz ist damit v ∈ C (T ), so daß sich die Behauptung mit
Hilfe klassischer“ Argumente ergibt.
Q.E.D.
”
Hilfssatz 3.4 (Polynomprojektion): Zu jeder Funktion v ∈ H m (T ) existiert ein eindeutig
bestimmtes Polynom q ∈ Pm−1 (T ) mit der Eigenschaft
Z
Dα (v − q) dx = 0 , 0 ≤ |α| ≤ m − 1 .
(3.3.57)
T
Beweis: Zur Lösung der Aufgabe machen wir den Ansatz
X
q(x) :=
ξ β xβ ∈ Pm−1 (T )
|β|≤m−1
mit unbekannten Koeffizienten ξ = (ξ β )|β|≤m−1 (bei lexikographischer Anordnung der Indexkomponenten). Dies führt auf das quadratische, lineare Gleichungssystem
Z
Z
X
β
α β
D α v dx , 0 ≤ |α| ≤ m − 1.
ξ
D x dx =
T
T
0≤|β|≤m−1
Dessen Koeffizientenmatrix
M=
Z
Dα xβ dx
T
0≤|α|,|β|≤m−1
ist regulär. Andernfalls gäbe es ein ξ = (ξ β )|β|≤m−1 6= 0 mit M ξ = 0 . Das damit gebildete
P
Polynom q(x) = 0≤|β|≤m−1 ξ β xβ ∈ Pm−1 (T ) hätte dann die Eigenschaft
Z
Dα q dx = 0 ,
T
0 ≤ |α| ≤ m − 1 ,
(3.3.58)
102
Finite-Elemente-Verfahren für elliptische Probleme
woraus offensichtlich q ≡ 0 und damit der Widerspruch ξ ≡ 0 folgte. Also existiert ein eindeutig
bestimmtes Polynom mit den verlangten Eigenschaften.
Q.E.D.
Hilfssatz 3.5 (Verallg. Poincarésche Ungleichung): Für jede Funktion v ∈ H m (T ) mit
der Eigenschaft
Z
D α v dx = 0 , 0 ≤ |α| ≤ m − 1 ,
(3.3.59)
T
gilt mit einer Konstante c0 = c(d, m, T )
kvkm;T ≤ c0 |v|m;T .
(3.3.60)
Beweis: Angenommen, die Behauptung wäre falsch. Dann existierte eine Folge von Funktionen
vk ∈ H m (T ) , k ∈ N mit den Eigenschaften
1 = kvk km;T ≥ k|vk |m;T ,
k ∈ N.
(3.3.61)
Aufgrund der Kompaktheit der Einbettung von H m (T ) in H m−1 (T ) konvergiert eine Teilfolge,
welche wir wieder mit (vk )k∈N bezeichnen, in H m−1 (T ) gegen ein v ∈ H m−1 (T ):
kvk − vkm−1;T → 0 (k → ∞).
(3.3.62)
Mit der Annahme folgt |vk |m;T → 0 (k → ∞) . Also ist (vk )k∈N Cauchy-Folge in H m (Ω) mit
Limes ṽ ∈ H m (T ) . Wegen vk →H m−1 v muß ṽ = v sein. Damit folgt |v|m;T = 0. Nach Hilfssatz
3.3 ist also v ∈ Pm−1 (T ) und besitzt die Eigenschaft
Z
Z
α
D α vk dx = 0 , 0 ≤ |α| ≤ m − 1 .
(3.3.63)
D v dx = lim
T
k→∞ T
Dies bedeutet aber wegen Hilfssatz 3.4 notwendig v ≡ 0, was im Widerspruch zur Annahme
kvkm;T = limk→∞ kvk km;T = 1 steht.
Q.E.D.
Nach diesen Vorbereitungen können wir das zentrale Resultat dieses Abschnitts, das sog.
Bramble15 -Hilbert16 -Lemma, beweisen.
Satz 3.5 (Bramble-Hilbert-Lemma): Sei F (·) : H m (T ) → R ein beschränktes, sublineares
Funktional, welches auf Pm−1 (T ) verschwindet, d.h.:
(i)
(ii)
(iii)
15
|F (v)| ≤ c1 kvkm;T
(Beschränktkeit),
|F (u + v)| ≤ c2 {|F (u)| + |F (v)|}
F (q) = 0,
q ∈ Pm−1 (T )
(Sublinearität),
(Annulierungseigenschaft).
James H. Bramble (1932-): US-amerikanischer Mathematiker: Prof. an der Cornell University und der Texas
A&M University; fundamentale Beiträge zur Theorie der Finite-Elemente-Methode und von Iterationsverfahren,
insbesondere Mehrgitterverfahrens.
16
Stephen Hilbert (????-): US-amerikanischer Mathematiker: Prof. am Ithaca College, New York; bekannt durch
das sog. “Bramble-Hilbert-Lemma”.
3.3 Interpolation mit finiten Elementen
103
Dann gilt mit der Konstante c0 aus Hilfssatz 3.5:
|F (v)| ≤ c0 c1 c2 |v|m;T ,
v ∈ H m (T ).
(3.3.64)
Beweis: Für ein v ∈ H m (T ) gilt mit beliebigem q ∈ Pm−1 (T ) :
|F (v)| = |F (v − q + q)| ≤ c2 {|F (v − q)| + |F (q)|} ≤ c1 c2 kv − qkm;T .
Wir wählen nun q ∈ Pm−1 (T ) als das gemäß Hilfssatz 3.4 zu v gehörende Polynom, so daß
gemäß Hilfssatz 3.5 folgt:
kv − qkm;T ≤ c0 |v − q|m;T = c0 |v|m;T .
Dies impliziert dann
|F (v)| ≤ c3 |v|m;T ,
mit c3 := c0 c1 c2 , was zu beweisen war.
Q.E.D.
Korollar 3.1 (Allg. Interpolationssatz): Seien die obigen Voraussetzungen erfüllt. Für jede
Funktion v ∈ H m (T ) und das zugehörige interpolierende Polynom IT v ∈ P (T ) gilt bzgl. einer
beliebigen stetigen Halbnorm | · | auf H m (T ):
|v − IT v| ≤ c |v|m;T
(3.3.65)
mit einer Konstante c = c(d, m, R, T, | · |).
Beweis: O.B.d.A. sei |v| ≤ kvkm;T , v ∈ H m (T ) . Durch F (v) := |v − IT v| wird auf H m (T ) ein
sublineares Funktional definiert. Die Interpolierende IT v besitzt die Darstellung
IT v =
R
X
χr (v)ϕ(r)
r=1
mit der durch die Bedingung χr (ϕ(s) ) = δrs , (r, s = 1, ..., R) eindeutig bestimmten verallgemeinerten Lagrange-Basis {ϕ(r) , r = 1, ..., R} des Polynomraums P (T ) . Wegen der Beschränktheit
der Knotenfunktionale χr folgt
|F (v)| ≤ |v| + |IT v| ≤ |v| +
R
X
r=1
|χr (v)| |ϕ(r) | ≤ (1 + Rcb max |ϕ(r) |) kvkm;T ,
r=1,...,R
und damit die Beschränktheit von F (·) . Wegen IT q = q für q ∈ P (T ) gilt weiter
F (q) = 0,
q ∈ Pm (T ).
Aus Satz 3.5 folgt damit die behauptete Abschätzung.
Q.E.D.
Beispiele von Halbnormen, für die das obige Resultat angewendet wird, sind etwa:
1. L2 -Norm über T :
|v − IT v| :=
Z
T
|v − IT v|2 dx
1/2
.
104
Finite-Elemente-Verfahren für elliptische Probleme
2. L2 -Norm über den Rand ∂T :
|v − IT v| :=
Z
∂T
|v − IT v|2 dx
1/2
.
3. Mittelwert über eine Kante Γ ⊂ ∂T :
Z
|v − IT v| := (v − IT v) dx .
Γ
4. Maximum-Norm über T :
|v − IT v| := max |v − IT v|.
T
5. Wert in einem Punkt P ∈ Ω :
|v − IT v| := |(v − IT v)(P )|.
Als nächstes greifen wir nun unser eigentliches Problem an, nämlich den Interpolationsfehler
auf den einzelnen Zellen T der Zerlegung Th abzuschätzen. Wir tun dies für den representativen
Spezialfall der klassischen Lagrange/Hermite-Interpolation, bei der die Knotenfunktionale χr
als Punktfunktionale für Funktionswerte sowie Ableitungswerte in gewissen Knotenpunkten âr ∈
T̂ (r = 1, ..., R) gegeben sind.
Sei T̂ das Referenzelement der Größe ĥ := diam(T̂ ) = 1 und Inkreisradius ρ̂ > 0 . Für eine
einzelne Zelle T ∈ Th bezeichnen wir mit ar = Bâr + b die aus den Stützstellen âr ∈ T̂ durch
Anwendung der Transformation σ(x̂) = B x̂ + b erzeugten Punkte ar ∈ T . Entsprechend seien
hT := diam(T ) sowie ρT > 0 der Inkreisradius von T . Die Umkehrabbildung σ −1 : T → T̂
(−1)
hat die Darstellung σ −1 (x) = B −1 x − B −1 b mit der inversen Matrix B −1 = (bij )di,j=1 . Unter
Verwendung dieser Abbildung x = σ(x̂) werden für Funktionen v : T → R und ŵ : T̂ → R
zugehörige Funktionen v̂ : T̂ → R und w : T → R definiert durch
v̂(x̂) := v(x),
w(x) := ŵ(x̂).
(3.3.66)
Entsprechend lassen sich die partiellen Ableitungen nach x̂ und x durch die jeweils anderen
ausdrücken:
d
d
X
X
(−1)
bij ∂ˆj .
bij ∂j , ∂i :=
∂ˆi :=
j=1
j=1
Wir nehmen an, daß der Polynomansatz P̂ (T̂ ) unisolvent ist mit einem Satz von Knotenfunktionalen der Form D̂r v̂(âr ), r = 1, ..., R , wobei die Punkte âr auch mehrfach auftreten können und
r
die Ableitungsoperatoren die Gestalt D̂r = ∂ˆα mit geeigneten Multiindizes αr = (αri , ..., αrd )
haben. Der Ansatzraum P̂ (T̂ ) habe die Lagrange-Basis {ϕ̂r , r = 1, . . . , R} , d.h.:
D̂r ϕˆs (âr ) = δrs .
Wir nehmen weiter an, daß alle auftretenden Ableitungen D̂r auf H m (T̂ ) wohl definiert und
stetig sind:
|D̂r v̂(âr )| ≤ c kv̂km;T̂ , v̂ ∈ H m (T̂ ).
Die lokalen Polynomräume P (T ) werden wieder erzeugt via Koordinatentransformation aus
3.3 Interpolation mit finiten Elementen
105
dem Ansatzraum P̂ (T̂ ) auf dem Referenzelement:
P (T ) := {q : T → R| q(σ(·)) ∈ P̂ (T̂ )}.
Dasselbe gilt für die zugehörigen Basen {ϕ(r) , r = 1, ..., R} von P (T )
ϕr (x) := ϕ̂r (σ −1 (x)) ,
x ∈ T.
Für Funktionen v ∈ H m (Ω) erhält man dann durch Setzung
IT v :=
R
X
s=1
D̂s v̂(âs )ϕs ∈ P (T )
eine zellweise Lagrange/Hermite-Interpolierende IT v ∈ P (T ) mit den Eigenschaften (Man beachte D̂r ϕ̂s (âr ) = δrs .):
D̂r IT v(ar ) =
R
X
D̂s v̂(âs )D̂r ϕs (ar ) =
s=1
R
X
D̂s v̂(âs )D̂r ϕ̂s (âr )
s=1
= D̂r v̂(âr ) = D̂r v(ar ),
r = 1, ..., R.
Je nach Art der Ableitungsoperatoren D̂r läßt sich dies gegebenenfalls auch als eine Interpolation mit lokal auf den Einzelzellen T definierten Ableitungsoperatoren Dr bzgl. der (physikalischen) Variablen x ausdrücken; z.B. in den einfachsten Fällen Dr v(ar ) := v(ar ) bzw.
Dr v(ar ) ≈ ∇v(ar ) .
Wir beweisen nun den Hauptsatz dieses Abschnittes zur Lagrange/Hermite-Interpolation.
Satz 3.6 (Spez. Interpolationssatz): Für jedes v ∈ H m (T ) und die zugehörige LagrangeHermite-Interpolierende IT v ∈ P (T ) auf der Zelle T ∈ Th gilt:
|v − IT v|k;T ≤ cI
hm
T
|v|m;T ,
ρkT
0 ≤ k ≤ m,
(3.3.67)
mit Durchmesser und Inkreisradius hT bzw. ρT von T und einer Konstante cI = cI (d, m, T̂ ) .
Beweis: (i) Für eine Funktion f ∈ L1 (T ) bezeichnet fˆ ∈ L1 (T̂ ) die zugehörige Transformierte
fˆ(x̂) := f (x),
x̂ = σ −1 (x) = B −1 x − B −1 b ∈ T̂ .
Die Transformation σ −1 hat die Funktionalmatrix ∇σ −1 = B −1 , so daß gilt:
Z
Z
Z
f (x) dx .
fˆ(x̂) dx̂ = | det B −1 | fˆ(σ −1 (x)) dx = | det B|−1
T̂
T
(3.3.68)
(3.3.69)
T
(−1)
Wir schätzen nun die Elemente bij sowie bij
der Matrizen B und B −1 ab. Jedes x ∈ Rd
mit |x| = ρ gestattet mit zwei Punkten ξ, η ∈ T die Darstellung x = ξ − η, wobei ξ etwa
als Mittelpunkt der Inkugel von T gewählt werden kann. Dann sind ξ̂ = B −1 ξ − B −1 b, η̂ =
B −1 η − B −1 b ∈ T̂ , und wir erhalten
|B −1 x| = |B −1 ξ − B −1 b − B −1 η + B −1 b| = |ξ̂ − η̂| ≤ ĥ.
(3.3.70)
106
Finite-Elemente-Verfahren für elliptische Probleme
Da alle Matrizennormen auf Rd×d äquivalent sind, gilt mit einer Konstante c = c(d)
max
(−1)
i,j=1,...,d
|bij
| ≤ c sup
x∈Rd
|B −1 x|
|B −1 x|
ĥ
= c sup
≤c .
|x|
|x|
ρ
|x|=ρ
(3.3.71)
Analog wird bewiesen:
max
i,j=1,...,d
|bij | ≤ c
h
.
ρ̂
(3.3.72)
(ii) Es seien nun T ∈ Th sowie v ∈ H m (T ) beliebig gegeben. Es ist IT v ∈ P (T ) die Interpolierende von v auf T und
IT̂ v̂(·) = IT v(σ(·)) ∈ P (T̂ )
(3.3.73)
die Interpolierende der Transformierten v̂ ∈ H m (T̂ ) auf T̂ . Nach Satz 3.1 gilt auf T̂ :
|v̂ − IT̂ v̂|k;T̂ ≤ ĉ |v̂|m;T̂ ,
0 ≤ k ≤ m,
(3.3.74)
mit einer festen Konstante ĉ = ĉ(d, m, T̂ ) . Durch Koordinatentransformation zwischen T̂ und
T werden wir nun zeigen, daß
|v − IT v|k;T ≤
c
| det B|1/2 |v̂ − IT̂ v̂|k;T̂ ,
ρk
|v̂|m;T̂ ≤ c hm | det B|−1/2 |v|m;T ,
mit Konstanten c = c(d, m, T̂ ). Diese beiden Beziehungen ergeben dann zusammen mit (3.3.74)
die Behauptung.
(iii) Für die Ableitungen von v bzw. v̂ gilt mit x̂ = σ −1 (x) = B −1 x − B −1 b :
−1
∂c
i v(x̂) = ∂i v(x) = ∂i v̂(σ (x)) =
∂ˆi v̂(x̂) = ∂ˆi v(σ(x̂)) =
d
X
d
X
∂ˆj v̂(x̂) ∂i σj−1 (x) =
d
X
j=1
j=1
∂j v(x) ∂ˆi σj (x̂) =
d
X
∂j v(x)bji =
d
X
j=1
j=1
j=1
(−1)
∂ˆj v̂(x̂) bji ,
und folglich
|∂c
i v(x̂)| ≤ c
ĥ
max |∂ˆj v̂(x̂)|
ρ j=1,...,d
|∂ˆi v̂(x̂)| ≤ c
d
∂j v(x̂)bji ,
h
max |d
∂j v(x̂)|.
ρ̂ j=1,...,d
Für allgemeine Ableitungen Dα bzw. D̂α der Ordnung k = |α| gewinnen wir durch k-malige
Anwendung dieser Beziehungen:
α v(x̂)| ≤ c
d
|D
|D̂ α v̂(x̂)| ≤ c
(−1) |α|
|bij
max
d
β v(x̂)| ≤ c
|bij ||α| max |D
i,j=1,...,d
i,j=1,...,d
|
max |D̂ β v̂(x̂)| ≤ c
max
|β|=|α|
|β|=|α|
ĥ |α|
ρ
h |α|
ρ̂
max |D̂β v̂(x̂)|,
|β|=|α|
d
β v(x̂)| .
max |D
|β|=|α|
3.3 Interpolation mit finiten Elementen
107
Mit Hilfe dieser Abschätzungen und der Substitutionsformel (3.3.69) folgt nun
Z
Z
α
2
α v(x̂)|2 dx̂
d
|D v(x)| dx = | det B| |D
T
T̂
Z
ĥ 2|α|
≤ c | det B|
max
|D̂ β v̂(x̂)|2 dx̂
ρ
|β|=|α| T̂
Z
Z
h 2|α|
α
2
d
β v(x̂)|2 dx̂
max
|D
|D̂ v̂(x̂)| dx̂ ≤ c
ρ̂
|β|=|α| T̂
T̂
Z
h 2|α|
|D β v(x)|2 dx .
≤ c | det B|−1
max
ρ̂
|β|=|α| T
Damit ist für 0 ≤ k ≤ m bewiesen:
|v|k;T ≤ c | det B|1/2
ĥ k
ρ
|v̂|k;T̂ ,
|v̂|k;T ≤ c | det B|−1/2
h k
ρ̂
|v|k;T .
Anwendung dieser Beziehungen für v und v − IT v ergibt schließlich wegen 0 < ρ ≤ h ≤ 1 die
behauptete Abschätzungen (3.3.67).
Q.E.D.
Bemerkung 3.6: Die Fehlerabschätzung (3.3.67) für die Polynominterpolation hat natürliche
Verallgemeinerungen auf andere Halbnormen | · |T sowie auf andere Regularitätsstufen v ∈
H m,p (T ) , 1 ≤ p ≤ ∞ . Wir geben ohne Beweis das folgende allgemeine Resultat an:
m−d/p
|v − IT v|k,q;T ≤ ci
hT
k−d/q
ρT
|v|m,p;T ,
(3.3.75)
für 0 ≤ k ≤ m, 1 ≤ p ≤ q ≤ ∞ , mit einer Konstante ci = ci (d, k, m, p, q, Tˆ) . Für spätere
Zwecke sind hiervon insbesondere die Fälle p = q = 1 (für m ≥ 2) , p = q = ∞ sowie
p = 2, q = ∞ (für k ≤ m + 2) von Interesse. Z.B. gilt für d = 2, m = 2, q = ∞, p = 2 :
max |v − IT v| ≤ ci hT |v|2,2;T .
T
(3.3.76)
Auf ähnliche Art wie im Beweis von Satz 3.6 gewinnt man durch Transformation auf das
Einheitselement T̂ die folgende sog. inverse Beziehung“ für finite Elemente:
”
Satz 3.7 (Inverse Beziehung): Unter den obigen Voraussetzungen gilt auf jeder Zelle T ∈
Th für Finite-Elemente-Funktionen v ∈ P (T ) mit einer Konstante c = c(d, ρT , k, s):
|v|k;T ≤ c
hsT
|v|s;T ,
ρkT
0 ≤ s ≤ k ≤ m.
(3.3.77)
Beweis: Für Polynome q̂ ∈ P (T̂ ) gilt wegen der Äquivalenz von Normen auf dem (endlich
dimensionalen) Quotientenraum P (T )/Pk−1 (T ) mit einer Konstante ĉ = ĉ(d, m, T̂ ) :
|q̂|k;T̂ ≤ ĉ |q̂|s;T̂ ,
0 ≤ s ≤ k ≤ m.
Die Behauptung ergibt sich nun wieder durch Transformation auf die Zelle T .
(3.3.78)
Q.E.D.
108
Finite-Elemente-Verfahren für elliptische Probleme
Bemerkung 3.7: Analoge Abschätzungen wie die in Satz 3.6 und Satz 3.7 gelten auch für
Tensorprodukt-Polynomansätze auf Vierecken bzw. Hexaedern.
Wir wollen diese Resultate auf die obigen konkreten Beispiele anwenden. In diesen sind alle
formulierten Bedingungen erfüllt. Insbesondere gilt die uniform shape“ Bedingung
”
hT
sup max
≤ c.
T
∈T
h ρT
h>0
(m−1)
Dann folgt aus Satz 3.6 für die FE-Ansatzräume Vh
die Interpolationsfehlerabschätzungen
|v|m;T ,
|v − IT v|k;T ≤ c hm−k
T
⊂ H01 (Ω) vom Polynomgrad m−1 ∈ N0
k = 0, ..., m, T ∈ Th ,
(3.3.79)
mit Konstanten c = c(d, m, T̂ ). Manchmal möchte man den Interpolationsfehler auch über den
Rand der Zelle oder punktweise abschätzen. Hierfür gilt
m−1/2
k∇2 vkm;T ,
(3.3.80)
k∇2 vkm;T .
max |v − IT v| ≤ chm−1
T
(3.3.81)
kv − IT vk∂T ≤ chT
und z.B. in zwei Dimensionen
x∈T
Als Folgerung aus diesem lokalen Abschätzungen erhalten wir die folgenden globale Approximationsabschätzungen
|v − Ih v|k ≤ c hm−k |v|m ,
k = 0, ..., m.
(3.3.82)
ku − Ih uk + hk∇(u − Ih u)k ≤ ch2 k∇2 uk.
(3.3.83)
Für lineare“ finite Elemente gilt also speziell
”
In diesem Fall ergibt die inverse“ Beziehung (3.3.77):
”
k∇vh k ≤ h−1 kvh k,
(1)
vh ∈ Vh .
(3.3.84)
Entsprechend gilt für quadratische“ finite Elemente
”
ku − Ih uk + hk∇(u − Ih u)k ≤ ch3 k∇3 uk,
(3.3.85)
und
k∇2 vh k ≤ h−2 kvh k,
(2)
vh ∈ Vh .
(3.3.86)
Damit ist jetzt die theoretische Grundlage für die a priori Fehlerabschätzungen für das GalerkinFinite-Elemente-Verfahren aus Satz 3.1 geschaffen.
3.4 A priori Fehleranalyse
109
3.4 A priori Fehleranalyse
Die in Abschnitt 3.3 hergeleiteten Abschätzungen für den Fehler bei der Interpolation mit
stückweise polynomialen Funktionen sind die Basis für die a priori Fehleranalyse des FiniteElemente-Verfahrens. Wir formulieren die folgende Verallgemeinerung von Satz 3.1 für FEApproximationen allgemeiner Ordnung m ≥ 2 ,
(∇uh , ∇ϕh ) = (f, ϕh )
∀ϕh ∈ Vh ,
(3.4.87)
der Poisson-Gleichung. Dabei ist die sog. Ordnung“ eines FE-Verfahrens im wesentlichen durch
”
den Polynomgrad der verwendeten Ansatzfunktionen bestimmt, d.h. durch die Beziehung Pm−1 ⊂
P (T ) für alle T ∈ Th .
Korollar 3.2 (Allg. FE-Konvergenz): Für den Fehler eh := u−uh einer FE-Methode mit
Ansatzräumen Vh ⊂ H01 (Ω) der Ordnung m ≥ 2 zur Approximation der Poisson-Gleichung gilt
die a priori Fehlerabschätzung:
keh k + hk∇eh k ≤ c hm k∇m uk .
(3.4.88)
Wir wollen eine Schwäche dieses Resultats nicht unerwähnt lassen. Im allgemeinen sind Lösungen u ∈ H01 (Ω) elliptischer Gleichungen zweiter Ordnung über Gebieten mit Polygonrand nicht
aus H m (Ω) für m ≥ 3. An den Ecken von ∂Ω treten starke Singularitäten der Ableitungen von
u auf. Die obige Voraussetzung u ∈ H m (Ω) ist also für m > 2 unrealistisch. Finite Elemente
höherer Ordnung m > 2 können jedoch bei Gebieten mit hinreichend glattem Rand ∂Ω erfolgreich verwendet werden, denn in diesem Fall kann die Regularitätstheorie meist u ∈ H m (Ω)
sichern. Dabei sind aber besondere Maßnahmen, wie z. B. die Verwendung isoparametrischer
Ansätze, zur Approximation entlang des krummen Randes erforderlich.
Wir haben gesehen, daß der Fehler z.B. bei linearen“ finiten Elementen gemessen in der L2 ”
Norm eine verbesserte Konvergenzordnung O(h2 ) gegenüber der von O(h) in der Energie-Norm
zuläßt. Es stellt sich die Frage, ob man durch weitere Abschwächung der Norm vielleicht noch
höhere Konvergenzordnungen erzielen kann. Diese Hoffnung wird zunächst bestärkt durch die
Beobachtung, daß dies für die L2 -Projektion durchaus der Fall ist. Die in Frage kommenden Normen werden illustrativ als negative“ Sobolew-Normen bezeichnet und sind in den einfachsten
”
Fällen definiert durch
kvk−1 := sup
ϕ∈V
(v, ϕ)
,
kϕk1
kvk−2 :=
sup
ϕ∈V
∩H 2 (Ω)
(v, ϕ)
.
kϕk2
wobei wieder V := H01 (Ω) .
(1)
Hilfssatz 3.6 (L2 -Projektion): Für die L2 -Projektion Ph : V → Vh auf den Raum Vh
linearen“ finiten Elemente gilt die Fehlerabschätzungen
”
ku − Ph uk−2 + hku − Ph uk−1 + h2 ku − Ph uk ≤ ch4 k∇2 uk .
der
(3.4.89)
Beweis: Zunächst rekapitulieren wir die übliche Bestapproximationseigenschaft“ der L2 -Projektion:
”
ku − Ph uk = min ku − ϕh k .
(1)
ϕh ∈Vh
(3.4.90)
110
Finite-Elemente-Verfahren für elliptische Probleme
Daraus folgt mit der lokalen Interpolationsabschätzung (3.3.79) die Beziehung
ku − Ph uk ≤ ch2 k∇2 uk .
(3.4.91)
Mit einem beliebigen ϕ ∈ H01 (Ω) gilt entsprechend für k ∈ {1, 2} :
(u − Ph u, ϕ) = (u − Ph u, ϕ − Ph ϕ)
≤ ku − Ph uk kϕ − Ph ϕk
≤ ch2+k k∇2 uk k∇k ϕk .
Dies impliziert
(u − Ph , ϕ)
≤ ch2+k k∇2 uk ,
kϕk
k
ϕ∈H 1 (Ω)∩H k (Ω)
sup
0
was zu beweisen war.
Q.E.D.
Der Beweis von Hilfssatz 3.6 zeigt, daß eine weitere Erhöhung jenseits O(h4 ) der Approximati(1)
onsordnung der L2 -Projektion auf den Ansatzraum Vh auch in einer noch schwächeren Norm
(1)
nicht mehr möglich ist. Für die Ritz-Projektion“ Rh : V → Vh ist in diesem Fall sogar O(h2 )
”
die Obergrenze für die erreichbare Ordnung. Dies zeigt der folgende Satz.
(1)
Satz 3.8 (Ritz-Projektion): Für die Ritz-Projektion Rh : V → Vh
linearen“ finiten Elemente gilt die Abschätzung
”
ku − Rh uk−1 ≥ c(f ) k∇(u − Rh u)k2 ,
auf den Raum der
(3.4.92)
mit einer positiven Konstante c(f ) > 0 .
Beweis: Sei f ∈ H01 (Ω) . Für die Lösung u ∈ V der Gleichung −∆u = f gilt unter Ausnutzung
der Galerkin-Orthogonalität“:
”
(u − Rh u, f ) = (∇(u − Rh u), ∇u) = k∇(u − Rh u)k2 .
Wegen
sup
ϕ∈V
(u − Rh u, ϕ)
(u − Rh u, f )
≥
kϕk1
kf k1
impliziert dies die Behauptung.
Q.E.D.
Da die Energie-Fehlerabschätzung
k∇(u − Rh u)k ≤ ch k∇2 uk
bzgl. der Ordnung bestmöglich ist, folgt aus (3.4.92) die Unmöglichkeit einer Fehlerabschätzung
mit einer Ordnung größer als zwei für lineare“ finite Elemente.
”
3.4.1 Punktweise Fehlerabschätzung
In den vorangegangenen Abschnitten haben wir gesehen, daß die Methode der finiten Elemente
als Projektionsmethode zunächst ganz natürlich zu a priori Abschätzungen in der Energienorm“
”
3.4 A priori Fehleranalyse
111
k∇ek und dann über ein Dualitätsargument auch zu verbesserten Abschätzungen in der L2 Norm kek führt. Diese Konvergenzaussagen im quadratischen Mittel“ gestatten aber noch
”
keinen unmittelbaren Schluß auf die punktweise Konvergenz des Verfahrens. Dieser Frage soll
jetzt wieder anhand des einfachen Modellproblems Poisson-Gleichung“,
”
−∆u = f in Ω,
u = 0 auf ∂Ω,
(3.4.93)
auf einem (konvexen) Polygongebiet Ω ⊂ R2 nachgegangen werden. Wir beschränken uns da(1)
bei auf die Approximation (3.4.87) mit stückweise linearen Ansätzen Vh ⊂ V auf regulären
Triangulierungen. Wir rekapitulieren hierfür die a priori Fehlerabschätzung
kek + hk∇ek ≤ ch2 k∇2 uk ,
(3.4.94)
wobei die Konstante c wesentlich durch die Konstante in der Interpolationsfehlerabschätzung
k∇(u − Ih u)kT ≤ ci h k∇2 ukT ,
T ∈ Th ,
(3.4.95)
bestimmt ist. Wir erinnern daran, daß im vorliegenden Fall eines konvexen Grundgebiets jedes
v ∈ V mit ∆v ∈ L2 (Ω) automatisch in H 2 (Ω) ist und der a priori Abschätzung genügt:
k∇2 vk ≤ k∆vk.
(3.4.96)
Satz 3.9 (Sub-optimale L∞ -Norm-Fehlerabschätzung): Unter den obigen Voraussetzungen konvergiert die Methode der finiten Elemente punktweise mit der Ordnung O(h) :
max |e| ≤ chk∇2 uk .
(3.4.97)
Ω
(1)
Beweis: Sei T ein beliebiges Dreieck aus Th . Für eine Funktion vh ∈ Vh
Z
−1
max |vh | ≤ c|T |
|vh | dx.
T
gilt dann
(3.4.98)
T
Dies folgt leicht mit Hilfe der Transformation auf die Referenzzelle T̂ ( dx ≈ |T |dx̂ ) und der
dort geltenden Beziehung (Äquivalenz von Normen)
Z
max |v̂h | ≤ ĉ |v̂h | dx̂.
T̂
T̂
(1)
Mit der Knoteninterpolierenden Ih u ∈ Vh
zu u ∈ V ∩ H 2 (Ω) gilt
max |u − Ih u| ≤ chT k∇2 ukT .
T
Damit erschließen wir dann
max |e| ≤ max |u − Ih u| + max |Ih e|
T
T
T
Z
≤ max |u − Ih u| + c|T |−1
|Ih e| dx
T
T
Z
−1
≤ max |u − Ih u| + c|T |
|e| dx ≤ chT k∇2 ukT + ch−1
T kekT .
T
T
(3.4.99)
112
Finite-Elemente-Verfahren für elliptische Probleme
Mit Hilfe der L2 -Fehlerabschätzung (3.4.94) folgt also die Behauptung.
Q.E.D.
Bemerkung 3.8: Unter der bloßen Annahme u ∈ V ∩H 2 (Ω) ist die Fehlerabschätzung (3.4.97)
bzgl. der h-Potenz optimal. Um dies einzusehen, betrachte man z.B. auf dem Einheitskreis
B1 = {x ∈ R2 | |x| < 1} die Funktionen
uh (x) := (|x|2 + h4 )1/2
Offenbar ist uh ∈ H 2 (B1 ) , und es gilt
Z
1/2
k∇2 uh kB1 ≤ c
(|x|2 + h4 )−1 dx
≤ c | ln(h)|1/2 .
B1
Wir nehmen nun an, daß unser Lösungsgebiet Ω den Kreis B1 enthält und die Funktionen
uh geeignet zu Funktionen ūh ∈ H01 (Ω) ∩ H 2 (Ω) fortgesetzt sind. Ferner gehöre zu jeder der
Triangulierungen Th ein Dreieck T0 mit Durchmesser h und dem Inkreismittelpunkt a0 = 0.
Dann ist in den Eckpunkten ai und dem Mittelpunkt a0 von T0 stets
ūh (ai ) ≥ h,
ūh (a0 ) = h2 .
Würde nun für die Ritz-Projektion ūhh ∈ Vh zu ūh mit einem ε > 0 gelten
max |ūh − ūhh | ≤ ch1+ε k∇2 ūh kΩ ,
T0
so ergäbe sich für hinreichend kleines h im Widerspruch zur Linearität der ūhh auf T0 :
|ūhh (a0 )| ≤ |ūhh (a0 ) − ūh (a0 )| + |ūh (a0 )| ≤ ch1+ε1 ,
0 < ε1 < ε,
|ūhh (ai )| ≥ |ūh (ai )| − |ūh (ai ) − ūhh (ai )| ≥ ch.
Numerische Experimente zeigen, daß im Falle höherer Regularität von u (etwa u ∈ C 2 (Ω))
die optimale Ordnung O(h2 ) des L2 -Fehlers auch für die punktweise Konvergenz vorliegt. Ein
ähnliches Phänomen haben wir bereits bei der Differenzenapproximation mit dem 5-PunkteOperator gesehen, bei dem sich auf gleichförmigen Gittern die Konvergenzordnung O(h) im
Falle u ∈ C 3 (Ω) auf O(h2 ) im Falle u ∈ C 4 (Ω) erhöht. Für die Methode der finiten Elemente
beweisen wir nun das folgende optimale Resultat auf allgemeinen regulären Gittern:
Satz 3.10 (Optimale L∞ -Abschätzung): Im Falle u ∈ V ∩ C 2 (Ω) gilt die Konvergenzabschätzung
sup |e| ≤ ch2 {| ln(h)| + 1} max |∇2 u|.
Ω
Ω
(3.4.100)
Beweis: Wir notieren zunächst die Interpolationsfehlerabschätzung
sup |u − Ih u| + h sup |∇(u − Ih u)| ≤ ch2 sup |∇2 u|
Ω
Ω
(3.4.101)
Ω
I) Für ein h > 0 sei T∗ ∈ Th beliebig, aber fest gewählt. O.B.d.A. wird im folgenden h ≤
(1)
angenommen. Mit der Knoteninterpolierenden Ih u ∈ Vh
1
2
von u gilt wieder (siehe Beweis von
3.4 A priori Fehleranalyse
113
Satz 3.9)
−1
max |e| ≤ c max |u − Ih u| + c|T∗ |
T∗
T∗
≤
ch2T∗
2
−1
max |∇ u| + c|T∗ |
T∗
Z
T∗
|e| dx
T∗
|e| dx.
Z
Damit ist die Abschätzung des L∞ -Fehlers zurückgeführt auf eine lokale L1 -Fehlerabschätzung.
Mit der durch
δh :≡ |T∗ |−1 sign(e) in T∗ , δh :≡ 0 sonst,
definierten Funktion δh ∈ L2 (Ω) ( regularisierte“ Dirac17 -Funktion) gilt weiter
”
Z
−1
|T∗ |
|e| dx = (δh , e).
T∗
II) Im nächsten Schritt wird wieder ein Dualitätsargument verwendet. Wir betrachten das Hilfsproblem
−∆gh = δh in Ω,
gh = 0 auf ∂Ω.
(3.4.102)
Die Funktion gh kann als regularisierte“ Greensche Funktion angesehen werden. Damit erhalten
”
wir
Z
|e| dx = (∇e, ∇gh ).
(3.4.103)
|T∗ |−1
T∗
Unter Verwendung der durch
(1)
(∇ghh , ∇ϕh ) = (∇gh , ∇ϕh ) ∀ϕh ∈ Vh ,
(1)
definierten Ritz-Projektion“ ghh ∈ Vh von gh erhalten wir durch zweimalige Anwendung der
”
Galerkin-Orthogonalität die Beziehung
Z
−1
(3.4.104)
|e| dx = (∇e, ∇(gh − ghh )) = (∇(u − Ih u), ∇(gh − ghh )).
|T∗ |
T∗
Mit der Hölderschen Ungleichung folgt
Z
Z
−1
|∇(gh − ghh )| dx.
|T∗ |
|e| dx ≤ max |∇(u − Ih u)|
T∗
Ω
(3.4.105)
Ω
Unter Beachtung der Interpolationsabschätzung (3.4.101) erhalten wir schließlich die Beziehung
Z
|∇(gh − ghh )| dx max |∇2 u|.
(3.4.106)
max |e| ≤ ch h +
T∗
Ω
Ω
Die punktweise Abschätzung des Fehlers e ist also zurückgeführt auf eine globale L1 -Fehlerabschätzung für den Gradienten der Greenschen Funktion“: ∇(gh − ghh ) . Dieser wird unten
”
17
Paul Adrien Maurice Dirac (1902-1984): französischer Physiker und Mathematiker; Prof. in Cambridge; wichtige Beiträge zur Quanten Mechanik und Kosmologie, 1933 Nobel-Preis.
114
Finite-Elemente-Verfahren für elliptische Probleme
weiter abgeschätzt. Dazu benötigen wir einige a priori Abschätzungen für gh , die im folgenden
bereitgestellt werden.
III) Sei x∗ der Inkreismittelpunkt von T∗ . Wir definieren die Gewichtsfunktion
σ(x) := (|x − x∗ |2 + κ2 h2 )1/2 .
Durch Nachrechnen verifiziert man leicht die Beziehungen ( 0 < h ≤
κh ≤ σ ≤ c,
|∇σ| ≤ c∗ ,
|∇2 σ| ≤ cσ −1 ,
1
2
)
kσ −1 k ≤ c | ln(h)|1/2 ,
mit von h und κ unabhängigen Konstanten. Für die Größen σ̄T := maxT σ und σ T := minT σ
gilt daher
σ̄T ≤ σ T + h max |∇σ| ≤ σ T + c∗ h,
T
und bei Wahl von κ := 2c∗ (unabhängig von h):
σ̄T ≤ σ T + 12 σ̄T ,
und damit
max
T ∈Th
σ̄T
≤ 2.
σT
(3.4.107)
Hilfssatz 3.7 (Greensche Funktion): Für die regularisierte Greensche Funktion“ gh gel”
ten die a priori Abschätzungen
sup |gh | ≤ c | ln(h)|,
(3.4.108)
Ω
k∇gh k + kσ∇2 gh k ≤ c | ln(h)|1/2 ,
2 h
−1
k∇ g k ≤ ch
,
(3.4.109)
(3.4.110)
mit von h ∈ (0, 12 ] unabhängigen Konstanten c.
Beweis: (i) Die richtige“ Greensche Funktion g(·) = g(x∗ , ·) zum Aufpunkt x∗ erlaubt die
”
Abschätzung (Beweis mit Hilfe des Maximumprinzips)
|g(x)| ≤ c {| ln(|x − x∗ |)| + 1} .
Konstruktionsgemäß folgt damit
|gh (x)| = |(∇gh , ∇g)| = |(δh , g)Ω | ≤ ch−2
Z
T∗
|g| dx ≤ c {| ln(h)| + 1} .
Dies impliziert die Abschätzung (3.4.108).
(ii) Zum Beweis von (3.4.110) verwenden wir die übliche a priori L2 /H 2 -Abschätzung
k∇2 gh k ≤ ckδh k ≤ ch−1 .
(iii) Als nächstes notieren wir die einfache a priori Abschätzung
k∇2 gh k ≤ k∆gh k ≤ ch−1 .
(3.4.111)
3.4 A priori Fehleranalyse
115
Weiter gilt
k∇gh k2 = (δh , gh ) ≤ c max |gh | ≤ c | ln(h)|.
Ω
Dies impliziert den ersten Teil der Abschätzung (3.4.109).
(iii) Schließlich setzen wir ξ := x − x∗ und finden wegen
|ξi ∇2 gh | ≤ |∇2 (ξi gh )| + |∇gh |
die Beziehung
kσ∇2 gh k2 =
≤
2
X
i=1
kξi ∇2 gh k2 + κ2 h2 k∇2 gh k2
2 n
X
i=1
o
k∇2 (ξi gh )k2 + k∇gh k2 + κ2 h2 k∇2 gh k2 .
Mit Hilfe der üblichen a priori L2 /H 2 -Abschätzung (3.4.96) folgt
k∇2 (ξi gh )k ≤ k∆(ξi gh )k ≤ kξi ∆gh k + k∇gh k
≤ kξi δh k + k∇gh k ≤ c + c | ln(h)|1/2 .
Die vorausgehenden Abschätzungen implizieren dann
o
n
kσ∇2 gh k ≤ c 1 + | ln(h)|1/2 ,
woraus (3.4.109) folgt. Dies vervollständigt den Beweis von (3.4.109).
Q.E.D.
IV) Wir kehren nun zum Beweis des Satzes zurück und schätzen wie folgt ab:
Z
|∇(gh − ghh )| dx ≤ kσ −1 k kσ∇(gh − ghh )k ≤ c | ln(h)|1/2 kσ∇(gh − ghh )k.
Ω
Durch Ausdifferenzieren folgt weiter
kσ∇(gh − ghh )k2 = (∇(gh − ghh ), ∇(σ 2 (gh − ghh ))) − (∇(gh − ghh ), (gh − ghh )∇σ 2 )
=: E1 − E2 .
Die Terme E1 und E2 werden im folgenden separat abgeschätzt. Im Hinblick auf die GalerkinOrthogonalität gilt
E1 = (∇(gh − ghh ), ∇(σ 2 (gh − ghh ) − ψh ))
(1)
mit der Knoteninterpolierenden ψh := Ih {∇(σ 2 (gh − ghh ))} ∈ Vh . Dies wird weiter abgeschätzt
durch
X
kσ∇(gh − ghh )kT kσ −1 ∇(σ 2 (gh − ghh ) − ψh )kT
E1 ≤
T ∈Th
≤ 14 kσ∇(gh − ghh )k2 + c
X
T ∈Th
kσ −1 ∇(σ 2 (gh − ghh ) − ψh )k2T .
116
Finite-Elemente-Verfahren für elliptische Probleme
Mit Hilfe der Interpolationsfehlerabschätzung (3.4.99) werden die einzelnen Summanden wie
folgt abgeschätzt:
2
2 h
h
kσ −1 ∇(σ 2 (gh − ghh ) − ψh )k2T ≤ σ −2
T k∇(σ (g − gh ) − ψh )kT
Dies ergibt wegen (3.4.107):
E1 ≤
h
1
4 kσ∇(g
2
2 2 h
h
2
≤ c σ −2
T hT k∇ (σ (g − gh ))kT
2
h
h 2
h
h 2
2 2 h 2
≤ c σ −2
T hT kg − gh kT + kσ∇(g − gh )kT + kσ ∇ g kT
2 2
2 h 2
h
h 2
≤ c kgh − ghh k2T + c σ −2
T σ̄T hT k∇(g − gh )kT + kσ∇ g kT .
− ghh )k2 + c kgh − ghh k2 + c h2 k∇(gh − ghh )k2 + kσ∇2 gh k2 .
Die schon bekannten L2 -Fehlerabschätzungen liefern weiter
E1 ≤ 41 kσ∇(gh − ghh )k2 + ch2 h2 k∇2 gh k2 + kσ∇2 gh k2 ,
sowie unter Beachtung der Abschätzungen von Hilfssatz 3.7
E1 ≤ 14 kσ∇(gh − ghh )k2 + ch2 | ln(h)|.
Für den zweiten Term gilt wegen |∇σ 2 | ≤ cσ :
E2 ≤ ckσ∇(gh − ghh )kkgh − ghh k ≤ 14 kσ∇(gh − ghh )k2 + ckgh − ghh k2
sowie mit den Argumenten von eben:
E2 ≤ 41 kσ∇(gh − ghh )k2 + ch2 .
Kombination der Abschätungen für E1 und E2 ergibt schließlich
kσ∇(gh − ghh )k2 ≤ 12 kσ∇(gh − ghh )k2 + ch2 | ln(h)|,
und damit die Behauptung.
Q.E.D.
Der logarithmische Term | ln(h)| in der Abschätzung (3.4.100) läßt sich auf allgemeinen Gittern nicht vermeiden. Dies wird durch numerische Tests und auch durch theoretische Analyse
bestätigt. Auf gleichförmigen Gittern (Je zwei benachbarte Dreiecke bilden ein Parallelogramm.)
erhält man unter der stärkeren Glattheitsbedingung u ∈ C 2+α (Ω) allerdings die optimale Konvergenzordnung O(h2 ). Vergleicht man dieses Resultat mit dem entsprechenden für die Differenzenapproximation mit dem 5-Punkte-Operator, so stellen wir eine deutliche Abschwächung
der Regularitätsanforderungen um fast zwei Stufen fest.
Auf Polygongebieten ist die Bedingung u ∈ H 2,∞ (Ω) für die schwache Lösung von (3.4.93)
im allgemeinen unrealistisch. Bei den Ecken können die zweiten Ableitungen Singularitäten
haben. Auf konvexen Polygongebieten ist gerade die Voraussetzung u ∈ H 2 (Ω) natürlich, d.h.
stets erfüllt, wogegen u ∈ H 2,∞ (Ω1 ) nur auf Teilgebieten Ω′1 ⊂ Ω mit positivem Abstand zu
den Eckpunkten gilt. In diesem Fall haben wir das folgende lokale“ Resultat:
”
Satz 3.11 (Lokales Fehlerverhalten): Sei Ω1 ⊂ Ω ein Teilgebiet mit positivem Abstand δ1
zu den Eckpunkten von Ω und u ∈ H 2 (Ω) ∩ C 2 (Ω1 ). Dann gilt auf jedem zweiten Teilgebiet
3.4 A priori Fehleranalyse
117
Ω2 ⊂ Ω1 mit Abstand δ2 > δ1 zu den Eckpunkten die Fehlerabschätzung
2
2
2
sup |e| ≤ ch | ln(h)| sup |∇ u| + k∇ ukΩ .
Ω2
(3.4.112)
Ω1
Beweis: Der technisch aufwendige Beweis kann im Rahmen dieser Vorlesung nicht geführt
werden.
Q.E.D.
Bemerkung 3.9: Zum Abschluß bemerken wir noch, daß sich für finite Elemente höherer Ordnung (Polynomgrad m − 1 ≥ 2) zu (3.4.100) analoge punktweise Fehlerabschätzungen unter der
Voraussetzung u ∈ C m (Ω) herleiten lassen:
sup |e| ≤ chm sup |∇m u|.
Ω
(3.4.113)
Ω
Bemerkenswerterweise tritt dabei ab Polynomordnung m − 1 = 2 der störende logarithmische
Term | ln(h)| nicht auf. Dasselbe gilt auch für den niedrigsten Ansatzgrad m − 1 = 1 , wenn der
maximale Fehlergradient betrachtet wird:
sup |∇e| ≤ ch sup |∇2 u|.
Ω
Ω
(3.4.114)
118
Finite-Elemente-Verfahren für elliptische Probleme
3.5 Implementierungsaspekte
Im folgenden wollen wir einige Fragen im Zusammenhang mit der praktischen Realisierung von
Finite-Elemente-Methoden diskutieren. Dazu betrachten wir als Modellfall die 1. RWA eines
allgemeineren (elliptischen) Differentialoperators,
Lu := −∇{a∇u} = f
in Ω,
u = 0 auf ∂Ω,
(3.5.115)
mit möglicherweise variablem Koeffizienten a = a(x) ≥ α > 0 auf einem (konvexen) Polygongebiet Ω ⊂ R2 . Die Diskretisierung erfolgt wieder auf Ansatzräumen Vh ⊂ H01 (Ω) zu einer Folge
von (gleichmäßig) regulären Zerlegungen Th = {T } des Grundgebiets Ω ⊂ Rd (d = 2, 3),
a(u, ϕ) = l(ϕ)
∀ϕh ∈ Vh .
(3.5.116)
mit den bilinearen bzw. linearen Formen
a(u, ϕ) := (a∇uh , ∇ϕh ),
l(ϕ) := (f, ϕh ).
Die Aufstellung des zugehörigen linearen Gleichungssystems erfordert in der Regel die Anwendung numerischer Integration, was zu einem zusätzlichen Fehler führt.
3.5.1 Aufbau der Systemmatrizen und Vektoren
Im Gegensatz zu den Differenzenverfahren auf strukturierten Gittern lassen sich die algebraischen Gleichungssysteme der Finite-Elemente-Verfahren auf allgemeinen Zerlegungen Th in der
Regel nicht explizit per Hand“ aufstellen.
”
(n)
Mit der Knotenbasis {ϕh , n = 1, ..., N } des Finite-Elemente-Raumes Vh ⊂ H01 (Ω) sind
N
die Systemmatrizen A = (anm )N
n,m=1 (”Steifigkeitsmatrix“) und M = (mnm )n,m=1 (”MassenN
matrix“) sowie der Lastvektor“ b = (bn )n=1 gebildet gemäß
”
(m)
(n)
anm = a(ϕh , ϕh ),
(m)
(n)
mnm = (ϕh , ϕh ),
(n)
bn = l(ϕh ).
Beide Matrizen sind konstruktionsgemäß symmetrisch und positiv-definit. Ihre größten und
kleinsten Eigenwerte seien λmax (A) , λmin (A) bzw. λmax (M ) , λmin (M ) , und die zugehörigen
Spektralkonditionen:
λmax (M )
λmax (A)
, κ2 (M ) =
.
κ2 (A) =
λmin (A)
λmin (M )
Wir rekapitulieren die folgenden Beziehungen zwischen einer Finite-Elemente-Funktion vh ∈ Vh
N
und ihrem zugehörigen Knotenvektor ξ = (ξn )N
n=1 ∈ R :
vh =
N
X
n=1
(n)
ξn ϕh ,
kvh k2 = hM ξ, ξi,
a(vh , vh ) = hAξ, ξi,
wobei h·, ·i das euklidische Skalarprodukt bezeichnet; die euklidische Vektornorm ist | · | . Der
Knotenvektor ξ ist bestimmt durch das lineare Gleichungssystem
Aξ = b
(3.5.117)
3.5 Implementierungsaspekte
119
Zur Aufstellung des Systems (3.5.117) bedient man sich in der Praxis eines zell-orientierten
Prozesses, des sog. Assemblierens“ (englischen assembling“). Dabei wird das Konzept der
”
”
Element-(Last)-Vektoren“ und Element-(Steifigkeits)-Matrizen” verwendet. Für einen Kno”
”
T )T mit
tenvektor ξ ∈ RN und eine Zelle T ∈ Th ist dabei ξT = (ξ1T , ..., ξnT , ..., ξN
ξnT := ξn
(n)
falls ϕh 6≡ 0 auf T, ξnT := 0
(n)
falls ϕh ≡ 0 auf T.
Die zugehörigen Element-Matrizen und -Vektoren haben die Form
(m)
(n) N
AT = (aTnm )N
n,m=1 := (a∇ϕh , ∇ϕh )T n,m=1 ,
(m)
(n) N
MT = (mTnm )N
n,m=1 := (ϕh , ϕh )T n,m=1 ,
(n) N
bT = (bTn )N
n=1 := (f, ϕh )T n=1 .
Dabei werden natürlich nur die wesentlichen, von Null verschiedenen Elemente von AT , MT
und bT gespeichert. Die einzelnen Gesamtmatrizen und Vektoren werden dann gebildet durch
Assemblierung der entsprechenden Element-Matrizen und -Vektoren gemäß :
X
X
X
A=
AT , M =
MT , b =
bT .
T ∈Th
T ∈Th
T ∈Th
Entsprechend gilt
hAξ, ξi =
X
T ∈Th
hAT ξT , ξT i,
hM ξ, ξi =
X
T ∈Th
hMT ξT , ξT i.
Die Element-Beiträge werden in der Regel durch Transformation auf ein Referenzelement berechnet. Wir diskutieren hier nur den Fall von Dreieckszerlegungen. Sei also wieder σT : T̂ → T
die affin-lineare Abbildung des Einheitsdreiecks T̂ auf das Dreieck T :
x = σT (x̂) = BT x̂ + bT ,
x̂ = σT−1 (x) = BT−1 x − BT−1 bT .
Die charakteristischen Parameter von T sowie T̂ sind mit hT , ρT bzw. ĥ, ρ̂ bezeichnet. Für
transformierte Funktionen v̂(x̂) = v(x) gilt dann
Z
Z
v(x) dx = | det BT |
v̂(x̂) dx̂,
T
T̂
woraus insbesondere | det BT | = |T ||T̂ |−1 ≈ hdT folgt. Ferner ist mit der Inversen BT−1 =
(−1)
(bij )dij=1 :
d
d
X
X
(−1)
ˆ
∂ˆj v̂(x̂)b
.
∂
v̂(x̂)∂
x̂
=
∂c
v(x̂)
=
∂
v(x)
=
∂
v̂(x̂)
=
j
i j
i
i
i
ji
j=1
j=1
c
ˆ
bzw. ∇v(x̂)
= BT−T ∇v̂(x̂)
. Die Elemente der Element-Matrizen AT und MT sowie des Element-
120
Finite-Elemente-Verfahren für elliptische Probleme
Vektors bT transformieren sich wie folgt:
Z
Z
(m)
(n)
T
d(n) dx̂
d(m) ∇ϕ
a∇ϕh ∇ϕh dx = | det BT | â∇ϕ
anm =
h
h
T̂
T
Z
ˆ ϕ̂(n) dx̂ =: | det BT | âTnm ,
ˆ ϕ̂(m) B −T ∇
= | det BT | âBT−T ∇
T
h
T̂
Z
Z
(m) (n)
(m) (n)
T
ϕh ϕh dx = | det BT | ϕ̂h ϕ̂h dx̂ =: | det BT | m̂nm .
mnm =
Z T̂
ZT
(n)
(n)
T
f ϕh dx = | det BT | fˆϕ̂h dx̂ =: | det BT | b̂n .
bn =
T̂
T
Die Werte âTnm , m̂Tnm und b̂Tn auf der Referenzzelle werden nun mit Hilfe von Quadraturformeln
auf T̂ berechnet. Dazu werden wir weiter unten noch mehr Details angeben. Wichtig ist, daß
diese Quadratur nur auf der Referenzzelle stattfindet und die tatsächlich verwendeten Größen
anm , mnm und bn im wesentlichen durch Skalierung mit | det BT | gewonnen werden.
3.5.2 Konditionierung der Systemmatrix
Wir wollen zunächst die Stabilität (für h → 0 ) der diskreten Finite-Elemente-Gleichung (3.5.117)
gegenüber Störungen der Daten untersuchen. Diese treten z.B. auf durch die Fehler bei der Berechnung der Elemente anm und mnm bei Verwendung von numerischer Quadratur. Durch rein
algebraische Argumente erhalten wir zunächst eine Stabilitätsabschätzung für allgemeine lineare
Gleichungssysteme (siehe Skriptum Einführung in die Numerik“).
”
Satz 3.12 (Allgemeiner Störungssatz): Seien Störungen δA der Matrix A und δb der
rechten Seite b gegeben, so daß µ := κ2 (A)kδAk/kAk < 1 . Dann gilt die Fehlerabschätzung
|δξ|
κ2 (A) n kδAk |δb| o
.
≤
+
|ξ|
1 − µ kAk
|b|
(3.5.118)
Zur quantitativen Auswertung dieser Abschätzung müssen wir die Spektralkondition der Steifigkeitsmatrix A in Abhängigkeit von der Gitterweite h abschätzen. Dazu nehmen wir an, daß
die betrachtete Familie von Zerlegungen (Th )h>0 gleichmäßig form- und größen-regulär“ ist,
”
d.h.:
maxT ∈Th hT hT
≤ c,
sup
≤ c.
sup max
h>0 minT ∈Th hT
h>0 T ∈Th ρT
Dann ergibt sich analog zum Differenzenverfahren das folgende allgemeine Resultat.
Satz 3.13 (Konditionierung): Auf einer Folge von (gleichmäßig) regulären Zerlegungen Th
gilt für die Spektralkonditionen der (symmetrischen und positiv definiten) Steifigkeitsmatrizen
A und der Massenmatrizen M :
κ2 (A) = O(h−2 ),
κ2 (M ) = O(1)
(h → 0).
Beweis: (i) Für die größten und kleinsten Eigenwerte von M gilt
λmin (M ) = min
ξ∈RN
hM ξ, ξi
hM ξ, ξi
≤ max
= λmax (M ) .
2
N
|ξ|
|ξ|2
ξ∈R
(3.5.119)
3.5 Implementierungsaspekte
121
In der folgenden Argumentation werden wieder die Element-Matrizen MT . Ferner bezeichne
dmin und dmax die kleinste bzw. die größte Anzahl von Zellen, die in einem Knoten der Zerlegung
Th zusammentreffen. Mit dieser Notation ergibt sich:
hM ξ, ξi =
hM ξ, ξi =
X
T ∈Th
X
T ∈Th
hMT ξT , ξT i ≥
hMT ξT , ξT i ≤
min
ξ∈RN , T ∈Th
max
ξ∈RN , T ∈Th
hMT ξT , ξT i X
|ξT |2 ≥ min {λmin (MT )} dmin |ξ|2 ,
T ∈Th
|ξT |2
T ∈Th
hMT ξT , ξT i X
|ξT |2 ≤ max {λmax (MT )} dmax |ξ|2 .
T ∈Th
|ξT |2
T ∈Th
Mit Hilfe der Beziehung | det BT | ≈ hdT ergibt sich mit der (festen) Matrix M̂ := (m̂nm )N
n,m=1 :
λmax (MT ) = | det BT | λmax (M̂ ) ≤ chdT ,
λmin (MT ) = | det BT | λmin (M̂ ) ≥ chdT ,
und folglich κ2 (M ) = O(1) .
(ii) Für die kleinsten und größten Eigenwerte von A gilt:
hAξ, ξi
hM ξ, ξi
min
= min
vh ∈Vh
hM ξ, ξi ξ∈RN |ξ|2
hM ξ, ξi
hAξ, ξi
max
= max
λmax (A) ≤ max
vh ∈Vh
|ξ|2
ξ∈RN hM ξ, ξi ξ∈RN
λmin (A) ≥ min
ξ∈RN
a(vh , vh )
λmin (M ),
kvh k2
a(vh , vh )
λmax (M ).
kvh k2
Wir schätzen weiter ab durch
min
vh ∈Vh
a(vh , vh )
a(v, v)
≥ min
=: λmin (L)
2
2
1
kvh k
v∈H0 (Ω) kvk
mit dem kleinste Eigenwert des Differentialoperators L auf dem Gebiet Ω . Ferner ergibt sich
mit Hilfe der inversen Beziehung“ für Finite-Elemente-Funktionen:
”
X
X
−2
2
2
a(vh , vh ) ≤ kak∞
k∇vh k2T ≤ ckak∞
ρ−2
T kvh kT ≤ ckak∞ max ρT kvh k ,
T ∈Th
T ∈Th
T ∈Th
bzw. λmax (A) ≤ c maxT ∈Th ρ2T λmax (M ) . Wir gewinnen so die Abschätzung
λmin (L)λmin (M ) ≤ λmin (A) ≤ λmax (A) ≤ c max ρ−2
T λmax (M ).
T ∈Th
Also ist κ2 (A) ≤ c maxT ∈Th ρ−2
T , was im Hinblick auf die Gleichförmigkeitsannahmen an die
Zerlegungsfolge den Beweis vervollständigt.
Q.E.D.
Bemerkung 3.10: Wir betonen, daß die Asymptotik O(h−2 ) der Kondition der Steifigkeitsmatrix durch die Ordnung des zugrunde liegenden Differentialoperators L bestimmt ist; sie hat
nichts mit dem Polynomgrad m − 1 des Finite-Elemente-Ansatzes oder der Raumdimension
d zu tun. In der Tat wurde der Beweis von Satz 3.13 allgemein für d ≥ 1 und für beliebigen
Polynomgrad m − 1 ≥ 1 geführt. Die Abhängigkeit von ρ := minT ∈Th ρT kommt über die Verwendung der inversen Beziehung zur Abschätzung von λmax (A) ins Spiel. Dabei ergibt offenbar
jede Ableitungsstufe in der Energieform a(·, ·) genau eine negative ρ-Potenz. Der Exponent
−2 ist also gerade durch die Ordnung des betrachteten Differentialoperators bestimmt. Bei der
Finite-Elemente-Diskretisierung von Differentialoperatoren höherer Ordnung 2r ≥ 2 verhält
122
Finite-Elemente-Verfahren für elliptische Probleme
sich die Kondition der Steifigkeitsmatrix dementsprechend wie κ2 (A) = O(h−2r ) . Zum Beispiel
treten in der Plattenstatik Randwertaufgaben vierter Ordnung (r = 2) mit dem biharmonischen
Operator ∆2 auf. In diesem Fall verhält sich die Kondition der zugehörigen Steifigkeitsmatrix
wie O(h−4 ) . Für eine Gitterweite der Größenordnung h ∼ 10−2 in zwei Dimensionen ergibt
sich damit κ2 (A) ∼ 108 , was Rechnung in mindestens doppelt-genauer Arithmetik nahe legt.
Die Fehlerabschätzung (3.5.118) ist am Extremfall einer Störung des Eigenvektors wmax in
Richtung des Eigenvektors wmin orientiert. Sie erfassen also den ungünstigsten Fehlereinfluß, wie
er in der Praxis kaum auftreten wird. Tatsächlich erweist sich (3.5.118) als viel zu pessimistisch
zur realistischen Erfassung des Einflusses von Datenfehlern bei der Lösung der Finite-ElementeGleichungen Ax = b . Zur Verdeutlichung betrachten wir im folgenden ausschließlich den Fall von
Störungen in der rechten Seite b , welche durch fehlerhafte Auswertung (z.B. durch numerische
Quadratur) der gegebenen rechten Seite f der Differentialgleichung entstehen.
Satz 3.14 (Spezieller Störungssatz): Auf einer Folge von (gleichmäßig) regulären Zerlegungen Th gilt die Fehlerabschätzung
κ2 (M ) kf k |δb|
|δξ|
≤
,
|ξ|
λ
kuh k |b|
(3.5.120)
mit dem kleinsten Eigenwert λ der 1. RWA des Differentialoperators L auf Ω .
Beweis: Aus der Identität A δξ = δb folgt |δξ| ≤ kA−1 k |δb| = λmin (A)−1 |δb| . Weiter ist
hAz, zi
hM z, zi
hAz, zi
≥ min
min
2
|z|
|z|2
z∈RN hM z, zi z∈RN
z∈RN
a(vh , vh )
λmin (M ) ≥ λ λmin (M ) ,
= min
vh ∈Vh kvh k2
λmin (A) = min
und somit |δξ| ≤ λ−1 λmin (M )−1 |δb| . Mit Hilfe der Schwarzschen Ungleichung ergibt sich
|b|2 =
N
X
(n)
(f, ϕh )2 = f,
N
X
n=1
n=1
(n)
(n) (f, ϕh )ϕh
Wegen
N
X
(n) (n) (f, ϕh )ϕh .
≤ kf k n=1
N
N
X
X
(n)
(m)
(n)
(m)
(n) (n) 2
(f, ϕh )(f, ϕh )(ϕh , ϕh ) = hM b, bi ≤ λmax (M ) |b|2
(f, ϕh )ϕh =
n=1
n,m=1
folgt dann |b| ≤ λmax (M )1/2 kf k . Ferner gilt wegen hM ξ, ξi ≤ λmax (M )kξk2 :
|ξ| ≥ λmax (M )−1/2 hM ξ, ξi1/2 = λmax (M )−1/2 kuh k .
Wir kombinieren die obigen Beziehungen und erhalten
|δξ|
λmax (M ) |δb| kf k
≤ λ−1
,
|ξ|
λmin (M ) |b| kuh k
was zu beweisen war.
Q.E.D.
3.5 Implementierungsaspekte
123
Wir haben in Satz 3.13 gesehen, daß die Massenmatrix M eine gleichmäßig bzgl. h beschränkte Spektralkondition hat κ2 (M ) = O(1) (h → 0) . Ferner folgt aus der Konvergenz des
Verfahrens die Beziehung
kuh k = kuk + O(h) (h → 0).
Damit erhalten wir aus Satz 3.14 die folgende asymptotische Abschätzung für die Fehlerfortpflanzung im Finite-Elemente-Galerkin-Verfahren
|δξ|
|δb|
≤ c(f, u, Ω)
,
|ξ|
|b|
(3.5.121)
mit einer nur von f, u und Ω abhängigen Konstante c(f, u, Ω). Dies besagt, daß die FiniteElemente-Methode stabil ist (für h → 0 ) bzgl. Störungen der rechten Seite f .
3.5.3 Aufstellung der Systemmatrizen mit numerischer Integration
Im folgenden analysieren wir den zusätzlichen Fehler, welcher bei näherungsweiser Berechnung
der Matrix- und Vektorelemente anm und bn mittels numerischer Quadratur entsteht. Im Zuge
der Matrix-Assemblierung müssen Integrale über Gitterzellen T ∈ Th ,
Z
Z
(j)
(j)
(i)
(3.5.122)
f (x)ϕh (x) dx,
a(x)∇ϕh (x)∇ϕh (x) dx,
T
T
(i)
berechnet werden, wobei ϕh (x) die Knotenbasisfunktionen sind. Wenn die Datenfunktionen
a(x), f (x) konstant oder auf der Zelle durch Polynome approximiert sind, so sind Integrale der
Form
Z
xp1 xq2 dx, p, q ∈ N0 ,
T
zu berechnen. Hierfür gibt es z.B. auf Dreiecken explizite Formeln. Sei T ein Dreieck in der
(x, y)-Ebene mit den Eckpunkten (xi , yi ), i = 1, 2, 3 . Ist der Ursprung des Koordinatensystems
im Schwerpunkt von T , d.h. x1 + x2 + x3 = y1 + y2 + y3 = 0 , so gilt z.B.:
Z
1 d(x, y) = |T |,
Z
ZT
y d(x, y) = 0,
x d(x, y) =
T
T
Z
|T | 2
(x1 + x22 + x23 ),
x2 d(x, y) =
12
ZT
|T |
xy d(x, y) =
(x1 y1 + x2 y2 + x3 y3 ),
12
T
Z
|T | 2
y 2 d(x, y) =
(y1 + y22 + y32 ).
12
T
Nicht exakt berechenbare Integrale werden durch numerische Quadratur angenähert. Dazu
dienen sog. Quadraturformeln“, welche analog wie auf 1-dimensionalen Intervallen auch auf
”
2- oder 3-dimensionalen Zellen über einen Interpolationsansatz erzeugt werden. Dies geschieht
zunächst auf der Referenzzelle T̂ und ergibt dann durch Transformation T̂ → T = σT (T̂ ) =
BT x̂ + bT auch Quadraturformeln auf den einzelnen Zellen T ∈ Th . Wir beschreiben diesen
124
Finite-Elemente-Verfahren für elliptische Probleme
Prozess im folgenden nur für Quadratur basierend auf Lagrange-Interpolation.
Auf der Referenzzelle T̂ seien ein Polynomraum P (T̂ ) mit S := dim P (T̂ ) sowie ein Satz
von Stützpunkten {x̂s ∈ T̂ , s = 1, ..., S} gewählt, welche unisolvent sind. Die Stützpunkte x̂s
brauchen nicht mit den Knotenpunkten des Finite-Elemente-Ansatzes übereinzustimmen. Seien
weiter L̂s ∈ P (T̂ ) die zugehörigen Lagrangeschen Basispolynome, welche durch die Eigenschaft
L̂s (x̂r ) = δsr charakterisiert sind. Dies erlaubt wieder die explizite Darstellung des zu einer
stetigen Funktion v̂(x̂) gehörenden Interpolationspolynoms durch
p(x̂) =
S
X
v̂(x̂s )L̂s (x̂).
s=1
Dies führt zu folgendem Ansatz für eine Quadraturformel auf T̂ :
QT̂ (v̂) :=
S
X
ω̂s v̂(x̂s ),
ω̂s :=
Z
L̂s (x̂) dx̂.
(3.5.123)
T̂
s=1
Die Stützpunkte x̂s werden so gewählt, daß Polynome von möglichst hohem Grad durch die
Formel exakt integriert werden. Dabei ist aus Stabilitätsgründen wieder darauf zu achten, daß
die Gewichte ω̂s positiv sind.
Definition 3.6 (Quadraturformel): Eine interpolatorische Quadraturformel der Art (3.5.123)
auf einer Referenzzelle T heißt von der Ordnung r “, wenn durch sie Polynome bis zum Grad
”
r − 1 (und nicht höher) exakt integriert werden. Sie wird zulässig“ für den Polynomansatz
”
P (T ) genannt, wenn ihre Stützstellenmenge reichhaltig genug ist, so daß
q ∈ P (T ) :
∇q(xs ) = 0 (s = 1, ..., S)
⇒
q ≡ konst.
(3.5.124)
Mit den Bezeichnungen
xs := σT (x̂s ),
ωs := | det BT | ω̂s
(s = 1, ..., S),
erhalten wir durch
QT (v) :=
S
X
ωs v(xs ) :=
S
X
s=1
s=1
| det BT |ω̂s v̂(x̂s ) = | det BT | QT̂ (v̂)
(3.5.125)
Quadraturformeln QT (·) auf den einzelnen Zellen T ∈ Th . Die gebräuchlichsten solcher Formeln für Dreiecke sind in Abbildung 3.10 zusammengestellt. Dabei bedienen wir uns der gebräuchlichen Schreibweise mit sog. baryzentrischen Koordinaten“. Für ein d-Simplex T mit
”
Eckpunkten {a0 , ..., ad } besitzt jeder Punkt x ∈ T eine eindeutige Darstellung als konvexe
Linearkombination der Eckpunkte:
x=
d
X
i=0
λi ai ,
0 ≤ λ ≤ 1,
d
X
λi = 1.
i=0
Die Koeffizienten {λ0 , ..., λd } sind dann die baryzentrischen Koordinaten von x im Simplex T .
Zum Beispiel sind {1, 0, ..., 0} die baryzentrischen Koordinaten des Eckpunkts a0 und { 12 , ..., 21 }
3.5 Implementierungsaspekte
125
die des Mittelpunktes zT . Die einfachsten Quadraturformeln auf Dreiecken/Simplizes sind die
Mittelpunktregel“ und die Trapezregel“ (siehe auch Abb. 3.10):
”
”
d
QT (v) := |T |v(zT ),
X
1
QT (v) :=
v(ai ).
|T |
d+1
i=0
Abbildung 3.10: Beispiele von Quadraturformeln auf Dreiecken.
Auf Vierecken bzw. Hexaedern werden sog. Tensorproduktformeln“ verwendet. Diese erhält
”
man ebenfalls über Transformation von der Referenzzelle. Demgemäß lauten auf dem Quadrat/Quader mit Mittelpunkt zT und Eckpunkten {a1 , ..., a2d } die Mittelpunktregel sowie die
126
Finite-Elemente-Verfahren für elliptische Probleme
(Tensorprodukt)-Trapezregel:
2d
X
1
QT (v) := d |T |
v(ai ).
2
QT (v) := |T |v(zT ),
i=0
Zur Erzielung höherer Genauigkeit werden extrapolierte Trapez-Formeln (z.B. TensorproduktSimpson-Regel) oder Tensorprodukt-Gauß-Formeln verwendet, welche ähnlich wie im eindimensionalen Fall konstruiert sind. Ein der gebräuchlichsten Formeln für Quadrate ist die 4-PunktGauß-Formel
4
1X
v(ξi ),
QT (v) :=
4
i=1
mit den Gauß-Punkten
ξ1 = (η− , η− ), ξ2 = (η− , η+ ), ξ3 = (η+ , η− ) und ξ4 (η+ , η+ ), wobei
p
1
η± := 2 (1 ± 1/3) .
Satz 3.15 (Quadraturfehler): Für eine interpolatorische Quadraturformel QT (·) der Ordnung r ≥ d auf einer Zelle T ∈ Th angewendet auf eine Funktion v ∈ W r,1 (T ) gilt
Z
Z
v dx − QT (v) ≤ cq hrT
|∇r v| dx,
(3.5.126)
T
T
mit einer von T und v ∈ H r (T ) unbhängigen Quadraturkonstanten cq > 0 .
Bemerkung 3.11: Die Vorausssetzung r ≥ d in Satz 3.15 dient zur Vereinfachung der Formulierung des Resultats. Wegen der Einbettung W d,1 (T ) ⊂ C(T̄ ) sind für Funktionen v ∈ W r,1 (T )
die für die Anwendung der Quadraturformel erforderlichen Punktwerte wohl definiert. Dies ist
aber auch gerade die richtige“ Regularitätsstufe für die maximale Ausnutzung der Approxima”
tionsgüte der Quadraturformel. Dies ist wichtig für die folgende Untersuchung des Einflusses des
Quadraturfehlers auf den Gesamtfehler. Im Übrigen ist jede der gebräuchlichen Quadraturformeln (z.B. Mittelpunkts- oder Trapezregel) mindestens von der Ordnung r = 2 , so daß in zwei
Dimensionen gar keine Einschränkung besteht. In drei Dimensionanen bedarf der Fall r = 2
eine gesonderte Betrachtung, die obwohl nicht schwer, hier nicht durchgeführt wird.
Beweis: Der Beweis verwendet das Bramble-Hilbert-Lemma 3.5 in Verbindung mit dem Transformationsargument von Satz 3.6. Auf der Referenzzelle T̂ definieren wir das Fehlerfunktional
Z
F (v̂) :=
v̂(x̂) dx̂ − QT̂ (v̂).
T̂
Zur Definition von F (·) benötigen wir Punktwerte von v̂ . Diese sind aufgrund des Sobolewschen
Einbettungssatzes in zwei Dimensionen für v ∈ H 2,1 (Ω) und in drei Dimensionen für v ∈
H 3,1 (Ω) wohl definiert. Es gilt dann
|F (v̂)| ≤ ckv̂kH r,1 .
Ferner ist F (·) offensichtlich sublinear und verschwindet nach Voraussetzung auf Pr−1 . Nach
der L1 -Variante des Bramble-Hilbert-Lemmas gilt dann
ˆ r v̂k 1 .
|F (v̂)| ≤ ck∇
L (T̂ )
3.5 Implementierungsaspekte
127
Sei nun σT wieder die affin-lineare Transformation von T̂ auf die Zelle T . Dann gilt für eine
Funktion v ∈ H r,1 (Ω) und ihre Transformierte v̂(x̂) := v(x), x = σT (x̂) :
Z
v(x) dx − QT (v) = | det BT | |F (v̂)|,
T
sowie
−1 r
r
ˆ r v̂k 1
k∇
L (T̂ ) ≤ c| det BT | hT k∇ vkL1 (T ) .
Kombination der letzten beiden Beziehungen ergibt die Behauptung.
Q.E.D.
Im folgenden werden wir uns auf die Quadratur auf Dreiecken bzw. Simplizes beschränken
und nehmen außerdem an, daß der Polynomansatz ein voller Polynomraum ist: P (T̂ ) = Pm−1 (T̂ ) .
Analoge Resultate gelten auch für die Quadratur auf Vierecken bzw. Hexaedern, doch erfordern
deren Formulierung und Beweis eine aufwendigere Notation.
Die Anwendung von Quadraturformeln zur Berechnung der Zellintegrale (3.5.122) ergibt eine
gestörte Bilinearform und rechte Seite
X
X
ah (u, ϕ) :=
QT (a∇u∇ϕ),
lh (ϕ) :=
QT (f ϕ)
T ∈Th
T ∈Th
sowie zugehörige gestörte Steifigkeitsmatrix- und Lastvektorelemente
X
X
(i)
(j)
(i)
QT (f ϕh ).
QT (a∇ϕh ∇ϕh ),
b̃j :=
ãij :=
T ∈Th
T ∈Th
Statt der exakten Finite-Elemente-Lösung uh ∈ Vh ist dann eine gestörte Approximation ũh ∈
Vh zu bestimmen durch
ah (ũh , ϕh ) = lh (ϕh ) ∀ϕh ∈ Vh .
(3.5.127)
Satz 3.16 (Numerische Integration): Die Quadraturformel auf der Referenzzelle QT̂ (·) sei
zulässig“ für den Finite-Elemente-Ansatz P (T̂ ) und von der Ordnung r ≥ d . Dann besitzen die
”
gestörten Finite-Elemente-Gleichungen (3.5.127) eindeutige Lösungen ũh ∈ Vh . Ist a ∈ C r (Ω) ,
so gilt für das gestörte Finite-Elemente-Verfahren der Ordnung m ≥ 2 die Fehlerabschätzung
ku − ũh k + hk∇(u − ũh )k ≤ c hmin{m,r+3−m} kukH m .
(3.5.128)
Zur Erzielung einer maximalen Konvergenzordnung ist also r ≥ 2m − 3 zu wählen.
Beweis: (i) Koerzitivität: Auf einer Zelle T ∈ Th gilt unter Verwendung der Transformation
T = σT (T̂ ) wegen a ≥ α > 0 :
QT (a|∇vh |2 ) =
S
X
ωs a(xs )|∇vh (xs )|2 ≥ α
s=1
S
X
≥α
s=1
S
X
s=1
ωs |∇vh (xs )|2 = α
S
X
s=1
ˆ h (x̂s )|2
| det BT | ω̂s |BT−1 ∇v̂
ˆ h (x̂s )|2 ≥ αc | det BT |h−2
| det BT | ω̂s kBT k−2 |∇v̂
T
S
X
s=1
ˆ h (x̂s )|2 ,
ω̂s |∇v̂
128
Finite-Elemente-Verfahren für elliptische Probleme
wobei v̂h (x̂) = vh (x), x̂ = σT−1 (x) . Analog gilt
ˆ h k2 ≥ c| det BT |−1 h2T k∇vh k2T .
k∇v̂
T̂
Durch
|||v̂h |||T̂ :=
S
X
s=1
ˆ h (x̂s )|2
ω̂s |∇v̂
1/2
ist auf dem Quotientenraum P (T̂ )/P0 eine Norm definiert. Dazu muß nur noch die Definitheit
ˆ h (x̂s ) = 0 (s = 1, ..., S) , so daß wegen
gezeigt werden. Aus |||v̂h |||T̂ = 0 folgt offenbar ∇v̂
der vorausgesetzten Zulässigkeit“ der Quadraturformel notwendig v̂h ≡ konst. ist. Da auch
ˆ h k auf P (T̂ )/P”0 eine Norm ist, gilt wegen der Äquivalenz aller Normen auf einem endlich
k∇v̂
T̂
dimensionalen Vektorraum mit einer Konstante ĉ > 0 :
ˆ hk .
|||v̂h |||T̂ ≥ ĉ k∇v̂
T̂
Dies impliziert dann
−2 ˆ
2
2
2
QT (a|∇vh |2 ) ≥ c| det BT |h−2
T |||v̂h |||T̂ ≥ c| det BT |hT k∇v̂h kT̂ ≥ c k∇vh kT ,
bzw. die gleichmäßige Koerzitivität der Bilinearformen ah (·, ·) :
ah (vh , vh ) ≥ ck∇vh k2 ,
vh ∈ Vh .
(3.5.129)
(ii) Fehlerabschätzung: Mit Hilfe der Koerzitivitätsabschätzung (3.5.129) folgt für den Fehler
ηh := uh − ũh ∈ Vh :
c k∇ηh k2 ≤ ah (uh − ũh , ηh ) = ah (uh , ηh ) − ah (ũh , ηh )
≤ (ah − a)(uh , ηh ) + (l − lh )(ηh ).
Dies impliziert
n |(a − a)(u , v )| |(l − l )(v )| o
h
h
h
h h
.
+
vh ∈Vh
k∇vh k
k∇vh k
k∇ηh k ≤ c max
Zusammen mit der bekannten H 1 -Fehlerabschätzung
k∇(u − uh )k ≤ chm kukH m
folgt
n |(a − a)(u , v )| |(l − l )(v )| o
h
h h
h
h
.
+
vh ∈Vh
k∇vh k
k∇vh k
k∇(u − ũh )k ≤ chm kukH m + c max
Im nächsten Schritt werden wir zeigen, daß
n |(a − a)(u , v )| |(l − l )(v )| o
h
h
h
h h
≤ c hmin{m,r−m+2} kukH m .
+
vh ∈Vh
k∇vh k
k∇vh k
max
(3.5.130)
Dies impliziert dann den ersten Teil der Behauptung
k∇(u − ũh )k ≤ chmin{m,r−m+2} kukH m .
(3.5.131)
3.5 Implementierungsaspekte
129
(iii) Konsistenz: Als nächstes schätzen wir den Abstand“ zwischen a(·, ·) und ah (·, ·) sowie
”
l(·) und lh (·) ab. Für uh , vh ∈ Vh folgt mit Hilfe der Abschätzung des Integrationsfehlers in
Satz 3.15:
X Z
a∇uh ∇vh dx − QT (a∇uh ∇vh )
|(a − ah )(uh , vh )| ≤
T
T ∈Th
≤ cq
X
hrT
T ∈Th
Z
T
|∇r (a∇uh ∇vh )| dx.
Durch Ausdifferenzieren erhalten wir
|(a − ah )(uh , vh )| ≤ c
X
T ∈Th
hrT k∇uh kH r (T ) k∇vh kH r (T ) ,
wobei die Konstante c wesentlich durch Schranken für die Ableitungen der Koeffizientenfunktion
a(x) bestimmt ist. Bei Beachtung von vh|T ∈ Pm−1 ergibt sich
|(a − ah )(uh , vh )| ≤ c
X
T ∈Th
hrT k∇uh kH m−2 (T ) k∇vh kH m−2 (T ) .
Mit Hilfe der inversen Beziehung“ für finite Elemente gilt
”
k∇vh kT ,
k∇vh kH m−2 (T ) ≤ ch2−m
T
womit folgt:
|(a − ah )(uh , vh )| ≤ chr−m+2
X
T ∈Th
k∇uh k2H m−2 (T )
1/2
k∇vh k.
Die Terme in uh werden unter Verwendung der Knoteninterpolierenden Ih u ∈ Vh und mit Hilfe
der inversen Beziehung sowie der lokalen Interpolationsabschätzungen wie folgt abgeschätzt:
k∇uh kH m−2 (T ) ≤ kuh − Ih ukH m−1 (T ) + kIh u − ukH m−1 (T ) + kukH m−1 (T )
≤ chT2−m kuh − Ih ukH 1 (T ) + chT k∇m ukT + kukH m−1 (T )
ku − Ih ukH 1 (T ) + kukH m (T )
≤ chT2−m kuh − ukH 1 (T ) + ch2−m
T
≤ chT2−m kuh − ukH 1 (T ) + kukH m (T ) .
Zusammenfassen der bisherigen Abschätzungen ergibt
|(a − ah )(uh , vh )| ≤ chr+2−m h2−m kuh − ukH 1 + kukH m k∇vh k,
und unter Verwendung der bekannten H 1 -Fehlerabschätzung kuh − ukH 1 ≤ chm−1 kukH m :
|(a − ah )(uh , vh )| ≤ chr+2−m kukH m k∇vh k.
(3.5.132)
Auf analoge Weise erschließen wir
|(l − lh )(vh )| ≤ chr−m+2 k∇vh k kukH m .
(3.5.133)
Die Abschätzungen (3.5.132) und (3.5.133) ergeben (3.5.130) und damit das Resultat (3.5.131).
(iv) L2 -Fehlerabschätzung: Zur Abschätzung des Fehlers in der L2 -Norm bedienen wir uns wieder
130
Finite-Elemente-Verfahren für elliptische Probleme
eines Dualitätsarguments. Sei z ∈ V die (eindeutige) Lösung des Hilfsproblems
−∇ · {a∇z} = uh − ũh
in Ω,
z = 0 auf ∂Ω.
Wegen der angenommenen Glattheit von a und der Konvexität von Ω ist z ∈ H 2 (Ω) und
genügt der a-priori Abschätzung
kzkH 2 ≤ ckuh − ũh k.
Sei zh ∈ Vh die Ritz-Projektion von z . Mit dieser Konstruktion erhalten wir mit Hilfe der
Galerkin-Orthogonalität:
kuh − ũh k2 = a(uh − ũh , z) = a(uh − ũh , zh )
= a(uh , zh ) − (a − ah )(ũh , zh ) − ah (ũh , zh )
= (l − lh )(zh ) − (a − ah )(ũh , zh ).
Die beiden Störungsterme werden nun analog wie unter (iii) abgeschätzt. Zunächst gilt wieder
mit Hilfe der inversen Beziehung:
X
hrT k∇ũh kH m−2 (T ) k∇zh kH m−2 (T )
|(a − ah )(ũh , zh )| ≤ c
T ∈Th
≤ chr+3−m
X
T ∈Th
k∇ũh k2H m−2 (T )
1/2 X
T ∈Th
k∇zh k2H 1 (T )
1/2
.
Für die beiden Summen erhalten wir analog wie oben unter (iii):
X
T ∈Th
sowie
k∇ũh k2H m−2 (T )
X
T ∈Th
1/2
k∇zh k2H 1 (T )
kũh − ukH 1 + kukH m ,
≤ ch2−m
T
1/2
≤ ckzkH 2 ≤ ckuh − ũh k.
Kombination dieser Abschätzungen und Berücksichtigung der schon bewiesenen H 1 -Fehlerabschätzung
ergibt dann:
|(a − ah )(ũh , zh )| ≤ chr−m+3 kuh − ũh kkukH m .
(3.5.134)
|(l − lh )(zh )| ≤ chr−m+3 kuh − ũh k.
(3.5.135)
Analog erschließen wir
Kombinieren aller vorausgehenden Beziehungen ergibt
kuh − ũh k ≤ chr−m+3 kukH m .
Zusammen mit der bekannten L2 -Fehlerabschätzung für eh = u − uh erhalten wir schließlich
ku − ũh k ≤ chmin{m,r−m+3} kukH m ,
was den Beweis vervollständigt.
Q.E.D.
3.5 Implementierungsaspekte
131
Bemerkung 3.12: Die Aussage von Satz 3.16 kann so interpretiert werden, daß zur Vermeidung
einer Reduzierung der Konvergenzordnung O(hm−1 ) in der Energie-Norm eine Quadraturformel der Ordnung r ≥ 2m − 3 verwendet werden sollte. Damit würden dann im Falle eines
konstanten Koeffizienten a die Matrixelemente anm exakt berechnet werden. Für bloße Konvergenz ũh → u (h → 0) wäre die Wahl r ≥ max{d, m − 2} ausreichend, vorausgesetzt die
Zulässigkeitsbedingung ist erfüllt.
132
Finite-Elemente-Verfahren für elliptische Probleme
3.6 A posteriori Fehleranalyse und Gittersteuerung
Eine wichtige Rolle bei der Lösung von partiellen Differentialgleichungen spielen die beiden
Aspekte Fehlerkontrolle und Gittersteuerung. Hat man eine approximative Lösung uh berechnet, ist es von Interesse, den Fehler zwischen dieser Näherung und der exakten Lösung u bzgl.
eines geeigneten Maßes abzuschätzen. Zu diesem Zweck dienen sog. a-posteriori Fehlerschätzer“,
”
welche im besten Fall ausschließlich von berechneten Größen und den Daten f abhängen. In
diesem Abschnitt wollen wir einfache residuen-basierte Fehlerschätzer für das Modellproblem
der 1. RWA des Laplace-Operators herleiten.
Eine globale Verfeinerung des ganzen Rechengebietes ist in drei Dimensionen in der Regel nicht realisierbar, da der Speicherplatz auf den verfügbaren Rechnern dazu nicht ausreicht.
Deshalb versucht man, nur dort lokal zu verfeinern, wo es die Lösungsstruktur bzw. die Genauigkeitsanforderungen verlangen. Unter optimaler Gittersteuerung wird dabei verstanden, möglichst
wenige markierte Elemente des Gitters zu verfeinern, so daß der Fehler in möglichst wenigen
Schritten unter eine vorgegebene Toleranz gedrückt wird. Die Wahl der zu verfeinernden Elemente trifft man aufgrund sog. lokaler Fehlerindikatoren“, aus denen sich der globale Fehlerschätzer
”
zusammensetzt. Solche Gittersteuerungsmethoden werden wir im zweiten Teil dieses Abschnitts
diskutieren.
3.6.1 Allgemeine a posteriori Fehlerabschätzung
Aus der a priori Fehlerschätzung aus Abschnitt 3.4 konnten wir die Konvergenzordnung des
Diskretisierungsfehlers eh = u − uh schon für verschiedene Normen herleiten:
– Energienorm-Fehlerabschätzung:
– L2 -Norm-Fehlerabschätzung:
– L∞ -Abschätzung:
k∇eh k ≤ ci cs h kukH 2 ,
keh k ≤ ci cs h2 kukH 2 ,
maxΩ |eh | ≤ ci cs h2 | ln(h)| M2 (u),
mit lokalen Interpolationskonstanten ci und globalen Stabilitätskonstanten cs . Leider sind diese
Abschätzungen für eine quantitative Fehlerkontrolle nicht zu gebrauchen, da die nötigen Informationen über die höheren Ableitungen der exakten Lösung u fehlen und insbesondere präzise
Abschätzungen für die Stabilitätskonstanten cs i.a. nicht zur Verfügung stehen. Ist aber der
Charakter einer lokalen Singularität der Lösung bekannt, wie z.B. im Fall von Ecken- oder
”
Kantensingulariutäten“, so kann diese Information zur vorab Anpassung des Gitters verwendet
werden. Dabei wird die Gitterweite h in Richtung auf die singuiläre Stelle hin systematisch
verkleinert, etwa gemäß h(r) ≈ h0 r α wobei der Exponent α > 1 aus dem bekannten singulären
Verhalten der Ableitungen der Lösung abgeleitet wird.
In allgemeinen Situationen muß man sich aber heuristischer Methoden zur Bestimmung der
Regularität der Lösung bedienen. Dies läuft (in Anlehnung an die traditionelle, abschneidefehlerbasierte Vorgehensweise bei Differenzenverfahren) auf die Schätzung der lokalen Glattheit der
unbekannten Lösung aus der berechneten numerischen Approximation hinaus. Zum Beispiel kann
man versuchen, auf einem Zellblock (etwa aus 2d Zellen) aus einer linearen Näherungslösung uh
durch Anwendung eines Differenzenquotienten ∇2h zweiter Ordnung im Schwerpunkt zT einer
3.6 A posteriori Fehleranalyse und Gittersteuerung
133
Zelle T ∈ Th eine Schätzung der zweiten Ableitungen von u auf T zu gewinnen:
max |∇2 u||T ≈ ηT := |∇2h uh (zT )||T .
T
(3.6.136)
Auf der Basis dieses Indikators ließen sich dann Strategien zu lokaler Gitterverfeinerung oder
-vergröberung aufstellen: Ist zum Beispiel ηT auf einer Zelle T ∈ Th überdurchschnittlich groß,
so wird diese in Teilzellen zerlegt. Diese Strategie der ad hoc Gitteranpassung erfordert keinen
großen Aufwand und funktioniert in der Praxis in vielen Fällen erstaunlich gut. Daher sind
Varianten dieser Strategie derzeit auch in vielen kommerziellen Programmen realisiert, wenn
diese überhaupt Gitteradaption beinhalten. Dabei gibt es aber die folgenden grundsätzlichen
Schwächen:
– Die Auswertung von (3.6.136) liefert keine Aussage über die tatsächliche Größe des Fehlers
eh = u − uh .
– Die auf den lokalen Indikatoren ηT basierende Gitterverfeinerungsstrategie geht davon aus,
daß der gemessene“ Fehler in T auch dort entstanden ist und durch lokale Verfeinerung
”
von T reduziert werden kann. Dies ist aber i.a. nicht richtig, da dabei das Phänomen der
globalen Fehlerakkumulation“ (auch pollution effect“ genannt) vernachlässigt wird.
”
”
Ziel der folgenden Diskussion ist es, über eine a posteriori Fehleranalyse via Dualitätsargumente
systematisch auswertbare und zuverlässige Fehlerschätzer zu entwickeln, aus denen auch effiziente Kriterien zur lokalen Gitteranpassung abgeleitet werden können. Wir betrachten dazu wieder
das Modellproblem
−∆u = f
in Ω,
u = 0 auf ∂Ω,
(3.6.137)
auf einem (nicht notwendig konvexen) Polygon- oder Polyedergebiet Ω ⊂ Rd . Die durch die
Variationsgleichung
(∇u, ∇ϕ) = (f, ϕ)
∀ϕ ∈ V = H01 (Ω),
(3.6.138)
definierte schwache Lösung u ∈ H01 (Ω) wird durch ein Galerkin-Finite-Elemente-Verfahren approximiert. Wir konzentrieren uns im folgenden auf die Approximation mit linearen“ finiten
”
(1)
Elementen. Die Näherungslösung uh = Rh u ∈ Vh ⊂ V ist bestimmt durch die Gleichung
(∇uh , ∇ϕh ) = (f, ϕh )
∀ϕh ∈ Vh .
(3.6.139)
Bei der Schätzung des Fehlers eh muß man sich für ein geeignetes Fehlermaß“ entscheiden,
”
welches sich am Bedarf der betrachteten Anwendung orientieren sollte. Beispiele sind etwa wie
schon oben erwähnt die traditionellen Maße Energienorm“, L2 -Norm sowie L∞ -Norm. Weitere
”
Beispiele sind:
– Mittelwerte:
– Linienintegrale:
– Ableitungswerte:
|(eh , ψ)Ω |,
ψ ∈ C(Ω),
|(eh , ψ)Γ |,
|∂i eh (a)|,
ψ ∈ C(∂Ω),
a ∈ Ω.
Um alle diese Sonderfälle im Rahmen einer einheitlichen Theorie behandeln zu können, führen
wir zunächst den Begriff des Fehlerfunktionals“ ein. Dies ist ein (der Einfachheit halber als
”
134
Finite-Elemente-Verfahren für elliptische Probleme
linear angenommenes) Funktional
J(·) : V → R,
bzgl. dem der Fehler eh geschätzt werden soll; d.h. gesucht ist eine berechenbare Schranke
für J(eh ) = J(u) − J(uh ) . Zu einem solchen Fehlerfunktional gehört eine (eindeutige) duale
”
Lösung“ z ∈ V , welche als Lösung des zugehörigen dualen Problems“ bestimmt ist:
”
(∇ϕ, ∇z) = J(ϕ)
∀ϕ ∈ V.
(3.6.140)
Testen wir in (3.6.140) mit ϕ = eh ∈ V , so ergibt sich unter Berücksichtigung der GalerkinOrthogonalität die Fehleridentität
J(eh ) = (∇eh , ∇z) = (∇eh , ∇(z − ψh )),
ψh ∈ Vh .
(3.6.141)
Dies wird nun weiter mit Hilfe von elementweise partieller Integration umgeformt zu
X J(eh ) =
− (∆eh , z − ψh )T + (∂n eh , z − ψh )∂T
T ∈Th
=
X (f + ∆uh , z − ψh )T − (∂n uh , z − ψh )∂T .
T ∈Th
Da z − ψh stetige Spuren entlang ∂T hat und in der obigen Summe jede Kante zweimal auftritt
mit wechselnder Richtung der Normalableitung ∂n uh , erhalten wir
X (3.6.142)
J(eh ) =
(f + ∆uh , z − ψh )T − 12 ([∂n uh ], z − ψh )∂T ,
T ∈Th
wobei auf inneren“ Kanten [∂n uh ]|Γ := ∂n uh|T + ∂n′ uh|T ′ jeweils den Sprung der Normalablei”
tung über Γ ⊂ ∂T zur Nachbarzelle bedeutet. Entlang von Kanten am Rand, Γ ⊂ ∂Ω , setzen
wir [∂n uh ]|Γ := 2∂n uh . Diese Fehleridentität beinhaltet Information über die Abhängigkeit des
Fehlerterms J(eh ) von den lokalen Residuen“ RT := (f + ∆uh )|T und r∂T := − 12 [∂n uh ]|∂T :
”
∂J(eh )
≈ (z − ψh )|T ,
∂RT
∂J(eh )
≈ (z − ψh )|∂T .
∂r∂T
(3.6.143)
Damit können wir hoffen, auf das spezielle Zielfunktional J(eh ) bezogene Kriterien für lokale
Gitterverfeinerung und damit Reduzierung dieser Residuen zu gewinnnen. Dabei mißt“ das
”
Zellresiduum“ R(uh ) das Erfülltsein der Differentialgleichung durch die Näherungslösung uh
”
und das Kantenresiduum“ r(uh ) deren Glattheit“.
”
”
Von der exakten Fehlerdarstellung (3.6.142) können wir nun in mehreren Schritten weitere,
gegebenenfalls leichter auswertbare Fehlerabschätzungen ableiten. Zunächst ist
X (3.6.144)
|J(eh )| ≤ (f + ∆uh , z − ψh )T − 21 ([∂n uh ], z − ψh )∂T ,
T ∈Th
und weiter
|J(eh )| ≤
X (f + ∆uh , z − ψh )T − 1 ([∂n uh ], z − ψh )∂T .
2
T ∈Th
(3.6.145)
3.6 A posteriori Fehleranalyse und Gittersteuerung
135
Bei Beachtung von z−ψh|∂Ω = 0 folgt dann mit Hilfe der Hölderschen Ungleichung:
|J(eh )| ≤
o
X n
kf + ∆uh kT kz − ψh kT + 21 k[∂n uh ]k∂T \∂Ω kz − ψh k∂T .
(3.6.146)
T ∈Th
Die letzte Abschätzung schreiben wir in der kompakten Form
X |J(eh )| ≤ η(uh ) :=
ρT (uh ) ωT (z) + ρ∂T (uh ) ω∂T (z)
(3.6.147)
T ∈Th
mit den Zellresiduentermen“
”
ρT (uh ) := kf + ∆uh kT ,
−1/2
ρ∂T (uh ) := 12 hT
k[∂n uh ]k∂T \∂Ω ,
und den Zellgewichten“
”
ωT (z) := kz − Ih zkT ,
1/2
ω∂T (z) := hT kz − Ih zk∂T .
Die Fehlerdarstellung (3.6.142) bzw. die Fehlerabschätzung (3.6.147) sind nicht unmittelbar
auswertbar. Zwar sind die Residuenterme“ R(uh ) = f + ∆uh und r(uh ) = − 12 [∂n uh ] aus der
”
Näherung uh berechenbar, doch die Wichtungsfaktoren z − ψh sind nur implizit über das duale
Problem (3.6.140) gegeben und müssen gesondert bestimmt werden. Mit dieser kritischen Frage
werden wir uns im Folgenden noch eingehender beschäftigen.
Die Zellgewichte lassen sich bei Wahl ψh := Ih z mit Hilfe der lokalen Interpolationsfehlerabschätzungen aus Abschnitt 3.3 weiter abschätzen durch
ωT (z) ≤ ci h3T max{|∇2 z|}.
T
(3.6.148)
Hierbei muß natürlich vorausgesetzt werden, daß die duale Lösung z ∈ H 2,∞ (Ω) ist. Wir werden später sehen, wie man sich von dieser sehr einschränkenden Annahme in gewisser Weise
befreien kann. Die Interpolationskonstante ci ist von verschiedenen Faktoren abhängig: Von
dem Polynomgrad der verwendeten Interpolierenden, vom Referenzelement T̂ sowie von den
Transformationen σT : T̂ → T . Sie stellt einen Unsicherheitsfaktor dar. Genaueres Nachrechnen ergibt eine Größenordnung von ci ≈ 0, 1 − 10 .
Die a posteriori Fehlerabschätzung (3.6.147) ist zuverlässig“ im Sinne, daß sie eine siche”
re obere Schranke für den Fehler |J(eh )| liefert, vorausgesetzt, es liegen zuverlässige Werte
für die Gewichte ωT (z) und ω∂T (z) vor. Sie wäre auch effizient“, wenn für den zugehörigen
”
Effektivitätsindex“ ( Überschätzungsfaktor“) gilt:
”
”
Ieff :=
η(uh )
≤ c0
|J(eh )|
(h → 0).
(3.6.149)
Bemerkung 3.13: Es ist zu bemerken, daß bereits der Übergang von der Fehleridentität“
”
(3.6.142) zur Fehlerabschätzung“ (3.6.144) in gewissen Fällen zu einer groben Überschätzung
”
des tatsächlichen Fehlers führen kann. Betrachten wir hierzu folgendes Beispiel: Auf dem Quadrat
Ω = (−1, 1) × (−1, 1) gilt es, für die Poisson-Gleichung den Punktfehler im Ursprung zu finden:
J(eh ) = eh (0) . Es ist möglich, die rechte Seite f und das Gitter Th so anti-symmetrisch
bzgl. x = 0 zu konstruieren, daß u(0) = 0 = uh (0) . In diesem Fall wird aber in der Regel
η(uh ) ≈ h2 > 0 sein, d.h.: Ieff = ∞ .
136
Finite-Elemente-Verfahren für elliptische Probleme
3.6.2 Spezielle a posteriori Fehlerschätzer
Der oben abgeleitete allgemeine Fehlerschätzer wird nun für verschiedene spezielle Fehlerfunktionale ausgewertet. In den betrachteten Fällen lassen sich die Gewichte ωT (z), ω∂T (z) analytisch
abschätzen. Wir beschränken uns hier auf die Betrachtung von P1 -Elementen.
a) Energienorm-Fehlerschätzer:
Zur Abschätzung des Energienormfehlers“ k∇eh k wählen wir das Fehlerfunktional
”
J(ϕ) := k∇eh k−1 (∇ϕ, ∇eh ),
so daß wir für ϕ = eh automatisch J(eh ) = k∇eh k haben. Für die zugehörige Lösung z ∈ V
des dualen Problems
(∇ϕ, ∇z) = J(ϕ)
∀ϕ ∈ V
(3.6.150)
gilt dann
k∇zk2 = k∇eh k−1 (∇z, ∇eh ) ≤ k∇zk,
woraus sich die folgende einfache a priori Abschätzung k∇zk ≤ 1 ergibt. Ausgehend von der
allgemeinen Fehlerabschätzung (3.6.146) erhalten wir
X k∇eh k ≤
kf + ∆uh kT kz − ψh kT + 12 k[∂n uh ]k∂T \∂Ω kz − ψh k∂T .
T ∈Th
Wir wählen nun ψh := Ih z als eine verallgemeinerte“ Knoteninterpolierende von z , für welche
”
die folgende lokale Fehlerabschätzung gilt:
1/2
kz − Ih zkT + hT kz − Ih zk∂T ≤ c̃i hT k∇zkT̃ ,
(3.6.151)
wobei T̃ := ∪{T ′ ∈ Th : T ′ ∩ T 6= ∅} . Damit folgt dann mit den Residuen ρT (uh ) und ρ∂T (uh ) :
X
−1/2
k∇eh k ≤ c̃i
hT kf + ∆uh kT + 12 hT k[∂n uh ]k∂T \∂Ω k∇zkT̃
T ∈Th
≤ c
Wegen
X
T ∈Th
1/2
1/2 X
k∇zk2T̃
.
h2T ρT (uh )2 + ρ∂T (uh )2
T ∈Th
X
T ∈Th
k∇zk2T̃
ergibt sich schließlich das folgende Resultat:
1/2
≤ ck∇zk ≤ c,
Satz 3.17 (a posteriori Energienormfehler): Für den Fehler eh := u − uh gilt die a posteriori Abschätzung bzgl. der Energienorm:
X
1/2
h2T ρT (uh )2 + ρ∂T (uh )2
.
(3.6.152)
k∇eh k ≤ ηE (uh ) := c
T ∈Th
3.6 A posteriori Fehleranalyse und Gittersteuerung
137
Diese Abschätzung ist in folgendem Sinne “scharf“:
X
1/2
h2T kf k2T
.
ηE (uh ) ≤ ck∇eh k + c
(3.6.153)
T ∈Th
Beweis: Es bleibt, die Abschätzung (3.6.153) zu beweisen. Dazu verwenden wir folgende Regularitätsaussage: Für eine Funktion v ∈ H 1 (Ω) mit der Eigenschaft ∆v ∈ L2 (Ω) existiert
∂n v ∈ L2 (∂Ω) und genügt der Abschätzung
k∂n vk∂Ω ≤ cΩ k∆vkΩ + k∇vkΩ .
Wir wenden dies auf der Referenzzelle T̂ an und erhalten mit Hilfe des üblichen Transformationsarguments auf jeder einzelnen Zelle T ∈ Th für entsprechende Funktionen v ∈ H 1 (T ) die
Abschätzung
2
(3.6.154)
k∂n vk2∂T ≤ c∗ hT k∆vk2T + h−1
T k∇vkT ,
mit einer von h unabhängigen Konstanten c∗ .
Auf jeder Zelle T ∈ Th ist uh|T ∈ P1 (T ) und folglich
ρT (uh )2 = kf + ∆uh k2T = kf k2T .
Für ein T ∈ Th sei T̃ := ∪{T ′ ∈ Th | T ′ und T haben gemeinsame Kante.} . Wegen der Stetigkeit
von ∂h u über Zellkanten hinweg, ist [∂n uh ] = −[∂n eh ] . Mit Hilfe der Abschätzung (3.6.154)
folgt damit wegen hT ≈ hT ′ für T ′ ∈ T̃ :
X
k∂n eh k2∂T ′ \∂Ω
h2T ρ∂T (uh )2 = 14 hT k[∂n eh ]k2∂T \∂Ω ≤ chT
≤ c∗ hT
X
T ′ ∈T̃
T ′ ∈T̃
2
hT ′ k∆eh k2T ′ + h−1
T ′ k∇eh kT ′
X
= c∗
h2T kf k2T ′ + k∇eh k2T ′ .
T ′ ∈T̃
Dies impliziert nach Summation über T ∈ Th die behauptete Abschätzung (3.6.153). Q.E.D.
Bemerkung 3.14: Mit einer etwas aufwendigeren Argumentation kann man die folgende verschärfte a posteriori Abschätzung herleiten:
X
1/2
h2T h2T k∇f k2T + ρ∂T (uh )2
.
ηE (uh ) ≤ c
T ∈Th
Diese besagt, daß im Fehlerschätzer ηE (uh ) in der Regel der Einfluß der Gleichungsresiduen
kf + ∆uh kT gegenüber den Regularitätsresiduen k[∂n uh ]k∂T \∂Ω vernachlässigt werden können.
Dies ist in dieser Form allerdings nur richtig für lineare bzw. bilineare finite Elemente.
b) L2 -Norm-Fehlerschätzer:
Zur Abschätzung des L2 -Fehlers keh k wählen wir das Fehlerfunktional
138
Finite-Elemente-Verfahren für elliptische Probleme
J(ϕ) := keh k−1 (ϕ, eh ),
womit automatisch J(e) = keh k gilt. Die zugehörige Lösung z ∈ V des dualen Problems
(∇ϕ, ∇z) = J(ϕ)
∀ϕ ∈ V
(3.6.155)
ist dann auf dem konvexen Gebiet Ω auch in H 2 (Ω), und es gilt die a priori Abschätzung
k∇2 zk ≤ k∆zk = 1 . Ausgehend von der Fehlerabschätzung (3.6.146) erhalten wir wieder
X keh k ≤
kf + ∆uh kT kz − ψh kT + 21 k[∂n uh ]k∂T \∂Ω kz − ψh k∂T .
T ∈Th
Wir können nun ψh := Ih z als die normale Knoteninterpolierende von z wählen:
1/2
kz − Ih zkT + hT kz − Ih zk∂T ≤ ci h2T k∇2 zkT .
(3.6.156)
Damit folgt dann wieder mit den oben definierten Residuen ρT (uh ) und ρ∂T (uh ) :
X
−1/2
h2T kf + ∆uh kT + 21 hT k[∂n uh ]k∂T \∂Ω k∇2 zkT
keh k ≤ ci
T ∈Th
≤ c
Wegen
X
T ∈Th
1/2 X
1/2
h4T ρT (uh )2 + ρ∂T (uh )2
k∇2 zk2T
.
T ∈Th
X
T ∈Th
k∇2 zk2T
ergibt sich schließlich das folgende Resultat:
1/2
= k∇2 zk ≤ 1,
Satz 3.18 (a posteriori L2 -Normfehler): Für den Fehler eh := u − uh gilt die a posteriori
Abschätzung bzgl. der L2 -Norm:
X
1/2
h4T ρT (uh )2 + ρ∂T (uh )2
.
(3.6.157)
keh k ≤ ηL2 (uh ) := c
T ∈Th
Diese Abschätzung ist ebenfalls scharf“ in folgendem Sinne:
”
X
1/2
h4T kf k2T
.
ηL2 (uh ) ≤ ckeh k + c
(3.6.158)
T ∈Th
Beweis: Der Beweis verläuft analog wie bei der Energienorm-Fehlerabschätzung. Diesmal basiert
die Herleitung der Umkehrabschätzung (3.6.158) auf der zellweisen Beziehung
2
k∂n vk2∂T ≤ c∗ {hT k∆vk2T + h−3
T kvkT },
(3.6.159)
welche ebenfalls durch Transformation von der Einheitszelle abgeleitet wird. Der Rest des Beweises sei als Übungsaufgabe gestellt.
Q.E.D.
3.6 A posteriori Fehleranalyse und Gittersteuerung
139
c) Punktfehler-Schätzer:
Zur Abschätzung des Fehlers eh (a) in einem festen Punkt P ∈ Ω würden wir gern das Fehlerfunktional J(ϕ) := ϕ(P ) wählen. Dieses ist auf stetigen Funktionen, aber nicht auf dem ganzen
Lösungsraum V = H01 (Ω) definiert, so daß die oben entwickelte allgemeine Theorie nicht unmittelbar anwendbar wäre. Deshalb wählen wir eine Kugelumgebung Bε := {x ∈ Rd : |x − P | < ε}
des Punktes P und arbeiten statt dessen mit dem regularisierten Funktional
Z
−1
ϕ dx,
Jε (ϕ) := |Bε |
Bε
welches sicher auf ganz V definiert und beschränkt ist. Der Regularisierungsparameter ε wird
üblicherweise gleich einer vorgegebenen Fehlertoleranz T OL gesetzt. Für hinreichend glatte
Funktionen ϕ ist dabei (Fehler der Mittelpunktregel)
|ϕ(P ) − Jε (ϕ)| ≤ c ε2 .
(3.6.160)
Wir betrachten den Fall d = 2 . Die Lösung zε ∈ V des zugehörigen dualen Problems
(∇ϕ, ∇zε ) = Jε (ϕ)
∀ϕ ∈ V,
(3.6.161)
ist dann eine regularisierte“ Greensche Funktion und verhält sich wie
”
−2
zε (x) ≈ log(|x−P | + ε),
|∇2 zε | ≈ |x−P | + ε .
Die Gewichte in der a posteriori Fehlerabschätzung (3.6.147) gestatten daher die Abschätzung
ωT (zε ) + ω∂T (zε ) ≤ ch2T k∇2 zε kT ≤ c h3T d−2
T ,
mit dT := maxx∈T {|x−a| + ε} . Wir finden also als obere Schranke für den Punktfehler:
|eh (P )| ≤ c
X
T ∈Th
ρT (uh )h2T k∇2 zε kT + cε2 ≤ c
X
ρT (uh )
T ∈Th
h3T
+ cε2 .
d2T
In diesem Fall ist aber die a-priori Bestimmung der Konstante c praktisch unmöglich.
d) Ein hyper-singulärer Fall
Einen kuriosen Sonderfall stellt die folgende Auswertungsgröße dar:
Z
Z
Z
∆u dx = − f dx .
∂n u ds
=
J(u) :=
∂Ω
Ω
Ω
Dieser mittlere Normalfluß“ ließe sich offenbar auch direkt aus den Daten f berechnen. Zur
”
Illustration wollen wir aber annehmen, daß diese Information nicht ausgenutzt wird, sondern
statt dessen J(u) durch J(uh ) approximiert wird. Das Funktional J(·) ist wieder nicht auf
dem ganzen Lösungsraum V definiert (wohl aber auf der reguläreren Lösung u ∈ V ∩ H 2 (Ω) ).
Zur Anwendung unserer allgemeinen Theorie muß das Funktional daher zunächst regularisiert
werden. Für das Folgende nehmen wir der Einfachheit halber an, daß Ω der Einheitskreis im
R2 ist. Für ε = T OL setzen wir Sε := {x ∈ Ω, dist{x, ∂Ω} < ε} und erhalten für glattes ϕ :
140
Finite-Elemente-Verfahren für elliptische Probleme
−1
Jε (ϕ) := ε
Z
∂r ϕ dx =
Z
∂Ω
Sε
∂r ϕ ds + O(ε).
Dabei ist ∂n auf Sε auf natürliche Weise durch Fortsetzung von ∂Ω definiert. Die Lösung
zε ∈ V des zugehörigen dualen Problems
(∇ϕ, ∇zε ) = Jε (ϕ)
∀ϕ ∈ V,
ist dann gegeben durch
zε = −1 in Ω\Sε ,
zε (x) = −ε−1 (1−|x|)
Hieraus ergibt sich die Fehlerabschätzung
X
h2T ρT (uh )k∇2 zε kT ≈
|Jε (eh )| ≤ ci
T ∈Th
auf Sε .
X
... ,
T ∩Sε 6=∅
d.h.: Die Zellen im Innern von Ω tragen nicht zum Gesamtfehler bei. Daher wäre die beste
Strategie zur Gitterverfeinerung, in jedem Verfeinerungszyklus jeweils nur die Zellen entlang
des Randes ∂Ω zu verfeinern. Dies setzt aber voraus, daß die Elemente des Lastvektors, bn =
(n)
(f, ϕh )Ω , exakt berechnet werden. Abbildung 3.11 zeigt ein automatisch verfeinertes Gitter
nach 7 Verfeinerungszyklen sowie die numerisch bestimmte duale Lösung auf diesem Gitter. Die
zugehörigen Ergebnisse sind in Tabelle 3.1 gelistet.
Abbildung 3.11: Verfeinertes Gitter nach 7 Verfeinerungszyklen (links) und die auf diesem Gitter numerisch bestimmte Lösung (rechts).
ηE
optimale“ Strategie
”
L
N
J(eh )
L
N
J(eh )
1
1024
2.91 + 0
1
559
2.90 + 0
2
4096
1.50 + 0
2
1294
1.50 + 0
3
16384
3
3079
4
64768
7.49 − 1
4
7174
5
253858
3.77 − 1
7.48 − 1
5
16738
6
memory
1.73 − 1
exhausted
6
38146
3.62 − 1
1.67 − 1
6.93 − 2
Tabelle 3.1: Resultate mit dem Energienorm-Fehlerschätzer ηE (uh ) und der optimalen“ Strategie.
”
3.6 A posteriori Fehleranalyse und Gittersteuerung
141
Numerische Auswertung des a-posteriori Fehlerschätzers
Wir wollen nun kurz die numerische Auswertung der Fehleridentität (3.6.142) diskutieren:
X J(eh ) = η(uh ) :=
(3.6.162)
(f + ∆uh , z − ψh )T − 12 ([∂n uh ], z − ψh )∂T .
T ∈Th
Wir wählen dazu ψh := Ih z , die Knoteninterpolierende von z . Die Qualität der Auswertung
wird durch den sog. Effektivitätsindex“ gemessen:
”
η(u ) h Ieff := .
J(eh )
Alle Methoden der Auswertung von (3.6.162) bedienen sich einer numerischen Lösung zh ∈ Vh
des dualen Problems, welche im einfachsten Fall durch direkte Diskretisierung von (3.6.162) mit
Hilfe des vorliegenden Verfahrens gewonnen wird:
(∇ϕh , ∇zh ) = J(ϕh )
∀ϕh ∈ Vh .
(3.6.163)
Wir unterscheiden zwei Anwendungen der Fehleridentität (3.6.162):
– Überprüfung der Genauigkeit einer auf dem Gitter Th berechneten Näherungslösung uh
und Abbruchkriterium für einen Gitterverfeinerungsprozess: η(uh ) ≤ T OL ?
– Grundlage zur Gewinnung von Kriterien ( Verfeinerungsindikatoren“ ηT ) zur lokalen Git”
teranpassung.
Die folgenden Strategien zur Auswertung von η(uh ) kommen in Betracht (hier beschrieben für
den Fall d-linearer Ansätze auf Rechteckgittern im Rd ):
1. Die duale Lösung z wird durch eine Näherung höherer Ordnung approximiert. Zum Bei(2)
spiel liefert die Approximation z ≈ zh mit der d-quadratischen Ritz-Projektion das
gewünschte asymptotische Verhalten limT OL→0 Ieff = 1 .
2. Die duale Lösung z wird durch eine zellblockweise (je 2d Zellen) d-quadratische Inter(2)
polierende der d-linearen Ritzapproximation approximiert: z ≈ Ih zh . In diesem Fall
beobachtet man limT OL→0 Ieff < 1 (≈ 0.5 − 0.9).
3. Die Differenz z−Ih z wird in Anlehnung an die oben zitierte Interpolationsfehlerabschätzung
mit Hilfe eines skalierten Differenzenquotienten der d-linearen Ritz-Proktion approximiert:
|z −Ih z| ≈ ci,T h2T |∇2h zh | . Dies führt in der Regel auf eine grobe Überschätzung des Fehlers.
In der Praxis wird meist die billige“ und ausreichend genaue Prozedur (2) verwendet. Dabei
”
brauchen insbesondere keine Interpolationskonstanten ci spezifiziert zu werden.
3.6.3 Strategien zur Gittersteuerung
Ziel ist es, den Fehler in dem durch das Fehlerfunktional J(·) beschriebenen Maß unter eine
gewisse vorgegebene Toleranz |J(eh )| ≤ T OL zu bringen und dabei mit dem vorhandenen Speicher auszukommen. Es können also nur eine bestimmte Anzahl von Zellen N ≤ Nmax verwaltet
142
Finite-Elemente-Verfahren für elliptische Probleme
werden. Die Gitterverfeinerung erfolgt dabei standardmäßig durch Kantenbisektion“, d.h. durch
”
Unterteilung einer Zelle T in 2d Teilzellen. Bei Gittervergröberung werden mehrere Zellen zu
einer Makrozelle zusammengefaßt. Wir werden im folgenden hauptsächlich Vierecks- oder Hexaedergitter betrachten. Bei Unterteilung einer Zelle entstehen sog. hängende“ Knoten auf den
”
Zellrändern, so daß das neue Gitter zunächst nicht zulässig wäre. Diese Unzulässigkeit kann
durch verschiedenen Methoden aufgehoben werden. Die meist gebräuchliche ist die Elimination
der zu den hängenden Knoten gehörenden Freiheitsgraden durch lineare Interpolation, wodurch
der entstehende diskrete Ansatzraum wieder konform wird: Vh ⊂ V (s. Abb. 3.12). Dabei wird
der fiktive Knotenwert vh (P ) in einem hängenden Knoten P auf einer Kante Γ ⊂ ∂T mit
Endpunkten P ′ , P ′′ durch die Interpolationsvorschrift vh (P ) := 21 {vh (P ′ )+vh (P ′′ )} festgelegt.
Alle im folgenden gezeigten Beispielrechnungen bedienen sich dieser Technik.
4
x
Abbildung 3.12: Verfeinertes Rechteckitter mit hängendem“ Knoten sowie die Basisfunktion
”
zum Mittelknoten.
Ausgangspunkt zur Gewinnung von Kriterien für die lokale Gitteranpassung ist eine aposteriori Fehlerschätzung der Form
X
|J(eh )| ≈
ηT ,
(3.6.164)
T ∈Th
mit lokalen Fehlerindikatoren“ ηT , welche durch Auswertung der Fehleridentität (3.6.142) mit
”
Hilfe einer der oben beschriebenen Methoden gewonnen werden. Wir erhalten bei Verwendung
von Methode (2):
(2)
(2)
ηT := (f + ∆uh , Ih zh − zh )T − 12 ([∂n uh ], Ih zh − zh )∂T \∂Ω (3.6.165)
und mit Methode (3):
ηT := ci h2T {ρT (uh ) + ρ∂T (uh )} k∇2h zh kT .
(3.6.166)
Wir beschreiben im folgenden das allgemeine Schema eines auf lokalen Fehlerindikatoren ηT
basierenden Gitteranpassungsprozesses:
Nachdem über das Gebiet Ω ein Grobgitter T0 := Th0 mit einer Gitterweitenverteilung h0
gelegt worden ist, sei der Prozeß der adaptiven Gittersteuerung schon L-mal durchlaufen worden.
Wir bestimmen nun auf dem Gitter TL := ThL die approximative Lösung uL ∈ VL := VhL .
Ebenso wird die diskrete duale Lösung zL ∈ VL auf TL berechnet. Nun können die lokalen
Fehlerindikatoren ηT gemäß (3.6.165) oder (3.6.166) für jede Zelle T ∈ TL ausgewertet werden.
3.6 A posteriori Fehleranalyse und Gittersteuerung
143
Wir bezeichnen mit NL ≈ dim(VL ) die Anzahl der Zellen des Gitters TL .
Abbruchabfrage: Ist das Abbruchkriterium η(uh ) ≤ 21 T OL auf dem Gitter TL erfüllt, wird
der Adaptionsprozess abgebrochen und zL als Näherung zu u akzeptiert, welche die Zielgröße
J(u) durch J(uh ) mit der gewünschten Genauigkeit T OL approximiert. Andernfalls wird ein
neuer Adaptionszyklus begonnen.
Adaptionszyklus: Der Übergang vom Gitter TL zum nächsten Gitter TL+1 erfolgt nach einer
der im folgenden beschriebenen Adaptionsstrategien“. Zunächst werden die Zellen T ∈ TL nach
”
der Größe ihrer Indikatorwerte ηT angeordnet,
{Ti , i = 1, ..., NL } :
ηT,1 ≥ ... ≥ ηT,i ≥ ηT,i+1 ≥ ... ≥ ηT,NL .
I) Fehlerbalancierungs-Strategie: Das Ziel ist, die Indikatorwerte so zu balancieren, daß
ηT ≈
T OL
,
NL
T ∈ TL .
(3.6.167)
Dann würde wie gewünscht gelten:
|J(eL )| ≈ η(uL ) ≈
X T OL
= T OL.
NL
T ∈TL
Das Problem bei dieser Strategie ist zum einen, daß die Zahl NL sich während des Verfeinerungsprozesses ständig ändert, und zum anderen, daß die Balancierungsvorschrift (3.6.167) die
delikate Wahl von Parametern 0 < α < β < 1 erfordert:
α
T OL
T OL
≤ ηT ≤ β
.
NL
NL
Für die folgende Diskussion setzen wir der Einfachheit halber α = 1/2, β = 1 . Im ersten Schritt
testet man, ob ηT,1 ≤ T OL/NL ist. Wenn ja“, ist das Abbruchkriterium erfüllt, wenn nein“,
”
”
wird die Zelle T1 verfeinert. Dies führt zu einer Erhöhung von NL auf NL + 3 . Danach wäre
es möglich, daß für alle übrigen Zellen TL,i gilt:
T OL
T OL
≤ ηT,i ≤
.
NL + 3
NL
Der Verfeinerungszyklus wäre also bereits nach dem ersten Schritt zu beenden und auf dem
erhaltenen Gitter TL+1 eine neue Näherungslösung uL+1 zu berechnen. Dies wäre aber sehr
ineffizient. Der Verfeinerungsprozeß sollte daher beschleunigt werden. Dazu überprüft man von
dem Indikator ηT,1 ausgehend und beginnend mit j = 0 , ob
ηT,i ≤
T OL
.
NL + 3j
Ist dies nicht erfüllt, wird das Element Ti geteilt, die Zähler j und i um Eins erhöht, und
man geht zum nächstkleineren ηT,i über. Ist die Bedingung allerdings erfüllt, hat man das
neue Gitter TL+1 gefunden. Diese Balancierungsstrategie ist zwar potentiell optimal, jedoch
mit aufwendigen Abfragen verbunden. Mögliche alternative Strategien, die einfacher sind, aber
weniger gute Ergebnisse liefern, sind die folgenden.
144
Finite-Elemente-Verfahren für elliptische Probleme
II) Fest-Raten-Strategie“: Ziel ist es, in jedem Adaptionszyklus die Anzahl der Gitterzellen
”
NL mit einer festen Rate zu erhöhen oder den Fehlerschätzwert η(uL ) mit einer festen Rate zu
verkleinern. Ausgangspunkt ist wieder eine Anordnung der Zellen von TL nach der Größe der
zugehörigen Indikatorwerte. Zu vorgewählten Prozentsätzen X% und Y % werden die Zellen
so gruppiert, daß (and der Zellanzahl orientierte Strategie)
#{Ti , . . . , TN∗ } ≈
X
NL ,
100
#{TNL −N ∗ +1 , . . . , TNL } ≈
Y
NL ,
100
oder alternativ (am Schätzwert orientierte Strategie)
N∗
X
i=1
ηT,i ≈ Y η(uL ),
NL
X
i=NL
−N ∗ +1
ηT,i ≈ X η(uL ).
Dann werden die Zellen Ti , . . . , TN∗ verfeinert und die Zellen TNL −N ∗ +1 , . . . , NL vergröbert.
Exakte“ Gitteroptimierung
”
Zum Abschluß wollen wir noch diskutieren, daß die Fehlerschätzung (3.6.147)
X
ρT (uh ) ωT (zh )
|J(eh )| ≈ η :=
(3.6.168)
T ∈Th
im Prinzip auch zur direkten Bestimmung eines optimalen“ Gitters mit Gitterweitenfunktion
”
h = h(x) verwendet werden könnte. Dies wird als Nebenprodukt auch eine Rechtfertigung für
die Äquilibrierungsstrategie“ liefern. Zu lösen sind die folgenden Optimierungsaufgaben:
”
(OP I) Bei vorgegebener Fehlertoleranz TOL soll die zu deren Erreichung benötigte Anzahl von
Zellen N (d.h. der numerische Aufwand) minimiert werden:
N → M IN,
η ≤ T OL.
(3.6.169)
(OP II) Bei vorgegebener maximalen Zellzahl Nmax (d.h. begrenzter Speicherkapazität) soll der
Fehler (genauer der Fehlerschätzer) minimiert werden:
η → M IN,
N ≤ Nmax .
(3.6.170)
Wir diskutieren im folgenden nur die für die Praxis relevantere Fragestellung (OP II). Das Optimierungsproblem (OP I) läßt sich mit analogen Argumenten behandeln (Übungsaufgabe). Die
grundlegende Annahme ist, daß die Größen ρT (uh ) sowie ωT (zh ) (nach geeigneter Skalierung)
für T OL → 0 zunehmend bessere, lokale Approximationen gewisser kontinuierlicher Funktionen
Φ(x) bzw. Ψ(x) sind:
−3/2
−1
1
kh−1
h−1
T [∂n uh ]k∂T \∂Ω → Φu (xT ),
T ρT (uh ) = hT kf + ∆uh kT + 2 hT
o
n
−5/2
kz
−
I
zk
,
h
kz
−
I
zk
→ Ψz (zT ),
h−3 ωT (zh ) = max h−3
T
h
h
∂T
T
T
(3.6.171)
(3.6.172)
wobei xT ein gemeinsamer Punkt einer Folge von Zellen T ist. Diese Annahme ist natürlich
im strengen Sinne nicht realistisch, da auf allgemeinen Gitterfolgen (Th )h→0 ein sehr unre-
3.6 A posteriori Fehleranalyse und Gittersteuerung
145
gelmäßiges Konvergenzverhalten auftreten kann. Unter der obigen Annahme gilt mit der Funktion A(x) := Φ(x)Ψ(x) :
Z
X
X
h(x)2 A(x) dx.
(3.6.173)
h4T h−4
ρ
(u
)
ω
(z
)
≈
ρT (uh ) ωT (zh ) =
T
T h
h
T
Ω
T ∈Th
T ∈Th
Für die Zellzahl N haben wir die Darstellung
N =
X
X
1 =
h2T h−2
T
T ∈Th
T ∈Th
Z
≈
h(x)−2 dx.
(3.6.174)
Ω
Damit können wir die Optimierungsaufgabe (OP II) näherungsweiser in kontinuierlicher Form
schreiben als:
Z
Z
2
h(x)−2 dx = Nmax .
(3.6.175)
h(x) A(x) dx → M IN, N (h) :=
F (h) :=
Ω
Ω
Hierbei haben wir o.B.d.A. die Ungleichungsbedingung N ≤ Nmax durch eine Gleichungsbedingung N = Nmax ersetzt, da sich ein minimaler Fehler sicherlich unter maximaler Ausnutzung der möglichen Zellzahl ergibt. Dieses restringierte Optimierungsproblem wird nun mit
dem Lagrange-Formalismus der Variationsrechnung gelöst. Dazu definieren wir die Lagrange”
Funktion“
L(h, λ) := F (h) + λ {N (h) − Nmax }
mit einem skalaren Lagrange-Parameter λ ∈ R. Jede Lösung des Optimierungsproblems ist dann
notwendig stationärer Punkt (Sattelpunkt) von L . Zur Bestimmung eines solchen Sattelpunkts
machen wir den Ansatz
d
L(h + tϕ, λ + tµ)|t=0 = 0
dt
∀ϕ ∈ C(Ω), ∀µ ∈ R.
Auswertung dieser Beziehung ergibt
Z
Z
2 h(x)A(x)ϕ(x) dx − 2λ h−3 (x)ϕ(x) dx = 0
Ω
Ω
sowie
µ
bzw. notwendig
Z
−2
h(x)
Ω
−3
h(x)A(x) − λh
dx − Nmax
= 0 ∀µ ∈ R,
h(x)−2 dx = Nmax .
Ω
h(x) =
W :=
Z
(x) = 0,
Hieraus ergibt sich, daß
und weiter
Z
Ω
A −1/4
λ
∀ϕ ∈ C(Ω)
,
A(x)1/2 dx = λ1/2 Nmax .
146
Finite-Elemente-Verfahren für elliptische Probleme
Damit erhalten wir einerseits den Lagrange-Parameter,
λ=
W 2
,
Nmax
und andererseits eine Gleichung für die gesuchte optimale“ Gitterweitenverteilung
”
W 1/2
hopt (x) =
A(x)−1/4 .
Nmax
(3.6.176)
(3.6.177)
Als Nebenprodukt dieser Rechnung ergibt sich für die optimale Gitterweite die Beziehung
ηT = h4T AT = λ ≡ konst.,
(3.6.178)
d.h.: Die an der Äquilibrierung der lokalen Fehlerindikatoren ηT orientierten Gittersteuerungsstrategien führen tatsächlich auf optimale Gitterweitenverteilungen.
Wir erwähnen noch, daß das zu (OP I) duale“ Optimierungsproblem (OP II) auf die folgende
”
Lösung führt:
hopt (x) =
T OL 1/2
W
A(x)−1/4 .
(3.6.179)
Die Größe W ist bei den üblichen Fehlerfunktionalen wohl definiert; dies beinhaltet sogar so
singuläre Fälle wie die Punktauswertung von Ableitungen J(u) = ∂i u(a) , A(x) ∼ |x − a|−3 .
Erst die Auswertung von zweiten Ableitungen J(u) = ∂i2 u(a) macht hier Probleme.
3.6.4 Ein Testbeispiel
Wir wollen die bisher erzielten Ergebnisse anhand eines konkreten Beispiels illustrieren. Dazu
wird wieder das übliche Modellproblem betrachtet:
−∆u = f
in Ω,
u = 0 auf ∂Ω.
(3.6.180)
Wir wollen den Punktwert ∂1 u(P ) für ein P ∈ Ω berechnen. Das zugehörige Funktional ist
wieder nicht auf dem ganzen Lösungsraum V = H01 (Ω) definiert und muß regularisiert werden.
Wir setzen dazu mit ε := T OL :
Z
−1
Jε (ϕ) := |Bε |
∂1 u dx .
(3.6.181)
Bε
Testfall 1: Sei Ω := (−1, 1)2 und P = 0 (siehe Abb. 3.13). Die zu dem Funktional Jε (·)
gehörige duale Lösung zε verhält sich dann wie |∇2 zε (x)| ≈ (|x| + ε)−3 . Dies impliziert, daß
|∂1 eh (0)| ≈ ci
X h4
T
ρT (uh ),
d3T
T ∈Th
(3.6.182)
3.6 A posteriori Fehleranalyse und Gittersteuerung
147
mit dT := |xT | + ε und dem Mittelpunkt xT von T . Wir wollen hierfür eine optimale Gitterweitenverteilung bestimmen. Ausgangspunkt ist die Äquilibrierungsbedingung
ηT ≈
h4T
T OL
≈
3
N
dT
⇒
3/2
h2T ≈ dT
T OL 1/2
N
.
Hieraus ergibt sich
N=
X
h2T h−2
T =
N 1/2
N 1/2 X
−3/2
≈
h2T dT
T OL
T OL
T ∈Th
T ∈Th
und folglich Nopt ≈ T OL−1 . Bei Verwendung des Energienorm-Fehlerschätzers (3.6.152) zur
Gitterverfeinerung ergibt sich dagegen die Gitterkomplexität Nopt ≈ T OL−2 . Dieses vorhergesagte Verhalten der verschiedenen Gitterverfeinerungsprozesse wird durch die numerischen
Ergebnisse in Tabelle 3.2 gut bestätigt.
TOL
N
L
ηweight(uh )
Ieff
4−2
|∂1 eh (0)|
148
6
7.51e-1
5.92e-2
0.08
4−3
940
9
4.10e-1
1.42e-2
0.03
4−4
4912
12
4.14e-3
3.50e-3
0.65
4−5
20980
15
2.27e-4
9.25e-4
4.16
4−6
86740
17
5.82e-5
2.38e-4
4.16
Tabelle 3.2: Resulte der Berechnung von ∂1 u(0) unter Verwendung des gewichteten a posteriori
Fehlerschätzers ηweight (uh ) für verschiedenen Verfeinerungslevel L ; der Effektivitätsindex“ ist
”
definert durch Ieff := |ηweight (uh )/∂1 eh (0)|.
Wir betonen, daß die richtige Wahl des Regularisierungsparameters ε = T OL in (3.6.181)
für den Lösungsprozess wichtig ist. Die triviale Alternative ε = hmin ist automatisch realisiert,
wenn zur Berechnung der Gewichte ωT (z) die numerisch bestimmte, diskrete, duale Lösung
zh ∈ Vh verwendet wird (siehe Abb. 3.13). Dies kann bei sehr singulären“ Funktionalen zu
”
starker lokaler Überverfeinerung, d.h. zu unnötig vielen Verfeinerungsschritten, führen.
Abbildung 3.13: Verfeinerte Gitter und numerisch bestimmte duale Lösung zur Berechnung
von ∂1 u(0) auf dem Quadrat bei Verwendung des a posteriori Fehlerschätzers ηweight (uh ) mit
TOL = 4−4 .
148
Finite-Elemente-Verfahren für elliptische Probleme
Testfall 2: Sei nun Ω das Rechteckgebiet Ω = (−1, 1) × (−1, 3) mit Schlitz bei (0, 0) (siehe
Abb. 3.15). Die Präsenz der (einspringenden) scharfen Ecke mit Innenwinkel ω = 2π bewirkt in
der schwachen Lösung eine Eckensingularität“ der Form s = ψ(θ)r 1/2 , d.h. eine Singularität
”
im Gradienten. Wir wollen illustrieren, wie diese Eckensingularität mit der durch die Gewichte
ωT (z) im Fehlerschätzer induzierten zusammenspielt.
Wir sehen in Abb. 3.15, daß der gewichtete Fehlerschätzer Zellen sowohl bei der Schlitzspitze
(zur Unterdrückung des Pollutionseffekts“), aber auch beim Auswertungspunkt konzentriert,
”
während der Energienorm-Fehlerschätzer wesentlich stärker an der Schlitzspitze und natürlich
gar nicht im Auswertungspunkt verfeinert.
"ETA_weight"
"ETA_E"
0.1
"ERROR"
"ETA_weight"
0.01
e_x(-2.,.5)
e_x(-2.,.5)
0.01
0.001
0.001
0.0001
1e-05
0.0001
1000
10000
Number of elements N
100000
1000
10000
Number of elements N
Abbildung 3.14: Vergleich der Effizienz von ηE (uh ) und ηweight (uh ) auf dem Schlitzgebiet.
Abbildung 3.15: Verfeinerte Gitter mit ungefähr 5000 Zellen zur Berechnung von ∂1 u(P ) , erzeugt mit dem gewichteten Fehlerschätzer ηweight (uh ) (mittig) sowie dem Energienorm-Fehlerschätzer ηE (uh ) (rechts).
3.7 Übungen
149
3.7 Übungen
Übung 3.1: Man formuliere das Ritzsche Verfahren mit endlich dimensionalen Teilräumen geeigneter Sobolew-Raume H m (Ω) für die folgenden Aufgabenstellungen:
a) Neumannsche RWA des Laplace-Operators:
−∆u = f in Ω,
∂n u = g auf ∂Ω.
b) Eigenwertproblem des Laplace-Operators:
−∆u = λu in Ω,
u = 0 auf ∂Ω.
c) Dirichletsche RWA des “biharmonischen” Operators:
−∆2 u = f in Ω,
u = ∂n u = 0 auf ∂Ω.
Dabei seien jeweils das Gebiet Ω sowie die Daten f, g als genügend regulär und kompatibel angenommen. Man versuche, hierfür analog zur Vorlesung “Bestapproximations”-Aussagen
herzuleiten.
Übung 3.2: Seien V ein Hilbert-Raum mit Skalarprodukt (·, ·)V und zugehöriger Norm k·kV
und a(·, ·) sowie l(·) bilineare bzw. lineare Formen auf V mit den Eigenschaften
|a(v, w)| ≤ αkvkV kwkV ,
|a(v, v)| ≥ κkvk2V ,
|l(v)| ≤ βkvkV ,
v, w ∈ V
v, w ∈ V
v∈V
(Beschränktheit),
(“V-Elliptizität”),
(Beschränktheit).
Dann hat die Variationsgleichung
a(u, ϕ) = l(ϕ)
∀ϕ ∈ V
nach dem Satz von Lax-Milgram eine eindeutige Lösung u ∈ V . Für endlich dimensionale
Teilräume Vh ⊂ V werden approximative Lösungen uh ∈ Vh bestimmt durch die “GalerkinGleichungen”
a(uh , ϕh ) = l(ϕh ) ϕh ∈ Vh .
a) Man zeige hierfür die (eindeutige) Existenz der “diskreten” Lösungen uh ∈ Vh und die
Fehlerabschätzung
α
inf ku − ϕh kV .
ku − uh kV ≤
κ ϕh ∈Vh
b) Man wende das Resultat von (a) zum Nachweis der Konvergenz der Galerkin-Approximation
des Diffusions-Konvektions-Problems
−∆u + ∂1 u = f in Ω,
u = 0 auf ∂Ω,
auf einem regulären Gebiet Ω ⊂ R2 mit rechter Seite f ∈ L2 (Ω) an.
c) Man versuche das Resultat von (a) für den Fall zu verallgemeinern, daß die Biliearform a(·, ·)
150
Finite-Elemente-Verfahren für elliptische Probleme
nicht V -elliptisch sondern nur “koerzitiv” ist, d.h.:
a(v, ϕ)
≥ γkvk,
ϕ∈V \{0} kϕkV
sup
a(ϕ, v)
≥ γkvk,
ϕ∈V \{0} kϕkV
sup
v ∈ V.
Worin bestehen hierbei die Probleme?
Übung 3.3: Das Modellproblem
−∆u = f in Ω,
u|∂Ω = 0,
auf dem Einheitsquadrat Ω = (0, 1)2 werde auf einem äquidistanten, kartesischen Gitter mit der
Gitterweite h mit Hilfe der Finite-Elemente-Methode mit stückweise bilinearen Ansatzfunktionen diskretisiert. Man stelle die zugehörigen Systemmatrizen auf:
a) mit exakter Integration,
b) unter Verwendung der 2-dimensionalen “Tensorprodukt-Trapezregel”
4
QT (f ) :=
|T | X
f (ai ),
4
ai Eckpunkte der Zelle T.
i=1
Welche Besonderheit ergibt sich?
Übung 3.4: Man überlege (etwa durch Konstruktion von Beispielen), in wie weit die folgenden
Bedingungen an eine Folge von (im Sinne der Vorlesung regulären) Zerlegungen {Th }h>0 eines
Gebiets Ω ⊂ R2 (in Dreiecke oder Vierecke) äquivalent sind:
a) Die inneren Winkel aller Zellen T ∈ Th sind gleichmäßig für T ∈ Th und h > 0 von Null
wegbeschränkt (“minimum angle condition”).
b) Für die Inkreisradien ρT und Umkreisradien hT der Zellen T ∈ Th gilt (“uniform shape
condition”):
nh o
T
< ∞.
sup
T ∈Th , h>0 ρT
c) Für die Seiten Γ ⊂ ∂T jeder Zelle T ∈ Th gilt
max |Γ| ≤ c min |Γ|
Γ⊂∂T
Γ⊂∂T
mit einer von T unabhängigen Konstante c.
(1)
Übung 3.5: Sei Vh ⊂ H 1 (Ω) der Raum der stückweise linearen finiten Elemente bzgl. einer
regulären Triangulierung von Ω ⊂ R2 . Mit Hilfe des L2 -Skalarprodukts (·, ·) ist die sog. “L2 (1)
Projektion” Ph : L2 (Ω) → Vh definiert durch die Vorschrift
(1)
(Ph u, ϕh ) = (u, ϕh ) ∀ϕh ∈ Vh .
a) Man leite eine Fehlerabschätzung für die L2 -Norm ku − Ph uk her, zunächst unter der Annahme v ∈ H 2 (Ω) . Was würde man unter den schwächeren Regularitätsannahmen v ∈ H 1 (Ω)
3.7 Übungen
151
oder v ∈ L2 (Ω) erhalten?
b) Welche verbesserte Abschätzung erhält man bzgl. der “negativen” Sobolew-Norm
ku − Ph uk−1 :=
(u − Ph u, ϕ)
≤ ch? kvkH 2 ?
k∇ϕk
1
ϕ∈H (Ω)
sup
0
Übung 3.6: Man begründe anhand der eindimensionalen Poisson-Gleichung
−u′′ (x) = f (x) in Ω = (0, 1),
u(0) = u(1) = 0,
(1)
daß für die Ritz-Projektion Rh : H01 (Ω) → Vh eine Abschätzung wie in Aufgabe 6.3b nicht
gelten kann. (Hinweis: Man verifiziere, daß in diesem Fall die Ritz-Projektion Rh u identisch mit
der Knoteninterpolierenden Ih u ist.)
Übung 3.7: Die Dirichletsche Randwertaufgabe
−∆u = f in Ω,
u = 0 auf ∂Ω,
auf einem konvexen Polygongebiet Ω ⊂ R2 werde mit einem Galerkin-Verfahren mit An(1)
satzräumen Vh ⊂ V := H01 (Ω) von linearen” finiten Elementen approximiert. Mit welcher
”
Ordnung konvergieren
i) der gewichtete Mittelwert über Ω ( ω ∈ H 1 (Ω) eine glatte Gewichtsfunktion):
Z
Z
uω dx (h → 0) ?
uh ω dx →
Ω
Ω
ii) der quadratischen Mittelwert über einen glatten geschlossenen Weg Γ ⊂ Ω :
Z
Z
u2 ds (h → 0) ?
u2h ds →
Γ
Γ
(Hinweis: Zur Erzielung eines optimalen Resultats verwende man die Variante des Spurlemmas
für Funktionen in H 1,1 (Ω) und die Fehlerabschätzungen aus der Vorlesung.)
Übung 3.8: Man untersuche, ob die folgenden Sätze von Funktionalen für die angegebenen
Polynomräume “unisolvent” sind. Dabei bezeichnen ai die Ecken, mi die Seitenmitten sowie
bij (j = 1, 2) jeweils zwei Gauß-Punkte auf der Kante Γi , i = 1, . . . , d + 1 , und z den Schwerpunkt des Elements T .
i) T (kartesisches) Einheitsdreieck:
P (T ) = P3 (T ),
p(ai ), ∇p(ai ), p(z);
P (T ) = P3 (T ),
p(ai ), p(bij ), p(z);
P (T ) = P5 (T ),
p(ai ), ∇p(ai ), ∇2 p(ai ), ∂n p(mi ).
152
Finite-Elemente-Verfahren für elliptische Probleme
ii) T (kartesisches) Einheitsquadrat:
P (T ) = Q̃1 (T ) := P1 (T ) ⊕ span{x2 − y 2 },
3
3
P (T ) = Q̃3 (T ) := P3 (T ) ⊕ span{x y, xy },
p(mi );
p(ai ), ∇p(ai ).
Übung 3.9: Sei Ω ⊂ R2 ein Polygongebiet und Th = {T } eine Triangulierung von Ω . Man
betrachte die beiden mit den kubischen Ansätzen aus Aufgabe 7.2 gebildeten Ansatzräumen
(3)
(3)
Sh und S̃h und bestimme deren Dimensionen asymptotisch in Abhängigkeit von h auf
gleichmäßigen Triangulierungen. Wieviele von Null verschiedene Elemente haben die zugehörigen
Steifigkeitsmatrizen pro Zeile bei der Approximation der Laplace-Gleichung?
Übung 3.10: Die Neumannsche Randwertaufgabe
−∆u + u = f in Ω,
∂n u = 0 auf ∂Ω,
auf einem konvexen Polygongebiet Ω ⊂ R2 soll mit einem Galerkin-Verfahren mit Ansatzräumen
(1)
Vh ⊂ V := H01 (Ω) von linearen” finiten Elementen approximiert werden.
”
a) Man formuliere diese Approximation, d. h. die Ansatzräume Vh ⊂ V := H 1 (Ω) und die
zugehörigen Variationsgleichungen.
b) Man leite Fehlerabschätzhungen in der H 1 - und der L2 -Norm her.
c) Wie muß dieser Ansatz im Fall eines krumm berandeten Gebiets und einer inhomogenen
Neumann-Randbedingung ∂n u = g auf ∂Ω zur Erzielung einer konformen Approximation
modifiziert werden?
Übung 3.11: Die Randwertaufgabe
−∆u = f in Ω,
u|∂Ω = 0,
auf einem Gebiet Ω ⊂ R2 mit (stückweise) kubisch (z. B. CAD-Daten mit kubischen SplineFunktionen) parametrisiertem C 2 -Rand ∂Ω soll mit einem (isoparametrischen) kubischen FiniteElemente-Ansatz diskretisiert werden. In diesem Fall hat die Lösung mindestens die Regularitätsstufe u ∈ H 3 (Ω) (i. Allg. aber u 6∈ H 4 (Ω) ), und es gilt die a priori Abschätzung
kuk2+k ≤ ck∆ukk ,
k = 0, 1.
a) Man gebe einen geeigneten Ansatzraum an. Welche Konvergenzordnungen sind dafür zu
erwarten bzgl. der Energie-Norm (H 1 -Seminorm) und der L2 -Norm, und welche Regularität
muß dabei jeweils für die Lösung u vorausgesetzt werden?
b) Welche Fehlerordnung läßt sich mit Hilfe eines Dualitätsarguments für die Mittelwerte zeigen,
d. h.:
Z
Z
u
dx
u
dx
−
≤ ch? kuk? ?
h
Ω
Ω
Übung 3.12: Sei T ⊂ R2 ein Dreieck mit Durchmesser hT und Inkreisradius ρT mit hT ≤
cρT , und sei Ih v die lineare Interpolierende mit den Funktionswerten in den Eckpunkten von
3.7 Übungen
153
T als Knotenwerte. Man zeige mit den Mitteln der Vorlesung die Abschätzung
3/2
kv − Ih vk∂T ≤ chT k∇2 vkT .
Hierdurch wird auch die Abschätzung
1/2
kv − Ih vk∂T ≤ chT k∇vkT
nahegelegt. Kann diese gelten?
Übung 3.13: Man gebe die bestmöglichen h-Potenzen in den folgenden Interpolationsfehlerabschätzungen für die Lagrange-Interpolation in P (T ) := P2 (T ) an:
(i)
(ii)
(iii)
(iv)
k∇2 (v − IT v)kT ≤ ci h?T k∇3 vkT ;
|(v − IT v)(a)| ≤ ci h?T k∇3 vkT ;
k∂n (v − IT v)k∂T ≤ ci h? k∇3 vkT ;
kv − IT vkT ≤ ci h?T k∇2 vkT .
Übung 3.14: Zur Finite-Elemente-Approximation des sog. Plattenbiegeproblems” (Randwert”
problem des biharmonischen” Operators)
”
∆2 u = f in Ω,
u = ∂n u = 0 auf ∂Ω,
wird wieder von einer zugehörigen variationellen Formulierung ausgegangen. Diese ist auf natürliche Weise im Sobolew-Raum V := H02 (Ω) = {v ∈ H 2 (Ω)| u|∂Ω = ∂n u|∂Ω = 0} definiert: Finde
u ∈ V mit
a(u, ϕ) := (∆u, ∆ϕ) = (f, ϕ) ∀ϕ ∈ V.
Die Bilinearform ist a(·, ·) V -elliptisch, so daß die betrachtete RWA eine eindeutige schwache”
”
Lösung u ∈ V besitzt. Auf einem Rechteck Ω ist diese schwache Lösung sogar in H 4 (Ω) und
genügt der a priori Abschätzung
kukH 4 ≤ ckf k.
Für einen konformen Finite-Elemente-Ansatzraum Vh muß nun gelten Vh ⊂ V , d.h.: die stückweise polynomialen Ansatzfunktionen müßen global stetig differenzierbar sein. Das Grundgebiet
Ω sei als konvex polygonal angenommen.
a) Einen konformen Finite-Elemente-Ansatzraum Vh ⊂ V erhält man mit Hilfe des quintischen
Argyris-Elements. Man gebe hierfür eine Fehlerabschätzung in der Energienorm” sowie in der
”
L2 -Norm an. (Hinweis: Dualitätsargument.)
b) Welche Spektral-Kondition in Abhängigkeit von der Gitterweite h ist für die zugehörige
Steifigkeitsmatrix Ah zu erwarten?
Übung 3.15: Die Steifigkeitsmatrix und der Lastvektor eines kubischen FE-Ansatzes zur Approximation der RWA
−∆u = 0 in Ω, u|∂Ω = 0,
auf einer Triangulierung von Ω ⊂ R2 werde mit Hilfe numerischer Quadratur berechnet.
154
Finite-Elemente-Verfahren für elliptische Probleme
a) Von welcher Ordnung sollte die verwendete Quadraturformel sein, damit (i) Konvergenz des
resultierenden Verfahrens bzgl. der Energienorm garantiert ist, und (ii) seine Ordnung optimal
ist? Man gebe jeweils ein Verfahrensbeispiel (Quadraturformel) mit möglichst geringer Komplexität (Anzahl der Funktionsauswertungen) an.
b) Zur Illustration der Notwendigkeit bzw. Nichtnotwendigkeit der in der Vorlesung abgeleiteten
Bedingungen an die numerische Quadratur betrachte man die Approximation der 1. RWA des
Laplace-Operators auf dem Einheitsquadrat mit bilinearen finiten Elementen auf einem äquidistanten, kartesischen Gitter. Welches Differenzenschema erhält man, wenn die Elemente der
Systemmatrix mit der Mittelpunktsregel berechnet werden? Diese Situation ist durch die Theorie
aus der Vorlesung nicht abgedeckt. Ist das resultierende Verfahren dennoch konvergent?
Übung 3.16: Für die Systemmatrix Ah einer Finite-Elemente-Diskretisierung für die 1. RWA
des Laplace-Operators
−∆u = f in Ω, u = 0 auf ∂Ω,
wurde in der Vorlesung für “quasi-gleichförmige” Triangulierungsfolgen (Th )h>0 die Kondition
cond2 (Ah ) = O(h−2 ) gezeigt.
(i) Man rekapituliere, was für eine Triangulierungsfolge “quasi-gleichförmig” bedeutet.
(ii) Wie hängt die Kondition von Ah von den Inkreis- bzw. Inkugelradien der Zellen ab, wenn
die Triangulierungsfolge nicht “formregulär” ist?
(iii) Man untersuche die Abhängigkeit der Kondition der Systemmatrix cond2 (Ah ) der “5Punkte-Differenzendiskretisierung auf äquidistanten Tensorproduktgittern mit unterschiedlichen
Gitterweiten hx 6= hy vom Seitenverhältnis hx /hy (“aspect ratio”). (Hinweis: Man verallgemeinere die in einer früheren Übungsaufgabe hergeleiteten expliziten Formeln für die Eigenwerte
der 5-Punkte-Matrix für die vorliegende Situation.)
Übung 3.17: Man rekapituliere den Beweis der Konditionsabschätzung cond2 (Ah ) = O(h−2 )
aus der Vorlesung für die Systemmatrix einer FE-Diskretisierung der 1. RWA (“Dirichletsche
RWA”) des Laplace-Operators auf einer “quasi-gleichförmigen” Triangulierungsfolge für die FEDiskretisierung der 2. RWA (“Neumannsche RWA”):
−∆u = f in Ω,
∂n u = 0 auf ∂Ω.
Übung 3.18: Es werde die inhomogene Neumannsche RWA
−∇ · (α∇u) + γu = f in Ω,
n · (α∇u) = g auf ∂Ω,
auf einem konvexen Polygongebiet Ω ⊂ R2 betrachtet. Die Daten α , γ , f und g seien glatt
und ferner α, γ > 0 . Mit Hilfe der FEM mit stückweise linearen Ansatzfunktionen wird eine
(1)
Näherung uh ∈ Vh ⊂ H 1 (Ω) berechnet.
a) Man gebe die zugehörige variationelle Formulierung an.
b) Man leite eine a posteriori Fehlerabschätzung für den Energie-Norm-Fehler her:
keh kE := (α∇eh , ∇eh )Ω + (γeh , eh )Ω
1/2
.
c) Man leite eine a posteriori Fehlerabschätzung für den L2 -Norm-Fehler keh k2 her.
3.7 Übungen
155
Übung 3.19: Die 1. RWA des Laplace-Operators auf einem konvexen Polygongebiet Ω ⊂ R2
werde durch lineare” finite Elemente auf einer Triangulierung Th von Ω approximiert. Man
”
zeige, daß die in der Vorlesung abgeleitete a posteriori Abschätzung für den L2 -Norm-Fehler,
ku − uh k2 ≤ c ηL2 (uh )
mit dem Schätzer”
”
ηL2 (uh ) :=
X
T ∈Th
1/2
2
k[∂
u
]k
,
h4T kf + ∆uh k22;T + 21 h−1
n h 2;∂T \∂Ω
T
asymptotisch optimal ist, d.h.:
ηL2 (uh ) ≤ cku − uh k2 +
X
T ∈Th
h4T kf + ∆uh k22
1/2
.
Dazu verwende man die Spur-Abschätzung”
”
−3/2
1/2
k∂n vk2;∂T ≤ chT k∆vk2;T + hT
kvk2;T ,
deren genaue h-Potenzen man mit Hilfe des üblichen Transformationsarguments aus der entsprechenden Ungleichung auf einer Einheitszelle” (Beweisskizze zur Wiederholung) erhält.
”
Übung 3.20: In Anlehnung an die Argumentationsweise der Vorlesung (siehe auch das Skriptum) leite man eine Formel für eine Gitterweitenfunktion h(x) her, welche in folgendem Sinne
“optimal” ist:
N → min!,
η(uh ) ≤ T OL,
wobei
N :=
Z
h(x)−2 dx,
η(uh ) :=
Ω
Z
h(x)2 A(x) dx.
Ω
Übung 3.21: Dem in der vorigen Aufgabe verwendeten Optimierungsargument liegt die Annahme zugrunde, daß sich die Zellresiduen im wesentlichen wie
1/2
ρT := kf + ∆uh kT + 12 hT k[∂n uh ]k∂T = O(hT )
verhalten. Man zeige, daß dies im Fall linearer Ansatzfunktionen auf einer quasi-gleichförmigen (regulär mit “uniform shape”- und “uniform-size”-Eigenschaft) Folge von Triangulierungen
im R2 mit hT ∼ h tatsächlich der Fall ist. Dazu verwende man die bekannte a priori Fehlerabschätzung
k∇(u − uh )k∞ ≤ chk∇2 uk∞
unter der Annahme u ∈ W 2,∞ (Ω) , sowie die gleichfalls bekannten lokalen Interpolationsfehlerabschätzungen und “inversen” Beziehungen für Finite-Elemente-Funktionen. (Bem.: Die Annahme der Quasi-Gleichförmigkeit ist natürlich unrealistisch, da ja im Endeffekt gerade lokal
verfeinerte Gitter erzeugt werden sollen.)
156
Finite-Elemente-Verfahren für elliptische Probleme
4 Iterative Lösungsverfahren für FD- und FE-Gleichungen
In diesem Kapitel werden iterative Lösungsverfahren für die durch Anwendung einer FiniteDifferenzen- oder Finite-Elemente-Diskretisierung entstehenden (linearen) Gleichungssysteme
diskutiert. Dies sind neben den traditionellen Fixpunktiterationen vor allem sog. PCG-Verfahren“
”
(preconditioned conjugate gradient methods) und die modernen Mehrgittermethoden“. Zugrun”
de gelegt wird dabei meist wieder das Modellproblem der 1. RWA des Laplace-Operators
Lu := −∆u = f
in Ω,
u = g auf ∂Ω,
(4.0.1)
auf einem (konvexen) Polygongebiet Ω ⊂ R2 . Erweiterungen für Probleme mit variablen Koeffizienten, anderen Randbedingungen, Unsymmetrien sowie auf drei Raumdimensionen werden
wieder in Bemerkungen berücksichtigt. Die zugehörigen algebraischen Systeme haben die Form
Ax = b,
(4.0.2)
N
mit Matrizen A = (anm )N
n,m=1 und Vektoren b = (bn )n=1 der Dimension N . In der Praxis
ist meist N ≫ 1000 , so daß neben dem Rechenaufwand auch der Speicherbedarf ein wichtiger
Aspekt ist. Je nach der gewählten Numerierung der Gitterpunkte bzw. Knoten haben die Matrizen in der Regel Bandstruktur und sind extrem dünn besetzt. Ist das kontinuierliche Problem
selbstadjungiert sowie definit, wie z.B. im Fall der 1. RWA des Laplace-Operators, so übertragen
sich diese Eigenschaften bei FE-Diskretisierungen direkt auf die Systemmatrizen A .
4.1 Krylow-Raum-Methoden
Wir diskutieren jetzt sog. Krylow1 -Raum-Methoden“, zu denen auch das klassische Verfahren
”
der konjugierten Gradienten ( CG-Verfahren“) gehört. Im folgenden werden euklidisches Skalar”
produkt und Norm auf RN mit hx, yi bzw. |x| bezeichnet. Die Koeffizientenmatrix A ∈ RN ×N
sei zunächst als symmetrisch und positiv definit angenommen. Dann läßt sich die Gleichung
(4.0.2) äquivalent charakterisieren durch ein quadratisches Minimierungsproblem:
⇔
Ax = b
Q(x) = min Q(y)
y∈RN
(4.1.3)
mit
Q(y) := 21 hAy, yi − hb, yi.
Wegen ∇2 Q ≡ A folgt aus der Positiv-Definitheit von A die Existenz eines eindeutig bestimmten Minimums von Q(·) , welches notwendig Lösung von (4.0.2) ist. Diese Konstruktion
ist analog zu der beim Nachweis von schwachen“ Lösungen der 1. RWA des Laplace-Operators.
”
Wir halten fest, daß der Gradient von Q in einem Punkt y ∈ Rn gegeben ist durch
∇Q(y) =
1
2
(A + AT )y − b = Ay − b .
(4.1.4)
Dies ist gerade der Defekt“ im Punkt y . Für jede symmetrische, positiv definite Matrix B ∈
”
RN ×N ist durch kykB := hBy, yi1/2 eine sog. Energie-Norm“ definiert. Mit dieser Notation
”
1
Aleksei Nikolaevich Krylov (1863-1945): russischer Mathematiker; Prof. an der Sov. Akademie der Wissensch.
in St. Petersburg; Beiträge zu Fourier-Analysis und Differentialgleichungen, Anwendungen in der Schiffstechnik.
157
158
Iterative Lösungsverfahren für FD- und FE-Gleichungen
gilt dann
2Q(y) = hAy, yi − 2hb, yi
= hAy, yi − hb, yi − hAy, A−1 bi + hb, A−1 bi − hb, A−1 bi
= hAy − b, y − A−1 bi − hb, A−1 bi
= hA−1 (Ay − b), Ay − bi − hb, A−1 bi = |Ay − b|2A−1 − |b|2A−1
= hy − A−1 b, A(y − A−1 b)i − hAA−1 b, A−1 bi = |y − x|2A − |x|2A ,
d.h.: Die Minimierung des Funktionals Q(·) ist äquivalent zur Minimierung der Defektnorm
|Ay − b|A−1 bzw. der Energie-Norm |y − x|A .
Die sog. Abstiegsverfahren“ bestimmen nun ausgehend von einem geeigneten Startvektor
”
x(0) ∈ Rn eine Folge von Iterierten x(t) , t ∈ N , durch
x(t+1) = x(t) + αt d(t) .
(4.1.5)
Dabei sind die d(t) vorgegebene oder auch erst im Verlauf der Iteration berechnete Abstiegs”
richtungen“, und die Schrittweiten“ αt ∈ R sind durch die Vorschrift bestimmt (sog. line
”
”
search“):
Q(x(t+1) ) = min Q(x(t) + αd(t) ) .
(4.1.6)
α∈R
Die notwendige Optimalitätsbedingung
d
Q(x(t) + αd(t) ) = ∇Q(x(t) + αd(t) ) · d(t) = hAx(t) − b, d(t) i + αhAd(t) , d(t) i = 0
dα
ergibt mit dem Residuum r (t) := b − Ax(t) = −∇Q(x(t) ) :
αt =
hr (t) , d(t) i
.
hAd(t) , d(t) i
Das allgemeine Abstiegsverfahren lautet also wie folgt:
Startwert:
für t ≥ 0:
x(0) ∈ RN ,
Iterierte x(t) ,
αt =
Residuum r (t) = b − Ax(t) ,
hr (t) , d(t) i
,
hAd(t) , d(t) i
Abstiegsrichtung d(t) ,
x(t+1) = x(t) + αt d(t) .
Praktisch günstiger ist die folgende Schreibweise, bei der man eine Matrix-Vektor-Multiplikation
spart, wenn man den Vektor Ad(t) abspeichert:
Startwert:
für t ≥ 0:
x(0) ∈ Rn ,
r (0) := b − Ax(0) ,
Iterierte x(t) ,
αt =
Residuum r (t) ,
hr (t) , d(t) i
,
hAd(t) , d(t) i
Abstiegsrichtung d(t) ,
x(t+1) = x(t) + αt d(t) ,
r (t+1) = r (t) − αt Ad(t) .
Die verschiedenen Abstiegsverfahren unterscheiden sich im wesentlichen durch die jeweilige
4.1 Krylow-Raum-Methoden
159
Wahl der Abstiegsrichtungen d(t) . Die einfachste Möglichkeit wäre, die Richtungen d(t) zyklisch
die kartesischen Einheitsvektoren {e(1) , . . . , e(n) } durchlaufen zu lassen. Die so erhaltene iterative Methode wird Koordinatenrelaxation“ genannt. Ein voller Relaxationszyklus ist äquivalent
”
zum Gauß-Seidel-Verfahren (Übungsaufgabe).
Naheliegender ist die Wahl der Richtung des stärksten Abfalls von Q(·) im Punkt x(t) ,
d.h. des Gradienten bzw. Residuums, als Suchrichtung d(t) = −g(t) = −∇Q(x(t) ) = r (t) . Diese
Gradientenverfahren“ ist aber relativ langsam (vergleichbar mit dem Jacobi-Verfahren). Je
”
zwei aufeinander folgende Abstiegsrichtungen sind dabei orthogonal, (d(t+1) , d(t) ) = 0 , aber
d(t+2) braucht nicht einmal annähernd orthogonal zu d(t) zu sein. Dies führt zu einem stark
oszillatorischen Konvergenzverhalten des Gradientenverfahrens besonders bei Matrizen A mit
weit auseinander liegenden Eigenwerten. Dies bedeutet etwa in Fall N = 2 , daß das Funktional
Q(·) stark exzentrische Niveaulinien hat und sich die Iterierten in einem Zickzackkurs der Lösung
annähern (siehe Bild).
Abbildung 4.1: Niveaulinien des quadratischen Funktionals in zwei Dimensionen
4.1.1 Verfahren der konjugierten Richtungen (CG-Verfahren)
Das Gradientenverfahren nutzt die Struktur des quadratischen Funktionals Q(·) , d.h. die Verteilung der Eigenwerte der Matrix A , nur lokal von einem Schritt zum nächsten aus. Es wäre
günstiger, wenn bei der Wahl der Abstiegsrichtungen auch die bereits gewonnenen Informationen
über die globale Struktur von Q(·) berücksichtigt würden, d.h. wenn etwa die Abstiegsrichtungen
paarweise orthogonal wären. Dies ist die Grundidee des sog. Verfahrens der konjugierten Gra”
dienten“ nach Hestenes2 und Stiefel3 ( conjugate gradient method“ oder kurz CG-Verfahren“),
”
”
welches sukzessive eine Folge von Abstiegsrichtungen d(t) erzeugt, die bzgl. des Skalarprodukts
(·, ·)A orthogonal sind ( A-orthogonal“). Zur Konstruktion dieser Folge macht man den Ansatz
”
Kt = span{d(0) , ..., d(t−1) }
und sucht, Iterierte in der Form
x(t) = x(0) +
t−1
X
i=0
αi d(i) ∈ x(0) + Kt
(4.1.7)
zu bestimmen, so daß
Q(x(t) ) = min Q(x(0) + y) .
y∈Kt
2
Magnus R. Hestenes (1906-1991): US-amerikanischer Mathematiker; Prof. an der UCLA, USA, fundamentale
Beiträge u.a. zur Numerischen Linearen Algebra.
3
Eduard Stiefel (1909-1978): schweizer Mathematiker; Prof. an der ETH Zürich; fundamentale Beiträge u.a.
zur Numerischen Linearen Algebra.
160
Iterative Lösungsverfahren für FD- und FE-Gleichungen
Dies ist äquivalent zu den Galerkin-Gleichungen“
”
hx(t) − x, d(t) iA = hAx(t) − b, d(j) i = 0,
j = 0, ..., t − 1,
(4.1.8)
bzw. zu r (t) = b − Ax(t) ⊥ Kt . Setzt man den Ansatz (4.1.7) in (4.1.8) ein, so erhält man das
Gleichungssystem
t−1
X
i=0
αi hAd(i) , d(j) i = hb − Ax(0) , dj i,
j = 0, ..., t − 1,
(4.1.9)
mit der regulären Koeffizientenmatrix MA = (hAd(k) , d(j) i)t−1
j,k=0 .
Eine natürliche Wahl der Ansatzräume Kt sind die sog. Krylow-Räume“
”
Kt (r (0) ; A) := span{r (0) , Ar (0) , ..., At−1 r (0) }
zum Residuum r (0) = b − Ax(0) des Startvektors x(0) . Nach Konstruktion ist stets
r (t) = b − Ax(t) = r (0) − r (0) + b − Ax(t)
= r (0) + A(x(0) − x(t) ) ∈ r (0) + AKt (r (0) ; A) ⊂ Kt+1 (r (0) ; A).
Da nach Konstruktion r (t) ⊥ Kt , ist also stets
hr (t) , r (i) i = 0,
i = 0, . . . , t − 1.
Ferner folgt im Fall At r (0) ∈ Kt (r (0) ; A) notwendig r (t) = 0 bzw. Ax(t) = b .
Ausgehend von der Formulierung (4.1.8) konstruiert das CG-Verfahren eine A-orthogonale Folge von Abstiegsrichtungen d(i) , die eine Basis des Krylow-Raumes Kt (r (0) ; A) bildet.
Dies ließe sich etwa mit Hilfe des klassischen Gram4 -Schmidt5 -Algorithmus leisten, was aber
numerisch sehr instabil ist. In Analogie zur vergleichbaren Situation bei der Konstruktion orthogonaler Polynome (z.B. die Legendre6 -Polynome) ist aber zu erwarten, daß dasselbe durch
eine zweistufige Rekursion erreichbar ist.
Ausgehend von einem Startpunkt x(0) mit Residuum (negativer Gradient) r (0) = b − Ax(0)
seien Iterierte x(i) und zugehörige Abstiegsrichtungen d(i) (i = 0, ..., t − 1) bestimmt, so daß
{d(0) , ..., d(t−1) } eine A-orthogonale Basis von Kt (d(0) ; A) ist. Zur Konstruktion des nächsten
4
Jørgen Pedersen Gram (1850-1916): dänischer Mathematiker, Mitarbeiter und später Eigentümer einer Versicherungsgesellschaft, Beiträge zur Algebra (Invariantentheorie), Wahrscheinlichkeitstheorie, Numerik und Forstwissenschaft; das u.a. nach ihm benannte Orthogonalisierungsverfahren geht aber wohl auf Laplace zurück und
wurde bereits von Cauchy 1836 verwendet.
5
Erhard Schmidt (1876-1959): deutscher Mathematiker, Prof. in Berlin, Gründer des dortigen Instituts für
Angewandte Mathematik 1920, nach dem Krieg Direktor des Mathematischen Instituts der Akademie der Wissenschaften der DDR; Beiträge zur Theorie der Integralgleichungen und der Hilbert-Räume sowie später zur
Topologie.
6
Adrien-Marie Legendre (1752-1833): französischer Mathematiker; Mitglied der Pariser Akademie der Wissensch.; Beiträge zur Himmelsmechanik, Zahlentheorie und Geometrie.
4.1 Krylow-Raum-Methoden
161
d(t) ∈ Kt+1 (d(0) ; A) mit der Eigenschaft d(t) ⊥A Kt (d(0) ; A) machen wir den Ansatz
d(t) = r (t) +
t−1
X
j=0
βjt−1 d(j) ∈ Kt+1 (d(0) ; A).
(4.1.10)
Dabei wird o.B.d.A. angenommen, daß r (t) = b − Ax(t) ∈
/ Kt (d(0) ; A) ist, da andernfalls r (t) = 0
(t)
bzw. x = x wäre. Zur Bestimmung der Koeffizienten βjt−1 beachten wir für i = 0, ..., t − 1 :
0 = hd(t) , Ad(i) i = hr (t) , Ad(i) i +
t−1
X
j=0
βjt−1 hd(j) , Ad(i) i = hr (t) + βit−1 d(i) , Ad(i) i .
Für i < t − 1 ist hr (t) , Ad(i) i = 0 wegen Ad(i) ∈ Kt (d(0) ; A) und demnach βit−1 = 0 . Für
i = t − 1 führt die Bedingung
t−1 (t−1)
0 = hr (t) , Ad(t−1) i + βt−1
hd
, Ad(t−1) i
(4.1.11)
zu den Formeln
t−1
βt−1 := βt−1
=−
hr (t) , Ad(t−1) i
,
hd(t−1) , Ad(t−1) i
d(t) = r (t) + βt−1 d(t−1) .
(4.1.12)
Die nächsten Iterierten x(t+1) und r (t+1) = b − Ax(t+1) sind dann bestimmt durch
αt =
hr (t) , d(t) i
,
hd(t) , Ad(t) i
x(t+1) = x(t) + αt d(t) ,
r (t+1) = r (t) − αt Ad(t) .
(4.1.13)
Dies sind die Rekursionsformeln des klassischen CG-Verfahrens. Wegen r (t) ⊥ Kt (r (0) ; A) und
Kt (r (0) ; A) = span{d(0) , . . . , d(t−1) } ist
hr (t) , d(i) i = 0,
i = 0, . . . , t − 1.
Damit lassen sich die Formeln für die Koeeffizienten αt und βt vereinfachen. Mit
|r (t) |2 = hd(t) − βt−1 d(t−1) , r (t+1) + αt Ad(t) i = αt hd(t) , Ad(t) i ,
(4.1.14)
|r (t+1) |2 = hr (t) − αt Ad(t) , r (t+1) i = −αt hAd(t) , r (t+1) i .
(4.1.15)
ergibt sich
αt =
|r (t) |2
,
hd(t) , Ad(t) i
βt =
|r (t+1) |2
,
|r (t) |2
(4.1.16)
solange die Iteration nicht mit r (t) = 0 abbricht. Diese Konstruktion führt auf den folgenden
162
Iterative Lösungsverfahren für FD- und FE-Gleichungen
CG-Algorithmus:
Startwert:
x(0) ∈ Rn ,
für t ≥ 0:
αt =
r (0) := b − Ax(0) ,
|r (t) |2
,
hAd(t) , d(t) i
x(t+1) = x(t) + αt d(t) , r (t+1) = r (t) − αt Ad(t) ,
βt =
|r (t+1) |2
,
|r (t) |2
d(t+1) = r (t+1) + βt d(t) .
In jedem Iterationsschritt ist dabei eine Matrix-Vektor-Multiplikation und fünf Operationen der
Mächtigkeit eines Skalarproduktbildung durchzuführen. Im Falle einer dünn besetzten Matrix
vom Typ der Modellmatrix sind das etwa 10N arithmetische Operationen. Das CG-Verfahren
erzeugt eine Basis von Abstiegsrichtungen, so daß es zwangsläufig nach spätestens t = N − 1
Schritten mit der Lösung x des Gleichungssystems (4.0.2) abbricht. Es handelt sich hierbei
also formal um ein direktes“ Lösungsverfahren. Bei großer Dimension N ≥ 103 geht die A”
Orthogonalität der Folge {d(0) , ..., d(t−1) } wegen des unvermeidlichen Rundungsfehlereinflusses
schnell verloren, und das Verfahren wird zu einem nicht terminierenden, iterativen Prozess.
Außerdem wäre die Durchführung von nahezu N − 1 Iterationsschritten wegen der damit verbundenen Zahl von O(N 2 ) arithmetischen Operationen viel zu hoch. Man wird also mit einer
wesentlich geringeren Anzahl von t ≪ N Schritten auskommen müssen. Wir fassen die wichtigsten Eigenschaften des CG-Verfahrens in folgendem Satz zusammen.
Satz 4.1 (CG-Konvergenz): Das CG-Verfahren bricht für jeden Startvektor x(0) ∈ RN nach
spätestens N −1 Schritten mit x(t) = x ab. Für 0 ≤ t < N −1 gilt die Fehlerabschätzung
1 − 1/√κ t
√
|e(0) |A , t ≥ 1,
(4.1.17)
|e(t) |A ≤ 2
1 + 1/ κ
mit der Spektralkondition κ := κ2 (A) = λmax (A)/λmin (A) von A . Zur Reduzierung des Anfangsfehlers um den Faktor ε sind höchstens
2
1√
κ ln
+1
(4.1.18)
t(ε) ≤
2
ε
Iterationsschritte erforderlich.
Dieses Resultat zeigt die Wichtigkeit der Kondition κ(A) für die Konvergenzgeschwindigkeit des
CG-Verfahrens. Für das Modellproblem ist κ(A) = O(h−2 ) , was eine Gesamtlösungskomplexität
von O(N 3/2 ) bedeutet. Das CG-Verfahren ist daher i.a. ähnlich effizient wie das optimale“
”
SOR-Verfahren, allerdings mit einer größeren Fehlerkonstanten. Im Gegensatz zu letzterem erfordert das CG-Verfahren aber nicht die Bestimmung eines optimalen Relaxationsparameters.
Dafür ist das Resultat (4.1.17) auf den Fall einer symmetrischen, positiv definiten Matrix A
beschränkt.
Beweis: (i) Unter Beachtung der Beziehung
|x(t) − x|A =
min
y∈x(0) +Kt
|y − x|A ,
Kt := Kt (r (0) ; A) = span{d(0) , . . . , d(t−1) } = span{A0 r (0) , . . . , At−1 r (0) }
4.1 Krylow-Raum-Methoden
163
finden wir
|x(t) − x|A = min |x(0) − x + p(A)r (0) |A .
p∈Pt−1
Wegen r (0) = b − Ax(0) = A(x − x(0) ) folgt weiter
|x(t) − x|A = min |[I − p(A)A](x(0) − x)|A
p∈Pt−1
≤ min |I + Ap(A)|A |x(0) − x|A ≤
p∈Pt−1
min
p∈Pt , p(0)=1
|p(A)|A |x(0) − x|A ,
wobei die zu der Vektornorm | · |A assoziierte natürliche Matrizennorm der Einfachheit halber
ebenfalls mit | · |A bezeichnet ist. Für beliebiges y ∈ RN haben wir mit einer Orthonormalbasis
{w(1) , . . . , w(N ) } aus Eigenvektoren von A die Entwicklung
y=
N
X
γi w(i) ,
γi = hy, w(i) i ,
i=1
und folglich
|p(A)y|2A
=
N
X
λi p(λi )2 γi2
i=1
wobei
M := sup |p(µ)| ,
≤ M
2
N
X
i=1
λi γi2 = M 2 |y|2A ,
λ := λmin (A), Λ := λmax (A) .
λ≤µ≤Λ
Dies impliziert dann
|p(A)|A =
sup
y∈Rn , y6=0
|p(A)y|A
≤ M.
|y|A
(ii) Wir haben gefunden, daß
|x(t) − x|A ≤
min
p∈Pt , p(0)=1
sup |p(µ)| |x(0) − x|A .
λ≤µ≤Λ
Dies ergibt die Behauptung, wenn wir zeigen können, daß
min
p∈Pt , p(0)=1
1 − pλ/Λ t
p
.
sup |p(µ)| ≤ 2
1 + λ/Λ
λ≤µ≤Λ
Dabei handelt es sich um ein Problem der Bestapproximation mit Polynomen bzgl. der Maximumnorm (Tschebyscheff7 -Approximation). Die Lösung p̄ ist gegeben durch
p̄(µ) = Tt
Λ + λ − 2µ Λ−λ
Tt
Λ + λ −1
Λ−λ
,
mit dem t-ten Tschebyscheff-Polynom Tt auf [−1, 1] . Dabei ist
sup p̄(µ) = Tt
λ≤µ≤Λ
Λ + λ −1
Λ−λ
.
7
Pafnuty Lvovich Tschebyscheff (russ.: Chebyshev) (1821-1894): russischer Mathematiker; Prof. in St. Petersburg; Beiträge zur Zahlentheorie, Wahrscjheinlichkeitstheorie und vor allem zur Approximationstheorie; entwickelte allgemeine Theorie orthogonaler Polsynome.
164
Iterative Lösungsverfahren für FD- und FE-Gleichungen
Aus der Darstellung
Tt (µ) =
1
2
µ+
p
p
t
t µ2 − 1 + µ − µ2 − 1 ,
µ ∈ (−∞, ∞),
für die Tschebyscheff-Polynome folgt über die Identität
r
√
√
√
κ+1
κ+1
2 κ
( κ ± 1)2
κ±1
κ + 1 2
−1=
±
±
=
= √
κ−1
κ−1
κ−1 κ−1
κ−1
κ∓1
die Abschätzung nach unten
Tt
Also wird
Λ + λ
Λ−λ
= Tt
√
√
√
1 h κ + 1 t κ − 1 t i 1 κ + 1 t
√
√
=
≥
+ √
.
κ−1
2
κ−1
κ+1
2
κ−1
κ + 1
√κ − 1 t
sup p̄(µ) ≤ 2 √
,
κ+1
λ≤µ≤Λ
was (4.1.17) impliziert.
(iii) Zur Herleitung von (4.1.18) fordern wir
√κ − 1 t(ε)
<ε ⇒
2 √
κ+1
Wegen
ln
ist dies erfüllt für t(ε) ≥
x + 1
1√
2
x−1
=2
√κ + 1 −1
ln √
t(ε) > ln
.
ε
κ−1
2
1 1 1
1 1
+
+
+ ...
3
x 3x
5 x5
≥
2
x
κ ln(2/ε) .
Q.E.D.
4.1.2 CG-Verfahren für unsymmetrische und indefinite Probleme
Zur Lösung allgemeiner Gleichungssysteme Ax = b mit einer regulären, aber nicht notwendig
symmetrisch und positiv definiten Matrix A ∈ Rn mit Hilfe des CG-Verfahrens kann man etwa
zu dem äquivalenten System
AT Ax = AT b
(4.1.19)
mit der positiv definiten Matrix AT A übergehen. Hierauf angewendet, schreibt sich das CGVerfahren wie folgt:
Startwerte:
für t ≥ 0:
x(0) ∈ RN ,
αt =
d(0) = r (0) = AT (b − Ax(0) ) ,
|r (t) |2
,
|Ad(t) |2
x(t+1) = x(t) + αt d(t) ,
βt =
|r (t+1) |2
,
|r (t) |2
r (t+1) = r (t) − αt AT Ad(t) ,
d(t+1) = r (t+1) + βt d(t) .
4.1 Krylow-Raum-Methoden
165
Die Konvergenzgeschwindigkeit ist dabei charakterisiert durch κ(AT A) . Das ganze Verfahren
beruht offenbar auf der Minimierung des Funktionals
Q(y) :=
1
2
hAT Ay, yi − hAT b, yi = 21 |Ay − b|2 − 12 |b|2 .
(4.1.20)
Da κ(AT A) ∼ κ(A)2 ist, muß man mit einer recht langsamen Konvergenz dieses quadrierten“
”
CG-Verfahrens für nicht symmetrische Systeme rechnen.
Auf der Basis der Chrakterisierung (4.1.3) ist das beschriebene CG-Verfahren auf symmetrische, positiv definite Matrizen beschränkt. Geht man allerdings von der notwendigen
”
Optimalitätsbedingung“ (4.1.8) aus, so ist dieser Ansatz auch für allgemeine Matrizen sinnvoll. Tatsächlich lassen sich auf diesem Wege leistungsfähige Verallgemeinerungen des CGVerfahrens auch für unsymmetrische und indefinite Matrizen ableiten. Dabei werden in der
Galerkin-Formulierung (4.1.8) als Ansatzräume meist wieder die Krylow-Räume
Kt = span{r (0) , Ar (0) , ..., At−1 r (0) }
verwendet. Als Testräume“ treten gleichfalls Kt∗ = Kt oder auch
”
Kt∗ = span{r (0) , AT r (0) , ..., (AT )t−1 r (0) }
auf. Die resultierenden Verfahren GMRES, ORTHOMIN, CRS, bi-CG-stab u.s.w., haben dann
jeweils die eine oder die andere Eigenschaft des normalen CG-Verfahrens, lassen aber keine so
vollständige Konvergenzanalyse zu.
4.1.3 Vorkonditionierung (PCG-Verfahren)
Die Fehlerabschätzuung für das CG-Verfahren garantiert eine besonders gute Konvergenz, wenn
die Kondition der Matrix A nahe bei Eins liegt. Daher wird eine Vorkonditionierung“ vorge”
nommen, d.h.: Das System Ax = b wird in ein äquivalentes umgeformt, Ãx̃ = b̃ , dessen Matrix
à besser konditioniert ist. Sei C eine symmetrische, positiv definite Matrix, welche explizit in
Produktform
C = KK T
(4.1.21)
gegeben ist mit einer regulären Matrix K . Das System Ax = b wird dann in der äquivalenten
Form geschrieben
K −1 A (K T )−1 K T x = K −1 b .
{z
} | {z }
| {z }
|
Ã
x̃
b̃
(4.1.22)
(K T )−1 ÃK T = (K T )−1 K −1 A(K T )−1 K T = C −1 A
(4.1.23)
Das CG-Verfahren wird nun auf das System Ãx̃ = b̃ angewendet. Die Beziehung
zeigt, daß für C ≡ A die Matrix à ähnlich zu I, d.h. κ(Ã) = κ(I) = 1 wäre. Folglich wird
man C −1 als möglichst gute Approximation von A−1 wählen, wobei natürlich die Zerlegung
C = KK T bekannt sein muß. Das CG-Verfahren für das transformierte System Ãx̃ = b̃ kann
166
Iterative Lösungsverfahren für FD- und FE-Gleichungen
in den ursprünglichen Größen A, b und x als PCG-Verfahren geschrieben werden:
Startwert:
x(0) ∈ RN , d(0) = r (0) = b − Ax(0) ρ(0) = C −1 r (0) ,
für t ≥ 0:
αt =
hr (t) , ρ(t) i
,
hAd(t) , d(t) i
x(t+1) = x(t) + αt d(t) , r (t+1) = r (t) − αt Ad(t) ,
ρ(t+1) = C −1 r (t+1) ,
βt =
hr (t+1) , ρ(t+1) i
,
hr (t) , ρ(t) i
d(t+1) = r (t+1) + βt d(t) .
Verglichen mit der einfachen CG-Iteration erfordert das PCG-Verfahren in jedem Schritt zusätzlich die Lösung des Systems Cρ(t+1) = r (t+1) , was unter Ausnutzung der Zerlegung C = KK T
erfolgt. Zur Erzielung einer Komplexität von O(N ) a.Op. pro Schritt sollte die Dreiecksmatrix
K eine ähnliche Besetzungsstruktur wie der untere Dreiecksanteil L von A haben. Ausgehend
von den oben betrachteten einfachen Fixpunktiterationen werden in der Praxis die folgenden
Vorkonditionierer verwendet:
1) Diagonal-Vorkonditionierung (Skalierung): C = D 1/2 D1/2 .
Die Skalierung bewirkt, daß die Elemente von A auf etwa gleiche Größenordnung gebracht
werden, insbesondere wird ãii = 1 . Dies reduziert die Kondition, denn es gilt:
κ(A) ≥
max1≤i≤N aii
.
min1≤i≤N aii
(4.1.24)
Beispiel: Die Matrix A = diag{λ1 = ... = λN −1 = 1, λN = 10k } hat die Kondition cond2 (A) =
10k . Die skalierte Matrix à = D−1/2 AD −1/2 hat dagegen die optimale Kondition cond2 (Ã) = 1 .
2) SSOR-Vorkonditionierung:
Mit einem Parameter ω wird gesetzt
1/2
1/2
+ {z
ωD −1/2 R}) .
C = (D + ωL)D −1 (D + ωR) = (D
+ {z
ωLD −1/2})(D
|
|
K
KT
Offenbar besitzt die Dreiecksmatrix K dieselbe schwache Besetzung wie A . Pro Iterationsschritt
erfordert das so vorkonditionierte Verfahren etwa doppelt so viel Aufwand wie das einfache
Verfahren. Dagegen gilt für die Modellmatrix bei optimaler Wahl des Parameters ω (i.a. nicht
leicht zu bestimmen!)
p
κ(Ã) = κ(A) .
3) ICCG-Verfahren (Incomplete Cholesky Conjugate Gradient):
Die symmetrische, positiv definite Matrix A besitzt eine Cholesky-Zerlegung A = LLT mit
einer unteren Dreiecksmatrix L = (lij )N
i,j=1 . Die Elemente von L sind bestimmt durch die
4.1 Krylow-Raum-Methoden
167
Rekursionsformeln
lii =
lji =
aii −
i−1
X
2
lik
k=1
i−1
X
1
aji −
lii
k=1
1/2
,
ljk lik ,
i = 1, . . . , N ,
j = i + 1, . . . , N .
Die Matrix L hat i.a. innerhalb der Hülle von A von Null verschiedene Elemente, erfordert also
in der Regel weit mehr Speicherplatz als A selbst. Dies wird jedoch dadurch ausgeglichen, daß
man nur eine ”unvollständige Cholesky-Zerlegung” vornimmt, d.h.: Im Cholesky-Algorithmus
werden einige der lji willkürlich Null gesetzt, z.B.: ˜lji = 0 , wenn aji = 0 . Dies ergibt dann
eine Zerlegung
A = L̃L̃T + E
(4.1.25)
mit einer unteren Dreiecksmatrix L̃ = (˜lij )i,j=1,...,N , welche eine ähnliche (dünne) Besetzungsstruktur wie A besitzt. Man spricht von der ICCG(0)-Variante, wenn (4.1.25) gefordert wird.
Werden im Fall einer Bandmatrix A weitere p Nebendiagonalen mit von Null verschiedenen Elementen in L̃ hinzugefügt bzw. weggestrichen, so nennt man dies die ICCG(+p) bzw.
ICCG(−p)-Variante. Zur Vorkonditionierung verwendet die ICCG-Methode die Matrix
C = KK T = L̃L̃T .
(4.1.26)
Obwohl keine strenge theoretische Begründung für den Erfolg dieses Ansatzes vorliegt, so zeigen doch numerische Tests an Modellproblemen, welchen Einfluß diese Konditionierung auf die
Verteilung der Eigenwerte der Matrix à hat. Zwar wird die Konditionszahl κ(Ã) nicht deutlich kleiner als κ(A) , doch die Eigenwerte von à häufen sich im Gegensatz zu denen von A
stark bei λ = 1 . Dies bewirkt, wie eine feinere Analyse zeigt, eine deutliche Beschleunigung der
Konvergenz.
4) ADI-Vorkonditionierung: C = (Ax + ωI)(Ay + ωI)(ATy + ωI)(ATx + ωI) .
Auch hier muß zur Bewahrung der Symmetrie von à eine symmetrisierte Variante des ADIMatrix verwendet werden.
Eine gute Vorkonditionierung der Modellmatrix bewirkt eine Verbesserung der Konvergenzrate von ρ(A) = 1 − O(h) auf ρ(Ã) = 1 − O(h1/2 ) und damit auf die Lösungskomplexität
O(N 5/4 ) . Besonders die ILU-Vorkonditionierung hat sich in der Praxis bei vielen Problemen als
effizient und robust erwiesen. Sie reduziert zwar nicht die Kondition, doch bewirkt eine Konzentration der Eigenwerte um den Wert λ = 1 , was ebenfalls eine deutliche Beschleunigung der
CG-Konvergenz mit sich bringt.
168
Iterative Lösungsverfahren für FD- und FE-Gleichungen
4.2 Mehrgitterverfahren
Mehrgitterverfahren gehören zum Typ der (verallgemeinerten) Defektkorrekturiterationen und
verwenden eine Folge von Subproblemen ähnlicher Struktur, aber sukzessive kleiner werdender Dimension. Sie sind speziell zugeschnitten auf die Lösung der Gleichungssysteme, wie sie
bei der Diskretisierung partieller Differentialgleichungen mit Differenzen- oder Finite-ElementeVerfahren entstehen. Die Idee ist die eines allen diskreten Problemen zugrunde liegenden übergeordneten, kontinuierlichen Problems und der fortgesetzten Aufspaltung von Fehlern und Defekten auf den verschiedenen Gittern in niedrig- und hochfrequente Anteile, die separat behandelt
werden. Bei richtiger Zusammenstellung der einzelnen Verfahrenskomponenten erhält man Idealfall das gewünschte optimale“ Lösungsverfahren der Komplexität O(N ) .
”
Zum Einstieg betrachten wir das Gleichungssystem auf dem Gitter Th :
Ah xh = bh
(4.2.27)
und approximieren die Lösung mit dem Richardson-Verfahren
(t+1)
xh
(t)
(t)
(t)
= xh + θh (bh − Ah xh ) = (Ih − θh Ah )xh + θh bh
(4.2.28)
mit einem Dämpfungsfaktor 0 < θh ≤ 1 . Die symmetrische, positiv definite Matrix Ah besitzt
(i)
ein Orthonormalsystem von Eigenvektoren {wh , i = 1, ..., Nh } zu den geordneten Eigenwerten
λmin (Ah ) = λ1 ≤ ... ≤ λN = λmax (Ah ) =: Λh . Entwickelt man den Anfangsfehler in der Form
(0)
eh
:=
(0)
xh
− xh =
Nh
X
(i)
εi wh ,
i=1
so gilt für die iterierten Fehler entsprechend
(t)
eh
= (Ih −
(0)
θh Ah )t eh
=
Nh
X
i=1
t
εi (Ih − θh Ah )
(i)
wh
=
Nh
X
i=1
(i)
εi (1 − θh λi )t wh .
Folglich ist
(t)
|eh |2
=
Nh
X
i=1
ε2i (1 − θh λi )2t .
(4.2.29)
Die Bedingung 0 < θh ≤ Λ−1
ist hinreichend für die Konvergenz der Richardson-Iteration.
h
Wegen |1 − θh λi | ≪ 1 für große λi und |1 − θh λ1 | ≈ 1 werden offenbar hoch-frequente“
”
Komponenten des Fehlers sehr schnell, aber niedrig-frequente“ nur sehr langsam gedämpft.
”
(t)
(t)
(t)
Dasselbe gilt auch für das Residuum rh = bh − Ah xh = Ah eh , d.h.: Bereits nach wenigen
Iterationen gilt:
[N/2]
(t)
|rh |2
≈
X
i=1
ε2i λ2i (1 − θh λi )2t ,
(4.2.30)
wobei [N/2] := max{n ∈ N| n ≤ N/2} ist. Dies kann so interpretiert werden, daß der iterierte
(t)
Defekt rh auf dem Gitter Th glatt ist. Daher sollte er auf einem gröberen Gitter T2h mit Git-
4.2 Mehrgitterverfahren
169
terweite 2h gut approximierbar sein. Die resultierende Defektgleichung zur Berechnung der Kor(t)
rektur zur Näherung xh auf Th würde dann wegen ihrer geringeren Dimension N2h ≈ Nh /4
auch weniger Aufwand kosten. Dieser Defektkorrekturproze in Verbindung mit sukzessiver Vergröberung kann weitergeführt werden bis zu einem gröbsten Gitter, auf dem die Defektgleichung
dann exakt gelöst wird. Die wichtigsten Bestandteile eines solchen Mehrgitterprozesses sind die
(0)
(ν)
Glättungsiteration“ xh = Shν (xh ) sowie geeignete Transferoperationen zwischen den Finite”
Elemente-Räumen auf den verschiedenen Gittern. Die Glättungsoperation Sh (·) ist gewöhnlich
gegeben in Form einer Fixpunktiteration (z.B. der Richardson-Iteration)
(ν+1)
xh
(ν)
(ν)
= Sh (xh ) := (Ih − Ch−1 Ah )xh + Ch−1 bh ,
mit der Iterationsmatrix Sh := Ih − Ch−1 Ah .
4.2.1 Mehrgitteralgorithmus im Finite-Elemente-Kontext
Zur Formalisierung des Mehrgitterprozesses betrachten wir nun eine Folge von Gittern Tl =
Thl , l = 0, ..., L , zunehmender Feinheit h0 > ... > hl > ... > hL sowie zugehörige FE-Räume
Vl := Vhl ⊂ V . Der Einfachheit halber sei angenommen, daß die FE-Räume hierarchisch geordnet sind, d.h.: V0 ⊂ V1 ⊂ ... ⊂ Vl ⊂ ... ⊂ VL . Diese Voraussetzung erleichtert die Analyse des
Mehrgitterprozesses, ist aber nicht entscheidend für sein Funktionieren. Zwischen den Funktionen vl ∈ Vl und den zugehörigen Knotenwertevektoren yl ∈ RNl gilt der übliche Zusammenhang vl (an ) = yl,n , n = 1, ..., Nl . Wie üblich schreiben wir das kontinuierliche Problem und sein
FE-Analogon in kompakter Form als
a(u, ϕ) = (f, ϕ)
∀ϕ ∈ V,
(4.2.31)
bzw. auf dem feinsten Gitter TL als
a(uL , ϕL ) = (f, ϕL ) ∀ϕL ∈ VL .
(4.2.32)
Dabei sind a(u, ϕ) := (Lu, ϕ) die zum (elliptischen) Operator L gehörende “Energie-Form“ und
(f, ϕ) das L2 -Skalarprodukt auf dem Lösungsgebiet Ω . Die exakte“ diskrete Lösung uL ∈ VL
”
genügt der a priori Fehlerabschätzung
ku − uL k ≤ c h2L kf k .
(4.2.33)
Ziel ist es, einen Lösungsprozess zu finden, der eine Approximation ũL ≈ uL liefert mit
kuL − ũL k ≤ c h2L kf k.
(4.2.34)
Ist der dazu erforderliche Aufwand O(NL ) und zwar gleichmäßig bzgl. L , so nennt man diesen
Prozess komplexitäts-optimal“. Wir werden sehen, daß der Mehrgitteralgorithmus bei richtiger
”
Wahl der Verfahrenskomponenten in diesem Sinne optimal“ ist.
”
(0)
Sei uL ∈ VL eine Schätzung für die exakte Lösung uL ∈ VL auf Gitterlevel L . Zunächst
(0)
(0)
(0)
wird uL geglättet“. Dazu werden ausgehend von ūL := uL z.B. ν Schritte des Richardson”
Verfahrens durchgeführt. In variationeller Schreibweise lautet dies:
(k)
(k−1)
(ūL , ϕL ) = (ūL
(k−1)
, ϕL ) + θL (f, ϕL ) − a(ūL
, ϕL )
∀ϕL ∈ VL ,
(4.2.35)
170
Iterative Lösungsverfahren für FD- und FE-Gleichungen
wobei θL = λmax (Ah )−1 . Mit der geglätteten Approximation wird der Defekt dL ∈ VL gebildet
(ohne ihn wirklich zu berechnen):
(ν)
(dL , ϕL ) := (f, ϕL ) − a(ūL , ϕL ),
ϕL ∈ VL .
(4.2.36)
Wegen VL−1 ⊂ VL erhält man auf dem nächst gröberen Gitter TL−1 die Defektgleichung
( Grobgittergleichung“)
”
(ν)
a(qL−1 , ϕL−1 ) = (dL , ϕL−1 ) = (f, ϕL−1 ) − a(ūL , ϕL−1 ) ∀ϕL−1 .
(4.2.37)
Die Korrektur qL−1 ∈ VL−1 wird nun entweder exakt berechnet (etwa mit einem direkten“
”(R)
(0)
Löser) oder nur näherungsweise mit Hilfe einer Defektkorrekturiteration qL−1 → qL−1 unter
(R)
Verwendung der noch gröberen Gitter TL−2 , ..., T0 . Das Ergebnis qL−1 ∈ VL−1 wird dann als
(ν)
Element von VL interpretiert und zur Korrektur von ūL
verwendet:
(R)
(ν)
¯(0)
ū
L := ūL + ωL qL−1 .
(4.2.38)
¯L zu
Dabei wird der Dämpfungsparameter ωL ∈ (0, 1) verwendet, um das Residuum von ū
minimieren. Auf diesen in der Praxis sehr nützlichen Trick wollen wir hier nicht weiter eingehen.
¯L wird nun nochmals µ-mal nachgeglättet“. Ausgehend
Die erhaltene korrigierte Näherung ū
”
(0)
¯
¯
von ūL := ūL wird etwa wieder mit dem Richardson-Verfahren iteriert:
(k)
(k−1)
¯L , ϕL ) = (ū
¯L
(ū
¯(k−1)
, ϕL ) + θL (f, ϕL ) − a(ū
, ϕL )
L
∀ϕL ∈ VL .
(1)
(4.2.39)
(µ)
¯L akzeptiert. Damit
Das Ergebnis wird schließlich als die nächste Mehrgitteriterierte uL := ū
haben wir einen Schritt des Mehrgitterverfahrens (einen Zyklus“) auf dem Gitterlevel L be”
schrieben. Jeder solche Zyklus beinhaltet also neben ν + µ Richardson-Schritten (auf Level L),
welche jeweils eine Inversion der Massematrix erfordern, die Lösung des Grobgitterproblems“
”
(4.2.37).
Wir wollen nun den beschriebenen Mehrgitteralgorithmus in etwas abstrakterer Form darstellen, um seine Struktur besser zu verstehen und ihn auch leichter analysieren zu können. Zu
den Matrizen Al = Ahl auf den Gittern Tl sind Operatoren Al : Vl → Vl assoziiert durch
(Al vl , wl ) = a(vl , wl ) = hAl yl , zl i ∀vl , wl ∈ Vl .
(4.2.40)
Weiter seien Sl (·) die zugehörigen Glättungsoperationen mit (linearen) Iterationsoperatoren
Sl . Beim Richardson-Verfahren ist der Iterationsoperator Sl = Il − θl Al . Schließlich führen wir
noch Transferoperatoren zwischen aufeinander folgenden Räumen ein:
rll−1 : Vl → Vl−1 (Restriktion),
pll−1 : Vl−1 → Vl (Prolongation).
Im Finite-Elemente-Kontext ist natürlicherweise rll−1 = Pl−1 die L2 -Projektion und pll−1 =
id. die natürliche Einbettung. Wir beschreiben nun den Mehrgitterprozeß zur Berechnung der
Lösung des Sytems
A L uL = f L
auf dem feinsten“ Gitter TL .
”
(4.2.41)
4.2 Mehrgitterverfahren
171
(t)
(0)
Mehrgitterprozeß: Ausgehend von einem Startwert uL ∈ VL werden Iterierte uL durch den
folgenden rekursiven Prozeß
(t)
(t+1)
= M G(L, uL , fL )
uL
(4.2.42)
(t)
erzeugt. Sei also die t-te Mehrgitteriterierte uL bestimmt.
Grobgitterlösung: Für l = 0 bedeutet M G(0, ·, g0 ) stets die exakte Lösung des Systems A0 v0 =
g0 (z.B. mit Hilfe eines direkten Lösungsverfahrens), d.h.:
v0 = M G(0, ·, g0 ) = A−1
0 g0 .
(4.2.43)
Rekursion: Sei für ein 1 ≤ l ≤ L das System Al vl = gl zu lösen. Mit Parameterwerten ν, µ ≥ 1
ist dann
(1)
(0)
M G(l, vl , gl ) := vl
≈ vl
(4.2.44)
rekursiv definiert durch die folgenden Schritte:
(i) Vorglättung:
(0)
v̄l := Slν (vl ) ;
(4.2.45)
dl := gl − Al v̄l , ;
(4.2.46)
d˜l−1 := rll−1 dl ;
(4.2.47)
(ii) Defektbildung:
(iii) Restriktion:
(0)
(iv) Defektgleichung: Ausgehend von ql−1 := 0 wird für 1 ≤ r ≤ R iteriert:
(r−1)
(r)
ql−1 := M G(l − 1, ql−1 , d˜l−1 ) ;
(4.2.48)
(4.2.49)
(v) Prolongation:
(R)
ql := pll−1 ql−1 ;
(4.2.50)
(vi) Korrektur: Mit einem Dämpfungsparameter ωl ∈ (0, 1] wird gesetzt:
v̄¯l := v̄l + ωl ql ;
(4.2.51)
(vii) Nachglättung:
(1)
vl
:= Slµ (v̄¯l ) ;
(4.2.52)
172
Iterative Lösungsverfahren für FD- und FE-Gleichungen
Im Falle l = L wird schließlich gesetzt:
(t+1)
uL
(1)
:= vl
.
(4.2.53)
(t+1)
(t)
Schematische Darstellung des Mehrgitterschritts uL → uL
(t)
(t)
(t)
:
(t)
uL → ūL = SLν (uL ) → dL = fL − AL ūL
↓ d˜L−1 = rLL−1 dL−1
˜
qL−1 = Ã−1
L−1 dL−1
(Restriktion)
(R-malige Defektkorrektur)
↓ q̃L = pL
L−1 qL−1
(Prolongation)
(t+1)
(t)
¯(t)
¯(t)
= SLµ (ū
ū
L )
L = ūL + ωL q̃L → uL
Wenn die Defektgleichung AL−1 qL−1 = d˜L−1 auf dem gröberen Gitter TL−1 exakt“ gelöst wird
”
(z.B. durch Gauß-Elimination), spricht man von einer Zweigittermethode“: In der Regel wird
”
der Prozeß aber rekursiv zum Mehrgitterverfahren bis zum gröbsten Gitter fortgesetzt. Dabei
kann der vollständige Mehrgitterzyklus auf verschiedene Art organisiert werden. Seine Struktur
ist im wesentlichen durch den Parameter R bestimmt, der festlegt, wie oft der Defektkorrekturprozeß auf jedem Gitterlevel durchgeführt wird. In der Praxis spielen nur die Fälle R = 1 oder
R = 2 eine Rolle. Dem entsprechen der im schematischen Bild gezeigte sog. V-Zyklus“ und
”
der sog. W-Zyklus“. Dabei stehen die Punkte •“ für Glättung und Defektkorrektur auf den
”
”
Gittern Tl , und die Linie −“ für den Transfer zwischen aufeinander folgenden Gitterniveaus.
”
v4
v3
v2
v1
v0
v4
v3
v2
v1
v0
Abbildung 4.2: Schema eines Mehrgitterverfahrens mit V- (oben links) F- (oben rechts) und
W-Zyklus (unten).
Der V-Zyklus ist sehr effizient (wenn er funktioniert), krankt aber oft an Instabilitäten,
welche durch Irregularitäten im Problem (starke Unsymmetrien, Eckensingularitäten, Gitterunregelmäßigkeiten u.s.w.) hervorgerufen werden. Der W-Zyklus ist dagegen sehr robust, aber auch
4.2 Mehrgitterverfahren
173
teurer. Methoden mit R ≥ 3 sind gewöhnlich zu ineffizient. Ein guter Kompromiß zwischen VZyklus und W-Zyklus stellt der sog. F-Zyklus“ dar. Dieser wird gewöhnlich auf Gitter TL
”
(0)
(0)
gestartet mit einem beliebigen Startvektor uL (meist uL = 0 ). Wird dieser Prozeß allerdings
zur Lösung eines nicht linearen Problems im Rahmen einer Newton-Iteration angewendet, so
kann dieser Startwert zu ungenau sein, und die ganze Iteration divergiert. In einem solchen Fall
startet man zur Generierung einer hinreichend genauen Anfangsapproximation den Mehrgitterprozess gewöhnlich auf dem gröbsten Gitter T0 . Wir beschreiben dieses sog. geschachtelte“
”
Mehrgitter-Schema ( nested multigrid“) für das lineare Problem.
”
Geschachteltes MG: Ausgehend von dem Startwert u0 := A−1
0 f0 auf dem gröbsten Gitter T0
werden für l = 1, ..., L rekursiv Näherungen ũl ≈ ul berechnet nach der Vorschrift:
(0)
ul
= pll−1 ũl−1
(t)
(t−1)
ul = M G(l, ul
, fl ),
t = 1, ..., tl ,
(t )
(tl )
kul
− ul k ≤ ĉ h2l kf k,
ũl = ul l .
Es gibt nicht den“ Mehrgitteralgorithmus. Die erfolgreiche Realisierung des Mehrgitterkon”
zepts erfordert eine sorgfältige Balance der verschiedenen Bestandteile wie Glätter Sl und Gitteroperatoren Al sowie der Gittertransfers rll−1 und pll−1 jeweils für das zu lösende Problem. Im
folgenden werden wir diese Verfahrenskomponenten im Rahmen des Finite-Elemente-Kontexts
diskutieren.
i) Glätter:
Glätter“ sind üblicherweise einfache Fixpunktiterationen, die auch als Löser“
”
”
verwendet werden können, aber mit einer sehr schlechten Konvergenzrate. Sie werden auf jedem
Gitterniveau nur ein paarmal angewendet (ν, µ ∼ 1 − 4), um die hochfrequenten Fehleranteile
auszudämpfen. Wir betrachten im folgenden nur das klassische Richardson-Verfahren,
Sl := Il − θl Al ,
θl = λmax (Al )−1 ,
(4.2.54)
welches aber nur bei sehr gutartigen“ Problemen funktioniert. Leistungsfähiger und robuster
”
sind das Gauß-Seidel- und das ILU-Verfahren. Diese funktionieren auch noch gut, wenn das
Problem gewisse Pathologien beinhaltet. Im Fall eines starken Advektionsterms besitzt die Systemmatrix bei Numerierung der Knotenpunkte in Transportrichtung einen dominanten unteren
Dreicksanteil L , für den die Gauß-Seidel-Methode exakt“ ist. Für Probleme mit degenerierten
”
Koeffizienten in einer Raumrichtung sowie auf stark anisotropen Gittern besitzt die Systemmatrix einen dominaten Tridiagonalanteil, für den wiederum die ILU-Iteration exakt ist. Für echt
indefinite Probleme werden spezielle, der jeweiligen Struktur des Problems angepaßte Glätter
verwendet, deren Diskussion aber außerhalb des Rahmens dieser Vorlesung liegt. Auf lokal verfeinerten Gittern darf die Glättung im Wesentlichen nur auf den jeweils neu hinzugekommenen
Zellen operieren, da sonst der arithmetische Aufwand pro Gitterlevel zu groß wird.
ii) Gittertransfers: Im Kontext einer Finite-Elemente-Diskretisierung mit geschachtelten Ansatzräumen V0 ⊂ V1 ⊂ ... ⊂ Vl ⊂ ... ⊂ VL ist die generische Wahl für die Prolongation
pll−1 : Vl−1 → Vl die zellweise Einbettung und für die Restriktion rll−1 : Vl → Vl−1 die L2 Projektion. Bei anderen Diskretisierungen (z.B. Differenzenschemata) verwendet man geeignete
Interpolationsprozesse (z.B. bilineare Interpolation).
iii) Grobgitteroperatoren: Die Operatoren Al auf den verschiedenen Gitterniveaus müssen nicht
notwendig zur selben Diskretisierung des Ausgangsproblems gehören. Dies wird z.B. wichtig
174
Iterative Lösungsverfahren für FD- und FE-Gleichungen
bei der Berücksichtigung von gitterweitenabhängiger künstlicher Diffusion ( upwinding“) zur
”
Behandlung von Transporttermen. Wir beschränken uns hier aber auf den Idealfall, daß alle
Al durch dieselben FE-Diskretisierungen auf der Gitterhierarchie {Tl }l=0,...,L erzeugt sind. In
diesem Fall gilt die für die theoretische Analyse nützliche Beziehung
(Al−1 vl−1 , wl−1 ) = a(vl−1 , wl−1 )
= a(pll−1 vl−1 , pll−1 wl−1 )
= (Al pll−1 vl−1 , pll−1 wl−1 ) = (rll−1 Al pll−1 vl−1 , wl−1 ) ,
d.h.: Al−1 = rll−1 Al pll−1 .
iv) Korrekturschritt: Im Korrekturschritt wird ein Dämpfungsparameter ωl ∈ (0, 1] verwendet,
der im einfachsten Fall ωl = 1 gesetzt ist. Es hat sich als sehr wirksam erwiesen, ihn so zu
wählen, daß der Defekt Al v̄¯l − d˜l−1 minimal wird. Dies führt auf die Formel
ωl =
(Al v̄¯l , d˜l−1 − Al v̄¯l )
.
kAl v̄¯l k2
(4.2.55)
In der folgenden Analyse werden wir der Einfachheit halber stets ωl = 1 setzen.
4.2.2 Konvergenz- und Aufwandsanalyse
Die klassische Analyse des Mehrgitteralgorithmus basiert auf seiner Interpretation als eine Defektkorrekturiteration und dem Konzept einer rekursiven Anwendung des Zweigitterverfahrens.
Zur Vereinfachung nehmen wir an, daß nur Vorglättung angewendet wird (d.h.: ν > 0, µ = 0)
und daß im Korrekturschritt keine Dämpfung erfolgt (d.h.: ωl = 1 ). Der Zweigitterprozeß läßt
sich dann in der folgenden Form schreiben:
(t+1)
uL
(t)
(t) −1 L−1
= SLν (uL ) + pL
fL − AL SLν (uL )
L−1 AL−1 rL
(t)
−1 L−1
ν (t)
= SLν (uL ) + pL
L−1 AL−1 rL AL uL − SL (uL ) .
(t)
(t)
Für den Iterationsfehler eL := uL − uL gilt daher
(t+1)
eL
ν (t)
−1 L−1
= I L − pL
L−1 AL−1 rL AL SL (uL ) − uL .
(4.2.56)
Die Glättungsoperation ist gegeben in der (affin-linearen) Form
SL (vL ) := SL vL + gL
und erfüllt als Fixpunktiteration die Bedingung SL (uL ) = uL . Daraus erschließt man rekursiv,
daß
(t)
(t)
(t)
SLν (uL ) − uL = SL SLν−1 (uL ) − uL = ... = SLν eL .
Mit dem sog. Zweigitteroperator“
”
−1 L−1
ν
ZGL (ν) := (IL − pL
L−1 AL−1 rL AL )SL
4.2 Mehrgitterverfahren
175
gilt daher
(t+1)
eL
(t)
= ZGL (ν)eL .
(4.2.57)
Satz 4.2 (Zweigitterkonvergenz): Für hinreichend häufige Glättung, ν > 0 , ist der Zweigitteralgorithmus konvergent mit einer bzgl. L gleichmäßigen L2 -Konvergenzrate:
kZGL (ν)k ≤ ρZG (ν) = c ν −1 < 1 .
(4.2.58)
ν
L
−1 L−1
ZGL (ν) = (A−1
L − pL−1 AL−1 rL )AL SL
(4.2.59)
−1 L−1
ν
L
kZGL (ν)k ≤ kA−1
L − pL−1 AL−1 rL kkAL SL k .
(4.2.60)
Beweis: Wir schreiben
und schätzen ab:
Der erste Term rechts beschreibt die Qualität der Approximation der Feingitterlösung auf dem
gröberen Gitter, während der zweite Term den Glättungseffekt enthält. Die Idee für die weitere
Analyse ist nun, zu zeigen, daß der Glätter SL (·) die sog. Glättungseigenschaft“,
”
kAL SLν vL k ≤ cs ν −1 h−2
L kvL k ,
vL ∈ VL ,
(4.2.61)
und die Grobgitterkorrektur die sog. Approximationseigenschaft“ besitzt,
”
−1 L−1
2
L
k(A−1
L − pL−1 AL−1 rL )vL k ≤ ca hL kvL k ,
vL ∈ VL ,
(4.2.62)
mit positiven Konstanten cs , ca gleichmäßig bzgl. L . Kombination dieser beiden Abschätzungen
ergibt dann die behauptete Ungleichung (4.2.58). Für hinreichend häufige Glättung ist ρZG :=
cν −1 < 1 , und der Zweigitteralgorithmus konvergiert gleichmäßig bzgl. L . Alle im folgenden
auftretenden Konstanten sind unabhängig von L .
(i) Glättungseigenschaft: Der selbstadjungierte Operator Al besitzt reelle, positive Eigenwerte
0 < λ1 ≤ ... ≤ λi ≤ ... ≤ λNL =: ΛL mit einem zugehörigen L2 -Orthonormalsystem von
Eigenfunktionen {w(1) , ..., w(NL ) } , so daß sich jedes vL ∈ VL in der Form
vL =
NL
X
γi w(i) ,
γi = (vL , w(i) )
(4.2.63)
i=1
darstellen läßt. Für den Richardson-Iterationsoperator
SL := IL − θL AL : VL → VL ,
θL = Λ−1
L ,
(4.2.64)
gilt dann
AL SLν vL =
NL
X
i=1
λi ν (i)
w ,
γi λi 1 −
ΛL
(4.2.65)
176
Iterative Lösungsverfahren für FD- und FE-Gleichungen
und folglich
kAL SLν vL k2 =
NL
X
i=1
λi 2ν
γi2 λ2i 1 −
ΛL
NL
λi 2ν o X
γi2
1≤i≤NL
ΛL
ΛL
i=1
n λ 2 2ν o
λ
i
i
= Λ2L max
1−
kvL k2 .
1≤i≤NL
ΛL
ΛL
≤ Λ2L max
n λ 2 i
1−
Mit Hilfe der Beziehung (Übungsaufgabe)
max {x2 (1 − x)2ν } ≤ (1 + ν)−2
(4.2.66)
kAL SLν vL k2 ≤ Λ2l (1 + ν)−2 kvL k2 .
(4.2.67)
0≤x≤1
ergibt sich
Die Beziehung ΛL ≤ ch−2
L liefert dann schließlich die behauptete Ungleichung für den RichardsonIterationsoperator
kAL SLν k ≤ cs ν −1 h−2
L ,
ν ≥ 1.
(4.2.68)
(ii) Approximationseigenschaft: Wir erinnern daran, daß im vorliegenden Kontext geschachtelter
FE-Räume Prolongationen und Restriktionen gegeben sind durch
pL
L−1 = id. (Identität),
rLL−1 = PL−1 (L2 -Projektion).
Ferner erfüllt der Operator AL : VL → VL definitionsgemäß
(AL vL , ϕL ) = a(vL , ϕL ),
vL , ϕL ∈ VL .
Für ein beliebiges, aber fest gewähltes fL ∈ VL gilt demnach für die Funktionen vL := A−1
L fL
−1 L−1
und vL−1 := AL−1 rL fL :
a(vL , ϕL ) = (fL , ϕL ) ∀ϕL ∈ VL ,
a(vL−1 , ϕL−1 ) = (fL , ϕL−1 ) ∀ϕL−1 ∈ VL−1 .
Der Funktion vL ∈ VL ordnen wir eine Funktion v ∈ V ∩ H 2 (Ω) zu als Lösung der Randwertaufgabe
Lv = fL in Ω,
v = 0 auf ∂Ω,
(4.2.69)
bzw. in schwacher“ Formulierung
”
a(v, ϕ) = (fL , ϕ)
∀ϕ ∈ V .
(4.2.70)
4.2 Mehrgitterverfahren
177
Dafür gilt die a priori Abschätzung
k∇2 vk ≤ ckfL k.
(4.2.71)
Dann ist
a(vL , ϕL ) = (fL , ϕL ) = a(v, ϕL ),
ϕL ∈ VL ,
a(vL−1 , ϕL−1 ) = (fL , ϕL−1 ) = a(v, ϕL−1 ),
ϕL−1 ∈ VL−1 ,
d.h.: vL und vL−1 sind gerade die Ritz-Projektionen von v auf VL bzw. VL−1 . Für diese gelten
die L2 -Fehlerabschätzungen
kvL − vk ≤ ch2L k∇2 vk,
kvL−1 − vk ≤ ch2L−1 k∇2 vk.
(4.2.72)
Damit erhalten wir wegen hL−1 ≤ 4hL und der a priori Abschätzung (4.2.71):
kvL − vL−1 k ≤ ch2L k∇2 vk ≤ ch2L kfL k .
(4.2.73)
Dies bedeutet mit der obigen Setzung, daß
−1 L−1
2
L
kA−1
L fL − pL−1 AL−1 rL fL k ≤ chL kfL k .
(4.2.74)
Damit folgt die gewünschte Abschätztung
2
L
−1 L−1
kA−1
L − pL−1 AL−1 rL k ≤ chL .
(4.2.75)
Dies vervollständigt den Beweis.
Q.E.D.
Das Resultat für den Zweigitteralgorithmus wird nun verwendet zum Nachweis der Konvergenz des vollen Mehrgitteralgorithmus.
Satz 4.3 (Mehrgitterkonvergenz): Es sei angenommen, daß der Zweigitteralgorithmus konvergiert mit einer L2 -Konvergenzrate ρZG (ν) → 0 für ν → ∞ , gleichmäßig bzgl. L . Dann
konvergiert für hinreichend häufige Glättung der Mehrgitteralgorithmus mit R ≥ 2 (W-Zyklus)
mit einer von L unabhängigen L2 -Konvergenzrate ρM G < 1 ,
(t)
(t)
kuL − M G(L, uL , fL )k ≤ ρM G kuL − uL k.
(4.2.76)
Beweis: Der Beweis wird durch Induktion nach dem Gitterlevel L geführt. Wir betrachten nur
den relevanten Fall R = 2 (W-Zyklus) und werden uns der Einfachheit halber nicht bemühen,
die auftretenden Konstanten zu optimieren. Sei ν so groß, daß die Konvergenzrate des Zweigitteralgorithmus ρZG ≤ 18 ist. Wir wollen zeigen, daß dann die Konvergenzrate des Mehrgitteralgorithmus ρM G ≤ 14 ist, gleichmäßig bzgl. L . Für L = 1 ist dies dann offenbar richtig. Sei nun
auch ρM G ≤ 14 für Gitterlevel L − 1 . Auf Gitterlevel L gilt dann ausgehend von der Iterierten
(2)
(t)
uL mit der approximativen Lösung qL−1 (nach 2-maliger Anwendung der Grobgitterkorrektur)
und der exakten Lösung q̂L−1 der Defektgleichung auf Level L − 1 :
(t+1)
uL
(t)
(t)
(2)
= M G(L, uL , fL ) = ZG(L, uL , fL ) + pL
L−1 (qL−1 − q̂L−1 )
(4.2.77)
178
Iterative Lösungsverfahren für FD- und FE-Gleichungen
Nach Induktionsvoraussetzung ist (Man beachte, daß der Startwert der Mehrgitteriteration auf
L−1
Level L − 1 gleich Null ist und ρ̂L−1 = A−1
L−1 rL dL ):
(t)
(2)
L−1
ν
kq̂L−1 − qL−1 k ≤ ρ2M G kq̂L−1 k = ρ2M G kA−1
L−1 rL AL SL (uL − uL )k .
(t)
(4.2.78)
(t)
Kombination der letzten Beziehungen ergibt für den Iterationsfehler eL := uL − uL :
(t)
(t+1)
ν
L−1
(4.2.79)
A
S
k
keL k .
r
keL k ≤ ρZG + ρ2M G kA−1
L
L
L−1 L
Die Norm rechts ist bereits im Zusammenhang mit der Konvergenz des Zweigitteralgorithmus
−1 L−1
ν
L
abgeschätzt worden. Mit dem Zweigitteroperator ZGL = (A−1
L − pL−1 AL−1 rL )AL SL gilt
−1 L−1
−1
L−1
ν
ν
L
ν
ν
A−1
L−1 rL AL SL = SL − (AL − pL−1 AL−1 rL )AL SL = SL − ZGL
und somit
ν
ν
L−1
kA−1
L−1 rL AL SL k ≤ kSL k + kZGL k ≤ 1 + ρZG ≤ 2 .
(4.2.80)
Damit erhalten wir schließlich
(t+1)
keL
(t)
k ≤ ρZG + 2ρ2M G keL k .
(4.2.81)
Mit Hilfe der Annahme über ρZG und der Induktionsannahme folgt
(t+1)
keL
k≤
1
8
was den Induktionsbeweis vervollständigt.
(t)
(t)
1
+ 2 16
keL k ≤ 14 keL k ,
(4.2.82)
Q.E.D.
Für gutartige“ Probleme (symmetrischer, positiv definiter Operator, glatte Koeffizienten,
”
quasi-gleichförmige Gitter u.s.w.) erreicht man in der Regel Mehrgitterkonvergenzraten im Bereich ρM G = 0, 1 − 0, 3 . Die obige Analyse ist nur für den W-Zyklus gültig, da im Beweisteil (ii)
R ≥ 2 benötigt wird. Der V-Zyklus kann nicht auf Basis nur einer Zweigitteranalyse behandelt
werden. In der Literatur finden sich allgemeinere Ansätze, die Konvergenz von Mehrgitterverfahren auch in weniger regulären Situationen garantieren.
Als nächstes diskutieren wir die numerische Komplexität des Mehrgitteralgorithmus. Dabei
werden die folgenden Bezeichnungen verwendet:
OP (T ) = Anzahl der a.Op. zur Durchführung einer Operation T,
R = Anzahl der Defektkorrekturschritte auf den einzelnen Gitterniveaus,
(d = Raumdimension),
Nl = dim Vl ≈ h−d
l
κ = max Nl−1 /Nl ,
1≤l≤L
C0 = OP (A−1
0 )/N0 ,
Cs = max {OP (Sl )/Nl },
Cd = max {OP (dl )/Nl },
Cr = max {OP (rl )/Nl },
Cp = max {OP (pl )/Nl }.
1≤l≤L
1≤l≤L
1≤l≤L
1≤l≤L
In der Praxis ist meist κ ≈ 2−d , Cs ≈ Cd ≈ Cr ≈ Cp ≈ #{anm 6= 0} und C0 N0 ≪ NL .
4.2 Mehrgitterverfahren
179
Satz 4.4 (Mehrgitterkomplexität): Unter der Bedingung q := Rκ < 1 gilt für einen Mehrgitterzyklus M GL :
OP (M GL ) ≤ CL NL
mit
CL =
(4.2.83)
(ν + µ)Cs + Cd + Cr + Cp
+ C0 q L ,
1−q
Der Mehrgitteralgorithmus liefert die NL -dimensionale diskrete Lösung uL ∈ VL auf dem Gitter
TL im Rahmen der Diskretisierungsgenauigkeit O(h2L ) bzgl. der L2 -Norm mit O(NL ln(NL ))
a.Op. und hat damit (fast) optimale Komplexität.
Beweis: Wir setzen Cl := OP (M Gl )/Nl . Ein Mehrgitterschritt beinhaltet die R-fache Anwendung desselben Algorithmus auf dem nächst gröberen Gitter. Bei Beachtung von Nl−1 ≤ κNl
gilt mit Ĉ := (ν + µ)Cs + Cd + Cr + Cp :
CL NL = OP (M GL ) ≤ ĈNL + R · OP (M GL−1 ) = ĈNL + R · CL−1 NL−1 ≤ ĈNL + qCL−1 NL ,
und folglich CL ≤ Ĉ + qCL−1 . Rekursive Anwendung dieser Beziehung liefert
CL ≤ Ĉ(1 + q + q 2 + ... + q L−1 ) + q L C0 ≤
Ĉ
+ q L C0 .
1−q
Dies impliziert die behauptete Abschätzung (4.2.83). Die Komplexität des Gesamtalgorithmus
ergibt sich dann aus den Beziehungen
−2/d
ρtM G ≈ h2L ≈ NL
,
t≈−
ln(NL )
.
ln(ρM G )
Dies vervollständigt den Beweis.
Q.E.D.
Wir bemerken, daß im Beweis der Aussage (4.2.83) die Bedingung
q := Rκ = R max Nl−1 /Nl < 1
1≤l≤L
wesentlich ist. Dies besagt für den W-Zyklus (R = 2), daß sich beim Übergang vom Gitter Tl−1
zum nächst feineren Tl die Anzahl der Gitterpunkte (bzw. Freiheitsgrade) hinreichend stark
erhöhen muß, etwa wie bei einer gleichförmigen Verfeinerung
Nl ≈ 4Nl−1 .
Bei einem adaptiv gesteuerten Verfeinerungsprozeß mit teilweise nur lokaler Gitterverfeinerung
ist dies meist nicht erfüllt; selbst bei Verwendung der Fest-Raten“-Strategie ist z.B. oft nur
”
Nl ≈ 2Nl−1 . In solchen Fällen muß der Mehrgitterprozeß zur Aufwandsersparnis modifiziert
werden. Dies geschieht dadurch, daß die kostenintensive Glättung sowie die anderen Operationen nur jeweils auf den beim Übergang von Tl−1 zu Tl neu hinzugekommenen Gitterpunkten
durchgeführt werden. Bei der Implementierung eines Mehrgitteralgorithmus auf lokal verfeinerten Gittern ist viel Fingerspitzengefühl erforderlich, wenn der resultierende Gesamtalgorithmus
komplexitäts-optimal sein soll.
180
Iterative Lösungsverfahren für FD- und FE-Gleichungen
Für das geschachtelte MG-Schema erhält man sogar im strengen Sinne optimale“ Lösungs”
komplexität O(NL ) , da auf jedem Gitterniveau bestmögliche Startwerte verwendet werden.
Satz 4.5 (Geschachteltes Mehrgitterverfahren): Das geschachtelte MG-Schema ist komplexitäts-optimal, d.h.: Es liefert die diskrete Lösung uL ∈ VL auf dem feinsten Gitter TL
im Rahmen der Diskretisierungsgenauigkeit O(h2L ) bzgl. der L2 -Norm mit einem Aufwand von
O(NL ) a.Op.
Beweis: Die Genauigkeitsanforderung für die Mehrgitteriteration auf Gitterlevel TL ist
(t)
keL k ≤ ĉh2L kf k.
(4.2.84)
(i) Wir wollen zunächst zeigen, daß (4.2.84) beim geschachtelten MG-Schema unter den Voraussetzungen des Mehrgitterkonvergenzsatzes 4.3 auf jedem Level L mit einer (hinreichend
(t)
(t)
großen) festen Zahl t∗ von Mehrgitterschritten erreichbar ist. Sei eL := uL − uL wieder der
(t)
(t)
(0)
Iterationsfehler auf Level L . Nach Annahme ist e0 = 0, t ≥ 1 . Im Fall uL := uL−1 gilt dann
(0)
(t)
(t)
keL k ≤ ρtM G keL k = ρtM G kuL−1 − uL k
(t)
≤ ρtM G kuL−1 − uL−1 k + kuL−1 − uk + ku − uL k
(t)
≤ ρtM G keL−1 k + ch2L kf k .
Rekursive Anwendung dieser Beziehung für L ≥ l ≥ 1 ergibt dann (wegen hl = 2L−l hL )
(t)
(t)
keL k ≤ ρtM G ρtM G keL−2 k + ch2L−1 kf k + ch2L kf k
..
.
(t)
t
2
2t
2
Lt
2
≤ ρLt
M G ke0 k + cρM G hL + cρM G hL−1 + ... + cρM G h1 kf k
2·2
2·L
= c2−2 h2L ρtM G 22 + ρ2t
+ ... + ρLt
kf k
M G2
M G2
≤ c2−2 h2L kf k
22 ρtM G
,
1 − 22 ρtM G
vorausgesetzt 22 ρtM G < 1 . Offenbar gibt es also ein t∗ , so daß (4.2.84) für t ≥ t∗ erfüllt ist,
und zwar gleichmäßig bzgl. L .
(ii) Wir kommen nun zur Aufwandsanalyse. Satz 4.4 besagt, daß ein Zyklus des einfachen“
”
Mehrgitteralgorithmus M G(l, ·, ·) auf dem l-ten Level Wl ≤ c∗ Nl a.Op. benötigt (gleichmäßig
bzgl. l ). Sei nun Ŵl die Anzahl der a.Op. des geschachtelten Schemas auf Gitterlevel l . Dann
gilt konstruktionsgemäß:
ŴL ≤ ŴL−1 + t∗ WL .
Durch Iteration dieser Beziehung erhalten wir mit κ := max1≤l≤L Nl−1 /Nl < 1 :
ŴL ≤ t∗ c∗ {NL + ... + N0 } ≤ ct∗ c∗ NL {1 + ... + κL } ≤
was zu beweisen war.
ct∗ c∗
NL ,
1−κ
Q.E.D.
4.3 Übungen
181
4.3 Übungen
Übung 4.1: Das allgemeine “Abstiegsverfahren” zur iterativen Lösung des Gleichungssystems
Ax = b mit symmetrischer, positiv-definiter Matrix A ∈ RN ×N lautet:
Startwert:
für t ≥ 0:
x(0) ∈ Rn ,
r (0) := b − Ax(0) ,
Abstiegsrichtung
αt =
d(t) ,
hr (t) , d(t) i
,
hAd(t) , d(t) i
x(t+1) = x(t) + αt d(t) ,
r (t+1) = r (t) − αt Ad(t) .
Die sog. “Koordinatenrelaxation” erhält man durch zyklische Wahl der Abstiegsrichtungen d(t)
aus den kartesischen Einheitsvektoren {e(1) , . . . , e(N ) } . Man zeige, daß jeder N -Zyklus der Koordinatenrelaxition äquivalent ist zum üblichen Gauß-Seidel-Verfahren. Bemerkung: Für eine
typische FE-Matrix hat die zyklische Koordinatenrelaxation also das Konvergenzverhalten:
|x(tN ) − x| ≤ cq t ,
q ≈ 1 − cond2 (A)−1 ≈ 1 − h2 .
Übung 4.2: Die erste RWA des Laplace-Operators
−∆u = f in Ω,
u = 0 auf ∂Ω,
auf einem regulären” Gebiet Ω ⊂ R2 werde mit einem FE-Verfahren mit stückweise linea”
ren Ansatzfunktionen auf einer Folge von quasi-gleichförmigen Gittern (d.h. größen- und formregulär) der Weite h diskretisiert. Dies führt auf lineare Gleichungssysteme Ax = b mit symmetrischen, positiv definiten (N × N )-Matrizen A , wobei N die Anzahl der Knotenpunkte
ist.
Welchen arithmetischen Aufwand (ausgedrückt in Potenzen von h) erfordert dabei die Lösung
dieser Gleichungssysteme mit dem CG-Verfahren mit der Genauigkeit des Diskretisierungsfehlers
gemessen in der Energie-Norm” k∇(u − uh )k ? Dazu verwende man die folgende bekannte
”
Fehlerabschätzung für das CG-Verfahren:
√
1 − 1/ κ
t
t
0
√ ,
|x − x |A ≤ 2q |x − x |A ,
q :=
1 + 1/ κ
mit der diskreten Energienorm” kxkA := (Ax, x)1/2 und der Spektralkondition κ := cond2 (A)
”
von A . (Hinweis: Man verwende die bekannte Beziehung für die Spektralkondition von A sowie die aus der obigen Fehlerabschätzung abgeleitete Abschätzung für die Anzahl der Iterationsschritte. Der Aufwand pro CG-Schritt entspricht etwas der zweimaligen Defektberechnung
x → d := Ax − b .)
Übung 4.3: Man versuche, den Beweis der Konvergenz des Zweigitterverfahrens ZG aus der
Vorlesung für den Fall zu verallgemeinern, daß die Restriktion rll−1 : Vl → Vl−1 mit Hilfe lokaler,
bilinearer Interpolation (anstelle der L2 -Projektion) auf dem Gitter Tl−1 definiert ist. Wo ist
dabei das Problem, und wie kann man damit fertig werden?
182
Iterative Lösungsverfahren für FD- und FE-Gleichungen
Übung 4.4: Die FE-Diskretisierung des Konvektions-Diffusionsproblems
−∆u + ∂1 u = f in Ω,
u = 0 auf ∂Ω,
führt auf unsymmetrische Systemmatrizen Ah . In diesem Fall erfordert die Analyse des Mehrgitterverfahrens einige Modifikationen. Man übertrage den Beweis aus der Vorlesung für die
Konvergenz des Zweigitteralgorithmus, wenn als Glätter wieder das Richardson-Verfahren
xht+1 = xth − θt (Ah xth − bh ),
t = 0, 1, 2, . . . ,
mit den Dämpfungsparametern θt := 12 kAh k−1 verwendet wird.
Übung 4.5: Zur Lösung der 1. RWA der Laplace-Gleichung
−∆u = f in Ω,
u = 0 auf ∂Ω,
auf dem Einheitsquadrat Ω = (0, 1)2 werde auf einer Folge äquidistanter, kartesischer Gitter
Tl mit Gitterweiten hl = 2−l mit Hilfe bilinearer finiter Elemente approximiert. Die diskrete
Gleichung auf Gitterlevel l werde dabei mit einem MG-Verfahren gelöst, wobei das RichardsonVerfahren zur Glättung, die natürliche Einbettung zur Prolongation und die lokale bilineare
Interpolation zur Restriktion verwendet werden. Die Anzahl der Vor- und Nachglättungsschritte
sei ν = 2 und µ = 0 . Wieviele a.Op. kosten dann ungefähr ein V-Zyklus und ein W-Zyklus
ausgedrückt in Vielfachen der Dimension Nl = dim Vl ?
5 Verfahren für parabolische Probleme
Wir diskutieren zunächst wieder die klassischen Differenzenapproximationen zur Lösung parabolischer Anfangs-Randwert-Aufgaben. Der Übersichtlichkeit halber beschränken wir uns dabei
auf das Modellproblem der Wärmeleitungsgleichung in zwei Ortsdimensionen mit Dirichletschen
Randbedingungen, d.h. auf die 1. ARWA:
∂t u + Lu = f
in Ω × (0, T ),
u|∂Ω = 0,
u|t=0 = u0 ,
(5.0.1)
mit einem elliptischen Operator L , der hier exemplarisch als L := −a∆ mit einer Konstanten
a > 0 gewählt wird.
Das Definitionsgebiet Ω ∈ R2 wird wieder als glatt berandet oder als konvexes Polygongebiet vorausgesetzt. Die Problemdaten f, g, u0 sind ebenfalls glatt und kompatibel, so daß die
Lösung ebenfalls als glatt angenommen werden kann. Erweiterungen für Probleme mit weniger
regulären Daten oder anderen Randbedingungen sowie auf den dreidimensionalen Fall werden
gegebenenfalls in Bemerkungen berücksichtigt. Gelegentlich wird auch das eindimensionale Analogon von (5.0.1) betrachtet. Als Basis von Finite-Elemente-Diskretisierungen dient wieder die
variationelle Formulierung von (5.0.1):
(∂t u, ϕ) + a(u, ϕ) = (f, ϕ)
∀ϕ ∈ V, t > 0,
u|t=0 = 0,
(5.0.2)
mit dem üblichen Sobolew-Raum V := H01 (Ω) und der symmetrischen und positiv definiten
Energie-Form“ a(u, ϕ) := (a∇u, ∇ϕ)Ω .
”
Bei der Diskretisierung von instationären Problemen gibt es drei verschiedene Vorgehensweisen, die wir im folgenden kurz beschreiben wollen.
i) Linienmethode“: Zunächst wird eine Diskretisierung bzgl. der Ortsvariablen vorgenom”
men, d.h.: mit Hilfe eines Finite-Differenzen- oder Finite-Elemente-Ansatzes werden diskrete“
”
Funktionen uh (t) = uh (·, t) bestimmt aus der Gleichung
u̇h (t) + Ah uh (t) = fh (t), t ≥ 0,
uh (0) = u0h .
(5.0.3)
Im Falle eines Differenzenverfahrens auf einem Ortsgitter {xi }i=1,...,N ist die diskrete Funktion
N → RN die
uh (t) = (un (t))N
n=1 der Vektor der Knotenwerte un (t) ≈ u(xn , t) , Ah = Ah : R
zum verwendeten Differenzenoperator korrespondierende Matrix und fh = bh = (f (xn ))N
n=1 .
Beim Finite-Elemente-Ansatz ist uh (t) ∈ Vh eine Finite-Elemente-Funktion, Ah =: Vh → Vh
das durch
(Ah vh , ϕh ) = a(vh , ϕh ), vh , ϕh ∈ Vh ,
definierte diskrete Analogon zum Differentialoperators L und fh = Ph f ∈ Vh die L2 -Projektion
der rechten Seite f auf Vh . Die Aufgabe (5.0.3) lautet demgemäß in variationeller Form wie
folgt:
(u̇h (t), ϕh ) + a(uh (t), ϕh ) = (f, ϕh ) ∀ϕh ∈ Vh , t ∈ I,
uh (0) = Ph u0 .
(5.0.4)
(n)
Nach Einführung einer Knotenbasis {ϕh , n = 1, ..., N = dim(Vh )} geht dieses Problem über
in ein System für den Vektor Uh (t) = (Un (t))N
n=1 der zugehörigen Knotenwerte,
Mh U̇h (t) + Ah Uh (t) = bh (t), t ≥ 0,
183
Uh (0) = Uh0 ,
(5.0.5)
184
Verfahren für parabolische Probleme
mit der Steifigkeitsmatrix“ und Massenmatrix“
”
”
(n)
(m)
Ah = (a(ϕh , ϕh ))N
n,m=1 ,
(n)
(m)
Mh = ((ϕh , ϕh ))N
n,m=1
der Finite-Elemente-Basis. In beiden Fällen, (5.0.3) oder (5.0.5), handelt es sich um ein System
von (linearen) gewöhnlichen Differentialgleichungen. Dieses wird nun mit einem der üblichen
Schemata bzgl. der Zeit diskretisiert. Nach Wahl einer (zunächst konstanten) Zeitschrittweite k
werden zu den “diskreten“ Zeitleveln tm = mk Approximationen Uhm = (Unm )N
n=1 zu u(·, tm )
bestimmt. Wir sprechen von einem Einschritt-“ bzw. einem Zweischrittverfahren“, wenn Uhm
”
”
aus den vorausgehenden Werten gemäß einer Formel der Form
Uhm = F (Uhm , Uhm−1 ) bzw. Uhm = F (Uhm , Uhm−1 , Uhm−2 )
berechnet wird. Im Falle
Uhm = F (Uhm−1 ) bzw. Uhm = F (Uhm−1 , Uhm−2 )
heißt die Methode explizit“. Zur Durchführung einer nicht expliziten, d.h. impliziten“, Me”
”
thode müssen in jedem Zeitschritt Gleichungssysteme gelöst werden. Die hohe Dimension des
Systems, N = #{Gitterpunkte an } bzw. N = dim(Vh ) , mit N ∼ 103 − 108 impliziert im
Hinblick auf die Lösungsökonomie Einschränkungen bei der Wahl der Verfahren. Es kommen in
der Regel nur Schemata einfacher Struktur, d.h. mit wenigen Matrix-Vektor-Multiplikationen,
und niedriger Ordnung r = 1 − 4 in Frage. Eine weitere wesentliche Einschränkung besteht
in der generischen Steifheit des Systems. Die Systemmatrix Ah hat in Abhängigkeit von der
(gleichförmigen) Gitterfeinheit h die Kondition
κ2 (Ah ) ≈ h−2 .
Bei expliziten Zeitschrittschemata sind also einschneidende Schrittweitenrestriktionen einzuhalten, welche deren Verwendung in der Regel verbietet. Der formale Vorteil der expliziten Verfahren, daß in den einzelnen Zeitschritten keine impliziten Gleichungssysteme zu lösen sind, wird
besonders in höheren Raumdimensionen (d = 2, 3) durch die hohe Zahl von durchzuführenden
Zeitschritten (besonders bei Verwendung lokal verfeinerter Ortsgitter) schnell aufgehoben.
Beispiel numerischer Instabilität: Wir wollen dies anhand einer einfachen Modellsituation illustrieren. Die eindimensionale, homogene Version der ARWA (5.0.1)
∂t u − ∂x2 u = 0 in Ω = (0, 1),
u|∂Ω = 0,
u|t=0 = u0
(5.0.6)
wird auf einem äquidistanten Gitter 0 = x0 < ... < xn < ... < xN +1 = 1 mit Hilfe zentraler
Differenzenquotienten 2. Ordnung,
n
o
∂x2 u(xn , t) ≈ h−2 Un−1 (t) − 2Un (t) + Un+1 (t) .
diskretisiert. Die Vektorfunktion Uh (t) = (Un (t))N
n=1 genügt dann dem System gewöhnlicher
Differentialgleichungen
U̇n (t) − h−2 {Un−1 (t) − 2Un (t) + Un+1 (t)} = 0 ,
wobei bei Berücksichtigung der Randbedingungen U0 ≡ UN +1 ≡ 0 gesetzt ist. Die Anfangswerte
185
sind naturgemäß Un (0) = u0 (xn ). Dies kann kompakt geschrieben werden als
U̇h + Ah Uh (t) = 0 , t ≥ 0,
mit der (N × N )-Matrix

Ah = h−2
−2

 1







0
1
Uh (0) = U 0 ,
0
−2
.. ..
.
.
(5.0.7)





..
.
.


−2 1 

1 −2
Diese Matrix hat, wie wir bereits wissen, die Eigenwerte
0 < λ1 ≤ ... ≤ λN =
4
+ O(h2 ),
h2
(5.0.8)
d.h.: Das nach Ortsdiskretisierung entstandene System (5.0.7) wird für kleines h zunehmend
steif mit Steifigkeitsrate κ = O(h−2 ). Beim expliziten Euler1 -Schema ( Polygonzugmethode“)
”
ist z.B. aus Stabilitätsgründen die Schrittweitenbedingung
−λn k ∈ [−2, 0]
⇒
k ≤ 21 h2
(5.0.9)
einzuhalten. Diese Schrittweitenbeschränkung für explizite Verfahren hat entscheidende praktische Bedeutung. Wir wollen das Phänomen der numerischen Instabilität illustrieren. Dazu
betrachten wir als einfachstes explizites Zeitschrittschema das klassische Euler-Verfahren (Polygonzugmethode) mit äquidistanter Schrittweite k . Dies führt auf die folgenden Differenzengleichungen für die Approximationen Unm ≈ u(xn , tm ) :
Unm+1 = Unm +
Für k = h2 ist dann
k m
m
m
U
−
2U
+
U
n
n+1 .
h2 n−1
(5.0.10)
m
m
Unm+1 = Un−1
− Unm + Un+1
.
Im Fall oszillierender Anfangsdaten u0n = (−1)n ergibt sich
Un1 = (−1)n−1 − (−1)n + (−1)n+1 = −3(−1)n = −3Un0 ,
und bei Fortsetzung dieses Arguments:
Unm = (−3)m Un0 ,
m ≥ 1, n = 1, ..., N.
(5.0.11)
Dieses Verhalten bedeutet numerische Instabilität“. Es mag unrealistisch erscheinen, eine oszil”
lierende Anfangsbedingung der Art Un0 = (−1)n anzunehmen, doch bedingt durch Rundungs-
1
Leonhard Euler (1707-1783), geb. in Basel: universeller Mathematiker und Physiker; bedeutendster und produktivster Mathematiker seiner Zeit; wirkte in Berlin und St. Petersburg; Arbeiten zu allen mathemischen Gebieten seiner Zeit.
186
Verfahren für parabolische Probleme
fehler könnte gelten
Un0 = Vn0 + ε(−1)n
(5.0.12)
mit glatten“ exakten Anfangsdaten V 0 . Wegen der Linearität der betrachteten Differenzen”
gleichungen folgt
Unm = Vnm + ε(−3)m (−1)n ,
(5.0.13)
so daß die anfänglich kleinen Anfangsstörungen schnell anwachsen. Z.B. ist diese für ε = 10−15 >
3−32 bereits nach nur 32 Zeitschritten auf Größe ≈ 1 angewachsen und zwar unabhängig von
der Größe von h .
ii) Rothe-Methode“: Bei der Rothe2 -Methode wird die Differentialgleichung als gewöhnliche
”
Differentialgleichung für eine Hilbertraum-wertige Funktion U (t) ∈ V aufgefaßt und zunächst
mit einem A-stabilen Verfahren in der Zeit diskretisiert. Bei Verwendung z.B. des impliziten
Euler-Schemas ergibt sich eine Folge von speziellen Randwertaufgaben
U m + kLU m = U m−1 + kf m , m ≥ 1,
U 0 (x) = u0 (x) .
Diese Probleme werden nun nacheinander auf möglicherweise wechselnden, dem Lösungsverlauf
angepaßten Ortsgittern diskretisiert. Das Problem ist dabei der adäquate Transfer der jeweiligen
Startlösung U m−1 vom alten auf das neue Ortsgitter. Hier zeigt sich wieder der systematische
Vorteil einer Finite-Elemente-Galerkin-Methode, bei der sich ganz automatisch als richtige Wahl
die L2 -Projektion von U m−1 auf das neue Gitter ergibt.
iii) Globale Orts-Zeit-Diskretisierung: Ähnlich wie bei den Transportproblemen könnte
auch bei der Wärmeleitungsgleichung eine simultane Diskretisierung (etwa mit einem FiniteElemente-Galerkin-Verfahren) auf einem unstrukturierten Gitter der ganzen (x, t)-Ebene erfolgen. Dieser theoretisch durchaus attraktive Ansatz wird aber bei höher dimensionalen Problemen wegen der globalen Kopplung aller Unbekannten sehr rechenaufwendig und spielt daher bei
parabolischen Problemen in der Praxis keine wesentliche Rolle.
Im folgenden Abschnitt werden wir Differenzenapproximationen in Verbindung mit der Linienmethode betrachten. Die Rothe-Methode wird in Verbindung mit Finite-Elemente-Verfahren
im Ort diskutiert. Dies mündet dann auch ohne Probleme in Galerkin-Diskretisierungen simultan in Ort und Zeit, den sog. unstetigen“ oder stetigen“ Galerkin-Verfahren (sog. dG(r)-“
”
”
”
oder cG(r)-Verfahren“).
”
2
Erich Rothe (1895-1988): deutscher Mathematiker; Promotion und Habilitation in Berlin (1928), danach
Assistent in Breslau, nach dem Krieg Prof. an der University of Michigan, USA.
5.1 Differenzenverfahren für parabolische Probleme
187
5.1 Differenzenverfahren für parabolische Probleme
5.1.1 Zeitschrittverfahren
Wir beginnen mit der Diskussion der Linienmethode“ zur Diskretisierung von parabolischen
”
ARWAn der Art
∂t u + Lu = f
in QT := Ω × I,
u|∂Ω = 0, u|t=0 = u0 ,
(5.1.14)
mit L := −a∆ auf einem beschränkten (regulär berandeten) Gebiet Ω ⊂ R2 und einem Zeitintervall I = [0, T ] . Der Einfachheit halber wird die rechte Seite f gelegentlich zu Null gesetzt.
Ortsdiskretisierung von (5.1.14) mit einem der üblichen Differenzenverfahren (z.B. dem 5Punkte-Operator mit geeigneter Randapproximation) führt auf ein System gewöhnlicher Differentialgleichungen
U̇h (t) + Ah Uh (t) = 0,
t > 0,
Uh (0) = U 0 ,
(5.1.15)
für den Vektor Uh (t) ∈ RN der Knotenwerte. Da die Eigenwerte der Systemmatrix Ah alle reell
sind (oder wenigstens nahe an der rellen Achse liegen), käme zur stabilen Integration des Systems (5.1.15) jede A(0)-stabile Formel in Frage. Dabei muß aber der hohe numerische Aufwand
bei der Durchführung komplizierter impliziter Verfahren hoher Ordnung berücksichtigt werden.
Durch Übertragung der klassischen Zeitschrittformeln für gewöhnliche Differentialgleichungen
auf das System (5.1.15) erhalten wir unter Benutzung der oben eingeführten Bezeichnungen die
folgenden einfachsten Einschrittverfahren:
1) Explizites Euler-Verfahren (Polygonzugmethode):
k−1 {Uhm − Uhm−1 } + Ah Uhm−1 = f m−1 ,
m ≥ 1,
2) Implizites Euler-Verfahren:
k−1 {Uhm − Uhm−1 } + Ah Uhm = f m ,
m ≥ 1,
3) Crank3 -Nicolson4 -Verfahren (Trapezregel):
k−1 {Uhm − Uhm−1 } + 12 Ah (Uhm + Uhm−1 ) = 21 k(f m + f m−1 ),
m ≥ 1,
und die Zweischrittverfahren:
4) BDF(2)-Verfahren (Rückwärtsdifferenzenformel):
m
1 −1
2 k {3Uh
− 4Uhm−1 + Uhm−2 } + Ah Uhm = f m,
m ≥ 2,
5) Mittelpunkts-Verfahren:
m
1 −1
2 k {Uh
3
− Uhm−2 } + Ah Uhm−1 = f m−1 ,
m ≥ 2,
John Crank (1916-): englischer Mathematiker; Prof. an der Brunel University, Uxbridge, England; Beiträge
zur Numerik partieller Differentialgleichungen, bekannt durch das Crank-Nicolson-Verfahren“.
”
4
Phyllis L. Nicolson (1917-1968): englische Physikerin; Lecturer an der Univ. Leeds und an der Univ. Manchester; bekannt durch das Crank-Nicolson-Verfahren“.
”
188
Verfahren für parabolische Probleme
6) Simpson-Verfahren:
m
1 −1
2 k {Uh
− Uhm−2 } + 32 Ah {Uhm + 4Uhm−1 + Uhm−2 } = f m−1 ,
m ≥ 2.
Als Startwerte werden gewöhnlich (im Fall glatter Anfangsdaten) einfach die Restriktionen
Un0 = u0 (an ) verwendet. Bei den Zweischrittverfahren wird der zweite erforderliche Startwert
Uh1 durch Anwendung einer Einschrittformel entsprechender Ordnung gewonnen. Wegen ihrer inhärenten Instabilität (triviales Stabilitätsgebiet) kommen die Mittelpunktsformel und die
Simpson-Formel für die praktische Anwendung nicht in Frage.
Wie bei der Analyse von Differenzenverfahren üblich verwenden wir den Abschneidefehler“
”
m = (τ m )N
τh,k
n n=1 der Differenzenformeln. Diesen erhält man wieder durch formales Auswerten der
Differenzenformeln auf der exakten Lösung:
m
:= um − F (um , um−1 , um−2 ).
k τh,k
Bei einer Ortsdiskretisierung der Ordnung p verhält sich der Abschneidefehler dann gemäß
m
τh,k
= O(hp + kq ),
wobei q die Ordnung“ des Zeitschrittverfahrens ist. Von der Fehleranalyse der Zeitschrittverfah”
ren für gewöhnliche Differentialgleichungen wissen wir bereits, daß die einfachen Euler-Verfahren
die Ordnung q = 1 und das Crank-Nicolson- sowie das BDF(2)-Verfahren die Ordnung q = 2
haben. Später werden wir noch Verfahren der Ordnung q = 3, 4 kennenlernen. Bei der Analyse
dieser Zeitschrittschemata für parabolische Probleme ist die genaue Abhängigkeit des Abschneidefehlers von der örtlichen und zeitlichen Regularität der Lösung interessant.
Hilfssatz 5.1 (Konsistenz): Für die ARWA (5.1.14) genügen die Abschneidefehler der betrachteten Differenzenverfahren den folgenden (scharfen) Abschätzungen:
i) Explizites und implizites Euler-Verfahren:
m
| ≤ max |τhm | + 21 k max |∂t2 u| ;
max |τh,k
Q̄T
Q̄T
Q̄T
(5.1.16)
ii) Crank-Nicolson-Verfahren:
m
| ≤ max |τhm | +
max |τh,k
max |∂t3 u| ;
(5.1.17)
m
| ≤ max |τhm | + 32 k2 max |∂t3 u| .
max |τh,k
(5.1.18)
Q̄T
Q̄T
1 2
12 k
Q̄T
iii) BDF(2)-Verfahren:
Q̄T
Q̄T
Q̄T
Dabei ist τhm = O(h2 ) der Abschneidefehler der Ortsdiskretisierung.
Beweis: Der Abschneidefehler der Ortsdiskretisierung genügt im allgemeinen der Abschätzung
|τhm | = |Lum − Lh um | ≤ ch2 M4m (u),
wobei Lh der Ortsdifferenzenoperator ist und M4 (u) := maxΩ̄ |∇4 um | . Speziell in einer Raum-
5.1 Differenzenverfahren für parabolische Probleme
189
dimension mit Ω = (0, 1) gilt
|τhm | = |∂x2 um − Lh um | ≤
4 m
1 2
12 h max |∂x u |.
[0,1]
i) Für die explizite Euler-Formel gilt
|k
−1
m
(u − u
m−1
m−1
) + Lh u
Z
−1
| = k
Z
= k−1
Z
≤ k−1 ≤ k−1
Z
tm
tm−1
tm
tm−1
tm
tm−1
tm
tm−1
∂t u dt + Lh um−1 ∂t u dt − ∂t um−1 − Lum−1 + Lh um−1 ∂t u − ∂t um−1 ds + |Lum−1 − Lh um−1 |
(t − tm−1 ) dt
max |∂t2 u| + |τhm−1 |
[tm−1 ,tm ]
Es folgt
m
| ≤ 12 k max |∂t2 u| + max |τhm−1 |.
max |τh,k
Q̄T
Q̄T
Q̄T
Dieselbe Abschätzung gilt auch für die implizite Euler-Formel.
ii) Für die Crank-Nicolson-Formel gilt
|k
−1
m
m−1
(u − u
)+
m
1
2 Lh (u
+u
m−1
Z
−1
)| = k
tm
tm−1
∂t u dt − 12 (∂t um + ∂t um−1 )
+ 12 (Lum − Lh um ) + 21 (Lum−1 − Lh um−1 )
Z tm
−1 1
(t
−
t
)(t
−
t
)
dt
≤k max |∂t3 u|
m
m−1
2
+
tm−1
m−1
m
1
|)
2 (|τh | + |τh
[tm−1 ,tm ]
Wir erhalten damit
m
max |τh,k
|≤
Q̄T
1 2
12 k
max |∂t3 u| + max |τhm |.
Q̄T
Q̄T
iii) Für die BDF(2)-Formel gilt
m
1 −1
2 k {3u
− 4um−1 + um−2 + Lh um } = 12 k−1 {3um − 4um−1 + um−2 − 2k∂t um }
+ Lh um − Lum .
Taylor-Entwicklung um tm liefert
3um − 4um−1 + um−2 − 2k∂t um = 43 k3 ∂t3 u(·, η m )
190
Verfahren für parabolische Probleme
mit gewissen Zwischenstellen η m ∈ [tm−2 , tm ] . Damit erhalten wir
m
| ≤ 32 k2 max |∂t3 u| + max |τhm |.
max |τh,k
Q̄T
Q̄T
Q̄T
Dies vervollständigt den Beweis.
Q.E.D.
Die Lösung der ARWA (5.1.14) besitzt die explizite Darstellung
u(x, t) =
∞
X
u0n v (n) (x)e−λn t ,
n=1
(x, t) ∈ QT ,
(5.1.19)
mit den Eigenwerten und (orthonormierten) Eigenfunktionen des regulären elliptischen“ Ope”
rators −a∆ : V ⊂ L2 (Ω) → L2 (Ω) ,
0 < λ1 < ... ≤ λn ≤ ... (n ∈ N),
v (n) (x) ∈ V :
−a∆v (n) = λn v (n) ,
und den Entwicklungskoeffizienten der Startwerte
u0 (x) =
∞
X
u0n v (n) (x) ,
u0n = (u0 , v (n) )Ω .
n=0
Diese Darstellung läßt sich wegen der gleichmäßigen Konvergenz der Reihen wie folgt umformen:
u(x, t) =
=
=
∞
X
∞
X
u0n v (n) (x)
n=1
∞
X
i i
i λn t
(−1)
i!
∞
∞
iX
X
it
(−1)
u0n λin v (n) (x)
=
i!
n=1
i=0
i=0
∞
∞
∞
X
i
i
X
X
it
0 i (n)
i
it
(−1) ∆
un ∆ v (x) =
u0n v (n) (x)
(−1)
i! n=1
i!
n=1
i=0
i=0
∞
X
i1
0
t∆ 0
i
(−1)
i=0
i!
(−t∆) u (x) =: e u (x).
Die Definition der Operatorfunktion et∆ über eine konvergente Taylor-Reihe läßt sich auf beliebige analytische Funktionen übertragen. Wir betonen, daß eine solche kompakte Lösungsdarstellung nur im Fall zeitlich konstanter Koeffizienten a möglich ist. Auf dem diskreten Zeitgitter
gilt dann
u(·, tm ) = ek∆ u(·, tm−1 ),
m ∈ N.
(5.1.20)
Dies legt es nahe, den Zeitschritt tm−1 → tm mit Hilfe einer rationalen Approximation R(z) ≈
ez der Exponentialfunktion der Ordnung“ q + 1 anzusetzen,
”
P (z)
= ez + O(|z|q+1 ), z ≤ 0,
(5.1.21)
R(z) =
Q(z)
mit geeigneten Polynomen P ∈ Pr und Q ∈ Ps , wobei natürlich Q auf z ∈ R− keine Nullstellen
haben darf. Das Diskretisierungsschema lautet dann
Uhm = R(−kAh )Uhm−1
bzw. Q(−kAh )Uhm = P (−kAh )Uhm−1 .
(5.1.22)
5.1 Differenzenverfahren für parabolische Probleme
191
Die oben betrachteten Einschrittverfahren lassen sich in diesen Rahmen einordnen gemäß:
Expliziter Euler“ :
”
Impliziter Euler“ :
”
Crank-Nicolson“ :
”
R(z) = 1 + z ,
R(z) = (1 − z)−1 ,
R(z) = (1 + 21 z)(1 − 12 z)−1 .
Durch die Ordnungsbedingung
ez Qrs (z) − Prs (z) = O(|z|r+s+1 ),
z ≤ 0,
(5.1.23)
für den Ansatz Prs ∈ Pr , Qrs ∈ Ps wird man auf die sog. Padé5 -Schemata“ geführt. Diese
”
sind eindeutig bestimmt und werden gewöhnlich in der sog. Padé-Tafel“ dargestellt:
”
1
1
1−z+ z 2
2
1+z
1
1
1+ z
2
1
1− z
2
1
1+ z
3
2
1
1− z+ z 2
3
6
1
1+z+ z 2
2
1
2
1
1+ z+ z 2
3
6
1
1− z
3
1
1
1+ z+ z 2
2
12
1
1
1− z+ z 2
2
12
...
...
...
...
1
1
1
1−z
1
1
1+x+ z 2 + z 3
2
6
1
3
1
1
1+ z+ z 2 + z 3
4
4
24
1
1− z
4
...
...
...
...
...
1
1 3
1
z
1+ z+ z 2 +
2
10
120
1
1 2
1 3
1− z+ z −
z
2
10
120
...
...
...
...
.
Offensichtlich sind alle bisher betrachteten Einschrittschemata Padé-Formeln und damit in
diesem Sinne ordnungsoptimal. Aus der Padé-Tafel erhalten wir nun weitere Zeitschrittverfahren
höherer Ordnung. Dabei kommen aus Ökonomiegründen nur die diagonalen“ oder subdiago”
”
nalen“ Padé-Schemata in Frage; z.B. die folgenden impliziten Verfahren 3. bzw. 4. Ordnung:
(I +
(I + 13 kAh )Uhm = (I − 32 kAh + 61 k2 A2h )Uhm−1
1
2 kAh
+
m
1 2 2
12 k Ah )Uh
= (I −
1
2 kAh
+
m−1
1 2 2
12 k Ah )Uh
(q = 3),
(q = 4).
Wir bemerken für die weitere Analyse, daß eine rationale Approximation R(z) der Exponentialfunktion (der Ordnung r ≥ 1 ) die folgende Eigenschaft hat:
|R(z)| ≤ eδz ,
−1 ≤ z ≤ 0,
(5.1.24)
mit einem geeigneten δ > 0 . Die Wirkung der Zeitschrittschemata des Typs (5.1.22) läßt sich
mit Hilfe der Spektralzerlegung der Matrix Ah wieder beschreiben durch:
Uhm
=
N
X
n=1
5
Uj0 R(−kλn )m v (n) ,
m ≥ 1,
Henri Eugène Padé (1785-1836): französischer Mathematiker; Prof. in Poitiers und Bordeaux; entwickelte die
sog. Padé-Approximation.
192
Verfahren für parabolische Probleme
bzw. (mit der Euklidischen Vektornorm | · | )
|Uhm |2 =
N
X
n=1
|Un0 |2 |R(−kλn )|2m .
Ihr qualitatives Verhalten läßt sich also weitgehend durch die Eigenschaften der verwendeten
rationalen Funktion R(z) charakterisieren. Wir stellen einige wichtige Bedingungen für die
folgende Analyse zusammen.
(i) Die A-Stabilität
|R(z)| ≤ 1 ,
z ≤ 0.
sichert die Stabilität“ der Zeititeration supm≥0 |Uhm | < ∞ .
”
(ii) Die strenge A-Stabilität
|R(z)| ≤ 1 − ck , z ≤ −1,
sichert die Beschränktheit der diskreten Lösung auch im Fall inhomogener rechter Seiten,
supm≥0 |Uhm | < c supm≥0 |f m | .
(iii) Die starke A-Stabilität
|R(z)| ≤ κ < 1 ,
z ≤ −1 ,
sichert die (exponentielle) Dämpfung hochfrequenter“ Lösungsanteile und macht das Verfahren
”
robust gegenüber lokalen Störungen der Daten ( Glättungseigenschaft“).
”
(iv) Zur korrekten Wiedergabe von Schwingungsprozessen (im Ort oszillierenden Lösungen)
sollte
R(±i) ∼ 1
sein, um diese Schwingungen möglichst wenig zu dämpfen ( numerischen Dissipativität“).
”
Offensichtlich können nur implizite Verfahren die gelisteten Eigenschaften haben. Das implizite Euler-Schema (und genauso alle sub-diagonalen Padé-Schemata)
ist stark A-stabil (mit
√
Limes κ = 0 ), neigt aber zur Überdämpfung: |(1 + i)−1 | = 1/ 2 . Dagegen ist das CrankNicolson-Schema (und genauso alle diagonalen Padé-Schemata) nur einfach A-stabil,
1 − 21 z
= 1,
lim
z→−∞ 1 + 1 z
2
besitzt aber praktisch auch keine numerische Dissipation: |(1 − i/2)(1 + i/2)−1 | = 1 . Die fehlende starke A-Stabilität hat nachteilige Konsequenzen im Fall von irregulären Anfangswerten
u0 (z.B.: lokalen Temperaturspitzen). Die durch diese Anfangsdaten induzierten hochfrequenten
Fehleranteile werden durch das Crank-Nicolson-Schema nur unzureichend ausgedämpft, so daß
sich ein unphysikalisches Lösungsverhalten zeigen kann. Es sei daran erinnert, daß der kontinuierliche Differentialoperator stark dämpfend ist:
ku(t)k ≤ e−λmin t ku0 k ,
t ≥ 0,
mit dem kleinsten Eigenwert des Ortsoperators, λmin > 0 .
Bei Verwendung des Crank-Nicolson-Schemas für Rechnungen über lange Zeiträume sollte
es stabilisiert werden, um wenigstens strenge A-Stabilität zu sichern. Dies kann ohne Reduktion
5.1 Differenzenverfahren für parabolische Probleme
193
der Konsistenzordnung durch einen leichten k-abhängigen Schift erfolgen:
I + 21 (1 + ck)kAh Uhm = I − 21 (1 − ck)kAh Uhm−1 .
(5.1.25)
Verfahren höherer Ordnung erfordern die Invertierung der Operatorfunktion Q(−kAh ) . Dies
ist in der Regel zu teuer. Einerseits ist die Besetzungstruktur von Q(−kAh ) selbst bei Polynomgrad j = 2 bereits deutlich dichter als die von Ah , andererseits würde das Arbeiten mit der
Linearfaktorzerlegung Q(z) = (z − µ)(z − µ̄) die Verwendung (kostspieliger) komplexer Arithmetik erfordern. Geeignet wärenQdagegen Schemata, bei denen das Nennerpolynom in reelle
Linearfaktoren zerfällt: Q(z) = sj=1 (z − µj ), µj ∈ R . Durch diesen Ansatz sollten sich systematisch Verfahren mit günstigeren Eigenschaften als die der einfachen Basisschemata gewinnen
lassen.
Ein Beispiel für einen solchen Ansatz ist die parameter-abhängige rationale Funktion
(1 + αθ ′ z)(1 + βθz)2
= ez + O(|z|3 ),
(1 − αθz)2 (1 − βθ ′ z)
Rθ (z) =
z ≤ 0,
√
mit θ = 1 − 12 2 = 0, 292893..., θ ′ = 1 − 2θ und beliebigen Werten α ∈ ( 12 , 1], β = 1 − α . Das
auf dieser rationalen Funktion basierende Schema ist wegen
|Rθ (z)| < 1 , z < 0 ,
β
< 1.
α
lim |Rθ (z)| =
z→−∞
stark A-stabil. Die Entwicklung
Rθ (z) = 1 + z + 12 z 2 {1 − (α − β)(2θ 2 − 4θ + 1)} + 16 r(θ, α)z 3 + O(|z|4 )
zeigt, daß für die obige Parameterwahl von der Ordnung O(k2 ) ist. Für die Güte dieser Approximation im Vergleich zu der des Crank-Nicolson-Schemas ist die Größe der führenden Fehlerkonstante r(α) bestimmend. Eine Taylor-Entwicklung ergibt
2
3
r(θ, α) = (18θ ′ + 24θ 3 )α3 + (42θ 2 θ ′ + 12θθ ′ + 30θ ′ )α2 β
2
3
2
3
+ (12θ 3 + 30θ 2 θ ′ + 24θθ ′ + 6θ ′ )αβ 2 + (6θ 2 θ ′ + 12θθ ′ + 6θ ′ ).
Im betrachteten Bereich {0, 5 < α ≤ 1} ist |r(θ, α)| ≤ 0, 5 . Damit ist die Fehlerkonstante dieser
1
der
Approximation nur in akzeptablem Maß größer als die entsprechende Fehlerkonstante 12
Trapezregel. Das zugehörige Verfahren läßt sich in Form eines Teilschrittschemas schreiben (hier
für den inhomogenen Fall),
Teilschritt-θ-Verfahren (Fractional-Step-θ-Method):
(I + αθkAh )U m−1+θ = (I − βθkAh )U m−1 + θkfhm−1 ,
′
(I + βθ kAh )U
m−θ
′
= (I − αθ kAh )U
m−1+θ
(I + αθkAh )U m = (I − βθkAh )U m−θ +
′
+ θ kfhm−θ ,
θkfhm−θ .
(5.1.26)
(5.1.27)
(5.1.28)
Jeder der Teilschritte hat die Form eines geschifteten Crank-Nicolson-Schritts, so daß der Gesamtaufwand pro Zeitschritt dem von drei Crank-Nicolson-Schritten entspricht. Für den speziellen Wert
α = (1 − 2θ)(1 − θ)−1 = 0, 585786...
194
Verfahren für parabolische Probleme
ist αθ = βθ ′ , so daß die zu invertierenden Matrizen in den drei Teilschritten übereinstimmen,
was z.B. bei der direkten Lösung der Gleichungssysteme ausgenutzt werden kann. Eine genaue
Analyse des Abschneidefehlers des FS-Schemas zeigt, daß seine führende Fehlerkonstante nur
wenig größer als die von drei kombinierten Crank-Nicolson-Schritten ist:
τkm = ĉk2 + O(k3 ),
ĉF S ∼ ĉ3×CN .
Dies bedeutet, daß das FS-Schema gegenüber dem CN-Schema bzgl. Genauigkeit und Aufwand
gleichwertig ist, aber über eine höhere Robustheit verfügt. Das FS-Schema hat sich in der Praxis als besonders geeignet zur Behandlung von parabolischen Problemen mit nicht notwendig
regulären Daten und geringer natürlicher Eigendissipation erwiesen.
5.1.2 Stabilität und Konvergenz
Wir wollen nun die Stabilität und Konvergenz von Diskretisierungen der Wärmeleitungsgleichung untersuchen. Dabei bedienen wir uns exemplarisch verschiedener Techniken, die alle diskrete Analoga von Analysemethoden beim kontinuierlichen Problem sind.
i) Maximumprinzipmethode“
”
Eine einfache, direkte Variante der Maximumprinzipmethode kann bei gewissen expliziten Differenzenschemata angewendet werden. Die Ortsdiskretisierung führe auf eine M-Matrix Ah . Für
die explizite Euler-Formel
Uhm = Uhm−1 − kAh Uhm−1
gilt dann wegen der Diagonaldominanz von Ah :
|Unm | = |1 − kann ||Unm−1 | + k
kann ||Unm−1 | +
≤ |1 −
X
ν6=n
|anν ||Uνm−1 |
kann max |Uνm−1 |.
ν
Unter der Schrittweitenbedingung
2
k ≤ max{a−1
nn } ∼ ch
(5.1.29)
n
folgt daher die L∞ -Stabilität des Verfahrens
max |Unm | ≤ max |Unm−1 | ≤ ... ≤ max |Un0 |,
n
n
n
m ≥ 1.
(5.1.30)
Im Fall des 5-Punkte-Schemas ist ann = 4h−2 , so daß die Stabilitätsbedingung (5.1.29) die
Form
k ≤ 41 h2
(5.1.31)
erhält.
Satz 5.1 (Explizites Euler-Verfahren): Unter der Schrittweitenbedingung (5.1.29) gilt für
5.1 Differenzenverfahren für parabolische Probleme
195
das explizite Euler-Verfahren die Konvergenzabschätzung
m
2
m
1
max |Uh − u(·, tm )| ≤ T 2 k max |∂t u| + max |τh | .
QT
Q̄T
Q̄T
(5.1.32)
mit dem örtlichen Abschneidefehler τhm = O(hq ) .
Beweis: Der Fehler em := u(·, tm ) − U m genügt der Gleichung
m
k−1 (em − em−1 ) + Ah em = τh,k
mit dem Abschneidefehler
m
| ≤ 12 k max |∂t2 u| + max |τhm | .
max |τh,k
Q̄T
Q̄T
Q̄T
Das bei der Herleitung der Stabilitätsbedingung (5.1.29) verwendete Argument liefert
m
|
max |em | ≤ max |em−1 | + k max |τh,k
Ω̄
Ω̄
Q̄T
Durch Iteration dieser Abschätzung folgt weiter wegen e0 = 0 :
max |em | ≤ k
Ω̄
≤
m
X
µ
|τh,k
|
µ=1
2
m
1
2 tm k max |∂t u| + tm max |τh |.
Q̄T
Q̄T
Dies impliziert die behauptete Fehlerabschätzung.
Q.E.D.
Eine wichtige Eigenschaft des kontinuierlichen Wärmeleitungsoperators ist seine inverse
”
Monotonie“, d.h.: Lösungen zu nicht-negativen Anfangsdaten und rechter Seite bleiben nichtnegativ. Diese Eigenschaft überträgt sich auf die diskretisierten Probleme, wenn die Systemmatrix Ah M-Matrix ist.
(i) Für das explizite Euler-Verfahren folgt unter der Schrittweitenbedingung (5.1.29) aus Unm−1 ≥
0 und fnm ≥ 0 notwendig auch
X
Unm = (1 − kann )Unm−1 + k
|anν |Uνm−1 + kfnm ≥ 0.
ν6=n
(ii) Für das implizite Euler-Verfahren ist im Falle Unm−1 ≥ 0 und fnm ≥ 0
(Ih + kAh )Uhm = Uhm−1 + kfhm ≥ 0.
Da mit Ah natürlich auch Ih + kAh M-Matrix ist, gilt (Ih + kAh )−1 ≥ 0 . Es folgt Uhm ≥ 0 .
In beiden Fällen ist also auch das diskrete Schema invers-monoton“. Dies ist i.a. für das Crank”
Nicolson-Schema nicht der Fall.
ii) Von Neumannsche Methode“ (Fourier-Methode)
”
Wir beschränken uns auf den örtlich eindimensionalen Fall mit Ω = (−π, π) ,
∂t u − ∂x2 u = 0 in QT ,
196
Verfahren für parabolische Probleme
mit periodischen“ Dirichlet-Randbedingungen
”
u(−π, t) = u(π, t),
t ≥ 0.
In diesem Fall kann die Lösung der ARWA nach trigonometrischen Funktionen entwickelt werden
(Fourier-Entwicklung). In komplexer Schreibweise lautet dies
u(x, t) =
∞
X
2
a0ν eiνx eν t ,
(5.1.33)
ν=0
mit den Entwicklungskoeffizienten a0ν der Anfangsbedingung. Auf einem äquidistanten Punktgitter {xn = −π + nh, n = 0, ..., N = 2π/h} machen wir für die diskrete Lösung Uhm =
{Unm , n = 0, ..., N }, m ≥ 0, den analogen Entwicklungsansatz
Unm
=
N
X
iνnh
am
ν e
=:
N
X
a0ν ωνm eiβν n
(5.1.34)
ν=0
ν=0
mit βν := νh und zu bestimmenden Parametern ων ∈ C . Wir fragen nach der Stabilität für
m → ∞ der Differenzendiskretisierung bzgl. der diskreten Spektralnorm
kUhm kh :=
N
X
n=1
2
|am
n|
1/2
.
Die Wirkung des (linearen) Differenzenschemas kann für jede einzelne Fourier-Komponente separat untersucht werden. Gesucht sind Bedingungen an k und h , unter denen |ων | ≤ 1 ist für
alle möglichen βν . Dann liegt Stabilität vor in dem Sinne, daß
kUhm k2h =
N
X
n=1
|a0n |2 |ων |2m ≤
N
X
n=1
|a0n |2 = kUh0 k2h .
(5.1.35)
Wir führen diese Analyse wieder exemplarisch für das explizite Euler-Schema durch. Mit r :=
kh−2 gilt
m
m
Unm+1 = rUn−1
+ (1 − 2r)Unm + rUn+1
.
Einsetzen von Unm := ω m eiβn ergibt
ω m+1 eiβn = rω m eiβ(n−1) + (1 − 2r)ω m eiβn + rω m eiβ(n+1) ,
und nach Vereinfachung
ω = re−iβ + (1 − 2r) + reiβ .
Es liegt Stabilität vor, wenn |ω| ≤ 1 für beliebiges β . Unter Ausnutzung der Beziehungen
eiβ = cos(β) + i sin(β),
cos(β) = 1 − 2 sin2 ( 12 β),
folgt
ω = r eiβ + e−iβ + (1 − 2r) = r (cos(β) + i sin(β) + cos(β) − i sin(β)) + (1 − 2r)
= r 2 − 4 sin2 ( 12 β) + (1 − 2r) = 1 − 4r sin2 ( 12 β).
5.1 Differenzenverfahren für parabolische Probleme
197
Stabilität liegt vor für
−1 ≤ 1 − 4r sin2 ( 21 β) ≤ 1 ∀β,
was äquivalent ist zu
r sin2 ( 12 β) ≤ 12 .
Dies führt auf die schon bekannte Stabilitätsbedingung
k ≤ 21 h2 .
(5.1.36)
Die Fourier-Methode kann auch für exotischere“ Differenzenformeln angewendet werden.
”
Wir demonstrieren dies anhand des klassischen Du Fort6 -Frankel7 -Verfahren“:
”
1
1
m
m
Unm+1 − Unm−1 − 2 Un−1
= 0.
(5.1.37)
− (Unm+1 + Unm−1 ) + Un+1
2k
h
Sein Abschneidefehler verhält sich wie
max |τnm | = O(k2 /h + k2 + h2 ).
n,m
(5.1.38)
Die von Neumannsche Stabilitätsanalyse liefert für die Verstärkungsfaktoren die Darstellung
( r := k/h2 )
p
2r cos(β) ± 1 − 4r 2 sin2 (β)
.
(5.1.39)
ω=
1 + 2r
Dies impliziert , daß |ω| ≤ 1 für alle β , d.h.: Das DuFord-Frankel-Schema ist unbedingt stabil.
Analog zeigt man, daß das sog. Richardson-Verfahren“
”
1
1
m
m
(Unm+1 − Unm−1 ) − 2 (Un−1
− 2Unm + Un−1
)=0
(5.1.40)
2k
h
unbedingt instabil ist. Obwohl es die optimale“ Konsistenzordnung O(h2 + k2 ) besitzt, ist
”
es also praktisch unbrauchbar. Dies ist nicht verwunderlich, da dieses Schema ein Derivat der
Mittelpunktsregel mit dem Stabilitätspolynom π(z, hλ) und den Wurzeln z1,2 = hλ ± (h2 λ2 +
1)1/2 ist.
Die von Neumann’sche Fourier-Methode zur Stabilitätsanalyse von Differenzenschemata ist
auf den Fall periodischer Dirichlet-Randbedingungen bzw. den Grenzfall von Ganzraum-Proble”
men“ ( Ω = R1 ) beschränkt und erfordert äquidistante Ortsgitter. Für allgemeinere Ortsdiskretisierungen anwendbar ist die im folgenden präsentierte Spektralmethode“.
”
iii) Spektral-Methode:
Die symmetrische, positiv definite Matrix Ah habe die Eigenwerte und zugehörigen (l2 -orthonormierten) Eigenvektoren
0 < λ1 ≤ ... ≤ λN ,
6
{w(n) , n = 1, ..., N }.
E.C. Du Fort (????-????): ????; Publ. mit S.P. Frankel: Stability conditions in the numerical tratment of
parabolic differential equations, Math. Tables and other Aids to Comput. (jetzt Math. Comput.) 7, 135-152
(1953).
7
S.P. Frankel (????-????): ????
198
Verfahren für parabolische Probleme
Jede Gitterfunktion besitzt dann eine Entwicklung der Form
Uhm =
N
X
an w(n) ,
n=1
an = hUhm , w(n) i.
Dabei ist das Skalarprodukt h·, ·i für eine FD-Diskretisierung im Ort wieder ein diskretes Analogon der kontinuierlichen L2 -Norm,
hv, wi :=
N
X
h2n vn wn ,
n=1
und für eine FE-Diskretisierung gerade diese: hv, wi := (v, w)Ω . Entsprechend sind die zugehörigen Normen kuk := hv, vi1/2 definiert. Wir analysieren im folgenden isoliert den Zeitschrittfehler
im Rahmen der Linienmethode.
Satz 5.2 (Glättungseigenschaft): Jedes stark A-stabile Einschrittschema vom Typ (5.1.22)
der Ordnung r besitzt die Glättungseigenschaft:
kUhm − um
hk≤c
kr 0
ku k,
trm h
m > 0.
(5.1.41)
Beweis: Nach Voraussetzung ist supz≥0 |R(−z)| ≤ 1 , limz→∞ |R(−z)| ≤ ω < 1 und
|R(−z) − e−z | ≤ c|z|r+1 ,
0 ≤ z ≤ 1.
O.B.d.A. nehmen wir an, daß |R(−z)| ≤ ω < 1 für z ≥ 1 . Wir verwenden wieder das Spektralargument von oben. Mit den Eigenwerten 0 < λ1 ≤ ... ≤ λN von Ah und einem zugehörigen
Orthonormalsystem {w(n) , n = 1, ..., N } von Eigenvektoren gilt wieder für den Anfangswert
u0h =
N
X
αn w(n)
n=1
die Abschätzung ( τn := kλn )
|Uhm
−
2
um
h|
=
N
X
n=1
=
2
α2n R(−kλn )m − e−mkλn X
τn ≤1
... +
X
... .
τn >1
Für die erste Summe rechts gilt mit einem geeigneten δ > 0 :
X
τn ≤1
... =
2
2 m−1
X X
R(−τn )m−1−µ e−µτn α2n
R(−τn ) − e−τn τn ≤1
≤c
X
τn ≤1
µ=0
τn2r+2 m2 e−2δ(m−1)τn α2n
≤ cm−2r |u0h |2 .
5.1 Differenzenverfahren für parabolische Probleme
199
Für die zweite Summe rechts gilt entsprechend mit einem δ > 0 :
o
n
X
X
... ≤ 2
α2n |R(−τn )|2m + e−2mτn
τn >1
τn >1
≤ ce−δm
X
τn >1
α2n ≤ cm−2r |u0h |2 .
Kombination dieser beiden Abschätzungen liefert wegen m = tm /k :
2
|Uhm − um
h| ≤c
k2r 0 2
|uh | .
t2r
m
Dies vervollständigt den Beweis.
(5.1.42)
Q.E.D.
Das populäre Crank-Nicolson-Schema
Uhm = (Ih + 21 kAh )−1 (Ih − 21 kAh )Uhm−1
besitzt als nicht stark A-stabiles Schema nicht die volle Glättungseigenschaft. Wir wollen diesen
Defekt anhand einer Modellbetrachtung erläutern. Sei
Uh0
=
N
X
α0n v (n)
⇒
n=1
Uhm
=
N
X
α0n
n=1
1 − kλ /2 m
n
v (n) .
1 + kλn /2
Die Lösungskomponente zur höchsten Frequenz Λ = λN verhält sich wie
ωm =
1 − kΛ/2 m
1 + kΛ/2
∼ e−tm Λ ,
was dem Abfall der exakten“ Lösung entspricht.
”
(i) Für kΛ < 2 (⇔ k ∼ h2 ) ist
|ω| ≤ e−δ , δ > 0,
was den korrekten exponentiellen Abfall e−δm impliziert.
(ii) Im Fall kΛ ∼ k/h2 ∼ 4/h (⇔ k ∼ h) ist
ω∼−
1 − h/2
,
1 + h/2
was oszillierendes Verhalten (−1)m e−hm impliziert.
Zur Dämpfung dieser Oszillationen in den hochfrequenten“ Komponenten können folgende
”
Strategien verwendet werden:
a) Mittelbildung:
Ũh1
=
0
1
4 {Uh
+
2Uh1
+
Uh2 }
=
N
X
n=1
α0n
n1
4
+
1 1 − 21 kλn 1 1 − 12 kλn 2 o (i)
w .
+
2 1 + 21 kλn 4 1 + 12 kλn
200
Verfahren für parabolische Probleme
Auswertung des Ausdrucks in der Klammer ergibt
1 + kλn + 12 k2 λ2n + 2 − 21 k2 λ2n + 1 − kλn + 41 k2 λ2n
1
=
1
1
2
4(1 + 2 kλn )
(1 + 2 kλn )2
und somit
Ũh1
=
N
X
αn
.
(1 + 21 kλn )2
n=1
b) Euler-Dämpfung: Der Zeitschrittprozeß wird mit zwei impliziten Euler-Schritten mit halber
Schrittlänge gestartet. Dies ergibt
Ũh1 =
N
X
n=1
α0n
1
1 + 12 kλn
2
w(n) .
Satz 5.3 (Gedämpftes Crank-Nicolson-Verfahren): Das durch zwei Euler-Schritte gedämpfte Crank-Nicolson-Verfahren besitzt die Glättungseigenschaft:
kUhm − um
hk≤c
Beweis: Für z ≥ 0 gilt
1 z3
−z 1 − 2 z ,
≤c
e −
1
1 + 2z
1 + 12 z
k2 0
ku k.
t2m h
−z
e −
Wir verwenden dies in der folgenden Abschätzung:
2
kUhm − um
hk =
N
X
n=1
α2n
(5.1.43)
1 z2
≤c
.
1+z
1+z
o2
2
n 1 − 1 kλ m
1
n
−mkλn
2
−
2
e
1 + 21 kλn
1 + 12 kλn
Wir bezeichnen den Inhalt der äußeren Klammer mit σnm und setzen τn := kλn . Es gilt
n
σnm = e−(m−2)τn e−2τn −
1 − 1 τ m
2 o n
2
o
1
1
−(m−2)τn
2 n
−
+
e
−
2
1 + 12 τn
1 + 12 τn
1 + 21 τn
1
1
e−τn +
= e−(m−2)τn e−τn −
1 + 21 τn
1 + 12 τn
1
2 m−3
M −3−µ
X
1 − 12 τn 1
−µτn 1 − 2 τn
e
.
+ e−τn −
1 + 12 τn 1 + 21 τn µ=0
1 + 12 τn
i) Fall τn ≤ 2 :
1
1 − 21 τn
− 2 τn
.
≤
e
1 + 21 τn
Dies sieht man wie folgt: Wegen ez ≥ z gilt −1 + ze−z ≤ 0 . Die Funktion f (z) := 1 − z −
(1 + z)e−z hat die Eigenschaften f (0) = 0 und f ′ (z) = −1 + ze−z ≤ 0 und folglich f (z) ≤ 0 .
5.1 Differenzenverfahren für parabolische Probleme
201
Damit erschließen wir
|σnm |
m−3
o
n
X
3 −mτn /2
−mτn 2
e−µτn /2
τn + τi e
≤c e
µ=0
n
1 − e−(m−2)τn /2 o
≤ c e−mτn τn2 + τn3 e−mτn /2
1 − e−τn /2
2
c
k
≤ 2 =c 2 .
m
tm
ii) Fall τn > 2 :
1 − τ /2 n
≤ e−2/τn .
1 + τn /2
Damit erschließen wir:
n
1o
|σnm | ≤ c e−mτn + e−2(m−2)/τn 2
τn
m 2 1 o
n
1
≤ c (mτn )2 e−mτn 2 + e−2m/τn
m
τ n m2
1
k2
≤c 2 =c 2 .
m
tm
Zusammenfassung der Resultate (i) und (ii) liefert nun:
2
kUhm − um
hk ≤c
N
k4 X 2
αn .
t4m
(5.1.44)
n=1
Dies vervollständigt den Beweis.
Q.E.D.
Auch die Spektralmethode ist auf den Fall parabolischer Probleme mit zeitunabhängigen,
selbstadjungierten Operatoren wie dem Laplace-Operator ∆ beschränkt. Die weitreichendste
Analysetechnik ist die sog. Energie-Methode“ (Hilbertraum-Methode), welche auch für Pro”
bleme mit unsymmetrischen Operatoren mit zeitabhängigen Koeffizienten anwendbar ist. Wir
demonstrieren diese Technik hier aber nur für die vorliegende Modellsituation.
iv) Energie-Methode:
Wir betrachten das populäre Crank-Nicolson-Schema. Für Funktionen (vn )N
n=1 auf einem äquidistanten Quadratgitter sind
(v, w)h := hd
N
X
n=1
vn wn ,
1/2
kvkh := (v, v)h ,
diskrete Analoga des L2 -Skalarprodukts und der zugehörigen L2 -Norm.
202
Verfahren für parabolische Probleme
Satz 5.4 (Crank-Nicolson-Verfahren): Das Crank-Nicolson-Verfahren hat für hinreichend
glatte Lösung u den globalen Diskretisierungsfehler
max ku − Uh kh ≤ c(u) T {h2 + k2 } ,
Q̄T
(5.1.45)
mit einer Konstante c(u) ≈ maxQ̄T {|∂t3 u| + a|∇4 u|} .
Beweis: Für den Fehler em := um − U m gilt
m
k−1 (em − em−1 ) + 12 Ah (em + em−1 ) = τh,k
.
Multiplikation dieser Identität mit em + em−1 und Summation über m ergibt
m
, em + em−1 )h .
k−1 {kem k2h − kem−1 k2h } + 12 (Ah (em + em−1 ), em + em−1 )h = (τh,k
Der kleinste Eigenwert von Ah ist λ > 0 . Damit erschließen wir
m 2
kh ,
k−1 {kem k2h − kem−1 k2h } + 21 λkem + em−1 k2h ≤ 12 λkem + em−1 k2h + 12 λ−1 kτh,k
bzw.
m 2
kem k2h ≤ kem−1 k2h + 21 λ−1 kkτh,k
kh .
Wir summieren nun über µ = m, ..., 1 und erhalten
kem k2h ≤ ke0 k2h + 12 λ−1 k
m
X
µ=1
µ 2
kτh,k
kh .
Mit e0 = 0 und der obigen Abschätzung für den Abschneidefehler folgt schließlich die Behauptung.
Q.E.D.
5.2 FE-Galerkin-Verfahren für parabolische Probleme
203
5.2 FE-Galerkin-Verfahren für parabolische Probleme
Wir diskutieren nun die Rothe-Methode zur Lösung des Problems
∂t u − ∆u = f
in QT = Ω × [0, T ],
(5.2.46)
mit den Nebenbedingungen u|t=0 = u0 und u|∂Ω = 0 . Da die folgende Analyse exemplarischen
Charakter hat, betrachten wir nur das implizite Euler-Schema. Dieses lautet angewendet auf das
kontinuierliche Problem (5.2.46)
−1
(U m − U m−1 ) − ∆U m = f¯m ,
km
U 0 := u0 ,
(5.2.47)
wobei die rechte Seite im zeitlichen Mittel ausgewertet wird gemäß
Z tm
m
−1
¯
f (t) dt = f m + O(km ).
f := km
tm−1
Die Zeitschrittweite km := tm − tm−1 darf hier variieren, um eine möglichst gute Anpassung an
die Lösungseigenschaften zu erreichen. Mechanismen zur adaptiven Wahl der Zeitschrittweiten
auf der Basis von a posteriori Fehlerabschätzungen werden weiter unten diskutiert.
Die einzelnen Zeitschritte seien mit Hilfe eines FE-Verfahrens mit Ansatzräumen Vhm ⊂ V
auf möglicherweise von Zeit zu Zeit wechselnden Gittern Tm
h diskretisiert:
(Uhm , ϕ) + km (∇Uhm , ∇ϕ) = (Uhm−1 , ϕ) + km (f¯m , ϕ)
∀ϕ ∈ Vhm .
(5.2.48)
Die Varianz der Ortsdiskretisierungen im Verlaufe der Zeititeration ermöglicht die dynamische
adaptive Anpassung der Ortsgitter an die momentane Lösungsstruktur. In Operatorschreibweise
lautet das Schema (5.2.47)
m m−1
m
+ km Phm f¯m ,
(Ihm + km Am
h )Uh = Ph Uh
Uh0 = Ph0 u0 ,
(5.2.49)
mit der L2 -Projektion Phm auf Vhm . Bezüglich der üblichen Knotenbasen {ϕm,n
h , n = 1, ..., Nm =
m
m
dim Vh } der Räume Vh läßt sich dies als lineares Gleichungssystem zur Bestimmung der zuNm schreiben. Dazu führen wir zusätzlich zu Massemagehörigen Knotenwertevektoren xm
h ∈R
trizen, Steifigkeitsmatrizen und Lastvektoren
Nm
m,j
,
ϕ
)
Mhm := (ϕm,i
,
h
h
i,j=1
Nm
m,i
m,j
Am
,
h := (∇ϕh , ∇ϕh )
i,j=1
Nm
¯m m,j
bm
h := (f , ϕh )
j=1
m−1
und Vhm ein:
auf dem Gitter Tm
h noch Transfermatrizen zwischen den Räumen Vh
Nm−1 ,Nm
m,n
Mhm−1,m := (ϕm−1,j
,
ϕ
)
.
h
h
j,n=1
Damit schreibt sich
Nm−1
(Uhm−1 , ϕm,n
h )=
X
j=1
m−1,m m−1
xm−1
(ϕm−1,j
, ϕm,n
xh
j
h
h ) = Mh
204
Verfahren für parabolische Probleme
und folglich
m−1,m m−1
m
xh + km Mhm bm
(Mhm + km Am
h.
h )xh = Mh
(5.2.50)
Wir wollen dieses Verfahren im folgenden im Hinblick auf Stabilität, Konvergenz sowie a priori
und a posteriori Fehlerabschätzung untersuchen.
5.2.1 A priori Konvergenzabschätzungen
Der natürliche Ansatz zur Analyse von FE-Diskretisierungen ist die Energie-Methode“. Wir
”
geben zunächst einen einfachen Beweis für das implizite Euler-Verfahren unter realistischen
Annahmen an die Regularität der Lösung. Wir setzen
hm := maxm diam(K),
K∈Th
k = max km
1≤m≤M
m mit um := u(·, t ) .
m
und em
m
h := Uh − u
Satz 5.5 (Implizites Euler-Verfahren): Für das implizite Euler-Schema in Verbindung mit
einer FE-Diskretisierung 2. Ordnung gelten die folgenden Fehlerabschätzungen:
i) Für beliebig variierende Ortsdiskretisierung:
max
1≤m≤M
kem
hk
≤ cT
1/2
max
0≤m≤M
−1/2 2
{km
hm k∇2 um k}
Z
M
X
2
km
+c
m=1
tm
tm−1
k∇∂t uk2 dt
1/2
;
(5.2.51)
ii) Im Spezialfall Vhm = Vh gleich für alle m :
max
1≤m≤M
kem
h k
≤ cT
1/2
max
0≤m≤M
{h2m k∇2 um k}
Z
M
X
2
+c
km
m=1
tm
tm−1
k∇∂t uk2 dt
1/2
.
(5.2.52)
4/3
Die Konvergenzordnung in (5.2.51) ist nicht optimal. Unter der Bedingung hm ≤ ckm ergibt
sich aber die zeit-optimale Konvergenzordnung O(km ) . Das optimale Resultat (5.2.52) läßt
−1 ≤ κ
sich auch unter den weniger einschränkenden Bedingungen Vhm−1 ⊂ Vhm oder h2m km
hinreichend klein beweisen.
Beweis: Wir bezeichnen mit Rhm u ∈ Vhm die elliptische“ Ritz-Projektion der kontinuierlichen
”
Lösung um zum Zeitlevel tm auf den Finite-Elemente-Raum Vhm , definiert durch
(∇Rhm v, ∇ϕh ) = (∇v, ∇ϕh )
∀ϕh ∈ Vhm .
(5.2.53)
Für deren Fehler gilt
kv − Rhm vk + hm k∇(v − Rhm v)k ≤ ch2m k∇2 vk.
(5.2.54)
Wir betrachten nun zunächst die Differenz ηhm := Uhm − Rhm um . Für beliebiges ϕh ∈ Vhm ist
dann unter Ausnutzung der Identität
(Uhm − Uhm−1 , ϕh ) + km (∇Uhm , ∇ϕh ) = km (f¯m , ϕh )
5.2 FE-Galerkin-Verfahren für parabolische Probleme
205
und der Projektionseigenschaft von Rhm :
(ηhm − ηhm−1 , ϕh ) + km (∇ηhm , ∇ϕh ) = km (f¯m , ϕh ) − (Rhm um −Rhm−1 um−1 , ϕh )
− km (∇Rhm um , ∇ϕh )
= km (f¯m , ϕh ) − (Rm um −Rm−1 um−1 , ϕh )
h
h
m
− km (∇u , ∇ϕh ).
Wir setzen nun ϕh := ηhm und erhalten mit Hilfe der Identität
(a − b)a = 12 a2 − 12 b2 + 21 (a − b)2
die Beziehung
m 2
1
2 kηh k
− 12 kηhm−1 k2 + 12 kηhm − ηhm−1 k2 + km k∇ηhm k2
= km (f¯m , η m ) − (Rm um − Rm−1 um−1 , η m ) − km (∇um , ∇η m )
h
h
h
h
h
= km (f¯m , ηhm ) − (um − um−1 , ηhm ) − km (∇um , ∇ηhm )
+
+
(5.2.55)
(u − Rhm um , ηhm ) − (um−1 − Rhm−1 um−1 , ηhm−1 )
(um−1 − Rhm−1 um−1 , ηhm−1 − ηhm ).
m
Weiter haben wir
km (f¯m , ηhm ) − (um − um−1 , ηhm ) − km (∇um , ∇ηhm )
Z tm
(f − ∂t u, ηhm ) dt − km (∇um , ∇ηhm )
=
=
=
Z
tm−1
tm
tm−1
Z tm
tm−1
≤
(∇u, ∇ηhm ) dt − km (∇um , ∇ηhm )
(5.2.56)
(t − tm−1 )(∇∂t u, ∇ηhm ) dt
km k∇ηhm k2
+
1 2
4 km
Z
tm
tm−1
k∂t ∇uk2 dt
sowie
(um−1 − Rhm−1 um−1 , ηhm−1 − ηhm ) ≤ 12 kηhm−1 − ηhm k2 + ch4m k∇2 um−1 k2
(5.2.57)
−1 m−1
− ηhm k2 + ckm h4m k∇2 um−1 k2
kηh
(um−1 − Rhm−1 um−1 , ηhm−1 − ηhm ) ≤ km
(5.2.58)
oder
i) Wir betrachten zunächst den Fall allgemein variierender Ortsdiskretisierung. Kombination der
Beziehungen (5.2.55), (5.2.56) und (5.2.57) und Absorption von Termen in die linke Seite ergibt
m 2
1
2 kηh k
− 21 kηhm−1 k2 ≤ (um − Rhm um , ηhm ) − (um−1 − Rhm−1 um−1 , ηhm−1 )
Z tm
1 2
+ 4 km
k∂t ∇uk2 dt + ch4m k∇2 um−1 k2 .
tm−1
206
Verfahren für parabolische Probleme
Wir wenden diese Abschätzung rekursiv für m, m − 1, ..., 1 an und finden
kηhm k2 ≤ kηh0 k2 + 2(um − Rhm um , ηhm ) − 2(u0 − Rh0 u0 , ηh0 )
Z tµ
m n
o
X
kµ2
+c
k∂t ∇uk2 dt + ch4µ k∇2 uµ−1 k2
tµ−1
µ=1
bzw.
kηhm k2 ≤ kηh0 k2 + 12 kηhm k2 + 21 kum − Rhm um k2 − (u0 − Rh0 u0 , ηh0 )
Z tµ
m
X
2
−1 4
kµ
k∂t ∇uk2 dt + ctm max {km
hµ k∇2 uµ k2 }.
+c
0≤µ≤m
tµ−1
µ=1
Mit Hilfe der Abschätzung
kuµ − Rhµ uµ k + kuµ − Phµ uµ k ≤ ch2µ k∇2 uµ k,
µ = 1, ..., m,
(5.2.59)
folgt
2
2 m
m
m
m m
m
kem
h k ≤ kηh k + ku − Rh u k ≤ kηh k + chm k∇ u k,
kηh0 k
0
≤ ku −
Rh0 u0 k
0
+ ku −
Ph0 u0 k
≤
ch20 k∇2 u0 k
(5.2.60)
(5.2.61)
und damit schließlich die Fehlerabschätzung (5.2.51):
2
kem
h k
≤
ctm max {kµ−1 h4µ k∇2 uµ k2 } +
0≤µ≤m
c
m
X
kµ2
µ=1
Z
tµ
tµ−1
k∇∂t uk2 dt.
(5.2.62)
ii) Wir nehmen nun an, daß Vhm = Vh bzw. Rhm = Rh für m = 1, ..., M . Kombination der
Beziehungen (5.2.55), (5.2.56) und (5.2.58) und Absorption von Termen in die linke Seite ergibt
m 2
1
2 kηh k
− 12 kηhm−1 k2 ≤ (um − Rhm um , ηhm ) − (um−1 − Rhm−1 um−1 , ηhm−1 )
Z tm
−1 m−1
2
+ 14 km
− ηhm k2 + ckm h4m k∇2 um−1 k2 .
k∂t ∇uk2 dt + km
kηh
tm−1
Wir wenden diese Abschätzung rekursiv für m, m − 1, ..., 1 an und finden:
kηhm k2 ≤ kηh0 k2 + 2(um − Rhm um , ηhm ) − 2(u0 − Rh0 u0 , ηh0 )
Z tµ
m n
o
X
2
k∂t ∇uk2 dt + km h4µ k∇2 uµ−1 k2 + kµ−1 kηhµ−1 − ηhµ k2
kµ
+c
µ=1
tµ−1
bzw. mit den Abschätzungen (5.2.59), (5.2.60) und (5.2.61),
2
kem
h k
≤ ctm max
0≤µ≤m
{h2µ k∇2 uµ k2 }
+
m
X
µ=1
kµ−1 kηhµ−1
−
ηhµ k2
+c
m
X
µ=1
kµ2
Z
tµ
tµ−1
k∂t ∇uk2 dt. (5.2.63)
5.2 FE-Galerkin-Verfahren für parabolische Probleme
207
m
Im letzten Schritt schätzen wir die mittlere Summe rechts ab. Jetzt kann ϕh = ϕm
h := ηh −
m−1
ηh
∈ Vh als Testfunktion verwendet werden, und wir erhalten wie oben
m−1 2
2
m 2
2
1
1
k + 12 km k∇ϕm
kϕm
h k
h k + 2 km k∇ηh k − 2 km k∇ηh
= km (f¯m , ϕm ) − (Rm um −Rm−1 um−1 , ϕm ) − km (∇Rm um , ∇ϕm )
h
h
h
h
h
h
m
m−1
m
m
= km (f¯m , ϕm
, ϕm
h ) − (u − u
h ) − km (∇u , ∇ϕh )
+ (um − um−1 − Rh (um + um−1 ), ϕm
h ).
Weiter haben wir
m
m−1
m
m
km (f¯m , ϕm
, ϕm
h ) − (u − u
h ) − km (∇u , ∇ϕh ) =
=
=
Z
tm
tm−1
Z tm
tm−1
Z tm
tm−1
≤
m
m
(f − ∂t u, ϕm
h ) dt − km (∇u , ∇ϕh )
m
m
(∇u, ∇ϕm
h ) dt − km (∇u , ∇ϕh )
(t − tm−1 )(∇∂t u, ∇ϕm
h ) dt
m 2
1
2 km k∇ϕh k
+
1 2
2 km
Z
tm
tm−1
k∂t ∇uk2 dt
sowie
m 2
2
m
m−1 2
1
(um − um−1 − Rh (um − um−1 ), ϕm
)k
h ) ≤ 4 kϕh k + chm k∇(u − u
Z tm
2
2
≤ 14 kϕm
k∇∂t uk2 dt.
h k + chm km
tm−1
Kombination dieser Abschätzungen und Absorption von Termen in die linke Seite ergibt
Z tm
m−1 2
m 2
m 2
2
2
k∇∂t uk2 dt.
kϕh k + km k∇ηh k − km k∇ηh k ≤ {km + chm km }
tm−1
Wir wenden diese Abschätzung wieder rekursiv für m, m − 1, ..., 1 an und finden
m
X
µ=1
2
kµ−1 kϕm
h k
+
k∇ηhm k2
k∇ηh0 k2
≤
+c
m
X
µ=1
{kµ +
Mit k∇ηh0 k2 ≤ ch40 k∇2 u0 k2 folgt schließlich
m
X
µ=1
kµ−1 kηhµ
−
ηhµ−1 k2
≤
ch40 k∇2 u0 k2
+c
m
X
µ=1
{kµ +
h2µ }
Z
h2µ }
tµ
tµ−1
Z
tµ
tµ−1
k∂t ∇uk2 dt.
k∂t ∇uk2 dt.
(5.2.64)
Wir setzen dies in (5.2.63) ein und erhalten die behauptete Abschätzung (5.2.52):
2
2
2 µ 2
kem
h k ≤ ctm max {hµ k∇ u k } +
0≤µ≤m
was den Beweis vervollständigt.
m
X
µ=1
kµ−1 kηhµ−1 − ηhµ k2 + c
m
X
µ=1
kµ2
Z
tµ
tµ−1
k∂t ∇uk2 dt,
Q.E.D.
208
Verfahren für parabolische Probleme
Hilfssatz 5.2 (A-priori Schranke): Für die Lösung der ARWA (5.2.46) gilt die a priori
Abschätzung
Z
−1
max k∇ uk + T
T
2
[0,T ]
0
k∇∂t uk2 dt
1/2
≤ c k∇2 u0 k + c max {kf k + k∂t f k}.
[0,T ]
(5.2.65)
Beweis: Der Beweis verwendet die Energie-Technik“, wird hier aber nicht ausgeführt. Q.E.D.
”
Wir wollen noch die Frage nach der inversen Monotonie“ der Orts-Zeit-Diskretisierung dis”
kutieren. Unter bestimmten Bedingungen an das Ortsgitter (z.B. alle Innenwinkel einer Triangulierung ω ≤ π/2 ) ist die Steifigkeitsmatrix Ah eine M-Matrix. Die Systemmatrix Mh +kAh muß
aber nicht automatisch M-Matrix sein. Um dies dennoch sicherzustellen, werden die Elemente
von Mh ,
m,j
mij = (ϕm,i
h , ϕh ),
mit Hilfe der Trapezregel ausgewertet. Bei stückweise linearen Ansätzen liefert dies eine Diagonalmatrix M̃h = Mh + O(h2 ) mit positiven Diagonalelementen, so daß M̃h + kAh M-Matrix
wird. Dieser Mass-Lumping“ genannte Prozeß erhält die Konvergenzordnung des Gesamtsche”
mas und stellt seine inverse Monotonie“ sicher (Übungsaufgabe).
”
5.2.2 Fehlerkontrolle und Schrittweitensteuerung
Zur Herleitung von a posteriori Fehlerabschätzungen erweist sich eine globale Betrachtung simultan in Ort und Zeit (ohne die bisherige Aufspaltung in Orts- und Zeitdiskretisierung) als
angemessen. Wir führen dazu das Konzept der unstetigen Galerkin-Verfahren“ für parabolische
”
ARWAn ein, als deren einfachster Spezialfall das implizite Euler-Verfahren (5.2.48) erscheinen
wird. Die Vorgehensweise entspricht der bereits von den gewöhnlichen AWAn her bekannten,
ergänzt um die Aspekte der Ortsdiskretisierung.
m
Ausgehend von oben formulierten Diskretisierungen Tm
h = {Kn } des Ortsgebiets Ω̄ und
0 = t0 < ... < tµ < ... < tM = T des Zeitintervalls I = [0, T ] führen wir die folgenden
Bezeichnungen ein (Man beachte, daß die Zeitschrittweite nicht bzgl. des Orts variiert.):
Im := (tm−1 , tm ],
k :=
max
m=1,...,M
km ,
km = tm − tm−1 ,
hm := maxm hK ,
v m± := lim v(·, tm ± s),
Qm
n :=
s↓0
Knm
× Im ,
h :=
K∈Th
max
m=1,...,M
hm ,
[v]m := v m+ − v m− ,
m
∂Qm
n := ∂Kn × Im ,
Qm := Ω × Im .
Die ARWA (5.2.46) läßt sich äquivalent schreiben in der Form
M Z
X
m=1
m−1
Im
{(∂t u, ϕ) + (∇u∇ϕ)} dt + ([u]
(m−1)+
,ϕ
Z
) = (f, ϕ) dt
(5.2.66)
I
für beliebige in der Zeit stetige Testfunktion ϕ(·, t) ∈ V , wobei die Anfangsbedingung durch
die Setzung u0− := u0 berücksichtigt ist. Jede (glatte) Lösung von (5.2.46) erfüllt offenbar die
Beziehung (5.2.66), und umgekehrt muß jede Lösung von (5.2.66) in den Teilintervallen Im der
5.2 FE-Galerkin-Verfahren für parabolische Probleme
209
Wärmeleitungsgleichung genügen und bei tm auch stetig sein. Damit folgt dann wieder, daß es
sich um eine Lösung der ARWA handeln muß. Dieses Problem wird nun mit einem GalerkinAnsatz auf dem ganzen Orts-Zeit-Zylinder QT diskretisiert. Dazu führen wir die folgenden
Finite–Elemente–Räume ein:
Vh = {v : Q̄T → R| vt∈Im (·, t) ∈ Vhm , vt∈Im (x, ·) ∈ Pr (Im ), (x, t) ∈ QT }.
Die Funktionen in Vh sind also bzgl. des Ortes stückweise in Vhm (d.h. linear oder bilinear
und stetig) und bzgl. der Zeit stückweise polynomial vom Grad r (und unstetig). Der GalerkinAnsatz sucht dann Approximationen Uh ∈ Vh zu bestimmen durch die Vorschrift
M Z
X
m=1
Im
(m−1)+
{(∂t Uh , ϕh ) + (∇Uh , ∇ϕh )} dt + ([Uh ]m−1 , ϕh
Z
) = (f, ϕh ) dt
(5.2.67)
I
für beliebige Testfunktion ϕh ∈ Vh mit dem Anfangswert Uh0− = Ph0 u0 ( Ph0 die L2 -Projektion
auf Vh0 ). Da die Testfunktionen unstetig in der Zeit sein dürfen, zerfällt dieses formal zeitlich
global gekoppelte System in lokale Teilprobleme auf jedem Zeitstreifen Qm = Ω × Im . Dieses
Schema wird unstetiges Galerkin-Verfahren“ (abgekürzt dG(r)-Verfahren“) genannt. Wir wol”
”
len im folgenden nur den einfachsten Fall r = 0 , d.h. das dG(0)-Verfahren, betrachten. In diesem
Fall reduziert sich das globale Schema (5.2.67) auf die folgende Sequenz von lokalen Gleichungen
auf den Zeitintervallen Im , m = 1, ..., M :
Z
Z
m−1
(f, ϕh ) dt
(5.2.68)
{(∂t Uh , ϕh ) + (∇Uh , ∇ϕh )} dt + ([Uh ]
, ϕh ) =
Im
Im
für beliebiges ϕh ∈ Vhm . Mit der Setzung Uhm := Uhm,− ergibt sich wegen ∂t Uh ≡ 0 auf Im :
km (∇Uhm , ∇ϕh ) + (Uhm − Uhm−1 , ϕ) = km (f¯m , ϕh )
(5.2.69)
für beliebiges ϕh ∈ Vhm . Dies ist gerade das implizite Euler-Verfahren (5.2.48), welches sich also
in diesem Rahmen als dG(0)-Verfahren interpretieren läßt. Diese Sicht ändert zwar nichts am
Verfahren selbst, bietet jedoch einen systematischen Zugang zu seiner Fehleranalyse.
Bemerkung 5.1: Die dG(r)-Verfahren höheren Grades r ≥ 1 entsprechen keinem der oben
diskutierten Zeitschritt-Schemata, sie sind vielmehr Varianten gewisser impliziter Runge8 Kutta9 -Verfahren. Wir bemerken aber, daß sich auch das populäre Crank-Nicolson-Verfahren
in den Rahmen der Galerkin-Verfahren einordnen läßt. Dazu macht man einen modifizierten
Ansatz mit bzgl. der Zeit stückweise linearen, aber diesmal global stetigen Funktionen. Der
Raum der Testfunktionen ist dagegen derselbe wie beim dG(0)-Verfahren. Dies wird dann ein
Petrow-Galerkin-Verfahren“ (sog. cG(1)-Verfahren), welches sich ähnlich analysieren läßt wie
”
das dG(0)-Verfahren:
(Uhm , ϕh ) + 12 km (∇(Uhm + Uhm−1 ), ∇ϕh ) = (Uhm−1 , ϕh ) + km (f¯m , ϕh ),
(5.2.70)
für beliebige Testfunktion ϕh ∈ Vhm .
8
Carle David Tolmé Runge (1856-1927): deutscher Mathematiker; Prof. in Hannover und Göttingen; Beiträge
zur Spektraltheorie mit Anwendungen in der Atom-Physik.
9
Martin Wilhelm Kutta (1867-1944): deutscher Mathematiker; Prof. in Stuttgart; Beiträge zur Aerodynamik
und zur Numerik von Differentialgleichungen.
210
Verfahren für parabolische Probleme
Wir wollen jetzt eine a posteriori Fehlerabschätzung für das dG(0)-Verfahren ableiten, welche
als Basis für eine simultane Anpassung des Ortsgitters und der Zeitschrittweite an den Lösungsverlauf dienen kann. Dazu setzen wir eh := Uh − u . Ein typisches Beispiel ist die Kontrolle des
+
L2 -Fehlers zum Endzeitpunkt J(eh ) := keN
h k.
Satz 5.6 (A-posteriori Fehlerschranke): Für das dG(0)-Verfahren gilt bei Kontrolle des
+
örtlichen L2 -Fehlers zum Endzeitpunkt, J(eh ) := keN
h k , die a posteriori Fehlerabschätzung
J(eh ) ≤ η(Uh ) := ci
m
X
X
µ=1
ρµn (Uh ) ωnµ (z),
(5.2.71)
µ
Kn
∈Tµ
h
mit den Residuentermen
ρµn (Uh ) := kR(Uh )kQµn + hn−1/2 k[∂n Uh ]k∂K×I µ + kµ−1/2 k[Uh ]µ−1 kKnµ ,
R(Uh ) := f − ∂t Uh + ∆Uh , und einer Interpolationskonstante“ ci . Mit der Lösung z des
”
dualen Problems“
”
−∂t z − ∆z = 0
z|∂Ω = 0, z|t=tm = kem+ k−1 em+ .
in Ω × [0, tm ],
(5.2.72)
haben die Gewichte ωnµ (z) die Gestalt:
ωnµ (z) := kµ k∂t zkQµn + kµ2 k∂t2 zkQµn + h2n k∇2 zkQµn .
Beweis: Das erste Standbein“ des Beweises ist ein (parabolisches) Dualitätsargument. Wir
”
führen zunächst für ein festes tm ∈ I das (kontinuierliche) duale Problem“ ein:
”
−∂t z − ∆z = ψ
in Qm := Ω × [0, tm ],
z|∂Ω , zt=tm = χ,
(5.2.73)
∀ϕ ∈ V.
(5.2.74)
bzw. in semi-variationeller Formulierung
−(∂t z, ϕ) + (∇z, ∇ϕ) = (ψ, ϕ)
Umschreiben in die Form (5.2.66) ergibt
m nZ
X
µ=1
Iµ
µ+
{−(ϕ, ∂t z) + (∇ϕ, ∇z)} dt + (ϕ
o Z
, [z] ) =
µ
(ϕ, ψ) dt
[0,tm ]
für beliebige in der Zeit stetige Testfunktion ϕ(·, t) ∈ V , wobei die Anfangsbedingung wieder
durch die Vorschrift z m+ := χ berücksichtigt ist. Durch partielle Integration in der Zeit wird
dies umgeformt zu
m nZ
X
µ=1
Iµ
µ−1
{(∂t ϕ, z) + (∇ϕ, ∇z)} dt + ([ϕ]
,z
(µ−1)+
Z
o
m+
) = (ϕ , χ) +
(ϕ, ψ) dt
(5.2.75)
[0,tm ]
für beliebige in der Zeit (stückweise) differenzierbare Testfunktion ϕ(·, t) ∈ V .
Das zweite Standbein“ des Beweises ist die Galerkin-Orthogonalität des Fehlers des dG(0)”
Verfahrens. Durch Vergleich der beiden Gleichungen (5.2.66) für u und (5.2.67) für Uh erhalten
5.2 FE-Galerkin-Verfahren für parabolische Probleme
211
wir für den Fehler eh := Uh − u die Galerkin-Orthogonalität“:
”
Z
M
X
(m−1)+
m−1
) =0
{(∂t eh , ϕh ) + (∇eh ∇ϕh )}, dt + ([eh ]
, ϕh
(5.2.76)
Im
m=1
für beliebige stetige Testfunktion ϕh (·, t) ∈ Vh .
Wir wählen nun in (5.2.75) die spezielle Testfunktion ϕ := eh und erhalten
m nZ
X
µ=1
Iµ
Z
o
,
χ)
+
{(∂t eh , z) + (∇eh , ∇z)} dt + ([eh ]µ−1 , z (µ−1)+ ) = (em+
h
(eh , ψ) dt.
[0,tm ]
Unter Ausnutzung von (5.2.76) erhalten wir damit die allgemeine Fehleridentität:
(em+
h , χ)
+
Z
(eh , ψ) dt =
[0,tm ]
m nZ
X
Iµ
µ=1
{(∂t eh , z − zh ) + (∇eh , ∇(z − zh ))} dt
o
+ ([eh ]µ−1 , (z − zh )(µ−1)+ )
(5.2.77)
mit einer beliebigen Approximation zh ∈ Vh zur dualen Lösung z . Wir setzen nun im dualen
Problem tm = T , ψ := 0 und χ := keN + k−1 eN + . Aus der allgemeinen Fehleridentität (5.2.77)
folgt
kem+
h k=
m nZ
X
Iµ
µ=1
o
{(∂t eh , z − zh ) + (∇eh , ∇(z − zh ))} dt + ([eh ]µ−1 , (z − zh )(µ−1)+ ) (5.2.78)
mit einer beliebigen Approximation zh ∈ Vh zur dualen Lösung z . Wir nutzen nun die Lösungseigenschaften von u und integrieren auf jeder Zelle Knm partiell bzgl. des Orts:
kem+
h k
=
m
X
X nZ
µ=1
Iµ
µ
Kn
∈Tµ
h
{(∂t u − ∂t Uh , z − zh )Knµ − (∆u − ∆Uh , z − zh )Knµ
o
− (∂n (Uh − u), z − zh )∂Knµ } dt + ([Uh − u]µ−1 , (z − zh )(µ−1)+ )Knµ .
Dies ergibt
kem+
h k=
m
X
X nZ
µ
µ=1 Kn
∈Tµ
Iµ
{(R(Uh ), z − zh )Knµ − 12 ([∂n Uh ], z − zh )∂Knµ } dt
h
o
+ ([Uh ]µ−1 , (z − zh )(µ−1)+ )Knµ ,
mit dem Residuum R(Uh ) := f − ∂t Uh + ∆Uh und dem Sprung [∂n Uh ] von ∂n Uh über die
Zellkanten. Durch Anwendung der Hölder’schen Ungleichung erhalten wir
kem+
h k≤
m
X
X n
kR(Uh )kQµn kz − zh kQµn
µ
µ=1 Kn
∈Tµ
h
o
+ 12 k[∂n Uh ]k∂Qµn kz − zh k∂Qµn } dt + k[Uh ]µ−1 kKnµ k(z − zh )(µ−1)+ kKnµ ,
(5.2.79)
212
Verfahren für parabolische Probleme
Wir wählen nun für zh die natürliche Interpolierende Ih,k z ∈ Vh , welche zellweise definiert ist
durch die Vorschrift
Z
−1
Ih,k z|Iµ = kµ
z dt, Ih,k z|Knµ = konstante Interpolation von z.
(5.2.80)
Iµ
Dann gelten die Interpolationsabschätzungen (Beweis mit Hilfe einer Variante des BrambleHilbert-Lemmas)
kz − Ih,k zkQµn ≤ ci ωnµ (z),
hn1/2 kz − Ih,k zk∂Qµn ≤ ci ωnµ (z),
kµ1/2 k(z − Ih,k z)(µ−1)+ kKnµ ≤ ci ωnµ (z),
(5.2.81)
(5.2.82)
(5.2.83)
wobei
ωnµ (z) := kµ k∂t zkQµn + kµ2 k∂t2 zkQµn + h2n k∇2 zkQµn .
Die Interpolationskonstante“ ci , welche in die a posteriori Fehlerabschätzung (5.2.71) eingeht,
”
hat dabei in der Regel die Größe ci ∼ 0, 1−1 . Einsetzen dieser Abschätzungen in (5.2.79) und
Anwendung der Schwarz’schen Ungleichung ergeben
kem+
h k ≤ ci
m
X n
X
µ
µ=1 Kn
∈Tµ
h
o
µ
−1/2
µ−1
µ
µ
kR(Uh )kQµn + h−1/2
k[∂
U
]k
+
k
k[U
]
k
n h ∂Qn
h
n
µ
Kn ωn (z),
Dies impliziert die Behauptung.
Q.E.D.
Zur konkreten Auswertung der a posteriori Fehlerabschätzung (5.2.71) müssen die Gewichte
berechnet werden. Dazu wird analog zum stationären, elliptischen Fall das duale Problem
(5.2.72) numerisch auf dem aktuellen Gitter gelöst. Mit der resultierenden diskreten dualen
Lösung zh wird dann approximiert gemäß:
ωnm (z)
ωnµ (z) ≈ ω̃nµ := kµ kkµ−1 [zh ]µ−1 kKnµ + h2n k∇2h zh kQµn ,
(5.2.84)
wobei ∇2h zh ∼ ∇2 z ein geeigneter Differenzenqotient ist. Auf der Basis der approximativen a
posteriori Fehlerabschätzung
kem+
h k ≈ η̃(Uh ) := ci
m
X
X
ρµn (Uh ) ω̃nµ (z)
(5.2.85)
µ
µ=1 Kn
∈Tµ
h
können nun simultan das Ortsgitter und die Zeitschrittweite adaptiert werden. Dabei werden in
einem iterativen Prozess die Ortsresiduen
+ h−1/2
k[∂n Uh ]k∂Qµn ,
ρm,1
n
n (Uh ) := kR(Uh )kQµ
n
und Zeitresiduen
−1/2
ρm,2
k[Uh ]µ−1 kKnµ ,
n (Uh ) := kµ
durch Anpassen von hn und km balanciert, bis η̃(Uh ) ≤ T OL für eine vorgegebene Fehlertoleranz TOL.
5.2 FE-Galerkin-Verfahren für parabolische Probleme
213
Analoge Resultate gelten für andere Fehlermaße, z.B. den globalen L2 -Fehler auf QT :
1/2
Z
keh k2 dt
J(eh ) := keh kQT =
.
(5.2.86)
I
In diesem Fall gilt die a posteriori Fehlerabschätzung (5.2.85) mit dem dualen Problem
−1/2
−∂t z − ∆z = keh kQT eh
in Ω × [0, tm ],
z|∂Ω = 0, z|t=tm = 0.
(5.2.87)
Die Wirksamkeit der adaptiven Steuerung der Ortsgitterweite auf der Basis dieser a posteriori
Fehlerabschätzungen wird anhand eines einfachen Beispiels demonstriert.
Beispiel 5.1: Wir lösen die inhomogene Wärmeleitungsgleichung
∂t u − ∆u = f
in QT ,
u|∂Ω = 0, u|t=0 = u0 ,
(5.2.88)
auf dem Einheitsquadrat Ω = (0, 1)2 . Als exakte“ Lösung wird angesetzt:
”
T
1
u(x, t) :=
, x0 := 12 + 14 cos(2πt), 21 + 14 sin(2πt) ,
0
2
1 + α|x − x |
woraus sich Anfangswert und rechte Seite ergeben zu
u0 (x) := u(x, 0),
f (x, t) := ∂t u(x, t) − ∆u(x, t).
Diese Lösungsfunktion beschreibt einen Hügel“ im Gebiet (0, 1)2 , der während des Zeitinter”
valls I = [0, 1] einmal im Kreis um den Punkt ( 12 , 12 ) herumläuft. Die Größe bzw. Steigung des
Hügels läßt sich durch Wahl des Parameters α steuern. Für den Test wird α = 50 gesetzt.
214
Verfahren für parabolische Probleme
Abbildung 5.1: Gittersequenzen bei Kontrolle des Endzeit-L2 -Fehlers keM kΩ ; Quelle: R. Hartmann, A
posteriori Fehlerschätzung ... für die Wärmeleitungsgleichung“, Diplomarbeit 1998.
”
Abbildung 5.2: Gittersequenzen bei Kontrolle des globalen L2 -Fehlers kekΩ×I (unten); Quelle: R. Hart-
mann, A posteriori Fehlerschätzung ... bei Galerkin-Verfahren für die Wärmeleitungsgleichung“, Di”
plomarbeit 1998.
5.3 Verallgemeinerungen und Lösungsaspekte
215
5.3 Verallgemeinerungen und Lösungsaspekte
Wir haben als Modellfall die Wärmeleitungsgleichung
∂t u − a∆u = f
in QT = Ω × [0, T ],
(5.3.89)
mit homogenen Dirichlet-Randbedingungen u|∂Ω = 0 und einem konstanten Diffusionskoeffi”
zienten“ a > 0 betrachtet.
i) Verallgemeinerungen:
Wir lassen nun zu, daß der Koeffizient a = a(x, t) vom Ort und von der Zeit abhängt. Das
Problem schreibt sich dann in der Form
∂t u − ∇ · {a∇u} = f
in QT = Ω × [0, T ].
(5.3.90)
Die oben betrachteten Zeitschrittverfahren lassen sich in der Regel leicht auf diesen allgemeineren
Fall übertragen. Wir wollen dies anhand des Crank-Nicolson-Verfahren diskutieren:
1 m
m−1 m−1
m
= 2 fh + fhm−1 ,
(5.3.91)
Uh
k−1 Uhm − Uhm−1 + 12 Am
h Uh + Ah
mit der Ortsdiskretisierung Ah (t) des Operators −∇ · (a(·, t)∇) . Dabei werden für Funktionen w(t) die abkürzenden Bezeichnungen wm := w(tm ) , wm−1/2 := w(tm−1/2 ) und tm−1/2 :=
1
2 (tm + tm−1 ) verwendet. Dies entspricht der sog. ”Sehnentrapezregel“; Anwendung der ”Tangententrapezregel“ führt auf das Schema:
m−1/2
m−1/2
k−1 Uhm − Uhm−1 + 12 Ah
.
Uhm + Uhm−1 = fh
(5.3.92)
Beide Verfahrensvarianten sind unbedingt stabil und von der Konvergenzordnung O(k2 + h2 ) .
Zu Ihrer Analyse ist das elegante Spektralargument aus dem vorigen Abschnitt leider nicht mehr
geeignet, da der Operator Ah (t) nun mit der Zeit variiert. Statt dessen verwendet man die flexiblere Energietechnik“ und behält im wesentlichen dieselben Aussagen wie im autonomen Fall,
”
allerdings mit wesentlich mehr Aufwand. Im (praktisch wichtigen) nichtlinearen Fall a = a(u(t))
wird zweckmäßigerweise die Tangententrapezform des Crank-Nicolson-Schemas verwendet:
k−1 Uhm − Uhm−1 + Ah
m
1
2 (Uh
Hier ist auch die BDF(2)-Formel gut anwendbar:
m−1/2
.
+ Uhm−1 ) = fh
2k−1 3Uhm − 4Uhm−1 + Uhm−2 + Ah (Uhm ) = fhm .
(5.3.93)
(5.3.94)
Eine Stabilitäts- und Konvergenzanalyse steht aber außerhalb des Rahmens dieser Vorlesung.
ii) Berechnung der Startwerte:
Bei der Durchführung jedes Zeitschritts ist die rechte Seite aufzubauen, welche die Information
vom vorausgehenden Zeitlevel beinhaltet. Dabei ist unter Umständen eine L2 -Projektion auf das
aktuelle Gitter vorzunehmen.
a) Anfangswert: Die Auswertung des Anfangswerts Uh0 kann meist durch einfache, lokale Interpolation (oder Restriktion) des kontinuierlichen Anfangswerts u0 auf das Gitter erfolgen. Im
Fall eines irregulären Anfangswerts, etwa u0 ∈
/ C(Ω̄) , ist jedoch Vorsicht geboten. Zur Gewährleistung der vollen Glättungseigenschaft“ der Diskretisierung (im Ort sowie in der Zeit) sollte
”
216
Verfahren für parabolische Probleme
Uh0 als L2 -Projektion ausgewertet werde gemäß:
(Uh0 , ϕh ) = (u0 , ϕh ) ϕh ∈ Vh .
(5.3.95)
b) Ortsgitterwechsel: Verändert sich die Ortsdiskretisierung vom Zeitlevel tm−1 zum Zeitlevel
tm , so muß die vorausgehende Näherung Uhm−1 ∈ Vhm−1 auf das neue Gitter transferiert werden.
Im FE-Kontext geschieht dies zwangsläufig gemäß
(Uhm−1 , ϕh ) ∀ϕh ∈ Vhm ,
(5.3.96)
was gleichbedeutend mit der Auswertung der L2 -Projektion Phm Uhm−1 ∈ Vhm ist. Dieser unscheinbare Schritt kann unter Umständen die teure“ Komponente des ganzen Lösungsprozesses
”
und Tm
sein. Dies ist dann der Fall, wenn die beiden Gitter Tm−1
h völlig unabhängig vonh
einander erzeugt werden. Zur Auswertung von (5.3.96) müssen Zellintegrale über Produkte von
Knotenbasisfunktionen berechnet werden:
Z
ϕm−1,j
ϕm,n
dx.
h
h
m
Kn
Normalerweise geschieht dies mit Hilfe von Quadraturformeln. Da die Funktion ϕm−1,j
auf der
h
Zelle Knm aber in der Regel nur stückweise glatt ist, wäre das zu ungenau. Der dadurch in
jedem Zeitschritt eingeschleppte Fehler würde im Verlaufe der Rechnung akkumulieren und das
Ergebnis stark verfälschen. Die Verwendung von Quadraturformeln besonders hoher Ordnung
(z.B. 3 × 3-Gauß-Formeln) behebt diese Schwierigkeit nicht, da letztere zur Erreichung ihrer
hohen Genauigkeit natürlich auch eine entsprechend hohe Regularität des Integranden benötigen.
Gerade diese ist aber im betrachteten Fall nicht gegeben. Es gibt im wesentlichen drei Wege zur
Lösung dieses technischen Problems:
- Es werden summierte“ Quadraturformeln auf den einzelnen Zellen Knm verwendet; etwa
”
durch Unterteilung in 4 − 16 Unterzellen. Dies erhöht zwar nicht die Ordnung der Integration,
vermindert aber die relevante Fehlerkonstante.
- Die Integration wird für den stückweise polynomialen Integranden exakt“ durchgeführt. Dazu
”
ist die Bestimmung aller Teilstücke von Knm erforderlich, auf denen ϕm−1,j
glatt ist. Dies wird
h
bei, unstrukturierten Gittern in 3-D allerdings sehr aufwendig.
- Gehören die Gitter Tm−1
und Tm
h zu einer Familie von hierarchisch verfeinerten Gittern,
h
kann diese strukturelle Information zur effizienten Berechnung der Integrale verwendet werden,
da die Lage der kritischen Knicklinien von ϕm−1,j
durch die reguläre Verfeinerung bestimmt
h
ist.
iii) Lösungskomplexität:
Wir betrachten wieder den Modellfall der homogenen Wärmeleitungsgleichung auf dem Einheitsquadrat Ω = (0, 1)2 ⊂ R2 ,
∂t u − ∆u = 0
in QT ,
(5.3.97)
welche auf einem äquidistanten Gitter mit dem 5-Punkte-Differenzenoperator diskretisiert sei.
(i) Explizite Verfahren (etwa das explizite Euler-Schema) erfordern in jedem Zeitschritt eine
Matrix-Vektor-Multiplikation mit einem arithmetischen Aufwand O(N ) . Die Stabilitätsbedingung k ≤ ch2 erzwingt etwa M ∼ h−2 ∼ N Zeitschritte pro Zeiteinheit. Dies bedeutet einen
5.3 Verallgemeinerungen und Lösungsaspekte
217
Gesamtaufwand von O(N 2 ) OP.
(ii) Implizite Verfahren erfordern in jedem Zeitschritt die Lösung eines linearen Gleichungssystems, erlauben aber größere Zeitschritte. Zur Überbrückung einer Zeiteinheit sind aus Genauigkeitsgründen in der Regel M ∼ h−1 Zeitschritte erforderlich. Wir diskutieren exemplarisch
das Crank-Nicolson-Verfahren. Bei zeilenweiser Numerierung der Gitterpunkte haben die resultierenden Gleichungssysteme
(Ih + 21 akAh )U m = (Ih − 12 akAh )U m−1
(5.3.98)
die Koeffizientenmatrix Lh := Ih + 12 akAh , wobei wieder

Bm −Im

 −Im Bm −Im

Ah = 

−Im Bm

..
.









. .  N
. 



..

.
Bm







 −1

4
−1


=

. .  m

. 
−1
4




.. ..

.
.

4 −1
mit der m×m-Einheitsmatrix Im . Die Eigenwerte dieser Matrix sind gegeben durch:
λkl (Lh ) = 1 + 21 akh−2 {4 − 2(cos(khπ) + cos(lhπ))},
k, l = 1, ..., m.
Damit ergibt sich ihre Spektralkondition zu
cond2 (Lh ) =
1 + 4akh−2
λmax (Lh )
∼
.
λmin (Lh )
1 + akπ 2
(5.3.99)
Wir haben also unterschiedlich kritische Konditionierung abhängig von der Relation zwischen k
und h . Im Hinblick auf eine Balancierung von Orts- und Zeitfehler ist die Wahl k ∼ h sinnvoll.
In diesem Fall ist dann
κ2 (Lh ) = O(h−1 ).
(5.3.100)
Im parabolischen Fall ist in der Regel die Konditionierung der zu lösenden impliziten Gleichungssysteme also weniger kritisch als bei elliptischen Problemen. Bei Einhaltung der (natürlich unrealistischen) Schrittweitenrelation k ∼ h2 wird sogar κ2 (Lh ) = O(1) , und der Lösungsaufwand
der impliziten Verfahren nähert sich dem der expliziten.
Zur Lösung des Systems (5.3.98) können alle oben diskutierten Methoden verwendet werden. Da sich im autonomen Fall die Matrix Lh von Zeitschritt zu Zeitschritt nicht ändert, bietet
sich die direkte Lösung mit Hilfe einer einmaligen Cholesky-Zerlegung zu Beginn der Rechnung
an (wenn dies speichertechnisch möglich ist). Dieser Ansatz erfordert es aber, den Zeitschritt
k konstant zu halten, was in den meisten praktischen Fällen nicht ökonomisch ist. Im allgemeinen muß in jedem Zeitschritt eine neue“ Matrix invertiert werden, was die Verwendung
”
iterativer Lösungsverfahren impliziert. Dabei steht mit Uhm−1 ein meist recht guter Startwert
zur Verfügung. Bei Verwendung eines Mehrgitterverfahrens bietet sich daher die Organisation
im F-Zyklus an. Häufig ist wegen der vergleichsweise moderaten Konditionierung der Matrizen
Lh (bei kleiner Zeitschrittweite) zu ihrer Invertierung ein normales CG-Verfahren ausreichend
schnell, so daß sich der Einsatz der komplizierten Mehrgitteriteration erübrigt. Dies hängt aber
sehr von der jeweiligen konkreten Situation ab.
218
Verfahren für parabolische Probleme
iv) Splitting-Methoden (ADI-Verfahren):
In höheren Raumdimensionen ist die Lösung der Gleichungssysteme in jedem Zeitschritt eines
impliziten Verfahrens kostspielig und kann Rechnungen über sehr lange Zeitintervalle T ≫ 1
unmöglich machen. Der Übergang zu expliziten Schemata ist in der Regel wegen der damit verbundenen Zeitschrittrestriktion auch nicht sinnvoll. In dieser Situation stellen die sog. Splitting”
Methoden“ eine attraktive Alternative dar. Diese zerlegen die Lösung der vollen d-dimensionalen
Gleichungssysteme in eine Folge von tridiagonalen Systemen (wie im 1-dimensionalen Fall), welche mit optimaler O(N )-Komplexität gelöst werden können. Ein Vertreter dieses Verfahrenstyps
ist das ADI-Verfahren“ (Alternating Direction Implicit Iteration) nach Peaceman-Rachford,
”
welches wir bereits im Zusammenhang mit iterativen Lösungsverfahren für spezielle separable“
”
Gleichungssysteme kennengelernt haben. Bei mehrdimensionalen, parabolischen Problemen wird
es nun als Diskretisierungsverfahren eingesetzt.
Wir betrachten wieder die Wärmeleitungsgleichung auf dem Einheitsquadrat Ω = (0, 1)2 ,
∂t u − a∆u = 0
in QT ,
(5.3.101)
welche auf einem äquidistanten Gitter mit dem 5-Punkte-Differenzenoperator diskretisiert sei.
Bei zeilenweiser Numerierung der Gitterpunkte haben die aus dem Crank-Nicolson-Verfahren
resultierenden Gleichungssysteme die Gestalt
(Ih + 12 akAh )U m = (Ih − 21 akAh )U m−1 .
(5.3.102)
Der Differenzenoperator Ah wird auf dem kartesischen Tensorprodukt-Gitter in seine Bestandteile bzgl. der einzelnen Koordinatenrichtungen zerlegt gemäß
Ah = Ah,1 + Ah,2 .
Entsprechend erhält das Gleichungssystem (5.3.102) des Crank-Nicolson-Schemas die Form
(Ih + 12 ak(Ah,1 + Ah,2 ))U m = (Ih − 12 ak(Ah,1 + Ah,2 ))U m−1
m−1/2
Die Ah,i sind Tridiagonalmatrizen. Es wird dann unter Einführung von Zwischenwerten Uh
wie folgt iteriert:
m−1/2
(Ih + 12 akAh,1 )Uh
= (Ih − 21 akAh,2 )Uhm−1
m−1/2
(Ih + 12 akAh,2 )Uhm = (Ih − 21 akAh,1 )Uh
.
Die ADI-Methode kann als ein Mehrschritt-Differenzenschema interpretiert werden, wobei allerdings die Zwischenwerte keine physikalische Relevanz haben. In jedem Teilschritt müssen
Gleichungssysteme mit Tridiagonalgestalt gelöst werden. Wir wissen bereits von der Diskussion der iterativen Lösungsverfahren, daß der ADI-Algorithmus für jeden Wert des Parameters
ak > 0 gegen die Lösung Uh∞ des Gleichungssystems Ah Uh∞ = 0 konvergiert. Dies ist auch
physikalisch“ sinnvoll, da ja im homogenen Fall ( f ≡ 0 ) auch für die exakte Lösung gilt
”
u(t) → 0 (t → ∞) . Damit erweist sich das ADI-Verfahren automatisch als unbedingt numerisch
m−1/2
erhalten wir
stabil. Durch Elimination des Zwischenwertes Uh
(I + 21 kAh,1 )(I + 12 kAh,2 )Uhm = (I − 12 kAh,1 )(I − 21 kAh,2 )Uhm−1 .
(5.3.103)
5.3 Verallgemeinerungen und Lösungsaspekte
219
Der Abschneidefehler dieser Differenzenformel erlaubt die Abschätzung
n
o
m
|τh,k
| ≤ c k2 max |∂t3 u| + h2 max |∇4 u| .
Q̄T
Q̄T
(5.3.104)
Eine Konvergenzanalyse ist leicht möglich, wenn wir wieder annehmen, daß die Zerlegungsmatrizen Ah,1 und Ah,2 kommutieren, d.h.: Ah,1 Ah,2 = Ah,2 Ah,1 . In diesem Fall besitzen sie ein
gemeinsames ONS von Eigenvektoren {v (n) , n = 1, ..., N } zu Eigenwerten λn = λn (Ah,1 ) und
µn = µn (Ah,2 ) . Die Koeffizienten in der Entwicklung
Uhm =
N
X
(n)
αm
ν v
ν=1
werden dann durch das ADI-Schema wie folgt fortgepflanzt
αm
n =
(1 − 21 kλn )(1 − 12 kµn ) m−1
αn .
(1 + 21 kλn )(1 + 12 kµn )
(5.3.105)
Hieraus folgt wieder, analog zum Crank-Nicolson-Schema, direkt die unbedingte Stabilität des
ADI-Schemas. Für die Fourier-Koeffizienten αn (t) der örtlich semi-diskreten Approximation
uh (t) gilt
αn (tm ) = e−k(λn +µn ) αn (tm−1 ).
(5.3.106)
Aus der Beziehung für z = z1 + z2 , zi ≤ 0 ,
1 + 21 z1 1 + 21 z2 z1
·
= e + O(|z1 |3 ) ez2 + O(|z2 |3 ) = ez + O(|z|3 )
1
1
1 − 2 z1 1 − 2 z2
(5.3.107)
erhält man durch Adaption des Arguments, welches bei der Konvergenzanalyse der Padé-Verfahren
verwendet wurde, den folgenden Satz.
Satz 5.7 (ADI-Verfahren): Angewendet auf die 5-Punkte-Diskretisierung der Wärmeleitungsgleichung auf dem Einheitsquadrat ist das ADI-Verfahren für jede Zeitschrittweite k stabil und
mit 2. Ordnung konvergent:
m
m
2
3
2
4
kUh − u kh ≤ c k max |∂t u| + h max |∇ u| .
(5.3.108)
Q̄T
Q̄T
Beweis: Der Beweis bedient sich wieder der Spektralmethode.
Q.E.D.
Der ADI-Ansatz ist generell auf (kartesischen) Tensorproduktgittern in beliebigen Raumdimensionen möglich, wenn der zugrunde liegende Differentialoperator separabel“ ist, d.h. additiv
”
in eindimensionale Operatoren zerfällt, wie z.B. der Operator
Lu = −∂12 u − ∂22 u + ∂1 u + ∂2 u + u.
In allgemeineren Situationen (z.B. bei Auftreten gemischter Ableitungen ∂1 ∂2 u oder auf unstrukturierten Gittern) sind additive Zerlegungen von Ah in tridiagonale Teilmatrizen nicht
mehr möglich, und der Wert des ADI-Ansatzes wird zweifelhaft.
220
Verfahren für parabolische Probleme
5.4 Übungen
Übung 5.1: Das implizite Euler-Verfahren angewendet auf eine FE-Diskretisierung des (homogenen) Wärmeleitungsproblems
∂t u − ∆u = 0,
t ≥ 0,
u|t=0 = u0 ,
u|∂Ω = 0,
mit linearen oder bilinearen Ansatzfunktionen führt auf eine Folge von linearen Systemen
Mh U m + kAh U m = Mh U m−1 ,
m ≥ 1,
U 0 = Ph u0 ,
mit der zugehörigen Massematrix Mh und Steifigkeitsmatrix Ah . Man zeige:
a) Die Auswertung der Elemente der Massematrix mit der Trapezregel ergibt eine Diagonalmatrix (sog. “Masse-Lumping”).
b) Auf Triangulierungen ohne stumpfe Innenwinkel ist die durch Masse-Lumping entstehende
Systemmatrix M̃h + kAh diagonal-dominant und vom nicht-negativen Typ, d.h. eine M-Matrix.
c) Anspruchsvolle Zusatzaufgabe: Der Lumping-Prozeß bewirkt einen Zusatzfehler der Größe
|Ũ m − U m | = O(h2 ) .
Übung 5.2: Man leite eine Bedingung für die L2 –Stabilität sowie die L∞ -Stabilität des Wärmeleitungsproblems aus Aufgabe 13.1 auf dem Einheitswürfel im R3 her. Die Ortsdiskretisierung
erfolge mit dem 7-Punkte-Differenzenoperator auf einem (äquidistanten) kartesischen Gitter mit
Gitterweite h . (Hinweis: Man übertrage die Argumentation aus der Vorlesung von zwei auf drei
Raumdimensionen.)
Übung 5.3: Die Wärmeleitungsgleichung
∂t u − a∆u = f, t ≥ 0,
ut=0 = u0 ,
u|∂Ω = 0,
auf einem Polygongebiet Ω ⊂ R2 mit Wärmeleitkoeffizient a > 0 werde im Ort mit einem
linearen Finite-Elemente-Ansatz auf einer quasi-gleichförmigen Folge von Triangulierungen der
Gitterweite h und in der Zeit mit dem impliziten Euler-Schema mit Schrittweite k diskretisiert:
Mh U m + kAh U m = Mh U m−1 + kbm ,
m ≥ 1,
U 0 = Ph u0 .
Man untersuche die Abhängigkeit der Konditionierung der zugehörigen Systemmatrix Mh +kAh
von den Diskretisierungsparametern h und k . (Hinweis: Man betrachte zunächst den Spezialfall,
daß Ω das Einheitsquadrat mit einem gleichförmigen Rechteckgitter ist und die Massematrix
Mh unter Anwendung der Trapezregel (“Masse-Lumping”) nur näherungsweise berechnet wird.)
6 Verfahren für hyperbolische Probleme
Wir diskutieren zunächst wieder die klassischen Differenzenapproximationen zur Lösung hyperbolischer Anfangs-Randwert-Aufgaben (ARWAn). Der Übersichtlichkeit halber beschränken wir
uns dabei auf das Modellproblem der Wellengleichung in einer Ortsdimension mit Dirichletschen
Randbedingungen, d.h. auf die 1. ARWA:
∂t2 u − c2 ∂x2 u = f
in QT := (0, 1) × [0, T ],
u(0, t) = u(1, t) = 0,
0
(6.0.1)
0
u(x, 0) = u , ∂t u(x, 0) = v ,
bzw. deren örtlich zweidimensionales Analogon
∂t2 u − c2 ∆u = f
u|∂Ω = 0,
in QT := Ω × [0, T ],
0
(6.0.2)
0
u|t=0 = u , ∂t u|t=0 = v .
Das Definitionsgebiet Ω wird wieder als glatt berandet oder als konvexes Polygongebiet vorausgesetzt. Die Problemdaten f, u0 , v 0 sind ebenfalls glatt und kompatibel, so daß die Lösung
ebenfalls als glatt angenommen werden kann. Unsere theoretischen Überlegungen haben gezeigt,
daß bei hyperbolischen Problemen Irregularitäten in den Anfangsdaten oder der rechten Seite
entlang der Charakteristiken fortgepflanzt werden. Im Gegensatz zu den elliptischen und parabolischen Problemen besitzen hyperbolische keinerlei Glättungseigenschaft“. Lokale Störungen
”
(bzw. Wellen) werden ungedämpft fortgeplanzt. Insbesondere gilt das Prinzip der Energieer”
haltung“, d.h.: Für f ≡ 0 bleibt die Gesamtenergie (Summe aus kinetischer und elastischer
Energie) in der Zeit erhalten:
k∂t u(t)k2 + c2 k∇u(t)k2 = kv 0 k2 + c2 k∇u0 k2 .
(6.0.3)
Diese charakteristische Eigenschaft sollten auch Diskretisierungen der Wellengleichung besitzen.
6.1 Differenzenverfahren für hyperbolische Probleme
Wir beginnen mit der örtlich eindimensionalen, homogenen Wellengleichung
∂t2 u − c2 ∂x2 u = 0 in QT := (0, 1) × [0, T ],
u(0, t) = u(1, t) = 0,
(6.1.4)
u(x, 0) = u0 , ∂t u(x, t) = v 0 .
Auf einem (äquidistanten) Orts-Zeit-Gitter {xn = nh, tm = mk} mit Ortsgitterweite h sowie
Zeitschrittweite k lautet die natürliche, zentrale Differenzenapproximation 2. Ordnung
m−1
m−1
k−2 {Unm − 2Unm−1 + Unm−2 } − c2 h−2 {Un−1
− Unm−1 + Un+1
}
(6.1.5)
zur Bestimmung der Approximationen Unm ∼ u(xn , tm ) . Dies ist eine (explizite) Zweischrittformel“.
”
Die Startwerte Un0 und Un1 werden aus den Anfangsbedingungen berechnet gemäß:
Un0 := u0 (xn ),
221
222
Verfahren für hyperbolische Probleme
sowie unter Beachtung von
u(xn , k) = u(xn , 0) + k∂t u(xn , 0) + 21 k2 ∂t2 u(xn , 0) + ...
= u0 (xn ) + kv 0 (xn ) + 12 c2 k2 ∂x2 u0 (xn ) + ...
durch
Un1 = u0 (xn ) + kv 0 (xn ) + 12 c2 k2 h−2 {u0 (xn−1 ) − 2u0 (xn ) + u0 (xn+1 )}.
Mit dem Quotienten σ := k/h gilt für den zugehörigen Abschneidefehler:
τh,k = {∂t2 u − c2 ∂x2 u} +
1 2 2
12 h (σ
− c−2 )∂t4 u +
1 4 4
360 h (σ
− c−4 )∂t6 u + ....
Offenbar ist τh,k ≡ 0 für σ = c−1 , d.h.: Die explizite Differenzenformel
m−1
m−1
Unn = Un−1
+ Un+1
− Unm−2
ist eine exakte“ Differenzendarstellung der Wellengleichung. Das Abhängigkeitsgebiet der Dif”
ferenzenformel hängt offenbar von der Schrittweitenrelation σ = k/h ab.
1. Fall 0 < σ ≤ c−1 : Abhängigkeitsgebiet der Differenzenformel enthält das der Differentialgleichung;
2. Fall σ = c−1 : Übereinstimmung“;
”
3. Fall σ > c−1 : Abhängigkeitsgebiet der Differenzenformel ist enthalten in dem der Differentialgleichung.
Satz 6.1 (Courant1 -Friedrichs2 -Lewy3 ): Notwendig für die Konvergenz
Unm → u(xn , tm )
(h, k → 0),
für beliebige Anfangsdaten ist die Schrittweitenbedingung ( CFL-Bedingung“)
”
k
σ := ≤ c−1 .
h
(6.1.6)
(6.1.7)
Beweis: Sei σ > c−1 . Wenn in irgendeinem festen Gitterpunkt (xn , tm ) für eine spezielle
Anfangsbedingung Unm → u(xn , tm ) konvergiert für h, k → 0 , so können wir diese Anfangsdaten
außerhalb des Abhängigkeitsintervalls von (xn , tm ) bzgl. der Differenzenformel beliebig ändern,
ohne daß Unm verändert wird. In diesem Fall kann also Unm nicht gegen die veränderte Lösung
ũ(xn , tm ) konvergieren.
Q.E.D.
Bemerkung 6.1: Wir weisen darauf hin, daß für spezielle Anfangsdaten durchaus (theoretische) Konvergenz auch für σ > c−1 eintreten kann; in diesem Fall liegt aber numerische Instabilität vor. Die Schrittweitenbedingung (6.1.7) ist weniger restriktiv als die entsprechende
Bedingung k ≤ 12 ah2 bei der Wärmeleitungsgleichung.
Im folgenden werden wir die Konvergenz des Differenzenschemas (6.1.5) untersuchen. Dabei
bedienen wir uns der Spektraltechnik, die wir bereits bei parabolischen Problemen kennengelernt
6.1 Differenzenverfahren für hyperbolische Probleme
223
haben. Der örtliche Differenzenoperator
Ah Unm := −
c2
m
}
{U m − 2Unm + Un+1
h2 n−1
(6.1.8)
m
( U0m = UN
+1 = 0 ) ist symmetrisch und positiv definit bzgl. des diskreten Skalarprodukts
(v, w)h := h2
N
X
vn wn ,
n=1
1/2
kvkh := (v, v)h .
Seine Eigenwerte seien 0 < λ1 ≤ ... ≤ λN ∼ 4c2 /h2 mit einem zugehörigen Orthonormalsystem
{w(n) , n = 1, ..., N } von Eigenvektoren. Insbesondere gilt
(Ah v, v)h ≥ λkvk2h
(6.1.9)
mit einer von h unabhängigen Konstante λ > 0 .
Satz 6.2 (CFL-Bedingung): Die explizite Differenzenformel (6.1.5) ist genau dann numerisch stabil, wenn die CFL-Bedingung k/h ≤ c−1 erfüllt ist. Im Falle einer hinreichend glatten
Lösung gilt dann die Konvergenzabschätzung
max kUhm − u(·, tm )kh ≤ c(u)T 2 {k2 + h2 }.
[0,T ]
(6.1.10)
Beweis: i) Für die Entwicklungskoeffizienten in
Uhm =
N
X
(n)
am
nw
n=1
gilt
m−1
=0
+ k2 λn am−1
+ am−2
am
n
n
n − 2an
bzw.
2
m−1
am
+ am−2
= 0.
n + (k λn − 2)an
n
(6.1.11)
Diese homogene Differenzengleichung hat die allgemeine Lösung
m
m
am
n = c1 r1 + c2 r2
mit den Wurzeln ri des charakteristischen Polynoms ρ(r) = r 2 + (k2 λn − 2)r + 1 :
p
2 − k2 λn ± (2 − k2 λn )2 − 4
r1,2 =
.
2
Im Fall k2 λn ≤ 4 ist |r1,2 | ≤ 1 , d.h.: Es liegt Stabilität vor. Im Fall k2 λn > 4 ist |r2 | > 1 ,
d.h.: Es besteht Instabilität. Offenbar gilt für h → 0 :
k 2 λn ≤ 4
⇔
σ ≤ c−1 .
(6.1.12)
224
Verfahren für hyperbolische Probleme
ii) Sei nun k2 λn ≤ 4 und die Lösung u glatt. Wir betrachten den Fehler der Ortsdiskretisierung
getrennt von dem der Zeitdiskretisierung:
m
m
m
em
n := u(xn , tm ) − Un = u(xn , tm ) − uh (xn , tm ) + uh (xn , tm ) − Un =: εh (xn , tm ) + En .
Für den Ortsdiskretisierungsfehler εh gilt ε0h = ∂t ε0h = 0 und
∂t2 εh + Ah εh = O(h2 ).
Wir multiplizieren diese Identität mit ∂t εh ,
2
2
1
2 dt k∂t εh kh + (Ah εh , εh )h = (O(h ), ∂t εh )h ,
und integrieren über [0, t] :
k∂t εh (t)k2h
Dies impliziert
+ (Ah εh (t), εh (t))h =
kεh (0)k2h
+ (Ah εh (0), εh (0))h +
Z
t
(O(h2 ), ∂s εh )h ds.
0
max k∂t εh k2h + (Ah εh , εh )h ≤ t O(h2 ) max k∂t εh kh
[0,t]
[0,t]
bzw. nach Aufintegrieren bzgl. der Zeit:
max kεh kh ≤ c t2 h2 .
[0,t]
(6.1.13)
Der Faktor t2 läßt sich hier nicht vermeiden, da bei der Wellengleichung (im Gegensatz zur
Wärmeleitungsgleichung) lokale Störungen nicht ausgedämpft werden.
iii) Für den Zeitdiskretisierungsfehler gilt
k−2 {E m − 2E m−1 + E m−2 } + Ah E m−1 = O(k2 ).
(6.1.14)
Die Konstante in O(k2 ) hängt dabei von den Zeitableitungen von uh (t) bis zur Ordnung 4 ab.
Diese lassen sich durch die entsprechenden Zeitableitungen von u beschränken, was hier jedoch
nicht ausgeführt werden soll. Für die n-te Fourier-Komponente Enm = (E m , w(n) )h gilt
Enm − 2Enm−1 + Enm−2 + k2 λn Enm−1 = (O(k4 ), w(n) )h ,
gleichmäßig bzgl. n . Das charakteristische Polynom dieser Differenzengleichung ist ρ(r) = r 2 +
(k2 λn − 2)r + 1 mit Wurzeln |r1,2 | = 1 . Die a priori Abschätzung für Lösungen inhomogener
Differenzengleichungen aus Hilfssatz 6.1 liefert also:
n
o
|Enm | ≤ c max |Enν | + m2 max O(k4 )
µ=0,1
bzw.
kE m k2h
=
m
X
ν=1
ν=2,...,m
|Enν |2 ≤ c kE 0 k2h + kE 1 k2h + ct4m k4 .
6.1 Differenzenverfahren für hyperbolische Probleme
225
Offenbar ist E 0 = 0 und
E 1 = uh (t1 ) − U 1 = uh (t1 ) − u0 − ku1 − 12 k2 Ah u0
= −ε(t1 ) + u(t1 ) − u0 − ku1 − 12 k2 c2 ∂x2 u(0) + O(k2 h2 )
= −ε(t1 ) + u(t1 ) − u0 − ku1 − 12 k2 ∂t2 u(0) + O(k2 h2 )
= O(k3 + k2 h2 ) + O(k3 ).
Dies führt auf
kE m k2h ≤ c t2m {h2 + k2 }2 .
(6.1.15)
Kombination der Abschätzungen (6.1.13) und (6.1.15) vervollständigt schließlich den Beweis.
Q.E.D.
Hilfssatz 6.1 (Differenzengleichungen): Die Folge {ym }m∈N genüge der linearen, inhomogenen Differenzengleichung
R
X
aν ym+ν = gm ,
ν=0
m ≥ 0.
(6.1.16)
Wenn alle Nullstellen λν des charakteristischen Polynoms
ρ(z) :=
R
X
aν z ν
ν=0
Betrag |λν | ≤ 1 haben, gilt die a priori Abschätzung
max |yν | ≤ cR max |yν | + m2 max |gν | ,
R≤ν≤m
0≤ν≤R
0≤ν≤m
m ≥ R.
Beweis: ohne
(6.1.17)
Q.E.D.
Bemerkung 6.2: Die bisher erhaltenen Aussagen bleiben gültig, wenn man das explizite Differenzenschema auf das reine Anfangswertproblem ( Cauchy-Problem“) der Wellengleichung an”
wendet. In diesem Fall ist man auf explizite Verfahren angewiesen, da zur Verwendung impliziter
Formeln die notwendigen Randwerte fehlen.
Bei der ARWA der Wellengleichung kann man sich von der einschränkenden CFL-Bedingung
durch Verwendung impliziter Differenzenformeln befreien, etwa der Art
=0
k−2 {Uhm − 2Uhm−1 + Uhm−2 } + αAh Uhm + (1 − 2α)Ah Uhm−1 + αAm−2
h
mit einem Parameter α ∈ [0, 1] . Diese Formel hat den Abschneidefehler
o
n
1
(σ 2 − 1) − ασ 2 }∂x4 u + O(h2 ) ;
τh = h2 { 12
(6.1.18)
Sie ist also für beliebiges α von zweiter Ordnung. Für ein implizites Differenzenschema enthält
ihr Abhängigkeitsbereich offensichtlich den der Differentialgleichung.
226
Verfahren für hyperbolische Probleme
Satz 6.3 (Konvergenz impliziter Verfahren): Die implizite Differenzenformel (6.1.18) ist
im Falle α ≥ 1/4 unbedingt stabil und im Fall 0 < α < 1/4 stabil für
1
0<σ≤ √
;
c 1 − 4α
(6.1.19)
Für andere σ ist sie instabil. Im stabilen Fall gilt die Konvergenzabschätzung
max kUhm − u(·, tm )kh ≤ c(u)T {k2 + h2 }.
[0,T ]
(6.1.20)
Beweis: Für die Entwicklungskoeffizienten in
Uhm =
N
X
(n)
am
nw
n=1
gilt
m−1
m−1
am
+ am−2
+ k2 λn {αam
+ αam−2
} = 0.
n − 2an
n
n + (1 − 2α)an
n
Das charakteristische Polynom dieser Differenzenformel
hat die Wurzeln
ρ(r) = (1 + αk2 λn )r 2 + k2 λn (1 − 2α) − 2 r + (1 + k2 λn α)
r1,2 =
2 − k2 λn (1 − 2α) ±
p
(k2 λn (1 − 2α) − 2)2 − 4(1 + k2 λn α)2
.
2(1 + αk2 λn )
Wir haben zwei Fälle zu unterscheiden:
a) Stabiler Fall:
(k2 λn (1 − 2α) − 2)2 ≤ 4(1 + k2 λn α)2
⇒
|r1,2 | = 1.
(6.1.21)
(k2 λn (1 − 2α) − 2)2 > 4(1 + k2 λn α)2
⇒
|r2 | > 1.
(6.1.22)
b) Instabiler Fall
Der Kette äquivalenter Ungleichungen
k2 λn (1 − 2α) − 2 ≤
k2 λn − 2αk2 λn ≤ 4 + 2αk2 λn
k2 λn − 4αk2 λn ≤ 4
4k2 c2
(1 − 4α) ≤ 4
h2
k2
(1 − 4α) ≤ c−2
h2
2 + 2k2 λn α
6.1 Differenzenverfahren für hyperbolische Probleme
227
entnehmen wir die Bedingungen α ≥ 1/4 oder
0 < α < 1/4,
1
σ≤ √
.
c 1 − 4α
(6.1.23)
Dagegen ist
k2 λn (1 − 2α) − 2 ≥ −2 − 2k2 λn α
k2 λn − 2αk2 λn ≥ −2αk2 λn
k2 λn ≥ 0,
stets erfüllt.
Dies beweist den die Stabilität betreffenden Teil des Satzes. Die Konvergenzabschätzung
wird dann ähnlich wie im expliziten Fall gezeigt. Wir lassen die Details weg.
Q.E.D.
In zwei Raumdimensionen ist der Abhängigkeitsbereich der Wellengleichung kegelförmig
(z.B. Kreiskegel bei kreisförmigem Grundgebiet). Die obigen Aussagen für den eindimensionalen
Fall gelten sinngemäß auch in zwei Dimensionen. Bei Ortsdiskretisierung mit dem 5-PunkteOperator Ah lautet das Analogon des expliziten Schemas (6.1.5)
(6.1.24)
k−2 Uhm − 2Uhm−1 + Uhm−2 + c2 Ah Uhm−1 = 0
und hat die Stabilitätsbedingung
1
σ≤√ .
2c
√
In drei Raumdimensionen verschärft sich diese Bedingung zu σ ≤ ( 3c)−1 .
(6.1.25)
228
Verfahren für hyperbolische Probleme
6.2 Finite-Elemente-Verfahren für hyperbolische Probleme
Als Basis von Finite-Elemente-Diskretisierungen dient wieder die variationelle Formulierung von
(6.0.2):
(∂t2 u, ϕ) + (a∇u, ∇ϕ) = (f, ϕ)
∀ϕ ∈ V, t > 0,
u|t=0 = 0,
(6.2.26)
mit dem üblichen Sobolew-Raum V := H01 (Ω) . Im Sinne der Rothe-Methode“ könnten diese
”
Gleichung nun zunächst wieder mit einem Differenzenschema 2. Ordnung in der Zeit und anschließend die einzelnen Zeitschritte mit FE-Ansätzen im Ort diskretisiert werden. Dies führt
wie bei den Differenzenverfahren zwangsläufig auf Zwei-Schritt-Schemata, mit denen die Energieerhaltung nicht zu bewerkstelligen ist. Wir wollen daher jetzt einen anderen Weg beschreiten,
der etwas näher an der Vorgehensweise bei parabolischen Problemen ist. Durch Einführung der
zusätzlichen Unbekannten v = ∂t u geht die Wellengleichung über in das System
∂t u − v = 0,
∂t v − c2 ∆u = f,
mit den natürlichen Randbedingungen u|∂Ω = v|∂Ω = 0 sowie den Anfangsbedingungen u|t=0 =
u0 und v|t=0 = v 0 . In variationeller Form schreibt sich dies wie
(∂t v, ϕ) − (v, ψ) = 0 ∀ψ ∈ V, t ∈ [0, T ],
(∂t u, ψ) + c2 (∇u, ∇ϕ) = (f, ϕ),
∀ϕ ∈ V,
mit den Anfangsbedingungen u|t=0 = u0 und v|t=0 = v 0 . Dieses System von Differentialgleichungen ist wieder hyperbolisch“, da alle Eigenwerte der Koeffizientenmatrix rein imaginär
”
sind. Zur Diskretisierung wäre also ein Zeitschrittverfahren günstig, bei dem die imaginäre Achse
gerade der Rand des Stabilitätsgebiets ist. Das Crank-Nicolson-Verfahren besitzt diese Eigenschaft.
Zur Diskretisierung dieses Systems verwenden wir das Rothe-Verfahren, d.h.: Zunächst wird
bzgl. der Zeit diskretisiert. Dazu verwenden wir auf einem Zeitgitter
0 = t0 < t1 < ... < tm < ... < tM = T,
mit Schrittweiten km = tm − tm−1 das Crank-Nicolson-Schema:
(um −um−1 , ψ) − 12 km (v m +v m−1 , ψ) = 0,
(v m −v m−1 , ϕ) + 12 km (c2 ∇(um +um−1 ), ∇ϕ) =0,
für alle Testfunktionen ϕ und ψ mit Anfangswerten u0 und v 0 . Bei diesem Zeitschrittverfahren
bleibt die totale Energie in jedem einzelnen Zeitschritt erhalten. Dazu setzen wir im variationellen
Schema ϕ := um − um−1 und ψ := v m − v m−1 und kombinieren die beiden resultierenden
Gleichungen zu
m 2
1
2 kv k
+ 12 kc∇um k2 =
m−1 2
1
k
2 kv
+ 12 kc∇um−1 k2 .
(6.2.27)
Die einzelnen Probleme in jedem Zeitschritt tm−1 → tm werden nun mit Hilfe eines FEVerfahrens diskretisiert. Dazu werden zu jedem Zeitlevel tm FE-Ansatzräume Vhm ⊂ V =
6.2 Finite-Elemente-Verfahren für hyperbolische Probleme
229
H01 (Ω) auf Gittern Tm
H der üblichen Art gewählt. Im folgenden betrachten wir zunächst den Fall,
daß die Gitter und Ansatzräume zu allen Zeitpunkten dieselben sind. Die allgemeine Situation
von mit der Zeit variierenden Ortsgittern ist in Abb. 6.1 skizziert.
Abbildung 6.1: Raum-Zeit-Gitter mit “hängenden Knoten“
Zu dem FE-Ansatz gehören wieder die Masse- und Steifigkeitsmatrizen
(i)
(i) (j)
Mh = (mij )ij = (ϕh , ϕh ) ij ,
(i) (j)
Ah = (aij )ij = (c2 ∇ϕh , ∇ϕh ) ij ,
wobei {ϕh , i = 1, ..., N } die Knotenbasis von Vh ist. Dabei wird angenommen, daß beide
Unbekannte uh sowie vh in demselben Ansatzraum Vh bestimmt werden. Dies ist wegen der
physikalisch vorgegebenen Randbedingung v|∂Ω = ∂t u|∂Ω = 0 sinnvoll. Eigentlich bräuchte vh
im Hinblick auf die gewählte variationelle Formulierung aber nur in L2 (Ω) gewählt zu werden.
m
m
Bezeichnen wir nun die zugehörigen Knotenwertvektoren von um
h und vh ebenfalls mit uh
m
und vh , so erhält das Zeitschrittschema die Gestalt
Mh (Uhm − Uhm−1 ) + 12 km Mh (Vhm − Vhm−1 ) = 0,
Mh (Vhm − Vhm−1 ) + 12 km Ah (Uhm + Uhm−1 ) = 0.
Dies kann nun so umgeformt werden, daß ein System von zwei sukzessive lösbaren Problemen
entsteht:
2
2
(Mh + 14 km
Ah )Uhm = Mh Uhm−1 + km Mh Vhm−1 − 41 km
Ah Uhm−1 ,
Mh Vhm = Mh Vhm−1 − 21 km Ah (Uhm + Uhm−1 ).
In jedem Zeitschritt sind also eine (modifizierte) Ritz-Projektion sowie eine L2 -Projektion durchzuführen. Die Konvergenzanalyse dieses Verfahrens kann wieder mit Hilfe der oben schon beschriebenen Energie-Technik“ erfolgen, was hier aber nicht ausgeführt werden soll.
”
230
Verfahren für hyperbolische Probleme
6.3 Verallgemeinerungen und Lösungsaspekte
Bei der Anwendung unbedingt stabiler, impliziter Differenzenschemata müssen in jedem Zeitschritt lineare Gleichungssysteme mit Koeffizientenmatrizen der Form Ih +αk2 Ah gelöst werden.
Deren Kondition verhält sich im Falle k ∼ h wie
κ2 (Ah ) ∼ 1.
(6.3.28)
Auf solchen gleichförmigen Gittern sind implizite Verfahren also verhältnismäßig kostengünstig.
Dies ändert sich aber, wenn das Ortsgitter zur Anpassung an irreguläre Lösungsstrukturen lokal
verfeinert wird.
6.4 Übungen
6.4 Übungen
Übung 6.1:
Übung 6.2:
231
232
Verfahren für hyperbolische Probleme
Index
5-Punkte-Operator, 48, 57, 64, 83
7-Punkte-Operator, 50
9-Punkte-Operator
gestreckter, 48
kompakter, 48, 84
2
L -Norm-Fehler, 130
L2 -Norm-Fehlerschätzer, 135
L2 -Projektion, 107, 148, 227
L∞ -Norm-Fehler, 109, 130
M -Matrix, 83
V -elliptisch, 72
dG(0)-Verfahren, 208
dG(r)-Verfahren, 207
h/p-Finite-Elemente-Methode, 77
A-orthogonal, 157
A-Stabilität, 190
starke, 190, 196
strenge, 190
Abhängigkeitsbereich, 39, 225
Ableitung
schwache, 24
verallgemeinerte, 24
Abschneidefehler, 46, 186, 217, 223
Abstiegsrichtung, 156
Abstiegsverfahren, 156
Adaptionsstrategie, 141
ADI-Verfahren, 63, 216, 217
Adini (????-????), 93
Adini-Plattenelement, 93
Allgemeiner Störungssatz, 118
Anfangs-Randwert-Aufgabe, 32
Approximationseigenschaft, 173
Argyris (1916-2004), 92
Argyris-Plattenelement, 92
Assemblierung, 117
Aubin (????-????), 80
Aubin-Nitsche-Trick, 80
Banach (1892-1945), 2
Bandmatrix, 52, 60
Baryzentrische Koordinaten, 122
BDF-Verfahren, 185, 186
Bestapproximationseigenschaft, 74, 107
Bestimmtheitsbereich, 39
Biharmonischer Operator, 7, 21, 91, 120, 151
Bramble (1932-), 100
Bramble-Hilbert-Lemma, 100, 124, 210
Cauchy (1789-1857), 11
Cauchy-Problem, 11, 223
CFL-Bedingung, 220, 221
CG-Verfahren, 157, 160, 179, 215
quadriertes, 163
Charakteristik, 12
Charakteristisches Polynom, 223
Cholesky (1975-1918), 63
Cholesky-Zerlegung, 63, 215
Courant (1888-1972), 220
Crank (1916-), 185
Crank-Nicolson-Verfahren, 186, 190, 200, 207,
213, 215, 216, 226
gedämpftes, 198
Sehnentrapezform, 213
Tangententrapezform, 213
Dämpfung, 172
Defekt, 155
Defektgleichung, 169
Defektkorrektur-Iteration, 61
Diagonaldominanz
erweiterte , 52
irreduzible, 53
Differentialgleichung
2. Ordnung, 10
gewöhnliche, 10
lineare, 9
nichtlineare, 9, 15
Differentialoperator
elliptischer, 12
hyperbolischer, 12
parabolischer, 12
Differenzenappoximation, 45
Differenzengleichung, 223
Differenzenoperatoren, 45
Differenzenverfahren
A(0)-stabil, 185
explizit, 182
implizit, 182
Diffusions-Transport-Gleichung, 72
Dirac (1902-1984), 111
Dirac-Funktion, 111
Direkte Methode, 18
Dirichlet (1805-1859), 15
Divergenz, 1
Du Fort (????-????), 195
Du Fort-Frankel-Verfahren, 195
Duale Lösung, 132
Duales Problem, 132
233
234
Dualitätsargument, 80, 208
Eckensingularität, 23, 43, 146
Effektivitätsindex, 133, 139
Eigenwerte, 68
Eigenwertproblem, 31
Einschrittverfahren, 182
Element-(Last)-Vektor, 117
Element-(Steifigkeits)-Matrix, 117
Energie, 39
Energie-Form, 167, 181
Energie-Methode, 36, 199
Energie-Norm, 18, 74, 155
Energieerhaltung, 219
Energiefunktional, 71
Energienorm-Fehler, 80, 130
Energienorm-Fehlerschätzer, 134
Erhaltungsgleichung, 40
Euklid (ca. 355-290 v. Chr.), 1
Euklidische Vektornorm, 1
Euklidisches Produkt, 1
Euler (1707-1783), 183
Explizites Euler-Verfahren, 185, 192
F-Zyklus, 171, 215
Fehler
lokaler, 114
Fehlerbalancierungs-Strategie, 141
Fehlerfunktional, 131
Fehlerindikator, 140
Fest-Raten-Strategie, 142
Finite Elemente, 77
bi-kubisch, 93, 94
bi-linear, 92
bi-quadratisch, 92
isoparametrisch, 96
konform, 89
konstant, 89
kubisch, 91, 150
linear, 78, 89, 93
nicht-konform, 89
parametrisch, 96
quadratisch, 90, 93
quartisch, 91
quintisch, 92
tri-linear, 94
tri-quadratisch, 94
Finite-Elemente-Interpolierende, 89
Finite-Elemente-Raum, 207
INDEX
Fixpunktiteration, 62
Formfunktion, 77
Formregularität, 78
Fourier (1768-1830), 31
Fourier-Entwicklung, 31
Frankel (????-????), 195
Friedrichs (1901-1982), 220
Galerkin (1871-1945), 75
Galerkin-Gleichungen, 158
Galerkin-Orthogonalität, 208
Galerkin-Verfahren, 75
Gauß-Seidel-Verfahren, 63
Gaußsches Eliminationsverfahren, 61
Gauß (1777-1855), 2
Geschachteltes Mehrgitterverfahren, 171
Gitterfeinheit, 45
Gitternumerierung
diagonale, 60
Schachbrett, 61
zeilenweise, 60
Gitteroptimierung, 142
Gittersteuerung, 139
Gittertransfer, 171
Glätter, 171
Glättungseigenschaft, 36, 173, 190, 196, 198,
213
Glättungsiteration, 167
Größenregularität, 78
Gradient, 1
Gradientenverfahren, 157
Gram (1850-1916), 158
Gram-Schmidt-Algorithmus, 158
Green (1793-1841), 2
Greensche Funktion, 17, 111, 112
Greensche Identität, 56
Grobgitteroperatoren, 171
Grobgitterproblem, 168
Hängender Knoten, 227
Hölder (1859-1937), 2
Höldersche Ungleichung, 2, 27
Hadamard (1865-1963), 9
Halbbandbreite, 52
Halbgruppen-Methode, 36
Hauptteil, 12, 13
Hermite (1822-1901), 88
Hermite-Element, 88
Hestenes (1906-1991), 157
INDEX
Hilbert (1862-1943), 2
Hilbert (????-), 100
ILU-Verfahren, 63
Implizites Euler-Verfahren, 185, 186, 202, 207
Integralformel von Green, 2
Integralsatz von Gauß, 2
Interpolationsabschätzung, 101, 103
Interpolationskonstante, 208, 210
Interpolierende, 79
Inverse Beziehung, 105
Inverse Monotonie, 54, 193
inverse Monotonie, 68
Iterationsmatrix, 62
Jacobi (1804-1851), 62
Jacobi-Verfahren, 62
Jordan (1838-1922), 11
Kantenresiduum, 132
Kegelschnitt, 12
klassische Lösung, 32
Knoten, 78
Knotenbasis, 79
Knotenbasisfunktion, 79
Knotenfunktional, 88
Knotenwert, 78, 88
Koerzitivität, 72
Konditionierung, 118, 151
Konditionszahl, 68
Konformität, 89
Konsistenz, 46, 186
Konsistenzordnung, 46
Kontinuitätsgleichung, 5
Konvergenz, 57
Konvergenzordnung, 46, 67
Konvergenzrate, 62
Koordinatenrelaxation, 157
Kovalevskaya (1850-1891), 15
Kronecker (1823-1891), 56
Kronecker-Symbol, 56
Krylov (1879-1955), 155
Krylow-Raum, 158
Krylow-Raum-Methode, 155
Kutta (1867-1944), 207
Lösung
klassische, 16
schwache, 19, 43
235
Lösungskomplexität, 214
Lagrange (1736-1813), 79
Lagrange-Basis, 79
Lagrange-Element, 88
Lagrange-Hermite-Interpolation, 103
Lagrange-Interpolation, 79
Laplace (1749-1827), 1
Laplace-Operator, 1, 13, 30, 43, 48, 59, 155
Lastvektor, 116, 201
Lax (????-), 73
Lax-Milgram-Lemma, 73
Lebesgue (1875-1941), 23
Lebesgue-Raum, 26
Legendre (1752-1833), 158
Legendre-Polynom, 158
Lewy (????-????), 220
Line Search, 156
Linienmethode, 181, 185
M-Matrix, 54, 68, 193, 206
Mass-Lumping, 206
Massematrix, 116, 182, 201, 227
Matrix
diagonal-dominant, 83
von nicht-negativem Typ, 52, 83
Matrizennorm, 1
Maximumnorm, 2
Maximumprinzip, 20, 112
diskretes, 53
elliptisches, 20
für finite Elemente, 83
parabolisches, 34
Maximumprinzipmethode, 192
Mehrgitter-Zyklus, 168
Mehrgitterverfahren, 166, 215
Mehrstellenformel, 67
Milgram (????-????), 73
Minimalfolge, 18
Mittelpunktregel, 123
Mittelpunkts-Verfahren, 185
Monombasis, 77
Morley (????-????), 90
Morley-Plattenelement, 90
Multiindex, 98
Nabla-Operator, 1
Nachglättung, 169
Navier (1785-1836), 5
Navier-Stokes-Gleichungen, 5
236
Neumann, von (1903-1957), 16
Nicolson (1917-1968), 185
Nitsche (1926-1996), 80
Normaleneinheitsvektor, 1
Numerische Dissipativität, 190
Numerische Integration, 121, 125, 151
Operator
kompakt, 31
positiv-definit, 31
symmetrisch, 31
Orthonormalsystem, 173
Orts-Zeit-Diskretisierung, 184
Padé (1785-1836), 189
Padé-Schema, 189
Padé-Tafel, 189
Parallelogrammidentität, 18
Parseval (1755-1836), 37
Parsevalsche Identität, 37
Partielle Ableitung, 1
PCG-Verfahren, 163
Petrow (1912-1987), 75
Petrow-Galerkin-Verfahren, 75, 207
Plattengleichung, 7
Poincaré (1854-1912), 3
Poincarésche Ungleichung, 3, 27, 42, 43, 100
Poisson (1781-1840), 4
Poisson-Gleichung, 4, 7, 13, 15, 71, 109
Pollution-Effekt, 146
Polygonzugmethode, 183
Projektionsmethode, 74
Prolongation, 168, 169
Punktfehler-Schätzer, 137
Punktgitter, 45
Quadraturfehler, 124
Quadraturformel, 122
Rückwärtsdifferenzenformel, 185
Randbedingungen
Dirichletsche, 15, 32, 71
natürliche, 72
Neumannsche, 16, 32, 72
Robinsche, 16, 32, 72
Randwertaufgabe, 15, 42
Referenzelement, 94, 102, 117
Referenztransformation, 95
Rellichscher Auswahlsatz, 30
INDEX
Residuum, 132
Restriktion, 168, 169
Reynolds (1842-1912), 5
Richardson (1881-1953), 62
Richardson-Verfahren, 62, 166, 168, 180, 195
Riemann (1826-1866), 16
Riesz (1880-1956), 73
Rieszscher Darstellungssatz, 73
Ritz (1878-1909), 74
Ritz-Projektion, 108, 202, 227
Ritzsche Projektions-Verfahren, 74
Robin 1855-1897, 16
Rothe (1895-1988), 184
Rothe-Methode, 184, 201, 226
Runge (1856-1927), 207
Runge-Kutta-Verfahren, 207
Satz
Geschachteltes Mehrgitterverfahren, 178
Mehrgitterkomplexität, 177
Mehrgitterkonvergenz, 175
von Cauchy-Kovalevskaya, 15
von Lax-Milgram, 147
Schlitzgebiet, 23
Schmidt (1876-1959), 158
Schnelle Fourier-Transformation, 61
Schrittweitensteuerung, 206
Seidel, von (1821-1896), 63
Separabilität, 216
Shortley (1910-), 49
Shortley-Weller-Approximation, 49, 53, 58, 60,
67, 81
Simplex, 95
Simpson-Verfahren, 186
Sobolew (1908-1989), 19
Sobolew-Raum, 18, 24, 26, 71
Sobolewsche Ungleichung, 29, 44
Sobolow-Raum, 43
SOR-Verfahren, 63
Spektral-Elemente-Methode, 77
Spektral-Galerkin-Verfahren, 77
Spektral-Methode, 36, 195
Spektral-Theorie, 30
Spektralkondition, 160, 215
Spektralnorm, 194
Spektralverfahren, 77
Spezieller Störungssatz, 120
Splitting-Methode, 216
INDEX
Spur-Abschätzung, 28
Spur-Lemma, 28
Stabilität, 46
Startwert, 213
Steifigkeitsmatrix, 116, 182, 201, 227
Stiefel (1909-1978), 157
Stokes (1819-1903), 5
Strukturregularität, 78
Taylor (1685-1731), 10
Taylor-Reihe, 10
Teilschritt-θ-Verfahren, 191
Tensorprodukt-Basis, 77
Tensorprodukt-Gauß-Formel, 124
Tensorprodukt-Simpson-Regel, 124
Tensorprodukt-Trapezregel, 148
Tensorproduktformel, 123
Transfermatrix, 201
Trapezregel, 123
Triangulierung, 78
Tschebyscheff (1821-1894), 161
Tschebyscheff-Approximation, 161
Typeneinteilung, 10, 41
Unisolvenz, 88, 98, 149, 153
Unstetiges Galerkin-Verfahren, 207
V-Zyklus, 170
Variablenseparation, 33
Variationelle Formulierung, 72, 181, 226
Variationsgleichung, 6, 72, 74
Verfeinerungstrategie
Fehleräquilibrierung, 142
Verträglichkeit, 46
Vieta (1540-1603), 13
Vietascher Wurzelsatz, 13
Von Neumannsche Methode, 193
Von Neumannsche Stabilitätsanalyse, 195
Vorglättung, 169
Vorkonditionierung, 62, 163
ADI, 165
Diagonal, 164
ICCG, 164
SSOR, 164
W-Zyklus, 170
Wärmeleitungsgleichung, 4, 5, 14, 32, 181, 211
Wellengleichung, 4, 7, 14, 38, 219, 226
Weller (????-????), 49
237
Wilson (????-????), 93
Wilson-Plattenelelement, 93
Wohl-gestellt, 9, 15
Zeilensummenkriterium
schwaches, 53
Zeitschrittverfahren, 185
Zeitschrittweite, 182, 206, 219
Zelle, 77
Zellgewicht, 133
Zellresiduum, 132
Zusammenhang, 52
Zweigittermethode, 170
Zweigitteroperator, 172
Zweischrittformel, 219
Zweischrittverfahren, 182