Sie sind hier

Nichtlinearität erzwingt Ganzheit

Nichtlinearität in der klassischen Mechanik

Die Punktmechanik wird gerne auf ein Wirkungsprinzip zurückgeführt. Der Kern des Wirkungsprinzips ist ein Funktional der Koordinaten und deren Ableitungen von der Zeit. Das Funktional ordnet allen möglichen Funktionen \(q(t)\) und deren Ableitungsfunktionen \( \dot{q(t)} \equiv \frac{\partial q}{\partial t} \) eine einzige reelle Zahl, genannt Wirkung, zu. Solche Skalare sind stabiler gegen Transformationen. Und so lässt sich ein allgemeines Prinzip festlegen, wie aus dem Wirkungsfunktional die Bewegungsgleichungen entstehen, egal welche Koordinaten man dabei konkret wählt. Bei einem abgeschlossenen System, das durch einen Satz von N Koordinaten \(\{q_i\}\) beschrieben werden soll, sehen die N gekoppelten Bewegungsgleichungen so aus:
\begin{equation}
\frac{d}{dt} \frac{\partial L}{\partial \dot{q_i}} - \frac{\partial L}{\partial q_i} = 0 \quad mit \quad L = L(\{q_i\}, \{\dot{q_i}\})
\end{equation}
Wenn die Lagrangefunktion L eine beliebige Funktion der Koordinaten und Ableitungen wäre, könnte man sich vorstellen, dass eine schier unendliche Fülle von linearen und nichtlinearen Differentialgleichungssystemen dabei entstehen könnte. In der Praxis trifft man aber immer wieder ähnliche Gesellen. Diese enthalten die Ableitungen in der Regel linear und haben höchstens bei den Koordinatenfunktionen nichtlineare Verknüpfungen.

Ein solcher Geselle beschreibt zum Beispiel die Bewegung von 2 Massenpunkten, also \( \{q_i\} = \{ r_{1x}, r_{1y}, r_{1z}, r_{2x}, r_{2y}, r_{2z} \} \), in Raum und Zeit. Die Kraft zwischen den 2 Massenpunkten soll nur von deren Abstand abhängen. Mit den 2 Abkürzungen \( \vec{r_i} = \begin{pmatrix} r_{ix} & r_{iy} & r_{iz} \end{pmatrix} \) sehen die Bewegungsgleichungen so aus:
\begin{equation}
m_1 \ddot{\vec{r_1}} - F(|\vec{r_1} -\vec{r_2}|) = 0
\end{equation}
\begin{equation}
m_1 \ddot{\vec{r_2}} - F(|\vec{r_1} -\vec{r_2}|) = 0
\end{equation}
Wenn wir damit Planetenbewegungen modellieren wollen, dann müssen wir ein 1/r-Potential \( V = - \frac{G m_1 m_2}{|\vec{r_1} - \vec{r_2}|} \) in der Lagrangefunktion verwenden und erhalten in den Bewegungsgleichungen eine Kraft F, die ebenfalls mit dem Abstand r schnell kleiner wird und im Unendlichen verschwindet. Diese Sorte Potentiale bzw. Kräfte ist der Erfahrung geschuldet: eine räumliche Trennung führt dazu, dass ein Körper, im Modell ein System aus Massenpunkten, einen anderen Körper praktisch nicht mehr spürt. Erst diese spezielle Natur der Kräfte rechtfertigt es im Modell, solche Massenpunktsysteme als trennbare Körper anzusehen.

Nehmen wir ein System aus 1 Planet + 1 Sonne und sorgen wir für einen großen Abstand zum Rest der Welt. Dann können wir die Bewegungsgleichungen analytisch lösen und erwarten, dass sich die Himmelskörper nach dieser Gleichung vorhersagbar bewegen werden. Eine kleine in der Rechnung nicht berücksichtigte Störung aus den Weiten des Alls wird zu einer kleinen Abweichung der tatsächlichen Bahn von der berechneten Bahn führen.

Dreikörperproblem

Nehmen wir ein System aus 2 Planeten + 1 Sonne, und sorgen wir für einen großen Abstand zum Rest der Welt. Dann können wir die Bewegungsgleichungen analytisch nicht mehr lösen aber immer noch numerisch und erwarten als Grünschnäbel vielleicht wieder, dass sich die Himmelskörper nach dieser Gleichung vorhersagbar bewegen werden. Eine kleine Störung aus den Weiten des Alls sollte wieder zu einer kleinen Abweichung der tatsächlichen Bahn von der berechneten Bahn führen. Das ist aber nun nicht mehr unbedingt so!

Die nichtlinearen Kräfte sorgen dafür, dass eine überraschende Lebendigkeit entsteht. Die folgende Tabelle zeigt nur 3 Beispiele für mögliche Bewegungen von Dreikörpersystemen im Ortsraum.

[Science-3]

Solche nichtlinearen Systeme können sehr empfindlich auf kleinste Störungen reagieren. In dem Fall kann man eine Trennung eines Systems der klassischen Mechanik vom Rest praktisch kaum noch durchführen. Die Natur der (makroskopischen) Kräfte unserer Alltagswelt ist immer nichtlinear. Selbst mit einer Spiralfeder können wir höchstens näherungsweise für ein lineares Kraft-Weg-Gesetz \( F = k |\vec{r_1} -\vec{r_2}| \) sorgen (mit einer Konstante k). Nichtlineare Anteile lassen sich prinzipiell nicht fernhalten. Und so können wir allein auf der Grundlage der klassischen Mechanik nachvollziehen, dass selbst mit den beschränkten menschlichen Sinnen und ohne technische Hilfsmittel frühe Naturbeobachter mit Hilfe ihres Verstandes und trotz mehrheitlich anderer Meinungen ihrer Mitmenschen zum Schluss gekommen sind, dass die Natur eine untrennbare Ganzheit sei. Im Film sehen wir einen späten Naturbeobachter, der versucht, diesen Weg für sein Publikum begehbar zu machen:

Mit nichtlinearen Modellen beschäftigt sich die Chaostheorie. In den 1980er Jahren gab es dafür ein breiteres öffentliches Interesse. Einige Forscher meinten, sie könnten die „Entstehung“ von Leben auf diese Weise „erklären“.

Wie man rechts sehen kann, können bereits einfache nichtlineare Differentialgleichungen mit wenigen Variablen zu erstaunlich komplexem Verhalten führen. Das Bild zeigt einen Attraktor, also die Bewegung im Phasenraum, die sich für \( t \rightarrow \infty \) zwangsläufig einstellt. Dieses Beispiel kommt mit 3 Koordinaten aus [Pickover auf www.chaoscope.org].

Schwingungen

Oben auf dieser Seite steht: egal, welche Koordinaten man wählt. Die Trennung durch entfernte Orte mag am anschaulichsten sein, der theoretischen Mechanik ist die „Bedeutung“ der Koordinaten jedoch nicht bekannt. Ihr ist eine Trennung im Impulsraum gleich wie eine im Ortsraum oder sonst irgendeine.

Betrachten wir eine eindimensionale Bewegung \( x = x(t) \), die einer Schwingungsgleichung mit einer Dämpfungskonstante d und einer Federkonstante k genügt:
\begin{equation}
m \ddot x + d \dot x + k x = 0
\end{equation}
Es gibt unendlich viele Lösungen dieser Gleichung. Sie lassen sich durch 2 Parameter „durchnummerieren“. Hier haben wir sie als \(x_0\) und \(\varphi_0\) eingebracht:
\begin{equation}
x(t)=x_0 e^{-\frac{d}{2m} t}\cos(\sqrt{ \frac{k}{m} - \frac{d^2}{4m} } t+ \varphi_0)
\end{equation}
\( x_0 \) und \( \varphi_0 \) werden durch die Anfangsbedingungen festgelegt. Danach ist die Lösung, die Bewegung \( x = x(t) \), eindeutig. Im Unterschied zum Planetensystem ist unsere Differentialgleichung diesmal linear. Wenn wir eine Lösung \( x_1(t) \) gefunden haben und eine zweite Lösung \( x_2(t) \), dann sind auch alle Linearkombinationen \( c_1 x_1(t) + c_2 x_2(t) \) Lösungen.

Diese Wirkung der Linearität entfaltet sich auch bei mehrdimensionalen linearen Gleichungssystemen. Hier haben wir ein System aus 2 Gleichungen, das über lineare Terme in den Koordinaten gekoppelt ist:
\begin{equation}
m_1 \ddot x_1 + d_1 \dot x_1 + k_1 x_1 + l_1 x_2 = 0 \quad \quad m_2 \ddot x_2 + d_2 \dot x_2 + k_2 x_2 + l_2 x_1 = 0
\end{equation}
Wir können 2 Abkürzungen einführen
\begin{equation}
\psi := \begin{pmatrix} x_1(t) \\ x_2(t) \end{pmatrix} \quad \quad \hat{O} := \begin{pmatrix} m_1 \frac{\partial^2}{\partial t^2} + d_1 \frac{\partial}{\partial t} + k_1 & l_1 \\ l_2 & m_2 \frac{\partial^2}{\partial t^2} + d_2 \frac{\partial}{\partial t} + k_2 \end{pmatrix}
\end{equation}
Damit lässt sich das Gleichungssystem schreiben als
\begin{equation}
\hat{O} \psi = 0
\end{equation}
Physiker lieben kompakte Schreibweisen! \( \hat{O} \) ist ein linearer Operator mit der Eigenschaft
\begin{equation}
\hat{O} ( c_1 \psi_1 + c_2 \psi_2 ) = c_1 \hat{O} \psi_1 + c_2 \hat{O} \psi_2
\end{equation}
Wir können das mit beliebig vielen Koordinaten weitertreiben. Schwingungen in Festkörpern könnten damit modelliert werden. So lange die Gleichungen linear sind, können wir beliebige Lösungen überlagern.

Stellen wir uns vor, unser Verstand sein kein Verstand aus Massenpunkten wie eine Rechenmaschine, sondern er würde mit linearen Schwingungen arbeiten. Dann könnten wir in unserem Verstand mehrere Denkvorgänge überlagern. Die Denkvorgänge würden sich gegenseitig nicht beeinflussen, ja mehr noch, es wäre innerhalb eines Denkvorgangs gar nicht möglich festzustellen, dass parallel dazu noch weitere laufen! Wer wollte solch ein Gehirn haben?

Gibt es aber nur kleine nichtlineare Anteile, dann sieht die Sache anders aus. Das Ganze wird zu etwas anderem als der Summe seiner Teile und kann ein vollkommen anderes Verhalten zeigen. Der schottische Ingenieur John Scott Russell ritt im August 1834 sein Pferd entlang dem Union Canal in der Nähe von Edinburgh, als Folgendes geschah [Briggs-Peat Kap. 4]:

Ich beobachtete die Bewegung eines Bootes, das von einem Pferdegespann ziemlich rasch einen engen Kanal entlanggezogen wurde, als das Boot plötzlich anhielt - nicht jedoch die Wassermasse im Kanal, die vom Boot in Bewegung gesetzt worden war; sie sammelte sich rund um den Bug des Bootes in einem Zustand wilder Erregung, ließ das Boot dann plötzlich hinter sich, rollte mit hoher Geschwindigkeit vorwärts, nahm dabei die Form einer großen Erhöhung an, ein abgerundeter, glatter, wohldefinierter Haufen Wasser, der entlang dem Kanal anscheinend ohne Formveränderung oder Geschwindigkeitsabnahme seinen Lauf nahm. Ich begleitete diese Welle auf meinem Pferd und überholte sie, während sie sich immer noch mit einer Geschwindigkeit von etwas acht oder neun Meilen pro Stunde bewegte, wobei sie ihre ursprüngliche Gestalt von etwa 30 Fuß Länge und ein bis eineinhalb Fuß Höhe beibehielt. Die Höhe nahm allmählich ab, und nachdem ich das Ganze für etwa ein oder zwei Meilen beobachtet hatte, verlor ich es in den Windungen des Kanals au den Augen.

Derartige Phänomene bekamen den Namen „Soliton“. Im Modell sind sie Lösungen nichtlinearer Differentialgleichungen, das Russellsche Soliton kann durch die Korteweg-de-Fries-Gleichung beschrieben werden.

Linearität der klassischen Elektrodynamik

Die 8 Bewegungsgleichungen der Felder E und B der klassischen Elektrodynamik sind linear. Materie wird durch Inhomogenitäten in's Spiel gebracht: als Ladungsdichte \( \rho \) und als Stromdichte \( \rho \).
\begin{equation}
\vec \nabla \cdot \vec {E}=\frac {\rho }{\varepsilon _0} \quad\quad \vec \nabla \cdot \vec B=0 \quad\quad \vec \nabla \times \vec {E}=-\frac {\partial \vec {B}}{\partial t} \quad\quad \vec {\nabla }\times \vec {B}=\mu _0 \vec {j}+\mu _0\varepsilon _0 \frac {\partial \vec {E}}{\partial t}
\end{equation}
Zum Beispiel mit diesen Definitionen
\begin{equation}
\hat{O} := \begin{pmatrix}
0 & \frac{\partial}{\partial x} & \frac{\partial}{\partial y} & \frac{\partial}{\partial z} & 0 & 0 & 0 & 0 \\
0 & -\mu _0\varepsilon _0\frac{\partial}{\partial t} & 0 & 0 & 0 & 0 & -\frac{\partial}{\partial z} & \frac{\partial}{\partial y} \\
0 & 0 & -\mu _0\varepsilon _0\frac{\partial}{\partial t} & 0 & 0 & \frac{\partial}{\partial z} & 0 & -\frac{\partial}{\partial x} \\
0 & 0 & 0 & -\mu _0\varepsilon _0\frac{\partial}{\partial t} & 0 & -\frac{\partial}{\partial y} & \frac{\partial}{\partial x} & 0 \\
0 & 0 & 0 & 0 & 0 & \frac{\partial}{\partial x} & \frac{\partial}{\partial y} & \frac{\partial}{\partial z} \\
0 & 0 & -\frac{\partial}{\partial z} & \frac{\partial}{\partial y} & 0 & \frac{\partial}{\partial t} & 0 & 0 \\
0 & \frac{\partial}{\partial z} & 0 & -\frac{\partial}{\partial x} & 0 & 0 & \frac{\partial}{\partial t} & 0 \\
0 & -\frac{\partial}{\partial y} & \frac{\partial}{\partial x} & 0 & 0 & 0 & 0 & \frac{\partial}{\partial t}
\end{pmatrix} \quad\quad
\psi := \begin{pmatrix}
0 \\ E_x(\vec{r},t) \\ E_y(\vec{r},t) \\ E_z(\vec{r},t) \\ 0 \\ B_x(\vec{r},t) \\ B_y(\vec{r},t) \\ B_z(\vec{r},t)
\end{pmatrix} \quad\quad
j := \begin{pmatrix}
\frac {1}{\varepsilon _0}\rho(\vec{r},t) \\ \mu _0 j_x(\vec{r},t) \\ \mu _0 j_y(\vec{r},t) \\ \mu _0 j_z(\vec{r},t) \\ 0 \\ 0 \\ 0 \\ 0
\end{pmatrix} \quad\quad
\end{equation}
lassen sich die Maxwell-Gleichungen ganz schnell auf die Kurzform \( \hat{O} \psi = j \) bringen. In der Literatur findet man normalerweise andere Zusammenfassungen der Feldgrößen. E- und B-Felder transformieren sich bei Poincaré-Transformationen, als seien sie Teile eines asymmetrischen Vierertensor zweiter Stufe. Man definiert 2 Viererfeldstärketensoren und die Lichtgeschwindigkeit c
\begin{equation}
F := \left({\begin{matrix}0&-E_{x}/c&-E_{y}/c&-E_{z}/c\\E_{x}/c&0&-B_{z}&B_{y}\\E_{y}/c&B_{z}&0&-B_{x}\\E_{z}/c&-B_{y}&B_{x}&0\\\end{matrix}}\right)
\quad\quad
F^* := \left({\begin{matrix}0&-B_{x}&-B_{y}&-B_{z}\\B_{x}&0&E_{z}/c&-E_{y}/c\\B_{y}&-E_{z}/c&0&E_{x}/c\\B_{z}&E_{y}/c&-E_{x}/c&0\\\end{matrix}}\right)
\quad\quad
c := \frac{1}{\sqrt{\mu _0\varepsilon _0}}
\end{equation}
und wir können durch die Definitionen
\begin{equation}
\hat{O} := \begin{pmatrix}
\frac{\partial}{\partial t} & -\frac{\partial}{\partial x} & -\frac{\partial}{\partial y} & -\frac{\partial}{\partial z} &
\frac{\partial}{\partial t} & -\frac{\partial}{\partial x} & -\frac{\partial}{\partial y} & -\frac{\partial}{\partial z}
\end{pmatrix} \quad\quad
\psi := \begin{pmatrix} F & 0 \\ 0 & F^* \end{pmatrix}
\end{equation}
sowie einer passenden Definition für j die 8 Gleichungen wieder auf die Form \( \hat{O} \psi = j \) bringen. Doch was ist nun die Botschaft?

So lange die Ladungs- und Stromdichten von außen aufgeprägt sind, überlagern sich die Lösungen unabhängig voneinander. Wenn ein Stern Licht in's All aussendet, dann kann man ihn als vorgegebene Ladungs- und Stromdichten auf dem Rand eines Gebietes, des Alls, modellieren: \( j_1 \). Bezeichnen wir die Lösung der Maxwell-Gleichungen, die sich daraus ergibt, mit \( \psi_1 \). Ein zweiter Stern \( j_2 \) soll dagegen zur Lösung \( \psi_2 \) führen. Wenn wir das Licht in einem Teleskop auffangen, dann „sehen“ wir: 2 Sterne. Wir sehen \( \hat{O} \psi = j = j_1 + j_2 = \hat{O} \psi_1 + \hat{O} \psi_2 = \hat{O} (\psi_1 + \psi_2) \). Wären die Maxwell-Gleichungen nichtlinear, dann würden wir vielleicht 4 statt 2 Bildpunkte sehen. Wir könnten eventuell immer noch mit Hilfe unserer Mathematik darauf schließen, dass 2 Sterne da sein müssen. Eventuell hätte sich unser Leib im Lauf der Evolution darauf eingestellt, und wir würden wie selbstverständlich in 4 Bildpunkten sofort und ohne Umwege 2 Sterne erkennen. Bei hoher Intensität der Strahlung wird sich wahrscheinlich chaotisches Verhalten einstellen. Unsere Mathematik und unser Leib würden versagen beim Versuch, im empfangenen Licht etwas anderes zu erkennen als das empfangene Licht. Wäre das chaotische Verhalten das Normalverhalten, dann wären bislang nur ein paar Verrückte zur Ansicht gelangt, dass der Himmel mit einzelnen Sternen bevölkert sei.

Wenn wir die Wirkung der Felder auf die Materie berücksichtigen wollen, so können wir das zum Beispiel durch die Lorentz-Kraft \( \vec F = q \vec {E} + q \dot{\vec {r}} \times \vec {B} \) tun. Zusammen mit der Newtonschen Gleichung \( \vec F = m \ddot{\vec {r}} \) bekommen wir ein nichtlineares Differentialgleichungssystem und die Teilbarkeit geht im Allgemeinen verloren. (Der nichtlineare Term ist \( \dot{\vec {r}} \times \vec {B} \)).

Linearität und Nichtlinearität der Quantentheorie

Ich habe schon Sätze gelesen wie "Die Quantentheorie ist eine lineare Theorie". Die Überschrift dieses Abschnitts lautet aber anders!

In der klassischen Theorie sind die Kräfte mal linear und mal nichtlinear. Lineare Kräfte sind oft eine Näherung für Systeme in einer Gleichgewichtslage, die eigentlich nichtlinearen Kräfte unterworfen sind. Im Beispiel rechts wird die Bewegung nahe der Gleichgewichtslage durch die rote Näherung zur Bewegung in einem harmonischen Potential mit seinem linearen Weg-Kraft-Gesetz vereinfacht. Zu meiner Studienzeit hieß es überspitzt: Das Einzige, was die Physiker rechnen können, sind harmonische Oszillatoren.

Die Quantentheorie funktioniert grundsätzlich anders. Erstens ist sie eine lineare Theorie und zweitens eine nichtlineare.

Die Bewegungsgleichungen der Quantentheorie (jedenfalls aller experimentell abgesicherten QTen) sind linear und von der Form \( \hat{O} \psi = 0 \). Die Operatoren sind keine linearen Näherungen von eigentlich nichtlinearen Operatoren, sondern sie sind 100% exakt linear. Wie wir im Informationskapitel gesehen haben, ermöglicht diese Eigenschaft die Wahrscheinlichkeitsinterpretation der Quantentheorie.

Alle Operatoren sind linear. Das heißt, dass wir die Koordinaten zur Beschreibung des Systems frei wählen dürfen - Ortskoordinaten, Schwerpunkt- und Relativkoordinaten, Impulskoordinaten, ... - und das System immer in unabhängige Teile geteilt werden kann. Das ist schon ganz erstaunlich! Abhängig von der jeweiligen Vorliebe dürfen wir uns vorstellen, dass die Welt aus solchen oder solchen Teilen bestehe. Aus welchen Teilen besteht sie denn nun „wirklich“?

Bei Hugh Everett wäre an dieser Stelle Schluss. Die Welt wäre linear, langweilig und tot. Die linearen Bewegungsgleichungen liefern hochgenaue Vorhersagen für mögliche Messwerte. In der Praxis erfahren wir aber, dass dasselbe Experiment verschiedene mögliche Messwerte mit ganz bestimmten Häufigkeiten liefert. Wir kommen nicht umhin, Wahrscheinlichkeiten für die möglichen Messwerte einzuführen, die die beobachteten Häufigkeiten wiedergeben. Die Wahrscheinlichkeiten berechnen sich aus den Lösungen der linearen Differentialgleichungssysteme durch einen nichtlinearen Schritt. Dieser Schritt, das Skalarprodukt, wird manchmal als Bilinearform bezeichnet, was sein wahres Wesen verschleiert: er ist nichtlinear und am Ehesten als quadratisch zu bezeichnen. Seit 100 Jahren wissen die Physiker nicht, was sie von diesem Schritt halten sollen und palavern über dessen Interpretation. Eine Schwierigkeit dabei ist die Vorstellung, dass man nach dem nichtlinearen Schritt der QT zu einer Beschreibungsschicht kommen müsse, in der die klassische Physik mit ihren Bewegungsgleichungen zu finden sei, weil man das halt so gewohnt ist. Diese klassische Schicht soll dann am Ende vor dem Bewusstsein erscheinen, und das, obwohl man bis heute keinerlei Erklärung für die Bewusstwerdung dieser klassischen Schicht hat und die klassische Schicht durch Experimente immer mehr in die Enge gedrängt wird, wie an anderer Stelle ausgeführt wird. Das Einzige, was wir sicher wissen, ist, dass wir irgendwo zwischen der linearen Beschreibungsebene der QT und dem Bewusstsein diesen nichtlinearen Schritt brauchen. Es muss keine eigene klassische Beschreibungsebene zwischen der linearen Schicht der QT und dem Bewusstsein geben. Es reicht völlig, wenn man quantentheoretisch erklären kann, wie klassische Dinge vor dem Bewusstsein erscheinen.

Im Kapitel über die Verschränkung haben wir gesehen, wie alle gedachten Teilungen auf der linearen Ebene durch den nichtlinearen Schritt ihre Bedeutung verlieren (ein Teilsystem hat keinen Zustandsvektor). Der nichtlineare Schritt macht zu Einem, was auch immer zuvor als geteilt angesehen worden war, auch wenn die Teile als Lichtjahre voneinander entfernt gesehen worden waren.

In Summa

Über verschiedene Theorien hinweg haben wir erkennen können, wir Linearität und Teilbarkeit sowie Nichtlinearität und Unteilbarkeit miteinander verbunden sind. Die Quantentheorie ist eine Theorie, die durch ihre Mehrschichtigkeit beides zugleich in Vollkommenheit liefern kann. Dennoch muss man als Quantentheoretiker neidisch auf die nichtlinearen Bewegungsgleichungen der klassischen Theorie schielen, die Lebendigkeit doch so gut darstellen können, und fragt sich: fehlt noch etwas in meiner Theorie?