Tensoren und Tensorprodukte
Inhalt
3.2. Tensoren und Tensorprodukte¶
In diesem Kapitel widmen wir uns einem für die Physik sehr wichtigen aber relativ abstrakten Thema der Vektoranalysis, nämlich Tensoren und Tensorprodukten. Der Begriff hat sehr viele verschiedene Anschauungsmöglichkeiten (siehe Wikipedia) weshalb es nicht leicht ist eine Einführung zu geben die gleichzeitig allgemein, aber auch verständlich ist. Da Tensoren aber eine wichtige Rolle in der Physik spielen werden wir uns hier damit beschäftigen.
3.2.1. Motivation¶
Wir betrachten zunächst ein konkretes Anwendungsbeispiel aus der Physik, welches auf Tensoren zurückgreift. Hier wird der sogenannte Cauchy Spannungstensor verwendet.
(Begriffsherkunft)
Der Begriff Tensor wurde von Hamilton in der Mitte des 19. Jahrhunderts eingeführt. Er leitete die Bezeichnung vom lateinischen tendere (spannen) ab, da die ursprüngliche Anwendung derartiger Objekte in der Elastizitätstheorie Anwendung fand.
Mechanische Spannung ist eine physikalische Größe, die die innere Beanspruchung und Kräfte in einem Volumen \(V\subset\R^3\) angibt, welche aufgrund einer äußeren Belastungen auftreten. Die grundlegende Idee ist das Euler-Cauchy Spannungsprinzip, welches beschreibt, dass auf jede Schnittfläche \(A\subset\R^2\), die ein Volumen in zwei Teile trennt, von diesen zwei Volumenteilen eine Spannung auf \(A\) ausgeübt wird, welche durch einen sogenannten Spannungsvektor \(\mathbf{T}^{(n)}\) beschrieben wird. Der Komponenten des Spannungsvektors haben hierbei die Dimension „Kraft pro Fläche“.
Wie in Abb. 3.1 visualisiert teilt sich die Spannung in zwei Komponenten auf:
Normalspannung:
Die Normalspannung \(\sigma_n\) ist der Teil des Spannungsvektors, der in Richtung der Normalen \(\mathbf{n}\) zeigt, welche orthogonal auf der Schnittfläche steht.
Scherspannung:
Die Scherspannung \(\tau_n\) ist der Teil des Spannungstensors, der parallel zur Schnittfläche liegt.
Man erkennt nun, dass die Spannung in \(V\) nicht durch einen einzigen Vektor ausgedrückt werden kann. Einerseits hängt sie vom betrachteten Punkt \(x\in V\) ab und zudem von der Orientierung der Schnittfläche. Allerdings hat Cauchy gezeigt, dass ein linearer Operator \(\mathbf{\sigma}(x)\) existiert, so dass
d.h. in jedem Punkt \(x\in V\) ist der Stressvektor linear im Normalenvektor \(n\).
Der lineare Operator \(\mathbf{\sigma}\) wird auch Cauchy Spannungstensor genannt. Um diesen besser zu verstehen betrachtet man für einen fixen Punkt \(x\) des Volumens einen infinitesimal kleinen, freigeschnittenen Würfel wie in Abb. 3.2. Nun definieren wir für die drei verschiedenen Flächen (orthogonal zu den Einheitsvektoren \(e_1, e_2\) und \(e_3\)) die Spannungsvektoren
So setzt sich beispielsweise der Spannungsvektor \(\mathbf{T}^{(e_1)}\) zusammen aus der Summe der Normalspannung \(\sigma_{11} e_1\) und den zwei Scherspannungskomponenten \(\sigma_{12} e_2\) und \(\sigma_{13} e_3\).
Insgesamt erhält man neun Spannungskomponenten \(\sigma_{ij}\) für \(i,j=1,2,3\) welche insgesamt den Spannungszustand im Punkt \(x\) als Spannungsvektoren in Richtung der Einheitsvektoren vollständig beschreiben. Dies liegt daran, dass wir jeden Spannungsvektor in \(x\) als Linearkombination der drei Spannungsvektoren \(\mathbf{T}^{(e_i)}, i=1,2,3\) darstellen können.
Wir führen nun eine multilineare Abbildung \(\otimes \colon \R^n \times \R^m \rightarrow \R^{n \times m}\) für zwei beliebige Vektoren \(x\in\R^n\) und \(y\in\R^m\) ein, die das dyadische Produkt der Vektoren genannt wird und wie folgt definiert ist
Fassen wir nun zeilenweise die Spannungsvektoren \(\mathbf{T}^{(e_i)}, i=1,2,3\) in einer Matrix zusammen, so erhalten wir den Cauchy Spannungstensor \(\mathbf{\sigma}\) für den Punkt \(x\) des Volumens als
Wir werden später sehen, dass man die Idee, den Operator \(\sigma\) über das dyadische Produkt zu definieren, abstrahieren kann, was auf den allgemeinen Tensorbegriff führt.
In der Tat handelt es sich bei dem Operator \(\sigma \colon \R^3 \rightarrow \R^3\) in (3.1) nicht nur um einen Tensor, sondern genauer um ein Tensorfeld, dass jedem Punkt \(x\) des Volumens einen Spannungstensor zuordnet.
3.2.2. Das Tensorprodukt¶
Wir wollen nun das Tensorprodukt von Vektorräumen abstrakt einführen und es an späterer Stelle für konkrete Realisierungen diskutieren. Hierbei wollen wir uns zunächst auf einen Spezialfall einschränken, der lediglich zwei Vektorräume berücksichtigt, um die zu Grunde liegenden wichtigen Konzepte klarer herauszustellen. Es ist wichtig zu verstehen, dass die folgenden Definitionen sich mit dem Konzept der \(k\)-Multilinearität in Multilinearformen auf \(k \in \N\) verschiedene \(\R\)-Vektorräume direkt verallgemeinern lassen.
(Tensorprodukt)
Es seien \(V\) und \(W\) zwei reelle Vektorräume. Ein reeller Vektorraum \(X\) heißt Tensorproduktraum falls eine bilineare Abbildung \(\otimes:V\times W\rightarrow X\) existiert, so dass die folgende universelle Eigenschaft gilt:
Für jede Bilinearform \(\phi\in L^2(V\times W; Y)\) in einen beliebigen reellen Vektorraum \(Y\), existiert eine eindeutige lineare Abbildung \(p \in L^1(X; Y)\), so dass gilt
In diesem Fall schreibt man auch \(X = V \otimes W\). Wir nennen die bilineare Abbildung \(\otimes\) Tensorprodukt und verwenden häufig für sie die Infix-Schreibweise \(v\otimes w := \otimes(v,w)\). Elemente \(x \in X\) des Tensorproduktraums \(X = V \otimes W\) nennen wir Tensoren.
Diese Definition erscheint auf den ersten Blick abstrakt und unverständlich. Was ist jetzt also genau ein Tensorprodukt?
Das Tensorprodukt ist universell:
Wir haben in der Definition 3.4 das kartesische Produkt \(\times\) benutzt welches eindeutig definiert ist. Im Gegensatz dazu gibt es jedoch nicht ein Tensorprodukt \(\otimes\) oder einen Tensorproduktraum \(V\otimes W\). Wir haben die Freiheit \(\otimes\) zu wählen und wann immer die universelle Eigenschaft erfüllt ist, heißt dann \(X = V\otimes W\) Tensorproduktraum. Derartige Konzepte nennt man in der Algebra universell. Betrachten wir hierzu ein kurzes Beispiel für unterschiedliche Realisierungen eines Tensorproduktes.
(Varianten eines Tensorprodukts)
Wir betrachten in diesem Beispiel den Euklidischen Vektorraum \(V=W=\R^2\) und zwei Vektoren \(x, y \in \R^2\). Nehmen wir zunächst das Tensorprodukt, dass durch das dyadische Produkt \(\otimes : \R^2 \times \R^2 \rightarrow \R^{2 \times 2}\) gegeben ist mit
Man sieht ein, dass der zugehörige Tensorproduktraum also \(\R^{2 \times 2} = \R^2 \otimes \R^2\) sein muss. Anderseits erhält man den gleichen Tensorproduktraum, wenn man ein alternatives Tensorprodukt \(\otimes^*\) zum dyadischen Produkt definiert, welches lediglich die Reihenfolge der Komponenten von \(y\) vertauscht mit
Was bedeutet die universelle Eigenschaft?
Wie wir weiter unten noch genauer beschreiben werden, stellt die universelle Eigenschaft eine wichtige Beziehung zwischen dem Raum der bilinearen Abbildungen auf \(V\times W\) und dem Raum der linearen Abbildungen von \(X = V\otimes W\) nach \(Y\) für ein Tensorprodukt \(\otimes\) her. Für den Spezialfall \(Y = \R\) ist letzterer gerade der algebraische Dualraum des Tensorproduktraums. Sofern wir das Tensorprodukt gegeben haben erhalten wir alle Bilinearformen also schon über einfache Linearformen auf \(V\otimes W\).
Das folgende einfache Beispiel soll uns helfen diese Beziehung besser zu verstehen.
(Universelle Eigenschaft)
Im Folgenden betrachten wir wieder den Euklidischen Vektorraum \(V=W=\R^2\) und zwei Vektoren \(x, y \in \R^2\). Wie wir in Example 3.5 festgestellt haben realisiert das dyadische Produkt
mit
ein Tensorprodukt der Vektorräume \(V=W=\R^2\). Wegen der universellen Eigenschaft muss nun gelten, dass für jede Bilinearform \(\Phi \in L^2(V \times W; Y)\) für beliebige \(\R\)-Vektorräume \(Y\) eine eindeutige lineare Abbildung \(p \in L^1(X; Y)\) existiert, die äquivalent im Sinne von (3.2) ist.
Nehmen wir also beispielsweise das Skalarprodukt \(\langle \cdot, \cdot \rangle \colon V \times W \rightarrow \R\) als eine mögliche Bilinearform \(\Phi \in L^2(V \times W; Y)\) mit
Wir müssen nun einen linearen Operator \(p \in L^1(X; Y)\) finden, der eine äquivalente Berechnung wie das Skalarprodukt auf dem Tensorproduktraum \(X = \R^{2 \times 2}\), der durch das dyadische Produkt induziert wird, durchführt. Hierzu wählen wir die Spur \(p(A) \coloneqq \operatorname{Spur}(A)\) einer Matrix \(A \in \R^{2 \times 2}\), denn diese ist linear und es gilt:
Überprüfen wir mit dieser Wahl nun die universelle Eigenschaft des dyadischen Produkts, so erhalten wir
Es sei angemerkt, dass wir nicht gezeigt haben, dass der Spur-Operator der einzige lineare Operator ist, der diese Äquivalenz erfüllt. Betrachten wir statt dessen die alternative Variante \(\otimes^*\) des dyadischen Produkts aus Example 3.5, so bleibt der Tensorproduktraum gleich, jedoch ändert sich der eindeutig bestimmte, lineare Operator \(p \in L^1(X; Y)\). Durch die Vertauschung der Elemente der Matrix \(x \otimes^* y\) nimmt man nicht mehr die Summe der Hauptdiagonalelemente realisiert durch den Operator \(\operatorname{Spur}(A) = a_{11} + a_{22}\), sondern die Summe der Gegendiagonalelemente realisiert durch einen linearen Operator \(\operatorname{Spur}^*(A) \coloneqq a_{21} + a_{12}\), d.h., die Diagonale von links unten nach rechts oben in der Matrix. In diesem Fall erhält man nämlich analog
Dies Veranschaulicht die Beziehung der involvierten Vektorräume und die zu Grunde liegende universelle Eigenschaft des Tensorprodukts.
Gefahr
Wir haben in Example 3.6 lediglich die universelle Eigenschaft zur Veranschaulichung überprüft für ein konkretes Beispiel. Wir haben jedoch nicht gezeigt, dass das dyadische Produkt die universelle Eigenschaft erfüllt. Dafür hätten wir die Äquivalenz für alle möglichen Bilinearformen \(\Phi \in L^2(V \times W; Y)\) für beliebige Vektorräume \(Y\) beweisen müssen.
3.2.3. Existenz und Konstruktion des Tensorprodukts¶
Wir stellen fest, dass es für zwei beliebige \(\R\)-Vektorräume \(V\) und \(W\) immer ein Tensorprodukt gibt, und dass wir dieses Tensorprodukt konkret konstruieren können indem wir uns auf die Basis der Vektorräume \(V\) und \(W\) zurückziehen. Diese Tatsache formulieren wir in der folgenden Aussage.
(Existenz des Tensorprodukts)
Für zwei reelle Vektorräume \(V, W\) existiert stets mindestens ein Tensorprodukt \(\otimes\in L^2(V\times W; V\otimes W)\).
Proof. Der folgende Beweis ist ein sogenannter konstruktiver Beweis, d.h., wir zeigen die Existenz eines Objekts indem wir es explizit angeben. Im Gegensatz hierzu gibt es auch nicht-konstruktive Existenzbeweise.
Es sei \(B^V = \{b_i^V: i\in I^V\}\) eine Basis von \(V\) und es sei analog \(B^W = \{b_i^W: i\in I^W\}\) eine Basis von \(W\) für zwei Indexmengen \(I^V\) und \(I^W\). Wir betrachten zunächst das kartesische Produkt der beiden Indexmengen
Es sei nun \(X\) ein reeller Vektorraum dessen Basis sich durch \(J\) indizieren lässt, das heißt es existiert eine Menge
so dass \(B^X\) eine Hamel-Basis von \(X\) ist. Man kann zeigen, dass ein solcher Vektorraum immer existiert.
Wir definieren nun eine bilineare Abbildung \(\otimes: V\times W \to X\) über
Es sei darauf hingewiesen, dass die bilineare Abbildung \(\otimes\) durch eine Definition über die Indexmenge \(J\) eindeutig festgelegt ist. Dies liegt daran, dass für beliebige Paare \((v,w)\in V\times W\) endlich viele Koeffizienten \(\alpha_{i_1},\ldots,\alpha_{i_n}\) und \(\beta_{j_1},\ldots, \beta_{j_m}\) existieren, so dass für die Vektoren \(v \in V\) und \(w \in W\) eine Darstellung in den jeweiligen Hamel-Basen existiert mit
Durch diese Darstellung erhalten wir für die bilineare Abbildung \(\otimes: V\times W \to X\) nun eine explizite Vorschrift als
Wir müssen nun noch die universelle Eigenschaft der bilinearen Abbildung \(\otimes\) nachweisen, um zu zeigen, dass es sich um ein Tensorprodukt handelt. Sei dazu \(\phi\in L^2(V\times W; Y)\) eine Bilinearform auf einen beliebigen reellen Vektorraum \(Y\). Dann können wir eine Linearform auf \(p: X\to Y\) explizit definieren durch Angabe ihrer Wirkung auf die Basiselemente mit
Dann gilt nämlich, unter Ausnutzung der Linearität von \(p\) und der obigen Rechnung, dass gilt
Wir sehen also, dass \(\otimes\) die universelle Eigenschaft erfüllt und zwar insbesondere dadurch, dass die Linearform \(p\) durch die obige Definition eindeutig festgelegt ist.
Als Korollar aus Theorem 3.1 erhalten wir somit, dass eine Basis des Tensorproduktraums durch das kartesische Produkt der ursprünglichen Basen konstruiert werden kann. Hieran sieht man den qualitativen Unterschied zwischen \(V \times W\) und \(V\otimes W\).
Für zwei reelle Vektorräume \(V\) und \(W\) mit zugehörigen Hamel-Basen
und einem Tensorprodukt \(\otimes:V\times W \to V\otimes W\) ist
eine Basis von \(X = V\otimes W\).
Wir wissen nun aus Theorem 3.1, dass immer mindestens ein Tensorprodukt existiert. Es stellt sich also die Frage inwiefern sich verschiedene Tensorprodukte auf den gleichen Vektorräumen \(V\) und \(W\) unterscheiden. Hierzu liefert das folgende Lemma eine klare Einsicht.
(Isomorphie von Tensorprodukträumen)
Es seien \(V\) und \(W\) zwei reelle Vektorräume und es seien
zwei Tensorprodukte. Dann existiert genau ein Isomorphismus
so dass gilt \(\otimes_2 = p\circ \otimes_1\).
Proof. Seien also zunächst zwei Tensorprodukte \(\otimes_1, \otimes_2\) auf \(V\times W\) gegeben. Wegen der universellen Eigenschaft des Tensorprodukts wissen wir, dass es lineare Abbildungen
gibt, so dass gilt
Durch Einsetzen der Gleichungen ineinander somit
Aus dem Beweis von Theorem 3.1 wissen wir, dass wir die Basis von \(V\otimes_2 W\) über die Abbildung \(\otimes_2(b_i^V, b_j^W)\) der Basiselemente von \(V\) und \(W\) charakterisieren können. Setzen wir also das Tensorprodukt dieser Basiselemente in die erste Gleichung ein, so erhalten wir
Das zeigt also, dass \(p_1\circ p_2 = \mathrm{Id}_{Y_1}\) die Identitätsabbildung auf dem Tensorproduktraum \(Y_1 = V \otimes_2 W\) sein muss. Dies folgt, weil \(p_1\circ p_2\) als lineare Abbildung schon ganz durch seine Wirkung auf den Basiselementen festgelegt ist. Analog kann man nun folgern, dass \(p_2\circ p_1 = \mathrm{Id}_{Y_2}\) die Identitätsabbildung im Tensorproduktraum \(Y_2 = V \otimes_1 W\) ist und somit sind die Linearformen \(p_1\) und \(p_2\) Isomorphismen und gerade die jeweiligen Umkehrfunktionen zueinander.
Insgesamt haben wir also gezeigt, dass Tensorprodukträume, die durch verschiedene Tensorprodukte auf dem gleiche kartesischen Produkraum stets isomorph zueinander sind.
Im endlich-dimensionalen Fall können wir uns also immer auf den \(\R^{n \cdot m}\) zurückziehen, wie das folgende Korrolar festhält.
Betrachten wir ein Tensorprodukt \(\otimes \in L^2(V \times W; V \otimes W)\) zweier endlich-dimensionaler \(\R\)-Vektorräume \(V\) und \(W\) mit \(\operatorname{dim}(V)=n \in \N\) und \(\operatorname{dim}(W)=m \in \N\), so existiert stets die folgende Isormorphie
Das heißt für die Dimension des Tensorproduktraums \(V \otimes W\) gilt offensichtlich
Das folgende Beispiel soll noch einmal die Isomorphie zwischen verschiedenen Tensorprodukträumen illustrieren.
(Dyadisches Produkt vs. Kronecker-Produkt)
Im Folgenden betrachten wir wieder den Euklidischen Vektorraum \(V=W=\R^2\) und zwei Vektoren \(x, y \in \R^2\). Wie wir in Example 3.5 und Example 3.6 festgestellt haben realisiert das dyadische Produkt
mit
ein Tensorprodukt der Vektorräume \(V=W=\R^2\).
Betrachten wir nun ein weiteres Tensorprodukt auf dem kartesischen Produktraum \(V \times W\), nämlich das Kronecker-Produkt \(\otimes_K\).
Das Kronecker-Produkt realisiert eine Abbildung
mit
Es wird nun klar, dass die Räume \(X_d = \R^{2 \times 2}\) und \(X_K = \R^4\) isomorph zueinander sind, d.h., es gilt \(X_d \cong X_K\). Außerdem kann man Tensoren in den jeweiligen Tensorprodukträumen durch zeilenweises Ablesen bzw. Eintragen in eine Matrix eindeutig ineinander überführen.
Das Tensorprodukt?
Die Aussage aus Lemma 3.4 zeigt also, dass obwohl es verschiedene Arten gibt Tensorprodukte auf dem kartesischen Produktraum \(V \times W\) zu definieren, die resultierenden Tensorprodukträume stets isomorph zueinander sind. Deshalb spricht man auch von dem Tensorprodukt \(\otimes\) und dem Tensorproduktraum \(V \otimes W\), was so klingt als gäbe es jeweils nur ein einziges Exemplar. In der Tat gibt es zwar mehrere Tensorprodukte aber man kann diese problemlos ineinander umrechnen und die resultierenden Tensorprodukträume alle miteinander identifizieren.
Deshalb werden wir im Folgendem auch häufig von dem Tensorprodukt sprechen.
3.2.4. Natürliche Homo- und Isomorphismen des Tensorprodukts¶
Von vielen Operationen kennen wir bereits Eigenschaften wie Kommutativität und Assoziativität. Derartige Eigenschaften gelten nicht direkt für das Tensorprodukt, allerdings erhalten wir Isomorphismen, welche bekannte Rechenregeln nachbilden. Diese Isomorphismen nennt auch natürlich oder kanonisch, weil Sie jeweils auf die naheliegendste Art und Weise definiert sind. Das folgende Lemma fasst die wichtigsten Eigenschaften des Tensorprodukts zusammen
(Natürliche Isomorphismen des Tensorprodukts)
Es seien \(V_1,V_2,V_3\) und \(V_4\) reelle Vektorräume. Dann existieren für das Tensorprodukt die folgenden Isomorphismen:
\(V_1\otimes V_2 \cong V_2\otimes V_1, \quad v_1\otimes v_2 \mapsto v_2\otimes v_1\) (Kommutativität),
\((V_1\otimes V_2)\otimes V_3 \cong V_1 \otimes (V_2 \otimes V_3),\quad (v_1\otimes v_2)\otimes v_3 \mapsto v_1 \otimes (v_2\otimes v_3)\) (Assoziativität),
\(\R \otimes V_1 \cong V_1,\quad a\otimes v_1 \mapsto a\,v_1\) (Produkt mit Skalaren),
Falls \(p_{12}:V_1\to V_2\) und \(p_{34}:V_3\to V_4\) Isomorphismen sind, so gilt (Transitivität)
Proof. Punkt 1.-3. sind in der Hausaufgabe zu zeigen.
Zu Punkt 4.:
Wichtig für die Transitivitätseigenschaft ist es zunächst einzusehen, dass die Definition des Tensorprodukts sinnvoll ist, denn nicht jedes Element \(x\in V_1\otimes V_3\) lässt sich direkt als Tensorprodukt schreiben. Wir wissen lediglich, dass endlich viele sogenannte elementare oder zerfallende Produkte \((v_1^i\otimes v_3^i)_{i=1}^n\) und Skalare \(\alpha_i\in\R, i=1,\ldots,n\), für \(n\in\N\) existieren, so dass sich jeder Vektor \(x \in V_1 \otimes V_3\) schreiben lässt als
was direkt aus der Basiskonstruktion in Theorem 3.1 folgt.
Die angegebene Abbildung
ist nun nur für zerfallende Produkte definiert. Allerdings lässt sie sich eindeutig zu einer linearen Abbildung \(\Phi(V_1\otimes V_3)\to (V_2\otimes V_4)\) fortsetzen, so dass für beliebige Vektoren \(x \in V_1 \otimes V_3\) gilt
Auf analoge Art und Weise definiert man nun die lineare Abbildung \(\Psi \colon V_2 \otimes V_4 \rightarrow V_1 \otimes V_3\) mit
und erhält sofort, dass \(\Psi\circ\Phi = \mathrm{Id}\) gilt, da für beliebige Vektoren \(x \in V_1 \otimes V_3\) gilt:
Analog gilt auch \(\Phi\circ\Psi = \mathrm{Id}\) und somit haben wir die Behauptung des Lemmas bewiesen.
Die zweite Eigenschaft in Lemma 3.5 erlaubt es uns das Tensorprodukt über \(k\)-viele reelle Vektorräume \(V_1,\ldots, V_k\) zu bilden. Daher können wir ab nun folgende Notation verwenden
und sehen, dass dieses Objekt wohldefiniert ist. Insbesondere ist äquivalent das Tensorprodukt über \(k\) Vektorräume mit Hilfe einer \(k\)-Multilinearform aus k-Multilinearformen zu definieren anstatt nur einer Bilinearform wie in Definition 3.4. Die folgende Bemerkung gibt die universelle Eigenschaft für solch ein Tensorprodukt an.
\(k\)-faches Tensorprodukt)
(Es seien \(V_1,\ldots, V_k\) für \(k \in \N\) reelle Vektorräume. Dann besitzt das \(k\)-fache Tensorprodukt \(\otimes \colon V_1 \times \ldots \times V_k \rightarrow \bigotimes_{i=1}^k V_i\) die folgende universelle Eigenschaft:
Für jede \(k\)-Multilinearform \(\phi\in L^k(V_1\times\ldots\times V_k; Y)\) in einen beliebigen reellen Vektorraum \(Y\) existiert eine eindeutige lineare Abbildung \(p \in L^1(\bigotimes_{i=1}^k V_i; Y)\), so dass gilt
(Notation)
Im obigen Fall interpretiert man \(\otimes: V_1\times\ldots\times V_k \rightarrow \bigotimes_{i=1}^k V_i\) als \(k\)-Multilinearform und benutzt die Infix-Notation
Im folgenden Abschnitt der Vorlesung wollen wir Tensoren insbesondere als Multilinearformen interpretieren. Deshalb interessieren wir uns im Folgenden für die Eigenschaften des Tensorprodukts, wenn wir speziell Räume von linearen Abbildungen betrachten. Die lineare Abbildung im folgenden Lemma stellt hierbei die zentrale Idee dar.
Es seien \(V_1, V_2\) sowie \(W_1, W_2\) reelle Vektorräume. Dann ist die Abbildung
ein wohldefinierter Homomorphismus.
Proof. In der Hausaufgabe zu zeigen.
Da die Notation in Lemma 3.6 vielleicht etwas abstrakt wirkt, soll die folgende Bemerkung auf die einzelnen Elemente der linearen Abbildung \(p\) nochmal genauer eingehen.
(Funktionen als Funktionswerte)
Die lineare Abbildung in Lemma 3.6 ist folgendermaßen zu verstehen:
\(\eta_1:V_1\rightarrow V_2\) und \(\eta_2: W_1 \rightarrow W_2\) sind lineare Abbildungen mit \(\eta_1 \in L(V_1; V_2)\) und \(\eta_2 \in L(W_1; W_2)\)
\(\eta_1 \otimes \eta_2\) ist dementsprechend ein Element aus dem Tensorproduktraum \(L(V_1; V_2)\otimes L(W_1; W_2)\),
\(p(\eta_1\otimes\eta_2)\) ist dann ein Element von \(L(V_1\otimes W_1; V_2\otimes W_2)\), also eine lineare Abbildung, welche vom Tensorproduktraum \(V_1\otimes W_1\) in den Tensorproduktraum \(V_2\otimes W_2\) abbildet,
\((p(\eta_1\otimes\eta_2))(v_1\otimes w_1)\) ist schließlich die Auswertung dieser Abbildung am Punkt \(v_1\otimes w_1\in V_1\otimes W_1\).
In diesem Fall notiert man auch
was bedeutet, dass \(\eta_1\otimes\eta_2\) auf eine Funktion abgebildet wird, welche wiederum \(v_1\otimes w_1\) als Argumente bekommt.
Insbesondere können wir im endlich-dimensionalen Fall zeigen, dass die Abbildung \(p\) in Lemma 3.6 einen Isomorphismus definiert. Hierzu formulieren wir zunächst das folgende nützliche Hilfslemma.
Seien \(V\) und \(W\) zwei beliebige reelle Vektorräume und \(n,m \in \N\). Dann existiert ein Isomorphismus, so dass
Proof. In der Hausaufgabe zu zeigen.
Es seien \(V_1, W_1\) reelle endlich-dimensionale Vektorräume und \(V_2, W_2\) beliebige reelle Vektorräume. Dann ist die Abbildung
ein Isomorphismus.
Proof. Seien \(V_1\) und \(W_1\) zwei endlich-dimensionale, reelle Vektorräume mit \(\operatorname{dim}(V_1) = n \in \N\) und \(\operatorname{dim}(W_1) = m \in \N\). Nach dem Isomorphiesatz für endlich-dimensionale Vektorräume 3.20 in [Bur20] existiert dann je ein Isomorphismus, so dass \(V_1 \cong \R^n\) und \(W_1 \cong \R^m\). Über diesen Isomorphismus lässt sich auch zeigen, dass \(L(V_1; V_2) \cong L(\R^n; V_2)\) und \(L(W_1; W_2) \cong L(\R^m; W_2)\) gilt. Zusammen mit der Transitivitätseigenschaft des Tensorprodukts aus Lemma 3.5 folgt dann aber schon
Daher reicht es, die Aussage des Theorems für den einfachen Fall \(V_1=\R^n, W_1=\R^m\) im Folgenden in zwei Schritten zu zeigen.
1.Schritt: Wir zeigen zunächst, dass die Isomorphie \(L(\R^k; Y) \cong Y^k\) gilt.
Es sei \(Y\) ein beliebiger reeller Vektorraum und es bezeichne \((e_i)_{i=1}^k\) die Standardbasis von \(\R^k\). Wir konstruieren nun eine Abbildung \(\phi:Y^k\rightarrow L(\R^k; Y)\), so dass
gilt. Die Abbildung \(\phi\) ist linear, da für alle Vektoren \(y,z \in Y^k\) und einen beliebigen Vektor \(x \in \R^k\) mit der Basisdarstellung \(x=\sum_{i=1}^k \alpha_i e_i\) gilt:
und für jedes Skalar \(\lambda \in \R\) gilt:
Offenbar ist diese lineare Abbildung auch injektiv, denn
Gleichzeitig ist die lineare Abbildung jedoch auch surjektiv, da jede lineare Abbildung in \(L(\R^k; Y)\) sich bereits durch seine Wirkung auf den Basiselementen \(e_i \in \R^k, i=1,\ldots,k\) eindeutig beschreiben lässt.
Wir sehen also ein, dass es sich bei der Abbildung \(\phi\) um einen Isomorphismus handelt und somit gilt also \(L(\R^k; Y) \cong Y^k\).
2.Schritt: Als Nächstes wollen wir die folgenden Isomorphien zeigen:
Mit Schritt 1 des Beweises wissen wir bereits, dass \(L(\R^n; V_2)\cong V_2^n\) und \(L(\R^m; W_2)\cong W_2^m\) gilt. Zusammen mit der Transitivitätseigenschaft des Tensorprodukts aus Lemma 3.5 folgt damit schon die erste Isomorphie
Für die zweite Isomorphie benutzen wir den Zusammenhang \(\R^n\otimes \R^m \cong \R^{n\cdot m}\) aus Corollary 3.2 und erhalten somit
Nutzen wir wiederum die Isomorphie aus Schritt 1 so erhalten wir
Wegen Lemma 3.7 wissen wir dann aber schon, dass gilt
Zusammen mit der Isomorphie (3.3) haben wir nun insgesamt gezeigt, dass
gilt, was mit unseren Vorüberlegungen die Aussage des Theorems beweist.
Wählen wir die Zielräume der linearen Abbildungen als \(V_2 = W_2 = \R\), so erhalten wir direkt folgendes Korrolar als Anwendung des allgemeinen Resultats in Theorem 3.2. Dies ermöglicht es uns später Tensoren als Linearformen zu interpretieren.
(Isomorphie des algebraischen Dualraums des Tensorproduktraums)
Es seien \(V\) und \(W\) beliebige endlich-dimensionale Vektorräume. Dann existiert ein Isomorphismus zwischen dem Tensorproduktraum der algebraischen Dualräume von \(V\) und \(W\) und dem algebraischen Dualraum des Tensorproduktraums, d.h.,
3.2.5. Tensoren als Multilinearformen¶
Das folgende Korollar kombiniert die theoretischen Ergebnisse des letzten Abschnitts und liefert so ein mathematisches Resultat, das für die Anwendung beispielsweise in der Physik von Bedeutung ist. Wir werden nämlich nun folgern, dass wir Tensoren als Multilinearformen auffassen können.
(Tensoren als Multilinearformen)
Seien \(V\) und \(W\) zwei reelle endlich-dimensionale Vektorräume und \(\otimes \colon V \times W \rightarrow V \otimes W\) das Tensorprodukt. Dann existiert ein Isomorphismus zwischen dem Tensorproduktraum und dem Raum der Bilinearformen durch
Proof. Wie wir in Corollary 3.3 gesehen haben, besteht ein Isomorphismus zwischen dem Tensorproduktraum algebraischer Dualräume und dem algebraischen Dualraum des entsprechenden Tensorproduktraums mit
Da jeder endlich-dimensionale, reelle Vektorraums \(V\) nach Lemma 3.3 isomorph zu seinem algebraischen Dualraum \(V^\ast\) ist, können wir die Transitivitätseigenschaft des Tensorprodukts aus Lemma 3.5 ausnutzen und erhalten die folgende Isomorphie
Gleichzeitig besagt die universelle Eigenschaft des Tensorprodukts in , dass es zu jeder Bilinearform \(\Phi \in L^2(V \times W; \R)\) eine eindeutige Linearform \(p \in L^1(V \otimes W; \R)\) gibt, so dass \(\Phi = p \circ \otimes\) gilt. Somit erhalten wir also auch einen Isomorphismus
Kombinieren wir diese mathematischen Resultate nun alle so ergibt sich die folgende Kette von Isomorphismen:
was die Aussage beweist.
Corollary 3.4 besagt, dass Tensoren als Elemente des Tensorproduktraums \(V \otimes W\) als Bilinearformen auf dem kartesischen Produktraum \(V \times W\) aufgefasst werden können. Diese Aussage lässt sich mit Hilfe von Remark 3.7 auch auf das \(k\)-fache Tensorprodukt verallgemeinern. Hier erhält man dann das Resultat, dass sich Tensoren als \(k\)-Multilinearformen interpretieren lassen mit
In (3.4) haben wir die Transitivitätseigenschaft des Tensorprodukts ausgenutzt, um beide Vektorräume mit ihren jeweiligen algebraischen Dualräumen zu identifizieren. Dies muss jedoch nicht sein, denn wir hätten genauso gut gemischte Tensorprodukte der Form \(V \otimes W^\ast\) oder \(V^\ast \otimes W\) betrachten können, wenn wir die triviale Identifikation \(V \cong V\) oder \(W \cong W\) nutzen. Daher wollen wir im Folgenden Tensoren einer allgemeineren Form betrachten, nämlich solche, die für kartesische Produkte der Form \(V^r\times (V^\ast)^s\) mit \(r+s=k\) definiert sind.
(Gemischte Tensoren)
Es sei \(V\) ein reeller endlich-dimensionaler Vektorraum und \(V^\ast\) der zugehörige algebraische Dualraum. Dann nennt man
für \(k = r+s \in \N\) die Menge der gemischten Tensoren, welche kovariant der Stufe \(r\) und kontravariant der Stufe \(s\) sind. In manchen Kontexten spricht man auch nur von gemischten Tensoren der Stufe \(k=r+s\).
Die folgende Bemerkung erklärt, woher die Begriffe Kovarianz und Kontravarianz stammen.
(Ko- und Kontravarianz)
Die Bezeichnungen „kovariant“ und „kontravariant“ beziehen sich auf die Koordinatendarstellungen von Tensoren. Genauer gesagt beschreieb Sie, wie sich solche Koordinatendarstellungen bezüglich eines Basiswechsels im zugrundeliegenden Vektorraum verhalten.
Zusammenfassend kann man festhalten:
Kovariant nennt man ein Transformationsverhalten, bei dem sich die Basisvektoren und die darin dargestellten Größen in gleicher Weise transformieren.
Kontravariant nennt man ein Transformationsverhalten, wenn sich die Basisvektoren und die darin dargestellten Größen in unterschiedlicher Weise transformieren.
Das folgende Beispiel gibt eine Intuition für den Begriff der Kontravarianz an Hand von Vektorkoordinaten unter Basiswechseloperationen.
Sei \(V = \R^3\) der Euklidische Vektorraum und sei
die Standard-Einheitsbasis des \(\R^3\). Sei nun \(x \in \R^3\) ein Vektor, dessen Koordinaten bezüglich der Basis \(B_1\) gegeben sind als
Führen wir nun einen Basiswechsel von \(B_1\) zu einer neuen Basis \(B_2\) mit
durch, so ändert sich die Koordinatendarstellung von \(x\) bezüglich dieser Transformation zu
Wir sehen also, dass durch die Skalierung der Basisvektoren von \(B_1\) um den Faktor \(2\) sich die entsprechende Koordinatendarstellung halbiert, d.h., sich gerade gegensätzlich zur Basistransformation verhält. Daher sind Vektoren kontravariant bezüglich Basiswechseltransformationen.
Wir wollen diese allgemeine Definition von gemischten Tensoren nun mit einfachen Beispielen veranschaulichen. Beginnen wir zunächst mit dem Spezialfall von rein kovarianten Tensoren.
(Rein kovariante Tensoren)
Sei \(V\) ein endlich-dimensionaler, reeller Vektorraum mit \(\operatorname{dim}(V) = n \in \N\). Wir wollen im Folgenden Tensoren unterschiedlicher Stufen betrachten, die Multilinearformen repräsentieren. Diese haben keine kontravarianten Komponenten, sind also sozusagen rein kovariant.
Stufe 0: Wir betrachten Tensoren der Stufe \(r+s=0+0=0\). Elemente der Menge \(T^0_0(V) = L^0(V^0; \R)\) sind gerade die Skalare des zu Grunde liegenden Körpers \(\R\), da der Vektorraum \(V^0\) nur das Nullelement enthält.
Stufe 1: Wir betrachten Tensoren der Stufe \(r+s=1+0=1\). In diesem Fall entsprechen Elemente der Menge \(T^1_0(V) = L^1(V; \R)\) gerade den Linearformen des Vektorraums \(V\). Genauer gesagt handelt es sich um Elemente des algebraischen Dualraums \(V^\ast\).
Stufe k: Wir betrachten Tensoren der Stufe \(r+s=k+0=k\) für \(k\in \N\). Diese Tensoren entsprechen gerade den \(\mathbf{k}\)-Multilinearformen, da \(T^k_0(V) = L^k(V^k; \R) = L^k(V; \R)\).
Stufe n: Wir betrachten Tensoren der Stufe \(r+s=n+0=n\). Ein Beispiel für Elemente der Menge \(T^n_0(V) = L^n(V^n; \R)\) ist die Determinante einer \(n \times n\)-Matrix.
Betrachten wir als Nächstes den Spezialfall von rein kontravarianten Tensoren.
(Rein kontravariante Tensoren)
Sei \(V\) ein endlich-dimensionaler, reeller Vektorraum. Diese besitzen keine kovarianten Komponenten, sind also sozusagen rein kontravariant.
Stufe 1: Wir betrachten Tensoren der Stufe \(r+s=0+1=1\). In diesem Fall entsprechen Elemente der Menge \(T^0_1(V) = L^1(V^\ast; \R)\) gerade den Vektoren des Vektorraums \(V\). Genauer gesagt handelt es sich um Elemente des Bidualraums \(V^{**}\), der nach Remark 3.4 isomorph zu \(V\) ist.
Stufe 2: Wir betrachten Tensoren der Stufe \(r+s=0+2=2\). In diesem Fall entsprechen Elemente der Menge \(T^0_2(V) = L^2(V^\ast \times V^\ast; \R)\) sogenannten Bivektoren oder Dyaden. Ein Beispiel hierfür sind Tensoren, die durch dyadische Produkte erzeugt werden.
Abschließend betrachten wir noch ein Beispiel für echt gemischte Tensoren.
(Echt gemischte Tensoren)
Sei \(V\) ein endlich-dimensionaler, reeller Vektorraum. Wir wollen im Folgenden echt gemischte Tensoren diskutieren. Diese besitzen sowohl kontravariante als auch kovariante Komponenten.
Wir betrachten echt gemischte Tensoren der Stufe \(r+s=1+1=2\). Die Menge \(T^1_1(V) = L^2(V^\ast \times V; \R)\) enthält dann alle linearen Abbildung, die einer Linearform und einem Vektor eine reelle Zahl zuweisen. Ein typisches Beispiel für solch einen ist die sogenannte duale Paarung
Hier wird ein gegebener Vektor \(v \in V\) durch einen gegebenen linearen Operator \(L \in V^\ast\) ausgewertet. Die duale Paarung stellt eine Verallgemeinerung des Skalarprodukts dar.
3.2.6. Symmetrie und Antisymmetrie von Tensoren¶
Oft spielen gerade in der Physik spezielle Familien von Tensoren eine wichtige Rolle, nämlich symmetrische und antisymmetrische Tensoren. Diese Operatoren zeichnen sich durch ihr Verhalten unter Vertauschung von Argumenten aus und werden besonders in der Quantenmechanik und Kontinuumsmechanik betrachtet.
Bevor wir die Symmetrieeigenschaften von Tensoren definieren können, benötigen wir weitere Hilfsmittel aus der Kombinatorik. Die Vertauschung von Argumenten entspricht einer Permutationsabbildung und daher wollen wir das Vorzeichen solch einer Permutation betrachten, welches die Symmetrieeigenschaften von Tensoren charakterisiert.
(Signum einer Permutation)
Sei \(k\in\N\) und \(\pi \colon \lbrace 1,\ldots, k\rbrace \rightarrow \lbrace 1,\ldots, k\rbrace\) eine Permutation der Indizes \(1,\ldots,k\). Dann bezeichnen wir mit \(\operatorname{sgn}(\pi) := (-1)^{|\operatorname{inv}(\pi)|}\) das sogenannte Signum der Permutation \(\pi\), für das man die Menge der Fehlstände der Permutation \(\operatorname{inv}(\pi)\) betrachtet mit:
(Signum durch Transpositionen)
Man erhält eine äquivalente Definition indem man die Darstellung einer Permuattaion durch Transpositionen betrachtet. Eine Permuation vertauscht genau zwei Zahlen, konkret, definiert man für \(r,l\in\{1,\ldots,k\}\) die Permutation \(\tau_{rl}:\{1,\ldots,k\}\to\{1,\ldots,k\}\) wie folgt,
Jede Permutation lässt sich als Verkettung von Nachbarvertauschung darstellen, also Permutationen von benachbarten Elemneten. Konkret gilt für \(r<l\),
und da jede Nachbarvertauschung einen Fehlstand produziert gilt
was stets ungerade ist und somit haben wir \(\operatorname{sgn}(\tau_{rl}) = -1\) für belibiebige Transpositionen ungleich der Identität. Sei \(\pi\) nun eine Permutation und \(M(\pi)\) die Anzahl der Transpostionen mit welcher wir \(\pi\) darstellen können, dann gilt
Das folgende einfache Beispiel illustriert die Berechnung des Signums einer Permutation.
(Signum zweier Permutationen)
Wir betrachten im Folgenden zwei verschiedene Permutationen
1. Sei die Permutation \(\pi_1\) gegeben mit
Für die Menge der Fehlstände \(\operatorname{inv}(\pi_1)\) selektieren wir diejenigen Elemente \(i,j \in \lbrace 1,2,3,4 \rbrace\) mit \(i < j\) und \(\pi(i) > \pi(j)\). Dies trifft auf folgende Paare von Elementen zu:
Da die Permutation \(\pi_1\) insgesamt \(4\) Fehlstände erzeugt, gilt für das Signum der Permutation:
2. Sei die Permutation \(\pi_2\) gegeben mit
Für die Menge der Fehlstände \(\operatorname{inv}(\pi_2)\) selektieren wir diejenigen Elemente \(i,j \in \lbrace 1,2,3,4 \rbrace\) mit \(i < j\) und \(\pi(i) > \pi(j)\). Dies trifft auf folgende Paare von Elementen zu:
Da die Permutation \(\pi_2\) insgesamt \(3\) Fehlstände erzeugt, gilt für das Signum der Permutation:
Nun sind wir in der Lage die Symmetrieeigenschaften von Tensoren formal zu definieren.
(Symmetrie und Antisymmetrie von Tensoren)
Sei V ein reeller, endlich-dimensionaler Vektorraum und \(T \in T_k^0(V)\) ein rein kontravarianter Tensor von Stufe \(k \in \N\).
Wir nennen den Tensor \(T\) symmetrisch, wenn für alle möglichen Permutationen \(\pi \colon \lbrace 1,\ldots, k\rbrace \rightarrow \lbrace 1,\ldots, k\rbrace\) der Indizes \(1,\ldots,k\) der Wert des Tensors mit permutierten Argumenten sich nicht ändert, d.h.,
Wir nennen den Tensor \(T\) antisymmetrisch oder schiefsymmetrisch, wenn für alle möglichen Permutationen \(\pi \colon \lbrace 1,\ldots, k\rbrace \rightarrow \lbrace 1,\ldots, k\rbrace\) der Indizes \(1,\ldots,k\) der Wert des Tensors mit permutierten Argumenten sich bis auf das Vorzeichen nicht ändert und dabei folgendem Zusammenhang genügt
In Definition 3.7 haben wir die Symmetrieeigenschaften für rein kontravariante Tensoren eingeführt. Analog lässt sich die (Anti-)Symmetrie eines rein kovarianten Tensors \(T \in T^k_0(V)\) von Stufe \(k\) definieren. Die Definition von Symmetrie bzw. Antisymmetrie von echt gemischten Tensoren aus Definition 3.5 ist hingegen wenig sinnvoll, da die Rechenvorschrift eine gemischten Tensors unter beliebigen Permutationen der Argumente nicht mehr wohldefiniert sein muss.
Im folgenden Beispiel diskutieren wir jeweils einen Vertreter für symmetrische und antisymmetrische Tensoren.
(Symmetrieeigenschaften von Tensoren)
Betrachten wir zunächst das Standardskalarprodukt
als rein kontravarianten Tensor zweiter Stufe. Da das Standardskalarprodukt im \(\R^n\) eine positiv definite, symmetrische Bilinearform ist, überträgt sich die Symmetrieeigenschaft auf die Interpretation als Tensor. Daher ist das Standardskalarprodukt ein symmetrischer Tensor.
Als zweites Beispiel betrachten wir das sogenannte Levi-Civita-Symbol, auch genannt Epsilon-Tensor,
welcher einem Tupel von \(n\in\N\) Indizes \((i_1,\ldots,i_n) \in \N^n\) einen Wert zuordnet, je nachdem ob eine gerade oder eine ungerade Anzahl an Vertauschung benötigt wird, um die Indizes in aufsteigender Reihenfolge zu sortieren. Wird eine gerade Anzahl an Vertauschungen benötigt, so gilt \(\epsilon_{i_1,\ldots,i_n} = +1\). Wird eine ungerade Anzahl an Vertauschungen benötigt, so gilt \(\epsilon_{i_1,\ldots,i_n} = -1\). Aus letzterer Vorschrift lässt sich ableiten, dass der Epsilon-Tensor den Wert \(0\) haben muss, wenn mindestens zwei der Indizes gleich sind. Dies unterscheidet das Levi-Civita-Symbol vom Signum einer Permutation in Definition 3.6, welche als Bijektion auf paarweise verschiedenen Indizes definiert ist.
Aus dieser Vorschrift lässt sich bereits direkt ableiten, dass es sich beim Levi-Civita-Symbol um einen antisymmetrischen Tensor n-ter Stufe handelt, da jede paarweise Vertauschung von Indizes das Vorzeichen des Tensors wechselt.
Es stellt sich heraus, dass die Menge der (anti-)symmetrischen Tensoren eine Vektorraumstruktur induzieren, wie das folgende Lemma zeigt.
(Vektorraum der (anti-)symmetrischen Tensoren)
Sei \(V\) ein endlich-dimensionaler, reeller Vektorraum mit \(\operatorname{dim}(V) = n \in \N\) und sei \(k \in \N\) mit \(k \leq n\). Seien außerdem
die Menge der antisymmetrischen Tensoren der Stufe \(k\) auf \(V\) und
die Menge der symmetrischen Tensoren der Stufe \(k\) auf \(V\).
Dann bilden \(\Lambda_k(V)\) und \(\mathcal{S}_k(V)\) bezüglich der Addition von Tensoren und der skalaren Multiplikation in \(\R\) einen reellen Vektorraum.
Proof. In der Hausaufgabe zu zeigen.
Abschließend wollen wir uns in diesem Abschnitt noch einem nützlichen mathematischen Werkzeug widmen, das es erlaubt beliebige Tensoren symmetrisch bzw. antisymmetrisch zu machen. Hierzu definieren wir die folgenden Projektionsabbildungen.
(Fermionische und bosonische Projektion)
Sei \(V\) ein beliebiger, reeller Vektorraum und \(k \in \N\). Wir definieren zunächst die sogenannte fermionische Projektion
Diese Projektionsabbildung weist jedem Tensor \(T\in T_k^0\) der Stufe \(k\) einen antisymmetrischen Tensor \(\Pi_-(T) \in \Lambda_k(V)\) zu.
Analog definieren wir die sogenannte bosonische Projektion
Diese Projektionsabbildung weist jedem Tensor \(T\in T_k^0\) der Stufe \(k\) einen symmetrischen Tensor \(\Pi_+(T) \in \mathcal{S}_k(V)\) zu.
Die Bezeichnung fermionisch und bosonisch in Definition 3.8 stammen daher, dass symmetrische Tensorprodukte identische Bosonen in der Quantenmechanik beschreiben, wohingegen antisymmetrische Tensorprodukte identischen Fermionen zugeordnet werden. Weitere Informationen findet man beispielsweise unter Ununterscheidbarkeit von Teilchen in der Quantenmechanik.
3.2.7. Grassmann-Algebra¶
Im letzten Abschnitt haben wir gesehen, dass die Menge der antisymmetrischen Tensoren von Stufe zusammen mit der Addition von Tensoren der gleichen Stufe einen Vektorraum \(\Lambda_k(V)\) bildet. Im Folgenden werden wir sehen, dass wir sogar noch mehr Struktur in Form einer Algebra erhalten, wenn wir den Vektorraum mit einer verträglichen Multiplikation von Tensoren erweitern.
Zunächst wollen wir das äußere Produkt zweier Tensoren definieren.
(Äußeres Produkt von Tensoren)
Sei \(V\) ein endlich-dimensionaler, reeller Vektorraum und seien \(r,r',s,s' \in \N\). Sei außerdem \(T \in T^r_s(V)\) ein Tensor, der kovariant von Stufe \(r\) und kontravariant von Stufe \(s\) ist und sei \(T' \in T^{r'}_{s'}(V)\) ein Tensor, der kovariant von Stufe \(r'\) und kontravariant von Stufe \(s'\) ist.
Dann wird das äußere Tensorprodukt von \(T\) und \(T'\) (manchmal auch Tensormultiplikation genannt) als folgende Abbildung definiert:
Wir sehen also, dass das Tensorprodukt von Tensoren unterschiedlicher Stufe eine Abbildung induziert, die per Definition einen Tensor höherer Stufe liefert, d.h.,
Mit Hilfe des äußeren Produkts von Tensoren in Definition 3.9 sind wir nun in der Lage ein äußeres Produkt für antisymmetrische Tensoren zu definieren.
(Äußeres Produkt von antisymmetrischen Tensoren)
Sei \(V\) ein endlich-dimensionaler, reeller Vektorraum mit \(\operatorname{dim}(V) = n\) und seien \(\Lambda_k(V), \Lambda_l(V)\) jeweils die Vektorräume der antisymmetrischen Tensoren der Stufe \(k\in\N\) und \(l\in\N\). Wir definieren das sogenannte äußere Produkt als die folgende Abbildung
Häufig wird für das äußere Produkt die Infix-Notation verwendet, d.h., \(\omega \wedge \eta := \wedge(\omega,\eta)\).
Das folgende Lemma fasst die wichtigsten Eigenschaften des äußeren Produkts von antisymmetrischen Tensoren zusammen.
(Eigenschaften des äußeren Produkts)
Sei \(V\) ein endlich-dimensionaler, reeller Vektorraum und \(\lambda \in \R\) ein Skalar. Seien außerdem folgende antisymmetrische Tensoren gegeben: \(\omega, \omega' \in \Lambda_k(V), \eta \in \Lambda_l(V), \tau \in \Lambda_m(V)\).
Dann besitzt das äußere Produkt \(\wedge\) von antisymmetrischen Tensoren die folgenden Eigenschaften:
\((\omega \wedge \eta) \wedge \tau = \omega \wedge (\eta \wedge \tau), \qquad \) (Assoziativität)
\((\omega + \lambda \omega') \wedge \eta = \omega \wedge \eta + \lambda \omega' \wedge \eta\quad\) und analog im 2. Argument, (Bilinearität)
\(\omega \wedge \eta = (-1)^{kl} \eta \wedge \omega. \qquad\) (Antikommutativität)
Proof. In der Hausaufgabe zu zeigen.
Mit Hilfe der obigen Eigenschaften, insbesondere der Assoziativität, lässt sich das äußere Produkt für \(k \in \N\) Tensoren verallgemeinern, wie folgende Bemerkung festhält.
\(k\)-faches äußeres Produkt)
(Sei \(V\) ein endlich-dimensionaler, reeller Vektorraum und seien \(\omega_i \in \Lambda_{n_i}(V), i=1,\ldots,k\) antisymmetrische Vektoren der Stufe \(n_i \in \N\).
Dann gilt für das \(k\)-fache äußere Produkt von antisymmetrischen Tensoren,
Das folgende Theorem erweist sich als nützliche Einsicht, die im Laufe der Vorlesung noch von Bedeutung sein wird. Es besagt, dass das äußere Produkt von Linearformen mittels einer Determinante berechnet werden kann.
(Äußeres Produkt von Linearformen)
Sei \(V\) ein endlich-dimensionaler, reeller Vektorraum und \(k \in \N\). Seien außerdem \(\omega_1, \ldots, \omega_k \in V^\ast\) Linearformen auf \(V\) und \(v_1, \ldots, v_k \in V\) beliebige Vektoren.
Dann lässt sich der antisymmetrische, rein kovariante Tensor \(k\)-ter Stufe, der durch das äußere Produkt \(\omega_1 \wedge \ldots \wedge \omega_k \in \Lambda_k(V)\) gegeben ist berechnen als
Proof. Seien \(v_1,\ldots,v_k \in V\) beliebige Vektoren. Dann gilt nach der Definition des \(k\)-fachen äußeren Produkts in (3.5) folgender Zusammenhang
Bei der letzten Gleichung haben wir den Determinantenproduktsatz aus Satz 3.40 in [Bur20] verwendet.
Das folgende Lemma weist auf eine interessante Eigenschaft des Vektorraums der antisymmetrischen Tensoren hin, für den Fall, dass die Stufe der zugehörigen Tensoren größer als die Dimension des zu Grunde liegenden Vektorraums \(V\) ist.
Sei \(V\) ein endlich-dimensionaler, reeller Vektorraum mit \(\operatorname{dim}(V) = n \in \N\). Sei außerdem \(\Lambda_k(V)\) der Vektorraum der antisymmetrischen Tensoren der Stufe \(k\in\N\) mit \(k > n\). Dann gilt schon \(\Lambda_k(V) = \lbrace 0 \rbrace\).
Proof. Da \(V\) ein endlich-dimensionaler Vektorraum mit \(\operatorname{dim}(V)=n \in \N\) ist, wissen wir, dass eine Basis \(B\) von \(V\) aus \(n\) Vektoren \(B := \lbrace b_1,\ldots,b_n \rbrace \in V\) existiert. Dies bedeutet insbesondere, dass die Vektoren von \(B\) ein maximales System von linear unabhängigen Vektoren sind, die gleichzeitig noch ein Erzeugendensystem bilden. Jeder weitere Vektor \(v \in V\), den wir zu diesem System hinzunehmen lässt sich somit als Linearkombination der Basisvektoren von \(B\) darstellen.
Sei nun \(\omega \in \Lambda_k(V)\) ein antisymmetrischer, rein kovarianter Tensor der Stufe \(k > n\). Da dieser insbesondere eine \(k\)-Multilinearform darstellt, können wir für beliebige Vektoren \(v_1, \ldots, v_k \in V\) schreiben:
Wir sehen also, dass der Tensor sich auf die Wirkung der Basisvektoren von \(B\) zurückzuführen lässt und alle Summanden die Form \(\omega(b_{j_1}, \ldots, b_{j_k})\) besitzen. Da wir \(k > n\) angenommen haben, müssen mindestens zwei Basisvektoren gleich sein für jeden dieser Summanden.
Betrachten wir nun einen einzelnen Summanden für den wir ohne Beschränkung der Allgemeinheit annehmen, dass der der \(s\)-te und \(t\)-te Eintrag gleich sind für \(1 \leq s \neq t \leq n\), d.h., \(b_{j_s}=b_{j_t}\). Da der Tensor \(\omega\) antisymmetrisch ist, gilt jedoch:
Da also jeder Summand in (3.6) Null ist, handelt es sich also bei dem antisymmetrischen Tensor \(\omega\) um den Nulltensor, der alle Tupel \((x_1, \ldots, x_k) \in V^k\) auf die Null abbildet. Hieraus folgt nun die Behauptung, denn es gilt \(\Lambda_k(V) = \lbrace 0 \rbrace\) für \(k > n =\operatorname{dim}(V)\).
Mit der Aussage aus Lemma 3.10 wird klar, dass wenn wir die direkte Summe der Vektorräume von antisymmetrischen Tensoren der Stufe \(k\) bilden, wir nur bis zur Stufe \(k = n = \operatorname{dim}(V)\) gehen müssen, da anschließend nur Nullvektorräume hinzugefügt werden. Das heißt insbesondere, dass für den \(\R\)-Vektorraum der durch die direkte Summe gebildet wird gilt:
Mit dieser Erkenntnis lässt sich die sogenannte Grassmann-Algebra für antisymmetrische Tensoren definieren, wie folgende Bemerkung festhält.
(Grassmann-Algebra)
Die Menge
bildet zusammen mit den Verknüpfungen der Tensoraddition „\(+\)“ und der skalaren Multiplikation „\(\cdot\)“ in \(\R\) als direkte äußere Summe von Vektorräumen wiederum einen reellen Vektorraum \((\Lambda(V), +, \cdot)\).
Erweitert man diesen um die bilineare Verknüpfung, die durch das äußere Produkt \(\wedge\) in Definition 3.10 beschrieben wird, so erhält man eine Algebra \((\Lambda(V), +, \cdot, \wedge)\). Diese wird auch Grassmann-Algebra oder äußere Algebra genannt.