Farbverlauf - Gradient

Der durch die blauen Pfeile dargestellte Gradient bezeichnet die Richtung der größten Änderung einer Skalarfunktion. Die Werte der Funktion werden in Graustufen dargestellt und steigen im Wert von weiß (niedrig) nach dunkel (hoch).

In Vektorrechnung , die Gradienten eines skalarwertige differenzierbare Funktion f von mehreren Variablen ist das Vektorfeld (oder Vektor Wertfunktion ) , deren Wert in einem Punkt ist der Vektor , dessen Komponenten die partiellen Ableitungen von an . Das heißt, für ist sein Gradient am Punkt im n- dimensionalen Raum als Vektor definiert:

Das Nabla-Symbol , geschrieben als auf dem Kopf stehendes Dreieck und ausgesprochen "del", bezeichnet den Vektor-Differentialoperator .

Der Gradientenvektor kann als "Richtung und Geschwindigkeit des schnellsten Anstiegs" interpretiert werden. Wenn der Gradient einer Funktion an einem Punkt p ungleich Null ist , ist die Richtung des Gradienten die Richtung, in der die Funktion von p am schnellsten ansteigt , und der Betrag des Gradienten ist die Anstiegsrate in dieser Richtung, die größte absolute Richtungsableitung. Außerdem ist der Gradient genau dann der Nullvektor an einem Punkt, wenn es sich um einen stationären Punkt handelt (wo die Ableitung verschwindet). Der Gradient spielt somit eine grundlegende Rolle in der Optimierungstheorie , wo er verwendet wird, um eine Funktion durch Gradientenanstieg zu maximieren .

Der Gradient ist dual zur Gesamtableitung : Der Wert des Gradienten an einem Punkt ist ein Tangentenvektor – ein Vektor an jedem Punkt; während der Wert der Ableitung an einer Stelle ist eine Co - Tangentenvektor - eine lineare Funktion auf Vektoren. Sie sind dahingehend verwandt, dass das Skalarprodukt des Gradienten von f an einem Punkt p mit einem anderen Tangentenvektor v gleich der Richtungsableitung von f an p der Funktion entlang v ist ; das heißt, . Der Gradient lässt mehrere Verallgemeinerungen auf allgemeinere Funktionen auf Mannigfaltigkeiten zu ; siehe § Verallgemeinerungen .

Motivation

Der Gradient der 2D-Funktion f ( x , y ) = xe – ( x 2 + y 2 ) wird als blaue Pfeile über dem Pseudofarben-Plot der Funktion aufgetragen.

Betrachten wir einen Raum , in dem die Temperatur durch eine gegebene wird Skalarfeld , T , so an jedem Punkt ( x , y , z ) ist die Temperatur T ( x , y , z ) , unabhängig von der Zeit. An jedem Punkt im Raum zeigt der Gradient von T an diesem Punkt die Richtung an, in der die Temperatur am schnellsten ansteigt, weg von ( x , y , z ) . Die Größe des Gradienten bestimmt, wie schnell die Temperatur in diese Richtung ansteigt.

Betrachten wir eine Oberfläche , deren Höhe über dem Meeresspiegel am Punkt ( x , y ) ist H ( x , y ) . Der Gradient H an einem Punkt ist eine Ebene - Vektor zeigt in die Richtung des steilsten Neigung oder Grade an diesem Punkt. Die Steilheit der Steigung an diesem Punkt ist durch die Größe des Gradientenvektors gegeben.

Der Gradient kann auch verwendet werden, um zu messen, wie sich ein Skalarfeld in andere Richtungen ändert, anstatt nur in die Richtung der größten Änderung, indem ein Punktprodukt genommen wird . Angenommen, der steilste Hang auf einem Hügel beträgt 40%. Eine Straße, die direkt bergauf führt, hat eine Steigung von 40 %, eine Straße, die schräg um den Hügel führt, hat jedoch eine geringere Steigung. Wenn die Straße beispielsweise in einem Winkel von 60° zur Steigungsrichtung verläuft (wenn beide Richtungen auf die horizontale Ebene projiziert werden), ist die Neigung entlang der Straße das Punktprodukt zwischen dem Gradientenvektor und einem Einheitsvektor entlang der Straße , nämlich 40% mal der Kosinus von 60° oder 20%.

Wenn die Erhebungshöhe Funktion allgemeine, H ist differenzierbar , so wird der Gradient von H punktierte mit einem Einheitsvektor gibt die Steigung des Hügels in der Richtung des Vektors, die Richtungsableitung von H entlang des Einheitsvektor.

Notation

Der Gradient einer Funktion am Punkt wird normalerweise als geschrieben . Es kann auch durch eine der folgenden Bezeichnungen gekennzeichnet werden:

  •  : um die Vektornatur des Ergebnisses hervorzuheben.
  • grad f
  • und  : Einstein-Notation .

Definition

Der Gradient der Funktion f ( x , y ) = –(cos 2 x + cos 2 y ) 2 dargestellt als projiziertes Vektorfeld auf der unteren Ebene.

Die Steigung (oder Gradientenvektorfeldes) ein Skalarfunktion f ( x 1 , x 2 , x 3 , ..., x n ) bezeichnet ist f oder f wobei ( nabla ) den Vektor bezeichnet Differentialoperator , del . Die Schreibweise grad f wird auch häufig verwendet, um den Gradienten darzustellen. Der Gradient von f ist als das eindeutige Vektorfeld definiert, dessen Skalarprodukt mit einem beliebigen Vektor v an jedem Punkt x die Richtungsableitung von f entlang v ist . Das ist,

Formal ist der Gradient dual zur Ableitung; siehe Zusammenhang mit Derivat .

Wenn eine Funktion auch von einem Parameter wie der Zeit abhängt, bezieht sich der Gradient oft nur auf den Vektor seiner räumlichen Ableitungen (siehe Räumlicher Gradient ).

Größe und Richtung des Gradientenvektors sind unabhängig von der jeweiligen Koordinatendarstellung .

Kartesischen Koordinaten

Im dreidimensionalen kartesischen Koordinatensystem mit einer euklidischen Metrik ist der Gradient, falls vorhanden, gegeben durch:

wobei i , j , k die Standardeinheitsvektoren in den Richtungen der x- , y- bzw. z- Koordinaten sind. Zum Beispiel die Steigung der Funktion

ist

Bei manchen Anwendungen ist es üblich, den Gradienten als Zeilenvektor oder Spaltenvektor seiner Komponenten in einem rechtwinkligen Koordinatensystem darzustellen; Dieser Artikel folgt der Konvention, dass der Gradient ein Spaltenvektor ist, während die Ableitung ein Zeilenvektor ist.

Zylinder- und Kugelkoordinaten

In Zylinderkoordinaten mit einer euklidischen Metrik ist der Gradient gegeben durch:

wobei ρ der axiale Abstand ist, φ ist der azimutale oder Azimutwinkel, z die axiale Koordinate und e ρ , e φ und e z weisen Einheitsvektoren entlang den Koordinatenrichtungen.

In Kugelkoordinaten ist die Steigung gegeben durch:

wobei r der radiale Abstand ist, φ ist der Azimutwinkel und θ der Polarwinkel, und e r , e θ und e φ wieder lokale Vektoren Einheit in den Richtungen Koordinatenzeige ( Das heißt, die normalisiert ist kovarianten Basis ).

Informationen zum Gradienten in anderen orthogonalen Koordinatensystemen finden Sie unter Orthogonale Koordinaten (Differentialoperatoren in drei Dimensionen) .

Allgemeine Koordinaten

Wir betrachten allgemeine Koordinaten , die wir als x 1 , …, x i , …, x n schreiben , wobei n die Anzahl der Dimensionen des Gebietes ist. Hier bezieht sich der obere Index auf die Position in der Liste der Koordinate oder Komponente, also bezieht sich x 2 auf die zweite Komponente – nicht auf die Größe x zum Quadrat. Die Indexvariable i bezieht sich auf ein beliebiges Element x i . Mit der Einstein-Notation kann der Gradient dann geschrieben werden als:

(Beachten Sie, dass es dual ist ),

wobei und sich auf die nicht normalisierten lokalen kovarianten bzw. kontravarianten Basen beziehen, ist der inverse metrische Tensor , und die Einstein-Summierungskonvention impliziert eine Summation über i und j .

Wenn die Koordinaten orthogonal sind, können wir den Gradienten (und das Differential ) leicht in Bezug auf die normalisierten Basen ausdrücken , die wir als und bezeichnen , indem wir die Skalierungsfaktoren (auch als Lamé-Koeffizienten bekannt ) verwenden  :

( und ),

wobei wir die Einstein-Notation nicht verwenden können, da es unmöglich ist, die Wiederholung von mehr als zwei Indizes zu vermeiden. Trotz der Verwendung von oberen und unteren Indizes sind , , und weder kontravariant noch kovariant.

Der letztere Ausdruck ergibt die oben angegebenen Ausdrücke für Zylinder- und Kugelkoordinaten.

Beziehung mit Derivat

Beziehung zur Gesamtableitung

Die Steigung hängt eng mit der Gesamtableitung ( Gesamtdifferential ) zusammen : sie sind zueinander transponiert ( dual ). Unter Verwendung der Konvention, dass Vektoren in durch Spaltenvektoren dargestellt werden und dass Kovektoren (lineare Abbildungen ) durch Zeilenvektoren dargestellt werden , werden der Gradient und die Ableitung als Spalten- bzw Sonstiges:

Obwohl beide die gleichen Komponenten haben, unterscheiden sie sich darin, welche Art von mathematischem Objekt sie darstellen: An jedem Punkt ist die Ableitung ein Kotangensvektor , eine lineare Form ( Kovektor ), die ausdrückt, wie stark sich die (skalare) Ausgabe für eine gegebene infinitesimale ändert Änderung der (Vektor-)Eingabe, während der Gradient an jedem Punkt ein Tangentenvektor ist , der eine infinitesimale Änderung der (Vektor-)Eingabe darstellt. In Symbolen ist der Gradient ein Element des Tangentialraums an einem Punkt, während die Ableitung eine Abbildung vom Tangentialraum auf die reellen Zahlen ist, . Die Tangentialräume an jedem Punkt von können "natürlich" mit dem Vektorraum selbst identifiziert werden , und ähnlich kann der Kotangensraum an jedem Punkt natürlich mit dem dualen Vektorraum von Kovektoren identifiziert werden ; Daher kann man sich den Wert des Gradienten an einem Punkt im Original als Vektor vorstellen , nicht nur als Tangentenvektor.

Rechnerisch kann der Vektor bei einem gegebenen Tangentenvektor mit der Ableitung (als Matrizen) multipliziert werden, was gleich dem Punktprodukt mit dem Gradienten ist:

Differential oder (äußeres) Derivat

Die beste lineare Approximation an eine differenzierbare Funktion

an einem Punkt x in R n ist eine lineare Abbildung von R n nach R, die oft mit df x oder Df ( x ) bezeichnet und als differentielle oder totale Ableitung von f bei x bezeichnet wird . Die Funktion df , die x auf df x abbildet , wird als totales Differential oder äußere Ableitung von f bezeichnet und ist ein Beispiel für eine Differential 1-Form .

Viel wie die Ableitung einer Funktion einer einzigen Variablen , die repräsentiert Steigung der Tangente an die grafische Darstellung der Funktion stellt die Richtungs Ableitung einer Funktion in mehreren Variablen , um die Steigung der Tangente Hyperebene in der Richtung des Vektors.

Die Steigung steht in Beziehung zum Differential durch die Formel

für jeden vR n , wobei das ist Skalarprodukt : das Skalarprodukt eines Vektors mit dem Gradienten zu nehmen ist das gleiche wie die Richtungsableitung entlang des Vektors nehmen.

Betrachtet man R n als den Raum von (Dimension n ) Spaltenvektoren (von reellen Zahlen), so kann man df als den Zeilenvektor mit Komponenten

so dass df x ( v ) durch Matrixmultiplikation gegeben ist . Unter der Annahme der euklidischen Standardmetrik auf R n ist der Gradient dann der entsprechende Spaltenvektor, d. h.

Lineare Approximation an eine Funktion

Die beste lineare Approximation an eine Funktion kann eher als Gradient als als Ableitung ausgedrückt werden. Der Gradient einer Funktion f vom euklidischen Raum R n zu R an einem bestimmten Punkt x 0 in R n charakterisiert die beste lineare Annäherung an f an x 0 . Die Näherung lautet wie folgt:

für x nahe x 0 , wobei (∇ f  ) x 0 der bei x 0 berechnete Gradient von f ist und der Punkt das Skalarprodukt auf R n bezeichnet . Diese Gleichung entspricht den ersten beiden Termen in der multivariablen Taylor-Reihenentwicklung von f bei x 0 .

Beziehung zum Fréchet-Derivat

Sei U eine offene Menge in R n . Ist die Funktion f  : UR differenzierbar, dann ist das Differential von f die Fréchet-Ableitung von f . Also ist f eine Funktion von U zum Raum R n mit

wobei · das Punktprodukt ist.

Folglich gelten für den Gradienten die üblichen Eigenschaften der Ableitung, obwohl der Gradient selbst keine Ableitung, sondern dual zur Ableitung ist:

Linearität

Der Gradient ist linear in dem Sinne , dass , wenn f und g zwei reellwertigen differenzierbare Funktionen an dem Punkt aR n , und α und β zwei Konstanten sind , dann & alpha; f + & bgr; g differenzierbar ist bei a , und darüber hinaus

Produktregel

Wenn f und g sind reellwertige differenzierbare Funktionen an einem Punkt aR n , dann aktiviert die Produktregel , dass das Produkt fg bei differenzierbar ist ein , und

Kettenregel

Angenommen, f  : AR ist eine reellwertige Funktion, die auf einer Teilmenge A von R n definiert ist , und dass f an einem Punkt a differenzierbar ist . Es gibt zwei Formen der Kettenregel, die für den Gradienten gelten. Nehmen wir zunächst an, dass die Funktion g eine parametrische Kurve ist ; dh eine Funktion g  : IR n bildet eine Teilmenge IR in R n ab . Ist g an einem Punkt cI differenzierbar, so dass g ( c ) = a , dann

∘ wobei die Zusammensetzung Operator : (  f  ∘  g ) ( x ) = f ( g ( x )) .

Allgemeiner gesagt gilt , wenn stattdessen IR k gilt:

wobei ( Dg ) T die transponierte Jacobi-Matrix bezeichnet .

Nehmen Sie für die zweite Form der Kettenregel an, dass h  : IR eine reellwertige Funktion auf einer Teilmenge I von R ist und dass h im Punkt f ( a ) ∈ I differenzierbar ist . Dann

Weitere Eigenschaften und Anwendungen

Level-Sets

Eine ebene Fläche oder Isofläche ist die Menge aller Punkte, an denen eine Funktion einen bestimmten Wert hat.

Ist f differenzierbar, dann ergibt das Skalarprodukt (∇ f  ) xv des Gradienten an einem Punkt x mit einem Vektor v die Richtungsableitung von f an x in Richtung v . Daraus folgt , dass in diesem Fall das Gradient von f ist orthogonal zu der Ebene Sätzen von f . Zum Beispiel wird eine ebene Fläche im dreidimensionalen Raum durch eine Gleichung der Form F ( x , y , z ) = c definiert . Die Steigung von F ist dann senkrecht zur Oberfläche.

Allgemeiner gesagt kann jede eingebettete Hyperfläche in einer Riemannschen Mannigfaltigkeit durch eine Gleichung der Form F ( P ) = 0 ausgeschnitten werden, so dass dF nirgendwo Null ist. Die Steigung von F ist dann senkrecht zur Hyperfläche.

In ähnlicher Weise kann eine affine algebraische Hyperfläche durch eine Gleichung F ( x 1 , ..., x n ) = 0 definiert werden , wobei F ein Polynom ist. Der Gradient von F ist an einem singulären Punkt der Hyperfläche null (dies ist die Definition eines singulären Punktes). An einem nicht singulären Punkt ist es ein Normalenvektor ungleich Null.

Konservative Vektorfelder und das Gradiententheorem

Der Gradient einer Funktion wird als Gradientenfeld bezeichnet. Ein (kontinuierliches) Gradientenfeld ist immer ein konservatives Vektorfeld : Sein Linienintegral entlang eines beliebigen Pfades hängt nur von den Endpunkten des Pfades ab und kann durch den Gradientensatz (den Fundamentalsatz der Analysis für Linienintegrale) ausgewertet werden. Umgekehrt ist ein (stetiges) konservatives Vektorfeld immer der Gradient einer Funktion.

Verallgemeinerungen

Jakobiner

Die Jacobi-Matrix ist die Verallgemeinerung des Gradienten für vektorwertige Funktionen mehrerer Variablen und differenzierbarer Abbildungen zwischen euklidischen Räumen oder allgemeiner Mannigfaltigkeiten . Eine weitere Verallgemeinerung für eine Funktion zwischen Banachräumen ist die Fréchet-Ableitung .

Angenommen f  : ℝ n → ℝ m ist eine Funktion, so dass jede ihrer partiellen Ableitungen erster Ordnung auf n existiert . Dann wird die Jacobi-Matrix von f als m × n- Matrix definiert, die mit oder einfach bezeichnet wird . Der ( i , j ) -te Eintrag ist . Ausdrücklich

Gradient eines Vektorfeldes

Da die gesamte Ableitung eines Vektorfeldes eine lineare Abbildung von Vektoren auf Vektoren ist, ist sie eine Tensorgröße .

In rechtwinkligen Koordinaten ist die Steigung eines Vektorfeldes f = (  f 1 , f 2 , f 3 ) definiert durch:

(wobei die Einstein-Summationsnotation verwendet wird und das Tensorprodukt der Vektoren e i und e k ein dyadischer Tensor vom Typ (2,0) ist). Insgesamt entspricht dieser Ausdruck der Transponierten der Jacobi-Matrix:

In krummlinigen Koordinaten oder allgemeiner auf einer gekrümmten Mannigfaltigkeit beinhaltet der Gradient Christoffel-Symbole :

wobei g jk die Komponenten des inversen metrischen Tensors sind und die e i die Koordinatenbasisvektoren sind.

Invarianter ausgedrückt kann der Gradient eines Vektorfeldes f durch die Levi-Civita-Verbindung und den metrischen Tensor definiert werden:

wobei c die Verbindung ist.

Riemannsche Mannigfaltigkeiten

Für jede glatte Funktion f auf einer Riemannschen Mannigfaltigkeit ( M , g ) , die Steigung von f ist das Vektorfeld f , so dass für jedes Vektorfeld X ,

das ist,

wobei g x ( , ) das innere Produkt von Tangentenvektoren an x bezeichnet durch die Metrik g definiert und X f die Funktion ist, die jeden Punkt xM zur Richtungsableitung von f in Richtung X führt , ausgewertet bei x . Mit anderen Worten, in einem Koordinatendiagramm φ von einer offenen Teilmenge von M zu einer offenen Teilmenge von R n ist (∂ X f  )( x ) gegeben durch:

wobei X j die j- te Komponente von X in diesem Koordinatendiagramm bezeichnet.

Die lokale Form des Gradienten nimmt also die Form an:

Verallgemeinert man den Fall M = R n , hängt der Gradient einer Funktion von ihrer äußeren Ableitung ab, da

Genauer gesagt ist der Gradient f das Vektorfeld, das der differentiellen 1-Form df unter Verwendung des musikalischen Isomorphismus zugeordnet ist

(genannt "scharf"), definiert durch die Metrik g . Die Beziehung zwischen der äußeren Ableitung und dem Gradienten einer Funktion auf R n ist ein Spezialfall davon, bei dem die Metrik die flache Metrik ist, die durch das Skalarprodukt gegeben ist.

Siehe auch

Anmerkungen

Verweise

  • Bachman, David (2007), Advanced Calculus Demystified , New York: McGraw-Hill , ISBN 978-0-07-148121-2
  • Beauregard, Raymond A.; Fraleigh, John B. (1973), Ein erster Kurs in Linearer Algebra: mit optionaler Einführung in Gruppen, Ringe und Felder , Boston: Houghton Mifflin Company , ISBN 0-395-14017-X
  • Downing, Douglas, Ph.D. (2010), Barrons EZ-Kalkül , New York: Barrons , ISBN 978-0-7641-4461-5
  • Dubrovin, BA; Fomenko, AT; Novikov, SP (1991). Moderne Geometrie – Methoden und Anwendungen: Teil I: Die Geometrie von Flächen, Transformationsgruppen und Körpern . Graduiertentexte in Mathematik (2. Aufl.). Springer. ISBN 978-0-387-97663-1.
  • Harper, Charlie (1976), Einführung in die mathematische Physik , New Jersey: Prentice-Hall , ISBN 0-13-487538-9
  • Kreyszig, Erwin (1972), Advanced Engineering Mathematics (3. Aufl.), New York: Wiley , ISBN 0-471-50728-8
  • "McGraw Hill Encyclopedia of Science & Technology". McGraw-Hill Encyclopedia of Science & Technology (10. Aufl.). New York: McGraw-Hill . 2007. ISBN 978-0-07-144143-8.
  • Moise, Edwin E. (1967), Calculus: Complete , Reading: Addison-Wesley
  • Protter, Murray H.; Morrey, Jr., Charles B. (1970), College Calculus with Analytic Geometry (2. Aufl.), Reading: Addison-Wesley , LCCN  76087042
  • Schey, HM (1992). Div, Grad, Curl und all das (2. Aufl.). WW Norton. ISBN 0-393-96251-2. OCLC  25048561 .
  • Stoker, JJ (1969), Differentialgeometrie , New York: Wiley , ISBN 0-471-82825-4
  • Swokowski, Graf W.; Olinick, Michael; Pence, Dennis; Cole, Jeffery A. (1994), Calculus (6. Aufl.), Boston: PWS Publishing Company, ISBN 0-534-93624-5

Weiterlesen

  • Korn, Theresa M. ; Korn, Granino Arthur (2000). Mathematisches Handbuch für Wissenschaftler und Ingenieure: Definitionen, Theoreme und Formeln zur Referenz und Überprüfung . Dover-Publikationen. S. 157–160. ISBN 0-486-41147-8. OCLC  43864234 .

Externe Links