Derivat - Derivative

Der Graph einer Funktion , schwarz gezeichnet, und eine Tangente an diesen Graphen, rot gezeichnet. Die Steigung der Tangente ist gleich der Ableitung der Funktion am markierten Punkt.

In der Mathematik misst die Ableitung einer Funktion einer reellen Variablen die Änderungsempfindlichkeit des Funktionswertes (Ausgangswert) in Bezug auf eine Änderung seines Arguments (Eingangswert). Derivate sind ein grundlegendes Werkzeug der Infinitesimalrechnung . Zum Beispiel ist die Ableitung der Position eines sich bewegenden Objekts nach der Zeit die Geschwindigkeit des Objekts : Diese misst, wie schnell sich die Position des Objekts mit fortschreitender Zeit ändert.

Die Ableitung einer Funktion einer einzelnen Variablen an einem gewählten Eingabewert, falls vorhanden, ist die Steigung der Tangente an den Graphen der Funktion an diesem Punkt. Die Tangente ist die beste lineare Approximation der Funktion in der Nähe dieses Eingabewertes. Aus diesem Grund wird die Ableitung oft als "momentane Änderungsrate" bezeichnet, das Verhältnis der momentanen Änderung der abhängigen Variablen zu der der unabhängigen Variablen.

Ableitungen können auf Funktionen mehrerer reeller Variablen verallgemeinert werden . Bei dieser Verallgemeinerung wird die Ableitung als lineare Transformation uminterpretiert , deren Graph (nach entsprechender Übersetzung) die beste lineare Approximation an den Graphen der Originalfunktion ist. Die Jacobi-Matrix ist die Matrix , die diese lineare Transformation in Bezug auf die durch die Wahl der unabhängigen und abhängigen Variablen gegebene Basis darstellt. Sie kann anhand der partiellen Ableitungen nach den unabhängigen Variablen berechnet werden. Für eine reellwertige Funktion mehrerer Variablen reduziert sich die Jacobi-Matrix auf den Gradientenvektor .

Das Auffinden einer Ableitung wird als Differenzierung bezeichnet . Der umgekehrte Vorgang wird als Antidifferenzierung bezeichnet . Der fundamentale Satz der Infinitesimalrechnung bezieht die Antidifferenzierung mit der Integration . Differentiation und Integration bilden die beiden grundlegenden Operationen in der Ein-Variablen-Kalküle.

Definition

Eine Funktion einer reellen Variablen y = f ( x ) ist an einem Punkt a ihres Bereichs differenzierbar , wenn ihr Bereich ein offenes Intervall I mit a enthält und der Grenzwert

existiert. Dies bedeutet , dass für jede positive reelle Zahl (auch sehr klein), gibt es eine positive reelle Zahl existiert , so dass für jeden h , so dass und dann definiert ist, und

wobei die vertikalen Balken den absoluten Wert angeben (siehe (ε, δ)-Definition von Grenzwert ).

Wenn die Funktion f an a differenzierbar ist, dh wenn der Grenzwert L existiert, dann heißt dieser Grenzwert die Ableitung von f an a und bezeichnet (gelesen als " f prim von a ") oder (gelesen als "die Ableitung von f in Bezug auf x bei a ", " dy durch dx bei a " oder " dy über dx bei a "); siehe § Notation (Details) , unten.

Erklärungen

Differentiation ist die Aktion der Berechnung einer Ableitung. Die Ableitung einer Funktion y = f ( x ) einer Variablen x ist ein Maß für die Geschwindigkeit, mit der sich der Wert y der Funktion in Bezug auf die Änderung der Variablen x ändert . Sie heißt Ableitung von f nach x . Wenn x und y sind reelle Zahlen , und wenn die grafische Darstellung von f gegen aufgetragen x , Ableitung ist die Neigung dieses Graphen an jedem Punkt.

Steigung einer linearen Funktion:

Der einfachste Fall, abgesehen vom trivialen Fall einer konstanten Funktion , ist, wenn y eine lineare Funktion von x ist , was bedeutet, dass der Graph von y eine Gerade ist. In diesem Fall ist y = f ( x ) = mx + b , für reelle Zahlen m und b , und die Steigung m ist gegeben durch

wobei das Symbol Δ ( Delta ) eine Abkürzung für "change in" ist und die Kombinationen und sich auf entsprechende Änderungen beziehen, dh

.

Die obige Formel gilt, weil

So

Dies gibt den Wert für die Steigung einer Linie an.

Wenn die Funktion f nicht linear ist (dh ihr Graph ist keine gerade Linie), dann variiert die Änderung von y geteilt durch die Änderung von x über den betrachteten Bereich: Differentiation ist eine Methode, um einen eindeutigen Wert für diese Änderungsrate zu finden, nicht über einen bestimmten Bereich, sondern bei einem beliebigen Wert von x .

Änderungsgeschwindigkeit als Grenzwert
Abbildung 1 . Die Tangente bei ( x , f ( x ))
Abbildung 2. Die Sekante zur Kurve y = f ( x ) bestimmt durch die Punkte ( x , f ( x )) und ( x + h , f ( x + h ))
Abbildung 3. Die Tangente als Sekantengrenze
Abbildung 4. Animierte Darstellung: die Tangente (Ableitung) als Sekantengrenze

Die in den Abbildungen 1 bis 3 dargestellte Idee besteht darin, die Änderungsrate als Grenzwert des Verhältnisses der Differenzen Δ y / Δ x zu berechnen, wenn Δ x gegen 0 strebt.

Auf dem Weg zu einer Definition

Eine Sekante nähert sich einer Tangente, wenn .

Der gebräuchlichste Ansatz, diese intuitive Idee in eine präzise Definition zu verwandeln, besteht darin, die Ableitung als Grenzwert von Differenzenquotienten reeller Zahlen zu definieren. Dies ist der unten beschriebene Ansatz.

Sei f eine reellwertige Funktion, die in einer offenen Umgebung einer reellen Zahl a definiert ist . In der klassischen Geometrie, die Tangente an den Graphen der Funktion f in a war die einzigartige Linie durch den Punkt ( a , f ( a )) , das hat nicht das Graphen treffen f quer , was bedeutet , dass die Linie nicht gerade nicht bestanden durch der Graph. Die Ableitung von y nach x bei a ist geometrisch die Steigung der Tangente an den Graphen von f bei ( a , f ( a )) . Die Steigung der Tangente ist der Steigung der Geraden durch ( a , f ( a )) und einem nahegelegenen Punkt auf dem Graphen sehr ähnlich, zum Beispiel ( a + h , f ( a + h )) . Diese Linien werden Sekantenlinien genannt . Ein Wert von h nahe Null ergibt eine gute Annäherung an die Steigung der Tangente, und kleinere Werte (als Absolutwert ) von h ergeben im Allgemeinen bessere Annäherungen . Die Steigung m der Sekante ist die Differenz zwischen den y- Werten dieser Punkte geteilt durch die Differenz zwischen den x- Werten, d. h.

Dieser Ausdruck ist Newton ‚s Differenzenquotient . Der Übergang von einer Näherung zu einer genauen Antwort erfolgt mit Hilfe eines Grenzwerts . Geometrisch ist die Grenze der Sekantenlinie die Tangente. Daher sollte der Grenzwert des Differenzenquotienten , wenn h gegen Null geht, falls er existiert, die Steigung der Tangente an ( a , f ( a )) darstellen . Dieser Grenzwert wird als Ableitung der Funktion f an a definiert :

Wenn der Grenzwert existiert, f wird gesagt, dass differenzierbar an ein . Hier ist f ( a ) eine von mehreren gebräuchlichen Notationen für die Ableitung ( siehe unten ). Aus dieser Definition ist es offensichtlich , dass eine differenzierbare Funktion f wird zu erhöhen , wenn und nur wenn ihre Ableitung positiv ist, und nimmt ab iff sein Derivat negativ ist. Diese Tatsache wird ausgiebig bei der Analyse des Funktionsverhaltens ausgenutzt, zB beim Finden lokaler Extrema .

Äquivalent erfüllt das Derivat die Eigenschaft, dass

die die intuitive Interpretation hat (siehe Abbildung 1), dass die Tangente an f an a die beste lineare Näherung ergibt

bis f nahe a (dh für kleines h ). Diese Interpretation lässt sich am einfachsten auf andere Einstellungen verallgemeinern ( siehe unten ).

Das Einsetzen von h durch 0 im Differenzenquotienten bewirkt eine Division durch Null , sodass die Steigung der Tangente mit dieser Methode nicht direkt ermittelt werden kann. Definiere stattdessen Q ( h ) als Differenzenquotient als Funktion von h :

Q ( h ) ist die Steigung der Sekantenlinie zwischen ( a , f ( a )) und ( a + h , f ( a + h ) ) . Wenn f eine stetige Funktion ist , dh ihr Graph eine ununterbrochene Kurve ohne Lücken ist, dann ist Q eine stetige Funktion weg von h = 0 . Existiert der Grenzwert lim h →0 Q ( h ) , d. h. es gibt eine Möglichkeit, einen Wert für Q (0) zu wählen, der Q zu einer stetigen Funktion macht, dann ist die Funktion f bei a differenzierbar, und ihre Ableitung bei a ist gleich Q (0) .

In der Praxis zeigt sich die Existenz einer stetigen Erweiterung des Differenzenquotienten Q ( h ) auf h = 0 durch Modifizieren des Zählers, um h im Nenner aufzuheben . Solche Manipulationen können den Grenzwert von Q für kleine h deutlich machen, obwohl Q bei h = 0 noch nicht definiert ist . Dieser Vorgang kann bei komplizierten Funktionen lang und mühsam sein, und es werden häufig viele Tastenkombinationen verwendet, um den Vorgang zu vereinfachen.

Beispiel

Die quadratische Funktion

Die durch f ( x ) = x 2 gegebene Quadratfunktion ist bei x = 3 differenzierbar , und ihre Ableitung dort ist 6. Dieses Ergebnis wird durch Berechnung des Grenzwertes ermittelt, wenn h gegen Null des Differenzenquotienten von f (3) geht :

Der letzte Ausdruck zeigt, dass der Differenzenquotient bei h 0 gleich 6 + h ist und bei h = 0 wegen der Definition des Differenzenquotienten undefiniert ist . Die Definition des Grenzwertes besagt jedoch, dass der Differenzenquotient nicht definiert werden muss, wenn h = 0 ist . Der Grenzwert ergibt sich daraus, dass h auf Null geht, d. h. es ist der Wert, zu dem 6 + h tendiert, wenn h sehr klein wird:

Daraus ergibt sich die Steigung des Graphen der quadratischen Funktion an der Stelle (3, 9) ist 6 , und so seine Ableitung bei x = 3 ist , f ' (3) = 6 .

Eine ähnliche Berechnung zeigt ganz allgemein , dass die Ableitung der Quadratfunktion bei x = a ist f ' ( a ) = 2 ein :

Kontinuität und Unterscheidbarkeit

Diese Funktion hat an der markierten Stelle keine Ableitung, da die Funktion dort nicht stetig ist (insbesondere hat sie eine Sprungunstetigkeit ).

Wenn f ist differenzierbar in a , dann f muss auch sein , kontinuierlich auf ein . Wählen Sie als Beispiel einen Punkt a und lassen Sie f die Schrittfunktion sein , die den Wert 1 für alle x kleiner als a zurückgibt und einen anderen Wert 10 für alle x größer oder gleich a zurückgibt . f kann keine Ableitung an a haben . Wenn h negativ ist, dann liegt a + h im unteren Teil der Stufe, so dass die Sekantenlinie von a zu a + h sehr steil ist, und da h gegen Null geht, geht die Steigung gegen Unendlich. Wenn h positiv ist, liegt a + h im oberen Teil der Stufe, sodass die Sekantenlinie von a nach a + h die Steigung Null hat. Folglich nähern sich die Sekanten keiner einzelnen Steigung an, so dass die Grenze des Differenzenquotienten nicht existiert.

Die Betragsfunktion ist stetig, aber bei x = 0 nicht differenzierbar, da sich die Tangentensteigungen von links nicht dem gleichen Wert annähern wie von rechts.

Aber auch wenn eine Funktion an einem Punkt stetig ist, ist sie dort möglicherweise nicht differenzierbar. Zum Beispiel die Absolutwertfunktion von f ( x ) = | x | ist bei x = 0 stetig , aber dort nicht differenzierbar. Wenn h positiv ist, dann ist die Steigung der Sekantenlinie von 0 nach h eins, während wenn h negativ ist, dann ist die Steigung der Sekantenlinie von 0 nach h negativ Eins. Dies ist grafisch als "Knick" oder "Spitze" im Graphen bei x = 0 zu sehen . Selbst eine Funktion mit einem glatten Graphen ist an einem Punkt, an dem ihre Tangente vertikal ist, nicht differenzierbar : Zum Beispiel ist die durch f ( x ) = x 1/3 gegebene Funktion an x = 0 nicht differenzierbar .

Zusammenfassend lässt sich sagen, dass eine Funktion mit einer Ableitung stetig ist, aber es gibt stetige Funktionen, die keine Ableitung haben.

Die meisten in der Praxis vorkommenden Funktionen haben an allen Punkten oder fast an jedem Punkt Ableitungen . Früh in der Geschichte der Infinitesimalrechnung gingen viele Mathematiker davon aus, dass eine stetige Funktion an den meisten Punkten differenzierbar ist. Unter milden Bedingungen, zum Beispiel wenn die Funktion eine monotone Funktion oder eine Lipschitz-Funktion ist , ist dies wahr. 1872 fand Weierstrass jedoch das erste Beispiel einer überall stetigen, aber nirgendwo differenzierbaren Funktion. Dieses Beispiel ist heute als Weierstrass-Funktion bekannt . 1931 bewies Stefan Banach , dass die Menge der Funktionen, die irgendwann eine Ableitung haben, eine magere Menge im Raum aller stetigen Funktionen ist. Informell bedeutet dies, dass kaum zufällige stetige Funktionen auch nur an einem Punkt eine Ableitung haben.

Ableitung als Funktion

Die Ableitung an verschiedenen Punkten einer differenzierbaren Funktion. In diesem Fall ist die Ableitung gleich:

Sei f eine Funktion, die an jedem Punkt ihres Definitionsbereichs eine Ableitung hat . Wir können dann eine Funktion definieren, die jeden Punkt x auf den Wert der Ableitung von f bei x abbildet . Diese Funktion wird f ′ geschrieben und heißt Ableitungsfunktion oder Ableitung von f .

Manchmal hat f höchstens eine Ableitung, aber nicht alle Punkte seines Definitionsbereichs. Die Funktion , dessen Wert bei a gleich f ' ( a ) , wenn f ' ( a ) definiert ist , und an anderer Stelle ist nicht definiert , wird auch die Ableitung genannt f . Es ist immer noch eine Funktion, aber ihr Definitionsbereich ist strikt kleiner als der Definitionsbereich von f .

Mit dieser Idee wird Differentiation zu einer Funktion von Funktionen: Die Ableitung ist ein Operator, dessen Definitionsbereich die Menge aller Funktionen ist, die an jedem Punkt ihres Definitionsbereichs Ableitungen haben und deren Bereich eine Menge von Funktionen ist. Wenn wir diesen Operator mit D bezeichnen , dann ist D ( f ) die Funktion f . Da D ( f ) eine Funktion ist, kann sie an einem Punkt a ausgewertet werden . Nach der Definition der Ableitungsfunktion ist D ( f ) ( a ) = f ( a ) .

Betrachten Sie zum Vergleich die Verdopplungsfunktion f ( x ) = 2 x ; f ist eine reellwertige Funktion einer reellen Zahl, dh sie nimmt Zahlen als Eingaben und hat Zahlen als Ausgaben:

Der Operator D ist jedoch nicht für einzelne Zahlen definiert. Es ist nur für Funktionen definiert:

Da die Ausgabe von D eine Funktion ist, kann die Ausgabe von D an einem Punkt ausgewertet werden. Wenn zum Beispiel D zum Quadrat - Funktion angewendet wird, xx 2 , D gibt die Verdopplungsfunktion x ↦ 2 x , die wir genannt f ( x ) . Diese Ausgabefunktion kann dann ausgewertet werden, um f (1) = 2 , f (2) = 4 usw. zu erhalten.

Höhere Ableitungen

Sei f eine differenzierbare Funktion und sei f ihre Ableitung. Die Ableitung von f (wenn sie eine hat) wird f ′′ geschrieben und heißt die zweite Ableitung von f . In ähnlicher Weise wird die Ableitung der zweiten Ableitung, falls vorhanden, als f ′′′ geschrieben und als dritte Ableitung von f bezeichnet . In Fortsetzung dieses Prozesses kann man, falls vorhanden, die n- te Ableitung als die Ableitung der ( n −1) -ten Ableitung definieren. Diese wiederholten Ableitungen werden Ableitungen höherer Ordnung genannt . Die n- te Ableitung wird auch Ableitung der Ordnung n genannt .

Wenn x ( t ) die Position eines Objekts zum Zeitpunkt t darstellt , dann haben die Ableitungen von x höherer Ordnung spezifische Interpretationen in der Physik . Die erste Ableitung von x ist die Geschwindigkeit des Objekts . Die zweite Ableitung von x ist die Beschleunigung . Die dritte Ableitung von x ist der Ruck . Und schließlich die vierte bis sechste Derivate von x sind Snap, Knistern und Pop ; am besten auf die Astrophysik anwendbar .

Eine Funktion f muss keine Ableitung haben (zB wenn sie nicht stetig ist). Auch wenn f eine Ableitung hat, kann es keine zweite Ableitung haben. Lassen Sie zum Beispiel

Die Rechnung zeigt, dass f eine differenzierbare Funktion ist, deren Ableitung at gegeben ist durch

f' ( x ) ist das Doppelte der Absolutwertfunktion beiund hat keine Ableitung bei Null. Ähnliche Beispiele zeigen, dass eine Funktion eine k- te Ableitung für jede nicht negative ganze Zahl k haben kann, aber keine ( k + 1) -te Ableitung. Eine Funktion mit k aufeinanderfolgenden Ableitungen heißt k mal differenzierbar . Ist außerdem die k- te Ableitung stetig, so heißt die Funktion von der Differenzierbarkeitsklasse C k . (Dies ist eine stärkere Bedingung als k Ableitungen zu haben, wie das zweite Beispiel von Smoothness § Beispiele zeigt .) Eine Funktion mit unendlich vielen Ableitungen heißt unendlich differenzierbar oder glatt .

Auf der reellen Geraden ist jede Polynomfunktion unendlich differenzierbar. Wenn ein Polynom vom Grad n n- mal differenziert wird, wird es nach Standard- Differenzierungsregeln zu einer konstanten Funktion . Alle seine nachfolgenden Ableitungen sind identisch null. Insbesondere existieren sie, also sind Polynome glatte Funktionen.

Die Ableitungen einer Funktion f an einem Punkt x liefern polynomielle Annäherungen an diese Funktion in der Nähe von x . Wenn beispielsweise f zweimal differenzierbar ist, dann

in dem Sinne, dass

Wenn f unendlich differenzierbar ist, dann ist dies der Beginn der Taylor-Reihe für f berechnet bei x + h um x .

Wendepunkt

Ein Punkt, an dem die zweite Ableitung einer Funktion das Vorzeichen ändert, wird als Wendepunkt bezeichnet . An einem Wendepunkt kann die zweite Ableitung Null sein, wie im Fall des Wendepunkts x = 0 der durch gegebenen Funktion , oder sie kann nicht existieren, wie im Fall des Wendepunkts x = 0 der Funktion gegeben von . An einem Wendepunkt wechselt eine Funktion von einer konvexen Funktion zu einer konkaven Funktion oder umgekehrt.

Notation (Details)

Leibniz-Notation

Die Symbole , , und wurden 1675 von Gottfried Wilhelm Leibniz eingeführt . Sie wird immer noch häufig verwendet, wenn die Gleichung y = f ( x ) als funktionaler Zusammenhang zwischen abhängigen und unabhängigen Variablen betrachtet wird . Dann heißt die erste Ableitung

und wurde einst als infinitesimaler Quotient betrachtet. Höhere Ableitungen werden mit der Notation . ausgedrückt

für die n- te Ableitung von . Dies sind Abkürzungen für Mehrfachanwendungen des Ableitungsoperators. Beispielsweise,

Mit der Leibniz-Notation können wir die Ableitung von am Punkt auf zwei verschiedene Arten schreiben :

Die Notation von Leibniz erlaubt es, die Variable für die Differentiation (im Nenner) anzugeben, die bei der partiellen Differentiation relevant ist . Es kann auch verwendet werden, um die Kettenregel zu schreiben als

Lagranges Notation

Eine der gebräuchlichsten modernen Notationen zur Differenzierung, die manchmal auch als Primnotation bezeichnet wird , stammt von Joseph-Louis Lagrange und verwendet das Primzeichen , damit die Ableitung einer Funktion bezeichnet wird . In ähnlicher Weise werden die zweite und dritte Ableitung bezeichnet

  und  

Um die Zahl der Ableitungen über diesen Punkt hinaus anzugeben, verwenden einige Autoren römische Ziffern hochgestellt , während andere die Zahl in Klammern setzen:

  oder  

Die letztgenannte Notation verallgemeinert die Notation für die n- te Ableitung von – diese Notation ist am nützlichsten, wenn wir über die Ableitung als eine Funktion selbst sprechen möchten, da in diesem Fall die Leibniz-Notation umständlich werden kann.

Newtons Notation

Newtons Notation zur Differenzierung, auch Punktnotation genannt, platziert einen Punkt über dem Funktionsnamen, um eine Zeitableitung darzustellen. Wenn , dann

  und  

bezeichnen jeweils die erste und zweite Ableitung von . Diese Notation wird ausschließlich für Ableitungen nach Zeit oder Bogenlänge verwendet . Es wird typischerweise in Differentialgleichungen in der Physik und Differentialgeometrie verwendet . Die Punktnotation wird jedoch für Ableitungen höherer Ordnung (Ordnung 4 oder höher) unhandlich und kann nicht mit mehreren unabhängigen Variablen umgehen.

Eulersche Notation

Die Eulersche Notation verwendet einen Differentialoperator , der auf eine Funktion angewendet wird , um die erste Ableitung zu erhalten . Die n- te Ableitung wird bezeichnet .

Wenn y = f ( x ) eine abhängige Variable ist, wird oft der Index x an das D angehängt , um die unabhängige Variable x zu verdeutlichen . Die Eulersche Notation wird dann geschrieben

  oder   ,

obwohl dieser Index oft weggelassen wird, wenn die Variable x verstanden wird, zum Beispiel wenn dies die einzige unabhängige Variable ist, die im Ausdruck vorhanden ist.

Die Eulersche Notation ist nützlich, um lineare Differentialgleichungen aufzustellen und zu lösen .

Berechnungsregeln

Die Ableitung einer Funktion kann im Prinzip aus der Definition berechnet werden, indem man den Differenzenquotienten betrachtet und seinen Grenzwert berechnet. In der Praxis lassen sich, sobald die Ableitungen einiger einfacher Funktionen bekannt sind, die Ableitungen anderer Funktionen leichter berechnen, indem Regeln verwendet werden, um Ableitungen komplizierterer Funktionen von einfacheren zu erhalten.

Regeln für Grundfunktionen

Hier sind die Regeln für die Ableitungen der gebräuchlichsten Grundfunktionen, wobei a eine reelle Zahl ist.

  • Ableitungen von Befugnissen :
  • Exponentielle und logarithmische Funktionen :
  • Trigonometrische Funktionen :
  • Inverse trigonometrische Funktionen :

Regeln für kombinierte Funktionen

Hier sind einige der grundlegendsten Regeln zum Ableiten der Ableitung einer zusammengesetzten Funktion aus Ableitungen von Grundfunktionen.

  • Konstantenregel : wenn f ( x ) konstant ist, dann
  • Summenregel :
    für alle Funktionen f und g und alle reellen Zahlen und .
  • Produktregel :
    für alle Funktionen f und g . Als Sonderfall schließt diese Regel die Tatsache ein , wann immer eine Konstante ist, denn nach der Konstantenregel.
  • Quotientenregel :
    für alle Funktionen f und g an allen Eingängen mit g ≠ 0 .
  • Kettenregel für zusammengesetzte Funktionen: Wenn, dann

Rechenbeispiel

Die Ableitung der durch . gegebenen Funktion

ist

Hier wurde der zweite Term nach der Kettenregel und der dritte nach der Produktregel berechnet . Auch die bekannten Ableitungen der Elementarfunktionen x 2 , x 4 , sin( x ), ln( x ) und exp( x ) = e x , sowie die Konstante 7 wurden verwendet.

Definition mit Hyperrealen

Bezogen auf eine hyperreale Erweiterung RR der reellen Zahlen lässt sich die Ableitung einer reellen Funktion y = f ( x ) an einem reellen Punkt x als Schatten des Quotienten definieren ja/Δ xfür infinitesimales x , wobei y = f ( x + ∆ x ) − f ( x ) ist . Hier wird die natürliche Erweiterung von f auf die Hyperrealen noch mit f bezeichnet . Hier heißt die Ableitung existiert, wenn der Schatten unabhängig von der gewählten infinitesimalen Größe ist.

In höheren Dimensionen

Vektorwertige Funktionen

Eine vektorwertige Funktion y einer reellen Variablen sendet reelle Zahlen an Vektoren in einem Vektorraum R n . Eine vektorwertige Funktion kann in ihre Koordinatenfunktionen y 1 ( t ), y 2 ( t ), ..., y n ( t ) zerlegt werden , dh y ( t ) = ( y 1 ( t ), . .., j n ( t )) . Dazu gehören beispielsweise parametrische Kurven in R 2 oder R 3 . Die Koordinatenfunktionen sind reellwertige Funktionen, daher gilt für sie die obige Definition der Ableitung. Die Ableitung von y ( t ) ist definiert als der Vektor , der Tangensvektor genannt wird , dessen Koordinaten die Ableitungen der Koordinatenfunktionen sind. Das ist,

Äquivalent,

wenn die Grenze existiert. Die Subtraktion im Zähler ist die Subtraktion von Vektoren, nicht von Skalaren. Existiert die Ableitung von y für jeden Wert von t , dann ist y another eine weitere vektorwertige Funktion.

Wenn e 1 , ..., e n die Standardbasis für R n ist , dann kann y ( t ) auch als y 1 ( t ) e 1 + ⋯ + y n ( t ) e n geschrieben werden . Wenn wir annehmen, dass die Ableitung einer vektorwertigen Funktion die Linearitätseigenschaft behält , dann muss die Ableitung von y ( t )

weil jeder der Basisvektoren eine Konstante ist.

Diese Verallgemeinerung ist beispielsweise nützlich, wenn y ( t ) der Ortsvektor eines Teilchens zum Zeitpunkt t ist ; dann ist die Ableitung y ′( t ) der Geschwindigkeitsvektor des Teilchens zum Zeitpunkt t .

Teilderivate

Angenommen, f ist eine Funktion, die von mehr als einer Variablen abhängt – zum Beispiel

f kann als eine Familie von Funktionen einer Variablen interpretiert werden, die von den anderen Variablen indiziert wird:

Mit anderen Worten, jeder Wert von x wählt eine Funktion mit der Bezeichnung f x , die eine Funktion einer reellen Zahl ist. Das ist,

Sobald ein Wert von x gewählt ist, sagen wir a , dann bestimmt f ( x , y ) eine Funktion f a , die y an a 2 + ay + y 2 sendet :

In diesem Ausdruck ist a eine Konstante , keine Variable , also ist f a eine Funktion nur einer reellen Variablen. Folglich gilt die Definition der Ableitung für eine Funktion einer Variablen:

Das obige Verfahren kann für jede beliebige Auswahl von a durchgeführt werden . Das Zusammenfügen der Ableitungen zu einer Funktion ergibt eine Funktion, die die Variation von f in y- Richtung beschreibt:

Dies ist die partielle Ableitung von f nach y . Hier ist ein gerundetes d , das als partielles Ableitungssymbol bezeichnet wird . Um es vom Buchstaben d zu unterscheiden , wird ∂ manchmal "der", "del" oder "partial" anstelle von "dee" ausgesprochen.

Im Allgemeinen ist die partielle Ableitung einer Funktion f ( x 1 , …, x n ) in Richtung x i am Punkt ( a 1 , ..., a n ) definiert als:

Im obigen Differenzenquotienten werden alle Variablen außer x i fest gehalten. Diese Wahl fester Werte bestimmt eine Funktion einer Variablen

und per definitionem

Mit anderen Worten, die verschiedenen Auswahlmöglichkeiten eines Index sind eine Familie von Ein-Variablen-Funktionen wie im obigen Beispiel. Dieser Ausdruck zeigt auch, dass sich die Berechnung partieller Ableitungen auf die Berechnung von einvariablen Ableitungen reduziert.

Dies ist grundlegend für das Studium der Funktionen mehrerer reeller Variablen . Sei f ( x 1 , ..., x n ) eine solche reellwertige Funktion . Wenn alle partiellen Ableitungen f / ∂ x j von f im Punkt a = ( a 1 , ..., a n ) definiert sind, definieren diese partiellen Ableitungen den Vektor

was als Gradient von f bei a bezeichnet wird . Wenn f an jedem Punkt in einem Bereich differenzierbar ist, dann ist der Gradient eine vektorwertige Funktion f , die den Punkt ( a 1 , ..., a n ) auf den Vektor f ( a 1 , ..., ein n ) . Folglich bestimmt der Gradient ein Vektorfeld .

Richtungsderivate

Wenn f eine reellwertige Funktion auf R n ist , dann messen die partiellen Ableitungen von f seine Variation in Richtung der Koordinatenachsen. Wenn beispielsweise f eine Funktion von x und y ist , dann messen seine partiellen Ableitungen die Variation von f in x- und y- Richtung. Sie messen jedoch nicht direkt die Variation von f in eine andere Richtung, beispielsweise entlang der Diagonallinie y = x . Diese werden mit Hilfe von direktionalen Derivaten gemessen. Wähle einen Vektor

Die Richtungsableitung von f in Richtung von v im Punkt x ist der Grenzwert

In einigen Fällen kann es einfacher sein, die Richtungsableitung zu berechnen oder zu schätzen, nachdem die Länge des Vektors geändert wurde. Dies wird oft getan, um das Problem in die Berechnung einer Richtungsableitung in Richtung eines Einheitsvektors umzuwandeln. Um zu sehen, wie dies funktioniert, nehmen wir an, dass v = λ u ist, wobei u ein Einheitsvektor in Richtung von v ist . Setze h = k / λ in den Differenzenquotienten ein. Der Differenzenquotient wird zu:

Dies ist λ mal der Differenzenquotient für die Richtungsableitung von f nach u . Darüber hinaus ist das Annehmen des Grenzwerts, wenn h gegen Null geht, dasselbe wie das Annehmen des Grenzwerts, wenn k gegen Null geht, da h und k Vielfache voneinander sind. Daher D V ( f ) = λ D u ( f ) . Wegen dieser Umskalierungseigenschaft werden Richtungsableitungen häufig nur für Einheitsvektoren betrachtet.

Wenn alle partiellen Ableitungen von f existieren und in x stetig sind , dann bestimmen sie die Richtungsableitung von f in Richtung v nach der Formel:

Dies ist eine Folge der Definition der totalen Ableitung . Daraus folgt, dass die Richtungsableitung in v linear ist , was bedeutet, dass D v + w ( f ) = D v ( f ) + D w ( f ) ist .

Dieselbe Definition funktioniert auch, wenn f eine Funktion mit Werten in R m ist . Die obige Definition wird auf jede Komponente der Vektoren angewendet. In diesem Fall ist die Richtungsableitung ein Vektor in R m .

Gesamtableitung, Gesamtdifferential und Jacobi-Matrix

Wenn f eine Funktion aus einer offenen Teilmenge von R n bis R m ist , dann ist die Richtungsableitung von f in eine gewählte Richtung die beste lineare Annäherung an f an diesem Punkt und in dieser Richtung. Aber wenn n > 1 ist , kann keine einzige Richtungsableitung ein vollständiges Bild des Verhaltens von f liefern . Die totale Ableitung ergibt ein vollständiges Bild, indem alle Richtungen gleichzeitig betrachtet werden. Das heißt, für jeden Vektor v beginnend bei a gilt die lineare Näherungsformel:

Ebenso wie die einvariable Ableitung wird f  ′( a ) so gewählt, dass der Fehler in dieser Näherung möglichst klein ist.

Wenn n und m beide eins sind, dann ist die Ableitung f  ( a ) eine Zahl und der Ausdruck f  ′( a ) v ist das Produkt zweier Zahlen. Aber in höheren Dimensionen ist es unmöglich, dass f  ′( a ) eine Zahl ist. Wäre es eine Zahl, dann wäre f  ′( a ) v ein Vektor in R n , während die anderen Terme Vektoren in R m wären, und daher würde die Formel keinen Sinn ergeben. Damit die lineare Näherungsformel sinnvoll ist, muss f  ( a ) eine Funktion sein, die Vektoren in R n an Vektoren in R m schickt , und f  ′( a ) v muss diese bei v ausgewertete Funktion bezeichnen .

Um zu bestimmen, um welche Art von Funktion es sich handelt, beachte, dass die lineare Näherungsformel umgeschrieben werden kann als

Beachten Sie, dass , wenn wir einen anderen Vektor wählen w , dann ist diese Näherungsgleichungsauswahl- durch Substitution eine andere Näherungsgleichungsauswahl- bestimmt w für v . Sie bestimmt eine dritte Näherungsgleichung, indem sie sowohl w für v als auch a + v für a einsetzt . Durch Subtrahieren dieser beiden neuen Gleichungen erhalten wir

Wenn wir davon ausgehen , dass v klein ist, und dass das Derivat variiert kontinuierlich in einem , dann f  '( ein + v ) gleich etwa f  ' ( ein ) , und daher wird die rechte Seite ungefähr Null. Die linke Seite kann auf andere Weise mit der linearen Näherungsformel mit v + w anstelle von v umgeschrieben werden . Die lineare Näherungsformel impliziert:

Dies legt nahe, dass f  ′( a ) eine lineare Transformation vom Vektorraum R n in den Vektorraum R m ist . Tatsächlich ist es möglich, dies zu einer genauen Ableitung zu machen, indem der Fehler in den Näherungen gemessen wird. Nehmen Sie an, dass der Fehler in dieser linearen Näherungsformel durch eine Konstante mal || v ||, wobei die Konstante unabhängig von v ist, aber stetig von a abhängt . Dann können nach Hinzufügen eines geeigneten Fehlerterms alle der obigen angenäherten Gleichheiten als Ungleichungen umformuliert werden. Insbesondere ist f  ′( a ) eine lineare Transformation bis auf einen kleinen Fehlerterm. Im Grenzfall, da v und w gegen Null gehen, muss es sich also um eine lineare Transformation handeln. Da wir die gesamte Ableitung definieren, indem wir einen Grenzwert nehmen, wenn v gegen Null geht, muss f  ′( a ) eine lineare Transformation sein.

Bei einer Variablen wird die Tatsache, dass die Ableitung die beste lineare Näherung ist, dadurch ausgedrückt, dass sie die Grenze der Differenzenquotienten ist. Der übliche Differenzenquotient macht jedoch in höheren Dimensionen keinen Sinn, da eine Teilung von Vektoren in der Regel nicht möglich ist. Insbesondere liegen Zähler und Nenner des Differenzenquotienten nicht einmal im selben Vektorraum: Der Zähler liegt im Kobereich R m, der Nenner im Bereich R n . Darüber hinaus ist die Ableitung eine lineare Transformation, eine andere Art von Objekt sowohl vom Zähler als auch vom Nenner. Um die Idee zu verdeutlichen, dass f  ′( a ) die beste lineare Näherung ist, ist es notwendig, eine andere Formel für die einvariable Ableitung anzupassen, in der diese Probleme verschwinden. Falls f  : RR , dann kann die übliche Definition der Ableitung manipuliert werden, um zu zeigen, dass die Ableitung von f an a die eindeutige Zahl f  ′( a ) ist, so dass

Dies entspricht

denn der Grenzwert einer Funktion geht genau dann gegen Null, wenn der Grenzwert des Absolutwerts der Funktion gegen Null geht. Diese letzte Formel kann an die Situation mit vielen Variablen angepasst werden, indem die absoluten Werte durch Normen ersetzt werden .

Die Definition der totalen Ableitung von f an a lautet daher, dass es sich um die eindeutige lineare Transformation f a  ( a ) : R nR m handelt, so dass

Hier ist h ein Vektor in R n , also ist die Norm im Nenner die Standardlänge auf R n . Allerdings ist f ′( a ) h ein Vektor in R m , und die Norm im Zähler ist die Standardlänge auf R m . Wenn v ist ein Vektor , beginnend bei a , dann f  '( a ) v ist , der angerufene Pushforward von v von f und wird manchmal geschrieben f * v .

Existiert die totale Ableitung bei a , so existieren alle partiellen Ableitungen und Richtungsableitungen von f bei a , und für alle v ist f  ′( a ) v die Richtungsableitung von f in Richtung v . Wenn wir f mit Koordinatenfunktionen schreiben , so dass f = ( f 1 , f 2 , ..., f m ) ist , dann kann die totale Ableitung unter Verwendung der partiellen Ableitungen als Matrix ausgedrückt werden . Diese Matrix wird die Jacobi-Matrix von f bei a genannt :

Die Existenz der totalen Ableitung f ′( a ) ist strikt stärker als die Existenz aller partiellen Ableitungen, aber wenn die partiellen Ableitungen existieren und stetig sind, dann existiert die totale Ableitung, ist durch die Jacobi-Angabe gegeben und hängt stetig von a . ab .

Die Definition des gesamten Derivats subsumiert die Definition des Derivats in einer Variablen. Das heißt, wenn f eine reellwertige Funktion einer reellen Variablen ist, dann existiert die totale Ableitung genau dann, wenn die übliche Ableitung existiert. Die Jacobi-Matrix reduziert sich auf eine 1×1-Matrix, deren einziger Eintrag die Ableitung f ′( x ) ist. Diese 1×1-Matrix erfüllt die Eigenschaft, dass f ( a + h ) − ( f ( a ) + f  ′( a ) h ) näherungsweise null ist, mit anderen Worten, dass

Bis auf sich ändernde Variablen ist dies die Aussage, dass die Funktion die beste lineare Annäherung an f an a ist .

Die totale Ableitung einer Funktion ergibt keine andere Funktion wie der Fall mit einer Variablen. Dies liegt daran, dass die Gesamtableitung einer Funktion mit mehreren Variablen viel mehr Informationen aufnehmen muss als die Ableitung einer Funktion mit einer Variablen. Stattdessen ergibt die Gesamtableitung eine Funktion vom Tangentenbündel der Quelle zum Tangentenbündel des Ziels.

Das natürliche Analogon der totalen Ableitungen zweiter, dritter und höherer Ordnung ist keine lineare Transformation, ist keine Funktion auf dem Tangentenbündel und wird nicht durch wiederholtes Nehmen der totalen Ableitung gebildet. Das Analogon einer Ableitung höherer Ordnung, Jet genannt , kann keine lineare Transformation sein, da Ableitungen höherer Ordnung subtile geometrische Informationen wie Konkavität widerspiegeln, die nicht durch lineare Daten wie Vektoren beschrieben werden können. Es kann keine Funktion auf dem Tangentenbündel sein, da das Tangentenbündel nur Platz für den Basisraum und die Richtungsableitungen hat. Da Jets Informationen höherer Ordnung erfassen, nehmen sie als Argumente zusätzliche Koordinaten, die Richtungsänderungen höherer Ordnung darstellen. Der durch diese zusätzlichen Koordinaten bestimmte Raum wird als Strahlbündel bezeichnet . Die Beziehung zwischen der totalen Ableitung und den partiellen Ableitungen einer Funktion wird in der Beziehung zwischen dem Strahl k- ter Ordnung einer Funktion und ihren partiellen Ableitungen der Ordnung kleiner oder gleich k parallelisiert .

Durch wiederholtes Ziehen der Gesamtableitung erhält man höhere Versionen der Fréchet-Ableitung , spezialisiert auf R p . Die totale Ableitung k- ter Ordnung kann als Abbildung interpretiert werden

die einen Punkt x in R n nimmt und ihm ein Element des Raums der k -linearen Abbildungen von R n bis R m zuordnet – die "beste" (in einem gewissen präzisen Sinne) k -lineare Annäherung an f an diesem Punkt. Durch Präkomposition mit der Diagonalabbildung Δ, x → ( x , x ) kann eine verallgemeinerte Taylorreihe begonnen werden als

wobei f( a ) mit einer konstanten Funktion identifiziert wird, x ia i die Komponenten des Vektors xa sind und ( Df ) i und ( D 2 f ) jk die Komponenten von Df und D 2 f sind als linear Transformationen.

Verallgemeinerungen

Das Konzept eines Derivats kann auf viele andere Einstellungen erweitert werden. Der gemeinsame Faden ist, dass die Ableitung einer Funktion an einem Punkt als lineare Näherung der Funktion an diesem Punkt dient.

  • Eine wichtige Verallgemeinerung des Derivates betrifft komplexe Funktionen von komplexen Variablen , wie beispielsweise Funktionen von (eine Domäne in) die komplexen Zahlen C zu C . Den Begriff der Ableitung einer solchen Funktion erhält man, indem man in der Definition reelle Variablen durch komplexe Variablen ersetzt. Wenn C mit R 2 identifiziert wird, indem eine komplexe Zahl z als x + iy geschrieben wird , dann ist eine differenzierbare Funktion von C nach C sicherlich als Funktion von R 2 nach R 2 differenzierbar (in dem Sinne, dass ihre partiellen Ableitungen alle existieren), aber das Umgekehrte gilt im Allgemeinen nicht: Die komplexe Ableitung existiert nur, wenn die reelle Ableitung komplex linear ist und dies Beziehungen zwischen den partiellen Ableitungen auferlegt, die Cauchy-Riemann-Gleichungen genannt werden – siehe holomorphe Funktionen .
  • Eine andere Verallgemeinerung betrifft Funktionen zwischen differenzierbaren oder glatten Mannigfaltigkeiten . Intuitiv gesprochen ist eine solche Mannigfaltigkeit M ein Raum, der in der Nähe jedes Punktes x durch einen Vektorraum angenähert werden kann, der Tangentenraum genannt wird : das prototypische Beispiel ist eine glatte Fläche in R 3 . Die Ableitung (oder Differential) einer (differenzierbaren) Abbildung f : MN zwischen Mannigfaltigkeiten an einem Punkt x in M ist dann eine lineare Abbildung vom Tangentialraum von M bei x zum Tangentialraum von N bei f ( x ). Die Ableitungsfunktion wird zu einer Abbildung zwischen den Tangentenbündeln von M und N . Diese Definition ist in der Differentialgeometrie von grundlegender Bedeutung und hat viele Verwendungsmöglichkeiten – siehe Pushforward (Differential) und Pullback (Differentialgeometrie) .
  • Die Differenzierung kann auch für Abbildungen zwischen unendlichdimensionalen Vektorräumen wie Banach-Räumen und Fréchet-Räumen definiert werden . Es gibt eine Verallgemeinerung sowohl der gerichteten Ableitung, genannt Gateaux-Ableitung , als auch des Differentials, genannt Fréchet-Ableitung .
  • Ein Mangel der klassischen Ableitung besteht darin, dass sehr viele Funktionen nicht differenzierbar sind. Dennoch gibt es eine Möglichkeit, den Begriff der Ableitung so zu erweitern, dass alle stetigen Funktionen und viele andere Funktionen mit dem Konzept der schwachen Ableitung differenziert werden können . Die Idee ist, die stetigen Funktionen in einen größeren Raum, den sogenannten Verteilungsraum , einzubetten und nur zu verlangen, dass eine Funktion "im Durchschnitt" differenzierbar ist.
  • Die Eigenschaften der Ableitung haben die Einführung und das Studium vieler ähnlicher Objekte in Algebra und Topologie inspiriert – siehe zum Beispiel Differentialalgebra .
  • Das diskrete Äquivalent der Differentiation sind endliche Differenzen . Das Studium der Differentialrechnung wird mit der Berechnung der endlichen Differenzen in der Zeitskalenrechnung vereinheitlicht .
  • Siehe auch arithmetische Ableitung .

Geschichte

Calculus , in seiner frühen Geschichte als bekannt Infinitesimalrechnung , ist eine mathematische Disziplin konzentriert Grenzen , Funktionen , Ableitungen, Integrale und unendliche Reihe . Mitte des 17. Jahrhunderts entdeckten Isaac Newton und Gottfried Leibniz unabhängig voneinander die Infinitesimalrechnung. In einem erbitterten Streit , der bis zu ihrem Lebensende andauerte , behauptete jedoch jeder Erfinder, der andere habe seine Arbeit gestohlen .

Siehe auch

Anmerkungen

Verweise

Literaturverzeichnis

Drucken

Online-Bücher

Externe Links