Differential einer Funktion - Differential of a function

In der Analysis repräsentiert das Differential den Hauptteil der Änderung einer Funktion y  =  f ( x ) in Bezug auf Änderungen der unabhängigen Variablen. Das Differential dy ist definiert durch

wobei die Ableitung von f nach x ist und dx eine zusätzliche reelle Variable ist (so dass dy eine Funktion von x und dx ist ). Die Notation ist so, dass die Gleichung

gilt, wobei die Ableitung in der Leibniz-Notation dy / dx dargestellt wird , und dies ist konsistent damit, die Ableitung als Quotienten der Differentiale zu betrachten. Einer schreibt auch

Die genaue Bedeutung der Variablen dy und dx hängt vom Kontext der Anwendung und der erforderlichen mathematischen Genauigkeit ab. Der Bereich dieser Variablen kann eine besondere geometrische Bedeutung annehmen, wenn das Differential als eine besondere Differentialform betrachtet wird , oder eine analytische Bedeutung, wenn das Differential als lineare Annäherung an das Inkrement einer Funktion betrachtet wird. Traditionell werden die Variablen dx und dy als sehr klein ( infinitesimal ) angesehen, und diese Interpretation wird in der Nicht-Standard-Analyse streng gemacht .

Geschichte und Nutzung

Das Differential wurde zuerst über eine intuitive oder heuristische Definition von Isaac Newton eingeführt und von Gottfried Leibniz weitergeführt , der das Differential  dy als eine unendlich kleine (oder infinitesimale ) Änderung des Wertes  y der Funktion betrachtete, die einer unendlich kleinen Änderung  dx . entspricht im Argument x der Funktion  . Aus diesem Grund wird die momentane Änderungsrate von y in Bezug auf x , die der Wert der Ableitung der Funktion ist, mit dem Bruch . bezeichnet

in der sogenannten Leibniz-Notation für Ableitungen. Der Quotient dy / dx ist nicht unendlich klein; es ist vielmehr eine reelle Zahl .

Die Verwendung von Infinitesimals in dieser Form wurde vielfach kritisiert, zum Beispiel durch die berühmte Broschüre The Analyst von Bischof Berkeley. Augustin-Louis Cauchy ( 1823 ) definierte das Differential ohne Berufung auf den Atomismus der Leibnizschen Infinitesimalen. Stattdessen kehrte Cauchy in Anlehnung an d'Alembert die logische Ordnung von Leibniz und seinen Nachfolgern um: Die Ableitung selbst wurde zum fundamentalen Objekt, definiert als Grenze von Differenzenquotienten, und die Differentiale wurden dann in Bezug darauf definiert. Das heißt, eine war frei zu definieren das Differential dy durch einen Ausdruck

wobei dy und dx einfach neue Variablen sind, die endliche reelle Werte annehmen, nicht feste infinitesimale Werte, wie es bei Leibniz der Fall war.

Laut Boyer (1959 , S. 12) war Cauchys Ansatz eine bedeutende logische Verbesserung gegenüber dem infinitesimalen Ansatz von Leibniz, da die Größen dy und dx jetzt genau so manipuliert werden konnten wie alle anderen reellen Größen sinnvoll. Cauchys allgemeiner konzeptioneller Ansatz für Differentiale bleibt der Standard in modernen analytischen Behandlungen, obwohl das letzte Wort zur Strenge, einem völlig modernen Begriff der Grenze, letztendlich Karl Weierstrass zu verdanken ist .

Bei physikalischen Behandlungen, wie sie auf die Theorie der Thermodynamik angewendet werden, herrscht immer noch die infinitesimale Ansicht vor. Courant & John (1999 , S. 184) bringen die physikalische Verwendung infinitesimaler Differentiale mit ihrer mathematischen Unmöglichkeit wie folgt in Einklang. Die Differenzen stellen endliche Nicht-Null-Werte dar, die kleiner sind als der Genauigkeitsgrad, der für den speziellen Zweck, für den sie bestimmt sind, erforderlich ist. Daher müssen sich "physikalische Infinitesimals" nicht auf ein entsprechendes mathematisches Infinitesimal berufen, um einen genauen Sinn zu haben.

Nach den Entwicklungen im 20. Jahrhundert in der mathematischen Analysis und Differentialgeometrie wurde klar, dass der Begriff des Differentials einer Funktion auf verschiedene Weise erweitert werden kann. In der reellen Analysis ist es wünschenswerter, das Differential direkt als Hauptteil des Inkrements einer Funktion zu behandeln. Dies führt direkt zu der Vorstellung, dass das Differential einer Funktion an einem Punkt ein lineares Funktional eines Inkrements Δ x ist . Dieser Ansatz ermöglicht es das Differential (als lineare Karte) für eine Vielzahl von anspruchsvolleren Räumen entwickelt werden, was letztlich zu Begriffen wie der BEGRÜNDE Fréchet oder Gateaux Derivat . Ebenso ist in der Differentialgeometrie das Differential einer Funktion an einem Punkt eine lineare Funktion eines Tangentenvektors (eine "unendlich kleine Verschiebung"), die es als eine Art Eins-Form darstellt: die äußere Ableitung der Funktion. In der Nicht-Standard-Kalküle werden Differentiale als Infinitesimale betrachtet, die selbst auf eine strenge Grundlage gestellt werden können (siehe Differential (Infinitesimal) ).

Definition

Das Differential einer Funktion ƒ ( x ) an einem Punkt  x 0 .

Das Differential wird in modernen Behandlungen der Differentialrechnung wie folgt definiert. Das Differential einer Funktion f ( x ) einer einzelnen reellen Variablen x ist die Funktion df zweier unabhängiger reeller Variablen x und Δ x gegeben durch

Eines oder beide Argumente können unterdrückt werden, dh man kann df ( x ) oder einfach df sehen . Wenn y  =  f ( x ), kann das Differential auch als dy geschrieben werden . Da dx ( x , Δ x ) = Δ x ist es üblich, dx  = Δ x zu schreiben , so dass folgende Gleichheit gilt:

Dieser Begriff des Differentials ist allgemein anwendbar, wenn eine lineare Annäherung an eine Funktion gesucht wird, bei der der Wert des Inkrements Δ x klein genug ist. Genauer gesagt, wenn f eine differenzierbare Funktion bei x ist , dann ist die Differenz der y -Werte

befriedigt

wobei der Fehler ε in der Näherung εx  → 0 als Δ x  → 0 erfüllt . Mit anderen Worten, man hat die Näherungsidentität

bei dem der Fehler so klein wie gewünscht relativ zu x gemacht werden kann, indem Δ x auf ausreichend klein beschränkt wird; das heißt,

als Δ x  → 0. Aus diesem Grund ist das Differential einer Funktion als der (lineare) Hauptanteil im Inkrement einer Funktion bekannt: das Differential ist eine lineare Funktion des Inkrements Δ x , und obwohl der Fehler ε sein kann nichtlinear, tendiert es schnell gegen Null, da x gegen Null geht.

Differentiale in mehreren Variablen

Betreiber / Funktion
Differential 1: 2:

3:

Partielle Ableitung
Gesamtableitung

In Anlehnung an Goursat (1904 , I, §15) gilt für Funktionen von mehr als einer unabhängigen Variablen:

das partielle Differential von y bezüglich einer der Variablen  x 1 ist der Hauptteil der Änderung von y, die sich aus einer Änderung dx 1 in dieser einen Variablen ergibt  . Das partielle Differential ist also

unter Einbeziehung der partiellen Ableitung von y nach  x 1 . Die Summe der partiellen Differentiale bezüglich aller unabhängigen Variablen ist das totale Differential

das ist der Hauptteil der Änderung von y, die sich aus Änderungen der unabhängigen Variablen x i ergibt  .

Genauer gesagt, im Kontext der Multivariablenrechnung, nach Courant (1937b) , wenn f eine differenzierbare Funktion ist, dann ist nach der Definition der Differenzierbarkeit das Inkrement

wobei die Fehlerterme ε i gegen Null tendieren, da die Inkremente Δ x i gemeinsam gegen Null streben. Das gesamte Differential ist dann streng definiert als  

Da mit dieser Definition

hat man

Wie bei einer Variablen gilt die angenäherte Identität

bei dem der Gesamtfehler so klein wie gewünscht relativ zu gemacht werden kann, indem die Aufmerksamkeit auf ausreichend kleine Inkremente beschränkt wird.

Anwendung des Gesamtdifferentials auf die Fehlerabschätzung

Bei der Messung wird die Gesamtdifferenz verwendet , um den Fehler Δ f einer Funktion f basierend auf den Fehlern Δ x , Δ y , ... der Parameter x , y , … abzuschätzen. Angenommen, das Intervall ist kurz genug, damit die Änderung annähernd linear ist:

Δ f ( x ) = f' ( x ) × Δ x

und dass alle Variablen unabhängig sind, dann gilt für alle Variablen

Dies liegt daran, dass die Ableitung f x nach dem bestimmten Parameter x die Empfindlichkeit der Funktion f auf eine Änderung von x , insbesondere den Fehler Δ x , angibt . Da sie als unabhängig angenommen werden, beschreibt die Analyse das Worst-Case-Szenario. Es werden die Absolutwerte der Komponentenfehler verwendet, da die Ableitung nach einfacher Berechnung ein negatives Vorzeichen haben kann. Aus diesem Prinzip werden die Fehlerregeln der Summation, Multiplikation usw. abgeleitet, zB:

Sei f( a , b ) = a × b ;
Δ f = f ein Δ a + f b Δ b ; Bewertung der Derivate
Δ f = b Δ a + a Δ b ; dividieren durch f , das ist a × b
Δ f / f = Δ a / a + Δ b / b

Das heißt, bei der Multiplikation ist der relative Gesamtfehler die Summe der relativen Fehler der Parameter.

Um zu veranschaulichen, wie dies von der betrachteten Funktion abhängt, betrachten wir stattdessen den Fall, dass die Funktion f ( a , b ) = a ln b ist . Dann kann berechnet werden, dass die Fehlerschätzung

Δ f / f = Δ a / a + Δ b /( b ln b )

mit einem zusätzlichen Faktor ' ln b ', der bei einem einfachen Produkt nicht gefunden wird. Dieser zusätzliche Faktor neigt dazu, den Fehler kleiner zu machen, da ln b nicht so groß ist wie ein bloßes  b .

Differentiale höherer Ordnung

Differentiale höherer Ordnung einer Funktion y  =  f ( x ) einer einzelnen Variablen x können definiert werden über:

und allgemein,

Informell motiviert dies die Leibniz-Notation für Ableitungen höherer Ordnung

Wenn die unabhängige Variable x selbst von anderen Variablen abhängen darf, wird der Ausdruck komplizierter, da er auch Differentiale höherer Ordnung in x selbst enthalten muss. So ist zum Beispiel

und so weiter.

Ähnliche Überlegungen gelten für die Definition von Differentialen höherer Ordnung von Funktionen mehrerer Variablen. Wenn beispielsweise f eine Funktion zweier Variablen x und y ist , dann

wobei ein Binomialkoeffizient ist . Bei mehr Variablen gilt ein analoger Ausdruck, jedoch mit einer geeigneten multinomialen Erweiterung statt binomialer Erweiterung.

Auch Differentiale höherer Ordnung in mehreren Variablen werden komplizierter, wenn die unabhängigen Variablen selbst von anderen Variablen abhängen dürfen. Beispielsweise gilt für eine Funktion f von x und y, die von Hilfsvariablen abhängen darf,

Aufgrund dieser Notation wurde die Verwendung von Differentialen höherer Ordnung von Hadamard 1935 scharf kritisiert , der zu dem Schluss kam:

Enfin, que bedeuten ou que représente l'égalité
A mon avis, rien du tout.

Das heißt: Was ist schließlich mit der Gleichheit [...] gemeint oder vertreten? Meiner Meinung nach gar nichts. Trotz dieser Skepsis haben sich Differentiale höherer Ordnung als wichtiges Werkzeug in der Analyse herausgestellt.

In diesen Zusammenhängen ist das Differential n- ter Ordnung der Funktion f, das auf ein Inkrement Δ x angewendet wird, definiert durch

oder ein äquivalenter Ausdruck, wie z

wobei eine n- te Vorwärtsdifferenz mit Inkrement t Δ x ist .

Diese Definition ist auch sinnvoll, wenn f eine Funktion mehrerer Variablen ist (hier der Einfachheit halber als Vektorargument genommen). Dann ist das so definierte n- te Differential eine homogene Funktion vom Grad n im Vektorinkrement Δ x . Weiterhin ist die Taylorreihe von f im Punkt x gegeben durch

Die Gateaux-Ableitung höherer Ordnung verallgemeinert diese Überlegungen auf unendlichdimensionale Räume.

Eigenschaften

Aus den entsprechenden Eigenschaften der Ableitung, der partiellen Ableitung und der totalen Ableitung folgen auf einfache Weise eine Reihe von Eigenschaften des Differentials. Diese beinhalten:

  • Linearität : Für Konstanten a und b und differenzierbare Funktionen f und g gilt
  • Produktregel : Für zwei differenzierbare Funktionen f und g gilt

Eine Operation d mit diesen beiden Eigenschaften wird in der abstrakten Algebra als Ableitung bezeichnet . Sie implizieren die Machtregel

Darüber hinaus gelten verschiedene Formen der Kettenregel mit zunehmender Allgemeinheit:

  • Wenn y  =  f ( u ) eine differenzierbare Funktion der Variablen u und u  =  g ( x ) eine differenzierbare Funktion von x ist , dann
Heuristisch lässt sich die Kettenregel für mehrere Variablen selbst verstehen, indem man beide Seiten dieser Gleichung durch die unendlich kleine Größe dt dividiert .
  • Es gelten allgemeinere analoge Ausdrücke, bei denen die Zwischenvariablen x i von mehr als einer Variablen abhängen.

Allgemeine Formulierung

Ein konsistenter Differentialbegriff lässt sich für eine Funktion f  : R nR m zwischen zwei euklidischen Räumen entwickeln . Sei xx  ∈  R n ein Paar euklidischer Vektoren . Das Inkrement in der Funktion f ist

Existiert eine m  ×  n- Matrix A mit

in der der Vektor ε  → 0 als Δ x  → 0 gilt, dann ist f per Definition im Punkt x differenzierbar . Die Matrix A wird manchmal als Jacobi-Matrix bezeichnet , und die lineare Transformation , die dem Inkrement Δ x  ∈  R n den Vektor A Δ x  ∈ R m zuordnet,  ist in dieser allgemeinen Einstellung als Differential df ( x ) von f . bekannt am Punkt x . Dies ist genau die Fréchet-Ableitung , und die gleiche Konstruktion kann für eine Funktion zwischen beliebigen Banach-Räumen verwendet werden .

Ein weiterer fruchtbarer Gesichtspunkt besteht darin, das Differential direkt als eine Art gerichtete Ableitung zu definieren :

Dies ist der Ansatz, der bereits zur Definition von Differentialen höherer Ordnung verwendet wurde (und am ehesten der von Cauchy dargelegten Definition entspricht). Wenn t die Zeit und die x- Position repräsentiert , dann repräsentiert h eine Geschwindigkeit statt einer Verschiebung, wie wir sie bisher betrachtet haben. Dies führt zu einer weiteren Verfeinerung des Begriffs des Differentials: dass es eine lineare Funktion einer kinematischen Geschwindigkeit sein sollte. Die Menge aller Geschwindigkeiten durch einen gegebenen Raumpunkt wird als Tangentialraum bezeichnet , und daher gibt df eine lineare Funktion auf dem Tangentialraum: eine Differentialform . Mit dieser Interpretation ist das Differential von f als äußere Ableitung bekannt und hat eine breite Anwendung in der Differentialgeometrie, da der Begriff der Geschwindigkeiten und des Tangentialraums auf jeder differenzierbaren Mannigfaltigkeit Sinn macht . Wenn zusätzlich der Ausgabewert von f auch eine Position (in einem euklidischen Raum) darstellt, dann bestätigt eine Dimensionsanalyse, dass der Ausgabewert von df eine Geschwindigkeit sein muss. Behandelt man das Differential auf diese Weise, dann wird es als Pushforward bezeichnet, da es Geschwindigkeiten aus einem Quellraum in Geschwindigkeiten in einem Zielraum "schiebt".

Andere Ansätze

Obwohl die Vorstellung, ein infinitesimales Inkrement dx zu haben , in der modernen mathematischen Analysis nicht genau definiert ist , gibt es eine Vielzahl von Techniken, um das infinitesimale Differential so zu definieren, dass das Differential einer Funktion auf eine Weise gehandhabt werden kann, die nicht mit der Leibniz-Notation kollidiert . Diese beinhalten:

Beispiele und Anwendungen

Differentiale können in der numerischen Analyse effektiv verwendet werden , um die Ausbreitung experimenteller Fehler in einer Berechnung und damit die gesamte numerische Stabilität eines Problems zu untersuchen ( Courant 1937a ). Angenommen, die Variable x repräsentiert das Ergebnis eines Experiments und y ist das Ergebnis einer numerischen Berechnung, die auf x angewendet wird . Die Frage ist, inwieweit Fehler bei der Messung von x das Ergebnis der Berechnung von y beeinflussen . Wenn x bis auf Δ x seines wahren Wertes bekannt ist, dann liefert der Satz von Taylor die folgende Abschätzung des Fehlers Δ y bei der Berechnung von y :

wobei ξ = x + θ Δ x für 0 < θ < 1 ist . Wenn Δ x klein ist, ist der Term zweiter Ordnung vernachlässigbar, so dass y für praktische Zwecke durch dy = f' ( xx gut approximiert wird .

Das Differential ist oft nützlich, um eine Differentialgleichung umzuschreiben

in der Form

insbesondere wenn man die Variablen trennen möchte .

Anmerkungen

  1. ^ Für eine detaillierte historische Darstellung des Differentials siehe Boyer 1959 , insbesondere Seite 275 für Cauchys Beitrag zu diesem Thema. Eine gekürzte Darstellung erscheint in Kline 1972 , Kapitel 40.
  2. ^ Cauchy verneinte ausdrücklich die Möglichkeit tatsächlicher infinitesimaler und unendlicher Größen ( Boyer 1959 , S. 273–275) und vertrat den radikal anderen Standpunkt, dass „eine veränderliche Größe unendlich klein wird, wenn ihr Zahlenwert so unendlich klein wird wie gegen Null konvergieren" ( Cauchy 1823 , S. 12; Übersetzung von Boyer 1959 , S. 273).
  3. ^ Boyer 1959 , S. 275
  4. ^ Boyer 1959 , S. 12: "Die so definierten Differentiale sind nur neue Variablen und keine festen Infinitesimalen..."
  5. ^ Courant 1937a , II, §9: "Hier bemerken wir nur am Rande , dass es möglich ist, diese angenäherte Darstellung des Inkrements Δ y durch den linearen Ausdruck hf ( x ) zu verwenden, um eine logisch befriedigende Definition eines "Differentials" zu konstruieren, wie es insbesondere Cauchy getan hat."
  6. ^ Boyer 1959 , S. 284
  7. ^ Siehe zum Beispiel die einflussreichen Abhandlungen von Courant 1937a , Kline 1977 , Goursat 1904 und Hardy 1905 . Tertiäre Quellen für diese Definition sind auch Tolstov 2001 und Itô 1993 , §106.
  8. ^ Cauchy 1823 . Siehe zum Beispiel auch Goursat 1904 , I, §14.
  9. ^ Goursat 1904 , ich, §14
  10. ^ Insbesondere zur unendlichdimensionalen Holomorphie ( Hille & Phillips 1974 ) und zur numerischen Analysis über die Berechnung der endlichen Differenzen .
  11. ^ Goursat 1904 , ich, §17
  12. ^ Goursat 1904 , ich, §§14,16
  13. ^ Eisenbud & Harris 1998 .
  14. ^ Siehe Kock 2006 und Moerdijk & Reyes 1991 .
  15. ^ Siehe Robinson 1996 und Keisler 1986 .

Verweise

Externe Links