Prinzip der Gleichgültigkeit - Principle of indifference

Das Prinzip der Gleichgültigkeit (auch Prinzip der unzureichenden Vernunft genannt ) ist eine Regel für die Zuweisung epistemischer Wahrscheinlichkeiten . Das Prinzip der Gleichgültigkeit besagt, dass Agenten, wenn keine relevanten Beweise vorliegen, ihre Glaubwürdigkeit (oder „Glaubensgrade“) gleichmäßig auf alle möglichen Ergebnisse verteilen sollten, die in Betracht gezogen werden.

In der Bayes'schen Wahrscheinlichkeit ist dies der einfachste nicht informative Prior . Das Prinzip der Gleichgültigkeit ist unter der Frequenzinterpretation der Wahrscheinlichkeit bedeutungslos , bei der Wahrscheinlichkeiten eher relative Häufigkeiten als Grade des Glaubens an unsichere Sätze sind, die von Zustandsinformationen abhängig sind.

Beispiele

Die Lehrbuchbeispiele für die Anwendung des Gleichgültigkeitsprinzips sind Münzen , Würfel und Karten .

Zumindest in einem makroskopischen System muss davon ausgegangen werden, dass die physikalischen Gesetze, die das System regeln, nicht gut genug bekannt sind, um das Ergebnis vorherzusagen. Wie vor einigen Jahrhunderten von John Arbuthnot (im Vorwort von Of the Laws of Chance , 1692) beobachtet,

Es ist unmöglich, dass ein Würfel mit solch einer bestimmten Kraft und Richtung nicht auf eine so bestimmte Seite fällt, nur ich kenne nicht die Kraft und Richtung, die ihn auf eine so bestimmte Seite fallen lässt, und deshalb auch ich Nennen wir es Zufall, was nichts anderes ist als der Mangel an Kunst ...

Bei genügend Zeit und Ressourcen gibt es keinen grundsätzlichen Grund anzunehmen, dass keine angemessen genauen Messungen durchgeführt werden könnten, die eine Vorhersage des Ergebnisses von Münzen, Würfeln und Karten mit hoher Genauigkeit ermöglichen würden: Persi Diaconis 'Arbeit mit dem Münzwurf Maschinen ist ein praktisches Beispiel dafür.

Münzen

Eine symmetrische Münze hat zwei Seiten, willkürlich beschriftete Köpfe (viele Münzen haben den Kopf einer Person auf einer Seite) und Schwänze . Unter der Annahme, dass die Münze auf der einen oder anderen Seite landen muss, schließen sich die Ergebnisse eines Münzwurfs gegenseitig aus, sind erschöpfend und austauschbar. Nach dem Prinzip der Gleichgültigkeit weisen wir jedem der möglichen Ergebnisse eine Wahrscheinlichkeit von 1/2 zu.

Diese Analyse impliziert, dass die auf die Münze einwirkenden Kräfte nicht genau bekannt sind. Wenn der Impuls, der der Münze beim Start verliehen wird, mit ausreichender Genauigkeit bekannt wäre, könnte der Flug der Münze gemäß den Gesetzen der Mechanik vorhergesagt werden. Somit wird die Unsicherheit im Ergebnis eines Münzwurfs (größtenteils) aus der Unsicherheit in Bezug auf die Anfangsbedingungen abgeleitet. Dieser Punkt wird im Artikel über das Umwerfen von Münzen ausführlicher erörtert .

Würfel

Ein symmetrischer Chip hat n Flächen, die willkürlich mit 1 bis n bezeichnet sind . Eine gewöhnliche kubische Matrize hat n = 6 Flächen, obwohl eine symmetrische Matrize mit unterschiedlicher Anzahl von Flächen konstruiert werden kann; siehe Würfel . Wir gehen davon aus, dass der Würfel mit dem einen oder anderen Gesicht nach oben landet und es keine anderen möglichen Ergebnisse gibt. Unter Anwendung des Gleichgültigkeitsprinzips weisen wir jedem der möglichen Ergebnisse eine Wahrscheinlichkeit von 1 / n zu . Wie bei Münzen wird angenommen, dass die Anfangsbedingungen für das Werfen der Würfel nicht genau genug bekannt sind, um das Ergebnis gemäß den Gesetzen der Mechanik vorherzusagen. Würfel werden normalerweise so geworfen, dass sie auf einem Tisch oder einer anderen Oberfläche (n) abprallen. Diese Interaktion erschwert die Vorhersage des Ergebnisses erheblich.

Die Annahme der Symmetrie ist hier entscheidend. Angenommen, wir werden gebeten, für oder gegen das Ergebnis "6" zu wetten. Wir könnten argumentieren, dass es hier zwei relevante Ergebnisse gibt, "6" oder "nicht 6", und dass sich diese gegenseitig ausschließen und erschöpfend sind. Dies legt nahe, jedem der beiden Ergebnisse die Wahrscheinlichkeit 1/2 zuzuweisen.

Karten

Ein Standardstapel enthält 52 Karten, die jeweils auf willkürliche Weise, dh willkürlich, mit einem eindeutigen Etikett versehen sind. Wir ziehen eine Karte aus dem Stapel; Unter Anwendung des Gleichgültigkeitsprinzips weisen wir jedem der möglichen Ergebnisse eine Wahrscheinlichkeit von 1/52 zu.

Dieses Beispiel zeigt mehr als die anderen die Schwierigkeit, das Prinzip der Gleichgültigkeit in realen Situationen tatsächlich anzuwenden. Was wir wirklich mit dem Ausdruck "willkürlich angeordnet" meinen, ist einfach, dass wir keine Informationen haben, die uns dazu bringen würden, eine bestimmte Karte zu bevorzugen. In der Praxis ist dies selten der Fall: Ein neues Kartenspiel ist sicherlich nicht in beliebiger Reihenfolge, und ein Kartenspiel befindet sich auch nicht unmittelbar nach einer Kartenhand. In der Praxis mischen wir daher die Karten; Dies zerstört nicht die Informationen, die wir haben, sondern macht unsere Informationen (hoffentlich) praktisch unbrauchbar, obwohl sie im Prinzip immer noch verwendbar sind. Tatsächlich können einige erfahrene Blackjack-Spieler Asse durch das Deck verfolgen. für sie ist die Voraussetzung für die Anwendung des Gleichgültigkeitsprinzips nicht erfüllt.

Anwendung auf stetige Variablen

Eine falsche Anwendung des Gleichgültigkeitsprinzips kann leicht zu unsinnigen Ergebnissen führen, insbesondere bei multivariaten, kontinuierlichen Variablen. Ein typischer Fall von Missbrauch ist das folgende Beispiel:

  • Angenommen, in einer Box ist ein Würfel versteckt. Ein Etikett auf der Schachtel besagt, dass der Würfel eine Seitenlänge zwischen 3 und 5 cm hat.
  • Wir kennen die tatsächliche Seitenlänge nicht, können aber davon ausgehen, dass alle Werte gleich wahrscheinlich sind, und einfach den Mittelwert von 4 cm auswählen.
  • Anhand der Angaben auf dem Etikett können wir berechnen, dass die Oberfläche des Würfels zwischen 54 und 150 cm 2 liegt . Wir kennen die tatsächliche Oberfläche nicht, können aber davon ausgehen, dass alle Werte gleich wahrscheinlich sind, und einfach den Mittelwert von 102 cm 2 auswählen .
  • Anhand der Angaben auf dem Etikett können wir berechnen, dass das Volumen des Würfels zwischen 27 und 125 cm 3 liegt . Wir kennen das tatsächliche Volumen nicht, können aber davon ausgehen, dass alle Werte gleich wahrscheinlich sind, und einfach den Mittelwert von 76 cm 3 auswählen .
  • Wir sind jetzt jedoch zu dem unmöglichen Schluss gekommen, dass der Würfel eine Seitenlänge von 4 cm, eine Oberfläche von 102 cm 2 und ein Volumen von 76 cm 3 hat !

In diesem Beispiel ergeben sich widersprüchliche Schätzungen der Länge, Oberfläche und des Volumens des Würfels, weil wir für diese Parameter drei sich widersprechende Verteilungen angenommen haben: Eine gleichmäßige Verteilung für eine der Variablen impliziert eine ungleichmäßige Verteilung für die andere zwei. Im Allgemeinen gibt das Prinzip der Gleichgültigkeit nicht an, welche Variable (z. B. in diesem Fall Länge, Oberfläche oder Volumen) eine einheitliche epistemische Wahrscheinlichkeitsverteilung aufweisen soll.

Ein weiteres klassisches Beispiel für diese Art von Missbrauch ist das Bertrand-Paradoxon . Edwin T. Jaynes führte das Prinzip der Transformationsgruppen ein , die eine epistemische Wahrscheinlichkeitsverteilung für dieses Problem ergeben können. Dies verallgemeinert das Prinzip der Gleichgültigkeit, indem gesagt wird, dass man zwischen äquivalenten Problemen gleichgültig ist und nicht zwischen Sätzen gleichgültig. Dies reduziert sich immer noch auf das gewöhnliche Prinzip der Gleichgültigkeit, wenn man eine Permutation der Markierungen als Erzeugung äquivalenter Probleme betrachtet (dh unter Verwendung der Permutationstransformationsgruppe). Um dies auf das obige Kastenbeispiel anzuwenden, haben wir drei Zufallsvariablen, die durch geometrische Gleichungen verbunden sind. Wenn wir keinen Grund haben, ein Trio von Werten einem anderen vorzuziehen, müssen unsere vorherigen Wahrscheinlichkeiten durch die Regel zum Ändern von Variablen in kontinuierlichen Verteilungen in Beziehung gesetzt werden. Sei L die Länge und V das Volumen. Dann müssen wir haben

,

Wo sind die Wahrscheinlichkeitsdichtefunktionen (pdf) der angegebenen Variablen? Diese Gleichung hat eine allgemeine Lösung: wobei K eine Normalisierungskonstante ist, die durch den Bereich von L bestimmt wird , in diesem Fall gleich:

Um dies "auf die Probe zu stellen", fragen wir nach der Wahrscheinlichkeit, dass die Länge kleiner als 4 ist. Dies hat die Wahrscheinlichkeit von:

.

Für das Volumen sollte dies gleich der Wahrscheinlichkeit sein, dass das Volumen kleiner als 4 3 = 64 ist. Das PDF des Volumens ist

.

Und dann ist die Wahrscheinlichkeit eines Volumens kleiner als 64

.

Damit haben wir eine Invarianz in Bezug auf Volumen und Länge erreicht. Man kann auch die gleiche Invarianz in Bezug auf eine Oberfläche von weniger als 6 (4 2 ) = 96 zeigen. Beachten Sie jedoch, dass diese Wahrscheinlichkeitszuordnung nicht unbedingt eine "richtige" ist. Die genaue Verteilung von Längen, Volumen oder Oberfläche hängt davon ab, wie das "Experiment" durchgeführt wird.

Die grundlegende Hypothese der statistischen Physik , dass zwei beliebige Mikrozustände eines Systems mit derselben Gesamtenergie im Gleichgewicht gleich wahrscheinlich sind , ist in gewissem Sinne ein Beispiel für das Prinzip der Gleichgültigkeit. Wenn die Mikrozustände jedoch durch kontinuierliche Variablen (wie Positionen und Impulse) beschrieben werden, ist eine zusätzliche physikalische Basis erforderlich, um zu erklären, unter welcher Parametrisierung die Wahrscheinlichkeitsdichte einheitlich ist. Der Satz von Liouville rechtfertigt die Verwendung kanonisch konjugierter Variablen wie Positionen und ihrer konjugierten Impulse.

Das Wein / Wasser-Paradoxon zeigt ein Dilemma mit verknüpften Variablen und welche man wählen soll.

Geschichte

Die ursprünglichen Autoren der Wahrscheinlichkeitsrechnung, vor allem Jacob Bernoulli und Pierre Simon Laplace , betrachteten das Prinzip der Gleichgültigkeit als intuitiv offensichtlich und machten sich nicht einmal die Mühe, ihm einen Namen zu geben. Laplace schrieb:

Die Zufallstheorie besteht darin, alle Ereignisse der gleichen Art auf eine bestimmte Anzahl von Fällen zu reduzieren, die gleichermaßen möglich sind, dh auf solche, über die wir hinsichtlich ihrer Existenz gleichermaßen unentschlossen sein können, und die Anzahl der Fälle zu bestimmen günstig für das Ereignis, dessen Wahrscheinlichkeit gesucht wird. Das Verhältnis dieser Zahl zu der aller möglichen Fälle ist das Maß für diese Wahrscheinlichkeit, die somit einfach ein Bruch ist, dessen Zähler die Anzahl der günstigen Fälle und dessen Nenner die Anzahl aller möglichen Fälle ist.

Diese früheren Autoren, insbesondere Laplace, verallgemeinerten naiv das Prinzip der Gleichgültigkeit gegenüber dem Fall kontinuierlicher Parameter und gaben der sogenannten "einheitlichen vorherigen Wahrscheinlichkeitsverteilung" eine Funktion, die über alle reellen Zahlen konstant ist. Er benutzte diese Funktion, um einen völligen Mangel an Wissen über den Wert eines Parameters auszudrücken. Laut Stigler (Seite 135) war Laplace's Annahme einheitlicher vorheriger Wahrscheinlichkeiten keine metaphysische Annahme. Es war eine implizite Annahme zur Erleichterung der Analyse.

Das Prinzip der unzureichenden Vernunft war sein Vorname, der ihm von späteren Schriftstellern gegeben wurde, möglicherweise als Spiel mit Leibniz ' Prinzip der ausreichenden Vernunft . Diese späteren Schriftsteller ( George Boole , John Venn und andere) lehnten die Verwendung der Uniform aus zwei Gründen ab. Der erste Grund ist, dass die konstante Funktion nicht normalisierbar ist und somit keine richtige Wahrscheinlichkeitsverteilung darstellt. Der zweite Grund ist die Unanwendbarkeit auf kontinuierliche Variablen, wie oben beschrieben. (Allerdings können diese paradoxen Probleme gelöst werden Im ersten Fall wird ein konstanten, oder jedes allgemeinere endliches Polynom. Ist normierbare innerhalb eines endlichen Bereichs: der Bereich [0,1] ist alles , was hier zählt Alternativ kann die Funktion. außerhalb dieses Bereichs wie bei einer kontinuierlichen Gleichverteilung auf Null geändert werden . Im zweiten Fall gibt es keine Mehrdeutigkeit, vorausgesetzt, das Problem ist "gut gestellt", so dass keine ungerechtfertigten Annahmen getroffen werden können oder müssen. Dadurch wird die geeignete vorherige Wahrscheinlichkeitsdichtefunktion oder frühere Momenterzeugungsfunktion (mit entsprechend festgelegten Variablen) festgelegt, die für die Wahrscheinlichkeit selbst verwendet werden soll. Siehe das Bertrand-Paradoxon (Wahrscheinlichkeit) für einen analogen Fall.)

Das "Prinzip der unzureichenden Vernunft" wurde vom Ökonomen John Maynard Keynes  ( 1921 ) in "Prinzip der Gleichgültigkeit" umbenannt. Er achtete darauf, dass es nur gilt, wenn keine Kenntnisse vorliegen, die auf ungleiche Wahrscheinlichkeiten hinweisen.

Versuche, den Begriff auf eine festere philosophische Grundlage zu stellen, haben im Allgemeinen mit dem Konzept der Äquipossibilität begonnen und sind von diesem zur Äquiprobierbarkeit übergegangen .

Dem Prinzip der Gleichgültigkeit kann eine tiefere logische Rechtfertigung gegeben werden, indem angemerkt wird, dass äquivalenten Wissenszuständen äquivalente epistemische Wahrscheinlichkeiten zugewiesen werden sollten. Dieses Argument wurde von ET Jaynes vorgebracht : Es führt zu zwei Verallgemeinerungen, nämlich dem Prinzip der Transformationsgruppen wie im Jeffreys-Prior und dem Prinzip der maximalen Entropie .

Im Allgemeinen spricht man von nicht informativen Prioritäten .

Siehe auch

  • Bayesianische Erkenntnistheorie
  • Nachfolgeregel : Eine Formel zur Schätzung der zugrunde liegenden Wahrscheinlichkeiten bei wenigen Beobachtungen oder für Ereignisse, bei denen in (endlichen) Probendaten überhaupt keine Ereignisse beobachtet wurden

Verweise