Asymptotische Gleichverteilungseigenschaft - Asymptotic equipartition property

In der Informationstheorie ist die asymptotische Gleichverteilungseigenschaft ( AEP ) eine allgemeine Eigenschaft der Ausgabeabtastwerte einer stochastischen Quelle . Es ist grundlegend für das Konzept der typischen Menge, das in Theorien der Datenkompression verwendet wird .

Grob gesagt besagt das Theorem, dass, obwohl es viele Ergebnisreihen gibt, die durch einen zufälligen Prozess erzeugt werden können, das tatsächlich produzierte höchstwahrscheinlich aus einer lose definierten Menge von Ergebnissen stammt, die alle ungefähr die gleiche Chance haben, das tatsächlich realisierte zu sein . (Dies ist eine Folge des Gesetzes der großen Zahlen und der ergodischen Theorie .) Obwohl es einzelne Ergebnisse gibt, die eine höhere Wahrscheinlichkeit haben als jedes Ergebnis in dieser Menge, garantiert die große Anzahl von Ergebnissen in der Menge fast, dass das Ergebnis aus dem einstellen. Eine Möglichkeit, die Eigenschaft intuitiv zu verstehen, ist das große Abweichungstheorem von Cramér , das besagt, dass die Wahrscheinlichkeit einer großen Abweichung vom Mittelwert exponentiell mit der Anzahl der Stichproben abnimmt. Solche Ergebnisse werden in der Theorie der großen Abweichungen untersucht ; intuitiv sind es die großen Abweichungen, die die Gleichverteilung verletzen würden, aber diese sind unwahrscheinlich.

Auf dem Gebiet der Pseudozufallszahlenerzeugung wird ein Kandidatengenerator von unbestimmter Qualität, dessen Ausgangssequenz nach einigen statistischen Kriterien zu weit außerhalb des typischen Satzes liegt, als nicht ausreichend zufällig abgelehnt. Obwohl die typische Menge lose definiert ist, ergeben sich daher praktische Vorstellungen bezüglich ausreichender Typizität.

Definition

Bei einem zeitdiskreten stationären ergodischen stochastischen Prozess auf dem Wahrscheinlichkeitsraum ist die asymptotische Gleichverteilungseigenschaft eine Aussage, dass

wobei oder einfach die Entropierate von bezeichnet , die für alle zeitdiskreten stationären Prozesse einschließlich der ergodischen existieren muss . Die asymptotische equipartition Eigenschaft ist für finite-wertige (dh bewiesen ) stationären ergodischen stochastischen Prozesse in der Shannon-McMillan-Breiman Theorems die Ergodentheorie und für jegliche Verwendung IId Quellen direkt mit dem Gesetz der großen Zahlen sowohl in der diskretwertige Fall (wobei ist einfach die Entropie eines Symbols) und den stetigwertigen Fall (wobei H stattdessen die differentielle Entropie ist). Die Definition der asymptotischen Gleichverteilungseigenschaft kann auch für bestimmte Klassen zeitkontinuierlicher stochastischer Prozesse erweitert werden, für die eine typische Menge für eine ausreichend lange Beobachtungszeit existiert. Die Konvergenz ist in allen Fällen fast sicher nachgewiesen .

Zeitdiskrete iid-Quellen

Gegeben ist eine iid - Quelle , die Werte im Alphabet annehmen kann , ihre Zeitreihe ist iid mit Entropie . Das schwache Gesetz der großen Zahlen ergibt die asymptotische Gleichverteilungseigenschaft mit Konvergenz der Wahrscheinlichkeit ,

da die Entropie gleich der Erwartung von ist

Das starke Gesetz der großen Zahlen behauptet die stärkere fast sichere Konvergenz,

Zeitdiskrete endlichwertige stationäre ergodische Quellen

Betrachten Sie einen endlichwertigen Stichprobenraum , dh für den zeitdiskreten stationären ergodischen Prozess , der auf dem Wahrscheinlichkeitsraum definiert ist . Die asymptotische Gleichverteilungseigenschaft für eine solche stochastische Quelle ist als das Shannon-McMillan-Breiman-Theorem bekannt , nach Claude Shannon , Brockway McMillan und Leo Breiman .


Nichtstationäre zeitdiskrete Quelle, die unabhängige Symbole erzeugt

Die Annahmen von Stationarität/Ergodizität/identischer Verteilung von Zufallsvariablen sind für die Asymptotische Gleichverteilungseigenschaft nicht unbedingt erforderlich. Tatsächlich erfordert die asymptotische Gleichverteilungseigenschaft, wie intuitiv ziemlich klar ist, nur eine Form des Gesetzes der großen Zahlen, das ziemlich allgemein ist. Der Ausdruck muss jedoch entsprechend verallgemeinert und die Bedingungen präzise formuliert werden.

Wir nehmen an, dass die Quelle unabhängige Symbole mit möglicherweise unterschiedlichen Ausgabestatistiken zu jedem Zeitpunkt produziert. Wir nehmen an, dass die Statistik des Prozesses vollständig bekannt ist, d. h. die Randverteilung des Prozesses zu jedem Zeitpunkt ist bekannt. Die gemeinsame Verteilung ist nur das Produkt der Randwerte. Dann gilt unter der Bedingung (die gelockert werden kann), dass für alle i , für einige M > 0 Folgendes gilt (AEP):

wo

Anwendungen

Die asymptotische Gleichverteilungseigenschaft für nichtstationäre zeitdiskrete unabhängige Prozesse führt uns (neben anderen Ergebnissen) zum Quellencodierungstheorem für nichtstationäre Quellen (mit unabhängigen Ausgangssymbolen) und zum Rauschkanalcodierungstheorem für nichtstationäre speicherlose Kanäle.

Zeitkontinuierliche stationäre ergodische Quellen

Zeitdiskrete Funktionen können in zeitkontinuierliche Funktionen interpoliert werden. Wenn eine solche Interpolation f ist messbar , können wir die zeitkontinuierliche stationären Prozess entsprechend als definieren . Wenn die asymptotische Gleichverteilungseigenschaft für den zeitdiskreten Prozess gilt, wie in den oben gezeigten iid- oder endlichwertigen stationären ergodischen Fällen, gilt sie automatisch für den zeitkontinuierlichen stationären Prozess, der durch eine messbare Interpolation daraus abgeleitet wird. dh

wobei n dem zeitlichen Freiheitsgrad τ entspricht . nH ( X ) / τ und H ( X ) ist die Entropie pro Zeiteinheit und pro Freiheitsgrad jeweils definiert durch Shannon .

Eine wichtige Klasse solcher zeitkontinuierlicher stationärer Prozesse ist der bandbegrenzte stationäre ergodische Prozess, wobei der Probenraum eine Teilmenge der kontinuierlichen Funktionen ist. Die asymptotische Gleichverteilungseigenschaft gilt, wenn der Prozess weiß ist, in diesem Fall sind die Zeitabtastwerte iid, oder es existiert T > 1/2 W , wobei W die nominale Bandbreite ist , so dass die T- beabstandeten Zeitabtastwerte Werte in einem endlichen . annehmen in diesem Fall haben wir den zeitdiskreten endlichwertigen stationären ergodischen Prozess.

Alle zeitinvarianten Operationen bewahren auch die asymptotische Gleichverteilungseigenschaft, Stationarität und Ergodizität, und wir können einen stationären Prozess leicht in einen instationären umwandeln, ohne die asymptotische Gleichverteilungseigenschaft zu verlieren, indem wir eine endliche Anzahl von Zeitabtastwerten im Prozess auf Null setzen.

Kategorientheorie

Eine kategorietheoretische Definition für die Gleichverteilungseigenschaft wird von Gromov gegeben . Gegeben eine Folge kartesischer Potenzen eines Maßraums P , lässt diese Folge eine asymptotisch äquivalente Folge H N homogener Maßräume zu ( dh alle Mengen haben das gleiche Maß; alle Morphismen sind invariant unter der Gruppe der Automorphismen, also Faktor als Morphismus zum Terminalobjekt ).

Das Obige erfordert eine Definition der asymptotischen Äquivalenz . Dies wird in Form einer Distanzfunktion angegeben, die angibt, wie sehr sich eine injektive Korrespondenz von einem Isomorphismus unterscheidet . Eine injektive Korrespondenz ist eine teilweise definierte Abbildung , die eine Bijektion ist ; das heißt, es ist eine Bijektion zwischen einer Teilmenge und . Dann definiere

wo | S | bezeichnet das Maß einer Menge S . Im Folgenden wird das Maß von P und Q mit 1 angenommen, so dass die Maßräume Wahrscheinlichkeitsräume sind. Dieser Abstand wird allgemein als Erdbewegungsabstand oder Wasserstein-Metrik bezeichnet .

Definiere in ähnlicher Weise

wobei als Zählmaß auf P gilt . Daher erfordert diese Definition, dass P ein endlicher Maßraum ist. Schließlich lass

Eine Folge von injektiven Korrespondenzen ist dann asymptotisch äquivalent, wenn

Bei einer zu P N asymptotisch äquivalenten homogenen Raumfolge H N kann die Entropie H ( P ) von P angenommen werden als

Siehe auch

Anmerkungen

Verweise

Zeitungsartikel

  • Claude E. Shannon. „ Eine mathematische Theorie der Kommunikation “. Bell System Technical Journal , Juli/Oktober 1948.
  • Algoet, Paul H.; Cover, Thomas M. (1988). "Ein Sandwich-Beweis des Shannon-McMillan-Breiman-Theorems" (PDF) . Die Annalen der Wahrscheinlichkeit . 16 (2): 899–909.
  • Sergio Verdu und Te Sun Han. "Die Rolle der asymptotischen Equipartition-Eigenschaft bei der rauschfreien Quellcodierung." IEEE Transactions on Information Theory , 43 (3): 847–857, 1997.

Lehrbücher