Tweedie-Verteilung - Tweedie distribution

In Wahrscheinlichkeit und Statistik sind die Tweedie-Verteilungen eine Familie von Wahrscheinlichkeitsverteilungen, die die rein kontinuierlichen Normal- , Gamma- und inverse Gauß- Verteilungen, die rein diskrete skalierte Poisson-Verteilung und die Klasse der zusammengesetzten Poisson-Gamma- Verteilungen mit positiver Masse bei Null umfassen. sind aber ansonsten durchgehend. Tweedie-Verteilungen sind ein Spezialfall von exponentiellen Dispersionsmodellen und werden oft als Verteilungen für verallgemeinerte lineare Modelle verwendet .

Bent Jørgensen benannte die Tweedie-Verteilungen nach Maurice Tweedie , einem Statistiker und Medizinphysiker an der University of Liverpool , Großbritannien, der 1984 die erste gründliche Untersuchung dieser Verteilungen vorlegte.

Definitionen

Die (reproduktiven) Tweedie Verteilungen werden als Unterfamilie von (reproduktiven) definiert exponentieller Ausbreitungsmodelle (ED), mit einer speziellen Mittel - Varianzbeziehung. Eine Zufallsvariable Y ist Tweedie-verteilt Tw p (μ, σ 2 ) , wenn mit Mittelwert , positivem Dispersionsparameter und

wo heißt Tweedie-Leistungsparameter. Die Wahrscheinlichkeitsverteilung P θ,σ 2 auf den messbaren Mengen A , ist gegeben durch

für ein σ-endliches Maß ν λ . Diese Darstellung verwendet den kanonischen Parameter θ eines exponentiellen Disperson-Modells und die kumulierte Funktion

wo wir verwendet haben , oder gleichwertig .

Eigenschaften

Additive exponentielle Dispersionsmodelle

Die gerade beschriebenen Modelle sind in reproduktiver Form. Ein exponentielles Dispersionsmodell hat immer eine duale Form: die additive Form. Wenn Y reproduktiver, dann mit in der additiven Form ED * ( θ , λ ) für Tweedie Tw * p (μ, λ) . Additive Modelle haben die Eigenschaft, dass die Verteilung der Summe unabhängiger Zufallsvariablen,

für die Z i  ~ ED * ( θ , λ i ) mit festem θ und verschiedenen λ Mitglieder der Verteilungsfamilie mit gleichem θ sind ,

Reproduktive exponentielle Ausbreitungsmodelle

Eine zweite Klasse von exponentiellen Dispersionsmodellen existiert, bezeichnet durch die Zufallsvariable

wobei σ 2  = 1/ λ , bekannt als reproduktive exponentielle Dispersionsmodelle. Sie haben die Eigenschaft, dass für n unabhängige Zufallsvariablen Y i  ~ ED( μ , σ 2 / w i ), mit Gewichtungsfaktoren w i und

ein gewichteter Durchschnitt der Variablen ergibt,

Bei Reproduktionsmodellen gehört der gewichtete Durchschnitt unabhängiger Zufallsvariablen mit festen μ und σ 2 und verschiedenen Werten für w i zur Familie der Verteilungen mit gleichen μ und σ 2 .

Die exponentiellen Dispersionsmodelle von Tweedie sind sowohl additiv als auch reproduktiv; wir haben also die Dualitätstransformation

Skaleninvarianz

Eine dritte Eigenschaft der Tweedie-Modelle ist, dass sie skaleninvariant sind : Für ein reproduktives exponentielles Dispersionsmodell Tw p (μ, σ 2 ) und jede positive Konstante c haben wir die Eigenschaft des Abschlusses unter Skalentransformation,

Die Tweedie-Leistungsvarianzfunktion

Zur Definition der Varianzfunktion für exponentielle Dispersionsmodelle verwenden wir die Mittelwertabbildung, die Beziehung zwischen dem kanonischen Parameter θ und dem Mittelwert μ . Sie ist definiert durch die Funktion

mit kumulativer Funktion . Die Varianzfunktion V ( μ ) wird aus der Mittelwertabbildung konstruiert,

Hier bezeichnet der Minus-Exponent in τ −1 ( μ ) eher eine Umkehrfunktion als einen Kehrwert. Mittelwert und Varianz einer additiven Zufallsvariablen sind dann E( Z ) =  λμ und var( Z ) =  λV ( μ ).

Skaleninvarianz impliziert , daß die Varianz - Funktion , die die Beziehung gehorcht V ( μ ) = μ p .

Die Tweedie-Abweichung

Die Einheit deviance eine Fortpflanzungs Tweedie Verteilung ist gegeben durch

Die Tweedie-Kumulanten-Erzeugungsfunktionen

Die Eigenschaften von exponentiellen Dispersionsmodellen geben uns zwei Differentialgleichungen . Die erste setzt die Mittelwertabbildung und die Varianzfunktion miteinander in Beziehung,

Die zweite zeigt, wie die Mittelwertabbildung mit der Summenfunktion zusammenhängt ,

Diese Gleichungen können gelöst werden, um die Summenfunktion für verschiedene Fälle der Tweedie-Modelle zu erhalten. Eine kumulierte Erzeugungsfunktion (CGF) kann dann aus der kumulierten Funktion erhalten werden. Der additive CGF wird im Allgemeinen durch die Gleichung angegeben

und die reproduktive CGF von

wobei s die erzeugende Funktionsvariable ist.

Für die additiven Tweedie-Modelle haben die CGFs die Form,

und für die Fortpflanzungsmodelle,

Der Zusatzstoff und Fortpflanzungs Tweedie Modelle werden üblicherweise durch die Symbole bezeichnet Tw * p ( θ , λ ) und Tw p ( θ , σ 2 ) verbunden sind.

Die erste und zweite Ableitung der CGFs mit s  = 0 ergibt den Mittelwert bzw. die Varianz. Somit kann man bestätigen, dass sich bei den additiven Modellen die Varianz nach dem Potenzgesetz auf den Mittelwert bezieht,

Der Konvergenzsatz von Tweedie

Die exponentiellen Dispersionsmodelle von Tweedie sind aufgrund ihrer Rolle als Konvergenzschwerpunkte für eine Vielzahl statistischer Prozesse von grundlegender Bedeutung für die statistische Theorie . Jørgensen et al. haben einen Satz bewiesen, der das asymptotische Verhalten von Varianzfunktionen spezifiziert, bekannt als Tweedie-Konvergenzsatz . Dieser Satz wird technisch wie folgt formuliert: Die Einheitsvarianzfunktion ist regulär der Ordnung p bei null (oder unendlich), vorausgesetzt, dass V ( μ ) ~  c 0 μ p für μ bei Annäherung an null (oder unendlich) für alle reellen Werte von p und c 0  > 0. Dann gilt für eine Einheitsvarianzfunktion regulär der Ordnung p entweder bei Null oder Unendlich und für

für alle , und wir haben

as bzw. , wobei die Konvergenz durch Werte von c erfolgt, so dass im Bereich von θ liegt und c p −2 / σ 2 im Bereich von λ liegt . Das Modell muss unendlich teilbar sein, wenn c 2− p gegen Unendlich geht.

In nichttechnischen Begriffen impliziert dieser Satz, dass jedes exponentielle Dispersionsmodell, das asymptotisch ein Varianz-zu-Mittelwert-Potenzgesetz manifestiert, eine Varianzfunktion haben muss, die in den Anziehungsbereich eines Tweedie-Modells fällt. Fast alle Verteilungsfunktionen mit endlichen kumulativen Erzeugungsfunktionen qualifizieren sich als exponentielle Dispersionsmodelle und die meisten exponentiellen Dispersionsmodelle manifestieren Varianzfunktionen dieser Form. Daher haben viele Wahrscheinlichkeitsverteilungen Varianzfunktionen, die dieses asymptotische Verhalten ausdrücken, und die Tweedie-Verteilungen werden für eine Vielzahl von Datentypen zu Konvergenzzentren.

Verwandte Distributionen

Die Tweedie-Verteilungen umfassen eine Reihe bekannter sowie einige ungewöhnliche Verteilungen, die jeweils durch die Domäne des Indexparameters spezifiziert werden. Wir haben das

Für 0 <  p  < 1 existiert kein Tweedie-Modell. Beachten Sie, dass alle stabilen Verteilungen tatsächlich von stabilen Verteilungen erzeugt werden .

Vorkommen und Anwendungen

Die Tweedie-Modelle und das Taylorsche Potenzgesetz

Das Taylor-Gesetz ist ein empirisches Gesetz in der Ökologie , das die Varianz der Anzahl der Individuen einer Art pro Einheitsfläche des Lebensraums mit dem entsprechenden Mittelwert durch eine Potenzgesetz- Beziehung in Beziehung setzt. Für die Populationszahl Y mit Mittelwert µ und Varianz var( Y ) wird das Taylorsche Gesetz geschrieben:

wobei a und p beide positive Konstanten sind. Seit LR Taylor im Jahr 1961 dieses Gesetz beschrieben gibt es viele verschiedene Erklärungen gewesen angeboten , es zu erklären, von Tierverhalten hin, ein Random - Walk - Modell, eine stochastischen Geburt, Tod, Einwanderung und Auswanderung Modell zu Folge des Gleichgewichts und die Ungleichgewichts statistischer Mechanik . Über eine Erklärung für dieses Modell besteht kein Konsens.

Da Taylors Gesetz mathematisch identisch mit dem Varianz-zu-Mittelwert-Potenzgesetz ist, das die Tweedie-Modelle charakterisiert, schien es sinnvoll, diese Modelle und das Tweedie-Konvergenztheorem zu verwenden, um die beobachtete Häufung von Tieren und Pflanzen im Zusammenhang mit dem Taylor-Gesetz zu erklären. Der Großteil der beobachteten Werte für den Potenzgesetz-Exponenten p ist in das Intervall (1,2) gefallen, sodass die zusammengesetzte Tweedie-Poisson-Gamma-Verteilung anwendbar erscheint. Der Vergleich der empirischen Verteilungsfunktion mit der theoretischen zusammengesetzten Poisson-Gamma-Verteilung hat ein Mittel bereitgestellt, um die Konsistenz dieser Hypothese zu überprüfen.

Während herkömmliche Modelle für das Taylor-Gesetz dazu neigten, ad-hoc- Annahmen zum Verhalten von Tieren oder zur Populationsdynamik zu verwenden , würde der Konvergenzsatz von Tweedie implizieren, dass das Taylor-Gesetz aus einem allgemeinen mathematischen Konvergenzeffekt resultiert, ähnlich wie der zentrale Grenzwertsatz das Konvergenzverhalten bestimmter Arten von zufällige Daten. Tatsächlich muss jedes mathematische Modell, jede Annäherung oder Simulation, die entworfen ist, um das Taylor-Gesetz (auf der Grundlage dieses Theorems) zu liefern, zur Form der Tweedie-Modelle konvergieren.

Tweedie-Konvergenz und 1/ f- Rauschen

Rosa Rauschen oder 1/ f- Rauschen bezieht sich auf ein Rauschmuster, das durch eine Potenzgesetz-Beziehung zwischen seinen Intensitäten S ( f ) bei verschiedenen Frequenzen f gekennzeichnet ist.

wobei der dimensionslose Exponent γ ∈ [0,1]. Es kommt in einer Vielzahl von natürlichen Prozessen vor. Es gibt viele verschiedene Erklärungen für 1/ f- Rauschen, eine weit verbreitete Hypothese basiert auf der selbstorganisierten Kritikalität, bei der dynamische Systeme nahe einem kritischen Punkt angenommen werden, um skaleninvariantes räumliches und/oder zeitliches Verhalten zu zeigen.

In diesem Unterabschnitt wird ein mathematischer Zusammenhang zwischen 1/ f- Rauschen und dem Tweedie-Varianz-zu-Mittelwert-Potenzgesetz beschrieben. Zunächst müssen wir selbstähnliche Prozesse einführen : Für die Zahlenfolge

mit Mittel

Abweichungen

Abweichung

und Autokorrelationsfunktion

mit lag k , wenn die Autokorrelation dieser Folge das Langstreckenverhalten hat

für k und wobei L ( k ) eine langsam variierende Funktion bei großen Werten von k ist , wird diese Folge als selbstähnlicher Prozess bezeichnet.

Die Methode des Expandierens von Bins kann verwendet werden, um selbstähnliche Prozesse zu analysieren. Betrachten Sie einen Satz von nicht überlappenden Bins gleicher Größe, der die ursprüngliche Sequenz von N Elementen in Gruppen von m gleich großen Segmenten unterteilt ( N/m ist eine ganze Zahl), sodass neue reproduktive Sequenzen basierend auf den Mittelwerten definiert werden können:

Die aus dieser Sequenz ermittelte Varianz wird skalieren, wenn sich die Behältergröße ändert, so dass

genau dann, wenn die Autokorrelation die Grenzform hat

Man kann auch eine Menge entsprechender additiver Folgen konstruieren

basierend auf den expandierenden Behältern,

Vorausgesetzt, die Autokorrelationsfunktion zeigt das gleiche Verhalten, gehorchen die additiven Sequenzen der Beziehung

Da und Konstanten sind, bildet diese Beziehung ein Varianz-zu-Mittelwert-Potenzgesetz mit p  = 2 -  d .

Die obige bibedingte Beziehung zwischen dem Varianz-zu-Mittelwert-Potenzgesetz und der Potenzgesetz-Autokorrelationsfunktion und dem Wiener-Khinchin-Theorem implizieren, dass jede Folge, die ein Varianz-zu-Mittelwert-Potenzgesetz durch die Methode der Erweiterung von Bins aufweist, ebenfalls manifest wird 1/ f Rauschen und umgekehrt. Darüber hinaus wird das Tweedie-Konvergenztheorem aufgrund seines zentralen grenzwertartigen Effekts der Erzeugung von Verteilungen, die Varianz-zu-Mittelwert-Potenzfunktionen manifestieren, auch Prozesse erzeugen, die 1/ f- Rauschen manifestieren . Das Konvergenztheorem von Tweedie liefert somit eine alternative Erklärung für den Ursprung des 1/ f- Rauschens, basierend auf seinem zentralen grenzwertähnlichen Effekt.

So wie der zentrale Grenzwertsatz verlangt, dass bestimmte Arten von Zufallsprozessen als Fokus ihrer Konvergenz die Gaußsche Verteilung haben und somit weißes Rauschen ausdrücken , erfordert der Tweedie-Konvergenzsatz, dass bestimmte nicht-Gaußsche Prozesse als Konvergenzfokus die Tweedie-Verteilungen haben, die 1/ f Rauschen ausdrücken .

Die Tweedie-Modelle und Multifraktalität

Aus den Eigenschaften selbstähnlicher Prozesse hängt der Potenzgesetz-Exponent p  = 2 -  d mit dem Hurst-Exponenten H und der fraktalen Dimension D um

Eine eindimensionale Datenfolge von selbstähnlichen Daten kann ein Varianz-zu-Mittelwert-Potenzgesetz mit lokalen Variationen des Wertes von p und somit des Wertes von D demonstrieren . Wenn fraktale Strukturen lokale Variationen in der fraktalen Dimension aufweisen, werden sie als Multifraktale bezeichnet . Beispiele für Datensequenzen, die solche lokalen Variationen in p aufweisen, umfassen die Eigenwertabweichungen der Gaußschen Orthogonal- und Unitary-Ensembles . Die zusammengesetzte Tweedie-Poisson-Gamma-Verteilung diente dazu, Multifraktalität basierend auf lokalen Variationen des Tweedie-Exponenten α zu modellieren . Folglich kann in Verbindung mit der Variation von α dem Konvergenzsatz von Tweedie eine Rolle bei der Entstehung solcher Multifraktale zugeschrieben werden.

Es hat sich gezeigt, dass die Variation von α in bestimmten Fällen der asymmetrischen Laplace-Verteilung folgt . Es wurde gezeigt, dass diese Verteilung ein Mitglied der Familie der geometrischen Tweedie-Modelle ist, die sich als begrenzende Verteilungen in einem Konvergenzsatz für geometrische Dispersionsmodelle manifestieren.

Regionale Organdurchblutung

Der regionale Organblutfluss wurde traditionell durch die Injektion von radioaktiv markierten Polyethylen-Mikrokügelchen in den arteriellen Kreislauf von Tieren mit einer Größe beurteilt, bei der sie im Mikrokreislauf von Organen eingeschlossen werden. Das zu untersuchende Organ wird dann in gleichgroße Würfel geteilt und die Menge an radioaktiver Markierung in jedem Würfel wird durch Flüssigszintillationszählung bewertet und aufgezeichnet. Die Menge an Radioaktivität in jedem Würfel wird gemessen, um den Blutfluss durch diese Probe zum Zeitpunkt der Injektion widerzuspiegeln. Es ist möglich, benachbarte Würfel eines Organs auszuwerten, um den Blutfluss durch größere Regionen additiv zu bestimmen. Durch die Arbeit von JB Bassingthwaighte und anderen wurde ein empirisches Potenzgesetz zwischen der relativen Streuung des Blutflusses von Gewebeproben ( RD  = Standardabweichung/Mittelwert) der Masse m relativ zu Proben mit Referenzgröße abgeleitet:

Dieser Potenzgesetz-Exponent D s wurde als fraktale Dimension bezeichnet. Es kann gezeigt werden, dass das Potenzgesetz von Bassingthwaighte in direktem Zusammenhang mit dem Varianz-zu-Mittelwert-Potenzgesetz steht. Der regionale Organblutfluss kann daher durch die Poisson-Gamma-Verteilung der Tweedie-Verbindung modelliert werden., In diesem Modell könnte man annehmen, dass die Gewebeprobe eine zufällig (Poisson) verteilte Anzahl von Einschlussstellen enthält, jede mit gamma-verteiltem Blutfluss. Es wurde beobachtet, dass der Blutfluss auf dieser Mikrozirkulationsebene einer Gammaverteilung folgt, was diese Hypothese unterstützt.

Krebsmetastasen

Der "experimentelle Krebsmetastasen- Assay" hat eine gewisse Ähnlichkeit mit dem obigen Verfahren zur Messung des regionalen Blutflusses. Gruppen von syngenen und altersangepassten Mäusen werden intravenöse Injektionen von gleich großen Aliquots von Suspensionen von klonierten Krebszellen verabreicht, und dann werden nach einer bestimmten Zeit ihre Lungen entfernt und die Anzahl der Krebsmetastasen innerhalb jedes Lungenpaares gezählt. Wenn andere Gruppen von Mäusen , die mit verschiedenen Krebszelle injiziert werden Klone dann ist die Anzahl der Metastasen pro Gruppe werden in Übereinstimmung mit dem metastatischen Potentialen der Klone unterscheiden. Es ist seit langem bekannt, dass es trotz der besten Versuche, die experimentellen Bedingungen innerhalb jeder klonalen Gruppe einheitlich zu halten, beträchtliche intraklonale Variationen in der Anzahl von Metastasen pro Maus geben kann. Diese Variation ist größer als auf der Grundlage einer Poisson-Verteilung der Anzahl von Metastasen pro Maus in jedem Klon zu erwarten wäre, und wenn die Varianz der Anzahl von Metastasen pro Maus gegen den entsprechenden Mittelwert aufgetragen wurde, wurde ein Potenzgesetz gefunden.

Es wurde festgestellt, dass das Varianz-zu-Mittelwert-Potenzgesetz für Metastasen auch für spontane Mäusemetastasen und für Fallserien von menschlichen Metastasen gilt. Da hämatogene Metastasen in direktem Zusammenhang mit dem regionalen Blutfluss auftreten und videomikroskopische Studien darauf hindeuten, dass die Passage und das Einschließen von Krebszellen im Kreislauf analog zu den Mikrosphärenexperimenten erscheint, schien es plausibel vorzuschlagen, dass die Variation in der Anzahl hämatogener Metastasen die Heterogenität in regionalen Organdurchblutung. Das Blutflussmodell basierte auf der Poisson-Gamma-Verteilung der Tweedie-Verbindung, einer Verteilung, die eine kontinuierliche Zufallsvariable regelt. Aus diesem Grund wurde im Metastasenmodell angenommen, dass der Blutfluss durch diese Verteilung bestimmt wird und dass die Anzahl der regionalen Metastasen als Poisson-Prozess auftrat , dessen Intensität direkt proportional zum Blutfluss war. Dies führte zur Beschreibung der Poisson-negativen Binomialverteilung (PNB) als diskretes Äquivalent zur zusammengesetzten Tweedie-Poisson-Gamma-Verteilung. Die wahrscheinlichkeitserzeugende Funktion für die PNB-Verteilung ist

Die Beziehung zwischen Mittelwert und Varianz der PNB-Verteilung ist dann

die im Bereich vieler experimenteller Metastasierungsassays nicht vom Varianz-zu-Mittelwert-Potenzgesetz zu unterscheiden wäre. Bei spärlichen Daten würde sich diese diskrete Varianz-zu-Mittelwert-Beziehung jedoch eher wie eine Poisson-Verteilung verhalten, bei der die Varianz gleich dem Mittelwert ist.

Genomische Struktur und Evolution

Die lokale Dichte von Single Nucleotid Polymorphisms (SNPs) innerhalb des menschlichen Genoms sowie die von Genen scheint in Übereinstimmung mit dem Varianz-zu-Mittelwert-Potenzgesetz und der Tweedie-Verbindung Poisson-Gamma-Verteilung zu gruppieren. Im Fall von SNPs spiegelt ihre beobachtete Dichte die Bewertungstechniken, die Verfügbarkeit genomischer Sequenzen für die Analyse und die Nukleotid-Heterozygotie wider . Die ersten beiden Faktoren spiegeln Erfassungsfehler wider, die den Sammelmethoden innewohnen, letzterer Faktor spiegelt eine intrinsische Eigenschaft des Genoms wider.

Im koaleszenten Modell der Populationsgenetik hat jeder genetische Locus seine eigene einzigartige Geschichte. Innerhalb der Evolution einer Population von einigen Arten könnten einige genetische Loci vermutlich auf einen relativ neuen gemeinsamen Vorfahren zurückgeführt werden, während andere Loci möglicherweise ältere Genealogien haben . Ältere Genomsegmente hätten mehr Zeit gehabt, SNPs zu akkumulieren und Rekombination zu erfahren . RR Hudson hat ein Modell vorgeschlagen, bei dem die Rekombination für verschiedene genomische Segmente Variationen in der Zeit bis zum häufigsten kürzlichen Vorfahren verursachen könnte . Eine hohe Rekombinationsrate könnte dazu führen, dass ein Chromosom eine große Anzahl kleiner Segmente mit weniger korrelierten Genealogien enthält.

Unter der Annahme einer konstanten Hintergrundmutationsrate würde sich die Anzahl der SNPs pro Genomsegment proportional zur Zeit bis zum letzten gemeinsamen Vorfahren akkumulieren. Die gegenwärtige Theorie der Populationsgenetik würde darauf hinweisen, dass diese Zeiten im Durchschnitt gamma-verteilt sind. Die Poisson-Gamma-Verteilung der Tweedie-Verbindung würde ein Modell nahelegen, bei dem die SNP-Karte aus mehreren kleinen genomischen Segmenten bestehen würde, wobei die durchschnittliche Anzahl von SNPs pro Segment gemäß dem Modell von Hudson gammaverteilt wäre.

Die Verteilung der Gene innerhalb des menschlichen Genoms zeigte auch ein Potenzgesetz von Varianz zu Mittelwert, wenn die Methode der Binserweiterung verwendet wurde, um die entsprechenden Varianzen und Mittelwerte zu bestimmen. In ähnlicher Weise wurde festgestellt, dass die Anzahl der Gene pro Aufzählungsklasse einer Poisson-Gamma-Verteilung von Tweedie-Verbindungen entspricht. Diese Wahrscheinlichkeitsverteilung wurde als kompatibel mit zwei verschiedenen biologischen Modellen erachtet: dem Mikroanordnungsmodell, bei dem die Anzahl der Gene pro Einheit genomischer Länge durch die Summe einer zufälligen Anzahl kleinerer genomischer Segmente bestimmt wurde, die durch zufälliges Aufbrechen und Rekonstruktion von Protochormosomen abgeleitet wurden. Es wird angenommen, dass diese kleineren Segmente im Durchschnitt eine gammaverteilte Anzahl von Genen tragen.

Im alternativen Gencluster-Modell würden die Gene zufällig innerhalb der Protochromosomen verteilt. Über große evolutionäre Zeitskalen würden Tandem-Duplikationen , Mutationen, Insertionen, Deletionen und Neuanordnungen auftreten , die die Gene durch einen stochastischen Geburts-, Todes- und Einwanderungsprozess beeinflussen könnten , um die Tweedie-Verbindung Poisson-Gamma-Verteilung zu ergeben.

Beide Mechanismen würden neutrale evolutionäre Prozesse implizieren , die zu einer regionalen Häufung von Genen führen würden.

Zufallsmatrixtheorie

Das Gaußsche Einheitsensemble (GUE) besteht aus komplexen Hermiteschen Matrizen , die unter Einheitstransformationen invariant sind , während das Gaußsche Orthogonale Ensemble (GOE) aus reellen symmetrischen Matrizen besteht, die unter Orthogonaltransformationen invariant sind . Die Rangeigenwerte E n aus diesen Zufallsmatrizen obey Wigners halbkreisförmiger Verteilung : Für eine N × N Matrix , die die Durchschnittsdichte für die Eigenwerte der Größe E wird

als E → ∞ . Die Integration der Halbkreisregel liefert die Anzahl der Eigenwerte im Mittel kleiner als E ,

Die geordneten Eigenwerte können mit der Gleichung . entfaltet oder renormiert werden

Dadurch wird der Trend der Sequenz aus dem fluktuierenden Teil entfernt. Betrachten wir den absoluten Wert der Differenz zwischen der tatsächlichen und der erwarteten kumulierten Anzahl von Eigenwerten

wir erhalten eine Folge von Eigenwertfluktuationen, die unter Verwendung der Methode der Binserweiterung ein Varianz-zu-Mittel-Potenzgesetz aufzeigt. Die Eigenwertfluktuationen sowohl des GUE als auch des GOE manifestieren dieses Potenzgesetz mit den Potenzgesetz-Exponenten im Bereich zwischen 1 und 2, und sie manifestieren in ähnlicher Weise 1/ f- Rauschspektren. Diese Eigenwertfluktuationen entsprechen auch der zusammengesetzten Tweedie-Poisson-Gamma-Verteilung und weisen Multifraktalität auf.

Die Verteilung der Primzahlen

Die zweite Chebyshev-Funktion ψ ( x ) ist gegeben durch

wobei die Summation über alle Primzahlpotenzen erstreckt sich von nicht mehr als  x , x läuft über die positiven reellen Zahlen, und ist die Funktion von Mangoldt . Die Funktion ψ ( x ) ist mit der Primzahlzählfunktion π ( x ) verwandt und liefert als solche Informationen bezüglich der Verteilung der Primzahlen unter den reellen Zahlen. Sie ist asymptotisch zu  x , eine Aussage äquivalent zum Primzahlensatz und es kann auch gezeigt werden, dass sie auf die Nullstellen der Riemannschen Zetafunktion auf dem kritischen Streifen ρ bezogen ist , wobei der Realteil der Zetanullstelle ρ zwischen 0 . liegt und 1. Dann kann ψ ausgedrückt für x größer als eins geschrieben werden:

wo

Die Riemannsche Hypothese besagt, dass die nichttrivialen Nullstellen der Riemannschen Zetafunktion alle den Realteil ½ haben. Diese Nullstellen der Zetafunktion beziehen sich auf die Verteilung von Primzahlen . Schönfeld hat gezeigt, dass wenn die Riemannsche Hypothese wahr ist, dann

für alle . Wenn wir die Tschebyscheff-Abweichungen Δ( n ) an den ganzen Zahlen n unter Verwendung der Methode der Erweiterung von Bins analysieren und die Varianz gegen den Mittelwert auftragen, kann ein Varianz-zu-Mittelwert-Potenzgesetz demonstriert werden. Darüber hinaus entsprechen diese Abweichungen der Tweedie-Compound-Poisson-Gamma-Verteilung und weisen 1/ f- Rauschen auf.

Andere Anwendungen

Zu den Anwendungen von Tweedie-Distributionen gehören:

  • versicherungsmathematische Studien
  • Assay-Analyse
  • Überlebensanalyse
  • Ökologie
  • Analyse des Alkoholkonsums britischer Teenager
  • medizinische Anwendungen
  • Gesundheitsökonomie
  • Meteorologie und Klimatologie
  • Fischerei
  • Mertens-Funktion
  • selbstorganisierte Kritikalität

Verweise

Weiterlesen

  • Dunn, PK; Smyth, GK (2018). Verallgemeinerte lineare Modelle mit Beispielen in R . New York: Springer. doi : 10.1007/978-1-4419-0118-7 . ISBN 978-1-4419-0118-7. Kapitel 12 befasst sich mit Tweedie-Distributionen und -Modellen.
  • Kaas, R. (2005). "Compound Poisson Distribution and GLM's – Tweedie's Distribution" . In Proceedings of the Contact Forum "3rd Actuarial and Financial Mathematics Day" , Seiten 3–12. Brüssel: Königlich Flämische Akademie von Belgien für Wissenschaft und Kunst.
  • Tweedie, MCK (1956). „Einige statistische Eigenschaften von inversen Gaußschen Verteilungen“. Virginia J.Sci . Neue Serien. 7 : 160–165.