Kombination - Combination

In der Mathematik ist eine Kombination eine Auswahl von Elementen aus einer Sammlung, sodass die Reihenfolge der Auswahl keine Rolle spielt (im Gegensatz zu Permutationen ). Bei drei Früchten, zum Beispiel einem Apfel, einer Orange und einer Birne, gibt es drei Kombinationen von zwei, die aus diesem Set gezogen werden können: ein Apfel und eine Birne; ein Apfel und eine Orange; oder eine Birne und eine Orange. Formal eine k - Kombination eines Satz S ist eine Teilmenge von k verschiedenen Elementen von S . Wenn die Menge n Elemente hat, ist die Anzahl der k -Kombinationen gleich dem Binomialkoeffizienten

die mit Fakultäten als wann geschrieben werden kann und die null ist, wenn . Die Menge aller k- Kombinationen einer Menge S wird oft mit bezeichnet .

Kombinationen beziehen sich auf die Kombination von n Dingen, die k gleichzeitig ohne Wiederholung genommen werden. Um auf Kombinationen , bei denen Wiederholung erlaubt ist, die Bedingungen k -auswahl, k - multiset oder k -combination mit Wiederholung wird oft verwendet. Wenn es im obigen Beispiel möglich wäre, zwei von einer Obstsorte zu haben, gäbe es 3 weitere 2-Auswahlen: eine mit zwei Äpfeln, eine mit zwei Orangen und eine mit zwei Birnen.

Obwohl das Set aus drei Früchten klein genug war, um eine vollständige Liste von Kombinationen zu schreiben, wird dies mit zunehmender Größe des Sets unpraktisch. Zum Beispiel kann eine Pokerhand als eine 5-Kombination ( k  = 5) von Karten aus einem 52-Karten-Deck ( n  = 52) beschrieben werden. Die 5 Karten der Hand sind alle unterschiedlich und die Reihenfolge der Karten in der Hand spielt keine Rolle. Es gibt 2.598.960 solcher Kombinationen, und die Chance, eine beliebige Hand zufällig zu ziehen, beträgt 1 / 2.598.960.

Anzahl k -Kombinationen

3-elementige Teilmengen einer 5-elementigen Menge

Die Anzahl der k- Kombinationen aus einer gegebenen Menge S von n Elementen wird in elementaren kombinatorischen Texten oft mit , oder durch eine Variation wie , , , oder sogar bezeichnet (letztere Form ist Standard im Französischen, Rumänischen, Russischen, Chinesischen und Polnischen) Texte). Dieselbe Zahl kommt jedoch in vielen anderen mathematischen Kontexten vor, wo sie mit bezeichnet wird (oft gelesen als „ n wähle k “); insbesondere tritt er als Koeffizient in der Binomialformel auf , daher der Name Binomialkoeffizient . Man kann für alle natürlichen Zahlen k auf einmal definieren durch die Beziehung

woraus klar ist, dass

und weiter,

für k  >  n .

Um zu sehen, dass diese Koeffizienten k -Kombinationen aus S zählen , kann man zunächst eine Sammlung von n verschiedenen Variablen X s betrachten, die durch die Elemente s von S gekennzeichnet sind , und das Produkt über alle Elemente von  S entwickeln :

es hat 2 n verschiedene Terme, die allen Teilmengen von S entsprechen , wobei jede Teilmenge das Produkt der entsprechenden Variablen X s ergibt . Setzt man nun alle X s gleich der unbeschrifteten Variablen X , so dass das Produkt zu (1 + X ) n wird , wird der Term für jede k- Kombination aus S zu X k , so dass der Koeffizient dieser Potenz im Ergebnis gleich ist die Anzahl solcher k- Kombinationen.

Binomialkoeffizienten können auf verschiedene Weise explizit berechnet werden. Um sie alle für die Erweiterungen bis (1 + X ) n zu erhalten , kann man (zusätzlich zu den bereits gegebenen Grundfällen) die Rekursionsrelation

für 0 < k < n , was folgt aus (1 + X ) n = (1 + X ) n − 1 (1 + X ) ; Dies führt zur Konstruktion des Pascalschen Dreiecks .

Zur Bestimmung eines individuellen Binomialkoeffizienten ist es praktischer, die Formel zu verwenden

.

Der Zähler gibt die Anzahl der k- Permutationen von n an , dh von Folgen von k verschiedenen Elementen von S , während der Nenner die Anzahl solcher k- Permutationen angibt, die die gleiche k- Kombination ergeben, wenn die Reihenfolge ignoriert wird.

Wenn k n /2 überschreitet , enthält die obige Formel Faktoren, die Zähler und Nenner gemeinsam haben, und deren Auslöschung ergibt die Beziehung

für 0 kn . Dies drückt eine Symmetrie aus, die aus der Binomialformel ersichtlich ist und auch als k -Kombinationen verstanden werden kann, indem man das Komplement einer solchen Kombination nimmt, das eine ( nk ) -Kombination ist.

Schließlich gibt es eine Formel, die diese Symmetrie direkt zeigt und den Vorteil hat, dass sie leicht zu merken ist:

wo n ! bezeichnet die Fakultät von n . Sie wird aus der vorherigen Formel erhalten, indem Nenner und Zähler mit ( nk ) ! multipliziert werden , daher ist sie rechnerisch sicherlich weniger effizient als diese Formel.

Die letzte Formel kann direkt verstanden werden, indem man die n ! Permutationen aller Elemente von S . Jede solche Permutation ergibt eine k- Kombination durch Auswahl ihrer ersten k Elemente. Es gibt viele doppelte Auswahlen: Jede kombinierte Permutation der ersten k Elemente untereinander und der letzten ( n  −  k ) Elemente untereinander ergibt dieselbe Kombination; dies erklärt die Division in der Formel.

Aus den obigen Formeln folgen Beziehungen zwischen benachbarten Zahlen im Pascalschen Dreieck in allen drei Richtungen:

.

Zusammen mit den Grundfällen erlauben diese die sukzessive Berechnung von jeweils allen Anzahlen von Kombinationen aus derselben Menge (eine Reihe im Pascalschen Dreieck), von k- Kombinationen von Mengen wachsender Größe und von Kombinationen mit einem Komplement fester Größe nk .

Beispiel für Zählkombinationen

Als konkretes Beispiel kann man die Anzahl der möglichen Fünf-Karten-Hände aus einem Standard-Zwei-Karten-Deck wie folgt berechnen:

Alternativ kann man die Formel als Fakultäten verwenden und die Faktoren im Zähler gegen Teile der Faktoren im Nenner annullieren, wonach nur die restlichen Faktoren multipliziert werden müssen:

Eine andere alternative Berechnung, die der ersten äquivalent ist, basiert auf dem Schreiben

was gibt

.

Bei Auswertung in der folgenden Reihenfolge 52 1 × 51 ÷ 2 × 50 ÷ 3 × 49 ÷ 4 × 48 ÷ 5 kann dies nur mit ganzzahliger Arithmetik berechnet werden. Der Grund dafür ist, dass bei jeder Division das erzeugte Zwischenergebnis selbst ein Binomialkoeffizient ist, so dass niemals Reste auftreten.

Die Verwendung der symmetrischen Formel in Bezug auf Fakultäten ohne Vereinfachungen ergibt eine ziemlich umfangreiche Berechnung:

Aufzählen k -Kombinationen

Man kann alle k- Kombinationen einer gegebenen Menge S von n Elementen in einer festen Reihenfolge aufzählen , die eine Bijektion aus einem Intervall ganzer Zahlen mit der Menge dieser k- Kombinationen herstellt. Unter der Annahme, dass S selbst geordnet ist, zum Beispiel S = { 1, 2, …, n }, gibt es zwei natürliche Möglichkeiten, seine k -Kombinationen zu ordnen: indem man zuerst ihre kleinsten Elemente vergleicht (wie in den Abbildungen oben) oder indem man ihre größten vergleicht Elemente zuerst. Die letztere Option hat den Vorteil, dass das Hinzufügen eines neuen größten Elements zu S den Anfangsteil der Aufzählung nicht ändert, sondern nur die neuen k- Kombinationen der größeren Menge nach den vorherigen hinzufügt. Durch Wiederholung dieses Vorgangs kann die Aufzählung mit k- Kombinationen immer größerer Mengen unbegrenzt erweitert werden . Wenn außerdem die Intervalle der ganzen Zahlen bei 0 beginnen, dann kann die k- Kombination an einer gegebenen Stelle i in der Aufzählung leicht aus i berechnet werden , und die so erhaltene Bijektion ist als kombinatorisches Zahlensystem bekannt . Es wird in der Computermathematik auch als "Rang"/"Ranking" und "Unranking" bezeichnet.

Es gibt viele Möglichkeiten, k- Kombinationen aufzuzählen . Eine Möglichkeit besteht darin, alle Binärzahlen kleiner als 2 n zu besuchen . Wählen Sie die Zahlen mit k Nicht-Null-Bits, obwohl dies selbst für kleine n sehr ineffizient ist (z. B. würde n = 20 das Besuchen von etwa einer Million Zahlen erfordern, während die maximale Anzahl zulässiger k Kombinationen für k = 10 etwa 186.000 beträgt ). Die Positionen dieser 1-Bits in einer solchen Zahl sind eine spezifische k- Kombination der Menge { 1, …, n }. Eine andere einfache und schnellere Möglichkeit besteht darin, k Indexnummern der ausgewählten Elemente zu verfolgen , beginnend mit {0 .. k −1} ( nullbasiert ) oder {1 .. k } ( einsbasiert ) als erste erlaubte k -Kombination und dann wiederholtes Wechseln zur nächsten zulässigen k- Kombination durch Inkrementieren der letzten Indexnummer, wenn sie kleiner als n -1 ( nullbasiert ) oder n ( einsbasiert ) oder die letzte Indexzahl x ist, die kleiner als die Indexzahl ist danach minus eins, wenn ein solcher Index existiert und die Indexnummern nach x auf { x +1, x +2, …} zurücksetzen .

Anzahl Kombinationen mit Wiederholung

A k - Kombination mit Wiederholungen oder k - multicombination oder multisubset der Größe k von einem Satz S von einem Satz gegeben ist k nicht notwendigerweise verschiedene Elemente von S , wobei genommen , um nicht berücksichtigt: zwei Sequenzen definieren , die gleiche multiset wenn das eine kann aus dem anderen durch Vertauschen der Begriffe gewonnen werden. Mit anderen Worten, es ist eine Stichprobe von k Elementen aus einer Menge von n Elementen, die Duplikate (dh mit Ersetzung) zulässt, aber unterschiedliche Reihenfolgen außer Acht lässt (zB {2,1,2} = {1,2,2}). Verknüpfen Sie einen Index für jedes Element von S und denken Sie an die Elemente von S als Typen von Objekten, dann können wir lassen bezeichnen die Anzahl der Elemente vom Typ i in einem multisubset. Die Anzahl der Multiteilmengen der Größe k ist dann die Anzahl der nichtnegativen ganzzahligen Lösungen der diophantischen Gleichung :

Wenn S besitzt n Elemente, die Anzahl solcher k ist -multisubsets gekennzeichnet durch,

eine Notation, die dem analog ist Binomialkoeffizient die zählt k -subsets. Dieser Ausdruck, n multichoose k , kann auch als Binomialkoeffizienten angegeben werden:

Dieser Zusammenhang lässt sich leicht anhand einer als Sterne und Balken bekannten Darstellung nachweisen .

Nachweisen

Eine Lösung der obigen diophantischen Gleichung kann durch Sterne , ein Trennzeichen (ein Balken ), dann mehr Sterne, ein weiteres Trennzeichen usw. dargestellt werden. Die Gesamtzahl der Sterne in dieser Darstellung ist k und die Anzahl der Balken ist n - 1 (da eine Trennung in n Teile n-1 Trennzeichen benötigt). Somit entspricht eine Kette von k + n – 1 Symbolen (Sternen und Balken) einer Lösung, wenn die Kette k Sterne enthält. Jede Lösung kann dargestellt werden, indem man k aus k + n − 1 Positionen wählt , um Sterne zu platzieren und die verbleibenden Positionen mit Balken zu füllen. Zum Beispiel kann die Lösung der Gleichung dargestellt werden durch

Die Anzahl solcher Strings ist die Anzahl der Möglichkeiten, 10 Sterne an 13 Positionen zu platzieren, was der Anzahl der 10 Multisubsets einer Menge mit 4 Elementen entspricht.
Bijektion zwischen 3 Teilmengen einer 7er-Menge (links) und 3er-Multimengen mit Elementen aus einer 5er-Menge (rechts).
Dies veranschaulicht das .

Wie bei Binomialkoeffizienten gibt es mehrere Beziehungen zwischen diesen Mehrfachauswahl-Ausdrücken. Zum Beispiel für ,

Diese Identität ergibt sich aus dem Vertauschen der Sterne und Balken in der obigen Darstellung.


Beispiel für das Zählen von Multisubsets

Wenn Sie beispielsweise vier Donuts ( n  = 4) auf einem Menü zur Auswahl haben und drei Donuts ( k  = 3) möchten , kann die Anzahl der Möglichkeiten zur Auswahl der Donuts mit Wiederholung berechnet werden als

Dieses Ergebnis kann verifiziert werden, indem alle 3-Multiteilmengen der Menge S = {1,2,3,4} aufgelistet werden . Dies wird in der folgenden Tabelle angezeigt. Die zweite Spalte listet die tatsächlich gewählten Donuts auf, die dritte Spalte zeigt die nichtnegativen ganzzahligen Lösungen der Gleichung und die letzte Spalte zeigt die Sterne und Balken, die die Lösungen darstellen.

Nein. 3-Multiset Gl. Lösung Sterne und Bars
1 {1,1,1} [3,0,0,0]
2 {1,1,2} [2,1,0,0]
3 {1,1,3} [2,0,1,0]
4 {1,1,4} [2,0,0,1]
5 {1,2,2} [1,2,0,0]
6 {1,2,3} [1,1,1,0]
7 {1,2,4} [1,1,0,1]
8 {1,3,3} [1,0,2,0]
9 {1,3,4} [1,0,1,1]
10 {1,4,4} [1,0,0,2]
11 {2,2,2} [0,3,0,0]
12 {2,2,3} [0,2,1,0]
13 {2,2,4} [0,2,0,1]
14 {2,3,3} [0,1,2,0]
fünfzehn {2,3,4} [0,1,1,1]
16 {2,4,4} [0,1,0,2]
17 {3,3,3} [0,0,3,0]
18 {3,3,4} [0,0,2,1]
19 {3,4,4} [0,0,1,2]
20 {4,4,4} [0,0,0,3]

Anzahl der k -Kombinationen für alle k

Die Anzahl der k -Kombinationen für alle k ist die Anzahl der Teilmengen einer Menge von n Elementen. Es gibt mehrere Möglichkeiten, um zu sehen, dass diese Zahl 2 n ist . In Kombinationen ausgedrückt , ist dies die Summe der n- ten Reihe (von 0 gezählt) der Binomialkoeffizienten im Pascal-Dreieck . Diese Kombinationen (Teilmengen) werden durch die 1 Ziffern der Menge der Basis-2- Zahlen aufgezählt, die von 0 bis 2 n  − 1 zählen, wobei jede Ziffernposition ein Element aus der Menge von n ist .

Bei 3 Karten mit den Nummern 1 bis 3 gibt es 8 verschiedene Kombinationen ( Teilmengen ), einschließlich der leeren Menge :

Diese Teilmengen (in derselben Reihenfolge) als Zahlen zur Basis 2 darstellen:

0 – 000
1 – 001
2 – 010
3 – 011
4 – 100
5 – 101
6 – 110
7 – 111

Wahrscheinlichkeit: Stichproben einer zufälligen Kombination

Es gibt verschiedene Algorithmen , um eine zufällige Kombination aus einer bestimmten Menge oder Liste auszuwählen. Die Ablehnungsstichprobe ist bei großen Stichprobengrößen extrem langsam. Eine Möglichkeit, eine k- Kombination effizient aus einer Population der Größe n auszuwählen, besteht darin, über jedes Element der Population zu iterieren und bei jedem Schritt dieses Element mit einer sich dynamisch ändernden Wahrscheinlichkeit von auszuwählen . (siehe Reservoir-Probenahme ).

Siehe auch

Anmerkungen

Verweise

Externe Links