Wir haben bislang Zufallsexperimente kennen gelernt, bei denen die Wahrscheinlichkeiten der einzelnen Ergebnisse empirisch bestimmt werden mussten (z.B. Würfeln mit Lego-Stein) oder bei denen die Wahrscheinlichkeit des einzelnen Ergebnis durch eine Regelmäßigkeit im Experiment rechnerisch bestimmt werden konnte (Laplace).
Wurden diese Experimente wiederholt, so konnten sich die Wahrscheinlichkeiten ändern (Ziehen ohne zurücklegen) oder sie bleiben bei jeder Wiederholung gleich (Ziehen mit Zurücklegen).
Die Anzahl der möglichen Ergebnisse auf einer Stufe war nicht begrenzt, bei der Münze waren es zwei, beim normalen Würfel 6, beim Ikosaeder wären es 20.
Ein Bernoulli-Versuch wird grundsätzlich so formuliert, dass nur zwei Ergebnisse möglich sind: Erfolg oder Misserfolg.1) Nur wenn sich bei Wiederholung die Wahrscheinlichkeiten für Erfolg und Misserfolg nicht ändern, spricht man von einem Bernoulli-Versuch.
Das mehrfache Werfen einer Münze wäre also ein Bernoulli-Versuch, das mehrfache Würfeln nur dann, wenn man die sechs möglichen Würfelergebnisse in Erfolgs-Ergebnisse und Misserfolgs-Ergebnisse unterteilt. Ein Urnenexperiment ist schließlich nur dann ein Bernoulli-Versuch, wenn die gezogenen Kugel jedesmal zurückgelegt wird.
Die Ereignisse eines mehrfach wiederholten, also n-stufigen, Bernoulliversuchs lassen sich gut mit Hilfe eines Baumdiagramms darstellen.
Die Binomialverteilung ist die Wahrscheinlichkeitsverteilung eines (n-stufigen) Bernoulliversuchs.
Da der Bernoulli-Versuch nur zwei Ergebnisse kennt, sind zunächst auch nur zwei Wahrscheinlichlkeiten zu berücksichtigen, $P(Erfolg) = p$, $P(Misserfolg) = q = 1-p$.
Auf jeder Stufe kann nun Erfolg oder Misserfolg eintreten - die Binomialverteilung gibt dann die Wahrscheinlichkeit von $k$ Erfolgen bei $n$ Stufen an.
Denkt man an das Baumdiagramm, so muss man nun die einzelnen Pfadwahrscheinlichkeiten bestimmen und anschließend die Pfade mit gleicher Erfolgsanzahl addieren, um die Wahrscheinlichkeit des Ereignisses „k Erfolge bei n Wiederholungen“ zu bestimmen.
n Erfolge bei n Wiederholungen (also kein Misserfolg): $P(X=n) = p^n$
0 Erfolge bei n Wiederholungen (also n Misserfolge): $P(X=0) = q^n$
In beiden Fällen ist im Baumdiagramm nur ein Pfad vorhanden - in allen anderen Fällen gibt es mehrere Pfade.
1 Erfolg bei n Wiederholungen: Die Wahrscheinlichkeit jeden einzelnen Pfades ist $p^1~ q^{n-1}$. Der eine Erfolg könnte auf jeder Stufe auftreten, also gibt es $n$ Pfade.
Damit ergibt sich $P(X=1) = n~ p^1~ q^{n-1}$.
2 Erfolge bei n Wiederholungen: Die Wahrscheinlichkeit jeden einzelnen Pfades ist $p^2~ q^{n-2}$. Für den ersten Erfolg gibt es $n$ Möglichkeiten, auf welcher Stufe er auftritt, für den zweiten Erfolg dann noch $n-1$. Da es egal ist, in welcher Reihenfolge die beiden Erfolge auftreten, muss man noch durch 2 teilen.
Damit ergibt sich $P(X=2) = \frac{n (n-1)}{2}~ p^2~ q^{n-2}$.
3 Erfolge bei n Wiederholungen: Die Wahrscheinlichkeit jeden einzelnen Pfades ist $p^3~q{n-3}$. Für den ersten Erfolg gibt es $n$ Möglichkeiten, auf welcher Stufe er auftritt, für den zweiten Erfolg dann noch $n-1$, für den dritten $n-2$. Da es egal ist, in welcher Reihenfolge die drei Erfolge auftreten, muss man noch durch $3 \cdot 2 = 6$ teilen (einer der Erfolge könnte als erste, zweiter oder dritter kommen, der nächste hat nur noch zwei Möglichkeiten).
Damit ergibt sich $P(X=3) = \frac{n (n-1)(n-2)}{3 \cdot 2}~ p^3~ q^{n-3}$.
Langsam könnte euch der Term, mit dem man die Anzahl der Pfade berechnet, bekannt vorkommen….
Der Binomialkoeffizient gibt die Anzahl der möglichen Kombinationen an, also der Anzahl der Möglichkeiten, $k$ Elemente einer $n$-elementigen Menge ohne Berücksichtigung der Reihenfolge anzuordnen.
Da es egal ist, auf welcher Stufe die Erfolge auftreten, wird die Reihenfolge nicht berücksichtigt.
Die $k$ Elemente entsprechen der Anzahl der Erfolge, und die $n$-elementige Menge ist die Anzahl der Stufen, daher gilt grundsätzlich $k \le n$.
\[\left( \begin{array}{c}n\\ k\end{array} \right)= \frac{n!}{k!~(n-k)!}\]
Mit 0! = 1 ergibt sich $\left( \begin{array}{c}n\\ 0\end{array} \right)= \frac{n!}{0!~n!} = 1$
$\left( \begin{array}{c}n\\ n\end{array} \right)= \frac{n!}{n!~0!} = 1$
Außerdem sollte man sich klar machen, dass
$\left( \begin{array}{c}n\\ k\end{array} \right) = \left( \begin{array}{c}n\\ n-k\end{array} \right)$
denn: $n - (n-k) = k$ (vergleiche mit der Formel oben).
$P(X=k) = \left( \begin{array}{c}n\\ k\end{array}\right)~ p^k~ q^{n-k}$
mit $k$: Anzahl der Erfolge, $n$: Anzahl der Stufen, $p$: Erfolgswahrscheinlichkeit, $q = 1-p$: Misserfolgswahrscheinlichkeit.
Bei großem n wird die Berechnung der Binomialverteilung zeitaufwändig. Da eine Verteilung bei gegebenem n und gegebenen p aber jedesmal zu demselben Ergebnis führt, hat man sich schon schnell mit entsprechenden Tabellen geholfen, aus denen man die Ergebnisse dann ablesen konnte, ohne sie neu berechnen zu müssen.
Solche Tabellen findet ihr im Anhang des Buches und in der Formelsammlung (Wertetafel zur Binomialverteilung).
Der Computer kann die gewünschten Verteilungen schnell berechnen, daher sind bei Computereinsatz diese Wertetafeln nicht mehr notwendig.
Binomialkoeffizient: KOMBINATIONEN(n;k)
Wahrscheinlichkeit für (genau) k Erfolge bei n Stufen: BINOMVERT(k; n; p; 0)
Wahrscheinlichkeit für höchstens k Erfolge bei n Stufen (also kumulierte Verteilung):
BINOMVERT(k; n; p; 1)
Die letzte Ziffer, 0 bzw. 1, steht für nicht kumuliert bzw. kumuliert. Man könnte statt der 0 auch FALSCH und statt der 1 auch WAHR schreiben.
Die vollständige Verteilung erhält man in Excel mit einer Tabelle, in der man die Anzahl der Erfolge und die zugehörige Wahrscheinlichkeit mit Hilfe der BINOMVERT
-Funktion notiert.
Binomialkoeffizient:
COMB(n, k)
Wahrscheinlichkeit für (genau) k Erfolge bei n Stufen:
BINOMIAL_DENSITY(k, n, p)
Wahrscheinlichkeit für höchstens k Erfolge bei n Stufen (also kumulierte Verteilung):
BINOMIAL_DISTRIBUTION(j, n, p)
Die vollständige Verteilung erhält man über den TABLE
-Befehl:
table(binomial_density(k, n, p), k, 0, n, 1)
bzw. mit
table(binomial_distribution(k, n, p), k, 0, n, 1) für die kumulierte Verteilung,
wobei für n und p jeweils Werte eingesetzt werden müssen.
Wenn man mit Hilfe von Tabellen, mit Hilfe von Excel oder Derive oder eventuell „von Hand“ mit dem Taschenrechner die Wahrscheinlichkeiten einer Binomialverteilung bestimmt, muss man sich darüber im Klaren sein, ob die gesuchte Wahrscheinlichkeit als Teil der normalen Binomialverteilung oder als kumulierter Wert zu berechnen ist.
Dafür ist es hilfreich, sich die Bedeutung der häufig auftretenden Ausdrücke zu überlegen.
Grundsätzlich gilt: p = Erfolgswahrscheinlichkeit, k = Anzahl der Erfolge, n = Anzahl der Wiederholungen
Die gesuchten Wahrscheinlichkeiten sollten immer mit mindestens 3 Nachkommastellen angegeben werden.2)
Hat man nur Wertetafeln für die kumulierte (summierte) Binomialverteilung, muss man umformen:
$P(X=k) = P(X \le k) - P(X \le k-1)$
Man bestimmt also die Werte für die beiden kumulierten Wahrscheinlichkeiten aus der Tabelle und bildet die Differenz.
Rechnet man „von Hand“, mit Taschenrechner oder nutzt die Wertetafel zur Binomialverteilung, so muss man alle Wahrscheinlichkeiten von $P(X=0)$ bis $P(X=k)$ bestimmen und summieren.
$P(X<~k) = P(X \le ~k-1)$, dann wie bekannt bestimmen.
Hier muss man umformen:
$P(a \le X \le b) = P(X \le b) - P(X \le~ a-1)$
$P(a < X < b) = P(X \le~ b-1) - P(X \le~ a)$
Die beiden Wahrscheinlichkeiten des umgeformten Terms bestimt man wieder wie eine Wahrscheinlichkeit vom Typ $P(X \le k)$.3)
beschreibender Text | Formel |
---|---|
genau k Erfolge | P(X=k) oder P(X ≤ k) - P(X ≤ k-1) |
höchstens k Erfolge | P(X ≤ k) |
mindestens k Erfolge | P(X ≥ k) = 1 - P(X ≤ k-1) |
mindestens a, höchstens b Erfolge | P(a ≤ X ≤ b) = P(X ≤ b) - P(X ≤ a-1) |
weniger als k Erfolge | P(X<k) = P(X ≤ k-1) |
mehr als k Erfolge | P(X>k) = 1 - P(X ≤ k) |
mehr als a, weniger als b Erfolge | P(a<X<b) = P(X ≤ b-1) - P(X ≤ a) |
nur Erfolge | P(X=n) = pn |
keine Erfolge | P(X=0) = (1-p)n |