Wie schon bei der Laplace-Regel dargestellt, geht es beim Bestimmen von Wahrscheinlichkeiten eigentlich immer darum, die für das untersuchte Ereignis günstigen Ergebnisse zu bestimmen und dann den Anteil dieser günstigen Ergebnisse an der Gesamtzahl der Ergebnisse zu ermitteln.
Man betrachtet also Mengen von Ergebnissen. Diese kann man mit Venn-Diagrammen einfach darstellen und aus den Diagrammen die Rechenregeln ableiten.
Bei mehrstufigen Experimenten betrachtet man diese Ergebnismengen nacheinander. Hier bieten sich Baumdiagramme an um die Wahrscheinlichkeiten der Ereignisse auf jeder Stufe zu zeigen. Auch aus den Baumdiagrammen lassen sich dann die Rechenregeln für diese Art der Experimente ableiten.
Bestehen die Baumdiagramme aus zwei Stufen mit jeweils zwei Verzweigungen so kann man die dort enthaltenen Daten auch in Vierfeldertafeln darstellen. Diese ermöglichen es dann recht einfach die Reihenfolge der untersuchten Merkmale im Baumdiagramm umzustellen.
Für die Beispiele stellt man sich die Untersuchung von zwei Merkmalen vor - Venn-Diagramme lassen sich natürlich auch für die Untersuchung mehrerer Merkmale zeichnen, irgendwann wird es aber unübersichtlich.
Im Venn-Diagramm werden die einzelnen Ergebnismengen als Kreise (oder Ovale) dargestellt. In die Ergebnismenge E1 gehören hier dann alle Ergebnisse aus dem blauen und violetten Bereich, in die Ergebnismenge E2 alle Ergebnisse aus dem violetten und roten Bereich.
Der violette Bereich stellt die Schnittmenge dar, , also alle Ergebnisse, die sowohl in der Ergebnismenge E1 als auch in der Ergebnismenge E2 auftreten. Man sagt auch, die Schnittmenge besteht aus allen Ergebnissen, die in E1 und E2 auftreten.
Die orange gefärbte Gesamtfläche stellt die Vereinigungsmenge dar, . Hierzu zählen alle Ergebnisse aus der Menge E1 und alle Ergebnisse aus der Menge E2, dabei dürfen die Ergebnisse aus der Schnittmenge aber nur einfach gezählt werden. Man sagt auch, die Vereinigungsmenge besteht aus allen Ergebnissen, die in E1 oder E2 auftreten.1)
Der grau gefärbte Bereich umfasst alle Ergebnisse, die weder E1 noch E2 zugeordnet werden können und stellt das Gegenereignis dar, .
Im ganzen Rechteck schließlich befinden sich alle Ergebnisse des Zufallsversuchs, aufgeteilt auf die Teilergebnismengen.
Schließlich könnte man noch die Ergebnisse betrachten, die nur in E1 oder nur in E2 auftreten, dazu müsste man dann aus den jeweiligen Mengen die Elemente der Schnittmenge entfernen. Das wird mathematisch als „E1 ohne (Symbol: \) die Schnittmenge von E1 und E2“ formuliert und als bzw. notiert.
Elementare Summenregl
für 2)
Allgemeine Summenregel (Schnittmenge darf nicht doppelt berücksichtigt werden)
Komplementärregel
oder allgemein
Erklärung: Da Wahrscheinlichkeiten immer im Intervall [0; 1] liegen, also , muss die Summe der Wahrscheinlichkeiten von Ereignis und Gegenereignis 1 ergeben.
Bei mehrstufigen Zufallsexperimenten muss man unterscheiden, ob sich die Wahrscheinlichkeiten in den Stufen ändern (im Urnenmodell: ohne Zurücklegen), oder ob die Wahrscheinlichkeiten gleich bleiben (im Urnenmodell: mit Zurücklegen).3)
Das folgende Baumdiagramm stellt die möglichen Ergebnisse dar, die möglich sind, wenn man aus einer Urne mit 5 gelben, 2 roten und 3 blauen Kugeln nacheinander zwei Kugeln ohne Zurücklegen zieht:
Die Farben dienen hier zur Veranschaulichung des Ergebnisses (gelb, rot oder blau), die Zahlen sind die zugehörigen Wahrscheinlichkeiten.
Die Wahrscheinlichkeit der Ereignisse bestimmt man dann mit den Pfadregeln:
Pfadmultiplikationsregel: Die Wahrscheinlichkeit eines Pfades erhält man durch Multiplikation der Wahrscheinlichkeiten der Stufen, da die zweite Stufe ja nur ein Anteil von den Möglichkeiten beschreibt, die in der ersten Stufe ausgewählt wurden.
Bsp.
Pfadadditionsregel: Ist die Reihenfolge der Ziehung egal, kann man die Pfade, die die gleichen Ereignisse beschreiben, zusammenfassen:
Beispiel: eine gelbe und eine blaue Kugel wird gezogen
Wenn jedoch die Reihenfolge beachtet werden muss, dann sind die Ereignisse blau→gelb und gelb→blau zwei unterschiedliche Ereignisse und dürfen dann nicht zusammengefasst werden!
Vierfeldertafeln und die daraus abgeleiteten Baumdiagramme dienen vor allem zur Interpretation von Statistiken mit zwei Merkmalen, die jeweils zutreffen oder nicht zutreffen (die Symbolschreibweise A|B bedeutet in diesem Zusammenhang, dass die Wahrscheinlichkeit betrachtet wird, mit der das Ereignis B eintritt wenn A schon eingetreten ist).
Bei abhängigen Merkmalen ist P(A|B ) ungleich P(A) und P(B|A) ungleich P(B ).4)
Die Pfadwahrscheinlichkeiten (also die Werte, die im Inneren der Vierfeldertafel stehen) geben die Wahrscheinlichkeit des UND-Ereignisses an, also P(Merkmal A und Merkmal B ).
Mit der Regel von Bayes können die bedingten Wahrscheinlichkeiten berechnet werden - also die Wahrscheinlichkeiten, die in einem zweistufigen Baumdiagramm an den Ästen der zweiten Stufe stehen.5)
Bedingte Wahrscheinlichkeiten beschreiben die Wahrscheinlichkeit eines Ereignisses, das, gedacht, nach einem anderen Ereignis eingetreten ist (darum stehen die Werte auf der zweiten Stufe).
Man notiert diese Wahrscheinlichkeiten als P(B|A) oder als PA(B ), B bezeichne dabei das betrachtete Ereignis und A das vorangegangene.
Aus den Pfadregeln kann man nun die Berechnung der bedingten Wahrscheinlichkeit ableiten:
Pfadwahrscheinlichkeit = P(A) * P(B|A) = P(AB )