Wahrscheinlichkeiten darstellen und berechnen

Wie schon bei der Laplace-Regel dargestellt, geht es beim Bestimmen von Wahrscheinlichkeiten eigentlich immer darum, die für das untersuchte Ereignis günstigen Ergebnisse zu bestimmen und dann den Anteil dieser günstigen Ergebnisse an der Gesamtzahl der Ergebnisse zu ermitteln.

Man betrachtet also Mengen von Ergebnissen. Diese kann man mit Venn-Diagrammen einfach darstellen und aus den Diagrammen die Rechenregeln ableiten.

Bei mehrstufigen Experimenten betrachtet man diese Ergebnismengen nacheinander. Hier bieten sich Baumdiagramme an um die Wahrscheinlichkeiten der Ereignisse auf jeder Stufe zu zeigen. Auch aus den Baumdiagrammen lassen sich dann die Rechenregeln für diese Art der Experimente ableiten.

Bestehen die Baumdiagramme aus zwei Stufen mit jeweils zwei Verzweigungen so kann man die dort enthaltenen Daten auch in Vierfeldertafeln darstellen. Diese ermöglichen es dann recht einfach die Reihenfolge der untersuchten Merkmale im Baumdiagramm umzustellen.

Venn-Diagramme und Grundregeln

Für die Beispiele stellt man sich die Untersuchung von zwei Merkmalen vor - Venn-Diagramme lassen sich natürlich auch für die Untersuchung mehrerer Merkmale zeichnen, irgendwann wird es aber unübersichtlich.

Venn-Diagramm

Im Venn-Diagramm werden die einzelnen Ergebnismengen als Kreise (oder Ovale) dargestellt. In die Ergebnismenge E1 gehören hier dann alle Ergebnisse aus dem blauen und violetten Bereich, in die Ergebnismenge E2 alle Ergebnisse aus dem violetten und roten Bereich.

Der violette Bereich stellt die Schnittmenge dar, E1 inter E2, also alle Ergebnisse, die sowohl in der Ergebnismenge E1 als auch in der Ergebnismenge E2 auftreten. Man sagt auch, die Schnittmenge besteht aus allen Ergebnissen, die in E1 und E2 auftreten.

Die orange gefärbte Gesamtfläche stellt die Vereinigungsmenge dar, E1 union~ E2. Hierzu zählen alle Ergebnisse aus der Menge E1 und alle Ergebnisse aus der Menge E2, dabei dürfen die Ergebnisse aus der Schnittmenge aber nur einfach gezählt werden. Man sagt auch, die Vereinigungsmenge besteht aus allen Ergebnissen, die in E1 oder E2 auftreten.1)

Der grau gefärbte Bereich umfasst alle Ergebnisse, die weder E1 noch E2 zugeordnet werden können und stellt das Gegenereignis dar, overline{E1 union~ E2}.

Im ganzen Rechteck schließlich befinden sich alle Ergebnisse des Zufallsversuchs, aufgeteilt auf die Teilergebnismengen.

Schließlich könnte man noch die Ergebnisse betrachten, die nur in E1 oder nur in E2 auftreten, dazu müsste man dann aus den jeweiligen Mengen die Elemente der Schnittmenge entfernen. Das wird mathematisch als „E1 ohne (Symbol: \) die Schnittmenge von E1 und E2“ formuliert und als E1 backslash delim{lbrace} {E1 inter~ E2} {rbrace} bzw. E2 backslash delim{lbrace} {E1 inter~ E2} {rbrace} notiert.

Abzuleitende Rechenregeln

Elementare Summenregl

P(E) ~=~ P(a_1) ~+~ P(a_2) ~+~ P(a_3) ~+~ cdots ~+~ P(a_n) für E = delim{lbrace}{a_1, a_2, a_3, cdots, a_n}{rbrace}2)

Allgemeine Summenregel (Schnittmenge darf nicht doppelt berücksichtigt werden)

P(E1 union~ E2) ~=~ P(E1) ~+~ P(E2) ~-~ P(E1 inter~ E2)

Komplementärregel

P(overline{E1 union~ E2}) ~=~ 1 ~-~ P(E1 union~ E2) oder allgemein P(overline{A}) = 1 ~-~ P(A)

Erklärung: Da Wahrscheinlichkeiten immer im Intervall [0; 1] liegen, also 0 <= ~p~ <= 1, muss die Summe der Wahrscheinlichkeiten von Ereignis und Gegenereignis 1 ergeben.

Baumdiagramme und Pfadregeln

Bei mehrstufigen Zufallsexperimenten muss man unterscheiden, ob sich die Wahrscheinlichkeiten in den Stufen ändern (im Urnenmodell: ohne Zurücklegen), oder ob die Wahrscheinlichkeiten gleich bleiben (im Urnenmodell: mit Zurücklegen).3)

Das folgende Baumdiagramm stellt die möglichen Ergebnisse dar, die möglich sind, wenn man aus einer Urne mit 5 gelben, 2 roten und 3 blauen Kugeln nacheinander zwei Kugeln ohne Zurücklegen zieht:

baum ohne zurücklegen

Die Farben dienen hier zur Veranschaulichung des Ergebnisses (gelb, rot oder blau), die Zahlen sind die zugehörigen Wahrscheinlichkeiten.

Die Wahrscheinlichkeit der Ereignisse bestimmt man dann mit den Pfadregeln:

Pfadmultiplikationsregel: Die Wahrscheinlichkeit eines Pfades erhält man durch Multiplikation der Wahrscheinlichkeiten der Stufen, da die zweite Stufe ja nur ein Anteil von den Möglichkeiten beschreibt, die in der ersten Stufe ausgewählt wurden.

Bsp. P(rot, rot) ~=~ 2/10 ~*~ 1/9

Pfadadditionsregel: Ist die Reihenfolge der Ziehung egal, kann man die Pfade, die die gleichen Ereignisse beschreiben, zusammenfassen:

Beispiel: eine gelbe und eine blaue Kugel wird gezogen

P(gelb, blau) ~=~ 2 ~*~ {5~*~3}/{10~*~9}

Wenn jedoch die Reihenfolge beachtet werden muss, dann sind die Ereignisse blau→gelb und gelb→blau zwei unterschiedliche Ereignisse und dürfen dann nicht zusammengefasst werden!

Baumdiagramme und Vierfeldertafeln

Vierfeldertafel

Vierfeldertafeln und die daraus abgeleiteten Baumdiagramme dienen vor allem zur Interpretation von Statistiken mit zwei Merkmalen, die jeweils zutreffen oder nicht zutreffen (die Symbolschreibweise A|B bedeutet in diesem Zusammenhang, dass die Wahrscheinlichkeit betrachtet wird, mit der das Ereignis B eintritt wenn A schon eingetreten ist).

Bei abhängigen Merkmalen ist P(A|B ) ungleich P(A) und P(B|A) ungleich P(B ).4)

Die Pfadwahrscheinlichkeiten (also die Werte, die im Inneren der Vierfeldertafel stehen) geben die Wahrscheinlichkeit des UND-Ereignisses an, also P(Merkmal A und Merkmal B ).

BAYES'sche Regel

Mit der Regel von Bayes können die bedingten Wahrscheinlichkeiten berechnet werden - also die Wahrscheinlichkeiten, die in einem zweistufigen Baumdiagramm an den Ästen der zweiten Stufe stehen.5)

Bedingte Wahrscheinlichkeiten beschreiben die Wahrscheinlichkeit eines Ereignisses, das, gedacht, nach einem anderen Ereignis eingetreten ist (darum stehen die Werte auf der zweiten Stufe).

Man notiert diese Wahrscheinlichkeiten als P(B|A) oder als PA(B ), B bezeichne dabei das betrachtete Ereignis und A das vorangegangene.

Aus den Pfadregeln kann man nun die Berechnung der bedingten Wahrscheinlichkeit ableiten:

Pfadwahrscheinlichkeit = P(A) * P(B|A) = P(AinterB )

doubleleftright~~ P(B|A)~=~ {P(A inter B )} / {P(A)}

1)
Hier verwendet man das „oder“ einschließend (als und/oder denken), d.h. die Ergebnisse dürfen nur in E2 und nur in E2 und in beiden Mengen vorhanden sein. Der Gegensatz wäre das ausschließende oder, was zur Verdeutlichung immer als „entweder - oder“ umschrieben wird.
2)
P(a) = 1/|E| (Laplace) oder muss empirisch über relative Häufigkeiten bestimmt werden
3)
Ändern sich die Wahrscheinlichkeiten in den Stufen nicht, so sagt man, die Ergebnisse sind voneinander unabhängig (wie beim Münzwurf oder Ziehen mit Zurücklegen) - ändert sich die Wahrscheinlichkeit (wie beim Ziehen ohne Zurücklegen), so sind die Ergebnisse der zweiten Stufe von denen der ersten abhängig.
4)
Unabhängige Merkmale sind am Baum an gleichen Wahrscheinlichkeiten auf der 2. Stufe zu erkennen, in der Vierfeldertafel stehen die Zahlen in den Zeilen bzw. in den Spalten jeweils im gleichen Verhältnis.
5)
Diese Werte tauchen nicht in der Vierfeldertafel auf.
schule/ma/regelns2/sto/wktdarber.txt · Zuletzt geändert: 2018/06/09 12:10 von ahrens
CC Attribution-Noncommercial-Share Alike 4.0 International
Driven by DokuWiki Recent changes RSS feed Valid CSS Valid XHTML 1.0