Hypothesentest

Zurück zu Zufallsversuchen und Stichproben: Wenn man sich für eine von zwei Möglichkeiten entscheiden muss, kann man sich, wenn man die Wahrscheinlichkeiten des Auftretens der beiden betrachteten Ereignisse kennt, mit einem Zufallsexperiment die Entscheidung erleichtern.

Als Beispiel haben wir den Fall besprochen, dass ein neues Medikament mit einer, laut Hersteller, höheren Heilungsrate auf den Markt gebracht werden soll.

Um die Aussage des Herstellers zu überprüfen kann man nun das Medikament im Feldversuch testen - dabei ist klar, dass man nicht hunderte von Leuten das neue Medikament testen lassen kann, sondern sich auf eine überschaubare Zahl an Patienten beschränken muss.

Empirisch ermittelte relative Häufigkeiten entsprechen nach dem Gesetz der großen Zahl aber nur dann relativ sicher den Wahrscheinlichkeiten, wenn die Stichprobe möglichst groß ist - im Beispiel ist also mit Abweichungen von der theoretischen Zahl zu rechnen.

Man muss sich also überlegen, welche möglichen Erfolgszahlen k die Aussage des Herstellers unterstützen, und welche Erfolgszahlen dagegen sprechen - diese Festlegung eines Annahmebereichs und eines Verwerfungsbereichs, getrennt durch den kritischen Wert, nennt man dann eine Entscheidungsregel.

Je nach der im Experiment ermittelten Anzahl der Erfolge würde man dann die als erstes aufgestellte Hypothese (hier z.B.: „die Aussage des Herstellers stimmt“) annehmen oder verwerfen.

Bei der Entscheidung können aber auch Fehler passieren, da der Annahmebereich grundsätzliche eine Wahrscheinlichkeit kleiner als 1 hat. Wenn der Hersteller recht hat, die Erfolge aber zufällig deutlich weniger als erwartet sind und man darum die Hypothese ablehnt (verwirft), dann würde man einen Fehler 1. Art machen (Ablehnung (oder: Verwerfung) einer wahren Hypothese). Wenn die Aussage des Herstellers aber falsch wäre, man aber wegen zufällig deutlich mehr Erfolgen als für diesen Fall erwartet der Hypothese zustimmt (sie also annimmt), dann würde man einen Fehler 2. Art machen (Zustimmung zu (oder: Annahme) einer falschen Hypothese).

Beispielrechnung

Alte Wirksamkeit: $p = 0,6 \qquad$ Neue Wirksamkeit: $p = 0,8$

Hypothese: Das neue Medikament hat eine Wirksamkeit von $p = 0,8$

Entscheidungsregel: Wenn mindestens 15 Erfolge bei 20 Personen auftreten, wird die Hypothese angenommen, sonst abgelehnt.1)

Wahrscheinlichkeit dafür, dass das Versuchsergebnis im Annahmebereich liegt:

$P_{0,8}(X \ge 15) = 1 - P_{0,8}(X \le 14) = 1 - 0,1958 = 0,8042$

Wahrscheinlichkeit dafür, dass das Versuchsergebnis im Annahmebereich der Gegenhypothese, also $p = 0,6$, liegt:

$P_{0,6}(X \le 14) = 0,8744$

Wahrscheinlichkeit für den Fehler 1. Art, also dass das Versuchsergebnis im Verwerfungsbereich der Hypothese liegt, diese aber dennoch richtig ist:

$\alpha_{~0,8} = 1 - P_{0,8}(X \ge 15) = P_{0,8}(X \le 14) = 0,1958 = \beta_{~0,6}$

Wahrscheinlichkeit für den Fehler 2. Art, also dass das Versuchsergebnis im Verwerfungsbereich der Gegenhypothese liegt, diese aber dennoch richtig ist, die eigentliche Hypothese also falsch und der Hypothese trotzdem zugestimmt wird:

$\beta_{~0,8} = 1 - P_{0,6}(X \le 14) = 1 - 0,8744 = 0,1256 = \alpha_{~0,6}$

Hat man die Entscheidungsregel richtig gewählt, so ist die Summe der Fehlerwahrscheinlichkeiten 1. und 2. Art minimal.

Tauscht man Hypothese und Gegenhypothese aus, so vertauscht man auch die Ereignisse für Fehler 1. und 2. Art. Die entsprechenden Fehlerwahrscheinlichkeiten $\alpha$ und $\beta$ müssen also nicht neu berechnet werden.

Wählt man einen größeren Stichprobenumfang (also eine größere Anzahl an Versuchswiederholungen), so wird der Überlappungsbereich der Histogramme kleiner, dadurch verkleinern sich dann auch die Fehlerwahrscheinlichkeiten.

Beispiel mit größerem n

$n = 50$, Hypothese: $p = 0,8$, Gegenhypothese: $p = 0,6$

Entscheidungsregel: Annahme für $k \ge 35$, Ablehnung für $k \le 34$

$P_{0,8}(X \ge 35) = 0,9692 \qquad \alpha = 0,0308 \qquad \beta = 0,0955$

bzw. wenn man die Gegenhypothese betrachtet:

$P_{0,6}(X \le 34) = 0,9045 \qquad \alpha = 0,0955 \qquad \beta = 0,0308$

Entscheidungsregel zu vorgegebenem $\alpha$ finden

In der Praxis interessiert einen in der Regel nicht unbedingt der kritische Wert, bei dem die Summe der beiden Fehler minimal ist, sondern der Fehler 1. Art soll einen bestimmten Wert nicht überschreiten - üblich sind Wert für $\alpha$ von $\alpha = 0,10,~ \alpha = 0,05$ oder $\alpha = 0,01$.

Um jetzt die zu $\alpha$ gehörende Entscheidungsregel zu finden, muss man wieder in eine Tabelle mit kumulierten Wahrscheinlichkeiten sehen und dort einen Wert kleiner oder gleich $\alpha$ suchen.

Der Hypothese p = 0,8 wird zugestimmt, wenn eine Mindestanzahl von Erfolgen eintritt. Gesucht ist also der Wert k, bis zu dem die Fehlerwahrscheinlichkeit kleiner oder gleich $\alpha$ ist.

p = 0,8 und n = 20 p = 0,8 und n = 50 p = 0,6 und n = 20 p = 0,6 und n = 50
kP(X≤k) kP(X≤k) k1-P(X≤k) k1-P(X≤k)
100,0026 320,0063 170,0036 380,0057
110,0100 330,0144 160,0160 370,0133
120,0321 340,0308 150,0510 360,0280
130,0867 350,0607 140,1256 350,0540
140,1958 360,1106 340,0955
330,1561

Prüft man also die Hypothese „Erfolgswahrscheinlichkeit ist $p = 0,8$ “, dann stimmt man ihr nach den Tabellen mit den kumulierten Werten also in den folgenden Fällen zu:

n = 20n = 50
$\alpha \le 0,01$k ≥ 12$\beta = 0,5956$ k ≥ 33$\beta = 0,2369$
$\alpha \le 0,05$k ≥ 13$\beta = 0,4159$ k ≥ 35$\beta = 0,0955$
$\alpha \le 0,10$k ≥ 14$\beta = 0,2500$ k ≥ 36$\beta = 0,0540$

Prüft man jedoch die Gegenhypothese „Erfolgswahrscheinlichkeit ist $p = 0,6$ “, dann würde man ihr nach den Tabellen also in diesen Fällen zustimmen:

n = 20n = 50
$\alpha \le 0,01$k ≤ 17 k ≤ 38
$\alpha \le 0,05$k ≤ 16 k ≤ 36
$\alpha \le 0,10$k ≤ 15 k ≤ 34

Damit wird folgendes deutlich: Will man einen Fehler 1. Art möglichst ausschließen, setzt also die Fehlerwahrscheinlichkeit $\alpha$ möglichst klein an, so erhöht sich automatisch die Wahrscheinlichkeit für einen Fehler 2. Art, also den Fall, dass einer falschen Hypothese zugestimmt wird.

1)
Der kritische Wert liegt also zwischen 14 und 15 und wurde so gewählt, da P(X=14) für p=0,6 größer als P(X=14) für p=0,8 ist, andererseits P(X=15) für p=0,6 kleiner als P(X=15) für p=0,8 ist.
schule/ma/regelns2/sto/hypothesentest.txt · Zuletzt geändert: 2018/06/09 12:06 von ahrens
CC Attribution-Noncommercial-Share Alike 4.0 International
Driven by DokuWiki Recent changes RSS feed Valid CSS Valid XHTML 1.0