Kritischer Wert (Statistik)

Aus testwiki
Version vom 3. Mai 2024, 23:29 Uhr von imported>Sigma^2 (Einleitung: Lit aktualisiert)
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)
Zur Navigation springen Zur Suche springen

Ein kritischer Wert ist in der Testtheorie und bei der Anwendung statistischer Tests eine Stelle, die den Ablehnbereich (kritischen Bereich) vom Annahmebereich (Nicht-Ablehnungsbereich) eines statistischen Tests trennt. Bei vielen in der Anwendung verbreiteten statistischen Testverfahren ist der Ablehnbereich ein Intervall oder die Vereinigung von zwei Intervallen, so dass es einen oder zwei kritische Werte gibt.[1][2]

Beispiel: einseitiger t-Test

Da die Teststatistik eine Zufallsvariable ist, kann ihre Realisierung (die Prüfgröße) unter- oder oberhalb des kritischen Werts liegen. Liegt sie oberhalb des kritischen Werts, so wird die Nullhypothese verworfen.

Bei einem einseitigen Einstichproben-t-Test mit der Nullhypothese H0:μμ0 und der Gegenhypothese H1:μ>μ0 ist der Ablehnbereich

A:=(t1α;n1,)

und der Annahmebereich ist das Komplement

(,t1α;n1].

Der Berührungspunkt t1α;n1 zwischen dem Ablehnbereich und dem Annahmebereich ist der kritische Wert. Hier ist der kritische Wert das (1α)-Quantil der t-Verteilung mit n1 Freiheitsgraden.

Liegt die Prüfgröße t, das ist eine Realisierung der Teststatistik T, im Ablehnbereich, ist t also größer als der kritische Wert, so wird die Nullhypothese dieses Tests zugunsten der Gegenhypothese abgelehnt, anderenfalls nicht abgelehnt. Die nebenstehende Abbildung verdeutlicht dies.

Bei einer Testdurchführung, die auf dem p-Wert basiert, ist der p-Wert genau dann kleiner als das vorgegebene Signifikanzniveau α, wenn die Prüfgröße t im Ablehnbereich liegt, das bedeutet hier, dass t größer als der kritische Wert ist.

Beispiel: zweiseitiger t-Test

Darstellung der Trennschärfe und der Fehlerwahrscheinlichkeit erste Art eines statistischen Tests bei gegebener Nullhypothese (sampling distribution 1) und Alternativhypothese (sampling distribution 2).

Bei einem zweiseitigen Einstichproben-t-Test mit der Nullhypothese H0:μ=μ0 und der Gegenhypothese H1:μμ0 setzt sich der Ablehnbereich

A:=(,t1α/2;n1)(t1α/2;n1,)

aus zwei Teilintervallen zusammen und der Annahmebereich ist das Komplement

[t1α/2;n1,t1α/2;n1].

Dabei bezeichnet t1α/2;n1 das (1α/2)-Quantil der t-Verteilung mit n1 Freiheitsgraden. Es gibt in diesem Fall die zwei kritischen Werte k1=t1α/2;n1 und k2=t1α/2;n1, die den Ablehnbereich vom Annahmebereich trennen. Die Nullhypothese dieses Tests wird abgelehnt, wenn die Prüfgröße t im Ablehnbereich liegt, wenn also entweder t<k1 oder t>k2 gilt.

In der zweiten Abbildung ist, zusammengesetzt aus zwei blauen Teilflächen, die Fehlerwahrscheinlichkeit 1. Art (engl.: chance of Type I error), d. h. die Ablehnwahrscheinlichkeit bei Richtigkeit der Nullhypothese, für den Fall einer zweiseitigen Alternativhypothese dargestellt. Die rot schraffierte Fläche unter der roten Dichtefunktion über dem Ablehnbereich verdeutlicht eine Fehlerwahrscheinlichkeit 2. Art und damit einen Wert der Trennschärfe (Power) des Tests. Ein zweiter, in diesem Fall sehr kleiner, Teil der Fehlerwahrscheinlichkeit 2. Art wird durch die Fläche unter der roten Dichtefunktion über dem linken Teil des Ablehnbereichs beigetragen, ist aber in dieser Graphik nicht sichtbar.

Häufig, wie auch in den beiden angegebenen Beispielen von Ablehnbereichen, kann im Fall einer einfachen Nullhypothese der Ablehnbereich so gewählt werden, dass das vorgegebene Signifikanzvniveau α und die Fehlerwahrscheinlichkeit 1. Art übereinstimmen, und kann im Fall einer zusammengesetzten Nullhypothese der Ablehnbereich so gewählt werden, dass das vorgegebene Signifikanzvniveau die Fehlerwahrscheinlichkeiten 1. Art nach oben beschränkt und zugleich das Maximum oder Supremum dieser Fehlerwahrscheinlichkeiten 1. Art ist.

Einzelnachweise