Šidák-Korrektur

Aus testwiki
Zur Navigation springen Zur Suche springen

Die Šidák-Korrektur ist ein Verfahren der mathematischen Statistik bei der Verwendung multipler Tests. Dazu werden beim Test einer Globalhypothese mit Hilfe mehrerer Einzeltests die Signifikanzniveaus der Einzeltests so korrigiert, dass der Test der Globalhypothese das vorgegebene Signifikanzniveau hat. Die Šidák-Korrektur kann angewendet werden, wenn die einzelnen Tests stochastisch unabhängig sind oder wenn die Teststatistiken der Einzeltests eine gemeinsame multivariate Normalverteilung besitzen und die Annahmebereiche der Tests eine spezielle Form haben. Wenn die Voraussetzungen für die Anwendung der Šidák-Korrektur erfüllt sind, ergibt sich eine Verbesserung gegenüber der Bonferroni-Korrektur, die ohne besondere Voraussetzungen anwendbar ist.

Globalhypothese und Elementarhypothesen

Zu k statistischen Tests mit den Nullhypothesen H1,,Hk kann die Durchschnittshypothese H0=j=1kHj gebildet werden. Die Hypothesen H1,,Hk heißen in diesem Zusammenhang Elementarhypothesen und H0 heißt Globalhypothese. Ein Test für die Nullhypothese H0 kann auf den Tests für die einzelnen Elementarhypothesen aufgebaut werden, da die Nullhypothese H0 genau dann falsch ist, wenn mindestens eine der Elementarhypothesen falsch ist. Eine mögliche Testprozedur besteht also darin, H0 genau dann abzulehnen, wenn mindestens eine der Hypothesen H1,,Hk abgelehnt wird. Ein vorgegebenes globales Signifikanzniveau αglobal(0,1) für den Test von H0 kann im Allgemeinen nicht eingehalten werden, wenn dieses als lokales Signifikanzniveau für die Einzeltests verwendet wird, da es dann im Allgemeinen zur so genannten Alphafehler-Kumulierung kommt. Um das vorgegebene globale Signifikanzniveau αglobal(0,1) einzuhalten, kann basierend auf der Bonferroni-Korrektur das lokale Signifikanzniveau αlokal=αglobal/k für die einzelnen Tests vorgegeben werden. Im Vergleich zu diesem allgemein anwendbaren Standardansatz ergibt sich mit der Šidák-Korrektur unter bestimmten Voraussetzungen ein verbessertes Verfahren.

Berechnung der Šidák-Korrektur

Eine Voraussetzung für die Anwendung der Šidák-Korrektur ist die stochastische Unabhängigkeit der Einzeltests. Eine alternative Voraussetzung ist eine multivariate Normalverteilung für die Teststatistiken der Einzeltests, wobei die stochastische Unabhängigkeit nicht erforderlich ist; allerdings müssen die Annahmebereiche der Teststatistiken Intervalle sein, die symmetrisch zum jeweiligen Erwartungswert sind. Die Zulässigkeit der Anwendung der Šidák-Korrektur bei multivariater Normalverteilung und beliebiger Abhängigkeit ergibt sich aus der Šidák-Ungleichung. Wenn eine der beiden Voraussetzungen erfüllt ist, ist für den Test der Globalhypothese das globale Signifikanzniveau von αglobal dann gewährleistet, wenn jeder der k Einzeltests zum lokalen Signifikanzniveau

αlokal=1(1αglobal)1/k

durchgeführt wird und die Globalhypothese abgelehnt wird, wenn mindestens ein Einzeltest zur Ablehnung der betreffenden Elementarhypothese führt.

Im Vergleich zur Bonferroni-Korrektur, die für jeden Einzeltest das lokale Signifikanzniveau αglobal/k verlangt, gilt

1(1αglobal)1/k>αglobal/kfürk>1.

Mit der Šidák-Korrektur ist die Reduktion des lokalen Signifikanzniveaus im Vergleich zum globalen Signifikanzniveau weniger stark als mit der Bonferroni-Korrektur. Allerdings ist der Unterschied nicht sehr groß. Beispielsweise ergibt sich für αglobal=0,05 und k=10 mit der Šidák-Korrektur das lokale Signifikanzniveau αlokal0,00516 im Vergleich zum lokalen Signifikanzniveau 0,005 bei Anwendung der Bonferroni-Korrektur.

Theoretischer Hintergrund

Die vorgegebenen Signifikanzniveaus beschränken die Fehlerwahrscheinlichkeiten 1. Art der entsprechenden Tests. Jeweils für j=1,,k bezeichne Hj:θΘj die Nullhypothese, Tj die Teststatistik, Aj den Ablehnbereich und gj(θ)=Pθj(TjAj) die Gütefunktion des j-ten Einzeltests. Das lokale Signifikanzniveau beschränkt die Fehlerwahrscheinlichkeiten 1. Art jedes Einzeltests. Für j=1,,k gilt also

gj(θ)αlokal=1(1αglobal)1/kfür alle θΘj.

Daraus folgt mit einfachen Umformungen

1j=1k(1gj(θ))αglobalfür alle θΘ0:=j=1kΘj.

Für die Globalhypothese H0:θΘ0 ist die Gütefunktion durch

g0(θ)=Pθ(H0 wird abgelehnt)=Pθ(Mindestens ein Hj wird abgelehnt)=1Pθ(Alle Hj werden nicht abgelehnt)=1Pθ(T1A1,,TkAk)

gegeben. Es müssen nun zwei Anwendungsfälle der Šidák-Korrektur unterschieden werden:

1. Falls die Zufallsvariablen T1,,Tk stochastisch unabhängig sind, gilt

Pθ(T1A1,,TkAk)=j=1kPθ(TjAj)=j=1k(1gj(θ))

und somit

g0(θ)=1j=1k(1gj(θ))αglobalfür alle θΘ0,

so dass alle Fehlerwahrscheinlichkeiten 1. Art für den Test der Globalhypothese durch αglobal beschränkt sind.

2. Falls die Zufallsvariablen T1,,Tk multivariat normalverteilt, aber nicht notwendig stochastisch unabhängig, sind und falls alle Annahmebereiche symmetrische Intervalle zu den jeweiligen Erwartungswerten sind, ergibt die Šidák-Ungleichung

Pθ(T1A1,,TkAk)j=1kPθ(TjAj)=j=1k(1gj(θ)).

Somit ergibt sich

g0(θ)1j=1k(1gj(θ))αglobalfür alle θΘ0,

so dass auch in diesem Fall alle Fehlerwahrscheinlichkeiten 1. Art für den Test der Globalhypothese durch αglobal beschränkt sind.

Während im ersten Fall eine Faktorisierung der Wahrscheinlichkeit Pθ(T1A1,,TkAk) aufgrund der stochastischen Unabhängigkeit möglich ist, wird diese Wahrscheinlichkeit im zweiten Fall mit Hilfe der Šidák-Ungleichung durch ein Produkt von Wahrscheinlichkeiten nach unten abgeschätzt.

Literatur