Alphafehler-Kumulierung: Unterschied zwischen den Versionen

Aus testwiki
Zur Navigation springen Zur Suche springen
imported>Nesevra
 
(kein Unterschied)

Aktuelle Version vom 17. September 2024, 23:34 Uhr

Vorlage:QS-Mathematik Die Alphafehler-Kumulierung, häufig auch α-Fehler-Inflation genannt, bezeichnet in der Statistik die Erhöhung der globalen Alpha-Fehler-Wahrscheinlichkeit (Fehlerwahrscheinlichkeit 1. Art) durch multiples Testen in derselben Stichprobe. Je mehr richtige Hypothesen man auf einem Datensatz mit einem fixierten Signifikanzniveau testet, umso größer wird die Wahrscheinlichkeit, dass mindestens eine dieser Hypothesen (fälschlich) abgelehnt wird.

Multiples Testen

Vorlage:Hauptartikel

Oft wird in einer Studie nicht nur eine Nullhypothese festgelegt, sondern man will mehrere Fragen mittels der gewonnenen Daten beantworten. Dies können weitere Nullhypothesen, aber auch Konfidenzintervalle oder Schätzwerte sein.

Unter multiplem Testen versteht man die simultane Durchführung mehrerer Tests. Bei einem einfachen Testproblem wird eine Nullhypothese H0 und eine Gegenhypothese H1 betrachtet. Im Fall des multiplen Testens werden mehrere Nullhypothesen H1,H2,,Hk mit zugehörigen Gegenhypothesen K1,K2,,Kk untersucht.[1][2] Multiples Testen wirft im Vergleich zur Durchführung eines einzelnen Tests mehrere Aufgaben auf:

  1. Die Konzepte des Fehlers 1. Art (auch α-Fehler genannt) und der Fehlerwahrscheinlichkeit 1. Art müssen auf multiple Tests verallgemeinert werden. Dies erfolgt durch die Konzepte des multiplen Fehlers 1. Art und der multiplen Fehlerwahrscheinlichkeit 1. Art.
  2. Die betrachtete Familie der Hypothesen und die Tests sollte bestimmte Konsistenzbedingungen erfüllen, z. B. Kohärenz, Konsonanz und Abgeschlossenheit.
  3. Die vorgegebenen Signifikanzniveaus müssen für mehrere Tests aufeinander abgestimmt werden. Im Zusammenhang mit dieser Fragestellung wird die Alphafehler-Kumulierung relevant.

Inflation des Alphafehlers oder Alphafehler-Kumulierung

Die sogenannte Inflation des α-Fehlers oder Alphafehler-Kumulierung beim multiplen Testen soll anhand eines Beispiels illustriert werden: Betrachtet werden k unabhängige Tests mit einfacher Nullhypothese, für die jeweils das geforderte Signifikanzniveau αlokal ausgeschöpft wird, so dass jeweils die Fehlerwahrscheinlichkeit 1. Art mit dem Signifikanzniveau zusammenfällt. Wenn alle Nullhypothese wahr sind, ist die Wahrscheinlichkeit, dass mindestens eine der Nullhypothesen ablehnt wird, d. h. die multiple Fehlerwahrscheinlichkeit 1. Art 1(1αlokal)k. Die Berechnung erfolgt mit Hilfe der entsprechenden Gegenwahrscheinlichkeit und der Multiplikation von Wahrscheinlichkeiten bei stochastischer Unabhängigkeit. Die multiple Fehlerwahrscheinlichkeit 1. Art nimmt mit zunehmender Zahl von Tests zu. Für wachsendes k wächst die multiple Fehlerwahrscheinlichkeit 1. Art und nähert sich für k der Zahl 1.

Vorlage:Manueller Rahmen Bei multiplen Testproblemen werden das lokale (nur die einzelne Hypothese betreffende) α-Niveau und das globale α-Niveau (für die gesamte Hypothesenfamilie) unterschieden. Es gibt mehrere Methoden für die Anpassung (Adjustierung) des lokalen α-Niveaus. So wird bei der Bonferroni-Korrektur das globale α-Niveau durch die Zahl der Tests geteilt um das lokale α-Niveau zu erhalten. Dadurch sinkt das Alpha-Risiko entsprechend:

1(1αglobalk)k.

Noch genauer wäre die Šidák-Korrektur anzuwenden und für jede Nullhypothese das lokale α auf der Basis des globalen Niveaus nach folgender Formel anzupassen: αlokal=1(1αglobal)1/k  mit k= Anzahl der Einzelhypothesen. Daneben gibt es auch noch andere Methoden der Adjustierung, siehe z. B. Falscherkennungsrate.

Adjustierung des globalen α-Niveaus

Wie aber kann man dieser α-Fehler-Inflation entgegenwirken bzw. sie korrigieren?

Bonferroni-Korrektur

Die Bonferroni-Korrektur ist die einfachste und konservativste Form, das multiple α-Niveau anzupassen.[3] Dabei wird das globale α-Niveau zu gleichen Teilen auf die Einzeltests verteilt:

P(Hi wird abgelehnt, obwohl Hi richtig ist)αkfür i=1,,k,

jeder Einzeltest wird also mit dem Niveau α/k (und nicht α) durchgeführt. Daraus folgt mittels der Bonferroni-Ungleichung, dass die Ungleichung

P(Mindestens ein Hi wird abgelehnt, obwohl alle Hi richtig sind)α

erfüllt ist. Aus dem lokalen Niveau α/k ergibt sich also das globale Niveau α. Die sehr konservative Vorgehensweise bei der Bonferroni-Korrektur hat den Nachteil, dass das Ergebnis einen sehr geringen p-Wert aufweisen muss, um als statistisch signifikant gelten zu können. Dies versuchen Weiterentwicklungen wie die Bonferroni-Holm-Prozedur zu vermeiden.

Bonferroni-Holm-Prozedur

Eine Erweiterung der Bonferroni-Korrektur stellt die Bonferroni-Holm-Prozedur[4] dar. Dabei kommt folgender Algorithmus zum Tragen:

  1. Festlegung des globalen α-Niveaus αglobal
  2. Durchführung aller Einzeltests und Ermittlung der p-Werte
  3. Sortieren der p-Werte vom Kleinsten zum Größten
  4. Berechnung der lokalen α-Niveaus als Verhältnis von globalem α-Niveau zur Anzahl der Tests - i, wobei gilt:
    i=1,,k, α1=αglobalk, α2=αglobalk1, αi=αglobalki+1
  5. Vergleiche die p-Werte mit den berechneten sortierten lokalen α-Niveaus (beginnend mit α1 ) und wiederhole diesen Schritt so oft, bis der p-Wert größer ist als der zugehörige αi  Wert.
  6. Alle Nullhypothesen, deren p kleiner als der lokale α-Wert waren, werden zurückgewiesen (bedeutet: der Effekt ist signifikant, es wird davon ausgegangen, dass die Alternativhypothese zutrifft). Die Prozedur endet mit derjenigen Nullhypothese, deren p größer als das lokale α-Niveau ist. Alle folgenden Nullhypothesen werden nicht zurückgewiesen (unter dem globalen α-Niveau).

Die Bonferroni-Holm-Prozedur ist weniger konservativ als die Bonferroni-Korrektur. Nur der erste Test muss auf dem bei der Bonferroni-Korrektur erforderlichen Niveau statistisch signifikant sein, danach sinkt das nötige Niveau stetig. Allerdings weist auch diese Prozedur ebenso wie die Bonferroni-Korrektur den Nachteil auf, dass eventuelle logische und stochastische Abhängigkeiten zwischen den Teststatistiken nicht genutzt werden.

Šidák-Korrektur

Die Šidák-Korrektur kann angewendet werden, falls die einzelnen Tests stochastisch unabhängig sind oder falls die Teststatistiken insgesamt einer multivariaten Normalverteilung folgen und die Ablehnbereiche der einzelnen Teststatistiken symmetrisch zum jeweiligen Erwartungswert sind. Die Signifikanzniveaus der einzelnen Tests werden als

αi=1(1αglobal)1/kfür i=1,,k

festgelegt, um das globale Niveau αglobal zu garantieren.

Weitere Methoden

Neben den beschriebenen Adjustierungen existieren noch weitere Möglichkeiten der Anpassung an ein globales α-Niveau. Dazu gehören beispielsweise:

Einzelnachweise

  1. Vorlage:Literatur
  2. Vorlage:Literatur
  3. Vorlage:Literatur
  4. S. Holm: A simple sequentially rejective multiple test procedure. In: Scandinavian Journal of Statistics. Vol. 6, 1979, S. 65–70.