F-Verteilung

Aus testwiki
Zur Navigation springen Zur Suche springen

Die F-Verteilung oder Fisher-Verteilung, auch Fisher-Snedecor-Verteilung (nach Ronald Aylmer Fisher und George W. Snedecor), ist eine stetige Wahrscheinlichkeitsverteilung. Eine F-verteilte Zufallsvariable ergibt sich als Quotient zweier jeweils durch die zugehörige Anzahl der Freiheitsgrade geteilter Chi-Quadrat-verteilter Zufallsvariablen. Die F-Verteilung besitzt zwei unabhängige Freiheitsgrade als Parameter und bildet so eine Zwei-Parameter-Verteilungsfamilie.

Die F-Verteilung wird häufig in einem Test verwendet (F-Test), um festzustellen, ob der Unterschied zweier Stichprobenvarianzen auf statistischer Schwankung beruht oder ob er auf unterschiedliche Grundgesamtheiten hinweist. Auch im Rahmen der Varianzanalyse wird mit einer F-Statistik auf signifikante Unterschiede zwischen Grundgesamtheiten (Gruppen) getestet.[1]

Definition

Dichtefunktion der F-Verteilung mit ausgewählten Freiheitsgraden m und n
Datei:Cdf F-Verteilung.svg
Verteilungsfunktion der F-Verteilung mit ausgewählten Freiheitsgraden m und n

Eine stetige Zufallsvariable genügt der F-Verteilung F(m,n), mit m Freiheitsgraden im Zähler und n Freiheitsgraden im Nenner, wenn sie die Wahrscheinlichkeitsdichte

f(xm,n)=mm2nn2Γ(m+n2)Γ(m2)Γ(n2)xm21(mx+n)m+n2,x>0

besitzt. Dabei ist mit Γ(x) die Gammafunktion an der Stelle x bezeichnet.

Den historischen Ursprung obiger Definition der F-Verteilung bildet die Verteilung

Fm,n=χm2/mχn2/n,

wobei χm2 und χn2 unabhängige, Chi-Quadrat-verteilte Zufallsvariablen mit m bzw. n Freiheitsgraden sind.

Eigenschaften

Erwartungswert

Der Erwartungswert existiert nur für n>2 und hat dann den Wert

E(Fm,n)=nn2.

Varianz

Die Varianz ist nur für n>4 definiert und lautet dann

Var(Fm,n)=2n2(m+n2)m(n2)2(n4).

Verteilungsfunktion

Die Werte der Verteilung P(Xx)=F(x|m;n) werden meist numerisch ermittelt und in einer Tabelle angegeben. Eine komplette Tabellierung bezüglich aller Freiheitsgrade ist i. A. nicht notwendig, sodass die meisten Verteilungstabellen die Quantile bezüglich ausgewählter Freiheitsgrade und Wahrscheinlichkeiten angeben. Man macht sich hier auch die Beziehung zunutze:

F1(p;m;n)=1F1(1p;n;m),

wobei F1(p;m;n) das p-Quantil der F-Verteilung mit m und n Freiheitsgraden bedeutet.

Die F-Verteilung lässt sich geschlossen ausdrücken als

F(x|m;n)=I(mxmx+n,m2,n2),

wobei I(z,a,b)=1B(a,b)0zta1(1t)b1dt die regularisierte unvollständige Betafunktion darstellt.

Maximum

Für m>2 nimmt f an der Stelle

xmax=n(m2)m(n+2)

das Maximum an.

Entropie

Die Entropie der F-Verteilung (ausgedrückt in nats) beträgt

H(X)=ln(nmΓ(m2)Γ(n2)Γ(m2+n2))+(1m2)ψ(m2)(1+n2)ψ(n2)+m+n2ψ(m+n2),

wobei ψ die Digamma-Funktion bezeichnet.

Beziehungen zu anderen Verteilungen

Das Zeichen bedeutet im Folgenden „ist verteilt wie“.

Beziehung zur Beta-Verteilung

Die Zufallsvariable

Y=mnFm,n1+mnFm,n

ist betaverteilt mit Parametern m/2 und n/2 (YBeta(m/2,n/2)). Es gilt:

Yχm2χm2+χn2

wobei χm2 und χn2 unabhängige Chi-Quadrat-verteilte Zufallsgrößen sind mit m bzw. n Freiheitsgraden.

Beziehung zur Chi-Quadrat-Verteilung

Aus den unabhängigen χm2 und χn2 Chi-Quadrat-verteilten Zufallsgrößen mit m bzw. n Freiheitsgraden lässt sich

Fm,n=χm2/mχn2/n

konstruieren. Diese Zufallsvariable ist F(m,n)-verteilt.

Beziehung zur nichtzentralen F-Verteilung

Für unabhängige Zufallsvariablen Xχ2(δ,m) und Yχ2(n) ist

Z=X/mY/n

verteilt nach der nichtzentralen F-Verteilung ZF(δ,m,n) mit Nichtzentralitäts-Parameter δ. Dabei ist χ2(δ,m) eine nichtzentrale Chi-Quadrat-Verteilung mit Nichtzentralitäts-Parameter δ und m Freiheitsgraden. Für δ=0 ergibt sich die zentrale F-Verteilung F(m,n).

Dichte der nichtzentralen F-Verteilung

g(z|m,n,δ)=f(z|m,n)eδ/211(m+n2,m2,mzδ2(mz+n)).[2]

Die Funktion 11(a,b,x) ist eine spezielle hypergeometrische Funktion, auch Kummersche Funktion genannt und f(x|m,n) repräsentiert die oben angegebene Dichte der zentralen F-Verteilung.

Erwartungswert und Varianz der nichtzentralen F-Verteilung sind gegeben durch

n(1+δ/m)n2 mit n>2

und

2n2(m(1+δ/m)2+(n2)(1+2δ/m))m(n2)2(n4) mit n>4.

Beide ergeben bei δ0 die Formeln der zentralen F-Verteilung.

Beziehung zur Normalverteilung

Wenn die unabhängigen normalverteilten Zufallsvariablen X1,X2,,Xm,Y1,Y2,,Yn die Parameter

E(Xi)=μ,Var(Xi)=σ2
E(Yj)=ν,Var(Yj)=τ2

besitzen, sind die jeweiligen Stichprobenvarianzen SX2 und SY2 unabhängig, und es gilt:

SX2σ2χm12/(m1)
SY2τ2χn12/(n1)

Deshalb unterliegt die Zufallsvariable

F=SX2/σ2SY2/τ2

einer F-Verteilung mit m1 Freiheitsgraden im Zähler und n1 Freiheitsgraden im Nenner.

Beziehung zur Studentschen t-Verteilung

Wenn Xtn (Studentsche t-Verteilung), dann ist X2F(1,n).

Das Quadrat einer t-verteilten Zufallsvariablen mit n Freiheitsgraden folgt einer F-Verteilung mit m=1 und n Freiheitsgraden.

Herleitung der Dichte

Die Wahrscheinlichkeitsdichte der F-Verteilung lässt sich herleiten (vgl. Herleitung der Dichte der Studentschen t-Verteilung) aus der gemeinsamen Dichte der beiden unabhängigen Zufallsvariablen χm2 und χn2, die beide Chi-Quadrat-verteilt sind.[3]

gχm2,χn2(x,y)=(12m2Γ(m2)xm21exp{x2})(12n2Γ(n2)yn21exp{y2}).

Mit der Transformation

f=x/my/n,v=y

bekommt man die gemeinsame Dichte von F=χm2/mχn2/n und χn2, wobei f0 und v0 gilt.

Die Jacobideterminante dieser Transformation ist:

det(x,y)(f,v)=|mnv01|=mnv

Der Wert ist unwichtig, weil er bei der Berechnung der Determinante mit 0 multipliziert wird. Die neue Dichtefunktion schreibt sich also

gF,χn2(f,v)=12m2Γ(m2)(fvmn)m21e12(fvmn)12n2Γ(n2)vn21e12vmnv.

Gesucht ist nun die Randverteilung gm,n(f) als Integral über die nicht interessierende Variable v:

gm,n(f)=0gF,χn2(f,v)dv=(mn)m2fm212m+n2Γ(m2)Γ(n2)0vm+n21ev2(1+mnf)dv=mm2nn2Γ(m2+n2)Γ(m2)Γ(n2)fm21(mf+n)m+n2.

Quantilfunktionen

Das p-Quantil der F-Verteilung xp ist die Lösung der Gleichung p=F(xp|m,n) und damit prinzipiell über die Umkehrfunktion zu berechnen. Konkret gilt hier

xp=nI1(p,m2,n2)m(1I1(p,m2,n2))

mit I1 als Inverse der regularisierten unvollständigen Betafunktion. Dieser Wert xp ist in der F-Verteilungstabelle unter den Koordinaten p, m und n eingetragen oder in der Quantiltabelle der Fisher-Verteilung zu finden.

Für einige Werte m, n lassen sich die Quantilsfunktionen xp(m,n) explizit ausrechnen. Man löst das Beta-Integral I(mxmx+n,m2,n2) mit m,n=1,2,, wobei für ein paar Indizes invertierbare Funktionen auftreten:

m,n12341tan(π2p)22p21p2?42cos(2arcsin(p)3)14212(1(1p)21)p1p32(1(1p)2/31)21p23?2p2/333p2/3??41(4sin(arcsin(1p)3))214p2(1p)?112+sin(arcsin(12p)3)1

Aus der jeweils vollständigen Zeile und Spalte kann man sogar die allgemeinen Ausdrücke für höhere Indizes ablesen. Man findet:

xp(2,n)=n2(1(1p)2/n1)
xp(m,2)=2m(p2/m1p2/m)

Siehe auch

Literatur

  • Joachim Hartung, Bärbel Elpelt, Karl-Heinz Klösener: Statistik. 12. Auflage, Oldenbourg 1999, S. 156 ff., ISBN 3-486-24984-3.

Vorlage:Wikibooks

Einzelnachweise

  1. P. R. Kinnear, C. D. Gray (2004): SPSS 12 MADE SIMPLE. Psychology Press. New York. S. 208–209.
  2. Vorlage:MathWorld
  3. Frodesen, Skjeggestad, Tofte: Probability and Statistics in Particle Physics. Universitetsforlaget, Bergen – Oslo – Tromsø S. 145 f.

Vorlage:Navigationsleiste Wahrscheinlichkeitsverteilungen