Beta-Verteilung

Aus testwiki
Version vom 18. Januar 2025, 17:31 Uhr von imported>Rdebrand (Umlaut Workaround)
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)
Zur Navigation springen Zur Suche springen
Beta-Verteilung für verschiedene Parameterwerte
Kumulative Verteilungsfunktion für verschiedene Parameterwerte

Die Beta-Verteilung ist eine Familie stetiger Wahrscheinlichkeitsverteilungen über dem Intervall (0,1), parametrisiert durch zwei Parameter, die häufig als p und q – oder auch als α und β – bezeichnet werden. In der bayesschen Statistik ist die Beta-Verteilung die konjugierte a-priori-Wahrscheinlichkeitsverteilung für die Bernoulli-, Binomial-, der negativen Binomial- und der geometrischen Verteilung.

Definition

Die Beta-Verteilung Beta(p,q) ist definiert durch die Wahrscheinlichkeitsdichte

f(x)=1B(p,q)xp1(1x)q1.

Außerhalb des Intervalls (0,1) wird sie durch f(x)=0 fortgesetzt. Für p,q1 lässt sich (0,1) durch [0,1] ersetzen. Die Beta-Verteilung besitzt die reellen Parameter p und q (in den nebenstehenden Grafiken α und β). Um ihre Normierbarkeit zu garantieren, wird p,q>0 (bzw. α,β>0) gefordert.

Der Vorfaktor 1/B(p,q) dient der Normierung. Der Ausdruck

B(p,q)=Γ(p)Γ(q)Γ(p+q)=01up1(1u)q1du

steht für die Betafunktion, nach der die Verteilung benannt ist. Dabei bezeichnet Γ die Gammafunktion.

Die Verteilungsfunktion ist entsprechend

F(x)={0fallsx0,Ix(p,q)falls0<x1,1fallsx>1

mit

Ix(p,q):=1B(p,q)0xup1(1u)q1du.

Die Funktion Ix(p,q) heißt auch regularisierte unvollständige Betafunktion.

Eigenschaften

Erwartungswert

Der Erwartungswert berechnet sich zu

E(X)=pp+q.

Modus

Der Modus, also die Maximalstelle der Dichtefunktion f, ist für p>1, q>1

(1+q1p1)1=p1p+q2.

Varianz

Die Varianz ergibt sich zu

Var(X)=pq(p+q+1)(p+q)2.

Standardabweichung

Für die Standardabweichung ergibt sich

σ=pq(p+q+1)(p+q)2.

Variationskoeffizient

Aus Erwartungswert und Varianz erhält man unmittelbar den Variationskoeffizienten

VarK(X)=qp(p+q+1).

Schiefe

Die Schiefe ergibt sich zu

v(X)=2(qp)p+q+1(p+q+2)pq.

Höhere Momente

Aus der momenterzeugenden Funktion ergibt sich für die k-ten Momente

E(Xk)=r=0k1p+rp+q+r.

Symmetrie

Die Beta-Verteilung ist für p=q symmetrisch um x=12 mit der Schiefe v(X)=0.

Momenterzeugende Funktion

Die momenterzeugende Funktion einer betaverteilten Zufallsgröße lautet

MX(t)=1+n=1(k=0n1p+kp+q+k)tnn!.

Mit der hypergeometrischen Funktion 1F1 erhält man die Darstellung

MX(t)=1F1(p;q;t).

Charakteristische Funktion

Analog zur momenterzeugenden Funktion erhält man die charakteristische Funktion

φX(t)=1F1(p;q;it).

Beziehungen zu anderen Verteilungen

Spezialfälle

Grenzfälle

  • Für p0 und konstantes q geht die Beta-Verteilung in eine Bernoulli-Verteilung Ber(0) über (eine entsprechende Zufallsgröße hat dann fast sicher den Wert null). Dasselbe gilt für q bei konstantem p.
  • Für q0 und konstantes p geht die Beta-Verteilung in eine Bernoulli-Verteilung Ber(1) über (eine entsprechende Zufallsgröße hat dann fast sicher den Wert eins). Dasselbe gilt für p bei konstantem q.

Beides sieht man leicht durch entsprechende Grenzwertbildungen der Formeln für Erwartungswert und Varianz: Der Erwartungswert geht gegen null bzw. eins, die Varianz beide Male gegen null.

Beziehung zur Gammaverteilung

Wenn Xγ(p1,b) und Yγ(p2,b) unabhängige gammaverteilte Zufallsvariablen sind mit den Parametern p1,b bzw. p2,b, dann ist die Größe XX+Y betaverteilt mit Parametern p1 und p2, kurz

Beta(p1,p2)γ(p1,b)γ(p1,b)+γ(p2,b).

Beziehung zur stetigen Gleichverteilung

Sind X1,X2,,Xn unabhängige auf [0,1] stetig gleich verteilte Zufallsvariable, dann sind die Ordnungsstatistiken X(1),X(2),,X(n) betaverteilt. Genauer gilt

X(k)Beta(k,nk+1)

für k=1,,n.

Mischverteilungen

Eine Binomialverteilung, deren Parameter p betaverteilt ist, nennt man Beta-Binomialverteilung. Dies ist ein spezieller Fall einer Mischverteilung.

Beispiel

Vorlage:Hauptartikel Die Beta-Verteilung kann aus zwei Gammaverteilungen bestimmt werden: Der Quotient X=U/(U+V) aus den stochastisch unabhängigen Zufallsvariablen U und V, die beide gammaverteilt sind mit den Parametern b und pu bzw. pv, ist betaverteilt mit den Parametern pu und pv. U und V lassen sich als Chi-Quadrat-Verteilungen mit 2pu bzw. 2pv Freiheitsgraden interpretieren.

Mit Hilfe der linearen Regression wird eine geschätzte Regressionsgerade y^=β^0+β^1xi durch eine „Punktwolke“ mit n Wertepaaren {xi;yi}i=1,,n zweier statistischer Merkmale X und Y gelegt, und zwar so, dass die Quadratsumme der senkrechten Abstände der yi-Werte von der Geraden y^i minimiert wird.

Die Streuung der Schätzwerte y^i um ihren Mittelwert y^=y kann durch SSEi=1n(y^iy)2 gemessen werden und die Streuung der Messwerte yi um ihren Mittelwert kann durch SSTi=1n(yiy)2 gemessen werden. Erstere stellt die „(durch die Regression) erklärte Quadratsumme“ (sum of squares explained, kurz: SSE) und letztere stellt die „totale Quadratsumme“ (sum of squares total, kurz: SST) dar. Der Quotient dieser beiden Größen ist das Bestimmtheitsmaß:

𝑅2SSESST.

Die „(durch die Regression) nicht erklärte Quadratsumme“ bzw. die „Residuenquadratsumme“ (residual sum of squares, kurz SSR) ist durch SSRi=1n(yiy^i)2 gegeben. Durch die Quadratsummenzerlegung TSS=ESS+RSS lässt sich das Bestimmtheitsmaß auch darstellen als

𝑅2=SSESSE+SSR.

Es ist also betaverteilt. Da das Bestimmtheitsmaß das Quadrat des Korrelationskoeffizienten von x und y darstellt (R2=r2), ist auch das Quadrat des Korrelationskoeffizienten betaverteilt. Allerdings kann die Verteilung des Bestimmtheitsmaßes beim globalen F-Test durch die F-Verteilung angegeben werden, die tabelliert vorliegt.

Verallgemeinerung: Beta-Verteilung auf (a,b)

Definition

Die allgemeine Beta-Verteilung ist definiert durch die Wahrscheinlichkeitsdichte

f(x)=1B(a,b,p,q)(xa)p1(bx)q1,

wobei a und b die obere und untere Grenze des Intervalls sind. Entsprechend ergibt sich die Berechnung von B zu

B(a,b,p,q)=ab(ua)p1(bu)q1du=Γ(p)Γ(q)Γ(p+q)(ba)p+q1.

Eigenschaften

Ist X betaverteilt auf dem Intervall (0,1) mit Parametern p, q, dann ist

Y=(ba)X+a

betaverteilt auf dem Intervall (a,b) mit den gleichen Parametern p, q. Ist umgekehrt Y betaverteilt auf (a,b), dann ist

X=Yaba

betaverteilt auf (0,1).

Beispiel

Im Dreieckstest werden drei Proben im gleichseitigen Dreieck angeordnet, wobei eine Ecke des gedachten Dreiecks nach oben zeigt. Zwei der drei Proben gehören zum Produkt A und eine Probe gehört zum Produkt B oder umgekehrt. Die Aufgabe des Probanden besteht nun darin, dasjenige Produkt zu finden, das nur einmal vorkommt. Die Wahrscheinlichkeit durch bloßes Raten die richtige Antwort zu geben beträgt 13.

Verteilung der Erfolgswahrscheinlichkeiten einer Stichprobe im Dreieckstest (schwarze Linie) bei einer Rate-Erfolgswahrscheinlichkeit von 1/3 (blaue Linie)

Die Erfolgswahrscheinlichkeiten variieren je nach sensorischen Fähigkeiten. Unter der Annahme, dass kein Proband absichtlich eine falsche Antwort gibt, liegt die Erfolgswahrscheinlichkeit bei niemandem unter 13. Bei Feinschmeckern oder großen Geschmacksunterschieden kann diese theoretisch bis auf 100 % ansteigen. Im Folgenden wird für beliebige Rate-Erfolgswahrscheinlichkeiten c mit 0<c<1 die Beta-Verteilung auf (c,1) hergeleitet.[1] Aus den eben genannten Gründen modelliert diese Wahrscheinlichkeitsdichte die Erfolgswahrscheinlichkeiten der Probanden realistischer als eine Beta-Verteilung auf (0,1).

Die Erfolgswahrscheinlichkeiten πi der einzelnen Probanden i=1,,n seien zunächst betaverteilt auf (0,1) mit Parametern α und β. Die korrigierten Erfolgswahrscheinlichkeiten auf (c,1) ergeben sich aus pi=c+(1c)πi. Die Wahrscheinlichkeitsdichte von pi lässt sich über den Transformationssatz für Dichten bestimmen. Die Beta-Verteilung von πi hat eine positive Dichte im Intervall (0,1). Die Transformation u:(0,1)(c,1) mit u(π)=c+(1c)π=p ist ein Diffeomorphismus. Daraus erhält man die Umkehrfunktion u1(p)=pc1c. Für die gesuchte Dichtefunktion von p erhält man

fp(p)=fπ(u1(p))|pu1(p)|=fπ(pc1c)|11c|=11cfπ(pc1c|α,β).

Diese Wahrscheinlichkeitsdichte von p auf (c,1) wird in Abhängigkeit von der Wahrscheinlichkeitsdichte von π auf (0,1) dargestellt. In der nebenstehenden Grafik ist beispielhaft eine Beta-Verteilung auf (13,1) mit Parametern α=0,5 und β=4 eingezeichnet. Der Erwartungswert beträgt 40,7%. Die durchschnittliche Erfolgswahrscheinlichkeit liegt damit 7,4% über der Rate-Erfolgswahrscheinlichkeit von 33,3%.

Einzelnachweise

  1. Brockhoff, Per Bruun. "The statistical power of replications in difference tests." Food Quality and Preference 14.5 (2003): 405-417.

Vorlage:Navigationsleiste Wahrscheinlichkeitsverteilungen