Chow-Test

Aus testwiki
Version vom 12. Oktober 2022, 22:18 Uhr von imported>Kmhkmh
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)
Zur Navigation springen Zur Suche springen

Der Chow-Test ist ein statistischer Test, mit dem sich die Koeffizienten zweier linearer Regressionen auf Gleichheit testen lassen. Der Test ist nach seinem Erfinder, dem Ökonomen Gregory Chow, benannt.

Anwendungsgebiete

Der Chow-Test wird in der Ökonometrie verwendet, um Zeitreihen auf Strukturbrüche zu testen. Ein weiteres Anwendungsgebiet ist die Programmevaluation, hierbei werden zwei unterschiedliche Teilgruppen (Programme), wie zum Beispiel zwei Schultypen, miteinander verglichen. Im Gegensatz zur Zeitreihenanalyse lassen sich hier die beiden Teilgruppen keinen aufeinander folgenden Intervallen zuordnen, stattdessen erfolgt die Einteilung nach einem qualitativen Aspekt, wie zum Beispiel dem Schultyp.

Strukturbruch Programmevaluation

Datei:Chowtest4.svg

Fehler beim Erstellen des Vorschaubildes:

Bei x=1,7 liegt ein Strukturbruch vor, Regressionen auf den Teilintervallen [0;1,7] und [1,7;4] liefern eine bessere Modellierung als die Regression über dem Gesamtinterval (gestrichelt)

Vergleich zweier Programme (rot, grün) im selben Datensatz, separate Regressionen auf den zu einem Programm gehörigen Daten liefern eine bessere Modellierung als die Regression über den gesamten Datensatz (schwarz)

Vorgehen

Gegeben ist ein Datensatz (Yi,Xi) mit Xi=(xi1,,xik) für i=1N, dessen Beziehung durch eine lineare Funktion mit einem normalverteilten Fehler (ϵ) mit Erwartungswert 0 (E(ϵ)=0) beschrieben wird (multiple Regressionsanalyse), d. h. man hat

Yi=c0+c1xi1+c2xi2++ckxik+ϵi für i=1N.

Man vermutet jedoch, dass sich der Datensatz in zwei Gruppen der Größen Na und Nb aufteilen lässt, die durch zwei unterschiedliche lineare Funktionen besser beschrieben werden.

Yi=a0+a1xi1+a2xi2++akxik+ϵi für i=1Na
Yi=b0+b1xi1+b2xi2++bkxik+ϵi für i=Na+1Na+Nb

Hierbei ist N=Na+Nb und es wird die Hypothese H0:(a0,a1,,ak)=(b0,b1,,bk) gegen H1:(a0,a1,,ak)(b0,b1,,bk) getestet. Bezeichnet man die Summe der quadrierten Residuen der Regression über den gesamten Datensatz mit S und über die beiden Teilgruppen mit Sa und Sb, dann folgt die unten definierte Testgröße T einer F-Verteilung mit den Freiheitsgraden k+1 und Na+Nb2(k+1).

T:=(S(Sa+Sb))/(k+1)(Sa+Sb)/(Na+Nb2(k+1))

Beispiel

Gegeben ist der folgende Datensatz, dessen Beziehung durch die lineare Funktion Y=c0+c1X modelliert werden soll:

Xi 0,5 1,0 1,5 2,0 2,5 3,0 3,5 4,0 4,5 5,0 5,5 6,0
Yi −0,043 0,435 0,149 0,252 0,571 0,555 0,678 3,119 2,715 3,671 3,928 3,962
Fehler beim Erstellen des Vorschaubildes:
Der Datenplot legt einen Strukturbruch bei x=4 nahe.

Ein Datenplot lässt vermuten, dass bei x=4 ein Strukturbruch vorliegt, daher teilt man den Datensatz in 2 Intervalle [0,5;3,5] und [4,0;6,0] ein und führt über diesen, zusätzlich zur Regression über den gesamten Datensatz, getrennte Regressionen durch. Dann testet man, ob die beiden Teilregressionen dieselbe lineare Funktion erzeugen, also H0:(a0,a1)=(b0,b1) gegen H1:(a0,a1)(b0,b1)

Regression auf dem gesamten Datensatz:

x=112i=112Xi=3,2500 y=112i=112Yi=1,6660
Sxx=i=112(Xix)2=35,7500 Syy=i=112(Yiy)2=29,7661
Sxy=i=112(Xix)(Yiy)=30,0570 S=SyySxy2Sxx=4,4955

Regression auf [0,5,3,5]

x=17i=17Xi=2,0000 y=17i=17Yi=0,3710
Sxx=i=17(Xix)2=7,0000 Syy=i=17(Yiy)2=0,4070
Sxy=i=17(Xix)(Yiy)=1,4125 Sa=SyySxy2Sxx=0,1220
Datei:Chowtest2.svg
Datenplot mit Regressionsgeraden

Regression auf [4,0,6,0]

x=15i=15Xi=5,0000 y=15i=15Yi=3,4790
Sxx=i=15(Xix)2=2,5000 Syy=i=15(Yiy)2=1,1851
Sxy=i=15(Xix)(Yiy)=1,4495 Sb=SyySxy2Sxx=0,3446

Berechnung der Testgröße:

T:=(S(Sa+Sb))/(k+1)(Sa+Sb)/(Na+Nb2(k+1))=34,5345

Wegen F2;8;0,95=4,459  (Signifikanzniveau α=0,05) gilt  TF2;8;0,95. Somit kann die Nullhypothese H0 verworfen werden. Das heißt, die beiden Regressionsgeraden auf den Teilintervallen sind nicht identisch. Es liegt also ein Strukturbruch vor und die Teilregressionen liefern eine bessere Modellierung als die Regression über den gesamten Datensatz.

Literatur

Vorlage:Commonscat