Stichproben-Regressionsfunktion

Aus testwiki
Zur Navigation springen Zur Suche springen

In der Statistik entspricht eine Stichproben-Regressionsfunktion (Vorlage:EnS sample regression function, kurz: SRF), auch empirische Regressionsfunktion, der geschätzten Version der Regressionsfunktion der Grundgesamtheit. Die Stichproben-Regressionsfunktion ist fix, aber in der Grundgesamtheit unbekannt. Handelt es sich bei der Regressionsfunktion um eine Gerade, dann ist auch von einer Stichproben-Regressionsgerade oder empirischen Regressionsgerade die Rede. Die Stichproben-Regressionsgerade wird als Kleinste-Quadrate-Regressionsgerade (kurz: KQ-Regressionsgerade) aus Beobachtungspaaren gewonnen, die Datenpunkte repräsentieren. Sie stellt laut dem Kleinste-Quadrate-Kriterium die bestmögliche Anpassung an die Daten dar.

Einfache lineare Regression

Wenn man mittels der Kleinste-Quadrate-Schätzung den Kleinste-Quadrate-Schätzer für die Steigung β^1=SPxy/SQx und den Kleinste-Quadrate-Schätzer für das Absolutglied β^0=yβ^1x ermittelt, dann erhält man die folgende KQ-Regressionsgerade:

y^=E(yX=x)^=β^0+β^1x.

Diese wird auch Stichproben-Regressionsfunktion genannt, da sie eine geschätzte Variante der (theoretischen) Regressionsfunktion der Grundgesamtheit

E(yX=x)=β0+β1x

darstellt.[1] Die Parameter β^0 und β^1 werden auch empirische Regressionskoeffizienten genannt.[2] Da die Stichproben-Regressionsfunktion durch eine gegebene Stichprobe gewonnen wird, liefert eine neue Stichprobe einen neuen Anstieg β^1 und ein neues Absolutglied β^0. In den meisten Fällen kann man den Kleinste-Quadrate-Schätzer für die Steigung darstellen als

β^1=Δy^/Δx

Durch diese Darstellung kann man erkennen, dass der Kleinste-Quadrate-Schätzer für die Steigung wiedergibt, wie stark sich die Zielgröße y verändert, wenn sich die Einflussgröße x um eine Einheit erhöht.[3]

Multiple lineare Regression

Gegeben ein typisches multiples lineares Regressionsmodell 𝐲=𝐗β+ε, mit β dem p×1 Vektor der unbekannten Regressionsparameter, der n×p Versuchsplanmatrix 𝐗, dem n×1 Vektor der abhängigen Variablen 𝐲 und dem n×1 Vektor der Störgrößen ε. Dann ist die KQ-Stichproben-Regressionsfunktion bzw. Stichproben-Regressionshyperebene 𝐲^ gegeben durch

𝐲^=𝐗β^=𝐗(𝐗𝐗)1𝐗=𝐏𝐲=𝐏𝐲,

wobei 𝐏 die Prädiktionsmatrix darstellt.

Einzelnachweise

  1. Jeffrey Marc Wooldridge: Introductory econometrics: A modern approach. 5. Auflage. Nelson Education, 2013, S. 31.
  2. Otfried Beyer, Horst Hackel: Wahrscheinlichkeitsrechnung und mathematische Statistik. 1976, S. 185.
  3. Jeffrey Marc Wooldridge: Introductory econometrics: A modern approach. 5. Auflage. Nelson Education, 2013, S. 31.