Kovarianzmatrix

Aus testwiki
Zur Navigation springen Zur Suche springen

Vorlage:Dieser Artikel

Dichtefunktion einer um (0;0) zentrierten zweidimensionalen Gauß-Verteilung mit der Kovarianzmatrix Σ=(10,50,51)

In der Stochastik ist die Kovarianzmatrix die Verallgemeinerung der Varianz einer eindimensionalen Zufallsvariable auf eine mehrdimensionale Zufallsvariable, d. h. auf einen Zufallsvektor. Die Elemente auf der Hauptdiagonalen der Kovarianzmatrix stellen die jeweiligen Varianzen dar, und alle übrigen Elemente Kovarianzen. Die Kovarianzmatrix wird auch Varianz-Kovarianzmatrix oder selten Streuungsmatrix bzw. Dispersionsmatrix (Vorlage:LaS dispersio „Zerstreuung“, von dispergere „verteilen, ausbreiten, zerstreuen“) genannt und ist eine positiv semidefinite Matrix. Sind alle Komponenten des Zufallsvektors 𝐗 linear unabhängig, so ist die Kovarianzmatrix positiv definit.

Definition

Sei 𝐗 ein Zufallsvektor

𝐗=(X1X2Xn),

wobei E(Xi)=μi den Erwartungswert von Xi, Var(Xi)=σi2 die Varianz von Xi und Cov(Xi,Xj)=σij,ij die Kovarianz der reellen Zufallsvariablen Xi und Xj darstellt. Der Erwartungswertvektor von 𝐗 ist dann gegeben durch (siehe Erwartungswert von Matrizen und Vektoren)

E(𝐗)=E(X1X2Xn)=(μ1μ2μn)=μ,

d. h. der Erwartungswert des Zufallsvektors ist der Vektor der Erwartungswerte. Eine Kovarianzmatrix für den Zufallsvektor 𝐗 lässt sich wie folgt definieren:[1]

Cov(𝐗)=E((𝐗μ)(𝐗μ))=E((X1μ1)2(X1μ1)(X2μ2)(X1μ1)(Xnμn)(X2μ2)(X1μ1)(X2μ2)2(X2μ2)(Xnμn)(Xnμn)(X1μ1)(Xnμn)(X2μ2)(Xnμn)2)=(Var(X1)Cov(X1,X2)Cov(X1,Xn)Cov(X2,X1)Var(X2)Cov(X2,Xn)Cov(Xn,X1)Cov(Xn,X2)Var(Xn))=(σ12σ12σ1nσ21σ22σ2nσn1σn2σn2)=Σ

Die Kovarianzmatrix wird mit Cov(𝐗), oder ΣX notiert und die Kovarianzmatrix der asymptotischen Verteilung einer Zufallsvariablen mit V oder V. Die Kovarianzmatrix und der Erwartungswertvektor sind die wichtigsten Kenngrößen einer Wahrscheinlichkeitsverteilung. Sie werden bei einer Zufallsvariablen als Zusatzinformationen wie folgt angegeben: X(μ,Σ). Die Kovarianzmatrix als Matrix aller paarweisen Kovarianzen der Elemente des Zufallsvektors enthält Informationen über seine Streuung und über Korrelationen zwischen seinen Komponenten. Wenn keine der Zufallsvariablen X1,,Xn degeneriert ist (d. h. wenn keine von ihnen eine Varianz von Null aufweist) und kein exakter linearer Zusammenhang zwischen den Xi vorliegt, dann ist die Kovarianzmatrix positiv definit.[1] Man spricht außerdem von einer skalaren Kovarianzmatrix, wenn alle Außerdiagonaleinträge der Matrix Null sind und die Diagonalelemente dieselbe positive Konstante darstellen.[2]

Eigenschaften

Grundlegende Eigenschaften

  • Für i=j gilt: Cov(Xi,Xj)=Var(Xi). Somit enthält die Kovarianzmatrix auf der Hauptdiagonalen die Varianzen der einzelnen Komponenten des Zufallsvektors. Alle Elemente auf der Hauptdiagonalen sind daher nichtnegativ.
  • Eine reelle Kovarianzmatrix ist symmetrisch, da die Kovarianz zweier Zufallsvariablen symmetrisch ist.
  • Die Kovarianzmatrix ist positiv semidefinit: Aufgrund der Symmetrie ist jede Kovarianzmatrix mittels Hauptachsentransformation diagonalisierbar, wobei die Diagonalmatrix wieder eine Kovarianzmatrix ist. Da auf der Diagonale nur Varianzen stehen, ist die Diagonalmatrix folglich positiv semidefinit und somit auch die ursprüngliche Kovarianzmatrix.
  • Umgekehrt kann jede symmetrische positiv semidefinite d×d-Matrix als Kovarianzmatrix eines d-dimensionalen Zufallsvektors aufgefasst werden.
  • Aufgrund der Diagonalisierbarkeit, wobei die Eigenwerte (auf der Diagonale) wegen der positiven Semidefinitheit nicht-negativ sind, können Kovarianzmatrizen als Ellipsoide dargestellt werden.
  • Für alle Matrizen 𝐀m×n gilt Cov(𝐀𝐗)=E(𝐀(𝐗E(𝐗))(𝐗E(𝐗))𝐀)=𝐀Cov(𝐗) 𝐀.
  • Für alle Vektoren 𝐛n gilt Cov(𝐗+𝐛)=Cov(𝐗).
  • Sind 𝐗 und 𝐘 unkorrelierte Zufallsvektoren, dann gilt Cov(𝐗+𝐘)=Cov(𝐗)+Cov(𝐘).
  • Sind die Elemente Xi von 𝐗 unkorreliert, so gilt Cov(𝐗)=diag(σ12,σ22,,σn2), d. h. die Kovarianzmatrix ist eine Diagonalmatrix.
  • Man erhält mit der Diagonalmatrix 𝐃=(diag(Σ))1/2=diag(σ1,σ2,,σn) die Kovarianzmatrix durch die Beziehung Σ=𝐃𝐏𝐃, wobei 𝐏 die Korrelationsmatrix in der Grundgesamtheit darstellt
  • Sind die Zufallsvariablen standardisiert, so enthält die Kovarianzmatrix gerade die Korrelationskoeffizienten und man erhält die Korrelationsmatrix
  • Die Inverse der Kovarianzmatrix 𝐏=Σ1 heißt Präzisions­matrix oder Konzentrationsmatrix
  • Die Determinante der Kovarianzmatrix |Σ| wird verallgemeinerte Varianz genannt und ist ein Maß für die Gesamtstreuung eines multivariaten Datensatzes
  • Für die Spur der Kovarianzmatrix gilt Spur(Σ)=i=1nσi2
  • Cov(𝐗+𝐘,𝐙)=Cov(𝐗,𝐙)+Cov(𝐘,𝐙)

Beziehung zum Erwartungswert des Zufallsvektors

Ist μ=E(𝐗) der Erwartungswertvektor, so lässt sich mit dem Verschiebungssatz von Steiner angewandt auf mehrdimensionale Zufallsvariablen zeigen, dass

Cov(𝐗)=E((𝐗μ)(𝐗μ))=E(𝐗𝐗)μμ.

Hierbei sind Erwartungswerte von Vektoren und Matrizen komponentenweise zu verstehen.

Ein Zufallsvektor, der einer gegebenen Kovarianzmatrix gehorchen und den Erwartungswert μ haben soll, kann wie folgt simuliert werden:
zunächst ist die Kovarianzmatrix zu zerlegen (z. B. mit der Cholesky-Zerlegung):

Cov(𝐗)=𝐃𝐃.

Anschließend lässt sich der Zufallsvektor berechnen zu

𝐗=𝐃ξ+μ

mit einem (anderen) Zufallsvektor ξ mit voneinander unabhängigen standardnormalverteilten Komponenten.

Kovarianzmatrix zweier Vektoren

Die Kovarianzmatrix zweier Vektoren lautet

Cov(𝐗,𝐘)=E((𝐗μ)(𝐘ν))

mit dem Erwartungswert μ des Zufallsvektors 𝐗 und dem Erwartungswert ν des Zufallsvektors 𝐘.

Kovarianzmatrix als Effizienzkriterium

Die Effizienz bzw. Präzision eines Punktschätzers lässt sich mittels der Varianz-Kovarianzmatrix messen, da diese die Informationen über die Streuung des Zufallsvektors zwischen seinen Komponenten enthält. Im Allgemeinen gilt, dass sich die Effizienz eines Parameterschätzers anhand der „Größe“ seiner Varianz-Kovarianzmatrix messen lässt. Es gilt je „kleiner“ die Varianz-Kovarianzmatrix, desto größer die Effizienz des Schätzers. Seien θ~ und θ^ zwei unverzerrte (K×1) Zufallsvektoren. Wenn θ ein (K×1) Zufallsvektor ist, dann ist Cov(θ^) eine (K×K) positiv definite und symmetrische Matrix. Man kann sagen, dass Cov(θ^) „kleiner“ ist als Cov(θ~) in Sinne der Loewner-Halbordnung, d. h., dass Cov(θ~)Cov(θ^) eine positiv semidefinite Matrix ist.[3]

Kovarianzmatrix in Matrix-Notation

Die Kovarianzmatrix lässt sich in der Matrix-Notation darstellen als

Cov(𝐗)=1n(𝐗𝐗T1n𝐗11𝐗T),

wobei 11 die Einsmatrix und n die Anzahl Dimensionen bezeichnet.[4]

Stichproben-Kovarianzmatrix

Vorlage:Hauptartikel Eine Schätzung der Korrelationsmatrix in der Grundgesamtheit Σ^ erhält man, indem man die Varianzen und Kovarianzen in der Grundgesamtheit Var(Xi)=σi2 und Cov(Xi,Xj)=σij,ij durch die empirischen Varianzen und empirischen Kovarianzen (ihre empirischen Gegenstücke) σ^j2=sj2 und σ^jk=sjk ersetzt (sofern die x-Variablen Zufallsvariablen darstellen schätzen die die Parameter in der Grundgesamtheit).

Spezielle Kovarianzmatrizen

Kovarianzmatrix des gewöhnlichen Kleinste-Quadrate-Schätzers

Für die Kovarianzmatrix des gewöhnlichen Kleinste-Quadrate-Schätzers

𝐛=(𝐗𝐗)1𝐗𝐘; Cov(𝐘)=σ2𝐈

ergibt sich nach den obigen Rechenregeln:

Cov(𝐛)=(𝐗𝐗)1𝐗Cov(𝐘) 𝐗(𝐗𝐗)1=σ2(𝐗𝐗)1(𝐗𝐗)(𝐗𝐗)1=σ2(𝐗𝐗)1=Σ𝐛.

Diese Kovarianzmatrix ist unbekannt, da die Varianz der Störgrößen σ2 unbekannt ist. Einen Schätzer für die Kovarianzmatrix Σ^𝐛 erhält man, indem man die unbekannte Störgrößenvarianz σ2 durch den erwartungstreuen Schätzer der Störgrößenvarianz σ^2 ersetzt (siehe hierzu: Erwartungstreue Schätzung des unbekannten Varianzparameters).

Kovarianzmatrix bei scheinbar unverbundenen Regressionsgleichungen

Bei scheinbar unverbundenen Regressionsgleichungen (Vorlage:EnS: seemingly unrelated regression equations, kurz SURE) des Modells

yit=𝒙itβ+𝒆it,

wobei der Fehlerterm 𝒆it idiosynkratisch ist, ergibt sich die Kovarianzmatrix als

Cov(𝐞)=E(𝐞𝐞)=(E(𝒆1𝒆1)E(𝒆1𝒆N)E(𝒆N𝒆1)E(𝒆N𝒆N))=(σ11𝐈Tσ1N𝐈TσN1𝐈TσNN𝐈T)=(σ11σ1NσN1σNN)𝐈T=Σ𝐈T=Φ

Darstellung

Vorlage:Siehe auch Die Kovarianzmatrix kann als Näherung an die Streuregion und die Standardabweichungsellipse dargestellt werden.

Siehe auch

Literatur

Einzelnachweise

  1. 1,0 1,1 George G. Judge, R. Carter Hill, William E. Griffiths, Helmut Lütkepohl, Tsoung-Chao Lee: Introduction to the Theory and Practice of Econometrics. 2. Auflage. John Wiley & Sons, New York NY u. a. 1988, ISBN 0-471-62414-4, S. 43.
  2. Jeffrey M. Wooldridge: Introductory econometrics. A modern approach. 5th edition, international edition. South-Western Cengage Learning, Mason OH u. a. 2013, ISBN 978-1-111-53439-4, S. 857.
  3. George G. Judge, R. Carter Hill, William E. Griffiths, Helmut Lütkepohl, Tsoung-Chao Lee: Introduction to the Theory and Practice of Econometrics. 2. Auflage. John Wiley & Sons, New York NY u. a. 1988, ISBN 0-471-62414-4, S. 78.
  4. Lukas On Arnold, Muhsen Owaida: Single-Pass Covariance Matrix Calculation on a Hybrid FPGA/CPU Platform. In: Caterina Doglioni, Doris Kim, Graeme A. Stewart, Lucia Silvestris, Paul Jackson, Waseem Kamleh (Hrsg.): 24th International Conference on Computing in High Energy and Nuclear Physics (CHEP 2019). Adelaide, Australia, November 4–8, 2019 (= The European Physical Journal. Web of Conferences. 245, Vorlage:ISSN). EDP Sciences, Les Ulis 2020, (online).

Vorlage:Navigationsleiste Spezielle Matrizen in der Statistik