Räumliche Autokorrelation

Aus testwiki
Version vom 11. März 2025, 12:53 Uhr von imported>Jule Glühwurm (growthexperiments-addlink-summary-summary:1|1|0)
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)
Zur Navigation springen Zur Suche springen

Räumliche Autokorrelation wird in der Geostatistik verwendet, um Zusammenhänge von räumlichen Einheiten zu identifizieren, zu messen und auf ihre statistische Signifikanz zu testen.

Begriff und Definition

Der Begriff „Auto-Korrelation“ („Beziehung mit sich selbst“), bezieht sich auf das Auftreten von Ausprägungen einer Variable an bestimmten Orten in Abhängigkeit von der Ausprägung derselben Variable an anderen Orten.[1] Eine ältere Bezeichnung im Deutschen für das Phänomen ist Räumliche Erhaltensneigung[2]. Dieser ältere Begriff spielt darauf an, dass die Werte einer räumlich autokorrelierten Variable dazu neigen, ähnliche Beträge zu zeigen, wenn die Orte, an denen sie gemessen wurden, im Raum näher bei einander liegen.

Abgrenzung zu Korrelation und zeitlicher Autokorrelation

Bei der Berechnung der statistischen Korrelation werden zwei Variablen (x,y) bei zwei oder mehr Beobachtungen betrachtet; bei der räumlichen Autokorrelation hingegen eine Variable x an zwei oder mehr Orten.[3]

Während die zeitliche Autokorrelation die Beziehungen der Ausprägungen einer Variablen mit sich selbst über die Zeit beschreibt, beschreibt die räumliche Autokorrelation die Ausprägungen einer Variablen mit sich selbst im Raum.

Berechnung

Räumliche Autokorrelation kann positive oder negative Ausprägungen haben:

  • Positive räumliche Autokorrelation liegt dann vor, wenn nahe beieinander liegende Orte einander mit höherer Wahrscheinlichkeit ähnlich sind als weiter voneinander entfernte Orte.[4] Das heißt: Positive räumliche Autokorrelation liegt vor, wenn Orte dazu tendieren, im Hinblick auf eine Eigenschaft Cluster zu bilden. Positive räumliche Autokorrelation ist eine empirische Manifestation von Toblers „Erstem Gesetz der Geographie“.
  • Negative räumliche Autokorrelation liegt dann vor, wenn benachbarte Orte im Vergleich zu zufälliger Anordnung[5] unterschiedliche Eigenschaftswerte aufweisen. Bei Phänomenen, die mit Lebewesen (Tieren, Pflanzen) verbunden sind, wird negative Autokorrelation häufig durch Wettbewerb und Verdrängung verursacht.[6]
  • Keine räumliche Autokorrelation liegt vor, wenn die Orte im Hinblick auf eine Eigenschaft zufällig angeordnet sind, also keine ausgeprägten Cluster aufweisen.

Grundlage der Betrachtung ist eine räumliche Analyse von Punkten oder Polygonen und der Aufbau einer Distanzmatrix zwischen den Punkten oder Polygonen. Bei Punkten werden in der Regel entweder der Euklidische Abstand oder der Abstand nach der Manhattan-Metrik verwendet. Bei Polygonen wird entweder ein Zentralpunkt ermittelt und wie bei Punkten verfahren oder es wird lediglich festgestellt, ob Polygone einander benachbart sind (dann wird der Wert 1) oder nicht (0). Die Nachbarschaftsbeziehung kann sich auf das Vorhandensein von gemeinsamen Kanten (Linien) und Punkten (Queen Contiguity) oder auf das Vorhandensein allein von gemeinsamen Kanten (Rook Contiguity)[7] oder auf die Definition der k nächstgelegenen Nachbarn mit 1 (und aller übrigen mit 0, siehe Nächste-Nachbarn-Klassifikation) beziehen.

Kennziffern

Globale Maße

Wichtige Kennziffern[8] für die Messung räumlicher Autokorrelation in einem größeren Raum („globale Betrachtung“) sind

  • der vom australischen Mathematiker Patrick Alfred Pierce Moran (1917–1988) entwickelte Indexwert I (Moran's I)
  • der von dem irischen Statistiker Roy Geary (1896–1983) entwickelte Index C (Geary's C)

„Global “bedeutet hier, dass ein Wert für den gesamten Betrachtungsraum berechnet wird. Neben I und C kann auch eine von Getis und Ord entwickelte generalisierte Form des Index G (General G-Statistic) verwendet werden.

Moran's I

Zur Berechnung von Moran's I[9] wird zunächst die räumliche Autokovarianz der Variable x in zwei Regionen i und j ermittelt und über alle Regionenpaare i,j summiert. Zur Berechnung der Autokovarianz wird zunächst in der Region i die Differenz zwischen dem Wert der Variable x in dieser Region und dem Mittelwert der Variable x über alle Regionen gebildet. Das Ergebnis ist entweder positiv oder negativ. Das Gleiche geschieht in der Region j. Die Ergebnisse werden multipliziert. Diese Rechnung erfolgt für alle Regionenpaare i und j, die Ergebnisse werden summiert:

injnwij(xix)(xjx)

Das Gewicht w beschreibt die räumliche Nähe oder Distanz der beiden Regionen. Häufig wird für w der Wert 1 gewählt, wenn die Regionen benachbart sind und 0 wenn nicht. w macht also aus der Autokovarianz eine räumliche Autokovarianz.

Zur vollständigen Berechnung von Moran's I wird die so ermittelte räumliche Autokovarianz an der Summe der quadrierten Abweichungen der Region i und einem Beziehungswert normiert:[10]

I=ninjnwijinjnwij(xix)(xjx)in(xix)2

Moran's I kann Werte von −1 bis +1 annehmen, Werte größer als +0,3 werden als Indikator für eine relativ starke positive Autokorrelation angesehen, Werte kleiner als −0,3 als Indikator für eine relativ starke negative Autokorrelation.[11] Eine inferenzstatistische Absicherung durch Vergleich der standardisierten I-Werte mit einer Standard-Normalverteilung oder anhand eines Permutationstests ist üblich.

Der Erwartungswert für Moran's I bei Zufall beträgt[12]:

E(I)=1/(n1)

Geary's C

Geary's C[13] folgt einer ähnlichen Logik, allerdings wird nicht die Autokovarianz, sondern die Summe der quadrierten Abweichungen zugrunde gelegt und die Normierung etwas angepasst:

C=n12injnwijinjnwij(xixj)2in(xix)2

Geary's C kann Werte von 0 bis 2 annehmen, mit Werten < 1 als Indikator für eine positive räumliche Autokorrelation und > 1 als Indikator für negative räumliche Autokorrelation. Der Erwartungswert von Geary's C bei Zufall ist 1[14]. C ist im Vergleich zu Moran's I empfindlicher gegenüber kleinräumlichen Variationen und wird seltener genutzt.[15]

Lokale Maße

Für die Betrachtung von einzelnen Gebieten („lokale Betrachtung“) werden häufig

  • die von dem US-amerikanischen Geographen Arthur Getis und dem ebenfalls US-amerikanischen Betriebswirt J. Keith Ord entwickelten Indizes Gi und Gi* für die Analyse von Hotspots[16] oder
  • die von dem US-amerikanischen Geographen Luc Anselin entwickelten „Lokalen Indikatoren des räumlichen Zusammenhangs“[17] (Gamma, Local Moran's I und Local Geary's c) für die Analyse von Clustern

genutzt. „Lokale “Betrachtung bedeutet hier, dass nicht ein Index-Wert für alle betrachteten Orte berechnet wird, sondern für jeden Ort ein eigener Indexwert. Die lokalen Indexwerte geben also nicht Auskunft über die räumliche Konstellation insgesamt, sondern über die Stellung eines Ortes i innerhalb der räumlichen Konstellation. Während die globalen Maße also aussagen, ob es räumliche Cluster gibt, geben die lokalen Maße an, wo sich diese befinden.[18]

Getis-Ord G

Die G-Statistik von Getis und Ord ist ein inferenzstatistisches Maß der lokalen räumlichen Autokorrelation.[19] Der Wert G für einen Punkt i ergibt sich aus den Werten aller Punkte j, die innerhalb einer definierten Distanz d liegen. Das Gewicht w wird 1 für alle Punkte innerhalb der Distanz d und 0 für alle anderen Punkte und den Punkt i selbst. G ist nur definiert für den Fall, dass i und j nicht identisch sind, andernfalls wird statt Gi der leicht abgewandelte Index Gi* verwendet. Für jedes i werden ein p-Wert und ein z-Wert berechnet, die Auskunft über die Bedeutung des I-Wertes geben (z. B. High-High-Cluster mit signifikant hohen Werten in einer Nachbarschaft mit anderen hohen Werten). Hohe z-Werte deuten auf sogenannte „Hotspots“, niedrige z-Werte auf „Coldspots “hin.

Gi(d)=j=1nwij(d)xjj=1nxj

Local Moran's I

Local Moran's I ist ebenfalls ein inferenzstatistisches Maß der räumlichen Autokorrelation[20]. Für jedes i werden ein p-Wert und ein z-Wert berechnet, die Auskunft über die Bedeutung des I-Wertes geben (z. B. High-High-Cluster mit signifikant hohen Werten in einer Nachbarschaft mit anderen hohen Werten). Die Berechnung erfolgt, wie beim globalen Moran's I, durch Iteration über alle Kombination von Orten.

Ii=xixm2jwij(xjx);m2=i(xjx)2n

Software

Räumliche Autokorrelationen können mit allen gängigen Geoinformationssystemen (GIS), ggf. mit Hilfe von Plug-Ins, berechnet werden.[21] Außerdem können Spezialanwendungen für die räumliche Statistik wie zum Beispiel GeoDA oder CrimeStat[22] verwendet werden.

Literatur

Einzelnachweise