CUSUM

Aus testwiki
Zur Navigation springen Zur Suche springen

In der statistischen Prozess- und Qualitätskontrolle ist die kumulative Summe oder CUSUM (von Vorlage:EnS) eine sequentielle Analysemethode zur Entdeckung von Änderungen in einer sequentiellen Datenreihe oder Zeitreihe (z. B. Kurswechsel bzw. Wendepunkte).[1] E. S. Page definierte 1954 eine Qualitätszahl θ, einen Parameter einer Wahrscheinlichkeitsverteilung; z. B. den Erwartungswert. Er entwickelte CUSUM als Methode, um generelle Änderungen des Parameters aus zufälligem Rauschen herauszufiltern, und schlug ein Grenzkriterium vor, ab dem in den Prozess eingegriffen werden sollte. Einige Jahre später stellte George Alfred Barnard das V-Mask Diagramm vor zur visuellen Entdeckung von Änderungen von θ.[2]

Vorgehensweise

CUSUM betrachtet die kumulative Summen von Datenwerten xn und vorgegebenen Werten ωn:

S0=0
Sn=max(0,Sn1+xnωn)

Es ist wichtig anzumerken, dass CUSUM nicht die bloße kumulative Summe der Datenwerte ist, sondern die kumulative Summe der Differenzen zwischen den Datenwerten xn und ωn. Überschreitet der Wert von Sn+1 einen vorgegebenen Grenzwert, dann hat man eine Änderung gefunden. CUSUM erkennt also nicht nur scharfe Datenwertänderungen, sondern auch schrittweise und kontinuierliche über den Betrachtungszeitraum. Meist handelt es sich bei ω um eine Likelihood-Funktion, obwohl dies in Pages Artikel nicht so spezifiziert wird.

Beispiele

Beispiel 1

In dem Beispiel wird vorgegeben ωn=5 und betrachtet werden sowohl positive als auch negative kumulierte Abweichungen:

S0=S0+=S0=0
Sn+=max(0,Sn1++xnωn)
Sn=min(0,(Sn1xn+ωn))
Sn=Sn1ωn+xn
Datei:Cumsum.png
Grafische Darstellung der CUSUM Berechnung.
n Datenwert xn xnωn Sn+ Sn CUSUM Sn
0 0 0 0
1 2 −3 0 3 −3
2 4 −1 0 4 −4
3 7 +2 2 2 −2
4 3 −2 0 4 −4
5 9 +4 4 0 0

Sn kann auch aufgefasst werden:

  1. Alle Datenpunkte werden mittelwertbereinigt (xnωn) und
  2. zu jedem dadurch neu entstandenen Wert werden alle vorhergehenden mittelwertbereinigten Differenzen addiert.

Der Mittelwert ist dabei die Likelihoodschätzung für den Erwartungswert normalverteilter Datenwerte.

Beispiel 2

Die folgenden Grafiken zeigen den Verlauf von Sn, Sn+ und Sn in verschiedenen Situationen:

  • links: der Mittelwert des Prozesses ändert sich nicht
  • Mitte: der Mittelwert des Prozesses wird langsam größer (im Verhältnis zur Streuung)
  • rechts: der Mittelwert springt abrupt nach oben nach 60 Zeiteinheiten

In den Daten (oben) sind diese Änderungen kaum zu erkennen, jedoch im Verlauf der Sn, Sn+ und Sn Kurven (unten).

Literatur

Einzelnachweise