Dominierte Verteilungsklasse

Aus testwiki
Zur Navigation springen Zur Suche springen

Eine dominierte Verteilungsklasse ist in der mathematischen Statistik eine Menge von Wahrscheinlichkeitsmaßen, die alle absolut stetig bezüglich eines Maßes sind. Statistische Modelle mit dominierten Verteilungsklassen sind einfacher zu handhaben als solche ohne, da die Existenz einer Wahrscheinlichkeitsdichte garantiert ist und damit Methoden wie die Maximum-Likelihood-Methode angewandt werden können. Außerdem existieren für dominierte Verteilungsklassen gut handhabbare Kriterien für Suffizienz und Minimalsuffizienz.

Definition

Gegeben sei ein Messraum (Ω,Σ) sowie eine Menge 𝒫 von Wahrscheinlichkeitsmaßen auf diesem Messraum. Die Menge 𝒫 heißt dann eine dominierte Verteilungsklasse, wenn ein σ-endliches Maß μ existiert, so dass für alle P𝒫 gilt, dass

Pμ

gilt. Jedes P ist also absolut stetig bezüglich μ, das heißt für alle AΣ mit μ(A)=0 gilt auch P(A)=0. Dies wird dann auch mit 𝒫μ notiert.

Beispiele

  • Per Definition ist die Exponentialfamilie eine dominierte Verteilungsklasse, da sie als genau die Verteilungsklasse definiert ist, die eine vorgegebene Dichte bezüglich eines Maßes hat.
  • Definiert man als Verteilungsklasse 𝒫 genau diejenigen Wahrscheinlichkeitsmaße auf , die eine Wahrscheinlichkeitsdichte besitzen, so ist auch dies eine dominierte Verteilungsklasse. Dominierendes Maß ist hier das Lebesgue-Maß.
  • Ist C die Cantor-Verteilung und definiert man mit obigem 𝒫 die neue Verteilungsklasse als 𝒫*=𝒫C, so ist per se nicht klar, ob 𝒫* eine dominierte Verteilungsklasse ist oder nicht. 𝒫* wird jetzt nicht mehr durch das Lebesque-Maß dominiert, da die Cantor-Verteilung keine Dichte bezüglich des Lebesgue-Maßes hat. Nicht klar ist aber, ob es ein anderes σ-endliches Maß gibt, dass 𝒫* dominiert, oder ob ein solches Maß nicht existieren kann und damit die Verteilungsklasse zu einer nicht dominierten Verteilungsklasse macht.

Eigenschaften

  • Ist 𝒫 eine dominierte Verteilungsklasse, so wird diese Klasse auch immer durch ein Wahrscheinlichkeitsmaß dominiert. Denn ist μσ ein σ-endliches Maß, das die Verteilungsklasse dominiert, so lässt sich durch
μW(A):=n=112nμσ(AnA)μσ(An)
ein Wahrscheinlichkeitsmaß definieren, das die Verteilungsklasse dominiert. Dabei sind die An eine Zerlegung von Ω mit 0<μσ(An)<, wie in der Definition des σ-endlichen Maßes gefordert wird.
  • Ist 𝒫 eine dominierte Verteilungsklasse, so existiert immer ein P*, so dass 𝒩𝒫=𝒩P* und P* eine abzählbare Konvexkombination mit echt positiven Koeffizienten von Elementen aus 𝒫 ist. Es gilt also
P*=i=1αiPi mit αi>0 und i=1αi=1.
Dabei bezeichnet 𝒩𝒫 die Menge aller 𝒫-Nullmengen. Dieses P* spielt eine wichtige Rolle im Satz von Halmos-Savage und einigen aus ihm abgeleiteten Ergebnissen.
  • Ist 𝒫 eine dominierte Verteilungsklasse und ist 𝒫n die Klasse der n-fachen Produktmaße, so ist auch 𝒫n dominiert.
  • Ist 𝒫 dominiert durch μ und ist f eine messbare Funktion und sind alle Bildmaße Pf unter f σ-endlich, so ist auch die Verteilungsklasse der Bildmaße 𝒫f dominiert von μf.
  • Ist 𝒫 separabel bezüglich der Totalvariationsmetrik, so ist 𝒫 dominiert.
  • Ist 𝒫L die von P erzeugte Lokationsklasse, so ist 𝒫L genau dann eine dominierte Verteilungsklasse, wenn P dominiert ist.
  • Ist die σ-Algebra 𝒜 des statistischen Modells separabel und die Verteilungsklasse dominiert, so ist die Verteilungsklasse separabel bezüglich der Totalvariationsmetrik.

Verwendung

Nach dem Satz von Radon-Nikodým existieren für dominierte Verteilungsklassen immer Wahrscheinlichkeitsdichten bezüglich des dominierenden Maßes. Diese Existenzaussage ermöglicht bei stochastischen Modellen, die mit einer dominierten Verteilungsklasse ausgestattet sind, die Anwendung von Methoden, die auf Wahrscheinlichkeitsdichten beruhen. Ein Beispiel hierfür ist die Maximum-Likelihood-Methode.

Außerdem existieren bei dominierten Verteilungsklassen Kriterien, welche die Überprüfung der Suffizienz von σ-Algebren und Suffizienz von Statistiken erleichtern. Die meisten dieser Kriterien bauen auf dem Satz von Halmos-Savage unter Verwendung des oben konstruierten Maßes P* auf. Eines dieser Kriterien ist das Neyman-Kriterium, das beispielsweise die Suffizienz der Exponentialfamilie liefert.

Aus dem Satz von Halmos-Savage lässt sich auch ableiten, dass für dominierte Verteilungsklassen immer eine minimalsuffiziente σ-Algebra existiert. Sie wird von den Dichten der P bezüglich P* erzeugt.

Literatur