Übergangskern

Aus testwiki
Version vom 17. November 2024, 13:21 Uhr von imported>Rosenfalter (growthexperiments-addlink-summary-summary:1|0|2)
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)
Zur Navigation springen Zur Suche springen

Vorlage:Dieser Artikel Als Übergangskern bezeichnet man spezielle Abbildungen zwischen Messräumen in der Wahrscheinlichkeitstheorie, die im ersten Argument messbar sind und im zweiten Argument ein Maß liefern. Spezialfälle von Übergangskernen sind die sogenannten stochastischen Kerne, die auch Markow-Kerne oder Wahrscheinlichkeitskerne genannt werden. Bei ihnen ist das Maß immer ein Wahrscheinlichkeitsmaß. Ist das Maß immer ein Sub-Wahrscheinlichkeitsmaß, so spricht man auch von Sub-Markow-Kernen oder substochastischen Kernen.

Insbesondere die Markow-Kerne spielen eine wichtige Rolle in der Wahrscheinlichkeitstheorie wie beispielsweise bei der Formulierung der regulären bedingten Verteilung oder der Theorie der stochastischen Prozesse. Hier bilden sie im Speziellen die Basis für die Formulierung der Übergangswahrscheinlichkeiten von Markow-Ketten oder Existenzaussagen wie den Satz von Ionescu-Tulcea.

Definition

Gegeben seien zwei Messräume (Ω0,𝒜0) und (Ω1,𝒜1). Eine Abbildung K:Ω0×𝒜1[0,] heißt ein Übergangskern von (Ω0,𝒜0) nach (Ω1,𝒜1), wenn gilt:

  • Für jedes xΩ0 ist K(x,) ein Maß auf (Ω1,𝒜1).
  • Für jedes A1𝒜1 ist K(,A1) eine 𝒜0-messbare Funktion.

Ist das Maß für alle xΩ0 ein σ-endliches Maß, so spricht man von einem σ-endlichen Übergangskern; ist es stets endlich, so spricht man von einem endlichen Übergangskern. Ist das Maß für alle xΩ0 ein Wahrscheinlichkeitsmaß, so nennt man K einen stochastischen Kern oder Markow-Kern. Ist das Maß für alle xΩ0 ein Sub-Wahrscheinlichkeitsmaß, so heißt K ein substochastischer Kern oder sub-Markow'scher Kern.

Bemerkung: Bei manchen Definitionen werden die Argumente von K in umgekehrter Reihenfolge geschrieben, K(A,x) oder auch K(A|x), in Anlehnung an bedingte Wahrscheinlichkeiten.

Elementare Beispiele

  • Die Poisson-Verteilung Poix(A):=K(x,A) ist ein Markow-Kern von (+,(+)) nach (,𝒫()). Denn die Funktion fA(x)=Poix(A) mit Parameter A𝒫() ist stetig in x+ und daher messbar. Des Weiteren ist für jedes x+ die Poisson-Verteilung mit Parameter x eine Wahrscheinlichkeitsverteilung. Also handelt es sich um einen Übergangskern.
  • Die stochastische Matrix
A=(012121212012012)
kann als ein Markow-Kern von ({1,2,3},𝒫({1,2,3})) nach ({1,2,3},𝒫({1,2,3})) aufgefasst werden. Denn für jedes i ist die i-te Zeile ein Wahrscheinlichkeitsvektor und damit ein Wahrscheinlichkeitsmaß auf {1,2,3}. Außerdem ist sie eine Abbildung zwischen endlichen Mengen versehen mit der Potenzmenge und damit messbar.

Eigenschaften

Maße durch Kerne

Jedem Maß μ auf (Ω,𝒜) ordnet K durch

ν(A)=ΩK(x,A)μ(dx)

ein Maß ν auf (Ω,𝒜) zu. Dieses Maß wird üblicherweise mit μK bezeichnet. Ist μ ein Wahrscheinlichkeitsmaß, gilt also μ(Ω)=1, dann ist auch μK(Ω)=1, das heißt, μK ist ebenfalls ein Wahrscheinlichkeitsmaß.

Im Fall (Ω,𝒜)=(Ω,𝒜) wird ein Maß μ, für das μ=μK gilt, stationäres Maß genannt. Ein stationäres Wahrscheinlichkeitsmaß heißt auch stationäre Verteilung.

Messbare Funktionen durch Kerne

Jeder nichtnegativen messbaren Funktion g:Ω ordnet K durch

f(x)=Ωg(y)K(x,dy)

eine nichtnegative messbare Funktion f:Ω zu. Diese Funktion wird üblicherweise mit Kg bezeichnet. Mit der Kurzschreibweise μf=Ωf(x)μ(dx) gilt für alle Maße μ auf (Ω,𝒜) und alle nichtnegativen messbaren Funktionen g:Ω die Gleichung (μK)g=μ(Kg).

Diskreter Fall

Im diskreten Fall, wo Ω und Ω endliche oder abzählbare Mengen sind, genügt es die Wahrscheinlichkeiten pi,j anzugeben, mit denen man vom Zustand i in den Zustand j gelangt. Mit den Bezeichnungen des allgemeinen Falls gilt dann pi,j=K(i,{j}). Diese Wahrscheinlichkeiten bilden eine Übergangsmatrix M=(pi,j)iΩ,jΩ, die die Eigenschaft hat, dass alle Elemente zwischen 0 und 1 liegen und dass die Zeilensummen jΩpi,j den Wert 1 haben. Eine solche Matrix wird als stochastische Matrix bezeichnet. Sie ordnet jeder Wahrscheinlichkeitsverteilung auf Ω mit einer Zähldichte ρ=(ρi)iΩ die Zähldichte

ρM=(iΩρipi,j)jΩ

einer Wahrscheinlichkeitsverteilung auf Ω zu, das heißt, ρM wird mit der üblichen Matrixmultiplikation berechnet, wobei Zähldichten als Zeilenvektoren aufgefasst werden.

Ist g:Ω eine nichtnegative Funktion, aufgefasst als Spaltenvektor (gj)jΩ mit nichtnegativen Einträgen, dann gilt

Kg=(jΩpi,jgj)iΩ.

Das heißt, im diskreten Fall wird auch Kg, aufgefasst als Spaltenvektor mit Indizes in Ω, mit der üblichen Matrixmultiplikation berechnet.

Bemerkung: Bei manchen Definitionen werden Zeilen und Spalten der Matrix umgekehrt verwendet.

Operationen von Übergangskernen

Verkettung

Sind drei Messräume (Ω0,𝒜0),(Ω1,𝒜1),(Ω2,𝒜2) gegeben sowie zwei substochastische Kerne K1 von (Ω0,𝒜0) nach (Ω1,𝒜1) und K2 von (Ω1,𝒜1) nach (Ω2,𝒜2), so ist die Verkettung der Kerne K1 und K2 eine Abbildung

K1K2:Ω0×𝒜2[0,)

definiert durch

(K1K2)(x0,A2)=Ω1K1(x0,dx1)K2(x1,A2).

Die Verkettung ist dann ein substochastischer Kern von (Ω0,𝒜0) nach (Ω2,𝒜2). Sind K1 und K2 stochastisch, dann ist auch K1K2 stochastisch.

Produkte

Gegeben seien die Maßräume (Ω1,𝒜1),(Ω2,𝒜2) und (Ω3,𝒜3) und zwei endliche Übergangskerne K1 von (Ω1,𝒜1) nach (Ω2,𝒜2) und K2 von (Ω1×Ω2,𝒜1𝒜2) nach (Ω3,𝒜3) . Dann definiert man das Produkt der Kerne K1 und K2

K1K2:Ω1×(𝒜2𝒜3)[0,)

als

(ω1,A)Ω2K1(ω1,dω2)Ω3K2((ω1,ω2),dω3)χA((ω2,ω3)).

Das Produkt K1K2 ist dann ein σ-endlicher Übergangskern von (Ω1,𝒜1) nach (Ω2×Ω3,𝒜2𝒜3). Sind beide Kerne stochastisch (bzw. substochastisch), so ist auch das Produkt der Kerne stochastisch (bzw. substochastisch).

Ist K2 nur ein Kern von (Ω2,𝒜2) nach (Ω3,𝒜3), so fasst man den Kern als Kern von (Ω1×Ω2,𝒜1𝒜2) auf, der unabhängig von der ersten Komponente ist.

Weitere Beispiele

  • Ist ν:𝒜[0,1] ein Wahrscheinlichkeitsmaß auf (Ω,𝒜), dann ist K(x,A)=ν(A) eine (von xΩ unabhängige) Übergangswahrscheinlichkeit.
  • Für (Ω,𝒜)=(Ω,𝒜) und das Diracmaß δx im Punkt xΩ wird durch I(x,A)=δx(A) eine Übergangswahrscheinlichkeit von (Ω,𝒜) nach (Ω,𝒜) definiert, die auch Einheitskern genannt wird. Es gilt μI=μ für alle Maße μ auf (Ω,𝒜) und If=f für alle nichtnegativen messbaren Funktionen f:Ω.
  • Sind k:Ω×Ω eine nichtnegative und bezüglich der Produkt-σ-Algebra 𝒜𝒜 messbare Funktion und ν ein Maß auf (Ω,𝒜) mit Ωk(x,y)ν(dy)=1 für alle xΩ, dann wird durch
K(x,A)=Ak(x,y)ν(dy)
eine Übergangswahrscheinlichkeit definiert. Hier ist also K(x,) das Wahrscheinlichkeitsmaß auf (Ω,𝒜) mit der ν-Wahrscheinlichkeitsdichte k(x,).
  • Sei n fest und Bn,p die Binomialverteilung mit Parametern n und p, aufgefasst als Wahrscheinlichkeitsmaß auf Ω={0,1,,n}. Dann wird durch
K(p,A)=Bn,p(A)
eine Übergangswahrscheinlichkeit von (Ω,𝒜)=([0,1],([0,1])) nach (Ω,𝒫(Ω)) definiert. Ist beispielsweise βa,b eine Betaverteilung auf (Ω,𝒜), dann ist βa,bK die zugehörige Beta-Binomialverteilung auf Ω.

Darstellung als Daniell-stetige Abbildungen und Komposition

Jedem Markow-Kern K von (Ω,𝒜) nach (Ω,𝒜) ist auf dem Raum E* der numerischen, nichtnegativen Funktionen f:Ω[0,] über

(Tf)(ω):=f(ω)K(ω,dω)

eine Abbildung T:E*E* mit folgenden Eigenschaften zugeordnet:

  1. f0Tf0 für jedes fE* (Positivität),
  2. fnfTfnTf für jede monoton wachsende Folge (fn) in E* (Daniell-Stetigkeit, nach Percy John Daniell),
  3. T(f+g)=Tf+Tg (Additivität).

Zu jeder Abbildung T mit diesen Eigenschaften gibt es wiederum genau einen Kern, für den T die so gebildete Abbildung darstellt.

Aus der Komposition dieser Abbildungen T1T2 kann eine Definition für die Komposition der zugehörigen Kerne hergeleitet werden: Durch

K1K2(ω,A)=K1(ω,dω)K2(ω,A)

ist ein stochastischer Kern von (Ω,𝒜) nach (Ω,𝒜) definiert, der als Komposition von K1 und K2 bezeichnet wird. Im diskreten Fall entspricht K1K2 der Multiplikation der beiden Übergangsmatrizen.

Spezielle Anwendungen

Markow-Kerne finden breite Anwendung bei der Modellbildung etwa unter Zuhilfenahme von Markow- und Hidden-Markow-Modellen. In der Quantenphysik werden oft Übergangswahrscheinlichkeiten zwischen quantenmechanischen Zuständen untersucht. Außerdem werden Markow-Kerne in der mathematischen Statistik verwendet, um im Rahmen eines allgemeinen statistischen Entscheidungsproblems eine Entscheidungsfunktion zu definieren, die jedem Ausgang eines Experiments eine Entscheidung zuordnet. Dabei kann die Entscheidung sowohl eine Parameterschätzung als auch die Wahl eines Konfidenzintervalls oder die Entscheidung für oder gegen eine Hypothese sein.

Literatur

  • Vorlage:Literatur
  • Heinz Bauer: Wahrscheinlichkeitstheorie. De Gruyter, Berlin 2002, ISBN 3-11-017236-4.
  • Erhan Çınlar: Probability and Stochastics. Springer, New York u. a. 2011, ISBN 978-0-387-87858-4.