Verlustfunktion (Statistik)

Aus testwiki
Zur Navigation springen Zur Suche springen
Darstellung der Verlustfunktion

Eine Verlustfunktion (engl. loss function) ist eine spezielle Funktion in der mathematischen Statistik und Teil eines statistischen Entscheidungsproblemes. Sie ordnet jeder Entscheidung in Form einer Punktschätzung, einer Bereichsschätzung oder eines Tests den Schaden zu, der durch eine vom wahren Parameter abweichende Entscheidung entsteht. Gemeinsam mit der Entscheidungsfunktion wird die Verlustfunktion zur Risikofunktion kombiniert, die den potentiellen Schaden bei Verwendung einer Entscheidungsfunktion angibt.

Definition

Gegeben sei ein statistisches Modell (X,𝒜,(Pϑ)ϑΘ) und ein Entscheidungsraum (Ω,Σ). Dann heißt eine Funktion L:Θ×Ω[0,+] eine Verlustfunktion, wenn für jedes fixierte ϑΘ die Funktion L(ϑ,) Σ([0,+])-messbar ist. Das L steht dabei für loss, englisch für Verlust.

Die Verlustfunktion gibt den Verlust bei Vorliegen des Parameters ϑ an, wenn man sich für ωΩ entscheidet.

Klassische Verlustfunktionen

Gegeben sei die Parameterfunktion g von der Parametermenge Θ in die Entscheidungsmenge Ω, also g:ΘΩ und eine Norm auf der Entscheidungsmenge. Meist ist g(ϑ)=ϑ.

Eine typische Verlustfunktion ist dann

Lr(ϑ,ω):=ωg(ϑ)r

für ein r>0.

Im Rahmen der Probabilistischen Klassifikation können Scoring rules als Verlustfunktion eingesetzt werden.

Vorlage:Anker Laplace-Verlust

Ist r=1, also

L1(ϑ,ω):=ωg(ϑ),

so spricht man vom Laplace-Verlust.

Bei Wahl des Laplace-Verlusts die L-Unverfälschtheit zur Median-Unverfälschtheit und die Risikofunktion zum Mittleren betraglichen Fehler.

Vorlage:Anker Gauß-Verlust

Ist r=2, also

L2(ϑ,ω):=ωg(ϑ)2,

so spricht man vom Gauß-Verlust.

Wählt man in der Schätztheorie den Gauß-Verlust, so vereinfacht sich die L-Unverfälschtheit zur Erwartungstreue und die Risikofunktion zum mittleren quadratischen Fehler.

0-1-Verlust

Eine weitere wichtige Verlustfunktion ist der sogenannte 0-1-Verlust. Er ist definiert als

Lε(ϑ,ω):={1 falls ωg(ϑ)>ε0 falls ωg(ϑ)ε

für ein ε>0. Er bestraft alle Entscheidungen, die nahe genug an der „richtigen“ Entscheidung liegen, überhaupt nicht und alle, die einen gewissen Abstand zu ihr überschreiten, gleich stark. Im Rahmen von den mengenwertigen Bereichsschätzern wird der 0-1-Verlust dann auch definiert als

L(ϑ,ω):={1 falls g(ϑ)ω0 falls g(ϑ)ω,

da die Entscheidungen ω dann Mengen und keine einzelnen Werte mehr sind.

Neyman-Pearson-Verlustfunktion

Für statistische Tests verwendet man eine Abwandlung des 0-1-Verlustes, die sogenannten Neyman-Pearson-Verlustfunktion. Ist Θ=Θ0Θ1 eine Zerlegung des Parameterraumes in Hypothese Θ0 und Alternative Θ1 sowie a0 die Entscheidung für die Hypothese und a1 die Entscheidung für die Alternative, so wird die Verlustfunktion definiert durch

L(ϑ,a0)={0 falls ϑΘ0L1 falls ϑΘ1
L(ϑ,a1)={0 falls ϑΘ1L0 falls ϑΘ0.

Dabei ist L0,L1>0. L0 entspricht dann dem Verlust bei einem Fehler 1. Art, L1 bei einem Fehler 2. Art.

Siehe auch

Literatur