Evidence lower bound

Die Evidence lower bound (kurz ELBO)^[1], ist eine untere Schranke der Log-Likelihood-Funktion beobachteter Daten (X) und nützlich bei der Variational Inference.

Definition

Seien $X$ und $Z$ Zufallsvariablen, dann gilt $p_{θ} (X) = \int p_{θ} (X, Z = z) p (Z = z) d z .$ Unter Einführung von $q_{ϕ} (Z = z)$ als einfach zu verwendender Stichproben-Vorschlags-Verteilung gilt: $p_{θ} (X) = \int p_{θ} (X, Z = z) \frac{p (Z = z)}{q_{ϕ} (Z = z)} q_{ϕ} (Z = z) d z = E_{z \sim q_{ϕ}} [p_{θ} (X, Z = z) \frac{p (Z = z)}{q_{ϕ} (Z = z)}] .$

Somit gilt für die Log-Likelihood aufgrund der Jensen-Ungleichung: $\log (p_{θ} (X)) = \log (E_{z \sim q_{ϕ}} [p_{θ} (X, Z = z) \frac{p (Z = z)}{q_{ϕ} (Z = z)}]) \geq E_{z \sim q_{ϕ}} [\log (p_{θ} (X, Z = z) \frac{p (Z = z)}{q_{ϕ} (Z = z)})] .$

$E_{z \sim q_{ϕ}} [\log (p_{θ} (X, Z = z) \frac{p (Z = z)}{q_{ϕ} (Z = z)})]$ wird als ELBO bezeichnet.

Durch Schätzen der ELBO unter Verwendung des Stichprobenmittelwertes ist: ${\hat{E}}_{z \sim q_{ϕ}} [\log (p_{θ} (X, Z = z) \frac{p (Z = z)}{q_{ϕ} (Z = z)})] = \frac{1}{N} \sum_{i = 1}^{N} \log (p_{θ} (X, Z = z_{i}) \frac{p (Z = z_{i})}{q_{ϕ} (Z = z_{i})})$

Anwendung

Die Minimierung der Kullback-Leibler-Divergenz ist äquivalent zur Maximierung der Evidence lower bound. Die evidence lower bound wird bei der variational inference optimiert.

Einzelnachweise

↑ An Introduction to Bayesian Inference, Methods and Computation, Nick Heard, 2021, ISBN 978-3-030-82808-0, https://www.google.de/books/edition/An_Introduction_to_Bayesian_Inference_Me/9t5IEAAAQBAJ?hl=de&gbpv=1&dq=evidence%20lower%20bound&pg=PA57&printsec=frontcover

[1] An Introduction to Bayesian Inference, Methods and Computation, Nick Heard, 2021, ISBN 978-3-030-82808-0, https://www.google.de/books/edition/An_Introduction_to_Bayesian_Inference_Me/9t5IEAAAQBAJ?hl=de&gbpv=1&dq=evidence%20lower%20bound&pg=PA57&printsec=frontcover

[1]

Evidence lower bound

Definition

Anwendung

Einzelnachweise

Navigationsmenü

Suche