2
0
Fork 0
mirror of https://github.com/MartinThoma/LaTeX-examples.git synced 2025-04-26 06:48:04 +02:00
LaTeX-examples/documents/math-speech-a515/math-speech-a515.tex
Martin Thoma 7740f0147f Remove trailing spaces
The commands

find . -type f -name '*.md' -exec sed --in-place 's/[[:space:]]\+$//' {} \+

and

find . -type f -name '*.tex' -exec sed --in-place 's/[[:space:]]\+$//' {} \+

were used to do so.
2015-10-14 14:25:34 +02:00

95 lines
3.8 KiB
TeX

\documentclass[a4paper]{scrartcl}
\usepackage{amssymb, amsmath} % needed for math
\usepackage[utf8]{inputenc} % this is needed for umlauts
\usepackage[ngerman]{babel} % this is needed for umlauts
\usepackage[T1]{fontenc} % this is needed for correct output of umlauts in pdf
\usepackage[margin=2.5cm]{geometry} %layout
\usepackage{hyperref} % links im text
\usepackage{parskip}
\title{Praktikum Spracherkennung}
\author{Martin Thoma}
\hypersetup{
pdfauthor = {Martin Thoma},
pdfkeywords = {},
pdftitle = {Praktikum Spracherkennung}
}
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
% Begin document %
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
\begin{document}
\section{Aufgabe}
Berechnen Sie den Logarithmus der Wahrscheinlichkeit des Musters $m$, wenn die
eben definierte Gauß-Mixtur gegeben ist (d.h. die HMM
Emissionswahrscheinlichkeit).
\section{Gegeben}
\begin{align}
m &= \begin{pmatrix}2\\2\end{pmatrix} \in \mathbb{R}^d & \Sigma_{s,i} &= \begin{pmatrix}1 & 0 \\0 & 1\end{pmatrix} \in \mathbb{R}^{d \times d}\\
c_{s,1} &= 0.3 \in [0,1] & c_{s,2} &= 0.7 \in [0,1]\\
\mu_{s,1} &= \begin{pmatrix}1\\3\end{pmatrix} \in \mathbb{R}^d & \mu_{s,2} &= \begin{pmatrix}2\\4\end{pmatrix} \in \mathbb{R}^d
\end{align}
\[p(x|s) = \sum_{i=1}^{n_s} c_{s, i} \frac{1}{\sqrt{(2 \pi)^d |\Sigma_{s,i}|}} e^{-\frac{1}{2} {(x-\mu_{s,i})}^T \Sigma_{s,i}^{-1}(x-\mu_{s,i})}\]
mit
\begin{itemize}
\item $s$ (für \textit{senone}) ist die kleinste Einheit die der
automatische Spracherkenner zu erkennen in der lage sein soll.
\item $m$ ist das zu klassifizierende Muster.
\item $c_{s,i}$ sind die Gewichte der Gauss-Verteilungen. Ihre Summe muss
1 ergeben, damit das Ergebnis wieder eine
Wahrscheinlichkeitsdichtefunktion ist.
\item $\Sigma_{s,i}$ ist die Kovarianzmatrix. Sie ist invertierbar und
ihre Determinate $|\Sigma_{s,i}| \neq 0$.
\item $d$ ist die Dimension der Feature-Vektoren.
\item $n_s$ ist die Anzahl der Gauss-Verteilungen
\item $p(x|s)$ ist die Wahrscheinlichkeitsdichtefunktion, gegeben das
Senone $s$ für das Muster $x$.
\end{itemize}
\section{Erklärung}
Eine Gauss-Verteilung hat die Wahrscheinlichkeitsdichte $f:\mathbb{R} \rightarrow [0,1]$
\[f(x) := \frac{1}{\sqrt{2 \pi \sigma^2}} e^{-\frac{1}{2}(\frac{x - \mu}{\sigma})^2}\]
wobei $\mu$ der Erwartungswert und $\sigma^2$ die Varianz ist.
Man schreibt
\[X \sim \mathcal{N}(\mu, \sigma^2)\]
Eine multivariate Gauss-Verteilung ist eine Verallgemeinerung auf mehrdimensionale
Zufallsvariablen. Sie hat die Wahrscheinlichkeitsdichte $f: \mathbb{R}^n \rightarrow [0,1]$
\[f(x) := \frac{1}{\sqrt{(2\pi)^n|\Sigma|}} e^{-\tfrac{1}{2}(x-\mu)^{T}\Sigma^{-1}(x-\mu)}\]
wobei $\mu$ der Erwartungswert und $\Sigma$ die Kovarianz-Matrix ist.
Man schreibt
\[X \sim \mathcal{N}_n(\mu, \Sigma)\]
Eine Multinomialverteilung ist eine diskrete Wahrscheinlichkeitsverteilung.
\section{Einsetzen}
\begin{align}
p(m|s) &= \sum_{i=1}^{2} c_{s, i} \frac{1}{\sqrt{(2 \pi)^2}} e^{-\frac{1}{2} {(m_1 - \mu_{1,s,i})^2+(m_2 - \mu_{2,s,i})^2}}\\
&= 0.3 \frac{1}{\sqrt{(2 \pi)^2}} e^{-\frac{1}{2} ({1^2+ (-1)^2})} + 0.7 \frac{1}{\sqrt{(2 \pi)^2}} e^{-\frac{1}{2} ({0^2+ (-2)^2}})\\
&= \frac{1}{2 \pi} (0.3 e^{-1} + 0.7 e^{-2})\\
&\approx 0.0326\\
\log(p(m|s)) &\approx -3.4234
\end{align}
\section{Fragen}
$p(m|s)$ ist nicht die Wahrscheinlichkeit von $m$. Die Wahrscheinlichkeit
eines einzelnen Wertes einer kontinuierlichen Zufallsvariable ist immer $0$,
da sonst die Summe der Wahrscheinlichkeiten unendlich wäre. Ist das
dennoch der gewünschte Wert?
Was hat das mit den HMMs zu tun? Sollte da eventuell GMM stehen?
Was ist eine multinominale multivariate Gauss-Verteilung? Wo ist der
Unterschied zur multivariaten Gauss-Verteilung?
\end{document}