2
0
Fork 0
mirror of https://github.com/MartinThoma/LaTeX-examples.git synced 2025-04-24 22:08:04 +02:00

Einige Probleme beseitigt

This commit is contained in:
Martin Thoma 2014-01-20 08:29:52 +01:00
parent edde9da25b
commit bc73a5a948
5 changed files with 16 additions and 12 deletions

View file

@ -41,7 +41,8 @@ jedes Wort im Vokabular ein Wortknoten zum Graphen hinzugefügt. Alle
Knoten, die der Graph zuvor hatte, werden nun \enquote{Strukturknoten}
genannt.
Ein Strukturknoten $v$ wird genau dann mit einem Wortknoten $w \in W_t$
verbunden, wenn $w$ in einem Text von $v$ vorkommt.
verbunden, wenn $w$ in einem Text von $v$ vorkommt. \Cref{fig:erweiterter-graph}
zeigt beispielhaft den so entstehenden, bipartiten Graphen.
Der DYCOS-Algorithmus betrachtet also die Texte, die einem Knoten
zugeordnet sind, als eine Multimenge von Wörtern. Das heißt, zum einen
wird nicht auf die Reihenfolge der Wörter geachtet, zum anderen wird
@ -65,7 +66,7 @@ die strukturellen Sprünge und inhaltliche Mehrfachsprünge:
Dann heißt das zufällige wechseln des aktuell betrachteten
Knoten $v \in V_t$ zu einem benachbartem Knoten $w \in V_t$
ein struktureller Sprung.
ein \textit{struktureller Sprung}.
\end{definition}
\goodbreak
Im Gegensatz dazu benutzten inhaltliche Mehrfachsprünge

Binary file not shown.

View file

@ -22,7 +22,7 @@ für alle Knoten, die bisher noch nicht beschriftet sind.\\
\begin{definition}[Knotenklassifierungsproblem]\label{def:Knotenklassifizierungsproblem}
Sei $G_t = (V_t, E_t, V_{L,t})$ ein gerichteter Graph,
wobei $V_t$ die Menge aller Knoten,
$E_t$ die Kantenmenge und $V_{L,t} \subseteq V_t$ die Menge der
$E_t \subseteq V_t \times V_t$ die Kantenmenge und $V_{L,t} \subseteq V_t$ die Menge der
beschrifteten Knoten jeweils zum Zeitpunkt $t$ bezeichne.
Außerdem sei $L_t$ die Menge aller zum Zeitpunkt $t$ vergebenen
Knotenbeschriftungen und $f:V_{L,t} \rightarrow L_t$ die Funktion, die einen
@ -32,8 +32,8 @@ für alle Knoten, die bisher noch nicht beschriftet sind.\\
Textmenge $T(v)$ gegeben.
Gesucht sind nun Beschriftungen für $V_t \setminus V_{L,t}$, also
$\tilde{f}: V_t \rightarrow L_t$ mit
$\tilde{f}|_{V_{L,t}} = f$.
$\tilde{f}: V_t \setminus V_{L,t} \rightarrow L_t$. Die Aufgabe,
zu $G_t$ die Funktion $\tilde{f}$ zu finden heißt \textit{Knotenklassifierungsproblem}.
\end{definition}
\subsection{Herausforderungen}\label{sec:Herausforderungen}

View file

@ -6,10 +6,7 @@ Die Ausarbeitung soll 10-12 Seiten haben und die Präsentation
TODO
-----
* label -> Beschriftung
* Abschnitt "Problemstellung" überarbeiten
* Abbildung verlinken
* Algorithmen erklären
* Warum sind Stellenangaben überflüssig?
* Map erklären
* Algorithmus 4, S. 9

View file

@ -53,10 +53,16 @@ für den DYCOS-Algorithmus zu wählen ist. Dieser Parameter beschränkt
die Anzahl der möglichen Zielknoten $v' \in V_T$ auf diejenigen
$q$ Knoten, die $v$ bzgl. der Textanalyse am ähnlichsten sind.
In \cref{alg:l2} bis \cref{alg:l5} wird \cref{step:c1} durchgeführt.
In \cref{alg:l2} bis \cref{alg:l5} wird \cref{step:c1} durchgeführt
und alle erreichbaren Knoten in $reachableNodes$ mit der Anzahl
der Pfade, durch die sie erreicht werden können, gespeichert.
In \cref{alg:l6} wird \cref{step:c2} durchgeführt. Bei der
Wahl der Datenstruktur von $T$ ist zu beachten, dass man in
In \cref{alg:l6} wird \cref{step:c2} durchgeführt.
Ab hier gilt
\[ |T| = \begin{cases}q &\text{falls } |reachableNodes|\geq q\\
|reachableNodes| &\text{sonst }\end{cases}\]
Bei der Wahl der Datenstruktur von $T$ ist zu beachten, dass man in
\cref{alg:21} über Indizes auf Elemente aus $T$ zugreifen können muss.
In \cref{alg:l8} bis \cref{alg:l13} wird ein Wörterbuch erstellt,
@ -80,7 +86,7 @@ Wortknoten entspricht ausgewählt und schließlich zurückgegeben.
\State $reachableNodes[x] \gets reachableNodes[x] + 1$
\EndFor
\EndFor\label{alg:l5}
\State \label{alg:l6} $T \gets \Call{max}{reachableNodes, q}$ \Comment{Also: $|T| = q$, falls $|reachableNodes|\geq q$}
\State \label{alg:l6} $T \gets \Call{max}{reachableNodes, q}$
\\
\State \label{alg:l8} $s \gets 0$
\ForAll{Knoten $x \in T$}