mirror of
https://github.com/MartinThoma/LaTeX-examples.git
synced 2025-04-24 22:08:04 +02:00
48 lines
2.4 KiB
TeX
48 lines
2.4 KiB
TeX
Im Folgenden werden in \cref{sec:Motivation} einge Beispiele, in denen
|
|
der DYCOS-Algorithmus anwendung finden könnte, dargelegt. In
|
|
\cref{sec:Problemstellung} wird die Problemstellung formal definiert
|
|
und in \cref{sec:Herausforderungen} wird auf besondere Herausforderungen
|
|
der Aufgabenstellung hingewiesen.
|
|
|
|
\subsection{Motivation}\label{sec:Motivation}
|
|
Teilweise beschriftete Graphen sind allgegenwärtig. Publikationsdatenbanken
|
|
mit Publikationen als Knoten, Literaturverweisen und Zitaten als Kanten
|
|
sowie von Nutzern vergebene Beschriftungen (sog. {\it Tags}) oder Kategorien als Labels;
|
|
Wikipedia mit Artikeln als Knoten, Links als Kanten und Kategorien
|
|
als Labels sowie soziale Netzwerke mit Eigenschaften der Benutzer
|
|
als Labels sind drei Beispiele dafür.
|
|
Häufig sind Labels nur teilweise vorhanden und es ist wünschenswert die
|
|
fehlenden Labels automatisiert zu ergänzen.
|
|
|
|
\subsection{Problemstellung}\label{sec:Problemstellung}
|
|
Gegeben ist ein Graph, der teilweise gelabelt ist. Zusätzlich stehen
|
|
zu einer Teilmenge der Knoten Texte bereit. Gesucht sind nun Labels
|
|
für alle Knoten, die bisher noch nicht gelabelt sind.\\
|
|
|
|
\begin{definition}[Knotenklassifierungsproblem]\label{def:Knotenklassifizierungsproblem}
|
|
Sei $G_t = (V_t, E_t, V_{L,t})$ ein gerichteter Graph,
|
|
wobei $V_t$ die Menge aller Knoten,
|
|
$E_t$ die Kantenmenge und $V_{L,t} \subseteq V_t$ die Menge der
|
|
gelabelten Knoten jeweils zum Zeitpunkt $t$ bezeichne.
|
|
Außerdem sei $L_t$ die Menge aller zum Zeitpunkt $t$ vergebenen
|
|
Labels und $f:V_{L,t} \rightarrow L_t$ die Funktion, die einen
|
|
Knoten auf sein Label abbildet.
|
|
|
|
Weiter sei für jeden Knoten $v \in V$ eine (eventuell leere)
|
|
Textmenge $T(v)$ gegeben.
|
|
|
|
Gesucht sind nun Labels für $V_t \setminus V_{L,t}$, also
|
|
$\tilde{f}: V_t \rightarrow L_t$ mit
|
|
$\tilde{f}|_{V_{L,t}} = f$.
|
|
\end{definition}
|
|
|
|
\subsection{Herausforderungen}\label{sec:Herausforderungen}
|
|
Die Graphen, für die dieser Algorithmus konzipiert wurde,
|
|
sind viele $\num{10000}$~Knoten groß und dynamisch. \enquote{Dynamisch}
|
|
bedeutet in diesem Kontext, dass neue Knoten und eventuell auch neue
|
|
Kanten hinzu kommen bzw. Kanten oder Knoten werden entfernt werden.
|
|
Außerdem stehen textuelle Inhalte zu den
|
|
Knoten bereit, die bei der Klassifikation genutzt werden können.
|
|
Bei kleinen Änderungen sollte nicht alles nochmals berechnen
|
|
werden müssen, sondern basierend auf zuvor
|
|
berechneten Labels sollte die Klassifizierung angepasst werden.
|