2
0
Fork 0
mirror of https://github.com/MartinThoma/LaTeX-examples.git synced 2025-04-25 06:18:05 +02:00
LaTeX-examples/documents/DYCOS/Einleitung.tex

49 lines
2.4 KiB
TeX
Raw Normal View History

Im Folgenden werden in \cref{sec:Motivation} einge Beispiele, in denen
der DYCOS-Algorithmus anwendung finden könnte, dargelegt. In
\cref{sec:Problemstellung} wird die Problemstellung formal definiert
und in \cref{sec:Herausforderungen} wird auf besondere Herausforderungen
der Aufgabenstellung hingewiesen.
\subsection{Motivation}\label{sec:Motivation}
Teilweise beschriftete Graphen sind allgegenwärtig. Publikationsdatenbanken
mit Publikationen als Knoten, Literaturverweisen und Zitaten als Kanten
sowie von Nutzern vergebene Beschriftungen (sog. {\it Tags}) oder Kategorien als Labels;
Wikipedia mit Artikeln als Knoten, Links als Kanten und Kategorien
als Labels sowie soziale Netzwerke mit Eigenschaften der Benutzer
als Labels sind drei Beispiele dafür.
Häufig sind Labels nur teilweise vorhanden und es ist wünschenswert die
fehlenden Labels automatisiert zu ergänzen.
\subsection{Problemstellung}\label{sec:Problemstellung}
2014-01-12 18:14:47 +01:00
Gegeben ist ein Graph, der teilweise gelabelt ist. Zusätzlich stehen
2013-12-29 19:06:20 +01:00
zu einer Teilmenge der Knoten Texte bereit. Gesucht sind nun Labels
für alle Knoten, die bisher noch nicht gelabelt sind.\\
\begin{definition}[Knotenklassifierungsproblem]\label{def:Knotenklassifizierungsproblem}
Sei $G_t = (V_t, E_t, V_{L,t})$ ein gerichteter Graph,
wobei $V_t$ die Menge aller Knoten,
$E_t$ die Kantenmenge und $V_{L,t} \subseteq V_t$ die Menge der
2013-12-27 15:16:41 +01:00
gelabelten Knoten jeweils zum Zeitpunkt $t$ bezeichne.
Außerdem sei $L_t$ die Menge aller zum Zeitpunkt $t$ vergebenen
Labels und $f:V_{L,t} \rightarrow L_t$ die Funktion, die einen
Knoten auf sein Label abbildet.
Weiter sei für jeden Knoten $v \in V$ eine (eventuell leere)
2013-12-29 19:06:20 +01:00
Textmenge $T(v)$ gegeben.
Gesucht sind nun Labels für $V_t \setminus V_{L,t}$, also
$\tilde{f}: V_t \rightarrow L_t$ mit
$\tilde{f}|_{V_{L,t}} = f$.
\end{definition}
\subsection{Herausforderungen}\label{sec:Herausforderungen}
2013-12-29 19:06:20 +01:00
Die Graphen, für die dieser Algorithmus konzipiert wurde,
sind viele $\num{10000}$~Knoten groß und dynamisch. \enquote{Dynamisch}
bedeutet in diesem Kontext, dass neue Knoten und eventuell auch neue
Kanten hinzu kommen bzw. Kanten oder Knoten werden entfernt werden.
Außerdem stehen textuelle Inhalte zu den
2013-12-27 15:16:41 +01:00
Knoten bereit, die bei der Klassifikation genutzt werden können.
Bei kleinen Änderungen sollte nicht alles nochmals berechnen
werden müssen, sondern basierend auf zuvor
berechneten Labels sollte die Klassifizierung angepasst werden.