diff --git a/documents/DYCOS/DYCOS-Algorithmus.tex b/documents/DYCOS/DYCOS-Algorithmus.tex index f74d0c0..f80e14f 100644 --- a/documents/DYCOS/DYCOS-Algorithmus.tex +++ b/documents/DYCOS/DYCOS-Algorithmus.tex @@ -41,7 +41,8 @@ jedes Wort im Vokabular ein Wortknoten zum Graphen hinzugefügt. Alle Knoten, die der Graph zuvor hatte, werden nun \enquote{Strukturknoten} genannt. Ein Strukturknoten $v$ wird genau dann mit einem Wortknoten $w \in W_t$ -verbunden, wenn $w$ in einem Text von $v$ vorkommt. +verbunden, wenn $w$ in einem Text von $v$ vorkommt. \Cref{fig:erweiterter-graph} +zeigt beispielhaft den so entstehenden, bipartiten Graphen. Der DYCOS-Algorithmus betrachtet also die Texte, die einem Knoten zugeordnet sind, als eine Multimenge von Wörtern. Das heißt, zum einen wird nicht auf die Reihenfolge der Wörter geachtet, zum anderen wird @@ -65,7 +66,7 @@ die strukturellen Sprünge und inhaltliche Mehrfachsprünge: Dann heißt das zufällige wechseln des aktuell betrachteten Knoten $v \in V_t$ zu einem benachbartem Knoten $w \in V_t$ - ein struktureller Sprung. + ein \textit{struktureller Sprung}. \end{definition} \goodbreak Im Gegensatz dazu benutzten inhaltliche Mehrfachsprünge diff --git a/documents/DYCOS/DYCOS.pdf b/documents/DYCOS/DYCOS.pdf index 47a82cb..a568568 100644 Binary files a/documents/DYCOS/DYCOS.pdf and b/documents/DYCOS/DYCOS.pdf differ diff --git a/documents/DYCOS/Einleitung.tex b/documents/DYCOS/Einleitung.tex index 5f32808..9df9621 100644 --- a/documents/DYCOS/Einleitung.tex +++ b/documents/DYCOS/Einleitung.tex @@ -22,7 +22,7 @@ für alle Knoten, die bisher noch nicht beschriftet sind.\\ \begin{definition}[Knotenklassifierungsproblem]\label{def:Knotenklassifizierungsproblem} Sei $G_t = (V_t, E_t, V_{L,t})$ ein gerichteter Graph, wobei $V_t$ die Menge aller Knoten, - $E_t$ die Kantenmenge und $V_{L,t} \subseteq V_t$ die Menge der + $E_t \subseteq V_t \times V_t$ die Kantenmenge und $V_{L,t} \subseteq V_t$ die Menge der beschrifteten Knoten jeweils zum Zeitpunkt $t$ bezeichne. Außerdem sei $L_t$ die Menge aller zum Zeitpunkt $t$ vergebenen Knotenbeschriftungen und $f:V_{L,t} \rightarrow L_t$ die Funktion, die einen @@ -32,8 +32,8 @@ für alle Knoten, die bisher noch nicht beschriftet sind.\\ Textmenge $T(v)$ gegeben. Gesucht sind nun Beschriftungen für $V_t \setminus V_{L,t}$, also - $\tilde{f}: V_t \rightarrow L_t$ mit - $\tilde{f}|_{V_{L,t}} = f$. + $\tilde{f}: V_t \setminus V_{L,t} \rightarrow L_t$. Die Aufgabe, + zu $G_t$ die Funktion $\tilde{f}$ zu finden heißt \textit{Knotenklassifierungsproblem}. \end{definition} \subsection{Herausforderungen}\label{sec:Herausforderungen} diff --git a/documents/DYCOS/README.md b/documents/DYCOS/README.md index 8e53973..152fc3c 100644 --- a/documents/DYCOS/README.md +++ b/documents/DYCOS/README.md @@ -6,10 +6,7 @@ Die Ausarbeitung soll 10-12 Seiten haben und die Präsentation TODO ----- -* label -> Beschriftung * Abschnitt "Problemstellung" überarbeiten -* Abbildung verlinken * Algorithmen erklären * Warum sind Stellenangaben überflüssig? -* Map erklären * Algorithmus 4, S. 9 diff --git a/documents/DYCOS/Sprungtypen.tex b/documents/DYCOS/Sprungtypen.tex index 3b556a9..dab974c 100644 --- a/documents/DYCOS/Sprungtypen.tex +++ b/documents/DYCOS/Sprungtypen.tex @@ -53,10 +53,16 @@ für den DYCOS-Algorithmus zu wählen ist. Dieser Parameter beschränkt die Anzahl der möglichen Zielknoten $v' \in V_T$ auf diejenigen $q$ Knoten, die $v$ bzgl. der Textanalyse am ähnlichsten sind. -In \cref{alg:l2} bis \cref{alg:l5} wird \cref{step:c1} durchgeführt. +In \cref{alg:l2} bis \cref{alg:l5} wird \cref{step:c1} durchgeführt +und alle erreichbaren Knoten in $reachableNodes$ mit der Anzahl +der Pfade, durch die sie erreicht werden können, gespeichert. -In \cref{alg:l6} wird \cref{step:c2} durchgeführt. Bei der -Wahl der Datenstruktur von $T$ ist zu beachten, dass man in +In \cref{alg:l6} wird \cref{step:c2} durchgeführt. +Ab hier gilt +\[ |T| = \begin{cases}q &\text{falls } |reachableNodes|\geq q\\ + |reachableNodes| &\text{sonst }\end{cases}\] + +Bei der Wahl der Datenstruktur von $T$ ist zu beachten, dass man in \cref{alg:21} über Indizes auf Elemente aus $T$ zugreifen können muss. In \cref{alg:l8} bis \cref{alg:l13} wird ein Wörterbuch erstellt, @@ -80,7 +86,7 @@ Wortknoten entspricht ausgewählt und schließlich zurückgegeben. \State $reachableNodes[x] \gets reachableNodes[x] + 1$ \EndFor \EndFor\label{alg:l5} - \State \label{alg:l6} $T \gets \Call{max}{reachableNodes, q}$ \Comment{Also: $|T| = q$, falls $|reachableNodes|\geq q$} + \State \label{alg:l6} $T \gets \Call{max}{reachableNodes, q}$ \\ \State \label{alg:l8} $s \gets 0$ \ForAll{Knoten $x \in T$}