2
0
Fork 0
mirror of https://github.com/MartinThoma/LaTeX-examples.git synced 2025-04-26 06:48:04 +02:00

Inhaltlicher Mehrfachsprung -> Inhaltlicher Zweifachsprung

This commit is contained in:
Martin Thoma 2014-01-26 13:09:31 +01:00
parent dbbdbd5b4b
commit 32aedc66cc
8 changed files with 30 additions and 19 deletions

View file

@ -19,7 +19,7 @@ In diesem Fall macht es jedoch einen wichtigen Unterschied, ob jemand
Eine einfache Erweiterung des DYCOS-Algorithmus wäre der Umgang mit
mehreren Beschriftungen.
DYCOS beschränkt sich bei inhaltlichen Mehrfachsprüngen
DYCOS beschränkt sich bei inhaltlichen Zweifachsprüngen
auf die Top-$q$-Wortknoten, also die $q$ ähnlichsten Knoten
gemessen mit der Aggregatanalyse, allerdings wurde bisher noch nicht
untersucht, wie der Einfluss von $q \in \mathbb{N}$ auf die

View file

@ -58,7 +58,7 @@ jedes Wortes berücksichtigt.
\end{figure}
Entsprechend werden zwei unterschiedliche Sprungtypen unterschieden,
die strukturellen Sprünge und inhaltliche Mehrfachsprünge:
die strukturellen Sprünge und inhaltliche Zweifachsprünge:
\begin{definition}[struktureller Sprung]
Sei $G_{E,t} = (V_t, E_{S,t} \cup E_{W,t}, V_{L,t}, W_{t})$ der
@ -69,27 +69,27 @@ die strukturellen Sprünge und inhaltliche Mehrfachsprünge:
ein \textit{struktureller Sprung}.
\end{definition}
\goodbreak
Im Gegensatz dazu benutzten inhaltliche Mehrfachsprünge
Im Gegensatz dazu benutzten inhaltliche Zweifachsprünge
tatsächlich die Grapherweiterung:
\begin{definition}[inhaltlicher Mehrfachsprung]
\begin{definition}[inhaltlicher Zweifachsprung]
Sei $G_t = (V_t, E_{S,t} \cup E_{W,t}, V_{L,t}, W_{t})$ der
um die Wortknoten $W_{t}$ erweiterte Graph.
Dann heißt das zufällige wechseln des aktuell betrachteten
Knoten $v \in V_t$ zu einem benachbartem Knoten $w \in W_t$
und weiter zu einem zufälligem Nachbar $v' \in V_t$ von $w$
ein inhaltlicher Mehrfachsprung.
ein inhaltlicher Zweifachsprung.
\end{definition}
Jeder inhaltliche Mehrfachsprung beginnt und endet also in einem Strukturknoten,
Jeder inhaltliche Zweifachsprung beginnt und endet also in einem Strukturknoten,
springt über einen Wortknoten und ist ein Pfad der Länge~2.
Ob in einem Sprung der Random Walks ein struktureller Sprung oder
ein inhaltlicher Mehrfachsprung gemacht wird, wird jedes mal zufällig
ein inhaltlicher Zweifachsprung gemacht wird, wird jedes mal zufällig
neu entschieden. Dafür wird der Parameter $0 \leq p_S \leq 1$ für den Algorithmus
gewählt. Mit einer Wahrscheinlichkeit von $p_S$ wird ein struktureller
Sprung durchgeführt und mit einer Wahrscheinlichkeit
von $(1-p_S)$ ein modifizierter inhaltlicher Mehrfachsprung, wie er in
von $(1-p_S)$ ein modifizierter inhaltlicher Zweifachsprung, wie er in
\cref{sec:sprungtypen} erklärt wird, gemacht. Der
Parameter $p_S$ gibt an, wie wichtig die Struktur des Graphen im Verhältnis
zu den textuellen Inhalten ist. Bei $p_S = 0$ werden ausschließlich
@ -132,7 +132,7 @@ struktureller Sprung durchgeführt wird.
\If{$sprungTyp \leq p_S$}
\State $w \gets$ \Call{SturkturellerSprung}{$w$}
\Else
\State $w \gets$ \Call{InhaltlicherMehrfachsprung}{$w$}
\State $w \gets$ \Call{InhaltlicherZweifachsprung}{$w$}
\EndIf
\State $beschriftung \gets w.\Call{GetLabel}{ }$
\If{$!d.\Call{hasKey}{beschriftung}$}
@ -173,7 +173,7 @@ verwaltet der DYCOS-Algorithmus zwei weitere Datenstrukturen:
$w$ in den Texten von $v$.
\item Für jedes Wort des Vokabulars $W_t$ wird eine Liste von
Knoten verwaltet, in deren Texten das Wort vorkommt.
Diese Liste wird bei den inhaltlichen Mehrfachsprung,
Diese Liste wird bei den inhaltlichen Zweifachsprung,
der in \cref{sec:sprungtypen} erklärt wird,
verwendet.
\end{itemize}

Binary file not shown.

View file

@ -1,6 +1,6 @@
\subsection{Sprungtypen}\label{sec:sprungtypen}
Die beiden bereits definierten Sprungtypen, der strukturelle Sprung
sowie der inhaltliche Mehrfachsprung werden im folgenden erklärt.
sowie der inhaltliche Zweifachsprung werden im folgenden erklärt.
\goodbreak
Der strukturelle Sprung entspricht einer zufälligen Wahl eines
Nachbarknotens, wie es in \cref{alg:DYCOS-structural-hop}
@ -18,7 +18,7 @@ gezeigt wird.
\label{alg:DYCOS-structural-hop}
\end{algorithm}
Bei inhaltlichen Mehrfachsprüngen ist jedoch nicht sinnvoll so strikt
Bei inhaltlichen Zweifachsprüngen ist jedoch nicht sinnvoll so strikt
nach der Definition vorzugehen, also
direkt von einem strukturellem Knoten
$v \in V_t$ zu einem mit $v$ verbundenen Wortknoten $w \in W_t$ zu springen
@ -30,7 +30,7 @@ Gemeint sein können z.~B. das Bauwerk, das Entwurfsmuster der
objektorientierten Programmierung oder ein Teil des Gehirns.
Deshalb wird für jeden Knoten $v$, von dem aus man einen inhaltlichen
Mehrfachsprung machen will folgende Textanalyse durchgeführt:
Zweifachsprung machen will folgende Textanalyse durchgeführt:
\begin{enumerate}[label=C\arabic*,ref=C\arabic*]
\item \label{step:c1} Gehe alle in $v$ startenden Random Walks der Länge $2$ durch
und erstelle eine Liste $L$ der erreichbaren Knoten $v'$. Speichere
@ -42,10 +42,10 @@ CORA-Datensatz wurde in \cite[S. 364]{aggarwal2011} $q=10$ gewählt.}
Diese Knotenmenge heiße im Folgenden $T(v)$ und $p(v, v')$
sei die Anzahl der Pfade von $v$ über einen Wortknoten nach $v'$.
\item \label{step:c3} Wähle mit Wahrscheinlichkeit $\frac{p(v, v')}{\sum_{w \in T(v)} p(v, w)}$
den Knoten $v' \in T(v)$ als Ziel des Mehrfachsprungs.
den Knoten $v' \in T(v)$ als Ziel des Zweifachsprungs.
\end{enumerate}
Konkret könnte also ein inhaltlicher Mehrfachsprung sowie wie in
Konkret könnte also ein inhaltlicher Zweifachsprung sowie wie in
\cref{alg:DYCOS-content-multihop} beschrieben umgesetzt werden.
Der Algorithmus bekommt einen Startknoten $v \in V_T$ und
einen $q \in \mathbb{N}$ als Parameter. $q$ ist ein Parameter der
@ -76,10 +76,10 @@ der Pfaden der Länge 2 von $v$ nach $v'$ über einen beliebigen
Wortknoten entspricht ausgewählt und schließlich zurückgegeben.
\begin{algorithm}
\caption{Inhaltlicher Mehrfachsprung}
\caption{Inhaltlicher Zweifachsprung}
\label{alg:DYCOS-content-multihop}
\begin{algorithmic}[1]
\Procedure{InhaltlicherMehrfachsprung}{Knoten $v \in V_T$, $q \in \mathbb{N}$}
\Procedure{InhaltlicherZweifachsprung}{Knoten $v \in V_T$, $q \in \mathbb{N}$}
\State $erreichbareKnoten \gets$ leeres assoziatives Array\label{alg:l2}
\ForAll{Wortknoten $w$ in $v.\Call{getWordNodes}{ }$}
\ForAll{Strukturknoten $x$ in $w.\Call{getStructuralNodes}{ }$}