mirror of
https://github.com/MartinThoma/LaTeX-examples.git
synced 2025-04-26 06:48:04 +02:00
Inhaltlicher Mehrfachsprung -> Inhaltlicher Zweifachsprung
This commit is contained in:
parent
dbbdbd5b4b
commit
32aedc66cc
8 changed files with 30 additions and 19 deletions
|
@ -19,7 +19,7 @@ In diesem Fall macht es jedoch einen wichtigen Unterschied, ob jemand
|
|||
Eine einfache Erweiterung des DYCOS-Algorithmus wäre der Umgang mit
|
||||
mehreren Beschriftungen.
|
||||
|
||||
DYCOS beschränkt sich bei inhaltlichen Mehrfachsprüngen
|
||||
DYCOS beschränkt sich bei inhaltlichen Zweifachsprüngen
|
||||
auf die Top-$q$-Wortknoten, also die $q$ ähnlichsten Knoten
|
||||
gemessen mit der Aggregatanalyse, allerdings wurde bisher noch nicht
|
||||
untersucht, wie der Einfluss von $q \in \mathbb{N}$ auf die
|
||||
|
|
|
@ -58,7 +58,7 @@ jedes Wortes berücksichtigt.
|
|||
\end{figure}
|
||||
|
||||
Entsprechend werden zwei unterschiedliche Sprungtypen unterschieden,
|
||||
die strukturellen Sprünge und inhaltliche Mehrfachsprünge:
|
||||
die strukturellen Sprünge und inhaltliche Zweifachsprünge:
|
||||
|
||||
\begin{definition}[struktureller Sprung]
|
||||
Sei $G_{E,t} = (V_t, E_{S,t} \cup E_{W,t}, V_{L,t}, W_{t})$ der
|
||||
|
@ -69,27 +69,27 @@ die strukturellen Sprünge und inhaltliche Mehrfachsprünge:
|
|||
ein \textit{struktureller Sprung}.
|
||||
\end{definition}
|
||||
\goodbreak
|
||||
Im Gegensatz dazu benutzten inhaltliche Mehrfachsprünge
|
||||
Im Gegensatz dazu benutzten inhaltliche Zweifachsprünge
|
||||
tatsächlich die Grapherweiterung:
|
||||
\begin{definition}[inhaltlicher Mehrfachsprung]
|
||||
\begin{definition}[inhaltlicher Zweifachsprung]
|
||||
Sei $G_t = (V_t, E_{S,t} \cup E_{W,t}, V_{L,t}, W_{t})$ der
|
||||
um die Wortknoten $W_{t}$ erweiterte Graph.
|
||||
|
||||
Dann heißt das zufällige wechseln des aktuell betrachteten
|
||||
Knoten $v \in V_t$ zu einem benachbartem Knoten $w \in W_t$
|
||||
und weiter zu einem zufälligem Nachbar $v' \in V_t$ von $w$
|
||||
ein inhaltlicher Mehrfachsprung.
|
||||
ein inhaltlicher Zweifachsprung.
|
||||
\end{definition}
|
||||
|
||||
Jeder inhaltliche Mehrfachsprung beginnt und endet also in einem Strukturknoten,
|
||||
Jeder inhaltliche Zweifachsprung beginnt und endet also in einem Strukturknoten,
|
||||
springt über einen Wortknoten und ist ein Pfad der Länge~2.
|
||||
|
||||
Ob in einem Sprung der Random Walks ein struktureller Sprung oder
|
||||
ein inhaltlicher Mehrfachsprung gemacht wird, wird jedes mal zufällig
|
||||
ein inhaltlicher Zweifachsprung gemacht wird, wird jedes mal zufällig
|
||||
neu entschieden. Dafür wird der Parameter $0 \leq p_S \leq 1$ für den Algorithmus
|
||||
gewählt. Mit einer Wahrscheinlichkeit von $p_S$ wird ein struktureller
|
||||
Sprung durchgeführt und mit einer Wahrscheinlichkeit
|
||||
von $(1-p_S)$ ein modifizierter inhaltlicher Mehrfachsprung, wie er in
|
||||
von $(1-p_S)$ ein modifizierter inhaltlicher Zweifachsprung, wie er in
|
||||
\cref{sec:sprungtypen} erklärt wird, gemacht. Der
|
||||
Parameter $p_S$ gibt an, wie wichtig die Struktur des Graphen im Verhältnis
|
||||
zu den textuellen Inhalten ist. Bei $p_S = 0$ werden ausschließlich
|
||||
|
@ -132,7 +132,7 @@ struktureller Sprung durchgeführt wird.
|
|||
\If{$sprungTyp \leq p_S$}
|
||||
\State $w \gets$ \Call{SturkturellerSprung}{$w$}
|
||||
\Else
|
||||
\State $w \gets$ \Call{InhaltlicherMehrfachsprung}{$w$}
|
||||
\State $w \gets$ \Call{InhaltlicherZweifachsprung}{$w$}
|
||||
\EndIf
|
||||
\State $beschriftung \gets w.\Call{GetLabel}{ }$
|
||||
\If{$!d.\Call{hasKey}{beschriftung}$}
|
||||
|
@ -173,7 +173,7 @@ verwaltet der DYCOS-Algorithmus zwei weitere Datenstrukturen:
|
|||
$w$ in den Texten von $v$.
|
||||
\item Für jedes Wort des Vokabulars $W_t$ wird eine Liste von
|
||||
Knoten verwaltet, in deren Texten das Wort vorkommt.
|
||||
Diese Liste wird bei den inhaltlichen Mehrfachsprung,
|
||||
Diese Liste wird bei den inhaltlichen Zweifachsprung,
|
||||
der in \cref{sec:sprungtypen} erklärt wird,
|
||||
verwendet.
|
||||
\end{itemize}
|
||||
|
|
Binary file not shown.
|
@ -1,6 +1,6 @@
|
|||
\subsection{Sprungtypen}\label{sec:sprungtypen}
|
||||
Die beiden bereits definierten Sprungtypen, der strukturelle Sprung
|
||||
sowie der inhaltliche Mehrfachsprung werden im folgenden erklärt.
|
||||
sowie der inhaltliche Zweifachsprung werden im folgenden erklärt.
|
||||
\goodbreak
|
||||
Der strukturelle Sprung entspricht einer zufälligen Wahl eines
|
||||
Nachbarknotens, wie es in \cref{alg:DYCOS-structural-hop}
|
||||
|
@ -18,7 +18,7 @@ gezeigt wird.
|
|||
\label{alg:DYCOS-structural-hop}
|
||||
\end{algorithm}
|
||||
|
||||
Bei inhaltlichen Mehrfachsprüngen ist jedoch nicht sinnvoll so strikt
|
||||
Bei inhaltlichen Zweifachsprüngen ist jedoch nicht sinnvoll so strikt
|
||||
nach der Definition vorzugehen, also
|
||||
direkt von einem strukturellem Knoten
|
||||
$v \in V_t$ zu einem mit $v$ verbundenen Wortknoten $w \in W_t$ zu springen
|
||||
|
@ -30,7 +30,7 @@ Gemeint sein können z.~B. das Bauwerk, das Entwurfsmuster der
|
|||
objektorientierten Programmierung oder ein Teil des Gehirns.
|
||||
|
||||
Deshalb wird für jeden Knoten $v$, von dem aus man einen inhaltlichen
|
||||
Mehrfachsprung machen will folgende Textanalyse durchgeführt:
|
||||
Zweifachsprung machen will folgende Textanalyse durchgeführt:
|
||||
\begin{enumerate}[label=C\arabic*,ref=C\arabic*]
|
||||
\item \label{step:c1} Gehe alle in $v$ startenden Random Walks der Länge $2$ durch
|
||||
und erstelle eine Liste $L$ der erreichbaren Knoten $v'$. Speichere
|
||||
|
@ -42,10 +42,10 @@ CORA-Datensatz wurde in \cite[S. 364]{aggarwal2011} $q=10$ gewählt.}
|
|||
Diese Knotenmenge heiße im Folgenden $T(v)$ und $p(v, v')$
|
||||
sei die Anzahl der Pfade von $v$ über einen Wortknoten nach $v'$.
|
||||
\item \label{step:c3} Wähle mit Wahrscheinlichkeit $\frac{p(v, v')}{\sum_{w \in T(v)} p(v, w)}$
|
||||
den Knoten $v' \in T(v)$ als Ziel des Mehrfachsprungs.
|
||||
den Knoten $v' \in T(v)$ als Ziel des Zweifachsprungs.
|
||||
\end{enumerate}
|
||||
|
||||
Konkret könnte also ein inhaltlicher Mehrfachsprung sowie wie in
|
||||
Konkret könnte also ein inhaltlicher Zweifachsprung sowie wie in
|
||||
\cref{alg:DYCOS-content-multihop} beschrieben umgesetzt werden.
|
||||
Der Algorithmus bekommt einen Startknoten $v \in V_T$ und
|
||||
einen $q \in \mathbb{N}$ als Parameter. $q$ ist ein Parameter der
|
||||
|
@ -76,10 +76,10 @@ der Pfaden der Länge 2 von $v$ nach $v'$ über einen beliebigen
|
|||
Wortknoten entspricht ausgewählt und schließlich zurückgegeben.
|
||||
|
||||
\begin{algorithm}
|
||||
\caption{Inhaltlicher Mehrfachsprung}
|
||||
\caption{Inhaltlicher Zweifachsprung}
|
||||
\label{alg:DYCOS-content-multihop}
|
||||
\begin{algorithmic}[1]
|
||||
\Procedure{InhaltlicherMehrfachsprung}{Knoten $v \in V_T$, $q \in \mathbb{N}$}
|
||||
\Procedure{InhaltlicherZweifachsprung}{Knoten $v \in V_T$, $q \in \mathbb{N}$}
|
||||
\State $erreichbareKnoten \gets$ leeres assoziatives Array\label{alg:l2}
|
||||
\ForAll{Wortknoten $w$ in $v.\Call{getWordNodes}{ }$}
|
||||
\ForAll{Strukturknoten $x$ in $w.\Call{getStructuralNodes}{ }$}
|
||||
|
|
Loading…
Add table
Add a link
Reference in a new issue