diff --git a/documents/DYCOS/Abgrenzung.tex b/documents/DYCOS/Abgrenzung.tex new file mode 100644 index 0000000..f3009c3 --- /dev/null +++ b/documents/DYCOS/Abgrenzung.tex @@ -0,0 +1,5 @@ +Es gibt viele Knotenklassifizierungsalgorithmen. Im folgenden +werden einige von Ihnen mit dem DYCOS-Algorithmus verglichen und +unterschiedliche Eigenschaften der Algorithmen hervorgehoben. + +Der MUCCA-Algorithmus aus \cite{zappella} sei der erste. diff --git a/documents/DYCOS/Ausblick.tex b/documents/DYCOS/Ausblick.tex new file mode 100644 index 0000000..e69de29 diff --git a/documents/DYCOS/DYCOS-Algorithmus.tex b/documents/DYCOS/DYCOS-Algorithmus.tex new file mode 100644 index 0000000..3e157bf --- /dev/null +++ b/documents/DYCOS/DYCOS-Algorithmus.tex @@ -0,0 +1,5 @@ +\subsection{Notation} +\input{Notation} + +\subsection{Inhalte} +\input{Inhalte} diff --git a/documents/DYCOS/DYCOS.tex b/documents/DYCOS/DYCOS.tex index 4765aa5..6f9130e 100644 --- a/documents/DYCOS/DYCOS.tex +++ b/documents/DYCOS/DYCOS.tex @@ -17,13 +17,16 @@ \usepackage{listings} \usepackage{subfigure} \usepackage{hyperref} +\usepackage{cite} +\usepackage{parskip} +\usepackage[framed,amsmath,thmmarks,hyperref]{ntheorem} \usepackage{mystyle} \setcounter{tocdepth}{3} \setcounter{secnumdepth}{3} \hypersetup{ - pdftitle = {Über die Klassifizierung von Knoten in einem dynamischen Netzwerk mit Inhalt}, + pdftitle = {"Uber die Klassifizierung von Knoten in dynamischen Netzwerken mit Inhalt}, pdfauthor = {Martin Thoma}, pdfkeywords = {DYCOS} } @@ -31,10 +34,10 @@ \begin{document} \mainmatter -\title{\"Uber die Klassifizierung von Knoten in einem dynamischen Netzwerk mit Inhalt} -\titlerunning{Titel der Seminararbeit} +\title{\"Uber die Klassifizierung von Knoten in dynamischen Netzwerken mit Inhalt} +\titlerunning{\"Uber die Klassifizierung von Knoten in dynamischen Netzwerken mit Inhalt} \author{Martin Thoma} -\authorrunning{Titel des Seminars} +\authorrunning{Proseminar Netzwerkanalyse} \institute{Betreuer: Christopher O\ss{}ner} \date{17.01.2014} \maketitle @@ -42,15 +45,19 @@ \begin{abstract}% \input{abstract} \end{abstract} +\clearpage \section{Einleitung} \input{Einleitung} -\section{Notation} -\input{Notation} +\section{Abgrenzung} +\input{Abgrenzung} -\section{Inhalte} -\input{Inhalte} +\section{DYCOS} +\input{DYCOS-Algorithmus} + +\section{Ausblick} +\input{Ausblick} % Normaler LNCS Zitierstil %\bibliographystyle{splncs} diff --git a/documents/DYCOS/Einleitung.tex b/documents/DYCOS/Einleitung.tex index 229ad7b..c4c9683 100644 --- a/documents/DYCOS/Einleitung.tex +++ b/documents/DYCOS/Einleitung.tex @@ -1,3 +1,46 @@ +\subsection{Motivation} +Teilweise gelabelte Netzwerke sind allgegenwärtig. Publikationsdatenbanken +mit Publikationen als Knoten, Literaturverweisen und Zitaten als Kanten +sowie Tags oder Kategorien als Labels; +Wikipedia mit Artikeln als Knoten, Links als Kanten und Kategorien +als Labels sowie soziale Netzwerke mit Eigenschaften der Benutzer +sind drei Beispiele dafür. +Da Labels nur teilweise vorhanden sind, ist es wünschenswert die +fehlenden Labels zu ergänzen. + +\subsection{Problemstellung} +Das Knotenklassifierungsproblem sei wie folgt definiert:\\ + +\begin{definition}[Knotenklassifierungsproblem]\label{def:Knotenklassifizierungsproblem} + Sei $\G_t = (\N_t, \A_t, \T_t)$ ein Netzwerk, + wobei $\N_t$ die Menge aller Knoten, + $\A_t$ die Kantenmenge und $\T_t \subseteq \N_t$ die Menge Knoten mit Labels + jeweils zum Zeitpunkt $t$ bezeichne. + Außerdem sei $\L_t$ die Menge aller zum Zeitpunkt $t$ vergebenen + Labels und $f:\T_t \rightarrow \L_t$ die Funktion, die einen + Knoten auf sein Label abbildet. + + Gesucht sind nun Labels für $\N_t \setminus \T_t$, also + $\tilde{f}:\N_t \rightarrow \L_t$ mit + $\tilde{f}|_{\T_t} = f$. +\end{definition} + +Wir haben häufig zusätzlich zu dem Graphen $\G_t$ und der Label-Funktion +$f$ aus Definition~\ref{def:Knotenklassifizierungsproblem} noch +textuelle Inhalte, die Knoten zugeornet werden. + + +\subsection{Herausforderungen} +Die beispielhaft aufgeführen Netzwerke sind viele +$\num{10000}$~Knoten groß und dynamisch. Das bedeutet, es kommen +neue Knoten und eventuell auch neue Kanten hinzu bzw. Kanten oder +Knoten werden entfernt.Außerdem stehen +textuelle Inhalte zu den Knoten bereit, die bei der Klassifikation +genutzt werden können. + +Der DYCOS-Algorithmus nutzt diese und kann auf große, dynamische +Netzwerken angewandt werden. + Der DYCOS-Algorithmus nutzt Random Walks im Graphen, startend von dem zu klassifizierenden Knoten $n$. Dabei wird pro Random Walk gezählt, welche Klasse $K$ am häufigsten gesehen wird. Der Knoten $n$ diff --git a/documents/DYCOS/Makefile b/documents/DYCOS/Makefile index bdb51b3..7c77f4d 100644 --- a/documents/DYCOS/Makefile +++ b/documents/DYCOS/Makefile @@ -2,6 +2,8 @@ DOKUMENT = DYCOS make: pdflatex $(DOKUMENT).tex -output-format=pdf # Referenzen erstellen + bibtex $(DOKUMENT) + pdflatex $(DOKUMENT).tex -output-format=pdf # Referenzen einbinden pdflatex $(DOKUMENT).tex -output-format=pdf # Referenzen einbinden make clean diff --git a/documents/DYCOS/abstract.tex b/documents/DYCOS/abstract.tex index 12830c0..d438e70 100644 --- a/documents/DYCOS/abstract.tex +++ b/documents/DYCOS/abstract.tex @@ -1,13 +1,8 @@ -Teilweise gelabelte Netzwerke sind allgegenwärtig. Publikationsdatenbanken -bzw. Wikipedia mit Kategorien, soziale Netzwerke mit Eigenschaften der -Benutzer und Datenbanken zur Analyse des Kaufverhaltens mit -Produkt oder Kundeneigenschaften als Labels. Da die Labels nur -teilweise vorhanden sind, ist es wünschenswert die fehlenden Labels -zu ergänzen. Doch häufig sind diese Netzwerke viele $\num{10000}$ -Knoten groß und ändern sich laufend. Außerdem stehen textuelle -Inhalte zu den Knoten bereit, die bei der Klassifikation genutzt -werden können. - -Der DYCOS-Algorithmus nutzt diese und kann auf große, dynamische -Netzwerken angewandt werden. +In dieser Arbeit wird der DYCOS-Algorithmus vorgestellt. Er +klassifiziert automatisch Knoten in Netzwerken, die bereits +teilweise gelabelt sind. Zur Klassifizierung kann er textuelle +Informationen, die den Knoten zugeordnet sind, nutzen. Auch ist +er für für viele $\num{10000}$ Knoten große, dynamische Netzwerke +geeignet.\\ +\textbf{Keywords:} DYCOS, Label Propagation, Knotenklassifizierung diff --git a/documents/DYCOS/literatur.bib b/documents/DYCOS/literatur.bib index 4abbe17..d9302b9 100644 --- a/documents/DYCOS/literatur.bib +++ b/documents/DYCOS/literatur.bib @@ -1,3 +1,12 @@ % This file was created with JabRef 2.3.1. % Encoding: Cp1252 +@Online{zappella, + author = {Giovanni Zappella}, + title = {A Scalable Multiclass Algorithm for Node Classification}, + version = {1}, + date = {2011-12-19}, + eprinttype = {arxiv}, + eprintclass = {cs.LG, cs.GT}, + eprint = {http://arxiv.org/abs/1112.4344v1} +} diff --git a/documents/DYCOS/mystyle.sty b/documents/DYCOS/mystyle.sty index 1c56fea..768c427 100644 --- a/documents/DYCOS/mystyle.sty +++ b/documents/DYCOS/mystyle.sty @@ -8,3 +8,12 @@ \def\nodes{\ensuremath{\mathcal{N}_t}} \def\labeledNodes{\ensuremath{\mathcal{T}_t}} \DeclareUnicodeCharacter{00A0}{~} + +\theoremstyle{definition} +\renewtheorem{definition}{Definition} + +\def\A{\ensuremath{\mathcal{A}}} +\def\G{\ensuremath{\mathcal{G}}} +\def\L{\ensuremath{\mathcal{L}}} +\def\N{\ensuremath{\mathcal{N}}} +\def\T{\ensuremath{\mathcal{T}}}