2
0
Fork 0
mirror of https://github.com/MartinThoma/LaTeX-examples.git synced 2025-04-19 11:38:05 +02:00
LaTeX-examples/publications/Proseminar-Netzwerkanalyse/Ausblick.tex

22 lines
1.4 KiB
TeX

Den DYCOS-Algorithmus kann in einigen Aspekten erweitert werden. So könnte man
vor der Auswahl des Vokabulars jedes Wort auf den Wortstamm zurückführen. Dafür
könnte zum Beispiel der in \cite{porter} vorgestellte Porter-Stemming-Algorithmus verwendet werden. Durch diese Maßnahme wird das Vokabular kleiner
gehalten wodurch mehr Artikel mit einander durch Vokabular verbunden werden
können. Außerdem könnte so der Gini-Koeffizient ein besseres Maß für die
Gleichheit von Texten werden.
Eine weitere Verbesserungsmöglichkeit besteht in der Textanalyse. Momentan ist
diese noch sehr einfach gestrickt und ignoriert die Reihenfolge von Wörtern
beziehungsweise Wertungen davon. So könnte man den DYCOS-Algorithmus in einem
sozialem Netzwerk verwenden wollen, in dem politische Parteiaffinität von
einigen Mitgliedern angegeben wird um die Parteiaffinität der restlichen
Mitglieder zu bestimmen. In diesem Fall macht es jedoch einen wichtigen
Unterschied, ob jemand über eine Partei gutes oder schlechtes schreibt.
Eine einfache Erweiterung des DYCOS-Algorithmus wäre der Umgang mit mehreren
Beschriftungen.
DYCOS beschränkt sich bei inhaltlichen Zweifachsprüngen auf die
Top-$q$-Wortknoten, also die $q$ ähnlichsten Knoten gemessen mit der
Aggregatanalyse, allerdings wurde bisher noch nicht untersucht, wie der
Einfluss von $q \in \mathbb{N}$ auf die Klassifikationsgüte ist.