2014-01-20 10:01:05 +01:00
|
|
|
Den DYCOS-Algorithmus kann in einigen Aspekten erweitert werden.
|
|
|
|
So könnte man vor der Auswahl des Vokabulars jedes Wort auf den
|
|
|
|
Wortstamm zurückführen.
|
2014-01-12 17:46:43 +01:00
|
|
|
Dafür könnte zum Beispiel der in \cite{porter} vorgestellte
|
|
|
|
Porter-Stemming-Algorithmus verwendet werden. Durch diese Maßnahme wird das
|
2014-01-18 18:50:56 +01:00
|
|
|
Vokabular kleiner gehalten wodurch mehr Artikel mit einander
|
|
|
|
durch Vokabular verbunden werden können. Außerdem könnte so der
|
|
|
|
Gini-Koeffizient ein besseres Maß für die Gleichheit von Texten werden.
|
2013-12-27 19:14:51 +01:00
|
|
|
|
2014-01-11 19:27:50 +01:00
|
|
|
Eine weitere Verbesserungsmöglichkeit besteht in der Textanalyse.
|
2013-12-27 19:14:51 +01:00
|
|
|
Momentan ist diese noch sehr einfach gestrickt und ignoriert die
|
|
|
|
Reihenfolge von Wortern beziehungsweise Wertungen davon. So könnte
|
|
|
|
man den DYCOS-Algorithmus in einem sozialem Netzwerk verwenden wollen,
|
|
|
|
in dem politische Parteiaffinität von einigen Mitgliedern angegeben
|
|
|
|
wird um die Parteiaffinität der restlichen Mitglieder zu bestimmen.
|
|
|
|
In diesem Fall macht es jedoch einen wichtigen Unterschied, ob jemand
|
|
|
|
über eine Partei gutes oder schlechtes schreibt.
|
2013-12-28 18:52:58 +01:00
|
|
|
|
|
|
|
Eine einfache Erweiterung des DYCOS-Algorithmus wäre der Umgang mit
|
2014-01-19 21:47:36 +01:00
|
|
|
mehreren Beschriftungen.
|
2014-01-12 17:46:43 +01:00
|
|
|
|
|
|
|
DYCOS beschränkt sich bei inhaltlichen Mehrfachsprüngen
|
|
|
|
auf die Top-$q$-Wortknoten, also die $q$ ähnlichsten Knoten
|
|
|
|
gemessen mit der Aggregatanalyse, allerdings wurde bisher noch nicht
|
|
|
|
untersucht, wie der Einfluss von $q \in \mathbb{N}$ auf die
|
2014-01-12 18:14:47 +01:00
|
|
|
Klassifikationsgüte ist.
|