mirror of
https://github.com/MartinThoma/LaTeX-examples.git
synced 2025-04-26 06:48:04 +02:00
Verbesserungsvorschlaege von C. Oessner (Email vom 15.01.2014) eingearbeitet; Definition von 'Random Walk' hinzugefügt
This commit is contained in:
parent
be452cf225
commit
3c8ca52391
7 changed files with 51 additions and 42 deletions
|
@ -3,9 +3,9 @@ vielen Punkten verbessern. So könnte man vor der Auswahl des
|
|||
Vokabulars jedes Wort auf den Wortstamm zurückführen.
|
||||
Dafür könnte zum Beispiel der in \cite{porter} vorgestellte
|
||||
Porter-Stemming-Algorithmus verwendet werden. Durch diese Maßnahme wird das
|
||||
Vokabular kleiner gehalten, mehr Artikel können mit einander
|
||||
durch Vokabular verbunden werden und der Gini-Koeffizient wird ein
|
||||
besseres Maß für die Gleichheit von Texten.
|
||||
Vokabular kleiner gehalten wodurch mehr Artikel mit einander
|
||||
durch Vokabular verbunden werden können. Außerdem könnte so der
|
||||
Gini-Koeffizient ein besseres Maß für die Gleichheit von Texten werden.
|
||||
|
||||
Eine weitere Verbesserungsmöglichkeit besteht in der Textanalyse.
|
||||
Momentan ist diese noch sehr einfach gestrickt und ignoriert die
|
||||
|
|
Loading…
Add table
Add a link
Reference in a new issue