mirror of
https://github.com/MartinThoma/LaTeX-examples.git
synced 2025-04-26 06:48:04 +02:00
Fix typo in documents/Proseminar-Netzwerkanalyse
This commit is contained in:
parent
87020467c7
commit
9438adee4e
2 changed files with 5 additions and 5 deletions
Binary file not shown.
|
@ -6,11 +6,11 @@ die in fast allen Texten vorkommen, wie im Deutschen z.~B.
|
||||||
\enquote{und}, \enquote{mit} und die Pronomen. Es ist wünschenswert Wörter zu
|
\enquote{und}, \enquote{mit} und die Pronomen. Es ist wünschenswert Wörter zu
|
||||||
wählen, die die Texte möglichst stark voneinander Unterscheiden. Der
|
wählen, die die Texte möglichst stark voneinander Unterscheiden. Der
|
||||||
DYCOS-Algorithmus wählt die Top-$m$ dieser Wörter als Vokabular, wobei
|
DYCOS-Algorithmus wählt die Top-$m$ dieser Wörter als Vokabular, wobei
|
||||||
$m \in \mathbb{N}$ eine Festzulegende Konstante ist. In \cite[S. 365]{aggarwal2011}
|
$m \in \mathbb{N}$ eine festzulegende Konstante ist. In \cite[S. 365]{aggarwal2011}
|
||||||
wird der Einfluss von $m \in \Set{5,10, 15,20}$ auf die Klassifikationsgüte
|
wird der Einfluss von $m \in \Set{5,10, 15,20}$ auf die Klassifikationsgüte
|
||||||
untersucht und festgestellt, dass die Klassifikationsgüte mit größerem $m$
|
untersucht und festgestellt, dass die Klassifikationsgüte mit größerem $m$
|
||||||
sinkt, sie also für $m=5$ für den DBLP-Datensatz am höchsten ist. Für den CORA-
|
sinkt, sie also für $m=5$ für den DBLP-Datensatz am höchsten ist. Für den
|
||||||
Datensatz wurde mit $m \in \set{3,4,5,6}$ getestet und kein signifikanter
|
CORA-Datensatz wurde mit $m \in \set{3,4,5,6}$ getestet und kein signifikanter
|
||||||
Unterschied festgestellt.
|
Unterschied festgestellt.
|
||||||
|
|
||||||
Nun kann man manuell eine Liste von zu beachtenden Wörtern erstellen
|
Nun kann man manuell eine Liste von zu beachtenden Wörtern erstellen
|
||||||
|
@ -42,8 +42,8 @@ Datenstruktur wird in \cref{alg4:l10} bis \ref{alg4:l12} gefüllt.
|
||||||
In \cref{alg4:l17} bis \ref{alg4:l19} wird die relative Häufigkeit der Wörter
|
In \cref{alg4:l17} bis \ref{alg4:l19} wird die relative Häufigkeit der Wörter
|
||||||
bzgl. der Beschriftungen bestimmt. Daraus wird in \cref{alg4:l20} bis
|
bzgl. der Beschriftungen bestimmt. Daraus wird in \cref{alg4:l20} bis
|
||||||
\ref{alg4:l22} der Gini-Koeffizient berechnet. Schließlich werden in
|
\ref{alg4:l22} der Gini-Koeffizient berechnet. Schließlich werden in
|
||||||
\cref{alg4:l23} bis \ref{alg4:l24} die Top-$q$ Wörter mit den höchsten Gini-
|
\cref{alg4:l23} bis \ref{alg4:l24} die Top-$q$ Wörter mit den
|
||||||
Koeffizienten zurückgegeben.
|
höchsten Gini-Koeffizienten zurückgegeben.
|
||||||
|
|
||||||
\begin{algorithm}[ht]
|
\begin{algorithm}[ht]
|
||||||
\begin{algorithmic}[1]
|
\begin{algorithmic}[1]
|
||||||
|
|
Loading…
Add table
Add a link
Reference in a new issue