diff --git a/documents/DYCOS/DYCOS-Algorithmus.tex b/documents/DYCOS/DYCOS-Algorithmus.tex index 216ed0c..3d5eab3 100644 --- a/documents/DYCOS/DYCOS-Algorithmus.tex +++ b/documents/DYCOS/DYCOS-Algorithmus.tex @@ -42,7 +42,7 @@ Knoten, die der Graph zuvor hatte, werden nun \enquote{Strukturknoten} genannt. Ein Strukturknoten $v$ wird genau dann mit einem Wortknoten $w \in W_t$ verbunden, wenn $w$ in einem Text von $v$ vorkommt. \Cref{fig:erweiterter-graph} -zeigt beispielhaft den so entstehenden, bipartiten Graphen. +zeigt beispielhaft den so entstehenden, semi-bipartiten Graphen. Der DYCOS-Algorithmus betrachtet also die Texte, die einem Knoten zugeordnet sind, als eine Multimenge von Wörtern. Das heißt, zum einen wird nicht auf die Reihenfolge der Wörter geachtet, zum anderen wird diff --git a/documents/DYCOS/DYCOS.pdf b/documents/DYCOS/DYCOS.pdf index 00e9f87..2cc9288 100644 Binary files a/documents/DYCOS/DYCOS.pdf and b/documents/DYCOS/DYCOS.pdf differ diff --git a/presentations/Datamining-Proseminar/Hauptpresentation/LaTeX/Datamining-Proseminar-Hauptpresentation.pdf b/presentations/Datamining-Proseminar/Hauptpresentation/LaTeX/Datamining-Proseminar-Hauptpresentation.pdf new file mode 100644 index 0000000..ed4b694 Binary files /dev/null and b/presentations/Datamining-Proseminar/Hauptpresentation/LaTeX/Datamining-Proseminar-Hauptpresentation.pdf differ diff --git a/presentations/Datamining-Proseminar/Hauptpresentation/LaTeX/Sprungtypen.tex b/presentations/Datamining-Proseminar/Hauptpresentation/LaTeX/Sprungtypen.tex index 0bd0125..6396806 100644 --- a/presentations/Datamining-Proseminar/Hauptpresentation/LaTeX/Sprungtypen.tex +++ b/presentations/Datamining-Proseminar/Hauptpresentation/LaTeX/Sprungtypen.tex @@ -1,5 +1,5 @@ +\subsection{Sprungtypen} \framedgraphic{Sprungtypen}{../images/graph-content-and-structure.pdf} - \begin{frame}{Inhaltlicher Mehrfachsprung} \begin{itemize} \item<1-> \textbf{Struktursprung}: von Strukturknoten $v$ zu Strukturknoten $v'$ diff --git a/presentations/Datamining-Proseminar/Hauptpresentation/LaTeX/Ueberblick.tex b/presentations/Datamining-Proseminar/Hauptpresentation/LaTeX/Ueberblick.tex index 0270a47..3f0590c 100644 --- a/presentations/Datamining-Proseminar/Hauptpresentation/LaTeX/Ueberblick.tex +++ b/presentations/Datamining-Proseminar/Hauptpresentation/LaTeX/Ueberblick.tex @@ -75,4 +75,4 @@ \end{itemize} \end{frame} -\framedgraphic{Erweiterter, bipartiter Graph}{../images/graph-content-and-structure.pdf} +\framedgraphic{Erweiterter, semi-bipartiter Graph}{../images/graph-content-and-structure.pdf} diff --git a/presentations/Datamining-Proseminar/Hauptpresentation/LaTeX/Vokabular.tex b/presentations/Datamining-Proseminar/Hauptpresentation/LaTeX/Vokabular.tex index 89f0e31..d4f91e5 100644 --- a/presentations/Datamining-Proseminar/Hauptpresentation/LaTeX/Vokabular.tex +++ b/presentations/Datamining-Proseminar/Hauptpresentation/LaTeX/Vokabular.tex @@ -9,8 +9,8 @@ \uncover<4->{ \textbf{Idee}: \begin{itemize} - \item<5-> Gini-Koeffizient nutzen - \item<6-> Zufällige Beispielmenge von Texten für Vokabularbildung betrachten + \item<5-> Zufällige Beispielmenge von Texten für Vokabularbildung betrachten + \item<6-> Gini-Koeffizient nutzen \end{itemize} } \end{frame} @@ -20,7 +20,7 @@ \item<1-> statistisches Maß für Ungleichverteilung \item<2-> $g = \sum_i p_i^2$ mit $p_i$ als relative Häufigkeit \item<3-> $g \in (0, 1]$ - \item<4-> $g$ nahe bei $1$ $\Rightarrow$ Wort kommt selten vor + \item<4-> $g$ nahe bei $1$ $\Rightarrow$ Wort ist stark ungleich verteilt \item[$\Rightarrow$]<5-> Nehme Top-$m$ Wörter mit höchstem Gini-Koeffizient \end{itemize}