Cluster-Algorithmen

Die in der Ähnlichkeitsmatrix (N mal N) gespeicherten Daten können auch zur Generierung von Baumgraphen (Stammbäumen) benützt werden. Dafür können die Verfahren der hierarchisch agglomerativen Klassifizierung herangezogen werden. Diese verfügt über zahlreiche Algorithmen, von denen hier nur die Verfahren Ward und Complete Linkage benützt werden. Die damit berechneten Bäume enthalten stets N binäre Verzweigungen, die ausgehend von den N „Blättern“ des „Baumes“ durch paarweise Verschmelzungen erzeugt werden. Abschließend werden aus der Struktur des Baumes die in der Nähe der Wurzel (bzw. des Stammes) gelegenen Ramifikationen zu Zwecken der Dialektklassifikation herangezogen.