Les données stockées dans la matrice de similarité (N fois N) peuvent également être utilisées pour générer des arborescences ou dendrogrammes (« arbres généalogiques »). Les méthodes de la classification numérique agglomérative du type hiérarchique -ascendant peuvent être appliquées à cette fin. Il existe de nombreux algorithmes utiles en la matière, dont seules les méthodes Ward et Complete Linkage sont utilisées ici. Les arbres calculés contiennent toujours N embranchements binaires, qui sont générés à partir des N « feuilles » de l'« arbre » par des fusions par paires. En fin de compte, les ramifications situées près de la « racine » (ou du « tronc ») de l’arbre sont utilisées pour la classification (géo)linguistique.