Indices de similarité

IRI (Indice Relatif d'Identité): mesure, toujours pour deux profils de points d'enquête appariés, le pourcentage des coïncidences (qualitatives) des types linguistiques (« taxats ») présents dans ces profils.
Hypothèse de base: pondération égale de tous les types linguistiques (« taxats ») considérés.

IPI (Indice Pondéré d'Identité): mesure, toujours pour deux profils de points d'enquête appariés, le pourcentage des co-identités (qualitatives) des types linguistiques (« taxats ») présents dans ces profils.
Hypothèse de base : pondération variable des types linguistiques (« taxats ») comparés en fonction de la taille de leurs aires de diffusion. L'appariement entre deux aires taxatoires de taille réduite est considéré comme étant numériquement plus important pour le résultat final que l'appariement entre deux aires de dimensions majeures, qualifiés - du point de vue géolinguistique - comme étant « moins significatif » ou « banal ». Dans la formule de l'IPI - plus précisément : IPI(x) - il y a un diviseur variable x (entre 1 [= pondération maximale] et infini [= pondération minimale]) pour régler la pondération. Ici, nous présentons les résultats basés sur la pondération maximale.

Remarque relative aux cartes isoglottiques et aux cartes à rayons : Le message cartographique des deux types de visualisation est complémentaire : alors que sur les cartes isoglottiques les différents côtés de polygone visualisent des distances (d), sur les cartes à rayons les côtés de triangle servent à la visualisation de similarités (s). La relation entre s et d est régie par la formule suivante : s + d = 1 (ou 100). Il en résulte : IRI + IRD (Indice Relatif de Distance) = 100. La même relation vaut pour l’IPI.

Les indices de similarité IRI et IPI s'appliquent uniquement aux données qualitatives de l'ALF (situées sur l'échelle nominale). Pour les données quantitatives de DEES, les indices de similarité suivants sont disponibles:

DEM (Distance Euclidienne Moyenne): Figure souvent, dans les manuels de statistique, sous le nom de « distance euclidienne ». Repose, en dernière analyse, sur le théorème de Pythagore (a² + bsup2; = c²).

r(BP) [Indice de corrélation de Bravais-Pearson]: Les scores du r(BP) – qui saisit la relation linéaire entre deux variables métriques – oscillent toujours entre -1 et +1. Auguste Bravais (1811-1863), physicien français; Karl Pearson (1857-1936), statisticien anglais.