ArcGIS Help 10.2 - Fonctionnement de l'outil Prospection clients à l'aide d'ACP

L'outil Prospection clients à l'aide d'ACP permet d'analyser rapidement et facilement une base de données des clients. Grâce à lui, l'analyse n'a plus besoin de déterminer les seuils démographiques des données de ses clients. L'utilisateur identifie simplement les variables démographiques représentatives de ses clients, et l'outil se charge du reste. Il analyse les données démographiques sélectionnées au sein des géographies dans lesquelles se trouvent vos points de clients et les compare à l'aide de la méthode Analyse des Composantes Principales (ACP), en classant ces géographies en fonction de la similarité entre les valeurs démographiques et vos données clients. Ce processus permet d'obtenir une liste de géographies thématiquement appariées en fonction de leur classement. Les géographies sont classées de 1 à x (x correspondant au nombre de géographies sélectionnées à classer), où 1 représente le meilleur appariement possible pour les données clients.

Méthode Analyse des Composantes Principales (ACP)

Grâce à la méthode ACP, il n'est plus nécessaire de sélectionner des variables pour obtenir un classement des sites en fonction du niveau de similarité. Vous pouvez évaluer la similarité à l'aide d'un ensemble prédéfini de variables que vous choisissez ou utiliser toutes les variables fournies.

L'illustration ci-dessous montre comment les variables ou les voisins peuvent être sélectionnés, K représentant le nombre de voisins à trouver.

L'algorithme ACP considère un ensemble de variable pour chaque site comme un vecteur. Il considère ensuite un ensemble de vecteurs pour tous les sites potentiels et le site principal, et exécute l'analyse des composantes principales dans l'ordre suivant :

Il crée une matrice des covariances.
Il recherche les valeurs et les vecteurs propres de la matrice des covariances.
A l'aide du critère Kaiser, il supprime les vecteurs propres comportant des valeurs propres inférieures à 1.
Ces vecteurs propres constituent le sous-espace de l'espace initial.
Les projections sont calculées pour tous les vecteurs de ce sous-espace.
Il normalise les données projetées sur l'intervalle [0,1].
Il utilise la distance L2 (euclidienne) pour choisir les K sites potentiels similaires les plus proches.

La couche obtenue contenant les K sites potentiels les plus proches du site principal seront codées par couleurs en fonction de la distance L2 par rapport au site principal.

5/10/2014