Fonctionnement de l'outil Rechercher des sites similaires
L'outil Rechercher des sites similaires permet d'évaluer les nouveaux sites potentiels par rapport à un site connu dont les performances sont satisfaisantes, appelé un site principal.
Pourquoi est-ce que les performances de certains points de vente sont-elles meilleures que d'autres ? L'axiome "emplacement, emplacement, emplacement" en vigueur depuis longtemps dans le secteur de l'immobilier constitue généralement la part la plus importante de la réponse. L'outil Rechercher des sites similaires repose sur l'idée selon laquelle les caractéristiques d'un site principal peuvent être utilisées pour rechercher des sites similaires ailleurs. L'outil Rechercher des sites similaires permet d'évaluer des données surfaciques, par exemple des anneaux simples, des temps de trajet et d'autres formes de zones de chalandise. L'outil vous permet également d'évaluer des sites potentiels (points), car la couche cible et les anneaux seront créés autour de l'emplacement de chaque site cible.
Le site principal peut s'appuyer sur votre meilleur emplacement ou sur un emplacement standard. Vous pouvez sélectionner un site principal en fonction d'un point de vente doté d'un assortiment de produits en particulier ou d'un point de vente doté du taux le plus élevé de ventes de magasins comparables. Vous devez choisir le candidat de site principal sur lequel l'outil Rechercher des sites similaires basera ses évaluations. Vous pouvez choisir votre site principal en sélectionnant un point sur la carte, en saisissant une adresse ou en sélectionnant une entité dans une couche de points ou de polygones.
Vous pouvez par exemple utiliser comme sites évalués une base de données de points ajoutée en tant que couche à l'aide des outils Intégration des points de vente, une base de données de points géocodée par latitude/longitude ou adresse et intégrée à l'aide de l'assistant de configuration des couches d'analyse, des anneaux, des temps de trajet ou des zones de chalandise créées dans Business Analyst ou n'importe quel polygone ajouté en tant que couche sur la carte et intégré avec l'assistant de configuration des couches d'analyse.
Même si cela n'est pas obligatoire, il est conseillé de comparer les zones de taille similaire autour du site principal et des sites évalués. Par exemple, si vous utilisez un temps de trajet de cinq minutes autour de votre site principal, vous devez créer et utiliser un temps de trajet de cinq minutes autour des autres entités dans la couche cible.
Vous pouvez exécuter l'outil Rechercher des sites similaires de deux manières : à l'aide de la méthode Rechercher des sites similaires conventionnelle et de la méthode Analyse des Composantes Principales (ACP).
Méthode Rechercher des sites similaires conventionnelle
La méthode Rechercher des sites similaires conventionnelle classe les zones de chalandise en comparant les valeurs (cinq variables au maximum) du site principal et des sites évalués. Vous attribuez un pourcentage +/- par lequel vous souhaitez évaluer les sites en fonction de la valeur du site principal. Les sites se voient ensuite attribuer un score allant de 1 à 5 en fonction du nombre de variables répondant aux critères que vous avez définis.
Méthode Analyse des Composantes Principales (ACP)
L'analyse peut également être exécutée sur des points (points de vente) ou des polygones. Lorsque vous exécutez votre analyse sur une classe d'entités points et sélectionnez un rayon autour de chaque point, les données sont attribuées au cercle dans lequel l'analyse a été exécutée et sur les données contenues dans les rayons. Si vous choisissez une couche de polygones pour exécuter l'analyse, les données contenues dans chaque polygone seront utilisées pour classer chaque polygone et votre sortie sera fonction des contours de ces polygones.
Pour exécuter votre analyse avec des données clients, vous devez d'abord ajouter ces données dans certaines zones de chalandise et exécuter l'analyse sur cette couche.
La méthode Rechercher des sites similaires conventionnelle compare le site principal aux autres entités de la couche cible en fonction des variables que vous sélectionnez. Cette méthode repose sur l'hypothèse fondamentale selon laquelle vous connaissez les variables qui sont importantes dans le classement des sites en fonction de la similarité. Le fait que vous puissiez identifier précisément les variables appropriées est une hypothèse qui risque de ne pas tenir dans la plupart des cas. Par exemple, si les groupes d'îlots ont été utilisés comme niveau géographique, le choix des variables appropriées n'est pas simple. Il arrive que la définition de la plage sur +/- 60 pour cent pour les variables choisies ne permettent pas de trouver un site similaire.
Grâce à la méthode ACP, il n'est plus nécessaire de sélectionner des variables pour obtenir un classement des sites en fonction du niveau de similarité. Vous pouvez évaluer la similarité à l'aide d'un ensemble prédéfini de variables que vous choisissez ou utiliser toutes les variables fournies.
L'illustration ci-dessous montre comment les variables ou les voisins peuvent être sélectionnés, K représentant le nombre de voisins à trouver.
L'algorithme ACP considère un ensemble de variable pour chaque site comme un vecteur. Il considère ensuite un ensemble de vecteurs pour tous les sites potentiels et le site principal, et exécute l'analyse des composantes principales dans l'ordre suivant :
- Il crée une matrice des covariances.
- Il recherche les valeurs et les vecteurs propres de la matrice des covariances.
- A l'aide du critère Kaiser, il supprime les vecteurs propres comportant des valeurs propres inférieures à 1.
- Ces vecteurs propres constituent le sous-espace de l'espace initial.
- Les projections sont calculées pour tous les vecteurs de ce sous-espace.
- Il normalise les données projetées sur l'intervalle [0,1].
- Il utilise la distance L2 (euclidienne) pour choisir les K sites potentiels similaires les plus proches.
La couche obtenue contenant les K sites potentiels les plus proches du site principal seront codées par couleurs en fonction de la distance L2 par rapport au site principal.