Onglet Données
Paramètres de répartition avancés
Différentes méthodes permettent de récupérer plus précisément les données. Ceci est important lorsqu'une zone de chalandise traverse une couche démographique. Les modes de sélection plus traditionnels font appel à une méthode de répartition reposant sur la surface seule. Ce processus peut compromettre la précision si aucune donnée répartie équitablement dans des zones géographiques n'est disponible. Dans la plupart des cas, les populations ou les logements sont répartis de manière irrégulière au sein de contours géographiques, tels que les codes postaux, les comtés ou les régions.
Business Analyst offre les méthodes de répartition des données suivantes. Vous avez la possibilité de modifier ces paramètres pour parvenir à l'approche de récupération des données que vous souhaitez.
- Répartition sur une maille fine : cette méthode est la méthode de répartition et d'extraction des données la plus précise, quel que soit le niveau. Cependant, le temps de traitement est important, car la pondération du pourcentage démographique est examinée dans chaque point d'îlot.
- Centroïde en cascade : permet de récupérer les données plus rapidement, généralement sur des zones géographiques de grande envergure. Seuls les centroïdes géographiques des niveaux que vous choisissez sont renvoyés dans votre analyse. Ces centroïdes contiennent exactement les mêmes attributs démographiques que leurs polygones correspondants.
- Hybride : fusion des deux premières méthodes qui permet de bénéficier d'une grande précision à des niveaux plus faibles (Répartition sur une maille fine) et d'un traitement plus rapide à des niveaux géographiques plus importants (Centroïde en cascade). L'utilisation du centroïde en cascade au lieu de la répartition sur une maille fine aux niveaux plus importants renvoie des différences statistiques minimes. Par conséquent, la précision globale n'est pas compromise avec cette approche combinatoire.
Index de performance BDS
Business Analyst vous permet de créer des index de performance BDS personnalisés qui sont optimisés pour vos données personnalisées. Les index de performance permettent d'agréger les données et de créer efficacement des rapports de synthèse. Ces index de performance peuvent être créés lors de la configuration des données personnalisées. Vous pouvez également utiliser à tout moment le bouton Créer un index dans les paramètres de tolérance avancés. Si le bouton Créer un index est actif, aucun index n'existe actuellement pour votre couche personnalisée. Les index de performance BDS personnalisés peuvent uniquement être utilisés avec les niveaux géographiques BDS standard comme base (groupes d'îlots, secteurs de recensement, codes postaux et ainsi de suite). Chaque index de performance est copié à l'emplacement dans lequel votre couche BDS personnalisée est enregistrée. Des index de performance BDS étant créés par défaut pour tous les niveaux de données Esri, le bouton Recréer un index est inactif.
Paramètres du seuil de distance
Les paramètres des zones de seuil de répartition des données dans Business Analyst sont exprimés en unités de surface au carré, telles que les miles ou les kilomètres carrés. Une recherche de grande envergure a été menée afin d'identifier les baisses de performance de la récupération des données en fonction de la taille géographique d'une surface, la méthode de calcul et la hiérarchie des données. C'est pour cela que des seuils de zone par défaut sont définis pour la méthode hybride, la méthode de répartition sur une maille fine et la méthode de centroïde en cascade. Vous pouvez modifier ces paramètres conformément à votre propre méthodologie personnalisée.
Cette section traite des options de l'onglet Données et des paramètres de distance par défaut. Comme la plupart des zones de chalandise sont de formes irrégulières, les seuils reposent sur la distance maximum de hauteur ou de largeur.
- Dans la section Format de données en sortie, vous pouvez modifier le format de données en sortie. Vous avez le choix entre le fichier de géométries, la géodatabase personnelle et la géodatabase fichier.
- Cochez la case Utiliser d'autres alias pour la couche BDS pour afficher les valeurs définies dans la description de la variable de remplacement créée dans l'assistant de configuration des données personnalisées sous Paramètres de données personnalisés.
Vous pouvez ajouter ou soustraire des niveaux en cliquant sur les boutons plus ou moins. Cliquez sur un mode de calcul pour définir la méthode de calcul des données sur BlockApportionment (répartition sur une maille fine) ou CentroidsInPolygon (centroïde en cascade). Cliquez sur une couche de données pour la modifier. Par exemple, vous pouvez définir BlockGroups sur Codes postaux. La couche des comtés est l'option de contour la plus importante pour la récupération des données.
L'image ci-dessous montre une distance de référence pour les paramètres de répartition hybride des données par défaut.
Les nombres représentés dans l'image de la boîte de dialogue Paramètres de tolérance avancés ci-dessus correspondent à l'image ci-dessous.
Jusqu'à 101 miles : groupe d'îlots. La répartition sur une maille fine est indiquée dans la zone en jaune.
152 miles : les centroïdes des groupes d'îlots sont indiqués dans la zone en rouge.
202 miles : le centroïde des secteurs de recensement est indiqué dans la zone en bleu foncé.
404 miles : les centroïdes des codes postaux sont indiqués dans la zone en bleu clair.
Supérieur à 404 (ou plus comme indiqué dans l'image de la boîte de dialogue Paramètres de tolérance avancés ci-dessus) : les centroïdes des comtés sont indiqués dans la zone en blanc la plus éloignée.
Le seuil de distance est calculé à l'aide de la valeur maximale de la hauteur et de la largeur d'une zone de chalandise. Contrairement à l'exemple ci-dessus, de nombreuses zones de chalandise ne sont pas des cercles parfaits, mais des formes irrégulières. L'exemple ci-dessous montre comment calculer une valeur maximale pour une zone de chalandise de forme irrégulière.
Pour déterminer le seuil de distance, un polygone est tracé autour des points les plus éloignés d'une zone de chalandise. La valeur la plus importante entre la largeur et la hauteur du polygone est utilisée comme seuil de distance. Dans l'exemple ci-dessous, la largeur de la zone de chalandise est de 80 miles et la hauteur de 55 miles. Comme 80 miles (largeur) est la valeur la plus importante et qu'elle est inférieure au seuil de 101 miles, les points d'îlot sont récupérés à partir de la zone de chalandise.
Répartition sur une maille fine et centroïde en cascade
Cette section explique les méthodes de répartition sur une maille fine et de centroïde en cascade lorsque de petites zones géographiques sont utilisées. Dans cet exemple, les deux méthodes sont utilisées dans la même zone exactement pour extraire des données à l'aide de la superposition spatiale à partir des contours des codes postaux.
Reportez-vous à l'image ci-dessous pour les remarques suivantes :
- Imaginez que vous souhaitez créer un rapport sur la population dans cette zone de chalandise (à l'aide de l'outil Superposition spatiale). Vous pouvez voir que la zone de chalandise est de forme irrégulière et qu'elle traverse plusieurs contours.
- Les centroïdes des codes postaux sont représentés ici et seront utilisés lors du processus de récupération des données.
- Les centroïdes des codes postaux sont affichés en rouge. Ils représentent les centres géographiques des contours de tous les codes postaux et contiennent tous les attributs démographiques de leurs polygones correspondants.Remarque :
Chaque niveau de contour démographique inclus dans Business Analyst contient un centroïde. Chacun de ces centroïdes comporte les mêmes attributs démographiques que sa couche de contours correspondante (par exemple, des groupes d'îlots, des secteurs de recensement, des zones de marché désignées, des zones de tri d'acheminement, des provinces, des états et ainsi de suite). Ces centroïdes sont utilisés directement dans la méthode de répartition du centroïde en cascade.
- Les points d'îlot représentés par des points verts (issus des contours des îlots de recensement pour former des groupes d'îlots) sont l'unité la plus petite des données démographiques dans Business Analyst. Ces attributs démographiques sont utilisés pour la pondération de toutes les variables et incluent la population, le nombre total de ménages, les logements et le nombre d'entreprises.
L'exemple ci-dessous illustre la méthode de répartition des données Répartition sur une maille fine. Les codes postaux sont utilisés dans ce cas. Cet exemple illustre la précision accrue de la répartition sur une maille fine, en particulier dans les zones géographiques plus petites.
La valeur de la population pondérée pour le code postal 16199 est de 75 %, car 75 % de la population du code postal qui se trouve dans les points d'îlot se situe au sein de la zone de chalandise (ou 12 115/16 119*100). Ce scénario peut s'appliquer à tous les autres contours où la surface est subdivisée par une zone de chalandise.
Dans l'image ci-dessous, les encadrés montrent la population totale ajoutée à partir des points d'îlot contenus uniquement au sein de la zone de chalandise. Les points d'îlot qui se trouvent en dehors de la zone de chalandise ne sont pas compris dans l'analyse. Dans cet exemple, le nombre 14 042 est plus précis que 21 676 qui correspond à l'ensemble du code postal. Cette valeur de la population pondérée est de 65 %.
Les codes postaux sont utilisés dans cet exemple, mais vous pouvez utiliser n'importe quelle couche de contours démographiques. Les groupes d'îlots sont efficaces pour les zones géographiques plus petites et sont définis comme couche par défaut de répartition sur une maille fine.
Voici une table attributaire générée avec la méthode de répartition sur une maille fine. Vous pouvez voir que les points d'îlot inclus dans la zone de chalandise sont ajoutés afin d'équivaloir à la population totale. Donc 13 547 + 10 798 + 8 585 + 14 042 + 15 881 + 1 854 + 12 115 + 1 066 = 77 888.
Le champ de la population totale en 2000 présente la population totale de l'an 2000, ou 77 888 personnes, ajoutée à partir de chaque point d'îlot contenu au sein de la zone de chalandise. Le champ Total montre le nombre total de zones géographiques avec des points d'îlot inclus dans la récupération des données. La méthode de répartition sur une maille fine renvoie les données de neuf codes postaux différents, tandis que la méthode du centroïde en cascade ne renvoie que trois contours de codes postaux.
L'exemple ci-dessous illustre la méthode de répartition des données Centroïde en cascade à l'aide des codes postaux. Cet exemple met en exergue le fait que les centroïdes en cascade peuvent être moins précis, en particulier dans les zones géographiques plus petites.
Les centroïdes au sein de la zone de chalandise, comme illustré pour le code postal 15881, seront inclus dans l'analyse à l'aide de la méthode de répartition du centroïde en cascade. Les centroïdes situés en dehors de la zone de chalandise, comme illustré pour le code postal 16199, ne seront pas inclus dans l'analyse même si le contour correspondant se trouve au sein de la zone de chalandise. Même si les contours s'étendent en dehors de la zone de chalandise, comme illustré en violet pour le code postal 21676, les données de l'ensemble du contour sont représentées dans le centroïde.
Les étiquettes affichent les chiffres de la population de l'année 2000 pour le centroïde de chaque code postal. Les attributs des centroïdes des codes postaux découlent de leurs contours correspondants.
Voici une table attributaire générée avec la méthode du centroïde en cascade. Vous pouvez voir que les centroïdes des codes postaux inclus dans la zone de chalandise sont ajoutés afin d'équivaloir à la population totale. Donc 12 749 + 15 881 + 21 676 = 50 306.
Le champ de la population totale en 2000 présente la population totale de l'an 2000, soit 50 306 personnes, ajoutée à partir du centroïde de chaque code postal contenu au sein de la zone de chalandise. Le champ Total montre le nombre total de zones géographiques avec des points de centroïde inclus dans la récupération des données.