Format de grille Esri
Une grille est un format de stockage de données raster natif d'Esri. Il existe deux types de grilles : grille de nombres entiers et grille à virgule flottante. Utilisez les grilles d'entiers pour représenter les données discrètes et les grilles à virgule flottante pour représenter des données continues.
Pour en savoir plus sur les données discrètes et continues.
Les attributs d'une grille d'entiers sont stockés dans une table attributaire de valeurs (VAT). Cette table contient un enregistrement pour chaque valeur unique de la grille. L'enregistrement stocke la valeur unique (VALUE est un entier qui représente une classe ou un regroupement de cellules) et le nombre de cellules (COUNT) dans la grille représentée par cette valeur. Par exemple, si 50 cellules ont une valeur de 1 représentant une forêt, la table VAT affiche VALUE = 1 et COUNT = 50 pour chacune de ces cellules.
Pour en savoir plus sur les tables attributaires de jeu de données raster.
Les grilles à virgule flottante n'ont pas de table VAT car leurs cellules peuvent prendre n'importe quelle valeur dans une plage de valeurs donnée. Les cellules de ce type de grille n'entrent pas clairement dans des catégories discrètes. La valeur des cellules est l'attribut décrivant l'emplacement. Par exemple, dans une grille représentant les données d'altitude en mètres au-dessus du niveau de la mer, une cellule possédant une valeur de 10,1662 indique que l'emplacement est situé à environ 10 mètres au-dessus du niveau de la mer.
Les plages de valeurs de données pouvant être stockées sous la forme de valeurs de grille sont les suivantes :
- Les grilles à virgule flottante peuvent stocker des valeurs comprises entre - 3,4 x 1038 et 3,4 x 1038.
- Les grilles d'entiers peuvent stocker des valeurs comprises entre -2147483648 et 2147483647 (-231 et 231-1).
Dans le cas des grilles d'entiers, ces informations s'appliquent uniquement à l'attribut VALUE. D'autres attributs INFO peuvent être ajoutés à la table VAT d'une grille d'entiers ; la plage des valeurs dépend alors de la définition des attributs.
Le système de coordonnées d'une grille est identique à celui des autres données géographiques. Les lignes et colonnes sont parallèles aux axes x et y du système de coordonnées. Etant donné que les cellules d'une grille possèdent toutes la même dimension, l'emplacement et la surface couverte par toute cellule peuvent être déterminés facilement selon sa ligne et sa colonne. Le système de coordonnées d'une grille est donc défini par la taille de cellule, le nombre de lignes et de colonnes, ainsi que la coordonnée x,y du coin supérieur gauche. Les grilles contiennent également des informations supplémentaires, telles que le système de coordonnées qui leur est associé.
Comme pour la plupart des formats, le nom d'une grille ne doit pas inclure d'espace ou autres caractères spéciaux. Le nom de fichier d'une grille à plusieurs canaux ne peut pas contenir plus de 9 caractères et celui d'un jeu de données raster monocanal ne peut pas avoir plus de 13 caractères.
Structure des données de la grille
L'implémentation des grilles s'effectue au moyen d'une structure de données raster tuilées dont l'unité de stockage de base est un bloc de cellules rectangulaire. Les blocs sont stockés sur disque sous une forme compressée dans une structure de fichiers de longueur variable désignée sous le nom de tuile. Chaque bloc est stocké sous la forme d'un enregistrement de longueur variable.
La taille de la tuile d'une grille est basée sur le nombre de lignes et de colonnes que comporte cette grille au moment de sa création. La limite supérieure pour une taille de tuile est définie par l'application et est particulièrement élevée (elle est définie actuellement sur 4 000 000 x 4 000 000 cellules). En conséquence, la plupart des grilles utilisées pour les applications SIG sont stockées automatiquement dans une seule tuile. Les données spatiales sont réparties automatiquement entre plusieurs tuiles si la taille de la grille, au moment de sa création, est supérieure à la limite maximale.
L'organisation de stockage bloquée pour les grilles prend en charge l'accès spatial aléatoire et séquentiel à des jeux de données raster volumineux. La structure de blocage n'impose aucune restriction sur l'analyse commune des grilles. Pour ce type d'analyse, les tuiles et blocs émanant de différentes grilles ne doivent pas nécessairement coïncider dans l'espace de la carte. La structure des blocs et des tuiles est totalement transparente pour l'utilisateur. Ce dernier crée et manipule toujours une grille comme s'il s'agissait d'un raster transparent de cellules uniformément carrées.
Les grilles utilisent une méthode de compression raster RLE adaptative au niveau du bloc. Chaque bloc est testé afin de déterminer la profondeur (bits par cellule) à utiliser, ainsi que la méthode de stockage (cellule par cellule ou RLE) la plus efficace. Le boc est stocké dans le format le moins gourmand en espace disque. La méthode de compression adaptative constitue la solution idéale compte tenu de sa capacité à représenter efficacement aussi bien les données catégorielles homogènes que les données continues hétérogènes, tout en prenant en charge l'analyse commune à l'aide de ces deux types de données. Les opérations par cellule monocouche, telles que la reclassification de données, agissent directement sur des séries de données, sans décompression. Les opérations par cellule multicouches portant sur des couches en entrée compressées intersectent des séries de données des différentes couches et agissent sur les séries intersectées. Les opérations par voisinage monocouche et les opérations par cellule multicouches qui associent des données compressées et non compressées développent des exécutions dans des cellules et effectuent le traitement cellule par cellule traditionnel de manière transparente.
La structure des blocs de tuiles d'une grille est également transparente pour toute application qui accède aux données spatiales d'une grille. Les programmes qui manipulent des grilles accèdent aux données spatiales en plaçant une fenêtre rectangulaire définie dans les coordonnées de la carte.
Stockage des données de grille
Une grille est stockée dans un espace de travail ArcInfo. La grille, par exemple une couverture, est stockée sous la forme d'un répertoire distinct avec des tables et des fichiers associés contenant des informations qui lui sont spécifiques. Le répertoire de grille d'entiers (créé initialement par ArcInfo Workstation) contient les tables et fichiers suivants : la table BND qui stocke la limite de la grille, le fichier HDR qui stocke des informations spécifiques sur la grille (la résolution des cellules et le facteur de blocage, par exemple), la table STA qui contient des statistiques sur la grille, la table VAT qui stocke les données attributaires associées aux zones de la grille, le fichier journal (LOG) qui surveille les activités de la grille, ainsi que le fichier de tuile w001001.adf (q0x1y1) qui stocke les données de cellule et le fichier d'index correspondant w001001x.adf (q0x1y1x) qui indexe les blocs dans la tuile et le journal. (Il est possible que certains de ces éléments, comme le fichier journal, n'existent pas si le répertoire a été créé à l'aide d'opérateurs ArcGIS.)
Lorsqu'une grille est modifiée, les valeurs et informations contenues dans les fichiers et tables sont immédiatement mises à jour. Le contenu de la table INFO est accessible à l'utilisateur et fournit des informations sur la grille.
Table BND
Cette table contient la limite de la grille. La limite est un rectangle qui englobe les cellules d'une grille ; elle est stockée dans les coordonnées de la carte. Toutes les tables BND d'une grille sont stockées en double précision.
Les coordonnées minimales de la table BND correspondent au coin inférieur gauche de la cellule située en bas à gauche de la grille. Les coordonnées maximales correspondent au coin supérieur droit de la cellule située en haut à droite.
fichier HDR
Le fichier HDR est de type binaire. Les informations qui y sont stockées sont la taille de cellule, le type de grille (entier ou virgule flottante), la méthode de compression, le facteur de blocage, ainsi que des informations sur la tuile.
Table STA
La table STA est une table INFO qui contient des données statistiques sur une grille. La valeur minimale, la valeur maximale, la moyenne et l'écart type relatifs à la grille y sont stockés sous la forme de valeurs à virgule flottante. Vous devez vous abstenir de modifier directement ces valeurs.
Dans la mesure où NoData représente une valeur inconnue, il n'est pas utilisé pour calculer les statistiques dans la table STA.
Lors de la création d'une grille à deux niveaux (contenant uniquement les valeurs 0 et 1), la table STA présente la valeur 0 comme moyenne et – 1 comme écart type. La valeur d'écart type -1 indique que les statistiques n'ont pas été calculées pour une grille.
La valeur d'écart type -2 indique que la grille contient uniquement des cellules NoData.
Table VAT
La table VAT est une table INFO dans laquelle sont stockés les attributs associés aux zones d'une grille. Cette table est associée aux seules grilles d'entiers. Chaque table VAT contient au moins deux attributs : VALUE et COUNT. L'attribut VALUE contient des valeurs entières utilisées pour différencier les caractéristiques d'un emplacement des autres emplacements d'une grille. Toutes les cellules auxquelles est attribuée la même valeur contiennent les mêmes caractéristiques et, par conséquent, appartiennent à la même zone. COUNT correspond au nombre de cellules contenues dans une zone.
Vous pouvez ajouter de nouveaux attributs à la table VAT. Les attributs VALUE et COUNT ne doivent pas être modifiés. Quant au tri de la table VAT, il doit toujours être effectué sur l'attribut VALUE. N'ajoutez jamais de nouveaux éléments avant VALUE ou COUNT.
Les cellules qui contiennent NoData ne sont pas représentées dans la table VAT.
Vous trouverez, ci-dessous, un exemple de table VAT :
Record VALUE COUNT 1 0 628872 2 1 265043 3 2 151150 4 3 3185652 5 4 79983 6 5 4782 7 6 74334 8 7 8877 9 8 1817 10 9 491 11 10 858 12 11 8770 13 12 28789 14 13 72539 15 14 3686 16 15 3932 17 16 13227 18 17 1890 19 18 1305 20 19 427286 21 20 6695
Fichiers de tuile
Les fichiers w001001.adf (q0x1y1) et w001001x.adf (q0x1y1x) stockent les données et l'index de la première tuile, ou tuile de base, d'une grille. La limite supérieure définie pour la taille d'une tuile est relativement élevée et la plupart des grilles sont stockées à l'aide d'une seule tuile. Si des tuiles supplémentaires sont utilisées, elles sont automatiquement numérotées en fonction de leur relation spatiale par rapport à la première tuile. Les tuiles sont implémentées en tant que fichiers binaires de longueur variable. Dans les versions antérieures à ARC/INFO 7.x, ces fichiers étaient nommés q0x1y1 et q0x1y1x. Ils fonctionnent encore avec le logiciel actuel.
fichier journal
Le fichier journal est un fichier ASCII qui contient des informations relatives à la création d'une grille et aux modifications qui y ont été apportées. Le fichier journal effectue le suivi des opérations effectuées sur la grille, mais ne les contient pas toutes. Dans la mesure où toutes les fonctions Grid créent une nouvelle grille, seules les commandes Grid telles que RENAME et COPY peuvent modifier une grille existante et être saisies dans le fichier journal. A l'instar de tous les fichiers ASCII, le fichier journal est accessible par le biais de commandes système ou de tout éditeur de texte.
Limites de stockage
Le nom d'une grille est limité comme suit :
- Il ne peut pas contenir d'espaces.
- Il ne peut pas commencer par un chiffre.
- Il ne peut pas compter plus de 13 caractères (une grille multicanale autorise jusqu'à 9 caractères).
Le nombre de fichiers pouvant être stockés dans un répertoire INFO est limité pour les couvertures et les grilles. Il est d'environ 10 000. Par conséquent, le nombre de grilles que vous pouvez stocker dans un espace de travail est limité. Par exemple, voici le nombre maximal théorique de jeux de données de grille pouvant être stockés dans un répertoire d'espace de travail unique :
- Moins de 5 000 grilles à virgule flottante, ou
- Moins de 3 333 grilles d'entiers, avec VAT (moins de 5 000 sans VAT), ou
- Moins de 10 000 piles de grilles
Les nombres précédents sont les maximums théoriques. Si vous avez un processus qui doit créer des grilles intérimaires (et par conséquent des fichiers dans le répertoire INFO), ces nombres seront inférieurs. En outre, si vous stockez un mélange de fichiers, tels que des grilles et des couvertures, vous en stockerez moins.
Ces nombres concernent le nombre de fichiers dans le dossier de grille qui stockent des informations dans le répertoire INFO. La limite est 10 000 (9 999), mais il ne s'agit pas du nombre total de fichiers dans un répertoire INFO, c'est le nombre de fichiers qui pointent vers les fichiers dans le répertoire INFO. Pour chaque grille, il y a deux fichiers dans le dossier de la grille qui pointent sur des fichiers dans le dossier INFO : les fichiers BND (limite) et les fichiers de table (statistiques) STA (9999/2≈5000). Lorsqu'une grille a un VAT, celui-ci pointe également sur les fichiers dans le répertoire INFO, le nombre pouvant être stocké est davantage réduit (9999/3≈3333). Une pile de grilles possède un seul fichier qui pointe sur le répertoire INFO (9999/1≈9999).
Plusieurs lignes
Une pile se compose d'un ensemble ordonné de grilles spatialement superposées (couches), traitées comme une seule entité dans le cadre d'une analyse multivariée. L'analyse d'agrégat, la classification et l'analyse en composantes principales sont toutes des fonctions applicables aux couches d'une pile.
Une pile présente les caractéristiques suivantes :
- Un ensemble de couches dont chaque couche correspond à une grille
- Une étendue de la carte ou BND
- Une taille de cellule
- Un type de données
- Une projection
Chaque couche spécifiée dans une pile possède un numéro d'index qui indique son ordre dans la pile. Les grilles qui composent une pile doivent se trouver dans le même espace de travail.
Les limites des couches en entrée peuvent se superposer exactement, partiellement, voire pas du tout. Cependant, seule la zone de superposition des couches contient la pile. La table BND de la pile est le point d'intersection des limites de ses couches. Les calculs d'une fonction d'analyse multivariée portent sur la zone de superposition. En l'absence de zone commune entre les couches en entrée, la pile est vide et aucun calcul n'est effectué.
La taille de cellule d'une pile est définie, par défaut, sur la couche la plus grossière.
Vous pouvez combiner un nombre illimité de types de données (réels ou entiers) des grilles en entrée dans une pile. Cependant, avant d'appliquer une méthode multivariée, vous devez savoir ce que représentent les valeurs, s'il s'agit de données catégorielles ou continues, ainsi que la plage ou la plage relative des valeurs. Dans certaines analyses, le type de données en entrée de la pile détermine le type de données de la sortie.
Les informations de projection associées aux grilles en entrée sont stockées avec la pile. Etant donné que la pile est traitée comme une seule entité, toutes les grilles qu'elle contient doivent se trouver dans la même projection. Ces informations de projection permettent de garantir que chaque grille de la pile occupe la même zone géographique.
Stockage d'une pile de grilles
Une pile est stockée dans une structure de répertoire semblable à une grille ou à une couverture. Il y a deux fichiers dans le répertoire de pile : une table INFO STK externe et un fichier ASCII PRJ. Les grilles qui composent effectivement la pile n'y sont pas stockées. Il s'agit de grilles ordinaires dans votre espace de travail. Cela signifie que toute grille peut être utilisée dans plusieurs piles. La table STK stocke le nom des grilles qui composent la pile, ainsi que les valeurs d'index correspondantes :
GRID: LIST JER135.STK Record INDEX GRID 1 1 jer1 2 2 jer3 3 3 jer5
L'attribut INDEX indique la position d'une grille dans la pile, tandis que l'attribut GRID répertorie les noms des grilles qui composent ladite pile. Les données spatiales des grilles en entrée ne sont pas dupliquées dans la pile. En conséquence, la pile reflète toujours la dernière version des grilles en entrée. Le fichier STK est tout aussi accessible que n'importe quel autre fichier INFO. Vous pouvez ajouter des attributs à des fins de description ; pour le stockage de la date de collecte des données, par exemple. Toutefois, vous ne pouvez pas utiliser INFO pour modifier les valeurs de l'attribut INDEX ou les noms de l'attribut GRID. Toutes les manipulations concernant ces attributs doivent être effectuées exclusivement à l'aide des diverses commandes de gestion de pile disponibles dans Grid.
Lorsque le fichier PRJ est présent, il stocke les informations de projection de la pile :
Projection STATEPLANE Zone 4701 Datum NAD27 Zunits NO Units FEET Spheroid CLARKE1866 Xshift 0.0000000000 Yshift 0.0000000000 Parameters
Si la projection est inconnue pour toutes les grilles en entrée de la pile, aucun fichier PRJ n'est créé.
Le nom de la pile de grilles ne peut pas être enregistré avec des espaces, ne peut pas commencer par un chiffre et ne peut pas contenir plus de neuf caractères.
Valeur NoData dans une grille
Une valeur est associée à chacune des cellules d'une grille. Cependant, les cellules auxquelles n'est associée aucune valeur réelle peuvent se voir attribuer NoData dans la grille. NoData et 0 (zéro) ne sont pas équivalents ; 0 est une valeur admise. C'est pour cette raison que les cellules ayant la valeur NoData ne peuvent pas être utilisées dans le calcul des statistiques de la table STA d'une grille.