Cómo se almacenan y administran los datos ráster

Estructuras de datos ráster y modelos de almacenamiento

Los datos ráster y de imagen se almacenan normalmente en su forma original. Rara vez se editan los valores de un píxel individual, como podría editar una entidad en un dataset vectorial. Con frecuencia estos datos se pueden procesar para crear nuevas formas que pueden ser procesadas al vuelo o guardadas como otra versión. Estos datasets, y las colecciones de datasets, son frecuentemente muy grandes, de modo que contar con buenas capacidades de gestión es importante y ArcGIS está diseñado para hacerlo.

Hay tres métodos para almacenar los datos ráster y de imagen: como archivos en un sistema de archivos, en una geodatabase o administrados desde la geodatabase pero almacenados en un sistema de archivos. Esta decisión también implica determinar si se almacenan todos los datos en un dataset único o en un catálogo con la posibilidad de tener muchos datasets. Si elige almacenar los datos en un sistema de archivos, entonces está eligiendo almacenar datasets ráster mientras que una geodatabase puede almacenar tanto datasets ráster como datasets de mosaico. Una tercera opción de geodatabase es el catálogo de rásters. No se describe a continuación porque ha sido reemplazada por el dataset de mosaico, que tiene muchas más capacidades, usos y funciones.

Datasets ráster

La mayoría de los datos ráster y de imágenes (tales como una ortofotografía o DEM) se proporcionan como un dataset ráster. El término dataset ráster hace referencia a cualquier modelo de datos ráster que se almacena en el disco o en una geodatabase. Es el modelo de almacenamiento de datos ráster más básico, en el que los otros datasets se construyen en datasets ráster de gestión de datasets de mosaico. También es la salida de muchas herramientas de geoprocesamiento que procesan datos ráster. A continuación se muestra un ejemplo de un dataset ráster.

Ejemplo de dataset ráster

Un dataset ráster es cualquier formato ráster válido organizado en una o más bandas. Cada banda está compuesta de un vector de píxeles (celdas) y cada píxel tiene un valor. Un dataset ráster tiene por lo menos una banda. ArcGIS admite más de 70 formatos de archivo diferentes para dataset ráster, incluidos TIFF, JPEG 2000, Esri Grid y MrSid.

Más información sobre los formatos de archivo de dataset ráster admitidos

Datasets de mosaico

Un dataset de mosaico es una colección de datasets ráster (imágenes) almacenada como un catálogo y visualizada o accedida como una imagen en mosaico única o como imágenes individuales (rásteres). Estos conjuntos pueden ser extremadamente grandes tanto en tamaño de archivo total como en la cantidad de datasets. Los datasets ráster en un dataset de mosaico puede permanecer en su formato nativo en el disco o en la geodatabase. Los metadatos se pueden administrar en el registro del ráster, así como los atributos de la tabla de atributos. El almacenamiento de metadatos como atributos permite administrar fácilmente los parámetros como datos de orientación de sensor, así como habilitar consultas rápidas para habilitar selecciones.

Diagrama del dataset de mosaico

Los datos en un dataset de mosaico no tienen que estar adyacentes o superpuestos, pero pueden existir como datasets discontinuos no conectados. Por ejemplo, puede tener imágenes que cubran completamente un área o puede tener muchas tiras de imágenes que posiblemente no se unan para formar una imagen continua (como a lo largo de tuberías).

Cobertura de datos contiguosCobertura de datos discontinuos

Los datos incluso pueden superponerse completa o parcialmente, pero capturarse en fechas diferentes. El dataset de mosaico es un dataset ideal para almacenar datos temporales. Puede consultar el dataset de mosaico para ver las imágenes que necesite en función de la hora o las fechas, y utilizar un método de mosaico para mostrar la imagen en mosaico de acuerdo con un atributo de hora o fecha.

Los datasets de mosaico no están limitados a un tipo determinado de datos ráster. Puede agregar datos ráster en distintas proyecciones, resoluciones, profundidades de píxel y cantidad de bandas. Se pueden generar vistas generales (como pirámides) para el conjunto completo de datos. Esto permite ver más rápidamente los datos y servir fácilmente estos datasets. También hay muchas propiedades adicionales para la vista, incluido el establecimiento de un método de creación de mosaicos, que convierten estos datasets en únicos y funcionales en muchas situaciones. También puede consultar un dataset de mosaico sobre la base de restricciones de consulta espaciales y no espaciales. Los resultados de esa consulta pueden ser un conjunto de imágenes que podrían procesarse una por una, o podría ser una imagen en mosaico generada dinámicamente.

Además de los datos ráster, puede almacenar y administrar datos LIDAR en un dataset de mosaico de la misma manera que lo hace con los datasets ráster, e incluso junto con los datasets ráster. Los datos LIDAR se pueden almacenar tanto en el sistema de archivos como en archivos LAS o datasets LAS, o en una geodatabase como un dataset de terreno.

LicenciaLicencia:

Los datasets de mosaico están en versiones. La siguiente tabla describe su compatibilidad entre versiones:

Cliente

10.0 dataset de mosaico

10.1 dataset de mosaico

10.0

Completo (leer/modificar/crear)

No compatible

10.1

Sólo lectura

Completo (leer/modificar/crear)

Más información sobre el dataset de mosaico

Comparación de modelos de almacenamiento de datos ráster

Almacenar los datasets ráster individualmente suele ser el mejor método cuando los datasets no son adyacentes entre sí o se utilizan raramente en los mismos proyectos. La creación de mosaicos con las entradas para formar un gran extensión única de datos ráster es adecuada para muchas aplicaciones, pero es posible que se desee un dataset de mosaico por cualquiera de estas razones:

Comparación de los modelos de almacenamiento de datos ráster

Dataset ráster

dataset de mosaico

Descripción

Una imagen única de un objeto o una imagen sin fisuras que cubre un área espacialmente continua. Puede ser una imagen original única o el resultado de muchas imágenes anexadas (en mosaico) entre sí.

Icono de dataset ráster

Una colección de datasets ráster almacenada como un catálogo que permite almacenar, administrar, ver y consultar colecciones de ráster y datos LIDAR. Se ve como una imagen en mosaico, pero se tiene acceso a cada dataset en la colección.

Icono de dataset de mosaico

Almacenamiento

Como un archivo en el disco o en una geodatabase.

En una geodatabase, pero puede tener una referencia almacenada como un archivo en el disco.

Capas de mapa

Una capa de mapa.

Una capa de mapa.

Datos homogéneos o heterogéneos

Datos homogéneos: un único formato, tipo de datos y archivo.

Datos heterogéneos: varios formatos, tipos de datos, tamaños de archivo y sistemas de coordenadas.

Metadatos

Se almacenan una vez y se aplican al dataset completo.

Se puede almacenar dentro del registro ráster y como atributos en la tabla de atributos.

Datasets submuestreados

Una pirámide única en el dataset ráster completo.

Pirámides para cada dataset ráster, así como vistas generales (como una pirámide) para el conjunto completo.

Geoprocesamiento y análisis de la imagen

  • Se puede utilizar como fuente de datos en muchas herramientas de análisis y geoprocesamiento.
  • Se puede utilizar en la ventana Análisis de imagen.
  • Se puede utilizar como fuente de datos en muchas herramientas de análisis y geoprocesamiento.
  • Se puede utilizar en la ventana Análisis de imagen.

Ventajas

  • Visualización rápida a cualquier escala.
  • El mosaico ahorra espacio, dado que no hay datos superpuestos.
  • Administra grandes colecciones de datos ráster.
  • Visualización rápida a cualquier escala.
  • No hay pérdida de datos para crear el mosaico.
  • El usuario tiene el acceso al contenido completo de la colección.
  • Se puede establecer propiedades para controlar la visualización del mosaico.
  • Procesamiento al vuelo ("on the fly").

Desventajas

Los datasets ráster de geodatabases personales y de archivos son más lentos de actualizar porque hay que reescribir el archivo completo.

Las vistas generales pueden tardar tiempo en generarse.

Servicio

Se puede servir directamente como un servicio de imágenes.

Se puede servir directamente como un servicio de imágenes.

Recomendaciones

Utilice datasets ráster cuando no sea necesario conservar la superposición entre imágenes en mosaico, y para la visualización rápida de grandes cantidades de datos ráster.

Utilice un dataset de mosaico para administrar y visualizar datos LIDAR y ráster. Bueno para datos multidimensionales, consulta, almacenamiento de metadatos y superposición de datos, y proporciona una buena solución híbrida.

Comparación de los modelos de almacenamiento de datos ráster

Almacenamiento de datos ráster en la geodatabase

Almacene los datos ráster en la geodatabase cuando desee administrar los rásteres, agregar comportamiento y controlar el esquema; cuando desee administrar un conjunto bien definido de datasets ráster como parte del DBMS; y cuando necesite una arquitectura de datos para administrar todo el contenido. Hay tres tipos principales de geodatabases: corporativos, personales y de archivos.

La geodatabase corporativa utiliza ArcSDE y puede admitir varias operaciones en su DBMS. Las geodatabases de archivos (como las geodatabases personales) están diseñadas para ser editadas por un único usuario y no admiten el versionado. Residen en el directorio del sistema de archivos, así que no necesitan contraseña para el acceso. Las geodatabases de archivos y las geodatabases corporativas comparten el mismo esquema de almacenamiento básico.

NotaNota:

El comportamiento funcional de cada geodatabase es básicamente el mismo; no obstante, al algunas excepciones para herramientas o procedimientos específicos. Para obtener información sobre las diferencias en el comportamiento de una herramienta o procedimiento, consulte la herramienta o el procedimiento específico con este sistema de ayuda.

Comparación del almacenamiento de rásteres en geodatabases de archivos, corporativas y personales.

Característica de almacenamiento de ráster

Geodatabase de archivos

Geodatabase corporativa

Geodatabase personal

Límite de tamaño

1 TB para cada dataset ráster

Sin límite; el límite depende de los límites del DBMS

2 gigabytes (GB) por geodatabase (éste es un límite de tamaño de tabla, no un límite de tamaño de dataset ráster)

Formato de archivo de dataset ráster

Dataset ráster de geodatabase de archivos

Dataset ráster de ArcSDE

ERDAS IMAGINE, JPEG o JPEG 2000

Almacenamiento

  • Dataset ráster: Administrado
  • Dataset de mosaico: Sin administrar
  • Ráster como atributo: Administrados o no administrados
  • Dataset ráster: Administrado
  • Dataset de mosaico: Sin administrar
  • Ráster como atributo: Administrado
  • Dataset ráster: Administrado
  • Dataset de mosaico: Sin administrar
  • Ráster como atributo: Administrados o no administrados

Se almacena en el sistema de archivos

Se almacena en un RDBMS

Se almacena en Microsoft Access

Compresión

LZ77, JPEG, JPEG 2000 o ninguna

LZ77, JPEG, JPEG 2000 o ninguna

LZ77, JPEG, JPEG 2000 o ninguna

Pirámides

Admite la piramidación parcial

Admite la piramidación parcial

Regenera la pirámide completa

Realizar mosaicos

Permite anexar a un dataset ráster al disponer en mosaico

Permite anexar a un dataset ráster al disponer en mosaico

Reescribe un nuevo dataset cada vez que se dispone en mosaico a un dataset ráster

Actualización

Permite la actualización incremental

Permite la actualización incremental

Cantidad de usuarios

Un único usuario y grupos de trabajo pequeños; algunos lectores y un escritor

Multiusuario; muchos usuarios y muchos escritores

Un único usuario y grupos de trabajo pequeños; algunos lectores y un escritor

Geodatabases de archivos, personales y corporativas

Geodatabase de archivos

El modelo de almacenamiento de las geodatabases de archivos es un híbrido entre la geodatabase corporativa y la geodatabase personal, donde los datos ráster administrados siguen el modelo de almacenamiento de la geodatabase corporativa y los datos de ráster no administrados siguen el modelo de almacenamiento de la geodatabase personal. Las geodatabases de archivos también se asemejan a las personales, porque están diseñadas para ser editadas por un solo usuario y no son compatibles con el control de versiones. Residen en el directorio del sistema de archivos, así que no necesitan contraseña para el acceso. Las geodatabases de archivos y las geodatabases corporativas comparten el mismo esquema de almacenamiento básico.

Una geodatabase de archivos tiene varias ventajas sobre el uso de una geodatabase personal. Al igual que la geodatabase corporativa, la geodatabase de archivos almacena datos en bloques. Esto proporciona un acceso más eficaz a los datos, especialmente durante la operación de mosaico. Al crear un mosaico de datos en una geodatabase de archivos, solo se actualizan los bloques superpuestos. Si no existe un bloque superpuesto, se inserta un bloque nuevo. Los bloques parciales se rellenan con píxeles NoData. Además, el modelo de almacenamiento de la geodatabase de archivos (y corporativa) emplea actualizaciones de pirámide parciales, lo que ahorra tiempo. También las estructuras de los datos de las geodatabases de archivos y las corporativas son las mismas, lo que permite utilizar tecnología de copiado rápido para copiar y pegar los datos entre la geodatabase de archivos y la corporativa.

La geodatabase de archivos también acepta las palabras clave de configuración, pero a diferencia de la geodatabase corporativa, las palabras clave de configuración tienen un valor estándar predefinido. Para obtener más información sobre las palabras clave de configuración, vea Palabras clave de configuración para geodatabases de archivos.

Geodatabase corporativa

Cuando se almacenan los datos ráster en la geodatabase corporativa, es posible ofrecer un nivel de funcionalidad corporativo, como seguridad, acceso multiusuario y uso compartido de datos. Las siguientes son las tres razones principales para almacenar los datos ráster como una geodatabase corporativa:

  • No se actualizarán con mucha regularidad (por ejemplo, cada dos o tres años o más).
  • Se accederá a ellos en casos de uso de solo lectura (por ejemplo, utilizándolos como datos de mapa base bajo datos vectoriales).
  • Cientos de usuarios (o más) tendrán acceso a ellos como un mapa base.

Debido a su estructura de almacenamiento, se dice que los datos ráster son administrados, o totalmente controlados, por la geodatabase. Las geodatabases corporativas almacenan siempre toda la información del ráster (píxeles, referencia espacial, cualquier tabla asociada y otros metadatos) para los datasets ráster y los atributos de ráster en la base de datos relacional asociada. Esto significa que toda la información de ráster de entrada se carga en la base de datos y se puede considerar una conversión de formato.

La geodatabase corporativa divide uniformemente las bandas en bloques de píxeles según una dimensión definida por el usuario (el valor predeterminado es 128 por 128). Ordenar en teselas los datos de bandas de ráster permite un almacenamiento y una recuperación eficaces de los datos ráster. La información de la pirámide se almacena según una resolución en descenso. El número de niveles especificado por la aplicación o el usuario determina la altura de la pirámide.

La tabla de bloques de ráster (la tabla más grande y la que almacena la información real de píxel y las pirámides) almacena una fila por bloque (tesela) por banda en un dataset ráster y por nivel de pirámide. Por ejemplo, un ráster de tres bandas dividido en 12 bloques sin pirámides generadas tendrá 36 filas en la tabla BLK: 12 bloques independientes para cada una de las bandas. La columna que contiene los datos de píxel del bloque es un objeto binario grande (BLOB).

Más información sobre el almacenamiento de datos ráster en estos DBMS

DBMS

Modelo de almacenamiento de datos

DB2

Datasets ráster

Datasets de mosaico

Informix

Datasets ráster

Datasets de mosaico

Oracle

Datasets ráster

Datasets de mosaico

PostgreSQL

Datasets ráster

Datasets de mosaico

SQL Server

Datasets ráster

Datasets de mosaico

Geodatabase personal

En una geodatabase personal, el dataset ráster se convierte en un archivo IMAGINE (.img) y se almacena dentro de una carpeta de base de datos de imágenes (IDB). La carpeta IDB se encuentra en el directorio situado junto a la geodatabase personal. Al eliminar un dataset ráster, el ráster de la carpeta IDB se elimina de forma permanente.

Cuando se almacena un dataset de mosaico en una geodatabase personal, el dataset de mosaico es una tabla que apunta a los datasets ráster almacenados que contiene. En un dataset de mosaico, los datasets ráster se almacenan como no administrados; por lo tanto, contiene la ubicación de ruta donde están almacenados los datasets ráster. Cada fila en la tabla de negocios apunta al dataset ráster almacenado. Las operaciones en un dataset de mosaico no afectan a los archivos ráster almacenados; por lo tanto, si elimina los datasets ráster en un dataset de mosaico, sólo se eliminan del dataset de mosaico y no del disco.

Al almacenar un dataset ráster como un atributo, el ráster se almacena como un archivo IMG en la ubicación definida por el sistema o tal cual en el sistema de archivos; esto depende de si está administrado o no.

Compresión, pirámides y tamaño de tesela

Hay otras estructuras de almacenamiento a considerar al almacenar y administrar datos ráster, como la compresión, los datasets submuestreados (pirámides y vistas generales) y el tamaño de tesela.

Compresión

Hay dos tipos de compresión: sin pérdida de información y con pérdida de información. Una compresión sin pérdida de información significa que los valores de píxeles del dataset ráster no se modifican, mientras que la compresión con pérdida de información produce valores de píxel alterados. La cantidad de compresión depende del tipo de datos de píxel; cuanto más homogénea sea la imagen, más alta será la tasa de compresión. Debería almacenar los datos que se vayan a utilizar para el análisis, no solo para mostrar, mediante una compresión sin pérdida de información. La principal ventaja de comprimir los datos es que se necesita menos espacio de almacenamiento; la cantidad de ahorro depende del método de compresión y la redundancia de los datos. Una ventaja adicional es la impresionante mejora de rendimiento debido a la transferencia de menos paquetes de datos. Por ejemplo, cuando se accede a datos ráster a través de una red con ancho de banda bajo, el uso de compresión puede ofrecer un rendimiento mejorado porque la cantidad de información que se va a transferir se reduce considerablemente, lo que permite almacenar datasets ráster grandes, sin interrupciones, y proporcionarlos rápidamente a un cliente para su visualización.

Más información acerca de la compresión ráster

Los datasets de mosaico también tienen compresión. No se usa para el almacenamiento del dataset ráster que se va a administrar sino para la compresión que se aplica a la imagen que genera cuando se visualiza. Esto también es útil cuando se accede a los datos a través de la red al reducir el tamaño de archivo que se transfiere.

Más información sobre la propiedad Método de compresión permitido

Datasets submuestreados

Los datasets submuestreados son rásteres creados a partir de los datos originales para datasets ráster o datasets de mosaico. Se generan para mejorar la velocidad de visualización y el rendimiento. Cuando se crean para los datasets ráster, se denominan pirámides, y cuando se crean para los datasets de mosaico, se denominan vistas generales.

Pirámides y vistas generales

Pirámides

Vistas generales

Se crean para

Datasets ráster

Datasets de mosaico

Formato

Escribe archivos .ovr, con algunas excepciones.

Lee pirámides almacenadas externamente como .ovr o .rrd, o almacenadas internamente.

Escribe archivos .tif.

Almacenamiento

En un único archivo que generalmente se encuentra junto al dataset ráster de origen utilizando el mismo nombre.

En forma predeterminada, en una carpeta junto a la geodatabase con una extensión *.overviews, o internamente para ArcSDE.

La ubicación de almacenamiento se puede personalizar.

Tamaño de almacenamiento

2 a 10% (en comparación con los datasets ráster originales)

Factor de submuestreo

2

3

extensión

  • Cada nivel de pirámide cubre todo el dataset ráster.
  • Puede especificar el número de niveles a generar.

  • Puede cubrir parte o la totalidad del dataset de mosaico.
  • Cada nivel puede estar compuesto de una o varias imágenes.

Opciones para la creación

  • Cantidad de niveles a crear
  • Método de remuestreo
  • Método de compresión y calidad

  • Cantidad de niveles a crear
  • Tamaño de tesela
  • Tamaño de píxel base
  • Método de remuestreo
  • Método de compresión y calidad
  • Ubicación de salida
  • Factor de muestreo de extensión

Pirámides y vistas generales

Más información acerca de las pirámides ráster

Más información sobre las vistas generales del dataset de mosaico

Tamaño de tesela

En una geodatabase corporativa, los datos ráster se almacenan en una estructura donde son divididos en teselas, indexados, estructurados en pirámides y muy frecuentemente comprimidos. Debido al ordenamiento en teselas, la indización y la piramidación, cada vez que se consultan los datos ráster, solo se devuelven las teselas necesarias para satisfacer la extensión y resolución de la consulta, en lugar de todo el dataset. El tamaño de tesela controla el número de píxeles que desea almacenar en cada bloque de memoria de base de datos. Se especifica como un número de píxeles en X e Y. El tamaño de tesela predeterminado es 128 por 128 píxeles y la mayoría de las aplicaciones no garantiza la desviación de estos valores predeterminados. En una geodatabase corporativa, las teselas de datos ráster se comprimen antes de su almacenamiento en la geodatabase.

Temas relacionados

9/11/2013