Análisis cluster de espacio-tiempo

Los datos tienen contenido espacial y temporal: todo lo que sucede en algún lugar y ocurre en algún punto en el tiempo. Varias herramientas, como Análisis de punto caliente, Análisis de cluster y de valor atípico y Análisis de agrupamiento, le permiten aprovechar útilmente los aspectos de sus datos. Cuando considera tanto el contexto espacial y temporal de los datos, puede responder preguntas como las siguientes:

Varias herramientas en la caja de herramientas Estadística espacial funcionan evaluando a cada entidad dentro del contexto de las entidades vecinas. Cuando las relaciones de vecino se definen en términos tanto de espacio y tiempo, los análisis espaciales tradicionales se convierten en análisis de espacio-tiempo. Para definir las relaciones de vecino utilizando los parámetros espacial y temporal, utilice la herramienta Generate_Spatial_Weights_Matrix y seleccione la opción SPACE_TIME_WINDOW para el parámetro Conceptualización de relaciones espaciales . A continuación, especifique una Distancia de umbral y un intervalo de tiempo (Tipo de intervalo de tiempo/fecha y Valor de intervalo de tiempo/fecha). Si, por ejemplo, usted proporciona una distancia de 1 kilómetro y un intervalo de tiempo de 7 días, las entidades que se encuentran dentro de 1 kilómetro que también tienen una marca de tiempo/fecha en un lapso de 7 días entre sí, se analizarán de forma conjunta. De manera similar, las entidades proximales dentro de 1 kilómetro entre sí que no entran dentro del intervalo de tiempo de 7 días entre cada una no se considerarán entidades vecinas.

Más allá de instantáneas de tiempo

Un método común para la comprensión de las tendencias espaciales y temporales de los datos es desglosarlos en una serie de instantáneas de tiempo. Podría, por ejemplo, crear datasets separados para la semana uno, semana dos, semana tres, semana cuatro y semana cinco. A continuación, podría analizar cada semana por separado y presentar los resultados de su análisis como una serie de mapas o como una animación. Si bien esto un modo eficaz de mostrar tendencias, cómo decida dividir los datos es un tanto arbitrario. Si analiza sus datos semana en semana, por ejemplo, ¿cómo puede decidir dónde cae el corte? ¿Debería desglosar los datos entre el domingo y el lunes? ¿Quizás de lunes a jueves, y luego nuevamente de viernes a domingo? Y ¿hay algo especial sobre el análisis de los datos en los intervalos de toda la semana? ¿No podría ser que un análisis diario o mensual fuera más eficaz? Las consecuencias podrían ser importantes si la división (separar los eventos del domingo de los eventos del lunes, por ejemplo) separa entidades que realmente deberían estar relacionadas. En el ejemplo a continuación, 6 entidades caen dentro de una ventana de espacio-tiempo de 1 km y 7 días de la entidad etiquetada Ene 31; sin embargo, solo una entidad se incluirán como vecino si los datos se analizan mediante instantáneas mensuales.

Las instantáneas de datos pueden separar artificialmente las entidades que están cerca unas de otros en tiempo y espacio.

Al definir las relaciones de entidades utilizando el SPACE_TIME_WINDOW, no está creando instantáneas de los datos. En lugar de ello, todos los datos se utilizan en el análisis. Las entidades que están cerca entre sí en el tiempo y en el espacio se analizarán todas juntas, porque las relaciones de entidades se evalúan en relación a la ubicación y la marca de tiempo de la entidad de destino; en el ejemplo de arriba (A.), una ventana de espacio-tiempo de 1 km, 7 días busca seis vecinos para la entidad etiquetada Ene 31.

Supongamos que estuviera analizando incendios forestales en una región. Si desea ejecutar la herramienta de Análisis de punto caliente utilizando la conceptualización FIXED_DISTANCE_BAND predeterminada para definir las relaciones de entidades, el resultado sería un mapa que muestra las ubicaciones de puntos calientes y puntos fríos de incendios forestales estadísticamente significativos. Si después ejecutara el análisis de nuevo, pero esta vez define las relaciones espaciales en términos de VENTANA ESPACIO-TIME, puede descubrir que algunas de las áreas de punto caliente son estacionales. La comprensión de esta característica temporal de los incendios forestales puede tener consecuencias importantes para la forma de asignar los recursos de bomberos.

Visualizar los resultados de espacio-tiempo

Los mapas de calor generalmente muestran áreas de alta intensidad (puntos calientes) en rojo y áreas de baja intensidad (puntos fríos) en azul. En el siguiente gráfico, por ejemplo, las áreas en rojo son lugares que reciben el mayor número de llamadas de emergencia al 911. Las áreas en azul son ubicaciones que reciben relativamente pocas llamadas. ¿Cómo podría agregar información sobre la dimensión temporal de frecuencias de llamadas al 911 al siguiente mapa? ¿Cómo puede representar eficazmente en un mapa cosas como los brotes individuales, una serie de excesos de delitos, repercusiones en la adopción de una nueva tecnología o las oscilaciones estacionales de patrones de tormentas?

Mapa de calor de llamadas de emergencia al 911

Representar datos tridimensionales (ubicación x e y, más tiempo) es difícil de hacer con un mapa bidimensional. Observe que en el ejemplo a continuación, no puede discernir que hay dos puntos calientes distintos (cerca unos de otros en el espacio, pero separados por el tiempo), hasta que los datos se visualizan en tres dimensiones. Al extruir las entidades con base en un campo de tiempo, se vuelve más claro qué entidades están relacionados y cuáles están separados por el tiempo.

2D frente a clusters en 3D

Hay al menos dos maneras de visualizar la salida desde los análisis de espacio-tiempo. La visualización tridimensional es eficaz con un área de estudio más pequeña cuando se tiene un número limitado de entidades; este enfoque le permite presentar relaciones de espacio-tiempo en un solo mapa. Otro método eficaz para representar los procesos de espacio-tiempo es a través de la animación. Los ejemplos siguientes se centran específicamente en la visualización de clusters de espacio-tiempo.

Animación

Para animar los clusters de espacio-tiempo habilite la hora en las entidades de resultado, abra el Control deslizante de tiempo desde la barra de herramientas Herramientas y haga clic en Reproducir Reproducir. Configure una ventana de tiempo que le permitirá ver lo suficiente de los datos de una sola vez en un solo paso. Si es nuevo en la creación de animaciones, siga los siguientes vínculos.

3D

Otra forma poderosa para visualizar los resultados de un análisis cluster de espacio-tiempo es utilizar la visualización en 3D. Con este método, el tiempo se convierte en tercera dimensión, con entidades de punto extruidas para reflejar la progresión temporal. En el gráfico anterior en 3D, por ejemplo, los eventos más antiguos están más cercanos a la tierra, y los eventos más recientes se desplazan a altas elevaciones (parecen estar más cerca al visor).

Para crear una representación en 3D de los datos como el anterior, deberá utilizar ArcGlobe (que se incluye con la instalación estándar de ArcGIS for Desktop).

En primer lugar, ejecute el análisis cluster de espacio-tiempo en ArcGlobe, a continuación cree un nuevo campo en la clase de entidad de salida para reflejar la altura de cada entidad. Para este ejemplo, las alturas se basarán en el número de días que han transcurrido desde que ocurrió el primer evento en el dataset. Para calcular el intervalo de tiempo, deberá utilizar una secuencia de comandos de VB y la función de fecha llamada DateDiff, como se muestra a continuación.

NotaNota:

Si tiene problemas para agregar un campo nuevo a la clase de entidad de salida debido a un bloqueo, guarde el documento de ArcGlobe y vuelva a abrirlo, o exporte la clase de entidad de salida a un nuevo dataset, agréguela al documento de mapa y simbolícela para que coincida con la clase de entidad de salida.

A continuación, ordene las entidades por fecha para que pueda identificar la fecha más temprana. Utilizará esto para calcular los nuevos valores de campo del intervalo de tiempo. Haga clic derecho en el nuevo campo que acaba de crear y elija Calculadora de campo. Desde la calculadora de campo, haga clic en las funciones de tipo Fecha y seleccione DateDiff desde el lado derecho de la calculadora, como se ilustra a continuación. Escriba DateDiff ("d", "3/1/2011", [ DateField]), sustituyendo la cadena de caracteres de fecha con la fecha más temprana en la clase de entidad y especifique su nuevo nombre de campo para el parámetro [DateField] ("d" indica que el intervalo de diferencia debería estar en días).

Calculadora de campo

InmersiónInmersión:

El ejemplo anterior utiliza VB para calcular los campos de fecha/tiempo. La declaración equivalente en Python sería:

(datetime.datetime.strptime(!Date_Con!, "%m/%d/%Y ").date() - datetime.date(2011, 3, 11)).days

El siguiente paso es cambiar las propiedades de visualización de ArcGlobe para que las entidades en el dataset aparezcan elevadas. Para hacer esto, haga clic con el botón derecho en la clase de entidad de salida y elija Propiedades. En el cuadro de diálogo de propiedades, haga clic en la pestaña Elevación. En la sección Elevación desde las entidades, elija Utilizar valor constante o expresión y, a continuación, haga clic en el botón Calculadora Calculadora y especifique el nuevo campo que creó con la función DateDiff. ArcGlobe ahora va a elevar las entidades con base en el campo intervalo de tiempo. Si descubre que las entidades no están mostrando suficiente elevación, es posible que desee multiplicar el campo intervalo de tiempo por una constante. En la propiedad Utilizar valor constante o la expresión de la pestaña Elevación, se vería algo así: [TimeLapse] *100, según se ilustra a continuación.

Multiplicar la elevación por una constante

A continuación puede utilizar la herramienta de navegación ArcGlobe Navegar a inclinar y vea los resultados de cluster desde distintos ángulos y puntos de vista. El mapa resultante podría ser algo así:

Vistas simples en 3D

9/11/2013