Географически взвешенная регрессия (ГВР) (Пространственная статистика)

Уровень лицензии:BasicStandardAdvanced

Краткая информация

Выполняет Географически взвешенную регрессию (ГВР), локальную форму линейной регрессии, используемую для моделирования отношений, варьирующихся в пространстве.

Более подробно о работе Географически взвешенная регрессия

Рисунок

Географически взвешенная регрессия
ГВР – это локальная регрессионная модель. Коэффициенты могут варьироваться.

Использование

Синтаксис

GeographicallyWeightedRegression_stats (in_features, dependent_field, explanatory_field, out_featureclass, kernel_type, bandwidth_method, {distance}, {number_of_neighbors}, {weight_field}, {coefficient_raster_workspace}, {cell_size}, {in_prediction_locations}, {prediction_explanatory_field}, {out_prediction_featureclass})
ПараметрОбъяснениеТип данных
in_features

Класс пространственных объектов, содержащий зависимые и независимые переменные.

Feature Layer
dependent_field

Числовое поле, содержащее значения, для которых вы пытаетесь моделировать.

Field
explanatory_field
[explanatory_field,...]

Перечень полей, представляющих независимые переменные в вашей регрессионной модели.

Field
out_featureclass

Выходной класс объектов с оценками зависимых переменных и невязками.

Feature Class
kernel_type

Указывает, создается ли ядро как фиксированное, или оно может изменяться в пространстве как функция от плотности объектов.

  • ФиксированноеПространственный контекст (Гауссово ядро), используемый для решения каждого локального регрессионного анализа, является фиксированным расстоянием.
  • АдаптивноеПространственный контекст (Гауссово ядро) является функцией от конкретного количества соседей. Где распределение объектов плотное, пространственный контекст меньше; где распределение объектов редкое, пространственный контекст больше.
String
bandwidth_method

Определяет, как экстент ядра должен быть определен. Когда AICc или CV выбраны, инструмент найдет оптимальное расстояние/количество соседей для вас. Если вы не уверены, какие значения указать в параметрах Расстояние (Distance) (тип Ядра = ФИКСИРОВАННЫЙ) или Количество соседей (Number of Neighbors) (тип Ядра = АДАПТИВНЫЙ), стандартным вариантом является выбор либо AICc, либо CV. Если выбран параметр ШИРИНА ПОЛОСЫ (BANDWIDTH PARAMETER), следует указать значения Расстояние (Distance) или Количество соседей (Number of Neighbors).

  • AICcЭкстент ядра определяется с помощью Информационного критерия Akaike (AICc).
  • CVЭкстент ядра определяется с помощью Перекрестной проверки.
  • BANDWIDTH_PARAMETERЭкстент ядра определяется с помощью фиксированного расстояния или фиксированного количества соседей.
String
distance
(дополнительно)

Указывает фиксированную ширину полосы или расстояние, если тип ядра – FIXED (ФИКСИРОВАННЫЙ), а метод задания ширины полосы – BANDWIDTH PARAMETER.

Double
number_of_neighbors
(дополнительно)

Целое число, отражающее точное число соседей, для их включения в локальную ширину полосы Гауссова ядра всякий раз, когда тип ядра – ADAPTIVE (АДАПТИВНЫЙ), а метод задания ширины полосы = BANDWIDTH PARAMETER.

Long
weight_field
(дополнительно)

Числовое поле, содержащее пространственные веса для индивидуальных объектов. Поле веса позволяет рассматривать некоторые объекты как более важные по сравнению с другими в процессе калибровки модели. Прежде всего, полезно, когда число образцов, взятых в различных местоположениях, изменяется, значения для зависимых и независимых переменных усреднены, и места с большим количеством образцов более надежны (должны иметь больший вес). Если у вас есть в среднем 25 различных образцов для одного местоположения, но в среднем 2 образца для другого местоположения, вы можете использовать число образцов как ваше поле весов так, чтобы местоположения с большим количеством образцов имели большее влияние на образцовую калибровку, чем местоположения с немногими образцами.

Field
coefficient_raster_workspace
(дополнительно)

Полное имя пути к рабочему пространству, где будут создаваться коэффициенты растров. Когда это рабочее пространство обеспечено, растры создаются для точки пересечения и каждой независимой переменной.

Folder
cell_size
(дополнительно)

Размер ячейки (число) или ссылка на размер ячейки (имя пути к растровому набору данных) для использования при создании растров коэффициентов.

Размер ячейки по умолчанию является самым меньшим значением ширины или высоты экстента, определенных в среде геообработки выходной системы координат, и разделенных на 250.

Analysis Cell Size
in_prediction_locations
(дополнительно)

Класс объектов, содержащий объекты, представляющие местоположения, где оценки должны быть вычислены. Каждый объект в этом наборе данных должен содержать значения для всех независимых переменных; зависимая переменная для этих объектов будет оценена, используя модель, калиброванную для данных во входном классе объектов.

Feature Layer
prediction_explanatory_field
[prediction_explanatory_field,...]
(дополнительно)

Перечень полей, представляющих независимые переменные в классе пространственных объектов Местоположения интерполяции. Эти имена полей должны быть предоставлены в том же порядке (отношение один к одному), что и перечисленные для входного класса объектов независимые переменные. Если независимые переменные предсказания не приведены, выходной класс предсказанных пространственных объектов будет содержать только рассчитанные коэффициенты значений для каждого предсказанного местоположения.

Field
out_prediction_featureclass
(дополнительно)

Выходной класс объектов для оценок зависимых переменных для каждого объекта в классе пространственных объектов Предсказанных местоположений.

Feature Class

Пример кода

Географически взвешенная регрессия (ГВР). Пример (окно Python)

Следующий скрипт, представленный в окне Python, демонстрирует, как использовать инструмент GeographicallyWeightedRegression.

import arcpy
arcpy.env.workspace = "c:/data"
arcpy.GeographicallyWeightedRegression_stats("CallData.shp", "Calls","BUS_COUNT;RENTROCC00;NoHSDip",
                                             "CallsGWR.shp", "ADAPTIVE", "BANDWIDTH PARAMETER",
                                             "#", "25", "#","CoefRasters", "135", "PredictionPoints", 
                                             "#", "GWRCallPredictions.shp")
Пример ГВР (автономный скрипт Python)

Следующий автономный скрипт Python демонстрирует, как использовать инструмент GeographicallyWeightedRegression.

# Model 911 emergency calls using GWR

# Import system modules
import arcpy

# Set the geoprocessor object property to overwrite existing outputs
arcpy.gp.overwriteOutput = True

# Local variables...
workspace = r"C:\Data"

try:
    # Set the current workspace (to avoid having to specify the full path to the feature classes each time)
    arcpy.env.workspace = workspace

    # 911 Calls as a function of {number of businesses, number of rental units,
    # number of adults who didn't finish high school}
    # Process: Geographically Weighted Regression... 
    gwr = arcpy.GeographicallyWeightedRegression_stats("CallData.shp", "Calls", 
                        "BUS_COUNT;RENTROCC00;NoHSDip",
                        "CallsGWR.shp", "ADAPTIVE", "BANDWIDTH PARAMETER","#", "25", "#",
                        "CoefRasters", "135", "PredictionPoints", "#", "GWRCallPredictions.shp")

    # Create Spatial Weights Matrix to use with Global Moran's I tool
    # Process: Generate Spatial Weights Matrix... 
    swm = arcpy.GenerateSpatialWeightsMatrix_stats("CallsGWR.shp", "UniqID",
                        "CallData25Neighs.swm",
                        "K_NEAREST_NEIGHBORS",
                        "#", "#", "#", 25) 
                        
    # Calculate Moran's Index of Spatial Autocorrelation for 
    # OLS Residuals using a SWM File.  
    # Process: Spatial Autocorrelation (Morans I)...      
    moransI = arcpy.SpatialAutocorrelation_stats("CallsGWR.shp", "StdResid",
                        "NO_REPORT", "GET_SPATIAL_WEIGHTS_FROM_FILE", 
                        "EUCLIDEAN_DISTANCE", "NONE", "#", 
                        "CallData25Neighs.swm")

except:
    # If an error occurred when running the tool, print out the error message.
    print arcpy.GetMessages()

Параметры среды

Выходная система координат (Output Coordinate System)

Геометрия пространственных объектов проецируется в Выходную систему координат после завершения анализа. Следовательно, значения, введенные для параметра Расстояние (Distance) должны быть указаны в тех же самых единицах, что и Входной класс объектов (Input feature class). Значения, введенные для Выходного размера ячейки (Output cell size) должны быть в таких же единицах, что и выходная система координат.

Связанные темы

Информация о лицензировании

ArcGIS for Desktop Basic: Требует ArcGIS Spatial Analyst или Geostatistical Analyst
ArcGIS for Desktop Standard: Требует ArcGIS Spatial Analyst или Geostatistical Analyst
ArcGIS for Desktop Advanced: Да
5/10/2014