Классификация данных

При выполнении классификации похожие объекты группируются в классы с помощью назначения одинакового символа для каждого члена класса. Агрегирование объектов в классы упрощает процесс выявления закономерностей в данных. Определение диапазона класса определяет, какие объекты входят в этот класс и как они влияют на отображение карты. С помощью изменения границ между классами можно создавать карты различных видов. Классы можно создавать вручную. Также можно воспользоваться стандартной схемой классификации.

Зачем задавать классы вручную?

Создавайте классы вручную, если требуется, чтобы объекты соответствовали определенным критериям или при выполнении сравнения объектов по определенным достоверным значениям. Для этого задайте вручную верхний и нижний предел для каждого класса.

Данные также можно классифицировать вручную для выделения определенного диапазона значений, например расположенного выше или ниже порогового значения. Например, можно выделить область ниже определенного уровня высоты, которая подвержена затоплению.

Ручное назначение классов также может оказаться полезным для изоляции и выделения диапазонов данных. Например, если общий диапазон набора данных составляет от 0,0465 до 0,1736 и требуется изолировать большие значения, можно вручную назначить все значения ниже 0,15 одному классу, а все значения выше этого значения — другому классу.

Классификация вручную (Manual classification)

На диаграмме показано, как можно выделить выбранные диапазоны данных с помощью ручного назначения классов.

Использование стандартной схемы классификации

Заданные способы задания и разделения на классы определяют объем данных, которые входят в каждый из классов, и способ их представления на карте. В схеме классификации используются два основных компонента: количество классов, в которых организованы данные, и метод назначения классов. Количество классов зависит от цели анализа. Правила, по которым данные назначаются классам, требуется немного пояснить. Для геостатического слоя существует три стандартных способа назначения данных классам.

Равные интервалы

Диапазон возможных значений разделен на равные интервалы. Так как в экстремальных значениях обычно меньше конечных точек, количество значений меньше в экстремальных классах. Эта опция используется для выделения изменений в экстремальных диапазонах. Данный способ лучше всего применяется к часто используемым диапазонам, таким как проценты или температура.

Равные интервалы

Квантиль

Диапазон возможных значений разделен на неравные интервалы, но количество значений в каждом классе одинаково. Классы в экстремальных и средних диапазонах содержат одинаковое количество значений. Так как интервалы обычно больше в крайних положениях, эту опцию удобно использовать для выделения изменений в средних значениях распределения.

Квантиль

Геометрические интервалы

Данная схема классификации методом геометрических интервалов строит границы классов, основываясь на интервалах, имеющих геометрическую последовательность. Геометрический коэффициент в этом классификаторе может измениться (на обратный к нему), чтобы оптимизировать диапазоны классов. Алгоритм создает геометрические интервалы путем минимизирования квадратической суммы элементов в каждом классе. Это позволяет добиться того, что в каждом классе будет находиться примерно равное количество значений, и размеры интервалов будут примерно равнозначными.

Геометрические интервалы

Этот алгоритм был специально разработан для обработки непрерывных данных. Этот метод сочетает в себе достоинства методов равного интервала, естественных границ и квантиля. Он позволяет корректно разделить средние значения и выбивающиеся из ряда крайние, позволяя получить результат, адекватный с картографической точки зрения и визуально привлекательный.

Например, метод классификации по геометрическому интервалу подходит для набора данных об уровне осадков, где зарегистрированы осадки только в атрибутах 15 из 100 метеостанций (менее 50%), а атрибуты остальных метеостанций равны 0.

ПримечаниеПримечание:

Метод классификации по геометрическим интервалам изначально назывался «малые квантили», когда он был добавлен в модуль ArcGIS Geostatistical Analyst Extension для ArcGIS.

Связанные темы

9/11/2013