Выполнение классификации
Цель классификации состоит в определении принадлежности каждой ячейки в исследуемой области известному классу (классификация с обучением) или кластеру (классификация без обучения). В этих двух случаях входными данными для классификации является файл сигнатур, содержащий многомерную статистику каждого класса или кластера. Результатом каждой классификации является карта, которая разделяет исследуемые области на известные классы, соответствующим обучающим образцам, или на естественно возникшие классы, соответствующие кластерам, определенным путем кластеризации. Классификация ячеек в естественно возникшие классы, соответствующие кластерам, всегда называется стратификацией.
На панели инструментов Классификация изображений (Image Classification) находится интегрированная среда для помощи в пошаговом рабочем процессе, необходимом для выполнения классификации. Более подробную информацию об этой панели инструментов см. в разделе Что такое классификация изображений?
Максимальное подобие
Ячейки в классе редко являются однородными. Это особенно сказывается на обучающих образцах, взятых для классификации с обучением. Например, если лиственные деревья в тени имеют сигнатуру отражения, которая напоминает хвойные деревья на солнце, оба типа деревьев в конечном итоге окажутся в одном классе. Любая область в обучающем образце, взятая из среды обитания, где вы ожидаете встретить медведей, может содержать внутренние области, которые отражают отсутствие медведей.
На древовидной схеме ниже, класс A представляет лиственные деревья, а класс B - хвойные. Как вы классифицируете ячейку, попадающую в область наложения двух классов? Нужно ли классифицировать ее в класс A или в класс B?
Классификация максимальной вероятности вычисляет для каждого класса возможность того, что ячейка принадлежит классу с учетом атрибутивных значений. Ячейка присваивается классу с наибольшей вероятностью, что называется «максимальная вероятность».
Необходимы некоторые допущения, чтобы классификация максимальной вероятности работала соответствующим образом:
- Данные для каждого канала должны быть распределены нормально.
- Каждый класс должен иметь нормальное распределение в многомерном атрибутивном пространстве.
- Априорные вероятности классов должны быть равны, т.е. в отсутствии каких-либо весов атрибутивных значений, все классы имеют одинаковую вероятность.
Если априорная вероятность не равна для каждого класса в исследуемой области, вы можете взвесить классы. Например, при классификации спутникового изображения Аляски для лесов и прочих типов растительности может быть задана большая априорная вероятность, чем для жилых построек. Это значит, что вероятность, что ячейка содержит дом, намного ниже вероятности, что в ячейке есть какой-либо тип растительности. Если значение ячейки попадает в перекрывающуюся часть классов типов домов и растительности, высок шанс того, что ячейка скорее содержит растительность, чем дом, и ячейку нужно классифицировать соответствующим образом.
Эта вероятность и логика взвешивания основаны на правилах решений Бейса. Фактические значения вероятности для каждой ячейки и класса определяются из средних точек и ковариационной матрицы для каждого класса (хранящегося в файле сигнатур).
Для выполнения классификации используйте инструмент Классификация по методу максимального подобия (Maximum Likelihood Classification). Для этого инструмента требуются входные каналы из многоканальных растров и отдельных одноканальных растров, а также соответствующий файл сигнатур. Необходимо идентифицировать способ, которым взвешиваются классы или кластеры. Есть три способа взвесить классы или кластеры: равно (equal), ячейки в образцы (cells in samples) и файл (file). Если выбран способ «равно», все классы будут взвешены с одинаковой априорной вероятностью. Если выбран способ «ячейки в образцы», априорные вероятности будут пропорциональны числу ячеек в каждом классе или кластере в файле сигнатур. Если выбран «файл», входные данные априорного файла станут активными, и априорные вероятности будут читаться из определенного файла. Необходимо определить исключенную область. Исключенная область определяет долю ячеек, которые останутся неклассифицированными, из-за нижнего значения вероятности корректного отнесения ячейки к тому или иному классу. Значение по умолчанию равно 0,0, следовательно, классифицированы будут все ячейки. Можно создать дополнительную точность. В итоге, нужно задать им выходного растра.
Вероятность классов
Вместо присвоения ячеек классу на основе самой высокой вероятности на выходном растре, инструмент Вероятность классов (Class Probability) выдает слои вероятности, по одному каналу на каждый входной класс или кластер. Значения в каждой ячейке для каждого канала хранят вероятность принадлежности этой ячейки классу или кластеру на основе атрибутов из исходных входных каналов.
Возможность может использоваться в следующей ситуации. Представьте, что вы классифицируете изображение, где один класс - лес, а другой - болота. После запуска инструмента вы обнаружите, что есть ячейки на выходном растре класса леса, которые получают 60-процентный шанс принадлежать классу леса и, на выходном растре класса болот, 30-процентный шанс принадлежать классу болот. Вместо классификации ячеек в лес, вы можете классифицировать их как заболоченный лес.
Просмотр многомерной классификации
Классификация с обучением
Ниже приведены шаги для выполнения классификации с обучением:
- Идентифицируйте входные каналы.
- Создайте обучающие образцы из известных ячеек нужных классов.
- Разработайте файл сигнатур.
- Просмотр и редактирование файла сигнатур при необходимости.
- Запустите классификацию.
Классификация без обучения
Ниже приведены шаги для выполнения классификации без обучения:
- Идентифицируйте входные каналы.
- Определите количество создаваемых кластеров.Разработайте файл сигнатур.
- Разработайте файл сигнатур.
- Просмотр и редактирование файла сигнатур при необходимости.
- Запустите классификацию.