Как работает инструмент Классификация по методу максимального подобия (Maximum Likelihood Classification)
Алгоритм, используемый инструментом Классификация по методу максимального подобия (Maximum Likelihood Classification), основывается на двух основных принципах:
- Значения ячеек в выборке для каждого класса в многомерном пространстве подчиняются закону нормального распределения
- Используется теория Байе (теорема принятия решений)
Этот инструмент, при отнесении каждой ячейки к одному из классов, представленных в файле сигнатур, учитывает как дисперсии, так и ковариации сигнатур классов. При допущении, что выборка для класса подчиняется нормальному распределению, класс может быть охарактеризован вектором среднего и матрицей ковариации. После присвоения этих двух характеристик каждому значению ячейки из каждого класса, для определения принадлежности ячеек к тому или иному классу, вычисляется статистическая вероятность. Если задана опция EQUAL (РАВНО) для Взвешенной априорной вероятности, каждая ячейка будет отнесена к тому классу, вероятность принадлежности ячейки к которому максимальна.
Если вероятность встречаемости некоторых классов выше (или ниже) среднего, должна использоваться опция FILE (ФАЙЛ), работающая с Входным файлом априорной вероятности (Input a priori probability file). Веса классов с определенными вероятностями задаются в файле априорных вероятностей. В такой ситуации, файл априорных вероятностей помогает в определении местоположения ячеек, которые попадают в статистическое перекрытие двух классов. Такие ячейки будут отнесены к соответствующему классу с большей точностью, что, в итоге, приводит к лучшим результатам классификации. Такой подход к классификации с применением взвешивания носит название байсовского классификатора.
При выборе опции SAMPLE (ВЫБОРКА), априорные вероятности, присвоенные всем классам, представленным во входном файле сигнатур, будут пропорциональны числу ячеек, отнесенных к каждой сигнатуре. Следовательно, классы, в которые попадает меньшее число ячеек, чем среднее для выборки, получат веса ниже среднего, а те, в которых ячеек больше, получат большие веса. В результате, к соответствующим классам будет отнесено большее или меньшее количество ячеек.
Когда выполняется классификация по методу максимального подобия, дополнительно может быть также создан выходной растр достоверности (confidence raster). Этот растр показывает уровни достоверности классификации. Число уровней достоверности равно 14; это число напрямую связано с числом действительных значений доли отклонения. Первый уровень достоверности, код которого на растре достоверности - единица, состоит из ячеек, удаленных от любого вектора среднего, хранящегося в файле сигнатур, на самое короткое расстояние; следовательно, классификация этих ячеек выполнена с наибольшей определенностью. Ячейки, составляющие второй уровень достоверности (значение ячейки 2 на доверительном растре) будут классифицированы, только если исключенная область равна 0,99 или меньше. Наименьший уровень достоверности имеет значение 14 на растре достоверности, показывающим ячейки, которые скорее всего будут неправильно классифицированы. Ячейки этого уровня достоверности не будут классифицированы, когда доля отклонения равна 0.005 или больше.
Пример:
Следующий пример иллюстрирует классификацию многоканального растра, состоящего из трех каналов, с выделением пяти классов. Выделены следующие пять классов: сухое русло реки, лес, озеро, селитьба/сады и пастбища. Будет также создан выходной растр достоверности. Входные каналы растра приведены ниже.
Инструмент Классификация по методу максимального подобия (Maximum Likelihood Classification) используется для классификации растра на пять классов.
- Параметры, используемые в диалоговом окне инструмента Классификация по методу максимального подобия (Maximum Likelihood Classification):
Входные растровые каналы (Input raster bands) : redlands
Входной файл сигнатур (Input signature file) : wedit.gsg
Выходной многоканальный растр (Output multiband raster) : mlclass_1
Исключенная область (Reject fraction) : 0.01
Взвешенная априорная вероятность (A priori probability weighting) : EQUAL
Входной файл априорной вероятности (Input a priori probability file) : apriori_file_1
Выходной растр достоверности (Output confidence raster) : reject_ras
Классифицированный растр выглядит следующим образом:
Участки, выделенные красным цветом, - это ячейки, шанс которых быть правильно классифицированными меньше 1 процента. Благодаря использованному значению доли отклонения, равному 0,01, этим ячейкам присваивается значение NoData. Класс, соответствующий сухому руслу реки, показан белым цветом; класс, соответствующий лесу, - зеленым цветом; класс, соответствующий озерам, - синим цветом; класс, соответствующий селитьбе/садам, - желтым цветом; и наконец, оранжевым цветом показан класс, соответствующий пастбищам.
Приведенный ниже список - это таблица атрибутов значений выходного растра доверия. В нем показано число ячеек, классифицированных с той или иной степенью доверия. Значение, равное 1, означает 100-процентную вероятность того, что ячейка классифицирована правильно. С этим уровнем доверия классифицировано 3033 ячейки. Значение, равное 5, означает 95-процентную вероятность того, что ячейка классифицирована правильно. Количество ячеек, для которых вероятность того, что они классифицированы правильно, составляет 0,005, и которым на растре доверия присвоено значение, равное 14, - 10701.
RECORD VALUE COUNT 1 1 3033 2 2 3061 3 3 9187 4 4 16717 5 5 37361 6 6 136420 7 7 269592 8 8 250863 9 9 105001 10 10 23598 11 11 11190 12 12 11546 13 13 3621 14 14 10701