Нормальный график КК и общий график КК (Normal QQ Plot and General QQ Plot)

Графики квантиль-квантиль (КК) — это графики, на которых квантили из двух распределений расположены относительно друг друга.

Построение нормального графика КК

Во-первых, необходимо упорядочить значения данных и вычислить значения кумулятивного распределения как (i— 0,5)/n для i-го упорядоченного значения из n общих значений (так мы получим пропорцию данных, не соответствующих конкретному значению). График кумулятивного распределения создается путем наложения упорядоченных данных на значения кумулятивного распределения (график в верхнем левом углу нижеприведенного рисунка). Такой же процесс выполняется для стандартного нормального распределения (Гауссово распределение с усредненным значением = 0 и стандартным отклонением = 1 изображено на графике в верхнем правом углу нижеприведенного рисунка). Как только будут созданы оба графика кумулятивного распределения, значения данных, соответствующие указанным квантилям, соединяются попарно и наносятся на график КК (нижний график на рисунке).

Нормальный график КК
Пример нормального графика КК

Построение общего графика КК

Общий график КК позволяет оценить сходство распределений двух наборов данных. Такие графики создаются так же, как и нормальные графики КК. Единственным отличием является возможность использования любого набора данных в качестве второго набора данных. Если наборы данных имеют одинаковые распределения, точки на общем графике КК выстроятся в прямую (под углом 45 градусов) линию.

Общий график КК
Пример общего графика КК

Проверка распределения данных с помощью графиков КК

Точки нормального графика КК дают представление об одномерной нормальности набора данных. Если данные распределены нормально, точки выстроятся на базовой линии, проходящей под углом 45 градусов. Если данные не распределены нормально, точки отклоняться от базовой линии.

На следующем графике, значения квантилей стандартного нормального распределения нанесены на ось X нормального графика КК, а соответствующие значение квантилей набора данных — на ось Y. Можно увидеть, что точки расположены близко к 45-градусной базовой линии. Основное отклонение от этой линии возникает при высоких значениях концентрации озона.

С помощью нормального графика КК можно выбрать точки, которые не расположены вблизи базовой линии. Местоположения выбранных точек затем выделяются в виде данных ArcMap. Как показано ниже, они сосредоточены вокруг залива Сан-Франциско (на представленной ниже карте точки показаны розовым цветом).

Карта графика КК
Карта графика КК

Пример использования преобразования данных

Нормальный график КК аналогичного набора данных представлен здесь:

Стандартное нормальное распределение: преобразованный график КК
Стандартное нормальное распределение: преобразованный график КК

Обратите внимание, как точки отклоняются от прямой линии.

Однако, как показано на рисунке ниже, при применении логарифмического преобразований к набору данных, точки приближаются к 45-градусной базовой линии.

Стандартное нормально распределение: логарифмическое преобразование графика КК
Стандартное нормально распределение: логарифмическое преобразование графика КК

Преобразования по методу Box-Cox и по методу арксинуса также можно применять к данным в пределах возможностей инструмента "Нормальный график КК" для оценки их влияния на нормальность распределения.

9/11/2013