000639 : Невозможно оценить модель по причине мультиколлинеарности (избыток данных).

Описание

Невозможно решить модель регрессии (матрица не может быть интерполирована) при наличии мультиколлинеарности. Мультиколлинеарность возникает, если две или более переменных являются излишними (это означает, что они рассказывают ту же "историю", или почти ту же "историю"). Эффективная модель будет иметь независимые переменные, каждая из которых относится к своему аспекту зависимой переменной, которую Вы пытаетесь предсказать/понять.

Решение

(1) Удалите любые избыточные поля из набора независимых переменных. (2) Идентифицируйте и удалите любые независимые переменные, имеющие одно значение для всех пространственных объектов, например, поле, содержащее все нули. (3) Создайте матрицу рассеивания (scatterplot matrix) для независимых переменных и оцените наличие почти идеальной корреляции. Если это так, отбросьте одну из соответствующих переменных из модели.

9/11/2013