000639 : Impossible d’estimer le modèle en raison de la multicolinéarité (redondance de données).

Description

En présence de multicolinéarité, le modèle de régression n’est pas résolu (la matrice de conception ne peut pas être inversée). Ce cas se produit lorsque plusieurs variables sont redondantes (ce qui signifie qu’elles racontent la même "histoire" ou presque). Un modèle efficace possède des variables explicatives qui répondent chacune à une facette distincte de la variable dépendante que vous essayez de prévoir/comprendre.

Solution

(1) Retirez les éventuels champs redondants du groupe de variables explicatives. (2) Identifiez et retirez les variables explicatives dont la valeur est identique pour toutes les entités (un champ contenant uniquement des zéros, par exemple). (3) Créez une matrice de nuage de points pour les variables explicatives et examinez s’il existe des corrélations presque parfaites. Si tel est le cas, envisagez d’écarter du modèle une des variables correspondantes.

9/12/2013