Qu'est‑ce qu'un modèle linéaire généralisé ?

Les modèles linéaires généralisés comme la régression par les moindres carrés permettent de rechercher la relation entre une variable de réponse et un ou plusieurs prédicteurs. La différence essentielle entre ces deux techniques tient au fait que les modèles linéaires généralisés sont habituellement utilisés avec des variables de réponse de catégorie. La régression des moindres carrés est généralement utilisée avec des variables de réponse continues. Pour une description complète des modèles linéaires généralisés, consultez 1

Les techniques de modèles linéaires généralisés et celles de régression sur les moindres carrés estiment les paramètres du modèle pour optimiser l'ajustement de ce dernier. La technique des moindres carrés réduit au maximum la somme des erreurs quadratiques dans le but d'obtenir des estimations de maximum de vraisemblance des paramètres. Les modèles linéaires généralisés permettent d'obtenir des estimations de maximum de vraisemblance des paramètres à l'aide d'un algorithme de moindres carrés itérativement repondérés.

Par exemple, vous pourriez utiliser un modèle linéaire généralisé afin d'étudier la relation entre les années d'expérience d'opérateurs (variable continue non négative) et leur participation à un programme de formation facultatif (variable binaire : oui ou non), afin de prévoir si leurs produits répondent aux spécifications (variable binaire : oui ou non). Les deux premières variables sont les prédicteurs, tandis que la troisième est la réponse de catégorie.

Types de régression logistique

Minitab Statistical Software fournit quatre techniques de modèles linéaires généralisés que vous pouvez utiliser pour évaluer la relation entre une ou plusieurs variables de prédiction et une variable de réponse des types suivants. L'exemple précédent utilise la régression logistique binaire car la variable de réponse possède deux niveaux.

Type de variable Nombre de catégories Caractéristiques Exemples

Binaire

2

Deux niveaux

Succès/Echec

Oui/Non

Max/Min

Ordinale

3 ou plus

Niveaux en ordre naturel

Goût (Léger, Moyen, Fort)

Etat médical (Critique, Grave, Stable, Bon)

Résultats d'enquête (Pas d'accord, Neutre, D'accord)

Nominale

3 ou plus

Niveaux sans ordre naturel

Goût (Amer, Sucré, Acide)

Couleur (Rouge, Bleu, Noir)

Matière scolaire (Maths, Sciences, Arts)

Poisson

3 ou plus

La variable de réponse indique le nombre d'occurrences d'un événement dans un espace d'observation fini.

0, 1, 2, ...
Remarque

Pour une modèle contenant un prédicteur continu et une variable de réponse binaire, Minitab propose une cinquième technique. Une droite d'ajustement binaire décrit succinctement la relation entre le prédicteur et la réponse.

1 P. McCullagh et J. A. Nelder (1992). Generalized Linear Models. Chapman & Hall.