Tableau récapitulatif du modèle pour la fonction Ajuster le modèle logistique binaire

Obtenez des définitions et bénéficiez de conseils en matière d'interprétation pour chaque statistique fournie dans le tableau récapitulatif du modèle.

R carré de la somme des carrés d'écart

Le R2 de la somme des carrés d'écart est généralement considéré comme la proportion de la somme des carrés d'écart de la variable de réponse que le modèle explique.

Interprétation

Plus le R2 de la somme des carrés d'écart est élevé, plus le modèle est ajusté à vos données. Le R2 de la somme des carrés d'écart est toujours compris entre 0 et 100 %.

Le R2 de la somme des carrés d'écart augmente toujours lorsque vous ajoutez des prédicteurs à un modèle. Par exemple, le meilleur modèle à 5 prédicteurs aura toujours une valeur R2 au moins aussi élevée que celle du meilleur modèle à 4 prédicteurs. Par conséquent, le R2 de la somme des carrés d'écart est surtout utile pour comparer des modèles de même taille.

La valeur R2 de la somme des carrés d'écart n'est qu'une des mesures de l'ajustement du modèle aux données. Même si un modèle a une valeur R2 élevée, vous devez consulter les graphiques des valeurs résiduelles et les tests d'adéquation de l'ajustement pour évaluer l'ajustement du modèle aux données.

Vous pouvez utiliser une droite d'ajustement pour illustrer graphiquement différentes valeurs de R2 de la somme des carrés d'écart. Le premier diagramme illustre un modèle qui explique environ 96 % de la somme des carrés d'écart de la réponse. Le second diagramme illustre un modèle qui explique environ 60 % de la somme des carrés d'écart de la réponse. Plus un modèle explique la somme des carrés d'écart, plus les points de données sont proches de la courbe. En théorie, si un modèle pouvait expliquer 100 % de la somme des carrés d'écart, les valeurs ajustées seraient toujours égales aux valeurs observées et tous les points de données se situeraient sur la courbe.

Le format des données a un impact sur le R2 de la somme des carrés d'écart. Celui-ci est généralement plus élevé pour les données qui sont au format événement/essai. Les R2 de la somme des carrés d'écart sont comparables uniquement entre des modèles qui utilisent le même format de données. Pour plus d'informations, reportez-vous à la rubrique Influence du format des données sur l'ajustement dans la régression logistique binaire.

R carré (ajust) de la somme des carrés d'écart

Le R2 ajusté de la somme des carrés d'écart est la proportion de la somme des carrés d'écart de la réponse qui est expliquée par le modèle, ajustée au nombre de prédicteurs du modèle par rapport au nombre d'observations.

Interprétation

Pour comparer des modèles n'ayant pas le même nombre de prédicteurs, utilisez le R2 ajusté de la somme des carrés d'écart. Celui-ci augmente toujours lorsque vous ajoutez un prédicteur au modèle. Le R2 ajusté de la somme des carrés d'écart intègre le nombre de prédicteurs dans le modèle pour vous aider à choisir le modèle correct.

Par exemple, vous travaillez pour un fabricant de pommes chips qui étudie les facteurs influant sur le pourcentage de chips brisées. Vous obtenez les résultats suivants lorsque vous ajoutez les prédicteurs :
Etape % de pomme de terre Vitesse de refroidissement Température de cuisson R2 de la somme des carrés d'écart R2 ajusté de la somme des carrés d'écart Valeur de p
1 X     52% 51% 0,00
2 X X   63% 62% 0,00
3 X X X 65% 62% 0,00

La première étape génère un modèle de régression statistiquement significatif. La deuxième étape, qui ajoute la vitesse de refroidissement au modèle, augmente le R2 ajusté de la somme des carrés d'écart, ce qui indique que la vitesse de refroidissement améliore le modèle. La troisième étape, qui ajoute la température de cuisson au modèle, augmente le R2 de la somme des carrés d'écart, mais pas le R2 ajusté de la somme des carrés d'écart. Ces résultats prouvent que la température de cuisson n'améliore pas le modèle. D'après ces résultats, vous envisagez d'enlever la température de cuisson du modèle.

Pour la régression logistique binaire, le format des données a un effet sur la valeur de R2 ajusté de la somme des carrés d'écart. Pour les mêmes données, le R2 ajusté de la somme des carrés d'écart est en général supérieur lorsque les données ont le format Evénement/Essai au lieu du format Réponse binaire/Effectif. Utilisez le R2 ajusté de la somme des carrés d'écart uniquement pour comparer l'ajustement des modèles avec le même format de données. Pour plus d'informations, reportez-vous à la rubrique Influence du format des données sur l'ajustement dans la régression logistique binaire.

AIC

Le critère d'information d'Akaike est une mesure de la qualité relative d'un modèle qui représente l'ajustement et le nombre de termes du modèle. Cette statistique ne peut pas être interprétée sans valeur de comparaison.

Interprétation

Utilisez l'AIC pour comparer différents modèles. Plus l'AIC est faible, plus le modèle est ajusté aux données. Cependant, le modèle dont l'AIC est le plus faible pour un ensemble de prédicteurs n'est pas forcément bien ajusté aux données. Vous devez aussi utiliser les graphiques des valeurs résiduelles et les tests d'adéquation de l'ajustement pour évaluer l'ajustement du modèle aux données.

En utilisant ce site, vous acceptez l'utilisation de cookies à des fins d'analyse et de personnalisation du contenu.  Lisez notre politique