Interprétation des résultats principaux pour la fonction Régression logistique nominale

Suivez les étapes suivantes pour interpréter un modèle de régression logistique nominale. Les résultats clés incluent la valeur de p, les coefficients et le log de vraisemblance.

Etape 1 : Déterminer si l'association entre la réponse et les termes est significative du point de vue statistique

Pour déterminer si l'association entre la réponse et chacun des termes du modèle est statistiquement significative, comparez la valeur de p du terme à votre seuil de signification pour évaluer l'hypothèse nulle. L'hypothèse nulle est qu'il n'existe aucune association entre le terme et la réponse. En général, un seuil de signification (noté alpha ou α) de 0,05 fonctionne bien. Un seuil de signification de 0,05 indique un risque de 5 % de conclure à tort qu'il existe une association.
Valeur de p ≤ α : l'association est statistiquement significative.
Si la valeur de p est inférieure ou égale au seuil de signification, vous pouvez conclure qu'il existe une association statistiquement significative entre la variable de réponse et le terme.
Valeur de p > α : l'association n'est pas statistiquement significative.
Si la valeur de p est supérieure au seuil de signification, vous ne pouvez pas conclure qu'il existe une association statistiquement significative entre la variable de réponse et le terme. Il est sans doute nécessaire de réajuster le modèle sans le terme.
Si plusieurs prédicteurs ne présentent aucune association statistiquement significative avec la réponse, vous pouvez réduire le modèle en supprimant ces termes un par un. Pour plus d'informations sur la suppression de termes d'un modèle, reportez-vous à la rubrique Réduction du modèle.

Pour un facteur de catégorie avec plus de 2 niveaux, l'hypothèse pour le coefficient consiste à déterminer si le niveau du facteur est différent du niveau de référence pour le facteur. Pour évaluer la signification statistique du facteur, utilisez le test pour les termes avec plusieurs degrés de liberté. Pour plus d'informations sur la méthode d'affichage de ce test, reportez-vous à Sélectionner les résultats à afficher pour la fonction Régression logistique nominale.

Tableau de régression logistique Rapport des probabilités Prédicteur Coeff Coef ErT Z P de succès Logit 1 : (Maths/Science) Constante -1,12266 4,56425 -0,25 0,806 Méth. Enseignmt Expliquer -0,563115 0,937591 -0,60 0,548 0,57 Age 0,124674 0,401079 0,31 0,756 1,13 Logit 2 : (Arts/Science) Constante -13,8485 7,24256 -1,91 0,056 Méth. Enseignmt Expliquer 2,76992 1,37209 2,02 0,044 15,96 Age 1,01354 0,584494 1,73 0,083 2,76
IC à 95 % Prédicteur Inférieur Supérieur Logit 1 : (Maths/Science) Constante Méth. Enseignmt Expliquer 0,09 3,58 Age 0,52 2,49 Logit 2 : (Arts/Science) Constante Méth. Enseignmt Expliquer 1,08 234,90 Age 0,88 8,66

Log de vraisemblance = -26,446

Test visant à vérifier que toutes les pentes sont égales à zéro Valeur DL G de p 4 12,825 0,012
Tests d'adéquation de l'ajustement Méthode Khi deux DL P Pearson 6,95295 10 0,730 Somme des carrés d'écart 7,88622 10 0,640
Résultats principaux : valeur de p, coefficients

Dans ces résultats, les prédicteurs sont la méthode d'enseignement et l'âge. La réponse est la matière préférée de l'élève. La science représente le niveau de référence, les résultats comparent donc les autres matières à la science. Au seuil de signification de 0,05, vous pouvez conclure que les modifications de la méthode d'enseignement sont associées aux probabilités que les élèves préfèrent l'art à la science.

Dans le tableau de régression logistique, le résultat de comparaison est le premier résultat après l'étiquette logit, et le résultat de référence est le deuxième résultat. Les coefficients positifs rendent le résultat de comparaison plus probable que le résultat de référence lorsque le prédicteur continu augmente. Les coefficients positifs rendent également le résultat de comparaison plus probable au niveau de comparaison du prédicteur de catégorie qu'au niveau de référence du prédicteur de catégorie. Pour plus d'informations, reportez-vous à la rubrique Toutes les statistiques et tous les graphiques et cliquez sur Coeff.

Logit 2 compare les arts à la science. Dans logit 2, le coefficient pour Explication est d'environ 3. Comme la valeur est positive, les élèves sont plus susceptibles de préférer les arts à la science lorsque la méthode d'enseignement est Explication.

Etape 2 : Déterminer l'ajustement du modèle aux données

Pour déterminer le degré d'ajustement du modèle aux données, examinez le log de vraisemblance. Les valeurs élevées du log de vraisemblance indiquent un meilleur ajustement aux données. Les valeurs de log de vraisemblance étant négatives, plus elles sont proches de 0, plus la valeur est importante. Le log de vraisemblance dépend des données d'échantillons, vous ne pouvez donc pas l'utiliser pour comparer des modèles issus de différents ensembles de données.

Le log de vraisemblance ne peut pas diminuer lorsque vous ajoutez des termes à un modèle. Par exemple, un modèle comportant 5 termes a un log de vraisemblance plus élevé que les modèles à 4 termes que vous pouvez créer avec les mêmes termes. Cependant, le log de vraisemblance est le plus utile lorsque vous comparez des modèles de même taille. Pour prendre une décision concernant des termes individuels, observez les valeurs de p pour le terme dans les différents logits.

Tableau de régression logistique Rapport des probabilités Prédicteur Coeff Coef ErT Z P de succès Logit 1 : (Maths/Science) Constante 0,287682 0,540062 0,53 0,594 Méth. Enseignmt Expliquer -0,575364 0,935415 -0,62 0,538 0,56 Logit 2 : (Arts/Science) Constante -1,79176 1,08011 -1,66 0,097 Méth. Enseignmt Expliquer 2,48491 1,24162 2,00 0,045 12,00
IC à 95 % Prédicteur Inférieur Supérieur Logit 1 : (Maths/Science) Constante Méth. Enseignmt Expliquer 0,09 3,52 Logit 2 : (Arts/Science) Constante Méth. Enseignmt Expliquer 1,05 136,79

Log de vraisemblance = -28,379

Test visant à vérifier que toutes les pentes sont égales à zéro Valeur DL G de p 2 8,959 0,011 * REMARQUE * Aucun test d'adéquation de l'ajustement réalisé. * REMARQUE * Le modèle utilise tous les degrés de liberté.
Tableau de régression logistique Rapport des probabilités Prédicteur Coeff Coef ErT Z P de succès Logit 1 : (Maths/Science) Constante -1,12266 4,56425 -0,25 0,806 Méth. Enseignmt Expliquer -0,563115 0,937591 -0,60 0,548 0,57 Age 0,124674 0,401079 0,31 0,756 1,13 Logit 2 : (Arts/Science) Constante -13,8485 7,24256 -1,91 0,056 Méth. Enseignmt Expliquer 2,76992 1,37209 2,02 0,044 15,96 Age 1,01354 0,584494 1,73 0,083 2,76
IC à 95 % Prédicteur Inférieur Supérieur Logit 1 : (Maths/Science) Constante Méth. Enseignmt Expliquer 0,09 3,58 Age 0,52 2,49 Logit 2 : (Arts/Science) Constante Méth. Enseignmt Expliquer 1,08 234,90 Age 0,88 8,66

Log de vraisemblance = -26,446

Test visant à vérifier que toutes les pentes sont égales à zéro Valeur DL G de p 4 12,825 0,012
Tests d'adéquation de l'ajustement Méthode Khi deux DL P Pearson 6,95295 10 0,730 Somme des carrés d'écart 7,88622 10 0,640
Résultats principaux : log de vraisemblance

Par exemple, la directrice d'une école souhaite évaluer différentes méthodes d'enseignement. Le modèle avec la méthode d'enseignement seule a un log de vraisemblance d'environ −28.

Le modèle comportant la méthode d'enseignement et l'âge d'un élève a un log de vraisemblance d'environ −26. Vous ne pouvez pas utiliser le log de vraisemblance pour faire un choix entre ces deux modèles car ces derniers n'ont pas le même nombre de termes.

En utilisant ce site, vous acceptez l'utilisation de cookies à des fins d'analyse et de personnalisation du contenu.  Lisez notre politique