Interprétation des résultats principaux pour la fonction Régression logistique ordinale

Suivez les étapes ci-dessous pour interpréter un modèle de régression logistique ordinale. Les résultats principaux incluent la valeur de p, les coefficients, le log de vraisemblance et les mesures d'association.

Etape 1 : Déterminer si l'association entre la réponse et les termes est significative du point de vue statistique

Pour déterminer si l'association entre la réponse et chacun des termes du modèle est statistiquement significative, comparez la valeur de p du terme à votre seuil de signification pour évaluer l'hypothèse nulle. L'hypothèse nulle est qu'il n'existe aucune association entre le terme et la réponse. En général, un seuil de signification (noté alpha ou α) de 0,05 fonctionne bien. Un seuil de signification de 0,05 indique un risque de 5 % de conclure à tort qu'il existe une association.
Valeur de p ≤ α : l'association est statistiquement significative
Si la valeur de p est inférieure ou égale au seuil de signification, vous pouvez conclure qu'il existe une association statistiquement significative entre la variable de réponse et le terme.
Valeur de p > α : l'association n'est pas statistiquement significative
Si la valeur de p est supérieure au seuil de signification, vous ne pouvez pas conclure qu'il existe une association statistiquement significative entre la variable de réponse et le terme. Il est sans doute nécessaire de réajuster le modèle sans le terme.
Si plusieurs prédicteurs ne présentent aucune association statistiquement significative avec la réponse, vous pouvez réduire le modèle en supprimant ces termes un par un. Pour plus d'informations sur la suppression de termes d'un modèle, reportez-vous à la rubrique Réduction du modèle.

Pour un facteur de catégorie avec plus de 2 niveaux, l'hypothèse pour le coefficient consiste à déterminer si le niveau du facteur est différent du niveau de référence pour le facteur. Pour évaluer la signification statistique du facteur, utilisez le test pour les termes avec plusieurs degrés de liberté. Pour plus d'informations sur la méthode d'affichage de ce test, reportez-vous à Sélectionner les résultats à afficher pour la fonction Régression logistique ordinale.

Informations de réponse

VariableValeurDénombrement
Nouvelle consultationTrès probable19
  Assez probable43
  Peu probable11
  Total73

Tableau de régression logistique






Rapport des
probabilités
de succès







IC à 95 %
PrédicteurCoeffCoef ErTZPInférieurSupérieur
Const. (1)-0,5058980,938791-0,540,590     
Const. (2)2,277880,9859242,310,021     
Distance-0,04705510,0797374-0,590,5550,950,821,12
Résultats principaux : valeur de p, coefficients

L'analyse d'une étude de satisfaction des patients examine la relation entre la distance parcourue par un patient et la probabilité qu'il revienne. Dans ces résultats, la distance n’est pas statistiquement significative au niveau d’importance de 0,05. Vous ne pouvez pas conclure que les changements dans les distances sont associés à des changements dans les probabilités que les différents événements se produisent.

Evaluez le coefficient pour déterminer si une variation de la variable de prédicteur favorise ou non la probabilité des événements. La relation entre le coefficient et les probabilités dépend de divers aspects de l'analyse, tels que la fonction de liaison. Les coefficients positifs rendent le premier événement et les événements proches de celui-ci plus probables lorsque le prédicteur augmente. Les coefficients négatifs rendent le dernier événement et les événements proches de celui-ci plus probables lorsque le prédicteur augmente. Pour plus d'informations, reportez-vous à la rubrique Coeff.

Le coefficient pour la distance est d'environ −0,05, ce qui suggère que les grandes distances sont associées à des probabilités élevées de la réponse "Peu probable" et à de faibles probabilités de la réponse "Très probable".

Etape 2 : Déterminer l'ajustement du modèle aux données

Pour déterminer le degré d'ajustement du modèle aux données, examinez le log de vraisemblance et les mesures d'association. Des valeurs élevées de log de vraisemblance indiquent un meilleur ajustement aux données. Les valeurs de log de vraisemblance étant négatives, plus elles sont proches de zéro, plus la valeur est élevée. Le log de vraisemblance dépend des données d'échantillon ; vous ne pouvez donc pas l'utiliser pour comparer des modèles issus de différents fichiers de données.

Le log de vraisemblance ne peut pas diminuer lorsque vous ajoutez des termes à un modèle. Par exemple, un modèle avec 5 termes a un log de vraisemblance plus élevé que les modèles à 4 termes que vous pouvez créer avec les mêmes termes. Par conséquent, le log de vraisemblance est plus utile lorsque vous comparez des modèles de même taille. Pour prendre une décision concernant des termes individuels, observez les valeurs de p du terme dans les différentes fonctions logit.

Des valeurs plus grandes pour le D de Somers, le gamma de Goodman-Kruskal et le tau a de Kendall indiquent que le modèle a une meilleure capacité de prévision. Le D de Somer et le gamma de Goodman-Kurskal peuvent être compris entre -1 et 1, et le tau a de Kendall entre -2/3 et 2/3. Les valeurs proches du maximum indiquent que la capacité de prévision du modèle est appropriée. Les valeurs proches de 0 indiquent que le modèle n'a pas de relation de prévision avec la réponse. Dans la pratique, les valeurs négatives sont rares, car elles traduisent des performances encore plus médiocres que l'absence de relation entre le modèle et la réponse.

Fonction de liaison : Logit

Informations de réponse

VariableValeurDénombrement
Nouvelle consultationTrès probable19
  Assez probable43
  Peu probable11
  Total73

Tableau de régression logistique






Rapport des
probabilités
de succès







IC à 95 %
PrédicteurCoeffCoef ErTZPInférieurSupérieur
Const. (1)-0,5058980,938791-0,540,590     
Const. (2)2,277880,9859242,310,021     
Distance-0,04705510,0797374-0,590,5550,950,821,12
Log de vraisemblance = -68,987

Test visant à vérifier que toutes les pentes sont égales à zéro

DLGValeur de p
10,3280,567

Tests d'adéquation de l'ajustement

MéthodeKhi deuxDLP
Pearson97,4191010,582
Somme des carrés des écarts100,5161010,495

Mesures d'association :

(entre la variable de réponse et les prévisions de probabilité)
PairesNombrePourcentageMesures récapitulativesValeur
Concordantes83255,5D de Somers0,13
Discordantes63742,5Gamma de Goodman-Kruskal0,13
Ex aequo302,0Tau a de Kendall0,07
Total1499100,0   
Résultats principaux : log de vraisemblance, D de Somers, gamma de Goodman-Kruskal, tau a de Kendall

Par exemple, le responsable d'un cabinet médical souhaite étudie les facteurs qui influent sur le degré de satisfaction des patients. Dans le premier ensemble de résultats, la distance parcourue par le patient jusqu'au cabinet permet de prévoir la probabilité que ce dernier soit enclin à revenir. Le log de vraisemblance est de −68,987. Le D de Somers et le gamma de Goodman-Kruskal sont de 0,13. Le tau a de Kendall est de 0,07. Ces valeurs proches de 0 suggèrent une relation assez faible entre la distance et la réponse. Pour le test consistant à vérifier si toutes les pentes sont égales à 0, la valeur de p est supérieure à 0,05 ; le responsable décide alors d'essayer un autre modèle.

Dans le deuxième ensemble de résultats, les prédicteurs sont la distance et le carré de la distance. Vous ne pouvez pas utiliser le log de vraisemblance pour comparer ces modèles, car ils ne contiennent pas le même nombre de termes. Les mesures d'association sont supérieures pour le deuxième modèle, qui fonctionne donc mieux que le premier.

Régression logistique ordinale : Nouvelle consultation en fonction de Distance
Fonction de liaison : Logit

Informations de réponse

VariableValeurDénombrement
Nouvelle consultationTrès probable19
  Assez probable43
  Peu probable11
  Total73

Tableau de régression logistique






Rapport des
probabilités
de succès







IC à 95 %
PrédicteurCoeffCoef ErTZPInférieurSupérieur
Const. (1)6,386713,061102,090,037     
Const. (2)9,318833,159292,950,003     
Distance-1,256080,523879-2,400,0170,280,100,80
Distance*Distance0,04954270,02146362,310,0211,051,011,10
Log de vraisemblance = -66,118

Test visant à vérifier que toutes les pentes sont égales à zéro

DLGValeur de p
26,0660,048

Tests d'adéquation de l'ajustement

MéthodeKhi deuxDLP
Pearson114,9031000,146
Somme des carrés des écarts94,7791000,629

Mesures d'association :

(entre la variable de réponse et les prévisions de probabilité)
PairesNombrePourcentageMesures récapitulativesValeur
Concordantes93862,6D de Somers0,29
Discordantes50533,7Gamma de Goodman-Kruskal0,30
Ex aequo563,7Tau a de Kendall0,16
Total1499100,0