Interprétation des résultats principaux pour la fonction Régression logistique ordinale

Suivez les étapes ci-dessous pour interpréter un modèle de régression logistique ordinale. Les résultats principaux incluent la valeur de p, les coefficients, le log de vraisemblance et les mesures d'association.

Etape 1 : Déterminer si l'association entre la réponse et les termes est significative du point de vue statistique

Pour déterminer si l'association entre la réponse et chacun des termes du modèle est statistiquement significative, comparez la valeur de p du terme à votre seuil de signification pour évaluer l'hypothèse nulle. L'hypothèse nulle est qu'il n'existe aucune association entre le terme et la réponse. En général, un seuil de signification (noté alpha ou α) de 0,05 fonctionne bien. Un seuil de signification de 0,05 indique un risque de 5 % de conclure à tort qu'il existe une association.
Valeur de p ≤ α : l'association est statistiquement significative.
Si la valeur de p est inférieure ou égale au seuil de signification, vous pouvez conclure qu'il existe une association statistiquement significative entre la variable de réponse et le terme.
Valeur de p > α : l'association n'est pas statistiquement significative.
Si la valeur de p est supérieure au seuil de signification, vous ne pouvez pas conclure qu'il existe une association statistiquement significative entre la variable de réponse et le terme. Il est sans doute nécessaire de réajuster le modèle sans le terme.
Si plusieurs prédicteurs ne présentent aucune association statistiquement significative avec la réponse, vous pouvez réduire le modèle en supprimant ces termes un par un. Pour plus d'informations sur la suppression de termes d'un modèle, reportez-vous à la rubrique Réduction du modèle.

Dans le cas d'un facteur de catégorie avec plus de 2 niveaux, l'hypothèse pour le coefficient consiste à déterminer si le niveau du facteur est différent de son niveau de référence. Pour évaluer la signification statistique du facteur, utilisez le test dédié aux termes ayant plusieurs degrés de liberté. Pour plus d'informations sur l'affichage de ce test, reportez-vous à la rubrique Sélectionner les résultats à afficher pour la fonction Régression logistique ordinale.

Informations de réponse Variable Valeur Dénombrement Nouvelle consultation Très probable 19 Assez probable 43 Peu probable 11 Total 73
Tableau de régression logistique Rapport des probabilités IC à 95 % Prédicteur Coeff Coef ErT Z P de succès Inférieur Const. (1) -0,505898 0,938791 -0,54 0,590 Const. (2) 2,27788 0,985924 2,31 0,021 Distance -0,0470551 0,0797374 -0,59 0,555 0,95 0,82
Résultats principaux : valeur de p, coefficients

L'analyse d'une étude de satisfaction des patients examine la relation entre la distance parcourue par un patient et la probabilité qu'il revienne. Dans ces résultats, la distance est statistiquement significative au seuil de signification de 0,05. Vous pouvez en conclure que les variations des distances sont associées aux variations des probabilités d'occurrence des différents événements.

Evaluez le coefficient pour déterminer si une variation de la variable de prédicteur favorise ou non la probabilité des événements. La relation entre le coefficient et les probabilités dépend de divers aspects de l'analyse, tels que la fonction de liaison. Les coefficients positifs rendent le premier événement et les événements proches de celui-ci plus probables lorsque le prédicteur augmente. Les coefficients négatifs rendent le dernier événement et les événements proches de celui-ci plus probables lorsque le prédicteur augmente. Pour plus d'informations, reportez-vous à la rubrique Coeff.

Le coefficient pour la distance est d'environ −0,05, ce qui suggère que les grandes distances sont associées à des probabilités élevées de la réponse "Peu probable" et à de faibles probabilités de la réponse "Très probable".

Etape 2 : Déterminer l'ajustement du modèle aux données

Pour déterminer le degré d'ajustement du modèle aux données, examinez le log de vraisemblance et les mesures d'association. Des valeurs élevées de log de vraisemblance indiquent un meilleur ajustement aux données. Les valeurs de log de vraisemblance étant négatives, plus elles sont proches de zéro, plus la valeur est élevée. Le log de vraisemblance dépend des données d'échantillon ; vous ne pouvez donc pas l'utiliser pour comparer des modèles issus de différents fichiers de données.

Le log de vraisemblance ne peut pas diminuer lorsque vous ajoutez des termes à un modèle. Par exemple, un modèle avec 5 termes a un log de vraisemblance plus élevé que les modèles à 4 termes que vous pouvez créer avec les mêmes termes. Par conséquent, le log de vraisemblance est plus utile lorsque vous comparez des modèles de même taille. Pour prendre une décision concernant des termes individuels, observez les valeurs de p du terme dans les différentes fonctions logit.

Des valeurs plus grandes pour le D de Somers, le gamma de Goodman-Kruskal et le tau a de Kendall indiquent que le modèle a une meilleure capacité de prévision. Le D de Somer et le gamma de Goodman-Kurskal peuvent être compris entre -1 et 1, et le tau a de Kendall entre -2/3 et 2/3. Les valeurs proches du maximum indiquent que la capacité de prévision du modèle est appropriée. Les valeurs proches de 0 indiquent que le modèle n'a pas de relation de prévision avec la réponse. Dans la pratique, les valeurs négatives sont rares, car elles traduisent des performances encore plus médiocres que l'absence de relation entre le modèle et la réponse.

Régression logistique ordinale : Nouvelle con en fonction de Distance

Fonction de liaison : Logit

Informations de réponse Variable Valeur Dénombrement Nouvelle consultation Très probable 19 Assez probable 43 Peu probable 11 Total 73
Tableau de régression logistique Rapport des probabilités IC à 95 % Prédicteur Coeff Coef ErT Z P de succès Inférieur Const. (1) -0,505898 0,938791 -0,54 0,590 Const. (2) 2,27788 0,985924 2,31 0,021 Distance -0,0470551 0,0797374 -0,59 0,555 0,95 0,82
Prédicteur Supérieur Const. (1) Const. (2) Distance 1,12

Log de vraisemblance = -68,987

Test visant à vérifier que toutes les pentes sont égales à zéro Valeur DL G de p 1 0,328 0,567
Tests d'adéquation de l'ajustement Méthode Khi deux DL P Pearson 97,419 101 0,582 Somme des carrés d'écart 100,516 101 0,495
Mesures d'association : (entre la variable de réponse et les prévisions de probabilité) Paires Nombre Pourcentage Mesures récapitulatives Concordantes 832 55,5 D de Somers 0,13 Discordantes 637 42,5 Gamma de Goodman-Kruskal 0,13 Ex aequo 30 2,0 Tau a de Kendall 0,07 Total 1499 100,0
Résultats principaux : log de vraisemblance, D de Somers, gamma de Goodman-Kruskal, tau a de Kendall

Par exemple, le responsable d'un cabinet médical souhaite étudie les facteurs qui influent sur le degré de satisfaction des patients. Dans le premier ensemble de résultats, la distance parcourue par le patient jusqu'au cabinet permet de prévoir la probabilité que ce dernier soit enclin à revenir. Le log de vraisemblance est de −68,987. Le D de Somers et le gamma de Goodman-Kruskal sont de 0,13. Le tau a de Kendall est de 0,07. Ces valeurs proches de 0 suggèrent une relation assez faible entre la distance et la réponse. Pour le test consistant à vérifier si toutes les pentes sont égales à 0, la valeur de p est supérieure à 0,05 ; le responsable décide alors d'essayer un autre modèle.

Dans le deuxième ensemble de résultats, les prédicteurs sont la distance et le carré de la distance. Vous ne pouvez pas utiliser le log de vraisemblance pour comparer ces modèles, car ils ne contiennent pas le même nombre de termes. Les mesures d'association sont supérieures pour le deuxième modèle, qui fonctionne donc mieux que le premier.

Régression logistique ordinale : Nouvelle con en fonction de Distance

* ATTENTION * L'algorithme n'a pas convergé après 20 itérations. * ATTENTION * La convergence n'a pas été atteinte, soit pour le log de vraisemblance, soit pour le critère d'estimation des paramètres. * ATTENTION * Les résultats risquent de ne pas être fiables. * ATTENTION * Essayez d'augmenter le nombre maximum d'itérations.

Fonction de liaison : Logit

Informations de réponse Variable Valeur Dénombrement Nouvelle consultation Peu probable 2 Très probable 3 Assez probable 4 Total 9
Tableau de régression logistique Rapport des probabilités IC à 95 % Prédicteur Coeff Coef ErT Z P de succès Inférieur Const. (1) -8,37842 44,7209 -0,19 0,851 Const. (2) -6,68100 44,7154 -0,15 0,881 Distance 3,06326 13,2432 0,23 0,817 21,40 0,00 Distance*Distance -0,285089 0,962191 -0,30 0,767 0,75 0,11
Prédicteur Supérieur Const. (1) Const. (2) Distance 4,00884E+12 Distance*Distance 4,96

Log de vraisemblance = -292,087

Test visant à vérifier que toutes les pentes sont égales à zéro Valeur DL G de p 2 0,000 1,000
Tests d'adéquation de l'ajustement Méthode Khi deux DL P Pearson 79,970 100 0,930 Somme des carrés d'écart 541,172 100 0,000
Mesures d'association : (entre la variable de réponse et les prévisions de probabilité) Paires Nombre Pourcentage Mesures récapitulatives Concordantes 274 79,2 D de Somers 0,77 Discordantes 6 1,7 Gamma de Goodman-Kruskal 0,96 Ex aequo 66 19,1 Tau a de Kendall 0,10 Total 346 100,0
En utilisant ce site, vous acceptez l'utilisation de cookies à des fins d'analyse et de personnalisation du contenu.  Lisez notre politique