Exemple pour la fonction Régression logistique ordinale

Le responsable d'un cabinet médical souhaite connaître les facteurs qui influent sur le degré de satisfaction des patients. On demande aux patients s'il est peu probable, assez probable, ou très probable qu'ils reviennent pour des soins de suivi. Les prédicteurs pertinents sont la situation d'emploi, l'âge et la proximité du cabinet médical.

Le responsable détermine la variable de réponse suivante : la probabilité qu'un patient revienne. Les catégories de la variable de réponse présentant un ordre naturel, d'improbable à très probable, la variable de réponse est ordinale. Aussi, le responsable utilise la régression logistique ordinale pour modéliser la relation entre les prédicteurs et la variable de réponse. Le responsable utilise un seuil de signification de 0,05 pour évaluer la signification statistique et l'adéquation de l'ajustement du modèle.

  1. Ouvrez le fichier de données échantillons, SatisfactionPatient.MTW.
  2. Sélectionnez une cellule dans la colonne Nouvelle consultation.
  3. Cliquez avec le bouton droit de la souris et choisissez Propriétés de colonne > Ordre des valeurs.
  4. Sélectionnez Ordre défini par l'utilisateur et classez les valeurs dans l'ordre suivant :
    • Très probable
    • Assez probable
    • Peu probable
  5. Sélectionnez Stat > Régression > Régression logistique ordinale.
  6. Dans la zone Réponse, saisissez 'Nouvelle consultation'.
  7. Dans la zone Modèle, saisissez Distance Distance*Distance.
  8. Cliquez sur OK.

Interprétation des résultats

La valeur de p du test visant à vérifier que toutes les pentes sont égales à zéro est inférieure à 0,05. Cette valeur de p indique que la relation entre la variable de réponse et les prédicteurs est statistiquement significative. La valeur de p pour les deux tests d'adéquation de l'ajustement est supérieure à 0,05. Ces valeurs de p élevées ne suffisent pas à prouver que le modèle est inadapté.

Dans le tableau de régression logistique, les valeurs de p pour Distance et Distance*Distance sont inférieures au seuil de signification de 0,05. Le coefficient pour Distance est négatif, ce qui indique que les patients vivant loin du cabinet sont généralement moins susceptibles de revenir pour un suivi médical. Le coefficient pour Distance*Distance est positif, ce qui indique que passée une certaine distance les patients sont plus susceptibles de revenir. D'après ces résultats, le responsable émet l'hypothèse que les patients qui vivent près du cabinet sont plus susceptibles de programmer un suivi médical, car l'emplacement du cabinet est pratique pour eux. Les patients prêts à faire un long trajet pour une première consultation sont également plus susceptibles de revenir pour un suivi médical. Le responsable prévoit d'ajouter de nouvelles questions à l'étude afin d'approfondir ces pistes. Il prévoit également d'étudier les prévisions du modèle pour déterminer la distance à partir de laquelle les patients sont plus susceptibles de revenir.

Régression logistique ordinale : Nouvelle con en fonction de Distance

* ATTENTION * L'algorithme n'a pas convergé après 20 itérations. * ATTENTION * La convergence n'a pas été atteinte, soit pour le log de vraisemblance, soit pour le critère d'estimation des paramètres. * ATTENTION * Les résultats risquent de ne pas être fiables. * ATTENTION * Essayez d'augmenter le nombre maximum d'itérations.

Fonction de liaison : Logit

Informations de réponse Variable Valeur Dénombrement Nouvelle consultation Peu probable 2 Très probable 3 Assez probable 4 Total 9
Tableau de régression logistique Rapport des probabilités IC à 95 % Prédicteur Coeff Coef ErT Z P de succès Inférieur Const. (1) -8,37842 44,7209 -0,19 0,851 Const. (2) -6,68100 44,7154 -0,15 0,881 Distance 3,06326 13,2432 0,23 0,817 21,40 0,00 Distance*Distance -0,285089 0,962191 -0,30 0,767 0,75 0,11
Prédicteur Supérieur Const. (1) Const. (2) Distance 4,00884E+12 Distance*Distance 4,96

Log de vraisemblance = -292,087

Test visant à vérifier que toutes les pentes sont égales à zéro Valeur DL G de p 2 0,000 1,000
Tests d'adéquation de l'ajustement Méthode Khi deux DL P Pearson 79,970 100 0,930 Somme des carrés d'écart 541,172 100 0,000
Mesures d'association : (entre la variable de réponse et les prévisions de probabilité) Paires Nombre Pourcentage Mesures récapitulatives Concordantes 274 79,2 D de Somers 0,77 Discordantes 6 1,7 Gamma de Goodman-Kruskal 0,96 Ex aequo 66 19,1 Tau a de Kendall 0,10 Total 346 100,0
En utilisant ce site, vous acceptez l'utilisation de cookies à des fins d'analyse et de personnalisation du contenu.  Lisez notre politique