Tableau de régression logistique pour Régression logistique ordinale

Obtenez des définitions et bénéficiez de conseils en matière d'interprétation pour chaque statistique fournie dans le tableau de régression logistique.

Coeff

La régression logistique ordinale estime un coefficient pour chaque terme du modèle. Les coefficients des termes du modèle sont les mêmes pour chaque catégorie de résultats.

La régression logistique ordinale estime également un coefficient de constante pour toutes les catégories de résultats, sauf une. Les coefficients de constante, combinés aux coefficients des variables, forment un ensemble d'équations de régression binaire. La première équation estime la probabilité que le premier événement se produise. La deuxième équation estime la probabilité que le premier ou le deuxième événement se produise. La troisième équation estime la probabilité que le premier, le deuxième ou le troisième événement se produise, et ainsi de suite. Minitab nomme ces coefficients de constante de la manière suivante : Const (1), Const (2), Const (3), etc.

Interprétation

Utilisez les coefficients pour examiner la variabilité de la probabilité d'un résultat en fonction de la variation des variables de prédicteur. Le coefficient estimé d'un prédicteur représente la variation de la fonction de liaison pour chaque variation d'unité du prédicteur, tous les autres prédicteurs étant maintenus constants dans le modèle. La relation entre le coefficient et la probabilité d'un résultat dépend de divers aspects de l'analyse, tels que la fonction de liaison, l'ordre des catégories de réponse et les niveaux de référence pour les prédicteurs de catégorie présents dans le modèle. Généralement, les coefficients positifs rendent le premier événement et les événements proches de celui-ci plus probables lorsque le prédicteur augmente. Les coefficients négatifs rendent le dernier événement et les événements proches de celui-ci plus probables lorsque le prédicteur augmente. Un coefficient estimé proche de 0 implique un faible effet du prédicteur.

Par exemple, l'analyse d'une étude de satisfaction des patients examine la relation entre la distance parcourue par un patient et la probabilité qu'il revienne. Le premier événement figure en haut du tableau des informations de réponse. Dans ce cas, le premier événement est "Très probable" et le dernier événement est "Peu probable". Le coefficient négatif pour la distance indique que, plus la distance augmente, plus les patients sont susceptibles de répondre "Peu probable".

Informations de réponse

VariableValeurDénombrement
Nouvelle consultationTrès probable19
  Assez probable43
  Peu probable11
  Total73

Tableau de régression logistique






Rapport des
probabilités
de succès







IC à 95 %
PrédicteurCoeffCoef ErTZPInférieurSupérieur
Const. (1)-0,5058980,938791-0,540,590     
Const. (2)2,277880,9859242,310,021     
Distance-0,04705510,0797374-0,590,5550,950,821,12

Pour les prédicteurs de catégorie, la variation survient entre le niveau de référence et le niveau du prédicteur qui figure dans le tableau de régression logistique. En général, les coefficients positifs indiquent que le premier événement est plus probable au niveau du facteur présent dans le tableau de régression logistique qu'au niveau de référence du facteur. Les coefficients négatifs indiquent que le dernier événement est plus probable au niveau du facteur présent dans le tableau de régression logistique qu'au niveau de référence du facteur.

Par exemple, l'analyse d'une étude de satisfaction des patients examine la relation entre l'activité salariale d'un patient et la probabilité qu'il revienne. Le premier événement est "Très probable" et le dernier événement est "Peu probable". L'activité salariale se traduit par deux statuts : "Employé" ou "Au chômage". Le niveau de référence du prédicteur ne figure pas dans le tableau de régression logistique ; il s'agit du statut "Employé". Le coefficient négatif avec le niveau "Au chômage" indique que les patients au chômage sont plus susceptibles de répondre "Peu probable" que les patients employés.

Informations de réponse

VariableValeurDénombrement
Nouvelle consultationTrès probable19
  Assez probable43
  Peu probable11
  Total73

Tableau de régression logistique






Rapport des
probabilités
de succès







IC à 95 %
PrédicteurCoeffCoef ErTZPInférieurSupérieur
Const. (1)-0,7075120,352815-2,010,045     
Const. (2)2,123160,4446724,770,000     
Situation emploi             
  Au chômage-0,6314680,471078-1,340,1800,530,211,34

Remarque

Les coefficients de constante sont associés aux termes des prédicteurs pour estimer les probabilités. Minitab peut stocker ces probabilités pour les observations dans la feuille de travail lorsque vous effectuez l'analyse. Pour plus d'informations, reportez-vous à la rubrique Stocker des statistiques pour la fonction Régression logistique ordinale.

Coef ErT

L'erreur type du coefficient estime la variabilité entre les estimations des coefficients que vous obtiendriez si vous préleviez des échantillons dans la même population de façon répétée. Le calcul suppose que l'effectif d'échantillon et les coefficients à estimer restent identiques même après plusieurs échantillonnages.

Interprétation

Vous pouvez utiliser l'erreur type du coefficient pour mesurer la précision de l'estimation du coefficient. Plus l'erreur type est petite, plus l'estimation est précise.

Valeur de Z

La valeur de Z est une statistique pour les tests qui mesure le rapport entre le coefficient et son erreur type.

Interprétation

Minitab utilise la valeur de Z pour calculer la valeur de p, qui vous permet de déterminer si des termes sont significatifs et de choisir le modèle approprié. Le test s'avère précis lorsque l'effectif d'échantillon est assez important pour que la distribution des coefficients d'échantillons suive une loi normale.

Une valeur de Z suffisamment supérieure à 0 indique que l'estimation de coefficient est assez importante et précise pour être statistiquement différente de 0. Inversement, une valeur de Z proche de 0 indique que l'estimation de coefficient est trop petite ou imprécise pour que vous puissiez affirmer que le terme a un effet sur la réponse.

Valeur de p

La valeur de p est la probabilité qui mesure le degré de certitude avec lequel il est possible d'invalider l'hypothèse nulle. Des probabilités faibles permettent d'invalider l'hypothèse nulle avec plus de certitude.

Interprétation

Pour déterminer si l'association entre la réponse et chacun des termes du modèle est statistiquement significative, comparez la valeur de p du terme à votre seuil de signification pour évaluer l'hypothèse nulle. L'hypothèse nulle est que le coefficient du terme est égal à zéro, ce qui implique qu'il n'existe aucune association entre le terme et la réponse. En général, un seuil de signification (noté alpha ou α) de 0,05 fonctionne bien. Un seuil de signification de 0,05 indique un risque de 5 % de conclure à tort qu'il existe une association.
Valeur de p ≤ α : l'association est statistiquement significative.
Si la valeur de p est inférieure ou égale au seuil de signification, vous pouvez conclure qu'il existe une association statistiquement significative entre la variable de réponse et le terme.
Valeur de p > α : l'association n'est pas statistiquement significative.
Si la valeur de p est supérieure au seuil de signification, vous ne pouvez pas conclure qu'il existe une association statistiquement significative entre la variable de réponse et le terme. Il est sans doute nécessaire de réajuster le modèle sans le terme.
Si plusieurs prédicteurs ne présentent aucune association statistiquement significative avec la réponse, vous pouvez réduire le modèle en supprimant ces termes un par un. Pour plus d'informations sur la suppression de termes d'un modèle, reportez-vous à la rubrique Réduction du modèle.
Si un terme d'un modèle est statistiquement significatif, l'interprétation dépend du type de terme concerné. Les interprétations sont les suivantes :
  • Si un prédicteur continu est significatif, vous pouvez en conclure que les probabilités de niveau de réponse dépendent de ce prédicteur.
  • Si un prédicteur de catégorie est significatif, vous pouvez en conclure que les niveaux de réponse ont des probabilités différentes de se produire à ce niveau de facteur plutôt qu'au niveau de référence du facteur.
  • Si un terme d'interaction est significatif, vous pouvez en conclure que la relation entre un prédicteur et les probabilités de niveau de réponse dépend des autres prédicteurs du terme.
  • Si un terme polynomial est significatif, vous pouvez en conclure que la relation entre un prédicteur et les probabilités de niveau de réponse dépend de l'importance du prédicteur.

Rapport des probabilités de succès

Le rapport des probabilités de succès compare les probabilités de succès de deux événements. Les probabilités de succès d'un événement représentent la probabilité que l'événement se produise, divisée par la probabilité que l'événement ne se produise pas. Minitab calcule les rapports des probabilités de succès lorsque le modèle utilise la fonction de liaison logit.

Interprétation

Le rapport des probabilités de succès permet de déterminer l'effet d'un prédicteur. L'interprétation du rapport des probabilités de succès varie selon que le prédicteur est de catégorie ou continu.

Rapports des probabilités de succès des prédicteurs continus

Les rapports des probabilités de succès supérieurs à 1 indiquent que le premier événement et les événements proches de celui-ci sont plus probables lorsque le prédicteur augmente. Les rapports des probabilités de succès inférieurs à 1 indiquent que le dernier événement et les événements proches de celui-ci sont plus probables lorsque le prédicteur augmente.

Par exemple, l'analyse d'une étude de satisfaction des patients examine la relation entre la distance parcourue par un patient et la probabilité qu'il revienne. Le premier événement figure en haut du tableau des informations de réponse. Dans ce cas, le premier événement est "Très probable" et le dernier événement est "Peu probable". Le rapport des probabilités de succès de 0,95 pour la distance indique que plus la distance augmente, plus les patients sont susceptibles de donner la réponse "Peu probable". Pour chaque kilomètre supplémentaire effectué par un patient, les probabilités de succès de la réponse "Très probable" par rapport à "Assez probable" ou "Peu probable" diminuent d'environ 5 %.

Informations de réponse

VariableValeurDénombrement
Nouvelle consultationTrès probable19
  Assez probable43
  Peu probable11
  Total73

Tableau de régression logistique






Rapport des
probabilités
de succès







IC à 95 %
PrédicteurCoeffCoef ErTZPInférieurSupérieur
Const. (1)-0,5058980,938791-0,540,590     
Const. (2)2,277880,9859242,310,021     
Distance-0,04705510,0797374-0,590,5550,950,821,12

Rapport des probabilités de succès des prédicteurs de catégorie

Pour les prédicteurs de catégorie, le rapport des probabilités de succès compare les probabilités qu'un événement se produise à 2 niveaux différents du prédicteur. Les rapports des probabilités de succès supérieurs à 1 indiquent que le premier événement et les événements proches de celui-ci sont plus probables au niveau du prédicteur présent dans le tableau de régression logistique qu'au niveau de référence du prédicteur. Les rapports des probabilités de succès inférieurs à 1 indiquent que le dernier événement et les événements proches de celui-ci sont plus probables au niveau du prédicteur présent dans le tableau de régression logistique qu'au niveau de référence.

Par exemple, l'analyse d'une étude de satisfaction des patients examine la relation entre l'activité salariale d'un patient et la probabilité qu'il revienne. Le premier événement est "Très probable" et le dernier événement est "Peu probable". L'activité salariale se traduit par deux statuts : "Employé" ou "Au chômage". Le niveau de référence du prédicteur ne figure pas le tableau de régression logistique ; il s'agit du statut "Employé". Le rapport des probabilités de succès étant inférieur à 1, un patient employé est plus susceptible de répondre "Très probable" qu'un patient au chômage. Les probabilités de succès qu'un patient au chômage réponde "Très probable" au lieu de "Assez probable" ou "Peu probable" représentent 53 % des probabilités de succès qu'un patient employé réponde "Très probable". Par ailleurs, les probabilités de succès qu'un patient au chômage réponde "Très probable" ou "Assez probable" au lieu de "Peu probable" représentent 53 % des probabilités de succès qu'un patient employé réponde "Très probable" ou "Assez probable".

Informations de réponse

VariableValeurDénombrement
Nouvelle consultationTrès probable19
  Assez probable43
  Peu probable11
  Total73

Tableau de régression logistique






Rapport des
probabilités
de succès







IC à 95 %
PrédicteurCoeffCoef ErTZPInférieurSupérieur
Const. (1)-0,7075120,352815-2,010,045     
Const. (2)2,123160,4446724,770,000     
Situation emploi             
  Au chômage-0,6314680,471078-1,340,1800,530,211,34

Remarque

Les rapports des probabilités de succès utilisent l'ordre des catégories ; ils ne décrivent donc pas les variations des probabilités de succès pour les catégories dans le désordre. Par exemple, le rapport des probabilités de succès ne décrit pas la variation des probabilités de succès que le patient réponde "Assez probable" au lieu de "Très probable" ou "Peu probable". Pour modéliser les catégories dans un ordre arbitraire, utilisez la régression logistique nominale.

Intervalle de confiance pour le rapport des probabilités de succès (IC à 95 %)

Ces intervalles de confiance (IC) sont des étendues de valeurs susceptibles de contenir les valeurs réelles des rapports des probabilités de succès. Le calcul des intervalles de confiance utilise la loi normale. L'intervalle de confiance est précis si l'effectif d'échantillon est assez important pour que la distribution des rapports des probabilités de succès de l'échantillon suive une loi normale.

Les échantillons étant aléatoires, il est peu probable que deux échantillons d'une population donnent des intervalles de confiance identiques. Cependant, si vous prenez de nombreux échantillons aléatoires, un certain pourcentage des intervalles de confiance obtenus contiendra le paramètre de population inconnu. Le pourcentage de ces intervalles de confiance contenant le paramètre est le niveau de confiance de l'intervalle.

L'intervalle de confiance est composé de deux parties :
Estimation ponctuelle
L'estimation ponctuelle est l'estimation du paramètre calculé à partir des données échantillons.
Marge d'erreur
La marge d'erreur définit la largeur de l'intervalle de confiance et dépend de l'étendue des probabilités d'événement, de l'effectif d'échantillon et du niveau de confiance.

Interprétation

Pour évaluer l'estimation du rapport des probabilités de succès, utilisez l'intervalle de confiance.

Par exemple, avec un niveau de confiance de 95 %, vous pouvez être certain à 95 % que l'intervalle de confiance comprend la valeur du rapport des probabilités de succès pour la population. L'intervalle de confiance vous aide à évaluer la signification pratique de vos résultats. Utilisez vos connaissances spécialisées pour déterminer si l'intervalle de confiance comporte des valeurs ayant une signification pratique pour votre situation. Si l'intervalle est trop grand pour être utile, vous devez sans doute augmenter votre effectif d'échantillon.

Test pour les termes avec plusieurs degrés de liberté

Il s'agit d'un test global qui prend en compte tous les coefficients pour un prédicteur de catégorie simultanément. Ce test s'adresse aux prédicteurs de catégorie ayant plus de 2 niveaux.

Interprétation

Utilisez ce test pour déterminer si un prédicteur de catégorie avec plusieurs coefficients présente une relation statistiquement significative avec les événements de réponse. Lorsqu'un prédicteur de catégorie compte plus de 2 niveaux, les coefficients des niveaux individuels ont différentes valeurs de p. Le test global donne une réponse unique concernant la signification statistique du prédicteur.

Pour déterminer si l'association entre les événements de réponse et le prédicteur de catégorie est statistiquement significative, comparez la valeur de p du test à votre seuil de signification pour évaluer l'hypothèse nulle. Selon l'hypothèse nulle, il n'existe aucune association entre le prédicteur et les événements de réponse. En général, un seuil de signification (noté alpha ou α) de 0,05 fonctionne bien. Un seuil de signification de 0,05 indique 5 % de risque de conclure à tort qu'il existe une association.
Valeur de p ≤ α : l'association est statistiquement significative.
Si la valeur de p est inférieure ou égale au seuil de signification, vous pouvez en conclure qu'il existe une association statistiquement significative entre la variable de réponse et le prédicteur.
Valeur de p > α : l'association n'est pas statistiquement significative.
Si la valeur de p est supérieure au seuil de signification, vous ne pouvez pas en conclure qu'il existe une association statistiquement significative entre la variable de réponse et le prédicteur.

Log de vraisemblance

Minitab maximise la fonction de log de vraisemblance pour déterminer les valeurs optimales des coefficients estimés.

Interprétation

Utilisez le log de vraisemblance pour comparer deux modèles qui estiment les coefficients à l'aide des mêmes données. Les valeurs étant négatives, plus elles sont proches de zéro, plus le modèle s'ajuste aux données.

Le log de vraisemblance ne peut pas diminuer lorsque vous ajoutez des termes à un modèle. Par exemple, un modèle avec 5 termes a un log de vraisemblance plus élevé que les modèles à 4 termes que vous pouvez créer avec les mêmes termes. Par conséquent, le log de vraisemblance est plus utile lorsque vous comparez des modèles de même taille. Pour prendre une décision concernant des termes individuels, observez les valeurs de p du terme dans les différentes fonctions logit.

Vérifier que toutes les pentes sont à zéro

Il s'agit d'un test global qui prend en compte tous les coefficients des prédicteurs dans le modèle.

Interprétation

Utilisez ce test pour déterminer si au moins l'un des prédicteurs du modèle présente une association statistiquement significative avec les événements de réponse. En général, vous n'interprétez pas la statistique G ni les degrés de liberté (DL). Les DL sont égaux au nombre de coefficients pour les prédicteurs dans le modèle.

Pour déterminer si l'association entre les événements de réponse et les prédicteurs est statistiquement significative, comparez la valeur de p du test à votre seuil de signification pour évaluer l'hypothèse nulle. Avec l'hypothèse nulle, tous les coefficients des prédicteurs dans le modèle sont égaux à 0 ; il n'existe donc pas d'association entre les événements de réponse et les prédicteurs. En général, un seuil de signification (noté alpha ou α) de 0,05 fonctionne bien. Un seuil de signification de 0,05 indique 5 % de risque de conclure à tort qu'il existe une association.
Valeur de p ≤ α : l'association est statistiquement significative.
Si la valeur de p est inférieure ou égale au seuil de signification, vous pouvez en conclure qu'il existe une association statistiquement significative entre la variable de réponse et au moins un des prédicteurs.
Valeur de p > α : l'association n'est pas statistiquement significative.
Si la valeur de p est supérieure au seuil de signification, vous ne pouvez pas en conclure qu'il existe une association statistiquement significative entre la variable de réponse et un terme.