La régression logistique ordinale estime un coefficient pour chaque terme du modèle. Les coefficients des termes du modèle sont les mêmes pour chaque catégorie de résultats.
La régression logistique ordinale estime également un coefficient de constante pour toutes les catégories de résultats, sauf une. Les coefficients de constante, combinés aux coefficients des variables, forment un ensemble d'équations de régression binaire. La première équation estime la probabilité que le premier événement se produise. La deuxième équation estime la probabilité que le premier ou le deuxième événement se produise. La troisième équation estime la probabilité que le premier, le deuxième ou le troisième événement se produise, et ainsi de suite. Minitab nomme ces coefficients de constante de la manière suivante : Const (1), Const (2), Const (3), etc.
Utilisez les coefficients pour examiner la variabilité de la probabilité d'un résultat en fonction de la variation des variables de prédicteur. Le coefficient estimé d'un prédicteur représente la variation de la fonction de liaison pour chaque variation d'unité du prédicteur, tous les autres prédicteurs étant maintenus constants dans le modèle. La relation entre le coefficient et la probabilité d'un résultat dépend de divers aspects de l'analyse, tels que la fonction de liaison, l'ordre des catégories de réponse et les niveaux de référence pour les prédicteurs de catégorie présents dans le modèle. Généralement, les coefficients positifs rendent le premier événement et les événements proches de celui-ci plus probables lorsque le prédicteur augmente. Les coefficients négatifs rendent le dernier événement et les événements proches de celui-ci plus probables lorsque le prédicteur augmente. Un coefficient estimé proche de 0 implique un faible effet du prédicteur.
Par exemple, l'analyse d'une étude de satisfaction des patients examine la relation entre la distance parcourue par un patient et la probabilité qu'il revienne. Le premier événement figure en haut du tableau des informations de réponse. Dans ce cas, le premier événement est "Très probable" et le dernier événement est "Peu probable". Le coefficient négatif pour la distance indique que, plus la distance augmente, plus les patients sont susceptibles de répondre "Peu probable".
Variable | Valeur | Dénombrement |
---|---|---|
Nouvelle consultation | Très probable | 19 |
Assez probable | 43 | |
Peu probable | 11 | |
Total | 73 |
Rapport des probabilités de succès | |||||||
---|---|---|---|---|---|---|---|
IC à 95 % | |||||||
Prédicteur | Coeff | Coef ErT | Z | P | Inférieur | Supérieur | |
Const. (1) | -0,505898 | 0,938791 | -0,54 | 0,590 | |||
Const. (2) | 2,27788 | 0,985924 | 2,31 | 0,021 | |||
Distance | -0,0470551 | 0,0797374 | -0,59 | 0,555 | 0,95 | 0,82 | 1,12 |
Pour les prédicteurs de catégorie, la variation survient entre le niveau de référence et le niveau du prédicteur qui figure dans le tableau de régression logistique. En général, les coefficients positifs indiquent que le premier événement est plus probable au niveau du facteur présent dans le tableau de régression logistique qu'au niveau de référence du facteur. Les coefficients négatifs indiquent que le dernier événement est plus probable au niveau du facteur présent dans le tableau de régression logistique qu'au niveau de référence du facteur.
Par exemple, l'analyse d'une étude de satisfaction des patients examine la relation entre l'activité salariale d'un patient et la probabilité qu'il revienne. Le premier événement est "Très probable" et le dernier événement est "Peu probable". L'activité salariale se traduit par deux statuts : "Employé" ou "Au chômage". Le niveau de référence du prédicteur ne figure pas dans le tableau de régression logistique ; il s'agit du statut "Employé". Le coefficient négatif avec le niveau "Au chômage" indique que les patients au chômage sont plus susceptibles de répondre "Peu probable" que les patients employés.
Variable | Valeur | Dénombrement |
---|---|---|
Nouvelle consultation | Très probable | 19 |
Assez probable | 43 | |
Peu probable | 11 | |
Total | 73 |
Rapport des probabilités de succès | |||||||
---|---|---|---|---|---|---|---|
IC à 95 % | |||||||
Prédicteur | Coeff | Coef ErT | Z | P | Inférieur | Supérieur | |
Const. (1) | -0,707512 | 0,352815 | -2,01 | 0,045 | |||
Const. (2) | 2,12316 | 0,444672 | 4,77 | 0,000 | |||
Situation emploi | |||||||
Au chômage | -0,631468 | 0,471078 | -1,34 | 0,180 | 0,53 | 0,21 | 1,34 |
Les coefficients de constante sont associés aux termes des prédicteurs pour estimer les probabilités. Minitab peut stocker ces probabilités pour les observations dans la feuille de travail lorsque vous effectuez l'analyse. Pour plus d'informations, reportez-vous à la rubrique Stocker des statistiques pour la fonction Régression logistique ordinale.
L'erreur type du coefficient estime la variabilité entre les estimations des coefficients que vous obtiendriez si vous préleviez des échantillons dans la même population de façon répétée. Le calcul suppose que l'effectif d'échantillon et les coefficients à estimer restent identiques même après plusieurs échantillonnages.
Vous pouvez utiliser l'erreur type du coefficient pour mesurer la précision de l'estimation du coefficient. Plus l'erreur type est petite, plus l'estimation est précise.
La valeur de Z est une statistique pour les tests qui mesure le rapport entre le coefficient et son erreur type.
Minitab utilise la valeur de Z pour calculer la valeur de p, qui vous permet de déterminer si des termes sont significatifs et de choisir le modèle approprié. Le test s'avère précis lorsque l'effectif d'échantillon est assez important pour que la distribution des coefficients d'échantillons suive une loi normale.
Une valeur de Z suffisamment supérieure à 0 indique que l'estimation de coefficient est assez importante et précise pour être statistiquement différente de 0. Inversement, une valeur de Z proche de 0 indique que l'estimation de coefficient est trop petite ou imprécise pour que vous puissiez affirmer que le terme a un effet sur la réponse.
La valeur de p est la probabilité qui mesure le degré de certitude avec lequel il est possible d'invalider l'hypothèse nulle. Des probabilités faibles permettent d'invalider l'hypothèse nulle avec plus de certitude.
Le rapport des probabilités de succès compare les probabilités de succès de deux événements. Les probabilités de succès d'un événement représentent la probabilité que l'événement se produise, divisée par la probabilité que l'événement ne se produise pas. Minitab calcule les rapports des probabilités de succès lorsque le modèle utilise la fonction de liaison logit.
Le rapport des probabilités de succès permet de déterminer l'effet d'un prédicteur. L'interprétation du rapport des probabilités de succès varie selon que le prédicteur est de catégorie ou continu.
Les rapports des probabilités de succès supérieurs à 1 indiquent que le premier événement et les événements proches de celui-ci sont plus probables lorsque le prédicteur augmente. Les rapports des probabilités de succès inférieurs à 1 indiquent que le dernier événement et les événements proches de celui-ci sont plus probables lorsque le prédicteur augmente.
Par exemple, l'analyse d'une étude de satisfaction des patients examine la relation entre la distance parcourue par un patient et la probabilité qu'il revienne. Le premier événement figure en haut du tableau des informations de réponse. Dans ce cas, le premier événement est "Très probable" et le dernier événement est "Peu probable". Le rapport des probabilités de succès de 0,95 pour la distance indique que plus la distance augmente, plus les patients sont susceptibles de donner la réponse "Peu probable". Pour chaque kilomètre supplémentaire effectué par un patient, les probabilités de succès de la réponse "Très probable" par rapport à "Assez probable" ou "Peu probable" diminuent d'environ 5 %.
Variable | Valeur | Dénombrement |
---|---|---|
Nouvelle consultation | Très probable | 19 |
Assez probable | 43 | |
Peu probable | 11 | |
Total | 73 |
Rapport des probabilités de succès | |||||||
---|---|---|---|---|---|---|---|
IC à 95 % | |||||||
Prédicteur | Coeff | Coef ErT | Z | P | Inférieur | Supérieur | |
Const. (1) | -0,505898 | 0,938791 | -0,54 | 0,590 | |||
Const. (2) | 2,27788 | 0,985924 | 2,31 | 0,021 | |||
Distance | -0,0470551 | 0,0797374 | -0,59 | 0,555 | 0,95 | 0,82 | 1,12 |
Pour les prédicteurs de catégorie, le rapport des probabilités de succès compare les probabilités qu'un événement se produise à 2 niveaux différents du prédicteur. Les rapports des probabilités de succès supérieurs à 1 indiquent que le premier événement et les événements proches de celui-ci sont plus probables au niveau du prédicteur présent dans le tableau de régression logistique qu'au niveau de référence du prédicteur. Les rapports des probabilités de succès inférieurs à 1 indiquent que le dernier événement et les événements proches de celui-ci sont plus probables au niveau du prédicteur présent dans le tableau de régression logistique qu'au niveau de référence.
Par exemple, l'analyse d'une étude de satisfaction des patients examine la relation entre l'activité salariale d'un patient et la probabilité qu'il revienne. Le premier événement est "Très probable" et le dernier événement est "Peu probable". L'activité salariale se traduit par deux statuts : "Employé" ou "Au chômage". Le niveau de référence du prédicteur ne figure pas le tableau de régression logistique ; il s'agit du statut "Employé". Le rapport des probabilités de succès étant inférieur à 1, un patient employé est plus susceptible de répondre "Très probable" qu'un patient au chômage. Les probabilités de succès qu'un patient au chômage réponde "Très probable" au lieu de "Assez probable" ou "Peu probable" représentent 53 % des probabilités de succès qu'un patient employé réponde "Très probable". Par ailleurs, les probabilités de succès qu'un patient au chômage réponde "Très probable" ou "Assez probable" au lieu de "Peu probable" représentent 53 % des probabilités de succès qu'un patient employé réponde "Très probable" ou "Assez probable".
Variable | Valeur | Dénombrement |
---|---|---|
Nouvelle consultation | Très probable | 19 |
Assez probable | 43 | |
Peu probable | 11 | |
Total | 73 |
Rapport des probabilités de succès | |||||||
---|---|---|---|---|---|---|---|
IC à 95 % | |||||||
Prédicteur | Coeff | Coef ErT | Z | P | Inférieur | Supérieur | |
Const. (1) | -0,707512 | 0,352815 | -2,01 | 0,045 | |||
Const. (2) | 2,12316 | 0,444672 | 4,77 | 0,000 | |||
Situation emploi | |||||||
Au chômage | -0,631468 | 0,471078 | -1,34 | 0,180 | 0,53 | 0,21 | 1,34 |
Les rapports des probabilités de succès utilisent l'ordre des catégories ; ils ne décrivent donc pas les variations des probabilités de succès pour les catégories dans le désordre. Par exemple, le rapport des probabilités de succès ne décrit pas la variation des probabilités de succès que le patient réponde "Assez probable" au lieu de "Très probable" ou "Peu probable". Pour modéliser les catégories dans un ordre arbitraire, utilisez la régression logistique nominale.
Ces intervalles de confiance (IC) sont des étendues de valeurs susceptibles de contenir les valeurs réelles des rapports des probabilités de succès. Le calcul des intervalles de confiance utilise la loi normale. L'intervalle de confiance est précis si l'effectif d'échantillon est assez important pour que la distribution des rapports des probabilités de succès de l'échantillon suive une loi normale.
Les échantillons étant aléatoires, il est peu probable que deux échantillons d'une population donnent des intervalles de confiance identiques. Cependant, si vous prenez de nombreux échantillons aléatoires, un certain pourcentage des intervalles de confiance obtenus contiendra le paramètre de population inconnu. Le pourcentage de ces intervalles de confiance contenant le paramètre est le niveau de confiance de l'intervalle.
Pour évaluer l'estimation du rapport des probabilités de succès, utilisez l'intervalle de confiance.
Par exemple, avec un niveau de confiance de 95 %, vous pouvez être certain à 95 % que l'intervalle de confiance comprend la valeur du rapport des probabilités de succès pour la population. L'intervalle de confiance vous aide à évaluer la signification pratique de vos résultats. Utilisez vos connaissances spécialisées pour déterminer si l'intervalle de confiance comporte des valeurs ayant une signification pratique pour votre situation. Si l'intervalle est trop grand pour être utile, vous devez sans doute augmenter votre effectif d'échantillon.
Il s'agit d'un test global qui prend en compte tous les coefficients pour un prédicteur de catégorie simultanément. Ce test s'adresse aux prédicteurs de catégorie ayant plus de 2 niveaux.
Utilisez ce test pour déterminer si un prédicteur de catégorie avec plusieurs coefficients présente une relation statistiquement significative avec les événements de réponse. Lorsqu'un prédicteur de catégorie compte plus de 2 niveaux, les coefficients des niveaux individuels ont différentes valeurs de p. Le test global donne une réponse unique concernant la signification statistique du prédicteur.
Minitab maximise la fonction de log de vraisemblance pour déterminer les valeurs optimales des coefficients estimés.
Utilisez le log de vraisemblance pour comparer deux modèles qui estiment les coefficients à l'aide des mêmes données. Les valeurs étant négatives, plus elles sont proches de zéro, plus le modèle s'ajuste aux données.
Le log de vraisemblance ne peut pas diminuer lorsque vous ajoutez des termes à un modèle. Par exemple, un modèle avec 5 termes a un log de vraisemblance plus élevé que les modèles à 4 termes que vous pouvez créer avec les mêmes termes. Par conséquent, le log de vraisemblance est plus utile lorsque vous comparez des modèles de même taille. Pour prendre une décision concernant des termes individuels, observez les valeurs de p du terme dans les différentes fonctions logit.
Il s'agit d'un test global qui prend en compte tous les coefficients des prédicteurs dans le modèle.
Utilisez ce test pour déterminer si au moins l'un des prédicteurs du modèle présente une association statistiquement significative avec les événements de réponse. En général, vous n'interprétez pas la statistique G ni les degrés de liberté (DL). Les DL sont égaux au nombre de coefficients pour les prédicteurs dans le modèle.