Utilisez un diagramme de Pareto des effets normalisés pour comparer l'importance relative et la signification statistique des effets principaux, des effets quadratiques et des effets d'interaction.
Minitab présente les effets normalisés par ordre décroissant de leurs valeurs absolues. La ligne de référence du diagramme indique les effets significatifs. Par défaut, Minitab utilise un seuil de signification de 0,05 pour tracer la ligne de référence.
Terme | Effet | Coeff | Coef ErT | FIV |
---|---|---|---|---|
Constante | -2,7370 | 0,0479 | ||
Conservateur | 0,4497 | 0,2249 | 0,0477 | 1,03 |
PressSousVide | 0,2574 | 0,1287 | 0,0477 | 1,06 |
NiveauContamination | 0,2954 | 0,1477 | 0,0478 | 1,06 |
TempRefr | -0,1107 | -0,0554 | 0,0478 | 1,07 |
Conservateur*PressSousVide | -0,0233 | -0,0117 | 0,0473 | 1,05 |
Conservateur*NiveauContamination | 0,0722 | 0,0361 | 0,0474 | 1,06 |
Conservateur*TempRefr | 0,0067 | 0,0034 | 0,0472 | 1,05 |
PressSousVide*NiveauContamination | -0,0430 | -0,0215 | 0,0469 | 1,04 |
PressSousVide*TempRefr | -0,0115 | -0,0058 | 0,0465 | 1,02 |
NiveauContamination*TempRefr | 0,1573 | 0,0786 | 0,0467 | 1,02 |
Dans ces résultats, les coefficients des effets principaux de Conservateur, PressSousVide et NiveauContamination sont des nombres positifs. Le coefficient de l'effet principal de TempRefr est un nombre négatif. En général, les coefficients positifs augmentent la probabilité de l'événement tandis que les coefficients négatifs la réduisent quand la valeur du terme augmente.
Source | DL | Somme des carrés des écarts ajustée | Moyenne ajustée | Khi deux | Valeur de p |
---|---|---|---|---|---|
Modèle | 10 | 46,2130 | 4,6213 | 46,21 | 0,000 |
Conservateur | 1 | 22,6835 | 22,6835 | 22,68 | 0,000 |
PressSousVide | 1 | 7,3313 | 7,3313 | 7,33 | 0,007 |
NiveauContamination | 1 | 9,6209 | 9,6209 | 9,62 | 0,002 |
TempRefr | 1 | 1,3441 | 1,3441 | 1,34 | 0,246 |
Conservateur*PressSousVide | 1 | 0,0608 | 0,0608 | 0,06 | 0,805 |
Conservateur*NiveauContamination | 1 | 0,5780 | 0,5780 | 0,58 | 0,447 |
Conservateur*TempRefr | 1 | 0,0051 | 0,0051 | 0,01 | 0,943 |
PressSousVide*NiveauContamination | 1 | 0,2106 | 0,2106 | 0,21 | 0,646 |
PressSousVide*TempRefr | 1 | 0,0153 | 0,0153 | 0,02 | 0,902 |
NiveauContamination*TempRefr | 1 | 2,8475 | 2,8475 | 2,85 | 0,092 |
Erreur | 5 | 0,9674 | 0,1935 | ||
Total | 15 | 47,1804 |
Dans ces résultats, les effets principaux de Conservateur, PressSousVide et NiveauContamination sont statistiquement significatifs au seuil de signification α = 0,05. Vous pouvez en conclure que la variation de ces variables entraîne une variation de la variable de réponse.
Les termes d'interaction ne sont pas statistiquement significatifs. La relation entre chaque variable et la réponse peut ne pas dépendre de la valeur de l'autre variable.
Les rapports de probabilités de succès supérieurs à 1 indiquent que l'événement est plus susceptible de se produire à mesure que le prédicteur augmente. Les rapports de probabilités de succès inférieurs à 1 indiquent que l'événement est moins susceptible de se produire à mesure que le prédicteur augmente.
Incrément | Rapport des probabilités de succès | IC à 95 % | |
---|---|---|---|
Dose (mg) | 0,5 | 6,1279 | (1,7218; 21,8087) |
Dans ces résultats, le modèle utilise le dosage d'un médicament pour prévoir la présence ou l'absence de bactérie chez des sujets adultes. Dans cet exemple, l'absence de bactérie constitue l'événement. Chaque comprimé contenant une dose de 0,5 mg, les chercheurs utilisent une variation d'unité de 0,5 mg. Le rapport des probabilités de succès est environ de 6. Pour chaque comprimé supplémentaire pris par un adulte, les probabilités de succès concernant le fait qu'un patient n'ait pas la bactérie sont multipliées par 6.
Pour les prédicteurs de catégorie, le rapport des probabilités de succès compare les probabilités qu'un événement se produise à deux niveaux différents du prédicteur. Minitab configure la comparaison en répertoriant les niveaux dans deux colonnes, Niveau A et Niveau B. Le niveau B est le niveau de référence du facteur. Les rapports des probabilités de succès supérieurs à 1 indiquent que l'événement est plus susceptible de se produire au niveau A. Les rapports des probabilités de succès inférieurs à 1 indiquent que l'événement est moins susceptible de se produire au niveau A. Pour plus d'informations sur le codage des prédicteurs de catégorie, reportez-vous à la rubrique Schémas de codage des prédicteurs de catégorie.
Niveau A | Niveau B | Rapport des probabilités de succès | IC à 95 % |
---|---|---|---|
Mois | |||
2 | 1 | 1,1250 | (0,0600; 21,0834) |
3 | 1 | 3,3750 | (0,2897; 39,3165) |
4 | 1 | 7,7143 | (0,7461; 79,7592) |
5 | 1 | 2,2500 | (0,1107; 45,7172) |
6 | 1 | 6,0000 | (0,5322; 67,6397) |
3 | 2 | 3,0000 | (0,2547; 35,3325) |
4 | 2 | 6,8571 | (0,6556; 71,7169) |
5 | 2 | 2,0000 | (0,0976; 41,0019) |
6 | 2 | 5,3333 | (0,4679; 60,7946) |
4 | 3 | 2,2857 | (0,4103; 12,7323) |
5 | 3 | 0,6667 | (0,0514; 8,6389) |
6 | 3 | 1,7778 | (0,2842; 11,1200) |
5 | 4 | 0,2917 | (0,0252; 3,3719) |
6 | 4 | 0,7778 | (0,1464; 4,1326) |
6 | 5 | 2,6667 | (0,2124; 33,4861) |
Dans ces résultats, le prédicteur de catégorie est le premier mois de la haute saison d'un hôtel. La réponse correspond à l'annulation ou non d'une réservation par un client. Dans cet exemple, une annulation constitue l'événement. Le plus grand rapport des probabilités de succès est d'environ 7,71, lorsque le niveau A est le mois 4 et le niveau B est le mois 1. Cela indique que la probabilité qu'un client annule une réservation pendant le mois 4 est environ 8 fois supérieure à la probabilité qu'un client annule une réservation pendant le mois 1.
De nombreuses statistiques récapitulatives du modèle et d'adéquation de l'ajustement sont influencées par la façon dont les données sont organisées dans la feuille de travail et par le nombre d'essais contenus dans chaque ligne (un ou plusieurs). Le test de Hosmer-Lemeshow n'est pas influencé par l'organisation des données et présente des résultats comparables que les lignes contiennent un ou plusieurs essais. Pour plus d'informations, reportez-vous à la rubrique Influence du format des données sur l'ajustement dans la régression logistique binaire.
Plus le R2 de la somme des carrés d'écart est élevé, plus le modèle est ajusté à vos données. Le R2 de la somme des carrés d'écart est toujours compris entre 0 et 100 %.
Le R2 de la somme des carrés d'écart augmente toujours lorsque vous ajoutez des termes à un modèle. Par exemple, le meilleur modèle à 5 termes aura toujours une valeur R2 au moins aussi élevée que celle du meilleur modèle à 4 termes. Par conséquent, le R2 de la somme des carrés d'écart est surtout utile pour comparer des modèles de même taille.
La disposition des données a un impact sur le R2 de la somme des carrés d'écart. Le R2 de la somme des carrés d'écart est généralement plus élevé pour des données avec plusieurs essais par ligne que pour des données avec un seul essai par ligne. Les R2 de la somme des carrés d'écart sont comparables uniquement entre des modèles qui utilisent le même format de données.
Les statistiques d'adéquation de l'ajustement ne sont qu'un des types de mesures permettant d'évaluer l'ajustement du modèle. Même si un modèle présente une valeur souhaitée, vous devez consulter les graphiques des valeurs résiduelles et les tests d'adéquation de l'ajustement pour évaluer l'ajustement du modèle aux données.
Pour comparer des modèles n'ayant pas le même nombre de termes, utilisez le R2 ajusté de la somme des carrés d'écart. Celui-ci augmente toujours lorsque vous ajoutez un terme au modèle. Le R2 ajusté de la somme des carrés d'écart intègre le nombre de termes dans le modèle pour vous aider à choisir le modèle correct.
Utilisez les valeurs AIC, AICc et BIC pour comparer différents modèles. Des valeurs faibles sont souhaitables pour chacune. Cependant, le modèle présentant la valeur la plus faible pour un ensemble de prédicteurs n'est pas forcément bien ajusté aux données. Vous devez aussi utiliser les graphiques des valeurs résiduelles et les tests d'adéquation de l'ajustement pour évaluer l'ajustement du modèle aux données.
R carré de la somme des carrés des écarts | R carré (ajust) de la somme des carrés des écarts | AIC | AICc | BIC |
---|---|---|---|---|
97,95% | 76,75% | 105,98 | 171,98 | 114,48 |
Dans ces résultats, le modèle explique 97,95 % de la somme des carrés des écarts dans la variable de réponse. Pour ces données, la valeur R2 de la somme des carrés des écarts indique que le modèle fournit un bon ajustement aux données. Si des modèles supplémentaires sont ajustés avec d'autres prédicteurs, utilisez la valeur R2 ajustée de la somme des carrés des écarts, ainsi que les valeurs AIC, AICc et BIC pour comparer l'ajustement des modèles aux données.
Si l'écart est statistiquement significatif, vous pouvez essayer une autre fonction de liaison ou modifier les termes du modèle.
Variable | Valeur | Dénombrement | Nom d'événement |
---|---|---|---|
Pourrissement | Evénement | 506 | Event |
Non-événement | 7482 | ||
Conteneurs | Total | 7988 |
Test | DL | Khi deux | Valeur de p |
---|---|---|---|
Somme des carrés des écarts | 5 | 0,97 | 0,965 |
Pearson | 5 | 0,97 | 0,965 |
Hosmer-Lemeshow | 6 | 0,10 | 1,000 |
Dans ces résultats, les tests d'adéquation de l'ajustement ont tous des valeurs de p supérieures au seuil de signification habituel de 0,05. Les tests ne permettent pas de conclure que les probabilités prévues diffèrent des probabilités observées d'une façon non prévue par la loi binomiale.