Valeurs ajustées et diagnostics pour la fonction Droite d'ajustement binaire

Obtenez des définitions et bénéficiez de conseils en matière d'interprétation pour les valeurs ajustées et les diagnostics.

Valeur ajustée

La valeur ajustée est également appelée probabilité de l'événement ou probabilité prévue. La probabilité d'événement est la chance qu'un résultat ou un événement spécifique se produise. La probabilité d'événement estime la probabilité qu'un événement se produise, comme le fait de tirer un as dans un jeu de cartes ou la fabrication d'une pièce non conforme. La probabilité d'un événement est comprise entre 0 (impossible) et 1 (certain).

Interprétation

Dans la régression logistique binaire, une variable de réponse ne peut avoir que deux valeurs, la présence ou l'absence d'une maladie particulière, par exemple. La probabilité d'événement est la probabilité que la réponse pour une combinaison de facteurs ou de covariables donnée soit 1 pour un événement (par exemple, la probabilité qu'une femme de plus de 50 ans développe un diabète de type 2).

Chaque tentative d'une expérience est appelée "essai". Par exemple, si vous lancez une pièce 10 fois et que vous enregistrez le nombre de fois où elle tombe côté face, vous effectuez 10 essais pour cette expérience. Si les essais sont indépendants et de probabilité égale, vous pouvez estimer la probabilité d'événement en divisant le nombre d'événements par le nombre total d'essais. Par exemple, si la pièce tombe 6 fois côté face sur les 10 essais, la probabilité estimée de l'événement (nombre de chutes côté face) est égale à :

Nombre d'événements ÷ Nombre d'essais = 6 ÷ 10 = 0,6

Dans la régression logistique ordinale ou nominale, une variable de réponse peut posséder trois catégories (ou plus). La probabilité d'événement est la probabilité qu'une combinaison de facteurs ou de covariables donnée possède une catégorie de réponses spécifique. La probabilité cumulée d'événement est la probabilité que la réponse pour une combinaison de facteurs ou de covariables donnée se situe dans la catégorie k ou dans une catégorie inférieure, pour chaque valeur k possible, où k représente les catégories de réponse, 1…k.

Résiduelle

La valeur résiduelle mesure la capacité de prévision de l'observation par le modèle. Les observations mal ajustées par le modèle ont des valeurs résiduelles élevées. Minitab calcule les valeurs résiduelles pour chaque combinaison distincte de facteurs/covariables.

Interprétation

Créez un graphique des valeurs résiduelles pour déterminer si votre modèle est adapté et si les hypothèses de régression sont satisfaites. L'examen des valeurs résiduelles peut fournir des informations utiles sur l'ajustement du modèle aux données. De manière générale, les valeurs résiduelles doivent être distribuées de manière aléatoire sans aucun schéma clair ni aucune valeur aberrante. Si Minitab détermine que vos données comprennent des observations aberrantes, il les indique dans les résultats, dans le tableau Ajustements et diagnostics pour les observations aberrantes. Pour plus d'informations sur les valeurs aberrantes, reportez-vous à la rubrique Observations aberrantes.

Val. résid. norm

La valeur résiduelle normalisée est égale à la valeur résiduelle (ei) divisée par une estimation de son écart type.

Interprétation

Utilisez les valeurs résiduelles normalisées pour détecter les valeurs aberrantes. Les valeurs résiduelles normalisées supérieures à 2 et inférieures à −2 sont généralement considérées comme élevées. Le tableau Ajustements et diagnostics pour les observations aberrantes signale ces observations avec un "R". Lorsqu'une analyse indique qu'il existe de nombreuses observations aberrantes, le modèle révèle généralement des inadéquations de l'ajustement significatives. En d'autres termes, le modèle ne décrit pas de façon adéquate la relation entre les facteurs et la variable de réponse. Pour plus d'informations, reportez-vous à la rubrique Observations aberrantes.

Les valeurs résiduelles normalisées sont utiles, car les valeurs résiduelles brutes ne permettent pas toujours de détecter les valeurs aberrantes. La variance de chaque valeur résiduelle brute peut être différente en fonction des valeurs X qui lui sont associées. Il est donc difficile d'évaluer les tailles des valeurs résiduelles brutes. La normalisation des valeurs résiduelles résout ce problème en transformant les différentes variances selon une échelle commune.