Tableau d'analyse séquentielle de la variance pour la fonction Droite d'ajustement

Obtenez des définitions et bénéficiez de conseils en matière d'interprétation pour chaque statistique du tableau d'analyse séquentielle de la variance.

DL

Le nombre total de degrés de liberté (DL) représente la quantité d'informations dans vos données. L'analyse utilise ces informations pour estimer les valeurs des paramètres de population inconnus. Le nombre total de DL est déterminé par le nombre d'observations dans votre échantillon. Les DL d'un terme affichent la quantité d'informations utilisée par ce terme. Le fait d'accroître l'effectif de l'échantillon permet d'obtenir davantage d'informations sur la population, ce qui augmente le nombre total de degrés de liberté. Le fait d'augmenter le nombre de termes dans votre modèle utilise plus d'informations, ce qui réduit le nombre de DL disponibles pour l'estimation de la variabilité des estimations de paramètres.

Deux conditions doivent être remplies pour que Minitab subdivise les DL de l'erreur. D'abord, le modèle en cours doit ne pas inclure certains termes que vous pouvez ajuster avec les données. Par exemple, si vous disposez d'un prédicteur avec au moins 3 valeurs différentes, vous pouvez estimer un terme quadratique pour ce prédicteur. Si le modèle ne contient pas le terme quadratique, un terme pouvant être ajusté par les données n'est pas inclus au modèle, ce qui permet de remplir cette condition.

La seconde condition est que les données doivent contenir des répliques. Les répliques sont des observations où tous les prédicteurs ont la même valeur. Par exemple, si vous disposez de 3 observations où la pression est 5 et la température est 25, les 3 observations sont des répliques.

Si ces deux conditions sont remplies, les deux composantes des DL de l'erreur correspondant à l'inadéquation de l'ajustement et à l'erreur pure. Les DL pour l'inéquation de l'ajustement permettent de déterminer si la forme du modèle est adaptée. Le test d'inadéquation de l'ajustement utilise les degrés de liberté de l'inadéquation. Plus les DL sont nombreux pour l'erreur pure, plus le test d'inadéquation de l'ajustement est efficace.

Somme des carrés

Les sommes des carrés séquentielles sont des mesures de la variation des différentes composantes du modèle. Contrairement aux sommes des carrés ajustées, les sommes des carrés séquentielles dépendent de l'ordre dans lequel les termes sont entrés dans le modèle. Dans le tableau d'analyse séquentielle de la variance, Minitab sépare les sommes des carrés séquentielles en fonction des termes polynomiaux (c'est-à-dire linéaires, quadratiques et cubiques) du modèle.

Somme des carrés
La somme des carrés séquentielle de chaque terme polynomial est la part de la variation exclusivement expliquée par un terme, et non par les termes d'odre inférieur déjà entrés dans le modèle. Elle quantifie la variation des données de réponse expliquée par chaque terme polynomial, à mesure que vous les ajoutez, dans l'ordre, au modèle.
SomCar séq totale
La somme totale des carrés est obtenue en additionnant la somme des carrés du terme et la somme des carrés de l'erreur. Elle quantifie la variation totale dans les données.

Interprétation

Minitab utilise la somme des carrés séquentielle pour calculer la valeur de p pour un terme. Minitab utilise aussi les sommes des carrés pour calculer la statistique R2. En général, vous interprétez les valeurs de p et la statistique R2 plutôt que les sommes des carrés.

Valeur F

La valeur F est une statistique de test utilisée pour déterminer si le modèle est associé à la réponse.

Interprétation

Minitab utilise la valeur F pour calculer la valeur de p, qui vous permet de déterminer si le modèle est significatif d'un point de vue statistique. La valeur de p est la probabilité qui mesure le degré de certitude avec lequel il est possible d'invalider l'hypothèse nulle. Des probabilités faibles permettent d'invalider l'hypothèse nulle avec plus de certitude.

Une valeur F suffisamment élevée indique que le modèle est significatif.

Si vous souhaitez utiliser la valeur F pour savoir si l'hypothèse nulle doit être rejetée, comparez-la à votre valeur critique. Vous pouvez calculer la valeur critique dans Minitab ou rechercher la valeur critique dans un tableau de loi F, disponible dans la plupart des livres de statistiques. Pour plus d'informations sur la façon d'utiliser Minitab pour calculer la valeur critique, accédez à la rubrique Utilisation de la fonction de répartition (CDF) inverse et cliquez sur "Utiliser la CDF inverse pour calculer des valeurs critiques".

Valeur de p - Terme

La valeur de p est la probabilité qui mesure le degré de certitude avec lequel il est possible d'invalider l'hypothèse nulle. Des probabilités faibles permettent d'invalider l'hypothèse nulle avec plus de certitude.

Interprétation

Pour déterminer si l'association entre la réponse et chacun des termes du modèle est statistiquement significative, comparez la valeur de p du terme à votre seuil de signification pour évaluer l'hypothèse nulle. L'hypothèse nulle est que le coefficient du terme est égal à zéro, ce qui indique qu'il n'existe aucune association entre le terme et la réponse. En général, un seuil de signification (noté alpha ou α) de 0,05 fonctionne bien. Un seuil de signification de 0,05 indique un risque de 5 % de conclure à tort qu'il existe une association.
Valeur de p ≤ α : l'association est statistiquement significative.
Si la valeur de p est inférieure ou égale au seuil de signification, vous pouvez conclure qu'il existe une association statistiquement significative entre la variable de réponse et le terme. Si vous ajustez un modèle quadratique ou cubique et que les termes quadratiques ou cubiques sont significatifs, vous pouvez en conclure que les données contiennent une courbure.
Valeur de p > α : l'association n'est pas statistiquement significative.

Si la valeur de p est supérieure au seuil de signification, vous ne pouvez pas conclure qu'il existe une association statistiquement significative entre la variable de réponse et le terme. Si vous ajustez un modèle quadratique ou cubique et que les termes quadratiques ou cubiques ne sont pas statistiquement significatifs, il est sans doute nécessaire de sélectionner un modèle différent.