Méthodes et formules pour la fonction Prévoir

Sélectionnez la méthode ou la formule de votre choix.

Intervalle de confiance

Etendue de valeurs dans laquelle la réponse moyenne estimée d'un ensemble de valeurs de prédicteurs devrait se trouver.

Formule

Notation

TermeDescription
valeur de réponse ajustée pour un ensemble donné de valeurs de prédicteurs
αtaux d'erreur de type I
nnombre d'observations
pnombre de paramètres de modèle
S 2(b)matrice de variance/covariance des coefficients
s 2carré moyen de l'erreur
Xmatrice du plan
X0vecteur de valeurs de prédiction données avec une colonne et p lignes
X'0transposition du nouveau vecteur des valeurs de prédiction avec une ligne et p colonnes

Valeur ajustée

Notation

TermeDescription
valeur ajustée
xkke terme. Chaque terme peut être un prédicteur unique, un terme polynomial ou un terme d'interaction.
bkestimation du ke coefficient de régression

Erreur type de la valeur ajustée (ErT ajust)

L'erreur type de la valeur ajustée dans un modèle de régression avec un prédicteur est calculée comme suit :

L'erreur type de la valeur ajustée dans un modèle de régression avec plusieurs prédicteurs est calculée comme suit :

Pour la régression pondérée, inclure la matrice de poids dans l’équation:

Lorsque les données disposent d’un ensemble de données de test ou d’une validation croisée Buplé, les formules sont les mêmes. La valeur de s2 provient des données de formation. La matrice de conception et la matrice de poids proviennent également des données de formation.

Notation

TermeDescription
s2mean square error
nnumber of observations
x0new value of the predictor
mean of the predictor
xiie predictor value
x0 vector of values that produce the fitted values, one for each column in the design matrix, beginning with a 1 for the constant term
X0transpose of the new vector of predictor values
Xdesign matrix
Wweight matrix

Équation de régression

Pour un modèle avec plusieurs prédicteurs, l’équation est la suivante :

y = β0 + β1x1 + ... + βkxk + ε

L’équation ajustée est :

Dans la régression linéaire simple, qui n’inclut qu’un seul prédicteur, le modèle est :

y=ß0+ ß1x1+ε

En utilisant des estimations de régression b0 pour ß0, et b1 pour ß1, l’équation ajustée est la suivante :

Équations avec une variable catégorielle

Lorsque vous incluez une variable catégorielle dans un modèle de régression, il y a 2 options pour afficher l’équation de régression :
  • Équation séparée de chaque ensemble de niveaux prédicteurs catégoriels
  • Equation unique
Ces deux options sont équivalentes. Par exemple, supposons que les données aient les variables suivantes :
C1
La variable de réponse
C2
Un prédicteur continu
C3
Une variable prédictive catégorique avec les niveaux Rouge et Bleu
Les équations séparées sont les suivantes :
  • Bleu: C1 = 0,184 + 0,1964*C2
  • Rouge: C1 = 0,011 + 0,1964*C2

Une seule équation utilise une variable indicatrice pour représenter la variable catégorique.

C1 = 0,184 + 0,1964*C2 + 0,0*C3_Bleu - 0,173*C3_Rouge

Dans l’équation unique, C3_Bleu est égal à 1 si l’observation est bleue, et 0 sinon. C3_Rouge est égal à 1 si l’observation est rouge, et 0 sinon. Pour chaque groupe, on substitue la variable indicatrice pour vérifier que l’équation unique est la même que les deux équations distinctes.
  • Observation bleue (C3_Bleu = 1, C3_Rouge = 0) : C1 = 0,184 + 0,1964*C2 + 0,0*1 - 0,173*0 = 0,184 + 0,1964*C2
  • Observation rouge (C3_Bleu = 0, C3_Rouge = 1 : C1 = 0,084 + 0,1964*C2 + 0,0*0 - 0,173*1 = 0,011 + 0,1964*C2

Notation

TermeDescription
yréponse
xkKtrimestre . Chaque terme peut être un prédicteur unique, un terme polynomial ou un terme d’interaction.
ßkkième coefficient de régression de population
εterme d’erreur qui suit une distribution normale avec une moyenne de 0
bkEstimation du kième coefficientde régression de la population
réponse ajustée

Intervalle de prévision

L'intervalle de prévision est l'étendue dans laquelle on s'attend à trouver la réponse ajustée pour une nouvelle observation.

Formule

Notation

TermeDescription
s(Prév)
valeur de réponse ajustée pour un ensemble donné de valeurs de prédicteurs
αseuil de signification
nnombre d'observations
pnombre de paramètres de modèle
s 2carré moyen de l'erreur
Xmatrice de prédicteur
X0vecteur de valeurs de prédiction données avec une colonne et p lignes
X'0transposition du nouveau vecteur des valeurs de prédiction avec une ligne et p colonnes