Méthodes et formules pour la fonction Prévoir

Sélectionnez la méthode ou la formule de votre choix.

Sur ce thème

Intervalle de confiance
Valeur ajustée
Erreur type de la valeur ajustée (ErT ajust)
Équation de régression
Intervalle de prévision

Intervalle de confiance

Etendue de valeurs dans laquelle la réponse moyenne estimée d'un ensemble de valeurs de prédicteurs devrait se trouver.

Formule

Notation

Terme	Description

	valeur de réponse ajustée pour un ensemble donné de valeurs de prédicteurs
α	taux d'erreur de type I
n	nombre d'observations
p	nombre de paramètres de modèle
S ²(b)	matrice de variance/covariance des coefficients
s ²	carré moyen de l'erreur
X	matrice du plan
X₀	vecteur de valeurs de prédiction données avec une colonne et p lignes
X'₀	transposition du nouveau vecteur des valeurs de prédiction avec une ligne et p colonnes

Valeur ajustée

Notation

Terme	Description
	valeur ajustée
x_k	k^e terme. Chaque terme peut être un prédicteur unique, un terme polynomial ou un terme d'interaction.
b_k	estimation du k^e coefficient de régression

Erreur type de la valeur ajustée (ErT ajust)

L'erreur type de la valeur ajustée dans un modèle de régression avec un prédicteur est calculée comme suit :

L'erreur type de la valeur ajustée dans un modèle de régression avec plusieurs prédicteurs est calculée comme suit :

Pour la régression pondérée, inclure la matrice de poids dans l’équation:

Lorsque les données disposent d’un ensemble de données de test ou d’une validation croisée Buplé, les formules sont les mêmes. La valeur de s² provient des données de formation. La matrice de conception et la matrice de poids proviennent également des données de formation.

Notation

Terme	Description
s²	mean square error
n	number of observations
x₀	new value of the predictor
	mean of the predictor
x_i	i^e predictor value
x₀	vector of values that produce the fitted values, one for each column in the design matrix, beginning with a 1 for the constant term
X₀	transpose of the new vector of predictor values
X	design matrix
W	weight matrix

Équation de régression

Pour un modèle avec plusieurs prédicteurs, l’équation est la suivante :

y = β₀ + β₁x₁ + ... + β_kx_k + ε

L’équation ajustée est :

Dans la régression linéaire simple, qui n’inclut qu’un seul prédicteur, le modèle est :

y=ß₀+ ß₁x₁+ε

En utilisant des estimations de régression b₀ pour ß₀, et b₁ pour ß₁, l’équation ajustée est la suivante :

Équations avec une variable catégorielle

Lorsque vous incluez une variable catégorielle dans un modèle de régression, il y a 2 options pour afficher l’équation de régression :

Équation séparée de chaque ensemble de niveaux prédicteurs catégoriels
Equation unique

Ces deux options sont équivalentes. Par exemple, supposons que les données aient les variables suivantes :

C1: La variable de réponse
C2: Un prédicteur continu
C3: Une variable prédictive catégorique avec les niveaux Rouge et Bleu

Les équations séparées sont les suivantes :

Bleu: C1 = 0,184 + 0,1964*C2
Rouge: C1 = 0,011 + 0,1964*C2

Une seule équation utilise une variable indicatrice pour représenter la variable catégorique.

C1 = 0,184 + 0,1964*C2 + 0,0*C3_Bleu - 0,173*C3_Rouge

Dans l’équation unique, C3_Bleu est égal à 1 si l’observation est bleue, et 0 sinon. C3_Rouge est égal à 1 si l’observation est rouge, et 0 sinon. Pour chaque groupe, on substitue la variable indicatrice pour vérifier que l’équation unique est la même que les deux équations distinctes.

Observation bleue (C3_Bleu = 1, C3_Rouge = 0) : C1 = 0,184 + 0,1964*C2 + 0,0*1 - 0,173*0 = 0,184 + 0,1964*C2
Observation rouge (C3_Bleu = 0, C3_Rouge = 1 : C1 = 0,084 + 0,1964*C2 + 0,0*0 - 0,173*1 = 0,011 + 0,1964*C2

Notation

Terme	Description
y	réponse
x_k	K^trimestre . Chaque terme peut être un prédicteur unique, un terme polynomial ou un terme d’interaction.
ß_k	k^ième coefficient de régression de population
ε	terme d’erreur qui suit une distribution normale avec une moyenne de 0
b_k	Estimation du kième coefficient^de régression de la population
	réponse ajustée

Intervalle de prévision

L'intervalle de prévision est l'étendue dans laquelle on s'attend à trouver la réponse ajustée pour une nouvelle observation.

Formule

Notation

Terme	Description
s(Prév)
	valeur de réponse ajustée pour un ensemble donné de valeurs de prédicteurs
α	seuil de signification
n	nombre d'observations
p	nombre de paramètres de modèle
s ²	carré moyen de l'erreur
X	matrice de prédicteur
X₀	vecteur de valeurs de prédiction données avec une colonne et p lignes
X'₀	transposition du nouveau vecteur des valeurs de prédiction avec une ligne et p colonnes