Observations relatives aux données pour la fonction Régression non linéaire

Pour garantir la validité de vos résultats, prenez en compte les indications suivantes lorsque vous collectez des données, effectuez une analyse et interprétez vos résultats.

Les prédicteurs peuvent être continus ou de catégorie

Une variable continue peut être mesurée et ordonnée, et dispose d'un nombre infini de valeurs entre deux valeurs quelconques. Par exemple, les diamètres d'un échantillon de pneus représentent une variable continue.

Les variables de catégorie ont un nombre fini et dénombrable de catégories ou de groupes distincts. Les données de catégorie peuvent ne pas présenter d'ordre logique. Par exemple, les prédicteurs de catégorie incluent le sexe d'individus, le type de matériel et le mode de paiement.

Si vos données comportent une variable discrète, vous pouvez décider de la traiter comme un prédicteur continu ou de catégorie. Une variable discrète peut être mesurée et ordonnée, mais ses valeurs son dénombrables. Par exemple, le nombre de personnes vivant dans une maison est une variable discrète. Le choix de traiter une variable discrète comme un prédicteur continu ou de catégorie dépend du nombre de niveaux, ainsi que de l'objectif de l'analyse.

Si vous disposez de prédicteurs de catégorie, convertissez-les en variables indicatrices avant d'effectuer cette analyse. Pour convertir des prédicteurs de catégorie, utilisez Créer des variables indicatrices.

La variable de réponse doit être continue

Si la variable de réponse est une variable de catégorie, le modèle est moins susceptible de satisfaire les hypothèses de l'analyse, de décrire précisément vos données ou de permettre des prévisions utiles.

Si vos données ne nécessitent pas de fonction non linéaire, vous pouvez envisager d'autres analyses.

Si la variable de réponse contient deux catégories, comme Réussite et Echec, utilisez la fonction Ajuster le modèle logistique binaire.
Si la variable de réponse contient au moins trois catégories dont l'ordre est naturel, par exemple Absolument pas d'accord, Pas d'accord, Sans opinion, D'accord et Tout à fait d'accord, utilisez la fonction Régression logistique ordinale.
Si la variable de réponse contient au moins trois catégories qui n'ont pas d'ordre naturel, par exemple Eraflure, Entaille et Déchirure, utilisez la fonction Régression logistique nominale.
Si la variable de réponse dénombre des occurrences, comme le nombre de défauts, utilisez la fonction Ajuster le modèle de Poisson.

La fonction de prévision doit décrire précisément la relation entre les variables de réponse et de prédiction

Votre choix pour la fonction de prévision dépend souvent de vos connaissances préalables sur la forme de la courbe de la réponse ou du comportement des propriétés physiques et chimiques du système. Les formes de courbes non linéaires possibles sont notamment : concave, convexe, à croissance ou décroissance exponentielle, à courbe sigmoïde (S) et asymptotique. Vous devez indiquer la fonction qui répond tant aux exigences associées à vos connaissances préalables qu'aux graphiques des valeurs résiduelles.

Vous devez spécifier des valeurs de départ acceptables

Un algorithme itératif calcule les paramètres en ajustant systématiquement les estimations de paramètres de manière à réduire la somme des carrés de l'erreur (SCE). Dans certaines fonctions de prévision et certains fichiers de données, les valeurs de début peuvent affecter les résultats de façon significative.

Suivre les meilleures pratiques pour la collecte des données

Pour garantir la validité de vos résultats, suivez les indications ci-après :

Assurez-vous que les données sont représentatives de la population qui vous intéresse.
Collectez suffisamment de données pour bénéficier de la précision nécessaire.
Mesurez les variables de façon aussi exacte et précise que possible.
Enregistrez les données dans leur ordre de collecte.

Le modèle doit être correctement ajusté aux données

Si le modèle n'est pas correctement ajusté aux données, les résultats risquent d'être trompeurs. Dans les résultats, utilisez les graphiques des valeurs résiduelles et les statistiques récapitulatives du modèle pour déterminer l'ajustement du modèle aux données.