Observations relatives aux données pour la fonction Analyse discriminante

Pour garantir la validité de vos résultats, examinez les indications suivantes lorsque vous collectez des données, effectuez une analyse et interprétez vos résultats.

Les variables de prédiction doivent être quantitatives
Vous devez disposer d'au moins une colonne numérique contenant des données de mesure pour chaque prédicteur. Minitab utilise les données pour définir la relation entre le prédicteur et la réponse. Si vous disposez d'un prédicteur de catégorie, vous ne pouvez pas utiliser cette analyse. Utilisez plutôt la régression logistique.
Les prédicteurs ne doivent pas être hautement corrélés
La corrélation entre les prédicteurs est appelée multicolinéarité. Si la multicolinéarité est importante, ou si certains prédicteurs sont essentiellement constants, Minitab ne peut pas effectuer l'analyse discriminante et affiche un message.
La variable de réponse doit indiquer le groupe
Vous devez disposer d'une seule colonne de groupement contenant des identificateurs pour un maximum de 20 groupes. Les identificateurs de groupes peuvent être de type numérique, texte ou date/heure.
Les données des variables de prédiction doivent être normales pour tous les groupes
La normalité multivariée est une hypothèse formelle pour l'analyse discriminante. La fonction discriminante linéaire est raisonnablement robuste aux écarts par rapport à la normalité, mais la fonction discriminante quadratique est plus sensible à l'hypothèse de normalité. Envisagez d'utiliser la régression logistique si les prédicteurs ne sont pas normaux. Dans de tels cas, la régression logistique produit des résultats plus exacts.
Indiquer les probabilités a priori de l'analyse, si possible
Parfois, vous connaissez la probabilité qu'une observation appartienne à un groupe avant d'effectuer une analyse discriminante. Par exemple, si vous classez les acheteurs d'une voiture spécifique, il se peut que vous sachiez déjà que 60 % des acheteurs sont des hommes et 40 % des femmes. Si vous connaissez ou pouvez estimer les probabilités a priori, indiquez-les pour améliorer l'exactitude des résultats de l'analyse.