Spécifier la méthode de validation pour la fonction Ajuster le modèle de Poisson

Stat > Régression > Régression de Poisson > Ajuster le modèle de Poisson > Validation

Choisissez la méthode de validation pour tester votre modèle. Habituellement, avec des échantillons plus petits, la méthode de validation croisée sur K partitions est appropriée. Avec des échantillons plus grands, vous pouvez sélectionner une fraction de cas à utiliser pour l'apprentissage et les tests.

Aucune

L’analyse ne valide pas le modèle.

Validation croisée sur K ensembles

Procédez comme suit pour utiliser la validation croisée de K ensembles.
  1. Dans la liste déroulante, sélectionnez Validation croisée sur K ensembles.
  2. Choisissez l'une des options suivantes pour spécifier si vous souhaitez attribuer des partitions de manière aléatoire ou avec une colonne d'ID.
    • Affecter aléatoirement des lignes de chaque partition : sélectionnez cette option afin que Minitab sélectionne de manière aléatoire des lignes pour chaque partition. Vous pouvez spécifier le nombre de partitions. La valeur par défaut de 10 fonctionne bien dans la plupart des cas. L'utilisation d'une valeur inférieure de K peut introduire plus de biais. Cependant, de plus grandes valeurs de K peuvent introduire plus de variabilité. Vous pouvez également définir une base pour le générateur de nombres aléatoires.
    • Affecter des lignes de chaque partition par colonne d'ID : sélectionnez cette option pour choisir les lignes à inclure dans chaque partition. Dans Colonne d'ID, saisissez la colonne qui identifie les ensembles. Chaque ligne ayant la même valeur dans la colonne d'ID se trouve dans le même ensemble.
    • (Facultatif) Sélectionnez Stocker la colonne d'ID pour la validation croisée sur K partitions pour enregistrer la colonne d'ID.

Validation avec un ensemble de test

Procédez comme suit pour diviser les données en un ensemble de données d'apprentissage et un ensemble de données de test.
  1. Dans la liste déroulante, sélectionnez Validation avec un ensemble de test.
  2. Sélectionnez l'une des options suivantes pour spécifier si vous souhaitez sélectionner une fraction de lignes de manière aléatoire ou avec une colonne d'ID.
    • Sélectionner aléatoirement une fraction de lignes comme ensemble de test : sélectionnez cette option afin que Minitab sélectionne de manière aléatoire l'ensemble de données de test. Vous pouvez spécifier la quantité de données à utiliser dans l'ensemble de données de test. La valeur par défaut de 0,3 fonctionne bien dans la plupart des cas. Vous souhaitez inclure suffisamment de données dans l'ensemble de données de test pour bien évaluer le modèle. Si vous n'êtes pas sûr de la forme du modèle, un ensemble de données de test plus grand permet une validation plus solide. Vous souhaitez également disposer de suffisamment de données dans l'ensemble de données d'apprentissage pour bien estimer le modèle. Généralement, les modèles avec plus de prédicteurs nécessitent plus de données d'apprentissage pour l'estimation.
    • Définir la division d'apprentissage/de test par colonne d'ID : sélectionnez cette option pour choisir vous-même les lignes à inclure dans l'échantillon de test. Dans Colonne d'ID, saisissez la colonne qui indique les lignes à utiliser pour l'échantillon de test. La colonne d'ID ne doit contenir que deux valeurs. Dans Niveau pour l'ensemble de test, sélectionnez le niveau à utiliser comme échantillon de test.
  3. (Facultatif) Cochez Stocker la colonne d'ID pour la division d'apprentissage/de test pour enregistrer la colonne d'ID.