Comment commence le processus de regroupement par les K-Moyennes ?

Le processus de regroupement par les K-Moyennes commence par le groupement des observations en un nombre de groupes prédéfini.
  1. Minitab évalue chaque observation et la déplace vers le groupe le plus proche. Le groupe le plus proche est celui dont la distance euclidienne entre l'observation et le centre du groupe est la plus faible.
  2. Lorsqu'un groupe change en perdant ou gagnant une observation, Minitab recalcule son centre.
  3. Ce processus est répété jusqu'à ce qu'aucune observation ne puisse plus être déplacée dans un autre groupe. A ce stade, toutes les observations se trouvent dans le groupe le plus proche selon le critère précédent.

Contrairement au regroupement hiérarchique des observations, il est possible que deux observations soient partagées en deux groupes distincts après avoir été réunies.

Les procédures K-Moyennes fonctionnent mieux lorsque vous fournissez de bons points de départ pour les groupes. Il existe deux moyens de lancer le processus de regroupement : en spécifiant un nombre de groupes ou en fournissant une colonne de subdivision initiale contenant les codes des groupes.

Vous pouvez déclencher le processus lorsque vous n'avez pas d'informations complètes pour effectuer la subdivision initiale des données. Supposons que vous savez que la subdivision finale doit être constituée de trois groupes et que les observations 2, 5 et 9 appartiennent respectivement à chacun de ces groupes. La suite de la procédure est différente selon que vous spécifiez un nombre de groupes ou une colonne de subdivision initiale.
  • Si vous spécifiez le nombre de groupes, vous devez redisposer vos données dans la feuille de travail pour déplacer les observations 2, 5 et 9 en haut de cette feuille, puis spécifier 3 comme nombre de groupes.
  • Si vous saisissez une colonne de subdivision initiale, vous n'avez pas besoin de redisposer vos données dans la feuille de travail. Dans la colonne de la feuille de travail pour la subdivision initiale, entrez les numéros de groupes 1, 2 et 3 pour les observations 2, 5 et 9, respectivement, et entrez 0 pour les autres observations.

La subdivision finale dépend dans une certaine mesure de la subdivision initiale que Minitab utilise. Vous pouvez essayer des subdivisions initiales différentes. Selon Milligan [10], les procédures k-moyennes en groupes peuvent ne pas être aussi efficaces lorsque vous effectuez les initialisations arbitrairement. Toutefois, si vous fournissez de bons points de départ, le regroupement par la méthode des k-moyennes peut s'avérer très robuste.