Considérations relatives aux données pour Ajuster le modèle de Cox sous forme de processus de comptage

Pour vous assurer que vos résultats sont valables, tenez compte des indications suivantes lorsque vous collectez des données, effectuez l'analyse et interprétez vos résultats.

La variable de réponse doit être continue
Les données continues sont des mesures pouvant correspondre à toutes les valeurs numériques d'une étendue de valeurs le long d'une échelle continue, y compris des valeurs fractionnaires ou décimales.
Les données de réponse peuvent être des heures d’événement uniques ou des heures d’événement multiples
Pour collecter des données, vous mesurez généralement le temps jusqu’à un événement. Pour un formulaire de processus de comptage, vous devez également spécifier l’heure à laquelle le sujet entre dans l’étude. Par exemple, un sujet a une forme de cancer de la peau à 7, 11, 15 et 27 mois de l’étude. Par la suite, le sujet a été exempt de cancer pendant 6 mois. À chaque intervalle de temps, les chercheurs enregistrent le prédicteur fixe du groupe de traitement et enregistrent un prédicteur dépendant du temps du niveau hormonal du sujet.
Vous pouvez également utiliser des données qui décrivent plusieurs événements. Par exemple, une automobile tombe en panne, est réparée, est remise en service, puis retombe en panne, et ainsi de suite. Les valeurs des données représentent le moment de chaque défaillance, sans prendre en considération le temps de réparation.
Les données doivent être dans le style de saisie du processus de comptage
Dans le formulaire de saisie du processus de comptage, plusieurs lignes représentent chaque sujet. Chaque ligne décrit un intervalle de temps où les valeurs de toutes les variables sont constantes. Les prédicteurs dépendant du temps changent entre les lignes. Les intervalles commencent juste après l’heure de début et incluent l’heure de fin. Les prédicteurs peuvent être fixes ou dépendants du temps. Pour plus d'informations, accédez à Saisir vos données pour Ajuster le modèle de Cox sous forme de processus de comptage.
Vous devez tenir compte des données tronquées
Étant donné que les données de réponse sont temporelles, elles sont sujettes à la censure et à la troncature. Pour les modèles de régression de Cox, la forme la plus courante de censure est la censure à droite, et la forme la plus courante de troncature est la troncature à gauche. Vous pouvez spécifier une colonne pour indiquer les temps de réponse qui sont censurés et non censurés.
  • Tronquée à droite Un temps de réponse du sujet est correctement censuré si le sujet ne connaît pas l’événement d’intérêt avant la fin de l’étude, ou si le sujet est retiré de l’étude avant qu’il ne subisse l’événement. Par exemple, une unité de test peut encore fonctionner après la période de test, ou un sujet peut se retirer prématurément d’une étude pour une raison autre que le décès.
  • Entrées de troncature ou de retard à gauche : La troncature gauche se produit lorsque vous n’observez pas un sujet au début de l’étude. Au lieu de cela, vous les incluez plus tard dans l’étude lorsqu’un événement intermédiaire se produit. Le moment où le sujet entre dans l’étude est connu sous le nom de temps d’entrée ou de troncature. Par exemple, vous n’incluez pas les patients sur une liste d’attente pour une greffe d’organe jusqu’à ce qu’un organe soit disponible pour une greffe.
Les sujets sur différents traitements vivent l’événement à des taux proportionnels
Le modèle de régression de Cox ne nécessite pas de spécifier une distribution paramétrique pour les données de réponse. Cependant, le modèle suppose que les personnes dans deux traitements différents ont des dangers ou des risques proportionnels de vivre l’événement. L’hypothèse des risques proportionnels fournit une interprétation simple des coefficients de régression en termes de rapports de risque ou de risques relatifs. Si l’hypothèse des dangers proportionnels ne tient pas, le tableau des risques relatifs peut donner des conclusions erronées. Utilisez les tests pour le tableau des dangers proportionnels, le diagramme d’Andersen et le diagramme d’Arjas pour vérifier cette hypothèse.
Le modèle doit être à rang complet.
Un modèle à rang complet comporte suffisamment de données pour estimer tous les termes qu'il contient. En cas de données manquantes, d'insuffisance des données ou de colinéarité élevée, le modèle peut ne pas être à rang complet. Dans ce cas, Minitab vous alerte lors de l'analyse. Ce problème peut généralement être résolu en supprimant les interactions non importantes d'ordre supérieur du modèle.