Méthodes et formules pour les coefficients et équation de régression pour Ajuster le modèle de Cox avec des prédicteurs fixes uniquement

Sélectionnez la méthode ou la formule de votre choix.

Equation de régression

Le modèle semi-paramétrique des dangers proportionnels de Cox utilise les valeurs de prévision pour un individu, , pour prédire le score de risque, . L'équation de régression prend la forme générale suivante :

est le vecteur des coefficients estimés. Les coefficients estimés peuvent inclure des valeurs pour des termes d’ordre supérieur, tels que les carrés de prédicteurs continus. Le score de risque estimé est valable pour toute la période d’une étude et ne dépend pas du temps. Dans la sortie, l’équation se présente sous la forme suivante où une équation distincte apparaît pour différents niveaux de facteurs catégoriels :

Coeff

Soit la fonction de probabilité log-partielle pour le modèle des risques proportionnels de Cox . Le vecteur qui maximise la fonction de vraisemblance partielle, , donne les coefficients estimés pour le modèle. Trouver , définir les dérivées partielles de la fonction de vraisemblance log-partielle égale à zéro et résoudre les équations pour . Minitab Statistical Software utilise la méthode d’itération Newton-Raphson pour résoudre les équations. Voir Murray (1972)1 for a description of the Newton-Raphson iterative method.

Le vecteur des dérivées partielles de la fonction de vraisemblance log-partielle dépend de si la variable de réponse inclut des temps d’événement liés. Si la variable de réponse inclut des liens, alors l’estimation utilise soit l’approximation d’Efron, soit l’approximation de Breslow. Si la variable de réponse n’a pas de liens, les 3 méthodes fournissent les mêmes estimations. Moins il y a de liens dans les données, plus les résultats des deux méthodes d’approximation sont proches. Plus il y a de liens dans les données, plus l’approximation d’Efron améliore l’approximation de Breslow.

Les calculs utilisent la définition suivante :
TermeDescription
le vecteur des valeurs de covariable qui correspond à l’unité d’échantillon avec l’heure de l’événement

Données sans liens

Les calculs pour les données sans liens utilisent les définitions suivantes:
TermeDescription
le nombre de fois d’événements
le risque fixé à ce moment-là , qui est l’ensemble de toutes les unités d’échantillonnage qui n’ont pas encore échoué avant l’heure
une variable de comptage pour le nombre de paramètres dans le modèle, est le nombre de paramètres dans le modèle

La fonction de probabilité partielle pour le modèle des risques proportionnels de Cox sans attaches se présente sous la forme suivante :

La fonction de perte est calculée comme suit :

Le vecteur des dérivées partielles par rapport aux composantes de , se calcule selon la formule suivante :

de sorte que la dérivée partielle pour un coefficient particulier, , se calcule selon la formule suivante :

Données liées

Les calculs pour les données avec des liens utilisent les définitions suivantes:
TermeDescription
le nombre d'événements au temps
l’ensemble de toutes les unités d’échantillonnage qui ont l’événement à la fois
le risque fixé à ce moment-là , qui est l’ensemble de toutes les unités d’échantillonnage qui n’ont pas encore échoué avant l’heure
De plus, laissez

Approximation d’Efron pour les données avec des liens

La fonction de perte est calculée comme suit :

La fonction de perte est calculée comme suit :
de sorte que la dérivée partielle pour un coefficient particulier, , se calcule selon la formule suivante :

Approximation de Breslow pour les données à liens

La fonction de perte est calculée comme suit :

La fonction de perte est calculée comme suit :
de sorte que la dérivée partielle pour un coefficient particulier, , se calcule selon la formule suivante :

Coefficients codés

Le tableau affiche les coefficients codés lorsque l’analyse normalise les prédicteurs continus. Pour trouver les coefficients codés, remplacez les prédicteurs standardisés dans les équations précédentes.

Coef ErT

Les erreurs types des coefficients sont les racines carrées des éléments diagonaux de la matrice de covariance : La matrice de variance/covariance a la forme suivante :

où la matrice d’information observée, dépend si la variable de réponse inclut des temps d’événement liés. Si la variable de réponse inclut des liens, alors l’estimation utilise soit l’approximation d’Efron, soit l’approximation de Breslow. Si la variable de réponse n’a pas de liens, les 3 méthodes fournissent les mêmes estimations. Moins il y a de liens dans les données, plus les résultats des deux méthodes d’approximation sont proches. Plus il y a de liens dans les données, plus l’approximation d’Efron améliore l’approximation de Breslow.

Données sans liens

L’élément (k, l) de la matrice d’information de Fisher observée a la forme suivante:
où l’élément (k, l) de la matrice hessienne pour la fonction log-vraisemblance partielle a la forme suivante:

Approximation d’Efron pour les données avec des liens

L’élément (k, l) de la matrice d’information de Fisher observée a la forme suivante:
où l’élément (k, l) de la matrice hessienne pour la fonction log-vraisemblance partielle a la forme suivante:

et

Approximation de Breslow pour les données à liens

L’élément (k, l) de la matrice d’information de Fisher observée a la forme suivante:
où l’élément (k, l) de la matrice hessienne pour la fonction log-vraisemblance partielle a la forme suivante:

et

Valeur de Z

Pour calculer la statistique de test, procédez comme suit :
La fonction de perte est calculée comme suit :

est l'erreur type estimée du coefficient . La valeur de est la racine carrée positive du kème élément diagonal de .

% IC

Un intervalle de confiance à 100(1 – α) % par approximation s'obtient par la formule suivante :

est le centile supérieur α de la distribution normale standard.

Valeur de p

La valeur de p ajustée comporte l'expression suivante :
TermeDescription
une variable aléatoire de la loi normale standard
statistique de test pour contre l'hypothèse alternative

Modèles stratifiés de risques proportionnels

Pour un modèle qui inclut une variable catégorielle avec des niveaux s comme variable de stratification, les coefficients de régression sont constants dans toutes les strates. L’estimation des coefficients de régression dans le modèle stratifié a le même processus que pour le modèle des risques proportionnels sans stratification. Pour le modèle stratifié, la fonction de vraisemblance log-partielle se présente sous la forme suivante :

est la probabilité partielle logarithmique dans la strate j. Additionnez les dérivées de chaque strate pour obtenir les équations de vraisemblance partielle. Les dérivés de chaque strate sont les mêmes que les dérivés du modèle des risques proportionnels sans stratification. Les méthodes Breslow et Efron s’appliquent en conséquence.

1 Murray, W. Ed. (1972). Numerical Methods for Unconstrained Optimization. Academic Press.