Para cada assunto Seja ser a função passo que representa o número de eventos que se submetem experiências até o tempo . Então representa um processo de contagem para o assunto . Seja ser uma variável indicadora que tem o valor 1 se sujeito i está em risco no momento t e 0 de outra forma, o que é equivalente a Se e Senão
O modelo de riscos proporcionais de Cox pressupõe que a taxa de risco no momento para um indivíduo com um vetor de valores preditores , tem a seguinte forma:
em que é a taxa de risco da linha de base que caracteriza a distribuição não especificada do tempo de sobrevivência e é um vetor p-componente de coeficientes de regressão desconhecidos.
Por exemplo, uma formulação do modelo de riscos proporcionais cox como um processo de contagem baseado em Andersen et al. (1993)1 e Fleming e Harrington (1991)2, assumindo que sem tempos de evento empatados, tem uma probabilidade parcial de registro com a seguinte forma:
O vetor de derivativos parciais em relação aos componentes de , tem a seguinte forma:
A matriz p por p do leverage tem a seguinte forma:
onde a média ponderada dos sujeitos em risco no momento , tem a seguinte forma:
Esta formulação do modelo de riscos proporcionais cox é o modelo de riscos multiplicativos. O modelo de riscos multiplicativos tem as seguintes características:
O assunto pode vivenciar mais de um evento de interesse.
O sujeito pode vivenciar um evento várias vezes. Essa afirmação significa que a variável indicadora que identifica se o sujeito está em risco, , pode mudar estados de 1 para 0 e voltar várias vezes.
O sujeito pode entrar no estudo após o tempo 0. Esta afirmação equivale à ideia de que um sujeito pode entrar no conjunto de risco após o tempo 0. Um tempo é truncado quando o sujeito entra após o tempo 0.
Therneau (1999)3 fornece detalhes sobre a forma de entrada do processo de contagem de dados. A forma de entrada do processo de contagem de dados fornece uma técnica para encaixar o modelo de riscos multiplicativos com os mesmos algoritmos que se encaixam no modelo de riscos proporcionais cox.
O formulário de entrada do processo de contagem
No formulário de entrada do processo de contagem, várias linhas representam cada assunto. Cada linha descreve um intervalo de tempo quando os valores de todas as variáveis são constantes. Preditores dependentes do tempo mudam entre linhas. Os intervalos começam logo após o horário de início e incluem o tempo final. O tempo de início para o intervalo é o tempo de entrada para o assunto. O tempo final é a variável de resposta para o sujeito. A coluna de censura indica qualquer linha onde o horário final não seja um horário de evento.
Observações correlacionadas e o robusto estimador de covariância
Embora várias linhas representem cada sujeito na forma de entrada do processo de contagem, apenas uma linha das observações por sujeito contribui para a probabilidade a menos que exista correlação entre as observações em um subgrupo que diz respeito a cada sujeito. Por exemplo, as observações do sujeito estão correlacionadas em modelos que incluem eventos repetidos ou recorrentes. Lin e Wei (1989)4 propor um ajuste da matriz de covariância para explicar a correlação entre observações dentro do assunto. Seja ser a matriz de resíduos de pontuação. A matriz de variância-covariância tem a seguinte forma:
em que e é a matriz residual de pontuação colapsada. Para obter a matriz residual de escore colapsada, substitua cada conjunto de linhas residuais de escore pela soma dessas linhas residuais.
Uma análise que utiliza a robusta matriz de variância-covariância tem as seguintes características:
Os cálculos para inferências utilizam a robusta matriz de variância-covariância.
Os testes Wald e Score na tabela Bondade-de-Ajuste usam a robusta matriz de variância de variância. O teste de razão de probabilidade na tabela Bondade-de-Ajuste está faltando porque o teste de razão de probabilidade pressupõe que as observações dentro de um cluster são independentes.
A tabela ANOVA pode usar apenas o teste Wald.
1 Andersen, P. K., Borgon, O., Gill, R.D., e Keiden, N. (1993). Modelos estatísticos baseados na contagem de processos. Springer-Verlag.
2 Fleming, T. R., e Harrington, D. P. (1991). Contagem de processos e análise de sobrevivência. Wiley.
3 Therneau, T.M. (1999). Relatório técnico série nº 53: Um pacote para análise de sobrevivência em S.
4 Lin, D.Y. & Wei, L.J. (1989). A inferência robusta para o modelo de riscos proporcionais de Cox. Journal of the American Statistical Association, 84 (408), 1074-1078. https://doi.org/10.1080/01621459.1989.10478874