Considerações de dados para Regressão com dados de vida

Para garantir que seus resultados sejam válidos, considere as seguintes diretrizes ao coletar dados, realizar a análise e interpretar os resultados.

A variável de resposta deve ser contínua: Dados contínuos são medidas que podem, potencialmente, assumir qualquer valor numérico dentro de um intervalo de valores ao longo de uma escala contínua, incluindo valores fracionários ou decimais. Se os dados de resposta são binários (apenas dois resultados possíveis), em vez de medições contínuas de tempo de falha (ou outras unidades), use Análise por probito.
Dados de resposta são frequentemente tempos de falha.: Para coletar os dados, normalmente você mede a quantidade de tempo até que um item falhe quando ele está sujeito a condições diferentes que são medidas por uma ou mais variáveis e/ou fatores. Por exemplo, é possível medir o tempo até a falha de um item em funcionamento em diferentes temperaturas.
Os tempos de falha devem ser independente: O tempo de falha de um item não deve influenciar o tempo de falha de outro item. Se os tempos de falha forem dependentes, os resultados podem não ser precisos. Por exemplo, os tempos entre falhas para um sistema reparável, muitas vezes, não são independentes.
Você deve levar em conta dados censurados: Os dados de tempos de vida são, muitas vezes, censurados, o que significa que os tempos de falha exatos de alguns itens são desconhecidos. Caso tenha observações censuradas, você deve incluí-las em sua análise para obter estimativas de confiabilidade precisas.; Use a censura à direita para creditar tempos de sucesso aos itens que ainda não falharam. Use censura á esquerda ou intervalar para explicar a incerteza quando você não conhece os tempos de falha exatos. Para obter mais informações, vá para Censura dos dados.
O modelo pode incluir até 9 fatores e 50 covariáveis: Preditores podem ser fatores (variáveis categóricas) e covariáveis (variáveis contínuas). A menos que você especifique um preditor como um fator, presume-se que a previsão seja uma covariável.; Os termos do modelo podem ser criados a partir das variáveis preditoras e tratados como fatores de covariáveis, interações ou termos aninhados. Os fatores podem ser cruzados ou aninhados. As covariáveis podem ser cruzadas entre si ou com fatores, ou aninhadas dentro de fatores.
O modelo deve ajustar adequadamente os dados: Para obter resultados precisos, as suposições do modelo, incluindo o ajuste da distribuição e parâmetros de igualdade de forma (Weibull e exponencial) ou de escala (outras distribuições) devem ser apropriadas para seus dados. Use engenharia ou conhecimento histórico para selecionar um modelo de distribuição. Em seguida, analise os gráficos de probabilidade para os resíduos padronizados e Cox-Snell para determinar se os pressupostos do modelo são apropriados.
O modelo deve ser de posto completo e hierárquico.: Em um modelo hierárquico, se um termo de interação estiver incluído, todas as interações de ordem inferior e preditores que compõem o termo de interação também devem estar presentes no modelo. Um modelo de posto completo inclui dados suficientes para estimar todos os termos em seu modelo. Os dados faltantes, dados insuficientes ou com alta colinearidade podem impedir que um modelo seja de posto completo. Se o modelo não for de posto completo, o Minitab irá alertá-lo quando a análise deve ser realizada. Muitas vezes, é possível resolver esse problema removendo do modelo interações sem importância de ordem mais elevada. Para obter mais informações, vá para Restrições em modelos para regressão com dados de vida.