Especifique as probabilidades a priori e os custos de classificação errada para Classificação CART®

Módulo de análise preditiva > Classificação CART® > A priori/custo

Probabilidades a priori para níveis de resposta

Uma probabilidade a priori é a probabilidade de uma observação cair em um determinado grupo antes de os dados serem coletados. Quando você não especifica probabilidades a priori, o Minitab assume que os grupos são igualmente prováveis.
  • Todos os níveis têm igual probabilidade: O padrão usa probabilidades a priori iguais para todos os níveis de resposta. Por exemplo, se a resposta tiver 4 níveis, cada nível será definido em 0,25.
  • As probabilidades correspondem às frequências totais da amostra: Defina as probabilidades a priori de acordo com as proporções amostrais. Por exemplo, se o número total de observações for de 1000, e 250 delas são nível 1, 475 são nível 2, 100 são nível 3, e 175 são nível 4, o Minitab usa as proporções de 0,25, 0,475, 0,10 e 0,175 para os níveis.
  • Especificar as probabilidades a priori para cada nível: Defina probabilidades a priori para cada nível. Cada valor deve estar entre 0 e 1. As probabilidades para todos os níveis devem somar 1.

Custos de classificação errada

Especifique os custos para a classificação errada. Por padrão, o Minitab usa custos iguais a 1. Para indicar custos mais altos, use valores maiores. Os custos devem ser maiores que 0.

Por exemplo, a tabela a seguir reflete que o custo de classificar incorretamente um cliente em potencial seja 10 vezes mais alto do que classificar incorretamente um cliente não interessado. A proporção dos custos é relevante, não os custos reais.

Nível predito
Nível real Sim (Evento) Não
Sim (Evento)   10
Não 1