Uma coleta de dados pode ser distribuída ou dispersa de muitas maneiras diferentes. Por exemplo, os dados de rolamento um dado podem ter valores inteiros aleatórios de 1 a 6. Os dados de um processo de fabricação podem ser centralizados em um valor alvo ou podem incluir valores de dados que estejam muito distantes do valor central.
Você pode avaliar uma distribuição de dados através de gráficos, estatísticas descritivas ou comparação com uma distribuição teórica:
- Gráficos
- Os gráficos, como histogramas podem dar uma visão instantânea para a distribuição de um conjunto de dados. Os histogramas podem ajudá-lo a observar:
- Se os dados se agrupam em torno de um único valor, ou se os dados têm vários picos ou modos.
- Se os dados estão espalhados finamente sobre uma grande variedade ou se os dados estão dentro de um pequeno intervalo.
- Se os dados são assimétricos ou simétrico.
- Estatísticas descritivas
- As estatísticas descritivas que descrevem a tendência central (média, mediana) e dispersão (variância, desvio padrão) de dados com valores numéricos adicionam uma camada de detalhes e podem ser utilizadas para fazer comparações com outros conjuntos de dados.
- Distribuições teóricas
- Finalmente, algumas distribuições comuns podem ser identificadas e são referidas pelo nome, como as distribuições normal, Weibull e exponencial. A distribuição normal, por exemplo, é sempre em forma de sino e simétrica em torno de um valor médio.
- Provavelmente, seus dados reais só aproximam essas distribuições perfeitas. Se houver um bom ajuste, é possível dizer que os dados são bem modelados por uma determinada distribuição. Use para identificar a distribuição que melhor se ajusta aos seus dados.