Os dados podem estar empilhados, desempilhados ou em uma tabela bidimensional
Para dados empilhados (Um Y), você deve ter pelo menos uma coluna de dados numéricos ou de data/hora, e duas colunas correspondentes de dados categóricos. Para dados desempilhados (Múltiplos Y’s), você deve ter várias colunas de dados numéricos ou de data/hora, e cada coluna é um grupo, e uma coluna correspondente de dados categóricos. Para dados em uma tabela bidimensional (Séries em Linhas ou Colunas), você deve ter várias colunas de dados resumidos numéricos ou de data/hora. Você pode ter uma coluna de rótulos para as linhas.
Os dados de amostra devem ser selecionados aleatoriamente
Nas estatísticas, as amostras aleatórias são usadas para fazer generalizações ou inferências, sobre uma população. Se os dados não foram coletados aleatoriamente, os resultados podem não representar a população.