Los datos pueden estar apilados o desapilados en una tabla bidimensional
Para datos apilados (Una Y), debe tener por lo menos una columna de datos numéricos o datos de fecha/hora y dos columnas correspondientes de datos categóricos. Para datos desapilados (Múltiples Y), debe tener múltiples columnas de datos numéricos o datos de fecha/hora, y cada columna es un grupo, y una columna correspondiente de datos categóricos. Para datos en una tabla bidimensional (Series en filas o columnas), debe tener múltiples columnas de datos de resumen numéricos o de fecha/hora. Puede tener una columna de etiquetas para las filas.
Los datos de la muestra se deben seleccionar aleatoriamente
En estadística, las muestras aleatorias se utilizan para hacer generalizaciones, o inferencias, sobre una población. Si sus datos no se recopilaron aleatoriamente, sus resultados podrían no representar la población.