En regresión logística binaria, usted puede ingresar datos en dos formatos diferentes: formato de Respuesta binaria/Frecuencia y formato de Evento/Ensayo. Por lo general, el formato de los datos para el análisis debe coincidir con la forma en que se recopilaron los datos.
Normalmente los datos se recolectan y analizan en el formato de Evento/Ensayo, porque se pueden recopilar muchos ensayos a la vez. Por ejemplo, un ingeniero produce un lote de 200 circuitos integrados. Todos los circuitos del lote tienen que usar la misma configuración de proceso. Estos 200 circuitos son 200 ensayos. Si el ingeniero recolecta datos sobre otro lote con la misma configuración, los datos son una fila separada.
En el formato de Evento/Ensayo, la variable de respuesta utiliza dos columnas. Una columna contiene el número de éxitos o eventos de interés. La otra columna contiene el número de ensayos.
C1 | C2 | C3 | C4 |
---|---|---|---|
Éxitos | Ensayos | Temperatura | Materia prima |
180 | 200 | 1500 | Proveedor B |
200 | 200 | 1400 | Proveedor A |
196 | 200 | 1500 | Proveedor A |
197 | 200 | 1400 | Proveedor B |
190 | 200 | 1400 | Proveedor A |
193 | 200 | 1400 | Proveedor B |
198 | 200 | 1500 | Proveedor A |
185 | 200 | 1500 | Proveedor B |
Si los datos están en formato de Evento/Ensayo en la hoja de trabajo, pero el número de ensayos por fila es pequeño, la fiabilidad y la interpretación de los estadísticos cambian. Por ejemplo, si cada fila tiene 1 ensayo, entonces el número de eventos por fila es 0 o 1. El análisis de estos datos es igual que si se tuvieran datos de Respuesta binaria/Frecuencia sin una columna de frecuencia.
Normalmente los datos se recolectan y analizan en el formato de Respuesta binaria/Frecuencia, porque es posible registrar el resultado de cada ensayo separado a medida que se produce el resultado. Por ejemplo, un consultor de marketing encuesta a los consumidores cuando salen de un supermercado acerca de si compraron una nueva marca de cereal. Cuando cada consumidor responde, el consultor registra su información individual.
En el formato de Respuesta binaria/Frecuencia, la variable de respuesta utiliza una columna. La columna de respuesta tiene solo dos valores, uno de los cuales indica el evento y el otro indica el no evento.
C1 | C2 | C3 |
---|---|---|
Compró | Ingreso | Niños |
Sí | 37 | Sí |
No | 47 | Sí |
Sí | 34 | No |
Sí | 58 | No |
Usted puede incluir una columna de frecuencia para los datos que estén en formato de Respuesta binaria/Frecuencia. Para una interpretación más clara de la gráfica de residuos vs. orden, combine únicamente observaciones consecutivas. La combinación de observaciones no consecutivas puede crear u ocultar patrones en la gráfica de residuos vs. orden.
C1 | C2 | C3 | C4 |
---|---|---|---|
Compró | Ingreso | Niños | Frecuencia |
Sí | 40 | Sí | 2 |
No | 40 | No | 12 |
Sí | 45 | Sí | 1 |
No | 45 | No | 6 |