Prueba de chi cuadrado en Excel

Prueba de chi-cuadrado con Excel

La prueba de chi-cuadrado en Excel es la prueba no paramétrica más comúnmente utilizada para comparar dos o más variables para datos seleccionados al azar. Es un tipo de prueba que se usa para averiguar la relación entre dos o más variables, esto se usa en estadística que también se conoce como Chi-Square P-value, en Excel no tenemos una función incorporada pero podemos usar fórmulas para realizar la prueba de chi-cuadrado en excel utilizando la fórmula matemática para la prueba de chi-cuadrado.

Tipos

  1. Prueba de chi-cuadrado de bondad de ajuste
  2. Prueba de chi-cuadrado para la independencia de dos variables.

# 1 - Prueba de chi-cuadrado de bondad de ajuste

Se utiliza para percibir la proximidad de una muestra que se adapta a una población. El símbolo de la prueba de chi-cuadrado es (2). Es la suma de todo el ( recuento observado - recuento esperado) 2 / recuento esperado.

  • donde k-1 grados de libertad o DF.
  • Donde Oi es la frecuencia observada, k son categorías y Ei es la frecuencia esperada.

Nota: - La bondad de ajuste de un modelo estadístico se refiere a la comprensión de qué tan bien se ajustan los datos de muestra a un conjunto de observaciones.

Usos

  • La solvencia de los prestatarios en función de sus grupos de edad y préstamos personales.
  • La relación entre el desempeño de los vendedores y la capacitación recibida
  • Rentabilidad de una sola acción y de acciones de un sector como el farmacéutico o bancario
  • Categoría de espectadores e impacto de una campaña televisiva.

# 2 - Prueba de chi-cuadrado para la independencia de dos variables

Se utiliza para comprobar si las variables son autónomas entre sí o no. Con (r-1) (c-1) grados de libertad

Donde Oi es la frecuencia observada, r es el número de filas, c es el número de columnas y Ei es la frecuencia esperada

Nota: - Dos variables aleatorias se denominan independientes si la distribución de probabilidad de una variable no se ve afectada por la otra.

Usos

La prueba de independencia es adecuada para las siguientes situaciones:

  • Hay una variable categórica.
  • Hay dos variables categóricas y deberá determinar la relación entre ellas.
  • Hay tabulaciones cruzadas y es necesario encontrar la relación entre dos variables categóricas.
  • Hay variables no cuantificables (por ejemplo, respuestas a preguntas como, ¿los empleados de diferentes grupos de edad eligen diferentes tipos de planes de salud?)

¿Cómo hacer la prueba de chi-cuadrado en Excel? (con ejemplo)

Puede descargar esta plantilla de Excel de prueba de chi cuadrado aquí - Plantilla de Excel de prueba de chi cuadrado

El gerente de un restaurante quiere encontrar la relación entre la satisfacción del cliente y los salarios de las personas que esperan las mesas. En esto, estableceremos la hipótesis para probar el Chi-Cuadrado

  • Ella toma una muestra aleatoria de 100 clientes preguntando si el servicio fue excelente, bueno o malo.
  • Luego, clasifica los salarios de las personas que esperan en bajos, medios y altos.
  • Suponga que el nivel de significancia es 0.05. Aquí, H0 y H1 denotan la independencia y dependencia de la calidad del servicio de los salarios de las personas que sirven las mesas.
  • H 0 - la calidad del servicio no depende de los salarios de las personas que esperan las mesas.
  • H 1 - la calidad del servicio depende de los salarios de las personas que esperan las mesas
  • Sus hallazgos se muestran en la siguiente tabla:

En esto, tenemos 9 puntos de datos, tenemos 3 grupos, cada uno de los cuales recibió un mensaje diferente sobre el salario y el resultado se da a continuación.

Ahora vamos a contar la suma de todas las filas y columnas. Haremos esto con la ayuda de la fórmula, es decir, SUM. Para sumar el Excelente en la columna de totales, hemos escrito = SUMA (B4: D4) y luego presione enter.

Esto nos dará 26 . Realizaremos lo mismo con todas las filas y columnas.

Para calcular el Grado de Libertad (DF) usamos (r-1) (c-1)

DF = (3-1) (3-1) = 2 * 2 = 4

  • Hay 3 categorías de servicio y 3 categorías de salario.
  • Tenemos 27 encuestados con un salario medio (fila inferior, centro)
  • Tenemos 51 encuestados con un buen servicio (última columna, en el medio)

Ahora tenemos que calcular las frecuencias esperadas: -

Las frecuencias esperadas se pueden calcular mediante una fórmula: -

  • Para calcular el Excelente usaremos multiplicar el total de Bajo con el total de Excelente dividido por N.

Suponga que tenemos que calcular para la primera fila y la primera columna (= B7 * E4 / B9 ) . Esto le dará el número esperado de clientes que han votado Excelente servicio para los salarios de las personas que esperan tan bajo, es decir, 8.32 .

  • E 11 = (32 * 26) / 100 = 8,32 , E 12 = 7,02 , E 13 = 10,66
  • E 21 = 16,32 , E 22 = 13,77 , E 23 = 20,91
  • E 31 = 7.36 , E 32 = 6.21 , E 33 = 9.41

De manera similar para todos, tenemos que hacer lo mismo y la fórmula se aplica en el diagrama de abajo.

Obtenemos la tabla de frecuencia esperada como se indica a continuación: -

Nota: - Suponga que el nivel de significancia es 0.05. Aquí, H0 y H1 denotan la independencia y dependencia de la calidad del servicio de los salarios de las personas que sirven las mesas.

Después de calcular la frecuencia esperada, calcularemos los puntos de datos de chi-cuadrado usando una fórmula

Puntos de chi-cuadrado = (observado-esperado) ^ 2 / esperado

Para calcular el primer punto escribimos = (B4-B14) ^ 2 / B14. 

Copiaremos y pegaremos la fórmula en otras celdas para completar el valor automáticamente.

Después de esto, calcularemos el valor chi (valor calculado) sumando todos los valores dados encima de la tabla.

Obtuvimos el valor Chi como 18,65823 .

Para calcular el valor crítico para esto, usamos una tabla de valores críticos de chi-cuadrado o podemos usar la fórmula que se proporciona a continuación.

Esta fórmula contiene 2 parámetros CHISQ.INV.RT (probabilidad, grado de libertad).

La probabilidad es 0.05, es un valor significativo que nos ayudará a determinar si aceptamos la Hipótesis Nula (H 0 ) o no.

El valor crítico de chi-cuadrado es 9.487729037.

Ahora encontraremos el valor del chi-cuadrado o (valor P) = CHITEST (rango_actual, rango_esperado)

Rango de = CHITEST (B4: D6, B14: D16) .

Como hemos visto, el valor de la prueba chi o valor P es = 0,00091723.

Como hemos visto, hemos calculado todos los valores. Los valores de chi-cuadrado (valor calculado) solo son significativos cuando su valor es igual o superior al valor crítico 9,48, es decir , el valor crítico (valor tabulado) debe ser superior al 18,65 para aceptar la hipótesis nula (H 0 ) .

Pero aquí Valor calculado > Valor tabulado

X2 (calculado)> X2 (tabulado)

18,65> 9,48

En este caso, rechazaremos la Hipótesis Nula (H 0 ) y se aceptará la Alternativa (H 1 ) .

  • También podemos usar el valor P para predecir lo mismo, es decir, si el valor P <= α (valor significativo 0.05), la hipótesis nula será rechazada
  • Si el valor P> α , no rechace la  hipótesis nula .

Aquí el valor P (0.0009172) < α (0.05), rechazar H 0 , aceptar H 1

Del ejemplo anterior, concluimos que la calidad del servicio depende de los salarios de las personas que esperan.

Cosas para recordar

  • Considera el cuadrado de una variante normal estándar.
  • Evalúa si las frecuencias observadas en diferentes categorías varían significativamente de las frecuencias esperadas bajo un conjunto específico de supuestos.
  • Determina qué tan bien se ajusta una distribución supuesta a los datos.
  • Utiliza tablas de contingencia (en las investigaciones de mercado, estas tablas se denominan tablas cruzadas).
  • Admite mediciones de nivel nominal.