Distribución Chi Cuadrado

Una desviación normal estándar es una muestra aleatoria de la distribución normal estándar. La distribución Chi cuadrado es la distribución de la suma de desviaciones normales estándar al cuadrado. Los grados de libertad de la distribución son iguales al número de desviaciones normales estándar que se suman.

Indice de Contenido

¿Qué es una prueba de Chi cuadrado?

Hay dos tipos de pruebas de chi-cuadrado. Ambas usan la estadística chi-cuadrado y la distribución para diferentes propósitos:

  • Una prueba de bondad de ajuste de chi-cuadrado determina si los datos de una muestra coinciden con una población. Para obtener más detalles sobre este tipo, consulte: Prueba de bondad de ajuste.
  • Una prueba de chi-cuadrado para la independencia compara dos variables en una tabla de contingencia para ver si están relacionadas. En un sentido más general, prueba para ver si las distribuciones de variables categóricas difieren entre sí.
  • La estadística de prueba de chi cuadrado muy pequeña significa que los datos observados se ajustan muy bien a sus datos esperados. En otras palabras, hay una relación.
  • Una estadística de prueba de chi cuadrado muy grande significa que los datos no se ajustan muy bien. En otras palabras, no hay una relación.

¿Qué es una estadística de chi-cuadrado?

La fórmula para la estadística de chi cuadrado utilizada en la prueba de chi cuadrado es:

distribución chi cuadrado

El subíndice «c» son los grados de libertad. «O» es su valor observado y E es su valor esperado. Es muy raro que desee utilizar esta fórmula para encontrar un valor crítico de chi-cuadrado a mano. El símbolo de suma significa que deberá realizar un cálculo para cada elemento de datos en su conjunto de datos. Como probablemente pueda imaginar, los cálculos pueden ser muy, muy largos y tediosos. Por esto te invitamos a descargar nuestro formato Excel.

Una estadística de chi-cuadrado es una forma de mostrar una relación entre dos variables categóricas. En estadística, hay dos tipos de variables: variables numéricas (contables) y variables no numéricas (categóricas). La estadística de chi cuadrado es un número único que le indica cuánta diferencia existe entre sus conteos observados y los conteos que esperaría si no hubiera ninguna relación en la población.

Hay algunas variaciones en la estadística de chi-cuadrado. Cuál usas dependerá de cómo recopilaste los datos y qué hipótesis se está probando. Sin embargo, todas las variaciones utilizan la misma idea, que es que está comparando sus valores esperados con los valores que realmente recopila. Una de las formas más comunes se puede usar para tablas de contingencia:

distribución chi cuadrado

Donde O es el valor observado, E es el valor esperado e «i» es la posición «i-ésima» en la tabla de contingencia.

Un valor bajo para chi-cuadrado significa que existe una alta correlación entre sus dos conjuntos de datos. En teoría, si sus valores observados y esperados fueran iguales («sin diferencia»), entonces chi-cuadrado sería cero, un evento que es poco probable que ocurra en la vida real.

Decidir si una estadística de prueba de chi-cuadrado es lo suficientemente grande como para indicar una diferencia estadísticamente significativa no es tan fácil como parece. Sería bueno si pudiéramos decir que una estadística de prueba de chi-cuadrado> 10 significa una diferencia, pero desafortunadamente ese no es el caso.

Puedes tomar tu valor de chi-cuadrado calculado y compararlo con un valor crítico de una tabla de chi-cuadrado. Si el valor de chi-cuadrado es más que el valor crítico, entonces hay una diferencia significativa.

También podrías usar un valor p. Primero establezca la hipótesis nula y la hipótesis alternativa. Luego, genere una curva de chi-cuadrado para sus resultados junto con un valor p (consulte: Calcular un valor p de chi-cuadrado Excel). Los valores p pequeños (menos del 5%) generalmente indican que una diferencia es significativa (o «lo suficientemente pequeña»).

Consejo: La estadística Chi-cuadrado solo se puede usar en números. No se pueden usar para porcentajes, proporciones, medias o valores estadísticos similares. Por ejemplo, si tiene el 10 por ciento de 200 personas, necesitaría convertirlo a un número (20) antes de poder ejecutar una estadística de prueba.

Distribución Chi cuadrado

La distribución de la estadística de chi-cuadrado se llama distribución chi-cuadrado. En esta lección, aprendemos a calcular la estadística de chi-cuadrado y a encontrar la probabilidad asociada con la estadística. Y trabajaremos con algunos ejemplos de chi-cuadrado para ilustrar puntos clave.

Supongamos que realizamos el siguiente experimento estadístico. Seleccionamos una muestra aleatoria de tamaño n de una población normal, que tiene una desviación estándar igual a σ. Encontramos que la desviación estándar en nuestra muestra es igual a s. Dados estos datos, podemos definir una estadística, llamada chi-cuadrado, usando la siguiente ecuación:

distribución chi cuadrado

La distribución de la estadística de chi-cuadrado se llama distribución de chi-cuadrado. La distribución de chi-cuadrado se define por la siguiente función de densidad de probabilidad:

distribución chi cuadrado

donde Y0 es una constante que depende del número de grados de libertad, Χ2 es la estadística de chi-cuadrado, v = n – 1 es el número de grados de libertad, y e es una constante igual a la base del sistema de logaritmo natural (aproximadamente 2.71828). Y0 está definido, de modo que el área bajo la curva de chi-cuadrado es igual a uno.

La distribución chi-cuadrado tiene las siguientes propiedades:

  • La media de la distribución es igual al número de grados de libertad: μ = v.
  • La varianza es igual a dos veces el número de grados de libertad: σ2 = 2 * v
  • Cuando los grados de libertad son mayores o iguales a 2, el valor máximo para Y ocurre cuando Χ2 = v – 2.
  • A medida que aumentan los grados de libertad, la curva de chi-cuadrado se aproxima a una distribución normal.

Probabilidad acumulativa y la distribución chi cuadrado

La distribución chi cuadrado se construye de modo que el área total debajo de la curva sea igual a 1. El área debajo de la curva entre 0 y un valor de chi-cuadrado particular es una probabilidad acumulativa asociada con ese valor de chi cuadrado.

Deja un comentario

Scroll al inicio
Ir arriba