Distribución Hipergeométrica

En estadística se conoce la función de distribución en la que las selecciones se realizan a partir de dos grupos sin reemplazar a los miembros de estos. La distribución hipergeométrica a menudo se emplea en el muestreo aleatorio para el control estadístico de calidad.

¿Qué es la distribución hipergeométrica?

La distribución hipergeométrica es una distribución discreta que modela el número de eventos en un tamaño de muestra fijo cuando se conoce el número total de elementos en la población de la que proviene la muestra.

Cada elemento de la muestra tiene dos resultados posibles (ya sea un evento o un no evento). Las muestras no tienen reemplazo, por lo que cada elemento de la muestra es diferente. Cuando se elige un elemento de la población, no se puede volver a elegir. Por lo tanto, la probabilidad de que un elemento sea seleccionado aumenta en cada prueba, suponiendo que aún no se haya seleccionado.

Puedes usar la distribución hipergeométrica para muestras extraídas de poblaciones relativamente pequeñas, sin reemplazo. Por ejemplo, la distribución hipergeométrica se usa en la prueba exacta de Fisher para probar la diferencia entre dos proporciones, y en el muestreo de aceptación por atributos para el muestreo de un lote aislado de tamaño finito.

La distribución hipergeométrica se define mediante 3 parámetros: tamaño de la población, recuento de eventos en la población y tamaño de la muestra.

Por ejemplo, si recibes un envío de pedido especial de 500 etiquetas. Supón que el 2% de las etiquetas son defectuosas. El recuento de eventos en la población es 10 (0.02 * 500). Muestra 40 etiquetas y deseas determinar la probabilidad de 3 o más etiquetas defectuosas en esa muestra. La probabilidad de que 3 de las etiquetas más defectuosas en la muestra es 0.0384.

La diferencia entre las distribuciones hipergeométrica y binomial

Tanto la distribución hipergeométrica como la distribución binomial describen el número de veces que ocurre un evento en un número fijo de ensayos. Para la distribución binomial, la probabilidad es la misma para cada ensayo. Para la distribución hipergeométrica, cada prueba cambia la probabilidad de cada prueba posterior porque no hay reemplazo.

Utiliza la distribución binomial con poblaciones tan grandes que el resultado de un ensayo casi no tiene efecto sobre la probabilidad de que el próximo resultado sea un evento o no evento. Por ejemplo, en una población de 100,000 personas, 53,000 tienen sangre O +. La probabilidad de que la primera persona seleccionada al azar en una muestra tenga sangre O + es 0.530000. Si la primera persona en una muestra tiene sangre O +, entonces la probabilidad de que la segunda persona tenga sangre O + es 0.529995.

La diferencia entre estas probabilidades es lo suficientemente pequeña como para ignorarla en la mayoría de sus aplicaciones.

Si usas la distribución hipergeométrica con poblaciones que son tan pequeñas que el resultado de un ensayo tiene un gran efecto en la probabilidad de que el próximo resultado sea un evento o no evento. Por ejemplo, en una población de 10 personas, 7 personas tienen sangre O +. La probabilidad de que la primera persona seleccionada al azar en una muestra tenga sangre O + es 0.70000. Si la primera persona en la muestra tiene sangre O +, entonces la probabilidad de que la segunda persona tenga sangre O + es 0.66667.

La diferencia puede aumentar a medida que aumenta el tamaño de la muestra. La diferencia entre estas probabilidades es demasiado grande para ignorarla en muchas aplicaciones.

¿Cuándo usamos la distribución hipergeométrica?

La distribución hipergeométrica es una distribución de probabilidad discreta. Se utiliza cuando deseas determinar la probabilidad de obtener un cierto número de éxitos sin reemplazar un tamaño de muestra específico. Esto es similar a la distribución binomial, pero esta vez no se le da la probabilidad de un solo éxito. Algunas situaciones de ejemplo para aplicar esta distribución son:

La probabilidad de obtener 3 espadas en una mano de 5 cartas en el póker.
La probabilidad de atraer 60% de niños para la clase de primer año de un grupo mixto de género seleccionado al azar en una lotería de admisiones de escuelas charter.

¿Qué parámetros (información) necesitamos para los cálculos hipergeométricos?

Para calcular la función de masa de probabilidad (también conocida como una sola instancia) de una distribución hipergeométrica, necesitamos:

a) El número total de elementos de los que estamos extrayendo (llamado N).
b) El número total de elementos deseados en N (llamado A).
c) El número de sorteos de N que haremos (llamado n).
d) El número de elementos deseados en nuestro sorteo de n elementos (llamado x).

Se utilizan diferentes letras para estas variables según la plantilla que utilices.

Descarga Plantilla en Formato Excel para Distribución Hipergeométrica

TAMBIEN TE PUEDEN INTERESAR

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Ir arriba