Matemática
Inicio General Distribución binomial

Distribución binomial

Publicado por Laura

De vuelta al mundo del azar y la probabilidad vamos a estudiar en esta ocasión la distribución binomial.

Definición: diremos que una variable aleatoria X, presenta una distribución binomial cuando repetimos n veces en las mismas condiciones un experimento de bernouilli; que es cualquier experimento en el cual sólo hay dos posibles resultados, llamados éxito y fracaso. En ese caso diremos que X sigue una distribución binomial de parámetros, n y p, y escribiremos: X→B(n;p)

Se trata de una variable aleatoria discreta, por tanto su función de probabilidad viene dada por:

Donde k representa el número de éxitos, p representa la probabilidad de que produzca éxito, y q=1-p, es la probabilidad de que se produzca el fracaso.

Un buen ejemplo de esta distribución es lanzar 100 veces una moneda y estudiar el número de caras, es evidente que estamos repitiendo un mismo experimento 100 veces, donde p = ½.

Propiedades:

1. La esperanza o media de una variable aleatoria binomial es el tamaño por la probabilidad del éxito: E[X]=n•p.

2. La varianza de una variable aleatoria binomial es el tamaño por la probabilidad del éxito y por la probabilidad del fracaso: Var(x)= n•p•q= n•p•(1-p). La desviación típica es la raíz de la varianza.

Para poder calcular una probabilidad, al igual que con la normal, también disponemos de unas tablas pudiendo utilizar bien la fórmula o bien la tabla, P(X=k). Además debemos tener cuidado, porque también puede ser que en alguna ocasión nos pidan calcular una probabilidad acumulada, es decir, P(X≤k).

Veamos un ejemplo de esta distribución y como podemos calcular una probabilidad mediante la fórmula, o por el contrario usando las tablas (lo cual resulta mucho más cómodo, por supuesto).

Ejemplo: La probabilidad de recibir un correo spam en un día es del 15%. Si un día recibimos 5 correos:

a) Calcula la probabilidad de que 3 de ellos sean spam.

b) Calcula la probabilidad de recibir más de 4 correos de tipo spam.

En primer lugar definimos la variable aleatoria y la distribución que sigue:

X=”Número de correos de tipo spam en un día”

n=5

p= P(recibir un correo spam)=0,15

Por tanto X→B(5; 0,15)

a) Tenemos que calcular: P(X=3)

– Utilizando la fórmula:

– Utilizando la tabla:

En primer lugar, nos fijamos en la columna de la izquierda que nos indica la n, y nos vamos hasta el n=5. Dentro de esa fila, hay una nueva columna que nos indica k, y elegimos la fila donde k=3. A continuación nos vamos a la primera fila donde nos da las probabilidades (p) y elegimos la columna donde p=0,15, tal y como se muestra en la imagen:

Por tanto P(X=3)=0,0244

b) Tenemos que calcular P(X>4)= 1- P(X≤4)

-Utilizando al fórmula:

P(X>4)=1-[P(X=0)+P(X=1)+P(X=2)+P(X=3)+P(X=4)]

Teniendo que aplicar la formula en cada caso.

-Utilizando la tabla:

Cojamos ahora la tabla de la distribución acumulada: P(X≤x), y para buscar el número se procede de las misma forma que en el apartado a).

P(x>4)= 1- P(X≤4)=1- 0,9999=0,0001

Además, cuando el tamaño es lo suficientemente grande (n≥30), realizar algunos cálculos será muy difícil y costoso. Frente a esta situación utilizamos el teorema central del límite, que nos permite aproximar la distribución binomial a una más fácil y manejable como es la distribución normal.

Si X→B(n,p), ya hemos visto que E[X]=np y Var(X)=npq, por tanto, podemos decir:

X→N(np; √npq)

Dependiendo del nivel en el que estemos, deberemos llevar mucho cuidado, ya que como estamos pasando de una distribución discreta a una continua, tendremos que aplicar la corrección por continuidad.