jueves, 28 de febrero de 2013

Distribucion Normal de la probabilidad


DISTRIBUCIÓN NORMAL DE PROBABILIDAD
¿Qué es la distribución normal?

La Distribución Normal: una distribución de una variable aleatoria continua.
  Una muy importante distribución continua de probabilidad es la distribución normal. Varios matemáticos intervinieron en su desarrollo entre ellos figura el astrónomo del siglo XVIII Karl Gauss, a veces es llamada en sus honor la distribución de Gauss.
  
Características de la distribución normal de la probabilidad.
  
1. La curva tiene un solo pico, por consiguiente es unimodal. (Presenta una forma de campana).

2. La media de una población distribuida normalmente se encuentra en el centro de su curva normal.
3. A causa de la simetría de la distribución normal de probabilidad, la mediana y la moda de la distribución también se hallan en el centro, por tanto en una curva normal, la media, la mediana y la moda poseen el mismo valor.
4. Las dos colas (extremos) de una distribución normal de probabilidad se extienden de manera indefinida y nunca tocan el eje horizontal.
Áreas bajo la curva normal.


El área total bajo la curva normal será de 1.00 por lo cual podemos considerar que las áreas bajo la curva son probabilidades.

El valor de Z.

  
Z= Número de desviaciones estándar de x respecto a la media de esta distribución.
 
 
Z= x-m / s
 
 
X=valor de la variable aleatoria que nos interesa.
m= media de la distribución de esta variable aleatoria.
s = desviación estándar de esta distribución.
 
 
Las variables aleatorias distribuidas en forma normal asumen muchas unidades diferentes de medición, por lo que hablaremos de forma estándar y les daremos el símbolo de Z.



DISTRIBUCIÓN NORMAL
La distribución normal es también un caso particular de probabilidad de variable aleatoria contínua, fue reconocida por primera vez por el francés Abraham de Moivre (1667-1754).  Posteriormente, Carl Friedrich Gauss (1777-1855) elaboró desarrollos más profundos y formuló la ecuación de la curva; de ahí que también se le conozca, más comúnmente, como la "campana de Gauss".  La distribución de una variable normal está completamente determinada por dos parámetros, su media (µ) y su desviación estándar (σ). Con esta notación, la densidad de la normal viene dada por la ecuación:
que determina la curva en forma de campana que tan bien conocemos
Existen dos razones básicas por las cuales la distribución normal ocupa un lugar tan prominente en la estadística:
·         Tiene algunas propiedades que la hacen aplicable a un gran número de situaciones en la que es necesario hacer inferencias mediante la toma de muestras.
·         La distribución normal casi se ajusta a las distribuciones de frecuencias reales observadas en muchos fenómenos, incluyendo características humanas, resultados de procesos físicos y muchas otras medidas de interés para los administradores, tanto en el sector público como en el privado.
Propiedad:
No importa cuáles sean los valores de µ y σ para una distribución de probabilidad normal, el área total bajo la curva siempre es 1, de manera que podemos pensar en áreas bajo la curva como si fueran probabilidades. Matemáticamente es verdad que:
1.   Aproximadamente el 68% de todos los valores de una población normalmente distribuida se encuentra dentro de ± 1 desviación estándar de la media.
2.   Aproximadamente el 95.5% de todos los valores de una población normalmente distribuida se encuentra dentro de ± 2 desviaciones estándar de la media.
3.   Aproximadamente el 99.7% de todos los valores de una población normalmente distribuida se encuentra dentro de ± 3 desviaciones estándar de la media.


Relación entre el área bajo la curva de distribución normal de probabilidad y la distancia a la media medida en desviaciones estándar.
Estas gráficas muestran tres formas diferentes de medir el área bajo la curva normal. Sin embargo, muy pocas de las aplicaciones de la distribución normal de probabilidad implican intervalos de exactamente (más o menos) 1, 2 ó 3 desviaciones estándar a partir de la media. Para estos casos existen tablas estadísticas que indican porciones del área bajo la curva normal que están contenidas dentro de cualquier número de desviaciones estándar (más o menos) a partir de la media.
Afortunadamente también se puede utilizar una distribución de probabilidad normal estándar para encontrar áreas bajo cualquier curva normal. Con esta tabla se determina el área o la probabilidad de que la variable aleatoria distribuida normalmente esté dentro de ciertas distancias a partir de la media. Estas distancias están definidas en términos de desviaciones estándar.
Para cualquier distribución normal de probabilidad, todos los intervalos que contienen el mismo número de desviaciones estándar a partir de la media contendrán la misma fracción del área total bajo la curva para cualquier distribución de probabilidad normal. Esto hace que sea posible usar solamente una tabla de la distribución de probabilidad normal estándar.
El valor de z está derivado de la fórmula:





En la que:
·         x = valor de la variable aleatoria de interés.
·         µ = media de la distribución de la variable aleatoria.
·         σ = desviaciσn estándar de la distribución.
·         z = número de desviaciones estándar que hay desde x a la media de la distribución. (El uso de z es solamente un cambio de escala de medición del eje horizontal)
Distribución normal que ilustra la comparación de los valores de z y las desviaciones estándar.
Calculo de la distribución de probabilidad Normal por los métodos:
a) Utilización de las tablas de la distribución Normal.
b) Utilización del Minitab 15.
a) Cálculo de la distribución de probabilidad Normal utilizando las tablas de distribución de probabilidad normal estándar
Ejemplo:
Hay un programa de entrenamiento diseñado para mejorar la calidad de las habilidades de supervisión de los supervisores de la línea de producción. Debido a que el programa es auto-administrado, los supervisores requieren un número diferente de horas para terminarlo. Un estudio de los participantes anteriores indica que el tiempo medio que se lleva completar el programa es de 500 horas, y que esta variable aleatoria normalmente distribuida tiene una desviación estándar de 100 horas.
a) ¿Cuál es la probabilidad de que un candidato elegido al azar requiera más de 500 horas para completar el programa de entrenamiento?
b) ¿Cuál es la probabilidad de que un candidato elegido al azar se tome entre 500 y 650 horas en completar el programa de entrenamiento?
Resolviendo para:








Buscar Z = 1.50 en la tabla distribución de probabilidad normal estándar.
Encontrando una probabilidad de 0.4332.
Por lo tanto, la probabilidad de que un candidato escogido al azar requiera entre 500 y 650 horas para terminar el programa de entrenamiento es de 0.4332 es decir un 43.32%.

EJERCICIOS


1. Sea Z una variable aleatoria que sigue una distribución  N (0 , 1 ). Halla las siguientes probabilidades:
a.      P(Z ≥ 0.32)
b.      P(Z ≤ 0)
c.      P ( Z > 0.7 )
d.      P ( -0.51 ≤ Z ≤  0.51)
e.      P [ Z ≤  - 1.45 ]
f.       P [ Z > - 2.63]

2. En una distribución normal  N ( 5, 2 )  calcula las siguientes probabilidades:
a.      P ( X ≤ 3.25)
b.      P [ X > 4.5 ]
c.      P [X ≤  7.2]
d.      P [ 3 < X ≤  6]



3. El tiempo necesario para que una ambulancia llegue a un centro sanitario se distribuye según una variable normal de media 17 minutos y desviación típica 3 minutos. Calcula la probabilidad de que el tiempo de llegada esté comprendido entre 13 y 21 minutos. ¿Cuánto tiempo se espera que tarde la ambulancia en llegar? ¿ Para qué valor de t, la probabilidad de que el tiempo de llegada sea superior a t es del 5%?


4. Un estudio antropológico de una tribu del centro de África ha constatado que la longitud del dedo corazón de los adultos sigue una ley normal de media 60 mm y varianza 9 mm. Si hay 800 adultos en esa tribu, determina cuántos tienen el dedo corazón:
               a) Más largo de 62 mm                   
               b) Más corto de 57 mm.                           
               c) Entre 60 y 66 mm.


5. El peso teórico de la tableta de cierto medicamento es de 234 mg. Si suponemos que los pesos  de la tabletas tienen una desviación típica de 10 mg por tableta y que se distribuyen normalmente,
a.      ¿Cuál será el tanto por ciento de tabletas con peso menor o igual a 210 mg?
b.      ¿Cuál será el tanto por ciento de tabletas con peso superior a 240 mg?


6.El tiempo de vida de una bombilla sigue una distribución normal N(180, 15), donde el tiempo se mide en horas. ¿Cuál es la probabilidad de que al comprar una bombilla, luzca más de 195 horas? ¿ Y menos de 170?


7. Un laboratorio farmacéutico prepara pastillas circulares con un diámetro medio de 12 mm y una desviación típica de 0,8 mm, pero si la pastilla fabricada tiene un diámetro inferior a 9.5 mm o superior a 14.7 mm, ésta se rechaza por no tener la cantidad adecuada de medicamento. Sabemos además que el diámetro sigue una distribución normal. ¿Cuál es la probabilidad de que al fabricar una pastilla, ésta esté en condiciones de ser utilizada?

APLICACIONES:
Veamos a continuación cómo se puede emplear la distribución normal para aproximar una distribución binomial lo que facilita los cálculos en ésta, y por último un ejemplo de ajuste a una normal.
 1. APROXIMACIÓN DE UNA DISTRIBUCIÓN BINOMIAL POR UNA NORMAL




Una distribución binomial B(n,p) se parece a una normal tanto más cuanto mayor es el producto np (o nq si q<p, siendo q=1-p). Cuando np y nq superan 5, la aproximación es casi perfecta, como se puede apreciar en la figura.
En estas condiciones:

B(n,p) se aproxima a 

Podemos emplear la normal para calcular probabilidades en el caso de una distribución binomial, aunque hemos de tener en cuenta que la binomial es discreta y la normal continua, por lo que es necesario introducir un ajuste en el cálculo llamado corrección de Yates. Así:
p(X£x) = p(X'£x+0,5)          p(X<x) = p(X'£x-0.5)           p(X=x) = p(x-0,5£X'£ x+0,5)

Ejemplos: 

1) El 35% de una población está afectado por la gripe. Se eligen 30 personas al azar.
Se trata de una B(30;0,35) que aproximamos por N(10,5;2,61)
Calcula la probabilidad de que:
  • haya exactamente 10 enfermos
P(X=10) = P(9,5 £ X' £ 10,5)
  • haya más de 5 y menos de 12 enfermos
P(5<X<12) = P(5,5£X'£11,5)

2) Se lanza una moneda 200 veces, calcula la probabilidad de que aparezca cara al menos 100 veces.¿Cuál es la probabilidad de que aparezcan 90 caras?


2. AJUSTE DE UN CONJUNTO DE DATOS A UNA NORMAL
Con frecuencia conviene saber si puede suponerse que una serie de datos obtenidos experimentalmente proceden de una población distribuida normalmente.
Recordemos que en una distribución normal:
  • el 68% de los datos está en el intervalo (x-s, x+s)
  • el 95% de los datos está en el intervalo (x-2s, x+2s)
  • el 99% de los datos está en el intervalo (x-3s, x+3s)
Si calculadas la media x y la desviación típica s de nuestros datos, se cumplen aproximadamente estos porcentajes podemos considerar que la población de partida es normal. 
Veamos un ejemplo en el que seguimos un proceso un poco más elaborado:
Ejemplo
La tabla adjunta muestra la altura en cm de 100 estudiantes. ¿Es razonable suponer que estos resultados proceden de una distribución normal?

 ES IMPORTANTE RECORDAR:
  • Recuerda cómo se calcula la media y la desviación típica.
  • Dibujamos el histograma de la distribución.
  • Observa que el perfil del histograma recuerda a la curva normal.

    xa
    xb
    xifi
    xfi
    xifi
    155160157,581260   198450   
    160165162,5142275   369687,5
    165170167,5223685   617237,5
    170175172,5284830   833175   
    175180177,5162840   504100   
    180185182,581460   266450   
    185190187,54750   140625   
     10017100   2929725   
    media 
    x= 171
     desviación típica 
    s= 7,50
    Histograma 












    b) Comparamos la distribución empírica con la normal N((x,s) en este caso con la N(171;7,5).
    • Tipificamos los extremos de cada intervalo y calculamos en cada caso


      P(xa<x£xb)=P(za<z£zb)

      xa
      xb
      fri
      za
      zb
      p(X<xa)
      p(X<xb)
      p(xa<X<xb)
      1551600,08-2,13-1,470,01640,07120,05
      1601650,14-1,47-0,800,07120,21190,14
      1651700,22-0,80-0,130,21190,44700,24
      1701750,28-0,130,530,44700,70310,26
      1751800,160,531,200,70310,88490,18
      1801850,081,201,870,88490,96900,08
      1851900,041,872,530,96900,99440,03
      mediax= 171
      desv. típicas=7,50

Comparamos las probabilidades obtenidas con las frecuencias relativas y evaluamos las diferencias. En este caso, parecen suficientemente pequeñas como para aceptar que los datos provienen efectivamente de una distribución normal. 
Fíjate que este último paso es totalmente subjetivo, aunque existen métodos estadísticos con los que tomar esta decisión de forma más precisa.