DISTRIBUCIONES DE PROBABILIDAD
CONTINUAS
Entre las distribuciones a tratar en esta unidad serían:
- Distribución Normal
- Aproximación de la Normal a la Binomial
- Exponencial
- DISTRIBUCIÓN NORMAL.
Características:
a) Es generada por una variable de tipo continuo, denominada x;
-¥< x < ¥
b) La función que nos define esta distribución es:
Al dar a la función los valores de m , s2 y valores a x,
obtendremos la distribución
en cuestión, la que tiene forma de campana, por lo que también se le conoce
como campana de Gauss. Hay un número infinito de funciones de densidad Normal,
una para cada combinación de m y s. La media m mide la ubicación de la distribución y la desviación estándar s mide su dispersión.
c) Es simétrica con respecto a su eje
vertical.
d) Es asintótica con respecto a su eje
horizontal; esto quiere decir que jamás va a tocar el eje de las equis.
e) El área total bajo la curva es 1.
f) Sí sumamos a m ± s, se observará que aproximadamente el 68.26% de
los datos
se encuentran bajo la curva, si
sumamos a m ± 2s, el 95.44% de los datos estará
entre esos límites y si sumamos a m ± 3s, entonces el 99.74% de los datos
caerá dentro de esos límites. Esta característica es a la vez una forma
empírica y rápida de demostrar si los datos que se analizan tienen una
distribución Normal; ya que para trabajar los datos con esta distribución, debe
verificarse que efectivamente así se distribuyen, ya que de no hacerlo, las
decisiones que en un momento dado se tomarán de un análisis de los datos con la
distribución Normal, serían erróneas.
¿Cómo se determinan probabilidades con
la distribución Normal?
De acuerdo a como se trataron las
distribuciones de probabilidad continuas en la unidad III, lo más lógico es que
la función f(x, m, s2), se integre entre los
límites de la variable x; esto es,
La integral anterior nos daría el área
bajo la curva de la función, desde a hasta b, que corresponde o es igual a la
probabilidad buscada.
Debido a la dificultad que se presenta
para integrar esta función cada vez que sea necesario, lo que se hace es
tipificar el valor de la variable x, esto es, x se transforma en un valor de z,
de la siguiente manera:
Este valor de z es buscado en una tabla
donde vienen áreas asociadas a este valor, y haciendo uso de los valores
tabulados, se determina la probabilidad requerida. La tabla que es usada para
calcular las probabilidades es la que nos dá el área que se muestra a
continuación:
Ejemplos:
1. El acero que se utiliza para tuberías de agua a
menudo se recubre internamente con un mortero de cemento para evitar la
corrosión. En un estudio de los recubrimientos de mortero de una tubería
empleada en un proyecto de transmisión de agua en California (Transportation
Engineering Journal, Noviembre de 1979) se especificó un espesor de 7/16
pulgadas para el mortero. Un gran número de mediciones de espesor dieron una
media de 0.635 pulgadas y una
desviación estándar de 0.082 pulgadas. Sí las mediciones de espesor, tenían una
distribución Normal, ¿qué porcentaje aproximado fue inferior a 7/16 de pulgada?
Solución:
x =
variable que nos define el espesor del mortero en pulgadas
m = 0.635 pulgadas
s = 0.082 pulgadas
p(z =
-2.41) = 0.492
p(x < 7/16 pulgadas) = 0.5- p(z = -2.41) = 0.5-0.492 =
0.008
Por
tanto, 0.008 x 100% = 0.8% de los recubrimientos de mortero tienen un espesor
menor de 7/16 pulgadas
- APROXIMACIÓN DE LA NORMAL A LA BINOMIAL.
En este caso se estarán calculando
probabilidades de experimentos Binomiales de una forma muy aproximada con la
distribución Normal, esto puede llevarse a cabo si n¥® y p = p(éxito) no es muy cercana a 0 y 1, o cuando n es
pequeño y p tiene un valor muy cercano a ½ ; esto
es,
Donde:
x =
variable de tipo discreto; solo toma valores enteros
m = np = media de la distribución Binomial
s =
= desviación estándar de la distribución Binomial
Cuando
ocurren las condiciones anteriores, la gráfica de la distribución Binomial, es
muy parecida a la distribución Normal, por lo que es adecuado calcular
probabilidades con la Normal en lugar de con la Binomial y de una forma más
rápida.
En
resumen, se utiliza la aproximación Normal para evaluar probabilidades
Binomiales siempre que p no esté cercano a0 o 1. La
aproximación es excelente cuando n es grande y bastante buena para
valores pequeños de n si p está razonablemente cercana a ½.
Una posible guía para determinar cuando puede utilizarse la aproximación Normal
es tener en cuenta el cálculo de np y nq.
Sí ambos, np y nq son mayores o iguales a 5, la
aproximación será buena.
Antes de
empezar a resolver problemas con la aproximación Normal, es bueno aclarar que
se están evaluando probabilidades asociadas a una variable discreta x, con una
distribución que evalúa
variables de tipo continuo como es la Normal,
Por lo
que z sufre un pequeño cambio como se muestra a continuación:
¿Porqué
vamos a sumar o a restar ½ a x?
Este es
un factor de corrección debido a que se está evaluando una variable discreta
con una distribución continua, por lo que hay que delimitar claramente desde
que punto se va a evaluar la variable, dicho de otra forma, en que límite de la
barra (inferior o superior) nos debemos posicionar para determinar la
probabilidad requerida, cada barra de probabilidad a evaluar tiene como base la
unidad, ese es el porqué del ± ½.
Ejemplos:
1. La probabilidad de que un paciente se recupere de
una rara enfermedad de la sangre es de 0.4. Si se sabe que 100 personas han
contraído esta enfermedad, ¿Cuál es la probabilidad de que: a) al menos 30
sobrevivan?, b) más de 46 sobrevivan?, c) menos de 50 no sobrevivan?
Solución:
a)
n = 100
p =
p(paciente se recupere) = 0.40
q =
p(paciente no se recupere) = 1 – p = 1 – 0.40 = 0.60
m = np = (100)(0.40) = 40 pacientes se
recuperen
s =
=
pacientes que se
recuperan
x =
variable que nos define el número de pacientes que se recuperan
x = 0, 1,
2,....,100 pacientes que se recuperan
|
|
p( z =
-2.14) =0.4838
p(x ³ 30 ) = p(z = -2.14) +0.5 = 0.4838 + 0.5 = 0.9838
a)
p(z =
1.33) = 0.4082
p(x > 46) = 0.5 – p(z = 1.33) = 0.5 – 0.4082 = 0.0918
b) n = 100
p =
p(paciente no sobreviva) = 0.60
q =
p(paciente sobreviva) = 1 – p = 0.40
x =
variable que nos define el número de pacientes que no sobreviven
x = 0, 1,
2, ....,100
p( z =
-2.14) = 0.4838
p(x < 50) = 0.5 – p(z = -2.14) = 0.5 – 0.4838 = 0.0162
DISTRIBUCIÓN EXPONENCIAL.
A pesar
de que la distribución Normal puede utilizarse para resolver muchos problemas
en ingeniería y ciencias, existen aún numerosas situaciones que requieren
diferentes tipos de funciones de densidad, tales como la exponencial y la gamma
y algunas otras como la weibull, etc., etc., de momento solo trataremos sobre
el uso de la exponencial.
Resulta que la exponencial es un caso
especial de la distribución gamma, ambas tienen un gran número de aplicaciones.
Las distribuciones exponencial y gamma juegan un papel importante tanto en
teoría de colas como en problemas de confiabilidad. El tiempo entre las
llegadas en las instalaciones de servicio y el tiempo de falla de los
componentes y sistemas eléctricos, frecuentemente involucran la distribución
exponencial. La relación entre la gamma y la exponencial permite que la
distribución gamma se utilice en tipos similares de problemas.
La variable aleatoria x tiene una distribución exponencial,
con parámetro b, si su función de densidad es:
donde b > 0
La media y la variancia de la
distribución exponencial son:
m = b y s2 = b2
Relación con el proceso de Poisson.
Las aplicaciones más importantes de la
distribución exponencial son aquellas situaciones en donde se aplica el proceso
de Poisson , es necesario recordar que un proceso de Poisson permite el uso de
la distribución de Poisson. Recuérdese también que la distribución de Poisson se
utiliza para calcular la probabilidad de números específicos de “eventos”
durante un período o espacio particular. En muchas aplicaciones, el período o
la cantidad de espacio es la variable aleatoria. Por ejemplo un ingeniero
industrial puede interesarse en el tiempo T entre llegadas en una intersección
congestionada durante la hora de salida de trabajo en una gran ciudad. Una
llegada representa el evento de Poisson.
La relación entre la distribución
exponencial (con frecuencia llamada exponencial negativa) y el proceso llamado
de Poisson es bastante simple. La distribución de Poisson se desarrolló como
una distribución de un solo parámetro l, donde l puede interpretarse como el número promedio de eventos por unidad de
“tiempo” . Considérese ahora la variable aleatoria descrita por el tiempo que
se requiere para que ocurra el primer evento. Mediante la distribución de
Poisson, se encuentra que la probabilidad de que no ocurran en el espacio hasta
el tiempo t está dada por:
Ahora puede utilizarse lo anterior y hacer que X sea el tiempo para el
primer evento de Poisson. La probabilidad de que el período hasta que ocurre el
primer evento de Poisson exceda x es la misma que la probabilidad de que
no ocurra un evento de Poisson en x.
Esto último por supuesto está dado por
. Como resultado,
P(X ³ x) =
Entonces, la función de distribución
acumulada para x es:
P(0£ X £ x) = 1 -
Ahora, con objeto de que se reconozca la
presencia de la distribución exponencial, puede derivarse la distribución
acumulada anterior para obtener la función de densidad:
f(x) =
La cual es la función de densidad de la
distribución exponencial con
.
Nótese que la media de la distribución
exponencial es el parámetro
, el recíproco del
parámetro en la distribución de Poisson. El lector debe recordar que con
frecuencia se dice que la distribución de Poisson no tiene memoria, lo cuál
implica que las ocurrencias en períodos de tiempo sucesivos son independientes.
Aquí el parámetro importante
es el tiempo
promedio entre eventos. En teoría de la confiabilidad, donde la falla de un equipo concuerda
con el proceso de Poisson,
recibe el nombre
de tiempo promedio entre fallas. Muchas descomposturas de equipo siguen el
proceso de Poisson, y entonces la distribución exponencial es aplicable.
En el siguiente ejemplo se muestra una
aplicación simple de la distribución exponencial en un problema de
confiabilidad. La distribución binomial también juega un papel importante en la
solución.
Ejemplos:
- Suponga que un sistema contiene cierto tipo de componente cuyo
tiempo de falla en años está dado por la variable aleatoria T, distribuida
exponencialmente con tiempo promedio de falla
Solución:
La probabilidad de que un determinado
componente esté funcionando aún después de 8 años es:
Sea x el número de componentes funcionando
después de 8 años. Entonces mediante la distribución Binomial,
n = 5
p = 0.20 = probabilidad de que un
componente esté funcionando después de 8 años
q = 1-p = 0.80 = probabilidad de que un
componente no funcione después de 8 años
P(x ³ 2 ) = p(x=2) + p(x=3) + p(x=4)+p(x=5) = 1 – p(x = 0, 1)
=1-0.7373=0.2627