¿Necesitas clases particulares?
Conecta con un profesor particular personalizado para ti.
Conecta con un profesor particular personalizado para ti.
La distribución normal es, sin duda, la distribución de probabilidad más importante que trabajaremos. Es una distribución de probabilidad asociada a variables continuas que tienden a agruparse alrededor de su media, debido a su forma se denomina Campana de Gauss.
Queda definida mediante dos parámetros: la media y la desviación estándar o desviación típica
. Su gráfica es simétrica respecto a la media y la desviación estándar nos indica el mayor o menor grado de apertura de la curva. Esta distribución se expresa como
La función cumple las siguientes propiedades:
Aunque la variable puede tomar cualquier valor entre (–∞, +∞) la probabilidad de que tome valores alejados de la media es prácticamente nula.
Cuando la distribución normal tiene como parámetros y
recibe el nombre de distribución normal estándar.
Cualquier variable X que siga una distribución normal de parámetros m y s se puede transformar en otra variable que sigue una distribución normal estándar; este proceso se denomina tipificación. El comportamiento estadístico nos permite asociar valores de probabilidad a cualquier suceso de la variable estudiada.
Contaremos con una tabla con los valores correspondientes a una función de distribución normal de media y desviación típica
. Como cada ejercicio nos ofrecerá una distribución diferente, lo que tenemos que hacer a través de la tipificación es convertir dicha distribución en una distribución estándar.
Tipificar una variable consiste en transformar una distribución normal cualquiera en otra normal estándar
. Esta transformación consiste en:
Trasladar o centrar, es decir, hacer que la media sea cero .
Reducir (contraer o dilatar), es decir, hacer la desviación típica uno .
La distribución normal estándar tiene una variable aleatoria llamada , para calcular valores de probabilidad de una variable X, normal
se hace el siguiente cambio de variable:
donde Z es el valor de la distribución normal estándar, X es el valor de una distribución normal que se desea convertir a la normal estándar, y μ y σ son, respectivamente, la media y la desviación típica de esa población.
Para encontrar en la tabla la probabilidad asociada a un determinado valor de la variable Z, tenemos que encontrar el valor Z combinando los números de la primera columna y fila. La intersección de esa fila y esa columna nos indicará la probabilidad correspondiente a ese valor de Z.
Ejercicio resuelto: Uso de la tabla de distribución normal
La probabilidad de obtener un valor Z menor que 0,92 se encuentra encontrando el número en la tabla donde la fila es 0,9 y la columna es 0,02, el valor dónde se cruzan dicha fila y columna, será la probabilidad que corresponde a ese valor de la variable Z.
Por lo tanto:
La tabla de nos da el área debajo del gráfico desde z hasta el extremo izquierdo, que es la probabilidad de obtener un valor menor que Z de la variable aleatoria,
.
La tabla está preparada solamente para calcular valores menores que valores positivos.
Por tanto, deberemos utilizar la simetría de la función para convertir la probabilidad de modo que podamos usar la tabla. Por ejemplo:
Esta fórmulas nos permiten convertir cualquier valor para utilizarlo en la tabla.
1. Los salarios mensuales de los recién graduados que acceden a su primer empleo se distribuyen según una ley normal de media 1300 € y desviación típica 600 €. Calcular el porcentaje de graduados que cobran:
a) Menos de 600 € al mes.
b) Entre 1000 y 1500 € al mes.
c) Más de 2200 € al mes.
Solución
Sea X la variable “salarios mensuales, en euros, de los recién graduados en su primer empleo”, tendremos una distribución normal de
y
.
Para obtener las probabilidades a partir de la tabla hay que tipificar la variable:
a) Menos de 600 € al mes:
No podemos utilizar la tabla para calcular la probabilidad de dado que es un valor negativo. Utilizamos la siguiente ecuación:
Podemos calcular el valor de introduciendo en la tabla 1,17 (nos tienen que dar la tabla), el resultado es
Por tanto:
Es importante entender que al tratarse de una variable continua podemos aproximar que:
b) Entre 1000 y 1500 € al mes:
Utilizamos la fórmula:
Por tanto:
También sabemos que:
Finalmente:
c) Más de 2200 € al mes:
2. Se estima que el tiempo en horas que se necesita para memorizar un tema de Historia de la Filosofía es una variable aleatoria normal, cuya media y varianza se desconocen. Calcular la media y la desviación típica de esta distribución si se sabe que las tres cuartas partes de las estudiantes necesitan más de 3 horas y que el 5% necesita más de 6 horas para memorizarlo.
Solución
Sea X la variable “tiempo necesario para memorizar un tema de Historia de la Filosofía”, la distribución de la variable X es siendo ambos parámetros desconocidos.
Las tres cuartas partes de las estudiantes necesitan más de 3 horas. Esto significa que la probabilidad de que un alumno necesite más de 3h es de ¾.
El 5% necesita más de 6 horas.
Este ejercicio es al revés que el anterior, nos dan la probabilidad y debemos calcular la variable. Tendremos que buscar dentro de la tabla el valor de la probabilidad de y encontrar el valor de la variable asociado (fila y columna). Sin embargo, antes debemos tipificar y preparar la ecuación:
Buscamos en la tabla el valor de variable asociado a , que está entre 0,9495 y 0,9505, por lo que volvemos a hacer la media de los dos valores de
que le corresponden en la tabla a dichas probabilidades:
El proceso inverso sería:
Por tanto:
Hacemos lo mismo con la otra condición para resolver el sistema:
Buscamos en la tabla el valor de la variable asociada a la probabilidad de 0,25. Nos encontramos con que la tabla está preparada de modo que solo aparecen probabilidades mayores que 0,5.
Si analizamos el dibujo sabemos que si la probabilidad es menor de 0,5 es porque corresponde a un valor negativo:
Como en la tabla solo hay valores positivos debemos encontrar su equivalente:
Y para sacar el valor de a necesitamos convertirlo en:
El valor 0,75 sí que aparece en la tabla y corresponde a . Tenemos entonces que:
Una vez calculado el valor a, volvemos a la probabilidad inicial, que por analizar el dibujo sabemos que era negativo:
Tras estos cálculos, tenemos un sistema de dos ecuaciones y dos incógnitas:
Lo resolveremos por el método de igualación:
La media y la desviación típica son 3,8728 y 1,2931, respectivamente.
3. Supongamos que la estatura media de las alumnas de bachillerato se distribuye normalmente con media m = 166 cm y desviación típica 9 cm. Si se elige una alumna al azar halla la probabilidad de que su estatura sea:
a) Superior a 175 cm.
b) Inferior a 155 cm.
c) Esté entre 155 cm y 175 cm.
Solución
Sea X la variable “altura media de la alumna de bachillerato”, dado que sigue una distribución normal , tendremos que tipificarla mediante el cambio de variable correspondiente para calcular las siguientes probabilidades:
a) Superior a 175 cm:
b) Inferior a 155 cm:
c) Esté entre 155 cm y 175 cm:
4. Supongamos que los chicos de 15 años de un determinado país tienen una estatura que se distribuye según una normal de media 168 cm y desviación típica 12 cm. Si se quieren seleccionar al 5 % de los chicos más altos, ¿a partir de qué altura debe hacerse?
Solución
Si X es la variable que describe la altura de los chicos, seleccionar uno entre el 5% de los más altos tiene una probabilidad de 0,05; o, lo que es lo mismo, acordándonos de la simetría de la distribución normal:
Por lo que, el 5% de los chicos más altos miden más de 187,74 cm.
5. La edad de los habitantes de cierta ciudad se distribuye normalmente, con una media de 40 años. Se sabe además que el 2,28 % de los habitantes tiene más de 60 años.
a) ¿Cuál es la desviación típica?
b) ¿Cuál es el porcentaje de habitantes con menos de 35 años?
Solución
Sea X la variable “edad de los habitantes de la ciudad”, sabemos que:
a) ¿Cuál es la desviación típica?
Dado que sigue una distribución normal, tipificaremos en función de la desviación típica, que es un valor desconocido:
b) ¿Cuál es el porcentaje de habitantes con menos de 35 años?
El porcentaje de habitantes con menos de 35 años es del 30,85%.