Distribución normal
Al recolectar los datos de una variable que puede ser continua, como
por ejemplo la medición del peso, altura, dimensiones de un producto o una
variable discreta cuando establecemos si un producto o servicio es conforme
o no, la frecuencia de los datos tiende a acercarse hacia el centro y si lo
representamos gráficamente forma una curva de campana ( Distribución normal).
La variación de los datos se encuentran distribuidos a lo largo de la curva de campana como se puede apreciar en la gráfica anterior, sin embargo una proporción considerable de los datos tienden a centrarse en la gráfica.
Esta característica especial nos indica que en general cuando analizamos una muestra de datos significativa, todos tienden a acercarse a una medida central, que nos permitirá entender el comportamiento de la variable.
La distribución normal tiene como elementos principales a la media y la desviación estándar.
La media (μ) es una medida de tendencia central , que representa el promedio
de todos los datos del estudio.
La desviación estándar ( σ ) representa la dispersíón de los datos
, es decir nos da una idea de cuánto puede variar alrededor de la media
los datos.
La notación que se suele utilizar para representar una
distribución normal es la siguiente: N ( μ , σ )
Para establecer el rango de datos que puede variar nuestra medida
central que representa a una población, en estadística se utiliza los niveles
de confianza:
+/ - 1σ representa un nivel de confianza del 68%
+/ - 2σ representa un nivel de confianza del 95%
+/ - 3σ representa un nivel de confianza del
99.7%
Como se puede apreciar en la gráfica anterior para hallar el rango
que representa nuestra dispersión de datos se resta y se suma la desviación
estándar a la media poblacional.
A continuación, para desarrollar los conceptos que se están
tratando se resolverá el siguiente ejercicio.
Los resultados de un examen siguen una distribución normal con
media 78 y varianza 36. Se pide:
a) ¿Cuál es la probabilidad de que una persona que se presenta el
examen obtenga una calificación superior a 72?
b) Si se sabe que la calificación de un estudiante es mayor que 72 ¿cuál
es la probabilidad de que su calificación sea, de hecho, superior a 84?
Para empezar a resolver la pregunta "a" , desarrollaremos el concepto del estadístico Z.
Como pudieron apreciar en la curva de campana de la primera gráfica se observa que la medida central de los datos es cero y alrededor del mismo se distribuyen los datos.
En realidad el estadístico Z lo que hace es estandarizar los datos para que tengan una media = 0 y el Z de los datos en sí represente el número de desviaciones estándar que puede estar ubicado detrás o delante de la media.
Z = (observación - media ) / ( Desviación estándar )
a) En tal caso resolviendo:
Z = ( 72 - 78 ) / 6 = - 1
Como podemos observar se está evaluando la calificación de 72 respecto de la media que es 78.
El problema nos da como dato la varianza que es 36 , para hallar la desviación estándar solo se deberá calcular la raíz cuadrada.
El valor de Z obtenido es -1.
Ahora vamos a calcular la probabilidad que representa este valor de Z respecto a nuestra distribución para poder contestar a la pregunta:
p ( x > 72 ) = P ( Z > -1)
Observando nuestra tabla Z acumulada podemos determinar el porcentaje:
Para nuestro caso p( Z > -1 ) = 1 - P (Z <= - 1) = P ( Z <= 1)
p ( x > 72 ) = P ( Z > -1) = 0.841
Es decir hay una probabilidad de 84.1 % de que un estudiante obtenga una calificación superior a 72.
b) La probabilidad de que los resultados del examen sean mayor a 84 , si se sabe que la calificación de un estudiante es mayor a 72.
P ( x > 84 / x > 72) = ?
Primero calcularemos:
P ( x > 84)
Z = ( 84 - 78 ) / 6 = 1
es decir P ( x > 84) = P (Z > 1) = 1 - P (Z < = 1),
Observando nuestra tabla Z acumulado podemos observar que P ( Z <= 1) = 0.841
Entonces la P (Z >1) = 1- 0.841 = 0.159
Ahora aplicamos teorema de Bayes:
P (A / B ) = P (A y B ) / P (B)
P (x > 84 / x > 72 ) = P ( x > 84 y x > 72 ) / P (x > 72)
Resolviendo :
La intersección de P ( x > 84 y x > 72 ) = P (x > 84)
P (x > 84 / x > 72 ) = P ( x > 84 ) / P ( x > 72) = 0.159 / 0.841 = 0.189
Por tanto concluimos que la probabilidad de que un estudiante supere la puntuación de 84 , sabiendo que el resultado de un estudiante es mayor a 72 es 18.9 %