EXPLICACIÓN DE LA DIFERENCIA ENTRE LA ESTIMACIÓN DE LA DESVIACIÓN ESTÁNDAR DE UNA POBLACIÓN MEDIANTE UNA MUESTRA; Y EL CÁLCULO DE LA DESVIACIÓN MUESTRAL DE ESA MISMA POBLACIÓN PARA UN TAMAÑO DETERMINADO DE MUESTRA A) ESTIMACIÓN DE LA DESVIACIÓN MUESTRA DE LA POBLACIÓN.
MEDIANTE
UNA
Cuando se tienen poblaciones muy grandes en donde es impráctico o imposible tomar todos sus datos para calcular la desviación estándar, se acostumbra tomar una muestra y con esos resultados INFERIR la desviación estándar de TODA la población: Supóngase que se tienen cinco barajas en donde solo se dejaron los números del 2 al 10. Entonces la población está formada por 180 cartas (5 cartas x 9 números en cada una x 4 palos diferentes de cada número). 2 2 2 2
3 3 3 3
4 4 4 4
5 5 5 5
6 6 6 6
7 7 7 7
8 8 8 8
9 9 9 9
10 10 10 10
2 2 2 2
3 3 3 3
4 4 4 4
5 5 5 5
6 6 6 6
7 7 7 7
8 8 8 8
9 9 9 9
10 10 10 10
2 2 2 2
3 3 3 3
4 4 4 4
5 5 5 5
6 6 6 6
7 7 7 7
8 8 8 8
9 9 9 9
10 10 10 10
2 2 2 2
3 3 3 3
4 4 4 4
5 5 5 5
6 6 6 6
7 7 7 7
8 8 8 8
9 9 9 9
10 10 10 10
2 2 2 2
3 3 3 3
4 4 4 4
5 5 5 5
6 6 6 6
7 7 7 7
8 8 8 8
9 9 9 9
10 10 10 10
Ahora tomaremos una muestra de 40 cartas al azar y se obtiene lo siguiente: 7
5
2
10
6
2
8
8
9
3
4
7
6
10
2
3
4
7
5
3
8
2
9
6
6
5
8
9
10
10
7
8
5
4
8
9
3
10
6
∑x
242 = 6.05 cuyo resultado inferiremos es aproximadamente igual a la n 40 MEDIA DE LA POBLACIÓN µ = 6.05 X=
i
=
S
2
∑ (x =
− X)
i
2
n−1
2 247.2975 n ∑ fi x i = − X2 = = 6.340962 n − 1 n 39
S = S 2 = 6.340962 = 2.5181
En donde inferiremos que la DESVIACIÓN ESTÁNDAR DE LA POBLACIÓN es aproximadamente lo mismo, o sea
σ = S = 2.5 1 8 1 La diferencia entre lo REAL de la POBLACIÓN y lo INFERIDO por una MUESTRA es lo siguiente. PARAMETRO MEDIA DESVIACIÓN
MUESTRA
µ σ
REAL
6.05
6.0
2.5181
2.5820
Donde lo real se calculó por las fórmulas.
∑x
54 ya que no es necesario repetir TODOS los 180 números ya = 6.00 n 9 que hay 20 series idénticas de números del 2 al 10. µ=
i
=
(x σ =∑ 2
i
− µ)
2
n
=
60 = 6.6667 9
σ = σ2 = 6.6667 = 2.5820
Por consiguiente, el usar una MUESTRA DE UNA POBLACIÓN permite estimar el valor de la media y la desviación de esa POBLACIÓN. Conforme la muestra sea mayor se acercará más a los valores reales. B)
DESVIACIÓN MUESTRAL DE UNA DISTRIBUCIÓN DE PROMEDIOS
Consiste en la aplicación del TEOREMA DEL LÍMITE CENTRAL, trabajando con una distribución FORMADA POR PROMEDIOS. Supongamos que de las 180 cartas de nuestra población yo tomo pequeñas muestras de tamaño 4; digamos 10 muestras de tamaño cuatro. MUESTRA
1
2
3
4
SUMA
MEDIA
N° 1
4
6
8
5
23
5.75
2
2
7
5
3
17
4.25
3
9
10
6
6
31
7.75
4
8
5
2
6
21
5.25
5
7
9
10
4
30
7.5
6
6
8
3
5
22
5.5
7
9
7
4
6
26
6.5
8
5
6
5
6
22
5.5
9
10
2
6
6
24
6.0
10
8
10
6
5
29
7.25
∑X
61.25 = 6.125 = µ ya que conforme el k 10 tamaño de la muestra sea mayor y la cantidad de subgrupos también mayor, tiende a la media de la POBLACIÓN (6.0000).
El promedio de los promedios da X =
i
=
En cambio, la DESVIACIÓN de estas muestras de tamaño 4 es dado por
(X − X σx = n −1
2
i
=
que conforme haya más muestras llegará 11.16 = 1.1136 9
al valor de
σx =
σ 2.5820 = = 1.2910 n 4
Cualquier probabilidad que usted deseara obtener de “UN PROMEDIO DE TAMAÑO CUATRO CARTAS”, tendría que utilizar σx . Sería como calcular una probabilidad en una distribución normal elaborada a base de los promedios de las muestras de “tamaño cuatro” Por ejemplo, en un problema de “cuál es la probabilidad de que al sacar cuatro cartas el promedio sea mayor a 6.5” usted sacaría “z” como:
Z=
x−µ σx
=
6.5 − 6.0 2.5820
= 0.3873
4
Entonces recuerde que el sacar una muestra de una población para hacer inferencias es muy diferente a sacar determinada probabilidad de un “promedio”. En el primero la desviación ( σ ) se estima es aproximadamente similar a la calculada con la muestra ( S ), mientras que en el segundo al calcular la probabilidad “para un promedio” se
σ utiliza σx (
n )