Medidas de dispersión Distribución A = (70, 80, 90, 110,120,130) Distribución B = (1, 5, 10, 190,195, 199) x̄=100 A)
70 80 90
110 120 130 x̄=100
B) 1 5 10
190 195 199
LA MEDIA NO SE UN BUEN RESUMEN..
Medidas de Dispersión
NECESITAMOS ALGUNA MEDIDA QUE NOS MUESTRE COMO SE COMPORTAN LOS VALORES AL INTERIOR DE LA VARIABLE. QUE NOS MUESTRE LA CONCENTRACIÓN (HOMOGENEIDAD) O DISPERSIÓN DE LOS DATOS CON RESPECTO A LA MEDIA.
Una manera que aparece como muy natural para construir una medida sería promediar las desviaciones de la media, pero como vimos:
x1 − x + x 2 − x + ..... + xn − 1 − x + xn − x = 0 La sumatoria de las distancias a la media siempre es igual a 0.
DESVIO ESTANDAR (S)
Raíz cuadrada del promedio de la suma de los cuadrados de las distancias a la media.
∑ ( x − x) N
2
i
sx =
i =1
N
Matemáticamente es posible demostrar que la suma de los cuadrados de los desvíos de la totalidad de las observaciones, respecto de la media aritmética de la distribución, es menor que la suma de los cuadrados de los desvíos respecto de cualquier otro valor que no sea la
Ejemplo A=(70, 80, 90, 110,120,130)
B = (1, 5, 10, 190,195,199)
x̄ = 100
Hacer en clase
s=√(-30)²+(20)²+(10)²+(10)²+(20)²+(30)² 6
S = √ 2800 = √466,66=21,60 6 SA = 21,60
Ejemplo A = (70, 80, 90, 110,120,130) x̄ = 100
B = (1, 5, 10, 190,195, 199) Hacer en clase
s=√(-30)²+(-20)²+(-10)²+(10)²+(20)²+(30)² 6
S = √ 2800 = √466,66 =21,60 6 SA = 21,60 SB = 94,74
El Desvió Estándar (S) representa la dispersión. El Desvío Stándar nos muestra la dispersión de los datos con respecto a la media. Si tenemos la misma media. Cuanto mas pequeño es el Desvío mas cercanos a la media están los datos y mas homogénea es la distribución.
Formula Desvió Estándar (S) para agrupados Frecuencias Frecuencias Relativas
Absolutas N
sx =
(
∑n1 Ci − x i =1
)
N
Siendo: n1 = FA del intervalo cuya marca de clase le estoy restando la media. Ci = La Marca de Clase
∑ f (C − x ) N
2
1
sx =
2
i
i =1
Siendo:
f1 = FR del intervalo cuya marca de clase le estoy restando la media. Ci = La Marca de Clase
Varianza (V)
Varianza = S² En algunos casos es conveniente usar en lugar de S, la varianza. El cálculo es el mismo pero sin hacer la Raíz Cuadrada. N 2
s
2
( x − x) ∑
i= 1 =
i
N
Coeficiente de Variación El Desvío Estándar se obtiene en la medida de la variable. Por lo tanto solo puede ser comparado con otras variables que tengan la misma medida. Una forma de comparar Desvíos de distinta escala de medida es S = convertirloCV en una proporción de la x Media.
Coeficiente de Variación CV = S = x̄
Desvío Standard Media
Mide que proporción de la Media es el Desvío. Para convertirlo en porcentaje (%) lo tenemos que multiplicar por 100. De esta forma Estandarizamos los
Rango Intercoartílico Esta medida de dispersión, nos permite conocer que tan agrupados se encuentra el 50% central de las observaciones. Esta medida esta basado en el Rango, que según habíamos visto es la diferencia entre el valor máximo y el valor mínimo de la variable.
Rango Intercoartílico El rango intercoartilico es la diferencia entre el tercer cuartil y el primer cuartil. Entre el valor del individuo que ocupa el 75% de la distribución y el individuo que ocupa el 25% de la distribución. De esta forma el Rango intercoartílico nos da el recorrido donde se encuentran el 50% central de las
Calcular Rango Intercoartílico
EDADES 0000-1000
mc 500
FA 5
FR 0,05
FAA 5
FRA 0,05
1001-2000
1500
12
0,12
17
0,17
2001-3000
2500
18
0,18
35
0,35
3001-4000
3500
17
0,17
52
0,52
4001-5000
4500
16
0,16
68
0,68
5001-6000
5500
12
0,12
80
0,80
6001-7000
6500
9
0,09
89
0,89
7001-8000
7500
6
0,06
95
0,95
8001-9000
8500
5
0,05
100
1
100
1
Rango Intercoartílico 0-5 5-10
2,5 7,5
25 25
0-5
2,5
10
5-10
7,5
40
10-15
12,5
25
10-15 12,5
40
15-20 17,5
10
15-20 0-5 5-10 10-15 15-20
17,5 2,5 7,5 12,5 17,5
25 40 10 10 40
Calcular Desvío Estándar, Coef. De Variación y Rango Intercoartilico de estas distribuciones.