CUN.
MODELOS LINEALES: REPASO DE ESTADISTICA.
Lic. Juan Pablo Llinás C.
GUIA COMPLEMENTARIA MEDIDAS DE DISPERSIÓN
Breve Introducción Hasta el momento hemos estudiado los valores centrales de la distribución, pero también es importante conocer si los valores en general están cerca o alejados de estos valores centrales, es por lo que surge la necesidad de estudiar medidas de dispersión. Rango: Es la primera medida que vamos a estudiar, se define como la diferencia existente entre el valor mayor y el menor de la distribución,. Lo notaremos como R. Realmente no es una medida muy significativa e la mayoría de los casos, pero indudablemente es muy fácil de calcular. Hemos estudiado varias medidas de centralización, por lo que podemos hablar de desviación con respecto a cualquiera de ellas, sin embargo, la mas utilizada es con respecto a la media. Desviación: Es la diferencia que se observa entre el valor de la variable y la media aritmética. La denotaremos por di . No es una medida, son muchas medidas, pues cada valor de la variable lleva asociada su correspondiente desviación, por lo que precisaremos una medida que resuma dicha información. La primera solución puede ser calcular la media de todas las desviaciones, es decir, si consideramos como muestra la de todas las desviaciones y calculamos su media. Pero esta solución es mala pues como veremos siempre va a ser 0.
Luego por lo tanto esta primera idea no es valida, pues las desviaciones positivas se contrarrestan con las negativas. Para resolver este problema, tenemos dos caminos: 1. Tomar el valor absoluto de las desviaciones. Desviación media. 2. Elevar al cuadrado las desviaciones. Varianza. Desviación media: Es la media de los valores absolutos de las desviaciones, y la denotaremos por dm.
Varianza: Es la media de los cuadrados de las desviaciones, y la denotaremos por
o también por
.
Aunque también es posible calcularlo como:
Este estadístico tiene el inconveniente de ser poco significativo, pues se mide en el cuadrado de la unidad de la variable, por ejemplo, si la variable viene dada en cm. La varianza vendrá en cm2. Desviación típica: Es la raíz cuadrada de la varianza, se denota por Sx o σ x.
Este estadístico se mide en la misma unidad que la variable por lo que se puede interpretar mejor. Otros dos estadísticos importantes son la cuasivarianza y la cuasidesviación típica, que como veremos cuando estudiemos el tema de estimación estadística, son los estimadores de la varianza y desviación típica poblacionales respectivamente. Cuasivarianza: Es una medida de dispersión, cuya única diferencia con la varianza es que dividimos por N-1, la representaremos por
o
y la calcularemos de la siguiente forma:
Cuasidesviación típica: La raíz cuadrada de la cuasivarianza y la denotaremos por SN—1 o σ N-1.
Todas estas medidas de dispersión vienen influidas por la unidad en la que se mide la variable, esto implica que si cambiamos de unidad de medida, los valores de estos estadísticos se vean a su vez modificados.
Además, no permite comparar por ejemplo, en un grupo de alumnos si los pesos o las alturas presentan mas dispersión. Pues no es posible comparar unidades de distinto tipo. Precisamos por lo tanto, una medida "escalar", es decir, que no lleve asociado ninguna unidad de medida. Coeficiente de Variación: Es un estadístico de dispersión que tiene la ventaja de que no lleva asociada ninguna unidad, por lo que nos permitirá decir entre dos muestras, cual es la que presenta mayor dispersión. La denotaremos por C.V.
EJEMPLO DE APLICACIÓN Completa la siguiente tabla con todas las medidas estudiadas en la guía:
45
55
6
6
50
300
-19,4
116,4
2258,16
15000
55
65
10
16
60
600
-9,4
94
883,6
36000
65
75
19
35
70
1330
0,6
11,4
6,84
93100
75
85
11
46
80
880
10,6
116,6
1235,96
70400
85
95
4
50
90
360
20,6
82,4
1697,44
32400
N=
50
420,8
6082
246900
3470 = Dm=
=
C.V.=