UNIDAD IV : MEDIDAS DE DISPERSION Ing. Roy Donaldo silva
MEDIDAS DE DISPERSION Se llama dispersión de un conjunto de datos al grado en que los diferentes valores numéricos de los datos tiende a extenderse alrededor del valor medio utilizado. Este grado de dispersión se mide por medio de los indicadores estadísticos llamados medidas de dispersión, entre ellas tenemos : El rango, la varianza, y la desviación típica, El coeficiente de variación, desviación semi intercuartilica ,etc
Estas se estudian para datos : a) En Serie o también llamadas no agrupados y b) Para Datos Agrupados
MEDIDAS DE DISPERSION PARA DATOS EN SERIE RANGO, DESVIACION MEDIA, DESVIACION TIPICA, VARIANZA, COEFICIENTE DE VARIABILIDAD
ING. ROY DONALDO SILVA
Rango: Es la primera medida que vamos a estudiar, se define como la diferencia existente entre el valor mayor y el menor de la distribución, Lo notaremos como R. Permite obtener una idea de la dispersión de los datos, cuanto mayor es el rango, más dispersos están los datos de un conjunto. • RANGO : X mayor - X menor
DESVIACION MEDIA • Para serie de Datos se Puede definir como la media aritmética de las desviaciones de cada uno de los valores con respecto a la media aritmética de la distribución, y de indica así:
DM
x x N
Para encontrar la desviación media , se tiene que calcular primero la media aritmética
DESVIACION TIPICA La Desviación Típica : Es una medida de la magnitud en que se desvían las diversas puntuaciones obtenidas de su valor medio. Si las puntuaciones se agrupan estrechamente en torno a la media, la DT será relativamente pequeña; si se extienden en todas direcciones, la DT será relativamente grande. La desviación típica para serie de datos:
( X i X ) n
2
Usos de la desviación típica La desviación típica se utiliza generalmente para completar los indicadores de tendencia central como la media o la mediana. • El objetivo es ver si los valores de un conjunto de datos están más o menos reagrupados alrededor de la medida de tendencia central. A mayor dispersión, mayor valor tomará la desviación típica.
COEFlClENTE DE VARlAClON • Es una medida de variabilidad relativa, se expresa en porcentaje, por lo tanto permite la comparación entre variables medidas en unidades diferentes, por ej. Peso y altura, o cuando tratándose de la misma unidad de medida las medias son muy distintas. Cuanto más próximo a cero sea el valor del CV, será menor la variabilidad del grupo respecto a la Media es decir mas confiable su media aritmética. Es el cociente entre el Desvío Standard y la Media multiplicado por 100:
C.V =
𝜎 100% 𝑋
Grados de representatividad de la media aritmética para el C.V VALOR DEL COEFICIENTE DE VARIABILIDAD
GRADO EN QUE LA MEDIA REPRESENTA LOS DATOS
DE 0 A MENOS DE 10%
La MEDIA es ALTAMENTE REPRESENTATIVA
DE 10 A MENOS DE 20%
La MEDIA es BASTANTE REPRESENTATIVA
DE 20 A MENOS DE 30 % DE 30 A MENOS DE 40%
La MEDIA TIENE REPRESENTATIVIDAD
DE 40% O MAS
MEDIA es CARENTE DE REPRESENTATIVIDAD
La MEDIA tiene REPRESENTATIVIDAD DUDOSA
MEDIDAS DE DISPERSION PARA DATOS AGRUPADOS : • A) Datos agrupados en frecuencia • B) Datos agrupados en tablas de distribución de frecuencias
Desviación media para datos agrupados en frecuencia • Para Datos agrupados en frecuencia y en tabla de distribución se tiene que :
DM
fi X i X N
DESVIACION TIPICA PARA DATOS AGRUPADOS • PARA DATOS AGRUPADOS EN DISTRIBUCIONES DE FRECUENCIAS fi ( X i X )2 N
𝜎=
𝑋 2 𝑖 𝑓𝑖 σ 𝑁
− 𝑋ത 2
DESVIACION TIPICA PARA DATOS AGRUPADOS EN TABLAS DE DISTRIBUCION • METODO SIMPLE O ESTANDAR
fi ( Pm X ) N
2
• Primer METODOS ABREVIADO Desviaciones de media :
fi d fi d i N N 2 i
2
Segundo Método Abreviado ic x
fi d i fi d i N N 2
2
METODO alternativos: método abreviado de media aritmética
fi pm fi pmi N N 2 i
Método alternativo
fi pm 2 X N 2 i
2
Ejercicio para resolver por el alumno :
intervalos
li
ls
lri
lrs
Fi
pm
Ejercicio para resolver por el alumno : encuentre las medidas de dispersión vistas en clase ( utilice todos los métodos)
intervalos Fi li
ls
150
154
8
155
159
4
160
164
8
165
169
7
170
174
2
175
179
9 38
total
lri
lrs
pm
DESVIACION SEMI INTERCUARTILICA ES LA DISTANCIA ENTRE EL PRIMER Y TERCER CUARTIL DE UN GRUPO DE DASTOS ORDENADOS O DATOS AGRUPADOS, SE CALCULA DE LA SIGUIENTE MANERA:
• Q = ( Q3 – Q1)/2 aproximadamente se pude encontrar los cuartiles • Q1 = Md – Q • Q3 = Md + Q • A Mayor dispersión mayor la distancia intercuartilica y viceversa. Se usa cuando se presentan intervalos abiertos.
Calculo de la varianza en Tablas de Distribución La VARIANZA V(x) =σ2 : Es la media aritmética de la suma de los cuadrados de las desviaciones de una variable con respecto a su media. Por tanto, cuanto mayor sea esta medida, menos representativa de la realidad será la media de dicha variable o simplemente es elevar la desviación típica al cuadrado.
2
2
fi ( pm X ) N
2
fi pm fi pmi N N 2 i
2
Propiedades de la varianza
Propiedades de la media • • • •
𝑀 𝑋+𝐾 =𝑀 𝑋 +𝐾 M(K) = K M(KX) = K M(X) M(KX + K) = M(kX) + K
DONDE K = CONSTANTE Y M= MEDIA
Ejemplos de aplicación
• El gobierno de El salvador ha mantenido en las Instituciones del Nivel central un promedio de $ 600.0, el ministerio le ha establecido una desviación típica de $60. El presidente ha decidido presentarle al concejo de ministro que analicen lo siguiente : • A) Si se hace un aumento en $ 60.00 que sucede con la media aritmética y la varianza • B) Si el gobierno ha establecido que por la inflación se aumentara un 15% al salario promedio que sucedería con la media y la desviación típica (tome como 1.15) • C) Si el Presidente decide realizar los aumentos anteriores que sucedería?
EJERCICIO • CON UNA DESVIACION TIPICA DE $80.00 ¿Qué SUCEDE CON LA VARIANZA SI LOS SALARIOS : • A) SE AUMENTAN EN $ 40.00 • B) SE AUMENTAN EN UN %25
COEFICIENTE DE VARIACION • Es una medida de variabilidad relativa, se expresa en porcentaje, por lo tanto permite la comparación entre variables medidas en unidades diferentes, por ej. Peso y altura, o cuando tratándose de la misma unidad de medida las medias son muy distintas. Cuanto más próximo a cero sea el valor del CV, será menor la variabilidad del grupo respecto a la Media es decir mas confiable su media aritmética. Es el cociente entre el Desvío Standard y la Media multiplicado por 100:
C.V =
𝜎 100% 𝑋
Grados de representatividad de la media aritmética para el C.V VALOR DEL COEFICIENTE DE VARIABILIDAD
GRADO EN QUE LA MEDIA REPRESENTA LOS DATOS
DE 0 A MENOS DE 10% DE 10 A MENOS DE 20% DE 20 A MENOS DE 30 %
MEDIA ALTAMENTE REPRESENTATIVA
DE 30 A MENOS DE 40%
MEDIA CUYA REPRESENTATIVIDAD ES DUDOSA
DE 40% O MAS
MEDIA CARENTE DE REPRESENTATIVIDAD
MEDIA BASTANTE REPRESENTATIVA MEDIA TIENE REPRESENTATIVIDAD
Ejemplo : encuentre el grado de representatividad de la media Intervalos 60 – 74 75 – 89 90 – 104 105 -119 120 - 134
fi 8 10 16 9 7 50
EJERCICIO
• La defensoría del consumidor en una encuesta de calidad del producto AAAAA de las empresas pollo xxxxxxx, y pollo YYYYYY , se encontró la siguiente calidad de dicho producto, medido en cantidad de carne utilizada en ella. • ¿ Si usted tuviera necesidad de comprar el producto, con que compañía haría la compra, asumiendo que el precio es igual en ambas empresas?
Cantidad de gramos encontrados en la pechurricas de 10 restaurantes Grs en pollo campestre
Grs en pollo campero
3.6 3.8 3.9 4.0 4.1 4.2 4.5 4.6 4.7
1.9 2.1 3.5 6.8 4.2 4.8 5.6 5.9 7.7
En relación con el aprovechamiento de tres secciones de estadística de la facultad de economía , se obtiene información siguiente
Descripción
N° de estudiantes Calificación media Desviación típica Calific. Mayor Calific. mener
Se pregunta
:
Sección 01
Sección 02
Sección 03
50 8
60 8.5
55 7.5
1.2 9.5 6.5
1.8 9.0 6.2
2.0 8.4 4.6
a)Cual es el rango de la Sección de Estadística 01 b)Cual es la sección que presenta la mayor dispersión absoluta c) Cuela la sección que tiene media aritmética mas representativa d) Que sección cree que usted es la mas aplicada y por que ?
MEDIDAS DE FORMA Son indicadores estadísticos que permiten identificar si una distribución de frecuencia presenta uniformidad
EL COEFICIENTE DE ASIMETRIA DE PERSON PARA LOS DATOS AGRUPADOS: a) EN TABLAS DE DISTRIBUCION DE FRECUENCIAS
3 𝑋ത − 𝑀𝑒 𝐴𝑆𝑃 = 𝑆 < >Si el valor del coeficiente de asimetría es mayor que cero entonces la distribución presenta una asimetría positiva. < >Si el valor del coeficiente de asimetría es menor que cero entonces la distribución presenta una asimetría negativa. < >Si el valor del coeficiente de asimetría es igual a cero entonces la distribución es simétrica. < >El coeficiente varía entre [-3,3] aunque valores fuera de [-1,1] se consideran excepcionales
El coeficiente de asimetría de Fisher CAF
Si CAF<0: la distribución tiene una asimetría negativa y se alarga a valores menores que la media. Si CAF=0: la distribución es simétrica. Si CAF>0: la distribución tiene una asimetría positiva y se alarga a valores mayores que la media.
TIPOS DE ASIMETRIA
-Asimetría -Kurtosis o Apuntamiento
MEDIDAS DE FORMA: Coeficientes
Además de la posición y la dispersión de los datos, otra medida de interés en una distribución de frecuencias es la simetría y el apuntamiento o kurtosis de fisher
n
Coeficiente de Asimetría
CA
(x i 1
i
x)3
n s3 n
Coeficiente de Apuntamiento CAp
Si CA=0 si la distribución es simétrica alrededor de la media. Si CA<0 si la distribución es asimétrica a la izquierda Si CA>0 si la distribución es asimétrica a la derecha
( xi x ) 4 i 1
n s4
- Si CAp=0 la distribución se dice normal (similar a la distribución normal de Gauss) y recibe el nombre de mesocúrtica. - Si CAp>0, la distribución es más puntiaguda que la anterior y se llama leptocúrtica, (mayor concentración de los datos en torno a la media). - Si CAp<0 la distribución es más plana y se llama platicúrtica.
35
COEFICIENTE DE CURTOSIS DE FISHER Encuentre el Coeficiente de curtosis de Fisher para datos agrupados en tabla de distribución y establezca el tipo de curtosis: Estas medidas indican el grado de apuntamiento o achatamiento del gráfico correspondiente a una distribución de frecuencias
ഥ σ 𝒑𝒎 − 𝑿 𝒏 𝖌𝟐 = 𝑺𝟒
𝟒
𝒙 𝑭𝒊
a) Si el valor del coeficiente de curtosis es mayor que tres entonces la distribución es leptocúrtica. b) Si el valor del coeficiente de curtosis es menor que tres entonces la distribución es platicúrtica. c) Si el valor del coeficiente de curtosis es igual a tres entonces la distribución es mesocúrtica
Otra formula para el calcularlo
g2
(x i X ) ns
4
4
ni
3
Si g2 > 0 la distribución será leptocúrtica o apuntada Si g2 = 0 la distribución será mesocúrtica o normal Si g2 < 0 la distribución será platicúrtica o menos apuntada que lo normal.
INTRODUCCION A REGRESION : TIPOS DE REGRESION regresión lineal simple La regresión lineal simple se basa en estudiar los cambios en una variable, no aleatoria, afectan a una variable aleatoria, en el caso de existir una relación funcional entre ambas variables que puede ser establecida por una expresión lineal, es decir, su representación gráfica es una línea recta. Es decir, se esta en presencia de una regresión lineal simple cuando una variable independiente ejerce influencia sobre otra variable dependiente.
REGRESION LINEAL SIMPLE MODELO ESTIMADO
yˆ a bx DATOS
x x(1)
y y( 1 )
x( 2 )
y( 2 )
x(n )
y( n )
ESTIMADORES : MINIMOS CUADRADOS
a y bx
b
n
n
n
i 1
i 1
i 1
n xy xi y i n x xi i 1 i 1 n
2
n
2
40
Los siguientes datos han sido tomado de la defensoría del consumidor , en donde se refieren a la demanda de un producto (en miles de unidades) y su precio (en centavos de dólares) en cinco supermercados diferentes: Ajuste una función potencial y úsela para estimar la demanda cuando el precio del producto es de 0,8 centavos.
N 1 2 3 4 5 Total
Precio Demanda X y 0,02 32 0,06 25 0,10 12 0,11 38 0,14 6 41
Ejercicio : Los siguientes datos se refieren al tiempo de secado de un cierto barniz y a la cantidad de aditivo añadido para reducir el tiempo de secado: cuando será el tiempo de secado para nueve gramos Cantidad de aditivo agregado (g)
Tiempo de secado (horas)
X
y
0
12.0
1
10.5
2
10.0
3
8.0
4
7.0
5
8.0
6
7.5
7
8.5
8
9.0 42
Precio X
Demanda y
XY
X2
20
22
440
400
16
41
656
256
10
120
1200
100
11
89
979
121
14
56
784
196
71
328
4059
1073
43
Cantidad de aditivo agregado (g)
Tiempo de secado (horas)
xy
X2
0
0
10.5
10.5
1
2
10.0
20
4
3
8.0
24
9
4
7.0
28
16
5
8.0
40
25
6
7.5
45
36
7
8.5
59.5
49
8
9.0
72
64
x 0
y 12.0
1
36
81
299
204
44