ESTADIGRAFOS DE TENDENCIA CENTRAL O DE POSICION
Permiten determinar un valor característico de una distribución de frecuencias ubicado hacia el centro de la distribución.
1. MEDIA ARITMÉTICA n
∑x
1. Datos no agrupados
i
x = i =1 n
2. Datos agrupados en tablas de frecuencias. k
2.1 Discretos
x=
∑x ⋅ f i =1
i
i
n k
2.2 Continuos
x
y f i 1
i
n
i
PROPIEDADES DE LA MEDIA ARITMÉTICA 1. Producto de la media por una constante.
M (C ⋅ X i ) = C ⋅ M ( X i ) 2. Suma o diferencia de la media con una constante.
M ( X i + C) = M ( X i ) + C
1. Si X e Y representan 2 variables con igual número de datos, entonces la media de la suma de estas variables es
M ( X i + Yi ) = M ( X i ) + M (Yi ) 4. La suma de las desviaciones del i-ésimo dato con respecto de la media es cero
n
( x − x ) = 0 ∑ i i =1
DESVIACIÓN
2. MEDIANA.
Corresponde al valor de la variable bajo el cual está a lo más el 50% de los datos y sobre el cual está, a lo más, el otro 50%.
1. Datos sin agrupar Conjunto de datos de tamaño n ORDENADOS.
n par
Me =
n impar
x( i ) + x( i +1)
n +1 Posición( Me) = 2
2
x(i ) ; x( i +1)
Datos centrales
2. Datos agrupados en tablas de frecuencias. 2.1 Discretos Se identifica el valor de la frecuencia acumulada
Fi
que
es mayor o igual al 50% de los datos, entonces la Mediana corresponde al valor de la variable:
Me xi
2.2 Continuos
n C ⋅ − Fi −1 2 ' Me = L i −1 + fi INTERVALO MEDIANO. Corresponde al intervalo cuya frecuencia acumulada Fi supera inmediatamente a Posición (Me)
L'i 1 : Límite inferior del intervalo mediano. n : tamaño de muestra. Fi-1 : frecuencia acumulada del intervalo anterior al mediano. f i : frecuencia absoluta del intervalo mediano. C : amplitud del intervalo.
CUANTILES. PARTICIONAN LA DISTRIBUCIÓN DE FRECUENCIAS DIVIDIÉNDOLA EN 4, 10 ó 100 PARTES IGUALES.
Q2= Mediana = 50%
a) CUARTILES (Q)
Histograma 9 8 7 6 Frecuencia
Dividen a la distribución de frecuencias en cuatro partes iguales.
5 4 3 2 1
Q1:25% Q2:50% Q3:75%
0
Q1
Q2
Q3
n C ⋅ − Fi −1 4 ' Q1 = L i −1 + fi
b) DECILES (D)
Dividen la distribución de frecuencias en 10 partes iguales
D1=10%, D2=20%,….,D9=90% D5= mediana =50%
7n C ⋅ − Fi −1 10 D7 = L'i −1 + fi
Histograma 9 8 7 Frecuencia
6 5 4 3 2 1 0
D1
D5
D9
C) PERCENTILES (P) DIVIDEN LA DISTRIBUCIÓN EN 100 PARTES IGUALES. ¿Cómo encontrar el intervalo cuantílico?
n*r C ⋅ − Fi −1 100 ' Pr = L i −1 + fi n : total de datos.
ES AQUEL CUYA FRECUENCIA ACUMULADA ES INMEDIATAMENTE MAYOR A
n*r 100
L' : límite inferior del intervalo cuantílico. i -1 F : frecuencia acumulada del intervalo anterior al cuantílico. i-1 f : frecuencia absoluta del intervalo cuantílico. i C : amplitud del intervalo. r : orden del percentil.
2. RECORRIDO INTERCUARTÍLICO (Q) ES LA MÁXIMA AMPLITUD ENTRE LOS CUARTILES
Q = Q3 − Q1 3. RANGO DE VARIACIÓN (R) ES LA DIFERENCIA QUE EXISTE ENTRE EL MÁXIMO Y MÍNIMO VALOR DE LA VARIABLE PRESENTE EN UN CONJUNTO DE DATOS.
R = X máx − X mín
GRAFICO DE CAJA EL GRAFICO DE CAJA ES UTILIZADO PARA OBSERVAR LA POSICIÓN RELATIVA DE LOS CUARTILES Y LA PRESENCIA DE VALORES EXTREMOS DE UNA DISTRIBUCIÓN DE FRECUENCIAS.
GRAFICO DE CAJA (BOX-PLOT) 197,35
PUNTOS ATIPICOS 162,42
127,50 Q3 75%
92,57
57,65
MEDIANA
Q1 25%
3. MODA
El valor de la variable que más se repite en el conjunto de datos Datos agrupados Valor de la variable de mayor frecuencia absoluta. 1.- Discreto
Mo = xi
2.- Continuos
C ⋅ f i +1 Mo = L i −1 + f i −1 + f i +1 '
INTERVALO MODAl. Corresponde al intervalo de mayor frecuencia absoluta fi
L'i −1 : Límite inferior del intervalo modal. f i-1 : frecuencia absoluta anterior al intervalo modal. f i +1 : frecuencia absoluta del intervalo siguiente al modal. C : amplitud del intervalo.
EJEMPLO 1. Obtención e interpretación de las medidas de tendencia central. Para las siguientes tablas de frecuencias obtener media, mediana y moda. Interprete. CASO 1. Tabla de frecuencias para datos de variables discretas
Clase (i) 1
xi
fi
x=
3
2
Me =
2
7
3
3
9
10
4
12
5
Mo =
CASO 2. Tabla de frecuencias para datos de variables continuas
Intervalos
fi
10-20
2
20-30
5
30-40
9
40-50
3
50-60
1
x
=
Me = Mo =