METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR (MESU 05)
Del 16/03 al 06/04/2009
Por: Ing. M.Sc. Francisco Martínez Solaris Mgs. Educación Superior
[email protected] [email protected]
METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR Nociones Generales
Sexo HAI
Femenino
Total
Masculino
n
%
n
%
n
%
Negativo
182
57.59
134
42.41
316
80.2
Positivo
46
58.97
32
41.03
78
19.8
Total
228
57.87
166
42.13
394
100
200 150
182 134 Femenino
100 46
50
Masculino 32
0 Negativo
Positivo
METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR Nociones Generales ESTADÍSTICA
DESCRIPTIVA
¿Qué es?...
INFERENCIAL
PROPOSITO
Características
PROPOSITO METODOS
METODO
• TABULARES • GRAFICOS • NUMERICOS
PROBABILISTICO
METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR Nociones Generales
Ciencia encargada de la Recolección, Manipulación, Organización y Presentación de información de manera tal que ésta tenga una Confiabilidad determinada
METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR Nociones Generales INFERENCIA ESTIMACION
Población N Parámetro s µ, σ2, p, etc
Deducción
TECNICAS DE MUESTREO
Muestra n=? Estadísticos Estadígrafos
METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR Nociones Generales
MUESTREO
Probabilístico
MAS, MAP y MAE
No Probabilístico
Probabilística Azar
MUESTRA
Tipos No Probabilística Arbitraria
METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR
Nociones Generales
POBLACION
MUESTRA Atributo
• Nombre • Definición • Rango de Valores • Clasificación
Cambiar Variable
Elementos Cualitativas
Tipos Cuantitativas
Categorías Discretas Continuas
METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR
Nociones Generales
• Nombre
Variable
Elementos
+ Medirse
• Definición • Rango de Valores • Clasificación
Nominal Ordinal
Escalas de Medición
De Intervalo De Razón
METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR
Métodos Tabulares
DESCRIPTIVA METODOS
TABULARES
Sumatoria
Sea X y Y dos variables y sea x1, x2, … xn y y1, y2, … yn, valores que toman las variables X y Y, y sean “a” y “b” dos constantes. Entonces: x1 + x2 + x3 + …xn
∑
n i =1
y1 + y2 + y3 + …yn
∑
xi Propiedades
n i =1
yi
METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR
Propiedades de Sumatoria
METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR
Métodos Tabulares/Ordenamiento
Edad (años)
Edad (años)
17
15
18
16
18
16
16
17
21
17
15
Ordenándolo
17 19 20
18 18
Desventaja
Valores extremos
18 18
18
19
16
20
18
21
Valores mas frecuente
Valores extremos
METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR Cuadro de Frecuencia
Cuadros de Frecuencia
Edad (años)
fi
fr
Fia
Fra
15
1
8.3
1
8.3
16
2
16.7
3
25.0
17
2
16.7
5
41.7
18
4
33.3
9
75.0
19
1
8.3
10
83.3
20
1
8.3
11
91.7
21
1
8.3
12
100
Total
12
100
METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR Cuadro de Frecuencia
Lugar de realización del Diplomado
n
%
Extranjero
19
13.87
Universidad Objeto de Estudio
87
63.50
Otras universidades bolivianas
31
22.63
137
100
Total
METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR
Cuadro de Frecuencia
67.7
39.2
52.5
42.3
69.8
61.2
63.9
37.2
45.7
41.7
69.1
55.5
64.9
38.9
52.4
41.9
69.2
58.9
68.3
39.2
52.6
42.7
70.0
61.9
68.3
39.2
53.3
45.5
70.1
63.2
Cuadro de Frecuencia
La Estadística ofrece otra alternativa Tablas de Frecuencias Absolutas y Relativas
METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR
Tabla de Frecuencia Procedimiento
Definir el Número de Intervalos Ac = A/k A = Valor Máx.- Valor Mín.
≥ 5 ó ≤ 20 ó 25 Sturges K = 1 + 3.33* log n
Tipo de Intervalos
(Li - LS]
Ac = Ajustada RI = Ac*K > A MD = (RI – A)/2
METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR Tabla de Frecuencia
Intervalos de Clases
PMC
fi
fr
Fia
Fra
37.1 a 42.6
39.85
8
0.27
8
0.27
42.6 a 48.1
45.35
3
0.10
11
0.37
48.1 a 53.6
50.85
4
0.13
15
0.50
53.6 a 59.1
56.35
2
0.07
17
0.57
59.1 a 64.6
61.85
4
0.13
21
0.70
64.6 a 70.1
67.35
9
0.30
30
1
30
1
METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR Métodos Gráficos
Diagrama de Puntos Histograma Métodos Gráficos Clásicos
Polígono de Frecuencias Ojiva Diagrama de Sectores
METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR Diagrama de Puntos
15
16
17
18
Edad (años)
19
20
21
METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR
Tiempo (minutos)
0.1
64 .6
a7
4.6
59 .1
a6
9.1
53 .6
a5
3.6 a5
48 .1
42 .6
a4
2.6 a4
37 .1
8.1
Histograma de Frecuencias Absolutas
10 8 6 4 2 0 37 .1
Número de Estudiantes (fi)
Histograma
METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR Polígono de Frecuencias
Número de Estudiantes (fi)
10
Polígono de Frecuencias Absoluta
8 6 4 2 0 39.85 39.85 45.35 50.85 56.35 61.85 67.35 72.85 Puntos Medios de Clases
METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR Ojiva
40
Ojiva/Polígono de Frecuencias Acumuladas
fia
30 20 10 0 37.1
42.6
48.1
53.6
59.1
Tiempos (minutos)
64.6
70.1
METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR Diagrama de Sectores
1 -------360 19 ------- x
(19*360) X=
= 49.9 137
Lugar de realización de estudios Postgraduales
n
Grados
Extranjero
19
50
Universidad de Interés
87
229
Otras universidades bolivianas
31
81
137
360
Total
METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR Diagrama de Sectores
Lugar de realización de estudios postgraduales Otras universidades bolivianas 22.63%
Extranjero 13.87%
Universidad de Interés 63.50%
METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR
Métodos Numéricos (Medidas de Tendencia Central) Cuando se desea comparar dos o más poblaciones o bien muestras, y si las variables de interés son de carácter numérico … Los métodos tabulares no son los más recomendables
La Estadística oferta otra herramienta llamada Métodos Numéricos
METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR Medidas de Tendencia Central
Localizan el centro de una base de datos numéricas
Medidas de Tendencia Central
Métodos Numéricos
Cuantifican cuánto se dispersan los datos de una medida de tendencia central
Medidas de Dispersión
METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR Medidas de Tendencia Central
Promedio Media Ponderada Medidas de Tendencia Central
Mediana Moda
METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR Medidas de Tendencia Central/Promedio Población
Promedio
Media µ Poblacional
Es la sumatoria de las observaciones que toma una variable dividido entre el total de éstas
Muestra
Media Muestral
x
Se interpreta como el punto de equilibrio de una base de datos numéricas
METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR Medidas de Tendencia Central
Tiempo (minutos) 52.6 38.9 68.3 67.2 63.9 64.9 68.3 39.2 42.3
Suma Promedio
61.9 567.5 56.75
Desviaciones ( xi − x ) -4.15 -17.85 11.55 10.45 7.15 8.15
Propiedad
-17.55 -14.45 0
∑ ( xi − x ) = 0 i =1
11.55
5.15
n
Suma
METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR Medidas de Tendencia Central Media en datos tabulados Si la tabla no presenta clases abierta es posible hacer una estimación de la media tomando en cuenta lo siguiente: • PMC es el promedio de las observaciones de las observaciones que caben dentro del intervalos. • PMC*fi proporciona una estimación de la suma de las observaciones que caben en el intervalo y como una tabla tiene k-ésimo intervalos entonces:
METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR Medidas de Tendencia Central Intervalos de Clases
PMC
fi
37.1 a 42.6
39.85
8
318.8
42.6 a 48.1
45.35
3
136.05
48.1 a 53.6
50.85
4
203.4
53.6 a 59.1
56.35
2
112.7
59.1 a 64.6
61.85
4
247.4
64.6 a 70.1
67.35
9
606.15
30
1624.5
PMC*fi
x=
1624.5 = 54.15 30
METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR Medidas de Tendencia Central Cuando los datos tienen diferente peso dentro de la base de datos, si desea obtener el promedio, la media aritmética no es la más indicada Cargo
fi
Salario
Rector
1
2000
Asesores
2
1200
Vic. Académico
1
1150
Vic. Administrativo
1
1250
Jefe de Carrera C.S
2
1000
Jefe de Carrera
5
800
Administrativo
2
600
Secretarias
9
120
METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR Medidas de Tendencia Central
Cargo
fi (wi)
Salario (xi)
Xiwi
Rector
1
2000
2000
Asesores
2
1200
2400
Vic. Académico
1
1150
1150
Vic. Administrativo
1
1250
1250
Jefe de Carrera C.S
2
1000
2000
Jefe de Carrera
5
800
4000
Administrativo
2
600
1200
Secretarias
9
120
1080 15080
xw =
15080 23
= 655.65
METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR Medidas de Tendencia Central Si los datos no se distribuyen simétricamente (curva simétrica) el promedio no es la mejor medida para localizar el centro de los mismos
Datos sin tabular
•Ordenar Impar n
Me = xn/2 + 0.5 Par Me = (xn/2 + x n/2 + 1 )/2
Mediana (Me)
Datos tabulados
Me = a +
(b-a)(0.5- c) d
METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR Medidas de Tendencia Central
n es impar
Tiempo (minutos)
Tiempo (minutos)
38.9
38.9
39.2
39.2
42.3
42.3
52.6
52.6
61.9
61.9
63.9
63.9
64.9
64.9
67.2
67.2
68.3
68.3
Me = xn/2 + 0.5
Me
METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR Medidas de Tendencia Central Tiempo (minutos)
Tiempo (minutos)
39.2
39.2
42.3
42.3
52.6
52.6
61.9
61.9
63.9
63.9
64.9
64.9
67.2
67.2
68.3
68.3
68.3
68.3
38.9
n es par
38.9
Me = (xn/2 + x n/2 + 1 )/2
Me = 62.9
61.9 + 63.9 2
= 62.9
Mediana es aquella medida de tendencia central que antes y después de ella no existe más del 50% de la información
METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR Medidas de Tendencia Central Me = a +
(b-a)(0.5- c) d
a = Límite inferior de la clase de la Me b = Límite superior de la clase de la Me c = Fra una clase antes de la clase de la Me (Nj-1) d = fr de la clase de la Me
Clase de la Mediana • Complete la columna Fia • Localice la menor Fia > n/2 • La clase a la que pertenece esta frecuencia es la clase de la mediana (Nj) • La Clase antes de Nj es Nj -1
METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR Medidas de Tendencia Central Me = a +
Me = 53.6 +
(b-a)(0.5- c)
a = Límite inferior de la clase de la Me
d
b = Límite superior de la clase de la Me
(59.1-53.6)(0.5- 0.5) = 53.6 0.07
Intervalos de Clases
PMC
fi
fr
Fia
Fra
37.1 a 42.6
39.85
8
0.27
8
0.27
42.6 a 48.1
45.35
3
0.10
11
0.37
48.1 a 53.6
50.85
4
0.13
15
0.50
53.6 a 59.1
56.35
2
0.07
17
0.57
59.1 a 64.6
61.85
4
0.13
21
0.70
64.6 a 70.1
67.35
9
0.30
30
1
c = Fra una clase antes de la clase de la Me (Nj-1) d = fr de la clase de la Me
Ubicación de la clase de la Me n = 30 n/2 = 15 Nj = 17… (53.6 – 59.1) Nj- 1 = (48.1 – 53.6)
METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR Medidas de Tendencia Central
Connotancia de Moda (Mo) en Estadística
Tiempo (minutos) 38.9 39.2
En caso de existir es la (s) observación (nes) que más se repiten en una base de datos
42.3 52.6 61.9 63.9 64.9
Distribuciones:
67.2
Unimodales
68.3
Bimodales Etc.
68.3
Mo
METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR Medidas de Tendencia Central (ficmo- ficpremo) Mo = Licmo + Acmo (ficmo-ficpremo) + (ficmo – ficpostmo) Donde: Licmo: Límite inferior de la Clase Modal Acmo: Ancho de clase de la Clase Modal Ficmo: Frecuencia absoluta de la Clase Modal Ficpremo: Frecuencia absoluta de la Clase Premodal Ficpostmo: Frecuencia absoluta de la Clase Postmodal Clase Modal es la (s) que tiene(n) la mayor (es) fi
METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR Medidas de Tendencia Central (ficmo- ficpremo) Mo = Licmo + Acmo (ficmo-ficpremo) + (ficmo – ficpostmo) Intervalos de Clases
PMC
fi
37.1 a 42.6
39.85
8
42.6 a 48.1
45.35
3
48.1 a 53.6
50.85
4
53.6 a 59.1
56.35
2
59.1 a 64.6
61.85
4
64.6 a 70.1
67.35
9
(9 - 4) Mo = 64.6 + 5.5
= 66.56 (9 - 4) + (9 – 0)
METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR Medidas de Dispersión
Una medida de tendencia central por si sola no es tan importante. Por esta razón debe estar acompañada de una medida de dispersión Rango/Distancia/Amplitud o Recorrido
Varianza (Variancia)
Medidas de Dispersión Desviación Típica o Estándar
Coeficiente de Variación
METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR Medidas de Dispersión
Rango
Rango = Valor Máximo – Valor Mínimo Población ( σ²)
Varianza
∑ ( xi − µ ) N
σ = 2
2
i=1
N
Es el promedio de las desviaciones al cuadrado de las observaciones que toma una variable respecto a su media
Muestra (S²)
∑ n xi n 2 i =1 xi − ∑ i =1 n S2 = n−1
2
METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR Medidas de Dispersión xi
(Desviaciones)2
52.6
17.2225
38.9
318.6225
68.3
133.4025
67.2
109.2025
63.9
51.1225
64.9
66.4225
68.3
133.4025
39.2
308.0025
42.3
208.8025
61.9
26.5225
Sumatoria
567.5
1372.725
Promedio
56.75
1372.725 S² =
= 152.525mi²/est² 10 - 1
Desventaja Desviación Típica
S = √S²
S = √152.525 = 12.35 min/est
Interpretación 56.75 ± 12.35 min/est.
x±S
METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR Medidas de Dispersión Si la tabla no presenta clases abierta es posible hacer una estimación de la varianza de la siguiente forma: Intervalos de Clases
PMC
fi
37.1 a 42.6
39.85
8
42.6 a 48.1
45.35
3
48.1 a 53.6
50.85
4
53.6 a 59.1
56.35
2
59.1 a 64.6
61.85
4
64.6 a 70.1
67.35
9
METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR Medidas de Dispersión
S2 =
PMC*fi
PMC2*fi
8
318.8
12704.18
45.35
3
136.05
6169.8675
48.1 a 53.6
50.85
4
203.4
10342.89
53.6 a 59.1
56.35
2
112.7
6350.645
59.1 a 64.6
61.85
4
247.4
15301.69
64.6 a 70.1
67.35
9
606.15
40824.203
1624.5
91693.475
Intervalos de Clases
PMC
fi
37.1 a 42.6
39.85
42.6 a 48.1
2 ( 1624.5) 91693.475 −
30 −1
30
= 124.774
S = 124.774 =11.70
METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR Medidas de Dispersión
Todas las medidas de dispersión expuestas anteriormente son dimensionales (toman las unidades de medidas de las variables) Existe otra medida de dispersión pero adimensional llamadas Coeficiente de Variación o Dispersión Relativa
S C.V = x
S C.V = * 100 x
METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR Medidas de Dispersión
Las medidas de dispersión cuantifican cuánto se dispersan los datos alrededor de una medida de tendencia central, pero,¿Para donde se desvían los datos?, a la izquierda de la media, a la derecha o se distribuyen simétricamente. Existen otras medidas aplicable solo a curvas unimodales que tratan de las deformación de curvas tanto de forma horizontal como vertical
METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR Deformación de Curvas Unimodales
Asimetría
Asimetría Positiva
x
> Me > Mo
Curvas Simétricas
x
= Me = Mo
Asimetría Negativa
x
< Me < Mo
METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR Deformación de Curvas Unimodales Curva Leptocúrtica
Curtosis
Curva Mesocúrtica
Curva Platicúrtica
Kur > 3 Kur = 3
Kur < 3
METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR Regresión Lineal Simple
X1 Y
X2 . . .
Xi
Y: Variable Dependiente X: Variable Independiente
Y = f(X)
En el desarrollo de los eventos, puede ser que una variable sea afectada por el comportamiento de otra (s) variable (s) Es de interés poder cuantificar este tipo de relación de manera que se pueda predecir una variable en función de otra En Regresión Lineal Simple es de interés cuando una variable afecta el comportamiento de otra variable Propósito de la R.L.S: Predicción
METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR Regresión Lineal Simple
Por análisis de regresión se entiende al conjunto de métodos estadísticos que tratan con la formulación de modelos matemáticos que describen la relación entre variables y el uso de estas relaciones modeladas con el propósito de predecir e inferir. Por Regresión Lineal Simple se entiende al conjunto de cambios que experimenta una variable dependiente por un único cambio en la variable independiente
Supuestos del Análisis de Regresión Lineal Simple
“Y” es una variable aleatoria cuya distribución probabilística depende de “X” Modelo de la Línea Recta Homogeneidad de Varianza Normalidad Independencia
METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR
Regresión Lineal Simple/Diagrama de Dispersión Llamado también Ploteo de Datos, tiene como propósito mostrar la posible tendencia (en caso de existir) entre las variables “X” y “Y”. Consiste en llevar los pares de valores “x, y” a un sistema de coordenadas (bidimensional) Y (x, y)
X
METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR
Regresión Lineal Simple/Diagrama de Dispersión
METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR Regresión Lineal Simple/Métodos de Mínimos Cuadrados
El supuesto No 2 de RLS plantea que de existir una relación entre “X” y “Y”, ésta es una línea recta, por lo tanto se puede pensar en una ecuación de la siguiente forma: Parámetros
Estimación De tal manera que se llegue a obtener una ecuación de la siguiente naturaleza:
METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR Regresión Lineal Simple/Métodos de Mínimos Cuadrados Uso de Mínimos Gauss)
la Técnica de Cuadrados (Carl
A partir de muestras (x1, y1), (x2, y2), …(xi, yi) de las variables “X” y “Y”, se trata de obtener los estimadores . Para ello la Técnica de Mínimos Cuadrados minimiza la suma de cuadrado de las distancias entre los valores observados y los estimados de tal manera que :
Y
X
METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR
Regresión Lineal Simple/Recta de Estimación
Estimada una vez la recta de Predicción y teniendo en cuenta que el propósito de la R.L.S es la predicción, se hace necesario estar seguro que la ecuación estimada es capaz de predecir. Por esta razón es necesario validar la ecuación estimada
METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR Regresión Lineal Simple/Validación de la Recta de Estimación
Validación Cálculo de Coeficiente de Determinación R²
Cuantifica la cantidad de la variabilidad de “Y” que puede ser explicada por “X” R² ≥ 70%
Análisis de Varianza de la Regresión “ANARE”
METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR Regresión Lineal Simple/Validación de la Recta de Estimación/ANARE
Por análisis de Varianza se entiende, de forma general, a la partición de la variación total en fuente de variación conocida que en el caso de R.L.S son de acuerdo al siguiente modelo aditivo lineal: xi= Variación debida a Regresión εi = Variación debida al Error FV
gl
SC
CM
Regresión
1
SCRegresión
CMRegresión
SCError SCTotales
CMError
Error Total
n-2 n.1
Fc CMRegresión /CMError
Ft (Pr>F)
Regla de Decisión NRHo : Fc ≤ Ft RHo : Fc > Ft