CAPÌTULO I PLANTEAMIENTO DEL PROBLEMA 1.1.
FORMULACIÓN DEL PROBLEMA La estadística se ha convertido en una herramienta de capital importancia, sus
métodos y procedimientos son de uso casi obligatorio en la gran mayoría de las ramas del saber. Las ciencias sociales se valen de ella para indagar, hasta donde el método de la estadística lo permite, sobre las tendencias presente y futura del hombre en su constante proceso de cambio. El educador se puede valer de ella para lograr una aproximación al conocimiento de la realidad, especialmente para determinar la precisión de sus observaciones y mediciones. Por otra parte, el razonamiento estadístico constituye un medio útil para desarrollar un aspecto importante de la capacidad intelectual de una persona por lo que viene a formar parte también de la formación humana integral.
1.1.1. PROBLEMA GENERAL ¿En qué medida la aplicación de los conocimientos estadísticos pueden mejorar la toma de decisiones en las diferentes áreas del sector educativo?
1.2.
OBJETIVOS
1.2.1. OBJETIVO GENERAL: Aplicación de métodos estadísticos que permitan la toma de decisiones apropiadas en situaciones complejas que se caracterizan por estar sometidas a distintitos grados de incertidumbre.
1.2.2. OBJETIVOS ESPECIFICOS Dotar al estudiante de las capacidades y destrezas necesarias en lo que se refiere a cálculo de probabilidades, muestreo estadístico, estimación de parámetros y contrastes de hipótesis Formar en técnicas avanzadas como el uso de los programas E PIDAT 4.0 y MINITAB para desarrollar tareas específicas en empresas Reforzar el conocimiento, transmitiendo métodos y técnicas estudiadas en el curso de Estadística 2 mediante una formación completa y actualizada. 1
Formar en la metodología de la investigación propia de esa área de conocimiento, construyendo un trabajo de investigación propio, estableciendo antecedentes para la elaboración de trabajos futuros. Insertar en el estudio la incorporación de diversos programas que exijan el desarrollo integral de los estudiantes.
2
CAPÍTULO II MARCO TEÒRICO
2.1. MUESTREO 2.1.1. MUESTREO SIMPLE ALEATORIO Es un procedimiento de muestreo probabilístico que da cada elemento de la población objetivo y a cada posible muestra de un tamaño determinado, la misma probabilidad de ser seleccionado. Uno de los puntos importantes es que se tenga el tamaño correcto de muestra, para no tener un error de muestreo, el cual debe ser el mínimo posible. A. Pasos para seleccionar una muestra aleatoria simple a) Definir la población objetivo. b) Identificar el marco de muestreo. c) Asignar un número único a cada elemento. d) Determinar el tamaño de la muestra. e) Seleccionar al azar el número específico de elementos de la población.
B. Subtipos de muestreo aleatorio simple a) Muestreo con reemplazo: después de que un elemento ha sido seleccionado de entre el marco de la muestra se devuelve y es elegible para ser seleccionado de nuevo. b) Muestreo sin reemplazo: después de que un elemento se selecciona del marco de la muestra, se retira de la población y no regresa a la base del muestreo, este tipo de muestreo suele ser más eficiente ya que permite que el mismo elemento de la población entre a la muestra de una vez.
C. Ventajas y desventajas a) Tiende a producir muestras representativas y permite el uso de la estadística inferencial en el análisis de datos recogidos. b) Cada selección es independiente de otras selecciones. c) Es más fácil que otros procedimientos de muestreo probabilístico. d) Requiere un marco de muestreo de elementos de la población objetivo.
3
e) Tiende a tener errores de muestreo más grandes y menos precisión de muestreo estratificado del mismo tamaño de la muestra. f) Los encuestados pueden estar dispersos, por tanto, los costos de recolección de datos pueden ser superiores a las de otros diseños de la muestra de probabilidad. g) Puede no producir un número suficiente de elementos de pequeños subgrupos
D. Fortalezas y debilidades
FORTALEZAS Cada
combinación
DEBILIDADES
posible
de No se aprovecha del conocimiento
muestreo tiene igual probabilidad de que el investigador podría tener de la ser seleccionado.
población.
Más fácil de entender y comunicar a Puede tener errores de muestreo más otros.
grandes y menos precisión que otros diseños de muestreo con el mismo tamaño de la muestra.
Tiende
a
producir
muestras Si subgrupos de la población tienen
representativas
intereses particulares no pueden ser incluidos con un número suficiente en la muestra.
2.1.2. MUESTREO ESTRATIFICADO Es un procedimiento de muestreo donde el objetivo de población se separa en segmentos exclusivos, homogéneos (estratos), y luego una muestra aleatoria simple se selecciona de cada segmento (estrato). Las muestras seleccionadas de los diversos estratos se combinan en una sola muestra.
A. Pasos de selección para un muestreo estratificado a) Definir la población objetivo. 4
b) Identificar la variable de estratificación y determinar el número de estratos. c) Identificar la muestra. d) Dividir el marco de muestreo en estratos. e) Asignar un número único a cada elemento. f) Determinar el tamaño de muestra para cada estrato. g) Seleccionar al azar el número específico de elementos de cada estrato.
B. Ventajas a) Tiene mayor capacidad de hacer inferencia dentro de un estrato y comparaciones entre los estratos b) Tiene errores de muestreo al azar un poco más pequeño para las muestras de mismo tamaño, por lo que requiere tamaños de muestra más pequeños para el mismo margen de error. c) Obtiene un amuestra más representativa porque se asegura de que los elementos de cada estrato son representados en la muestra. d) Saca mayor provecho de los conocimientos que el investigador tiene sobre la población. e) Permite diferente método de investigación y procedimientos que se utilizaran en diferentes estratos. f) Permite el análisis de patrones dentro del estrato.
C. Debilidades a) Requiere información sobre la proporción de la población total que pertenece a cada estrato. b) La información sobre las variables de estratificación es requerida para cada elemento de la población. c) Es más caro, consume tiempo y es más complicado que el muestreo aleatorio. d) La selección de las variables de estratificación puede ser difícil si un estudio implica un gran número de variables. e) El análisis de los datos recogidos es más complejo que el análisis de los datos recogidos a través del muestro aleatorio simple. 2.1.3. MUESTREO SISTEMÁTICO
5
En este muestreo se hace una selección aleatoria del primer elemento para la muestra, y luego se seleccionan los elementos posteriores utilizando intervalos fijos o sistemáticos hasta alcanzar el tamaño de la muestra deseado. A. Pasos para la selección de un muestreo sistemático a) Definir la población objetivo. b) Determinar el tamaño deseado de la muestra. c) Identificar el marco muestre existente o desarrollar un marco de muestreo de la población objetivo. d) Determinar el número de elementos en el marco de la muestra.
B. Fortalezas a) Si el proceso de selección es manual, el muestreo sistemático es más fácil, más simple, menos tiempo y más económico. b) La población objetivo no tiene por qué ser numerada y se compila un marco si hay representación física. c) Si el orden de los elementos en el muestreo se asignó al azar, el muestreo sistemático puede producir resultados similares al muestreo aleatorio. d) Muestreo sistemático asegura que la muestra ex extendida a toda la población.
C. Debilidades a) Si el intervalo de muestreo se relaciona con el orden periódico de los elementos en el marco de muestreo, puede resultar una mayor variabilidad. b) Elementos
combinados
tienen
diferentes
probabilidades
de
ser
seleccionados. c) La estimación de las variaciones es más compleja que en el muestreo aleatorio simple.
2.1.4. MUESTREO POR CONGLOMERADOS Este es un procedimiento de muestreo probabilístico en que los elementos de la población son seleccionados al azar en forma natural por agrupaciones. A. Paso para seleccionar un muestreo por conglomerados 6
a) Definir la población objetivo. b) Determinar el tamaño de la muestra deseada. c) Identificar un marco de muestreo existente o desarrollar un nuevo marco de muestreo de grupos de la población objetivo. d) Determinar el número de grupos que se seleccione. e) Seleccionar al azar el número previsto de las agrupaciones.
B. Tipos de muestreo por conglomerado a) Monotípico: el muestreo se hace una sola vez. b) Bimetálico: el diseño incluye todos los pasos del diseño de muestreo por conglomerados, con una excepción del último paso.
2.2.
MEDIDAS ESTADÍSTICAS
2.2.2. MEDIDAS DE DISPERSIÓN Son parámetros estadísticos que indican cómo se alejan los datos respecto de la media aritmética, sirven como indicador de la variabilidad de los datos. Las medidas de dispersión más comunes son el rango, desviación estándar y varianza. a) Rango: indica la dispersión entre los valores extremos de una variable. b) Desviación estándar: mide el grado de dispersión de los datos con respecto a la media, se denota como s para una muestra u o para población. c) Varianza: es otro parámetro utilizado para medir la dispersión de los valores de una variable respecto a la media, corresponde a la media aritmética de los cuadrados de las desviaciones respecto a la media.
2.2.3. MEDIDAS DE FORMA Permiten comprobar si una distribución de frecuencia tiene características especiales como simetría, asimetría, nivel de concentración de datos y nivel de apuntamiento que la clasifique en un tipo particular de distribución, estas medidas son necesarias para determinar el comportamiento de los datos y así, adaptar herramientas para los análisis probabilísticos.
7
a) Distribución simétrica: al dividir una distribución de frecuencia mediante la mediana, ambas áreas resultantes son iguales, es decir, los datos se distribuyen de la misma forma y el área abarcada por ambos lados es equivalentes. o Distribución uniforme. - las frecuencias todas tienen las mismas alturas. o Distribución triangular. - los datos se distribuyen dando a un triángulo. o Distribución binomial simétrica. - presenta simetría con dos modas. b) Distribución asimétrica. – los datos no se distribuyen de forma uniforme y similar en las áreas que dan como resultado al dividir la distribución de frecuencia por la mediana. o Distribución sesgada hacia la izquierda. - Los datos se concentran hacia la izquierda de la distribución. o Distribución sesgada hacia a derecha. - Los datos se concentran hacia la derecha de la distribución. o Distribución asimétrica. - No presenta uniformidad en la distribución de los datos. c) Relación entre la media, mediana y moda. – o Cuando una distribución de frecuencia es simétrica, la media, mediana y moda coinciden en su valor (X=Me=Mo). o En el caso de la distribución binomial simétrica, es necesario calcular el promedio de las modas. o En una distribución sesgada a la izquierda, la moda es menor a la mediana, y esta a su vez menor que la media (X<Mo<Me). o En una distribución sesgada a la derecha la relación se invierte, la moda es mayor a la mediana, y esta a su vez mayor que la media (Mo>Me>X). d) Coeficiente de asimetría. – Mide el grado de asimetría de la distribución con respecto a la media. Un valor positivo de este indicador significa que la distribución se encuentra sesgada hacia la izquierda. Un resultado negativo significa que la distribución se sega a la derecha. CÁLCULO. o Paso1. Calculamos la desviación estándar de muestra. 8
o Paso2. Calculamos la diferencia de cada valor con respecto a la media, dividido por la desviación y luego elevado a la 3. o Paso 3. Se calcula el indicador completo. e) Curtosis. – Indica que tan apuntada o achatada se encuentra una distribución respecto a un comportamiento normal (distribución normal). Si los datos están muy concentrados hacia la media, la distribución es leptocúrtica (curtosis mayor que 0), si los datos están dispersos la distribución es platicurtica (curtosis menor a 0). f)
Media. – es la suma de todos los datos dividida entre números total de datos.
Se calculan dependiendo de cómo vengan ordenados los datos. La media de un grupo de datos se calcula: se debe multiplicar cada dato con su respectiva frecuencia, sumar todos estos productos, y el resultado dividirlo por la suma de los datos. g) Moda. – Es el dato que más se repite, es decir, aquel tiene mayor frecuencia absoluta, en caso de existir dos valores de la variable que tengan la mayor frecuencia absoluta habría dos modas. h) Mediana. – Es el valor que ocupa el lugar central entre todos los valores del conjunto de datos, cuando estos están ordenados en forma creciente o decreciente. Se ordena los datos de menor a mayor
2.3.
ESTIMACION PUNTUAL Y POR INTERVALOS DE CONFIRMACION
2.3.2. ESTIMACIÓN PUNTUAL: Una estimación del valor de un parámetro poblacional desconocido, es un número que se utiliza para aproximar el verdadero valor de dicho parámetro poblacional. A fin de realizar la estimación, tomaremos una muestra de la población y calcularemos el parámetro muestral asociado. 2.3.3. ESTIMACIÓN POR INTERVALO: El teorema de chebyshev nos indica que en una distribución normal, aproximadamente un 95% de los datos estaban situados a una distancia inferior a dos desviaciones estándar de la media.
9
Este tipo de intervalos se llaman intervalos de confianza de un parámetro poblacional, el nivel de confianza (1-a) del intervalo es la probabilidad de que este contenga al parámetro poblacional. a) Nivel de confianza. – probabilidad asociada con una estimación de intervalo de un parámetro de población. Esta indica que tan seguro se está de que la estimación de intervalo incluirá al parámetro de la población. Los niveles de confianza que más utilizan son 0.9, 0.95 y 0.99. b) Intervalo de confianza. – es el alcance, rango o recorrido de la estimación que se hace y que tiene designada una probabilidad de que incluya el valor real del parámetro de la población que se está estimando. c) Límites de confianza. – son el límite inferior y superior del intervalo de confianza. d) Coeficiente de confianza. – Es el nivel de confianza que tenemos en que el intervalo contiene el valor desconocido del parámetro. e) Relación entre nivel de confianza e intervalo de confianza. – aunque podría pensarse que deberíamos utilizar un alto nivel de confianza en todos los problemas de estimaciones, en la práctica, altos niveles de confianza producen intervalos de confianza grandes y estos no son precisos. f)
La distribución t.o Es simétrica respecto de la media. o El eje horizontal es una asíntota y la gráfica se extiende de infinito negativo
a infinito positivo. o Su varianza es mayor que 1 por lo que gráficamente esta distribución es más achatada y más dispersa que la normal. o La varianza de la distribución depende de los grados de libertad. o Es más compacta y muestra áreas y valores de t solamente para algunos porcentajes. o No se enfoca en la probabilidad de que el parámetro de la población que se está estimando se encuentre dentro de nuestro intervalo de confianza, mide la probabilidad de que no esté dentro de nuestro intervalo de confianza. o Se deben especificar los grados de libertad con los cuales se esté trabajando.
10
2.4.
PRUEBA DE HIPOTESIS PARA PROPORCIONES a) Proporciones. – es una razón entre el número de éxitos y el número de
observaciones. Si x se refiere al número de éxitos y n al de observaciones, la proporción de éxitos en una cantidad fija de pruebas es x/n. b) Distribución binomial. – solo hay dos posibles resultados en un determinado intento de un experimento. Los datos de la muestra son el resultado del proceso de conteo. La probabilidad de éxito es la misma de una prueba a otra. Cada prueba es independiente de otra. c) Prueba de hipótesis. – las pruebas de hipótesis se basan en la diferencia entre la proporción de la muestra p y la proporción supuesta de la población. Se usa la proporción de la muestra y su desviación estándar para determinar el estadístico de prueba. P=x/n “media”. d) Estadístico de prueba. – recordemos que un estadístico de prueba es un valor calculado a partir de datos muestrales, que se utiliza para tomar decisión sobre el rechazo de la hipótesis nula, el estadístico prueba se calcula convirtiendo al estadístico muestral es una puntuación como z,t o X^2. e) Prueba de hipótesis para proporciones de dos muestras. – en este caso se empleará la prueba z, que se basa en la diferencia entre dos proporciones de dos muestras (p1-p2). Cuando tenemos muestras suficientemente grandes (mayor a 30) los datos siguen una distribución normal estándar. 2.5.
ESTIMACION DE PARAMETROS El proceso de estimación en inferencia estadística puede ser descrito como el proceso
de estimar un parámetro a partir del estadístico correspondientes, tal como usar una media muestra para estimar la media poblacional (parámetro). 2.5.1.
Chi cuadrado
Esta prueba puede utilizarse incluso con datos medibles en una escala nominal. La hipótesis nula de la prueba Chi- cuadrado postula una distribución de probabilidad totalmente especificada como el modelo matemático de la población que ha generado la muestra. 11
CAPÌTULO III METODOLOGÍA
3.1.
MÉTODO CIENTÍFICO En la presente investigación se utilizará el método científico y dentro de esta los
siguientes métodos 3.1.1. Método deductivo Este método nos permite estudiar el problema de manera general para luego sacar conclusiones particulares. 3.1.2. Tipo de investigación Este método a través de observaciones que permitirá llegar a descubrir aspectos fundamentales del aspecto a investigar. 3.2.
POBLACIÒN Y MUESTRA
3.2.1. Población La población de la presente investigación la integran todos los docentes que están involucrados en la matriz del concurso público de ingreso a la carrera pública magisterial y de contratación docente en instituciones educativas públicas de educación básica.
ESTRATOS INICIAL PRIMARIA Primaria Primaria Educación Física SECUNDARIA Arte Ciencia tecnología y ambiente Comunicación Educación Física Educación para el trabajo Educación religiosa Formación ciudadana y cívica Historia geografía y economía Ingles 12
464 615 599 16 1039 44 82 247 59 115 28 14 91 122
Matemática Persona, familia y relaciones humanas TOTAL
300 250 200 150 100 50 0
203 34 2118
CONGLOMERADO 247 SECUNDARIA 44
82
115 59
203 91
28
14
122 34
Contabilizando la población da un total general de 2118 personas involucradas en el proceso investigativo
13
3.2.2. Muestra
ESTRATOS 1039
615 464
INICIAL
Z N P Q
PRIMARIA
SECUNDARIA
= 95%= (z =1,96) (margen de confiabilidad) 1.96 Tamaño de la población (N° de Clientes = seleccionados) 2,118 = Éxito de la varianza poblacional (0.50) 0.5 = Fracaso de la varianza poblacional (0.50) 0.5 14
E n
= 5% = 0,05 = Tamaño necesario de la muestra
CAPÌTULO IV APLICACIÓN Y RESULTADOS
15
0.10 92
4.1. PROBABILIDADES Ejercicios
1) Se extrae un docente al azar y se define los siguientes sucesos: A: el docente extraído sea varón B: el docente extraído se deportista C: el docente extraído tenga una resistencia que supere los 50.
Docente
Sexo
Deportistas
Resistencia
1
V
1
80
2
V
1
96
3
V
0
40
4
V
1
110
5
M
1
45
6
M
1
78
7
V
1
85
8
V
0
45
9
V
1
56
10
M
1
100
Fuente: Propia Elaboración: Propia Conteste las siguientes preguntas: 1. ¿Cuál es la probabilidad de que el docente extraído sea varón? P(A)=CF/CP=7/10=0,7 2. ¿Cuál es la probabilidad que sea deportista? P(A)=CF/CP=5/7=0,71 3. ¿Cuál es la probabilidad que su resistencia supere los 55? 16
P(A)=CF/CP=5/7=0,71 4. ¿Cuál es la probabilidad de que sea varón y deportista? P(A)=CF/CP=7/10x5/7=0,5 5. ¿Cuál es la probabilidad de que sea varón y tenga la resistencia superior a 55? P(A)=CF/CP=7/10x5/7=0,5 6. ¿Cuál es la probabilidad de que sea varón deportista y tenga una resistencia mayor a 55? P(A)=CF/CP=5/7X5/7=0,5 7. ¿La docente extraída es mujer ¿Cuál es la probabilidad de que sea deportista? P(A)=CF/CP=3/3=1 8. Si el docente extraído es deportista ¿Cuál es la probabilidad de que sea mujer? P(A)=CF/CP=3/8=0,4 9. ¿Cuál es la probabilidad de que sea varón o deportista? P(A)=CF/CP=7/8=0,875 10. ¿Cuál es la probabilidad de que sea mujer y tenga una resistencia mayor a 55? P(A)=CF/CP=3/3=1 11. ¿Son los sucesos A y B independientes? ¿Y Ay C? Si ambos ya que siendo mujer o varón no es necesario que sean deportistas En el examen para la carrera pública magisterial de 3000 docentes postulantes de “Educación inicial”, “Educación primaria” y “Educación secundaria” se realiza una encuesta sobre el aumento de preguntas en los exámenes. Los resultados obtenidos son los siguientes: Docentes de educación inicial
Docentes de educación primaria
17
Docentes de educación secundaria
TOTAL
A FAVOR
700
480
501
1681
EN CONTRA
400
505
414
1319
TOTAL
1100
985
915
3000
Si se extrae un sujeto al azar: 1. ¿Cuál es la probabilidad de que esté a favor del aumento de preguntas en los exámenes? P(A)=CF/CP=1681/3000=0.56 2. ¿Cuál es la probabilidad de que sea docente de educación inicial? P(A)=CF/CP=1100/3000=0.37 3. ¿Cuál es la probabilidad de que no sea docente de educación secundaria? P(A)=CF/CP=1100/3000+ 985/3000=0.70 4. ¿Cuál es la probabilidad de que sea docente de educación inicial y este a favor? P(A)=CF/CP=700/3000= 0.23 5. ¿Son independientes los sucesos “ser docente de educación primaria” y “estar a favor del aumento de preguntas en los exámenes”? Si son independientes 6. Calcule la probabilidad de que el objeto extraído cumpla al menos uno de los siguientes sucesos: “ser docente de educación primaria” o “estar a favor del aumento de preguntas en los exámenes”. P(A)=CF/CP=480/985=0.49 7. Si el sujeto extraído está a favor del aumento de preguntas en los exámenes, ¿Cuál es la probabilidad de que sea docente de educación secundaria? P(A)=CF/CP=501/1681=0.30 8. Si el sujeto extraído está en contra, ¿Cuál es la probabilidad de que sea docente de educación inicial?
18
P(A)=CF/CP=400/1319=0.30
2) Un total de 120 docentes a la carrera pública magisterial se matricularon en un curso de reforzamiento el cual se evaluó en dos pruebas, los resultados indicaron que hubo un promedio de 50 aprobados, que había 75 sujetos que rindieron la segunda prueba y de ellos 20 aprobaron. Se define dos sucesos: A: Haber dado el primer examen B: Haber dado el segundo examen Conteste las siguientes preguntas: 1. ¿Cuál es la probabilidad de que, al extraer un sujeto al azar, este aprobado en el segundo examen? P(A)=CF/CP=75/120= 0,63 2. ¿Si se selecciona un sujeto que aprobó? ¿Cuál es la probabilidad de que haya sido en el segundo examen? P(A)=CF/CP=20/50=0,4 3. ¿Cuál es la probabilidad de que al extraer un sujeto al azar haya dado el segundo examen y no haya aprobado? P(A)=CF/CP=75/120X55/75=0,5 4. ¿Son los sucesos A y B independientes? No, porque algunas personas dieron ambos exámenes y otro solo uno. 5. ¿Cuál es la probabilidad de que suceda al menos uno de los dos casos? P(A)=CF/CP=105/120= 0,88 6. Si se selecciona un sujeto que no rindió el segundo examen, ¿Cuál es la probabilidad de que haya aprobado? P(A)=CF/CP=30/45=0,7
4.2. MUESTREO
19
A. MUESTREO ALEATORIO SIMPLE Al tener nuestra base datos sobre los postulantes a la carrera pública magisterial deseamos hacer una encuentras a una cierta cantidad de postulantes sobre su rendimiento en dicha postulación para ello recurrimos a un muestreo aleatorio elaborado en Excel.
20
Para llegar a este resultado, en Excel se ha tenido que hallar una muestra más pequeña tomando en cuenta la base de datos luego se aplican las formulas respectivas y el mismo programa ha escogido aleatoriamente los 92 integrantes de la muestra. Del total de 2118 personas al hacer el procedimiento respectivo ser llega a qué se debe de encuestar a 92 docentes. Si se aumentara el tamaño de la muestra, el número de sujetos seleccionados podría aumentar y dividirlos en ambos grupos.
SE CONCLUYE QUE: El excel hace la selección de personas aleatoriamente por ello no se muestra ningún tipo de preferencia por ninguno de los miembros de la base de datos. La probabilidad de selección de cada miembro de la base de datos es la misma.
B. MUESTREO SISTEMATICO De la misma manera que en aleatorio queremos saber sobre el rendimiento en su postulación, pero en esta ocasión lo elaboraremos atreves del muestreo sistemático elaborado en Excel para ello tenemos que tener en cuenta cual es el factor, dicho factor lo hallaremos dividiendo la cantidad total de la base de datos entre la muestra.
21
Para llegar a este resultado se conto con el mismo tamaño de muestra, es decir 92, primero se eligio el factor es decir de cada cuanto sera el patron, luego se procedio a colocar sus respectivas formulas para que el sistema (excel) lo ordene de acuerdo al factor. Como resultado obtenemos el factor de 7 personas arrancando desde la persona número 1. Siendo el tamaño de muestra resultante de 92 personas. Se obtuvieron 92 personas seleccionadas sistemáticamente SE CONCLUYE QUE: El muestreo sistemático sigue ciertos parámetros fijados por el Excel, sin embargo hallar el factor a seguir no puede ser manipulado ya que es de acuerdo a los datos que se tienen. C. MUESTREO ALEATORIO ESTRATIFICADO Se investiga sobre docentes que rindieron el examen para la carrera pública magisterial y se tiene una muestra de 325, se desea saber la cantidad de méritos por los cursos de secundaria: artes, inglés, persona familia y relaciones humanas, formación cívica y ciudadana y educación religiosa, realizar un reparto proporcional de acuerdo a los méritos por curso. Primero se hace una pequeña base de datos conformada por los 325 docentes y se suma los méritos de acuerdo al área, de allí se procede a llevarlo al epidat. Para ello seleccionamos nuestra base de datos y luego los estratos que trabajaremos, después seleccionamos la opción de reparto proporcional para que de esa manera se reparta según la cantidad de méritos de cada curso y finalmente calculamos:
22
Según el muestreo aleatorio estratificado realizado a una población de 325 docentes los cuales pertenecen a 5 cursos especificados. se puede ver claramente que el curso que contiene docentes con más méritos es el estrato 2 que hace referencia al curso de “EBR Secundaria inglés”, de la misma manera el que tiene menos méritos es el estrato 5 el cual pertenece a “EBR Secundaria Educación Religiosa” SE CONCLUYE QUE: Según el muestreo aleatorio estratificado realizado a una población de 325 docentes se puede ver claramente que el curso que contiene docentes con más méritos es el estrato 2 que hace referencia al curso de “EBR Secundaria inglés”, de la misma manera el que tiene menos méritos es el estrato 5 el cual pertenece a “EBR Secundaria Educación Religiosa” D. MUESTREO POR CONGLOMERADOS
CONGLOMERADO MONOETÁPICO
Primero elegimos la base de datos a trabajar y lo llevamos al epidat
en el cual se debe llenar los ítems que nos pide, en este caso como conglomerado elegimos “NRO” y a “S3(*)” como el tamaño de conglomerado y finalmente calculamos:
23
SE CONCLUYE QUE:
Se concluye que la selección de la muestra en relación a la prueba
de conocimientos curriculares, pedagógicos y de la especialidad a través del muestreo por conglomerado es de 5 conglomerados por una muestra de 325, teniendo una probabilidad de selección de 0,2361 %
CONGLOMERADO BIETÁPICO
Se quiere obtener una muestra bietápica de 92 postulantes al concurso publico de ingreso a la carrera pública magisterial y de contratación docente la cual tiene registrados a 2118, la cual están distribuidos uniformemente en 14
grupos
correspondientes a su inscripción de los cuales se ha seleccionado 5 grupos.
Nro.
grupo de inscripción
muestra
EBR Secundaria ingles
total de inscritos 122
1 2
EBR Secundaria arte
44
5089.63636
3
EBR Secundaria Educación Física
59
3795.66102
4
EBR Secundaria Educación Religiosa
28
7998
5
EBR Secundaria Historia, Geografía y Economía
91
2460.92308
24
1835.60656
Paso 1: Abrimos el programa epidad selecionamos la opcion modulos muestreo, seleccion de muestras y finalmente muestreo por conglomerados bietapico
Paso 2: selecccionamos el excel con el que vamos a trabajar
25
Paso 3: hacemos click en la opción calcular mostrandonos como resultado los conglomerados selecionados los cuales son seleccionados aleatoriamente en este caso son el 2 y el 4 46 por cada uno de ellos
26
4.3. ESTIMACIÓN DE PARÁMETROS Se desea hallar un intervalo de confianza de 95% para el puntaje promedio de la prueba que se rindió comprensión de textos para los postulantes de EBR Secundaria arte. Para esto primero se sacara la desviación estándar y usa la siguiente muestra al azar de los puntajes obtenidos de 44 postulantes.
50 46 36 46 42 40 38 44 44 40 46 42 36 44 40 38 40 38 38 46 42 40 42 32 30 38 36 40 38 40 48 42 40 30 40 50 42 40 44 40 34 44 44 42
Para este tipo de ejercicios se cuenta con la ayuda del programa MINITAB
en el cual se digitan los datos a utilizar y luego elegimos lo que queremos hallar en este caso la desviación estándar y el grado de confianza, llenamos lo que pide y calculamos: Desviación estándar de puntaje Desviación estándar de puntaje = 4.52571 Z de una muestra: puntaje La desviación estándar supuesta = 4.53 Error Estándar De la Variable Puntaje
N 44
Media 40.727
Desv.Est. 4.526
Media 0.683
IC de 95% (39.389, 42.066)
Interpretación: Hay un 95% de confianza de que la media del puntaje en la parte que se rindió comprensión de textos para los postulantes de EBR Secundaria arte, caiga entre 39 y 42 puntos.
4.4. CHI CUADRADO
27
Se realizará una tabla de contingencia, prueba de asociación o prueba chi cuadrado. Tenemos plasmado aquí las asignaturas (comunicación, ingles, matemática), y los puntajes de los exámenes (s1=Raz. Verbal; s2=Raz. Lógico y s3=Raz. Matemático) que se aplicaron en cada asignatura
Seleccionamos stat > tables > cross tabulation and chi-square.
Continuando ingresamos los datos respectivos.
28
En filas agregamos la asignatura En columna la situación de puntaje. Y en frecuencia la cantidad de candidatos seleccionados o presentados.
En la opción chi – square, se selecciona las siguientes alternativas:
Prueba chi cuadrado. Celdas de conteo esperado. Residuo estandarizado.
29
Nos dirigimos a la asignatura de Comunicación, en el examen de R. Verbal, 7 docentes obtuvieron un puntaje de 30, se esperaba un resultado esperado de 11.75 personas y como residuo estándar que es -1.385 el cual se encuentra debajo del conteo esperado.
Entonces; Chi cuadrado de Pearson = 18.919 Con un Grado de libertad = 4 Valor P= 0.001 Significancia=0.05 Tabla chi cuadrado= 9.4877 30
Se presentan dos hipótesis: Ho: la variable “asignatura” y “puntaje” son independientes, es decir la “asignatura” no influye en el examen ni puntaje. Hi: La variable “asignatura” y “puntaje” son dependientes, es decir que la asignatura tiene que ver o refleja el puntaje de los docentes. Chi cuadrado=18.919 > tabla chi cuadrado= 9.4877; por tal razón se rechaza la hipótesis nula y se acepta la hipótesis alternativa de que la variable asignatura y la variable puntaje son dependientes.
Ahora se hará una prueba con el residuo estándar, donde hay una persona que está afectando los resultados, y es aquel que tenga un valor mayor a 2 (x>2) o menor a 2 (x<-2). En la asignatura de Ingles se esperaba que fuera 9.65 personas con puntaje 30 en R. Verbal, pero fueron 19 personas las que se presentaron con puntaje 30 en R.V.
31
Posiblemente esta asignatura este alterando la situación de las personas con este puntaje.
Ahora se hará otra forma de realizar esta prueba, seleccionamos la opción assistant > hyphotesis tests.
Seleccionamos la opción chi cuadrado para asociación.
32
Rellenamos la tabla con los datos. Seleccionamos la opción resultados de las columnas y el nivel de significancia se mantiene= 0.05.
33
¿DIFIEREN LOS RESIDUOS PORCENTUALES? La diferencia entre los perfiles de resultados porcentuales es significativa (p<0.05). Usted puede concluir que existe una asociación entre puntaje y asignatura. COMENTARIOS: Prueba: Se puede concluir que existen diferencias entre los perfiles de porcentaje de resultados en el nivel de significancia de 0.05. Gráfico de Perfiles porcentuales: se debe usar para comparar el perfil de cada valor de asignatura y el perfil promedio. Tabla de % de diferencia: buscar las barras largas para identificar los resultados con el mayor % de diferencia entre los conteos observados y esperados. Chi-Square Test for Association: puntaje by asiignatura Diagnostic Report
Observed and Expected Counts comunicacion Obs Exp 30 40 80
7 40 9
Total
56
12 34 10
ingles Obs 19 18 8 45
Exp 9.4 27 8.2
matematica Obs Exp 4 29 9
8.8 26 7.6
42
Expected counts should be at least 2 to ensure the validity of the p-value for the test.
El conteo esperado debe ser por lo menos mayor a 2 para garantizar la validez del valor de p para la prueba
34
CONTRASTE DE HIPOTESIS De acuerdo a los cálculos empleados se llegó al resultado de que hay un 95% de confianza de que la media del puntaje en la parte que se rindió comprensión de textos para los postulantes de EBR Secundaria arte, caiga entre 39 y 42 puntos.
SE CONLUYE QUE Concluimos que mediante el hallazgo de che cuadro en el programa MINITAB nos facilitamos el procedimiento, porque tan solo basamos datos, pero este no es el resultado final para hallar la hipótesis verdadera, sino, tienen que hacerse una comparación entre el valor de la intersección entre el GRADO DE LIBERTAD y LOS GRADOS DE SIGNIFICANCIA, depende a esto es que se hallara la hipótesis verdadera.
35
CONCLUSIONES
PRIMERA: La aplicación de métodos estadísticos muestra resultados con márgenes de fiabilidad en la toma de decisiones a situaciones complejas que con anterioridad mostraban grados de incertidumbre
SEGUNDA: La aplicación de la estadística ha permitido el desarrollo de capacidades y destrezas para la consecución del cálculo de probabilidades, muestreo estadístico, estimación de parámetros y contraste de hipótesis.
TERCERA: El uso de software y programas estadísticos como el EPIDAD y MINITAB, permiten el ahorro de tiempo y facilitan las tareas en los diferentes sectores de la sociedad.
CUARTA: La aplicación de la estadística ha consolidado el conocimiento teórico, logrando así un aprendizaje completo y actualizado.
QUINTA: El conocimiento sobre metodologías, ha logrado sentar conocimientos bases para futuros trabajos de mayor envergadura.
SEXTA: La incorporación de programas permite la innovación en el desarrollo magistral de los estudiantes universitarios.
36
RECOMENDACIONES
1. Aplicar la estadística y el uso de programas estadísticos que te facilitan los sondeos y/o investigaciones complejas, optimizando el tiempo y recursos
2. La aplicación de estadísticos de forma constante en los diferentes trabajos de investigación realizados durante la carrera universitaria.
3. Se recomienda la constante actualización en los nuevos programas estadísticos para poder hallar resultados de manera rápida y precisa; lo cual nos ayudara no solo en una investigación propia sino también a futuro con alguna entidad pública o privada.
4. Se recomienda consolidar los aprendizajes teóricos de una forma práctica con instituciones y empresas de nuestra sociedad que permitan conocer la realidad de nuestra sociedad.
5. Incluir exigencias metodológicas en los diferentes trabajos exigidos en la carrera universitaria, para desarrollar sus capacidades competitivas frente a otros.
6. La incorporación de tecnología a todos los cursos de la currícula académica, logrando así la innovación y competitividad frente a otras instituciones universitarias.
37
REFERENCIAS
BIBLIOGRAFÍA Douglas A. Lind Coastal .Estadísitca aplicada a los negocios y a la economía. Carolina University and University of Toledo.2008
WEBGRAFÍA http://aprendeenlinea.udea.edu.co/lms/moodle/mod/page/view.php?id=55121 https://explorable.com/es/muestreo-aleatorio http://www.vadenumeros.es/sociales/tipos-de-muestreo.htm http://virtual.uptc.edu.co/ova/estadistica/docs/libros/ftp.bioestadistica.uma.es/libro/node 89.htm http://www.universoformulas.com/estadistica/inferencia/muestreo-estratificado/ https://www.netquest.com/blog/es/blog/es/muestreo-sistematico http://www.universoformulas.com/estadistica/inferencia/muestreo-sistematico/ https://www.netquest.com/blog/es/blog/es/muestreo-probabilistico-muestreoconglomerados http://www.ub.edu/stat/GrupsInnovacio/Statmedia/demo/Temas/Capitulo6/B0C6m1t9.h tm http://www.eumed.net/libros-gratis/2007a/239/7.htm http://www.ub.edu/aplica_infor/spss/cap5-2.htm https://www.youtube.com/watch?v=AgpWO1LiHQU https://www.medwave.cl/link.cgi/Medwave/Series/MBE04/5053 https://es.slideshare.net/mib/pruebas-de-hiptesis-para-proporciones
38
ANEXOS BASES DE DATOS
39