Evaluación Educativa Profesor: Waldo Portilla Hidalgo
Comparación entre medición y evaluación ¿Qué se entiende por medir? ¿Qué se entiende por evaluar?
Diferencias entre Evaluación y Medición Evaluación: •Proceso más amplio que la medición. •La evaluación se apoya en la medición (pruebas) •Tiende a cualificar •Se centra en la persona y en función de ella da una valoración.
Medición: • Es la base de la evaluación • La medición está contenida en la evaluación • Tiende a cuantificar • Se centra sólo en los objetivos preestablecidos
LAS PRUEBAS ESCRITAS, DE ACUERDO AL TIPO DE ITEM PUEDEN CLASIFICARSE EN: A.-Pruebas de Desarrollo ( el estudiante suministra la respuesta ) 1. Respuesta Abierta (de tipo ensayo extenso). 2. Respuesta Intermedia (de tipo ensayo resumido). 3. Respuesta Restringida (con una palabra o frase ) 4. Completación ( llenar espacios ) B.- Pruebas Estructuradas de Respuesta Fija ( el estudiante escoge la respuesta ) 1. Doble alternativa (verdadero- falso ) 2.Correspondencia ( aparear, unir ) 3. Selección múltiple (elegir entre varias alternativas) 4. Identificación (en el mapa, en un gráfico etc.)
PRUEBAS DE DESARROLLO
• De “respuesta abierta” y los de “desarrollo de temas” demandan actividades de mayor complejidad y procesamiento, tales como comprensión, elaboración conceptual, capacidad de integración, creatividad, capacidad de análisis y establecimiento de juicios reflexivos o críticos.
Resultan más difíciles de evaluar porque no podemos controlar la naturaleza de la respuesta; por ejemplo un tipo de ensayo extenso como este: “Describa el papel que desempeñan la medición y la evaluación en el proceso de enseñanzaaprendizaje.” Aquí le damos toda la libertad al estudiante para que responda. Este tipo de ítem es útil para organizar y evaluar ideas pero no para medir respuestas específicas o conocimiento de hechos.
•De respuesta Intermedia limita la naturaleza, dimensión y organización de la respuesta, por ejemplo: “Describa dos ventajas y dos limitaciones de los ítems de ensayo extenso.”
Este tipo de pregunta controla la respuesta y hace que el ítem sirva para medir hechos específicos; aunque resulta inadecuado para medir la capacidad para organizar ideas.
•De “respuesta restringida”
Limita la respuesta a uno o más conceptos Determinados. Ejemplo: ¿Quién Descubrió Chile?
CÓMO ELABORAR ITEMES DE RESPUESTA BREVE • El item de respuesta breve o de completación pide al examinado que proporcione la respuesta en lugar de elegirla. Su estructura es similar a la de uno de opción múltiple pero sin las opciones. Consta de una pregunta o enunciado incompleto. • Ejemplos: • ¿Cómo se llaman las respuesta incorrectas de un item de opción múltiple? • Las respuestas de un item de opción múltiple se llaman.
REGLAS PARA ELABORAR ITEMES DE RESPUESTA BREVE • Enuncie el ítem de modo que únicamente sea posible una repuesta breve. • Comience con una pregunta directa y relacionada con un enunciado incompleto solo cuando sea posible una mayor consistencia. • Coloque los espacios al final del enunciado. • Evite claves ajenas a la respuesta. (El artículo un o una al final de la frase puede proporcionar una clave). • Con las respuestas numéricas, indique el grado de precisión deseado y las unidades en que se deben expresar.
LOS TETS DE DESARROLLO • Reglas para elaborar preguntas de desarrollo • La elaboración de preguntas de ensayo claras y carentes de ambigüedad es una tarea más difícil de lo que se supone. • Parar lograr preguntas de buena calidad vamos a tener en cuenta algunas reglas.
UTILICE PREGUNTAS QUE MIDAN ÚNICAMENTE RESULTADOS COMPLEJOS DE APREDIZAJE • Las preguntas de ensayo no deben usarse para medir resultados de “conocimiento” ya que estos pueden medirse mejor con pruebas estructuradas.
RELACIONE LA PREGUNTA TAN DIRECTAMENTE COMO SEA POSIBLE CON LOS RESULTADOS DE APRENDIZAJE QUE SE ESTÁ MIDIENDO • Cada pregunta debe medir uno o más resultados bien definidos. Hay que empezar con una descripción precisa de lo que se va a medir. • El ítem de respuesta restringida por su muy elaborada estructura se puede relacionar fácilmente con un resultado específico de aprendizaje.
En las preguntas abiertas • Redacte la pregunta de ensayo de manera que la respuesta deseada no sea fácil de obtener. Se recomienda redactar la pregunta una y otra vez teniendo en mente la respuesta que se espera del estudiante. • Evite comenzar las preguntas con “quién” “qué” “cuándo” “dónde” “mencione” y “enumere” estos términos limitan las respuestas a resultados del conocimiento. • Palabras como “por qué” “describa” “ esplique” “compare” “analice” “critique” “evalúe” revelan mejor el aprovechamiento complejo.
• NO HAY MEJOR FORMA DE COMPROBAR LA REDACCIÓN DE UNA PREGUNTA DE ENSAYO QUE, ESCRIBIR UNA RESPUESTA MODELO PARA LA MISMA.
CONCEDA SUFICIENTE TIEMPO PARA RESPONDER Y SUGIERA DURACIONES LÍMITES PARA CADA PREGUNTA • Las preguntas de ensayo se elaboran para medir habilidades y capacidades intelectuales por lo cual debe concederse suficiente tiempo para pensar y escribir. • Informar a los estudiantes el tiempo de que disponen para responder les ayudará a emplear su tiempo más eficientemente.
REGLAS PARA CALIFICAR TESTS DE ENSAYO • Una de las principales limitaciones del test de ensayo es la subjetividad, es decir, los sentimientos personales del calificador que pueden interferir con los juicios que hace sobre la calidad de las respuestas. Estos pueden ser predisposiciones respecto de quién escribió o del estilo como escribe, la ortografía, etc. Estas predisposiciones distorsionan los resultados de la medición.
EVALUE LAS RESPUESTAS EN FUNCIÓN DEL APREDIZAJE QUE SE ESTÁ MIDIENDO • Si se elabora una pregunta para medir “la capacidad para explicar relaciones de causa efecto” por ejemplo, debemos evaluar qué tan adecuadamente explica el estudiante las relaciones de causa-efecto planteadas en la pregunta. Todos los demás factores que no vienen al caso (caligrafía, ortografia, estilo etc. ) no se deben tomar para fines de calificación.
CALIFIQUE LAS RESPUESTAS DE TIPO RESTRINGIDO POR EL MÉTODO DE PUNTOS, DANDO UNA RESPUESTA MODELO COMO GUÍA
• Se recomienda hacer una respuesta modelo y asignarle una puntuación a cada respuesta, así como a las partes de la misma. Por ejemplo, se pueden asignar puntos por la pertinencia de los ejemplos usados, por la organización de la respuesta y por el nivel del contenido.
EVALUE TODAS LAS RESPUESTAS QUE LOS ESTUDIANTES DIERON A UNA PREGUNTA ANTES DE PASAR A LA EVALUACIÓN DE LA SIGUIENTE
• El evaluar pregunta por pregunta hace posible mantener una norma más uniforme para juzgar las respuestas.
EVALUE ANÓNIMAMENTE LAS RESPUESTAS QUE LOS ESTUDIANTES DAN A LAS PREGUNTAS DE ENSAYO
• Esta práctica es la mejor manera de evitar que el conocimiento previo del estudiante pueda afectar nuestra evaluación.
REGLAS PARA ELABORAR ITEMES DE OPCIÓN MÚLTIPLE
ELABORE CADA ITEM PARA MEDIR UN RESULTADO IMPORTANTE DEL APRENDIZAJE. EVITE ELABORAR TESTS SOBRE DETALLES SIN IMPORTANCIA.
PRESENTE SOLO UN PROBLEMA CLARAMENTE FORMULADO EN EL PIE DEL ITEM • DEFICIENTE: LA TABLA DE ESPECIFICACIONES: A. Indica cómo se usará un test para mejorar el aprendizaje. B.
Proporciona un muestreo más balanceado del contenido.
C.
Ordena los objetivos de la enseñanza en razón de su importancia.
D.
Especifica el método de puntuación que se usará en el test.
MEJOR: ¿Cuál es la principal ventaja de usar la tabla de especificaciones cuando se prepara un test de aprovechamiento? A.
Ahorra tiempo.
B.
Mejora el muestreo del contenido
C.
Facilita la elaboración de los ítemes.
D.
Aumenta la objetividad del test.
ENUNCIE EL PIE DE ITEM EN LENGUAJE CLARO Y SENCILLO
INCLUYA TANTAS PALABRAS COMO SEA POSIBLE EN EL PIE DEL ITEM • Deficiente: EN LOS TESTS OBJETIVOS, EL TERMINO “OBJETIVO”: A. Se refiere al método de identificar los resultados del aprendizaje. B. Se refiere al método de seleccionar el contenido del test. C. Se refiere al método de presentar el problema. D. Se refiere al método de calificar las respuestas.
•
Mejorado: EN LOS TESTS OBJETIVOS, EL TÉRMINO “OBJETIVO" SE REFIERE AL MÉTODO DE:
A) Identificar los resultados del aprendizaje.
B) Seleccionar el contenido del test.
C) Presentar el problema.
D) Calificar las respuestas.
ENUNCIE EL PIE DEL ITEM EN FORMA AFIRMATIVA SIEMPRE QUE SEA POSIBLE
HAGA HINCAPIÉ EN LA CONSTRUCCIÓN NEGATIVA SIEMPRE QUE LA UTILICE EN EL PIE DE UN ITEM •
Deficiente: ¿Cuál de las siguientes no es una práctica deseable cuando se preparan ítemes de opción múltiple?
A) Enunciar el pie de manera afirmativa. B)
Usar un pie que pudiera funcionar como item de respuesta breve.
C) Subrayar ciertas palabras del pie para recalcarlas. D) Acortar el pie alargando las opciones.
• Mejorado: • Al elaborar ítemes de opción múltiple todas las siguientes son prácticas deseables, EXCEPTO: A) Enunciar el pie en forma afirmativa. B) Usar el pie que pueda funcionar como ítem de respuesta breve. C) Subrayar ciertas palabras del pie para recalcarlas. D) Acortar el pie alargando las opciones.
ASEGÚRESE QUE LA RESPUESTA QUE SE OFRECE SEA LA CORRECTA O CLARAMENTE LA MEJOR
HAGA QUE TODAS LAS OPCIONES SEAN GRAMATICALMENTE CONSISTENTES CON EL PIE DEL ITEM
EVITE CLAVES VERBALES QUE PERMITAN A LOS ESTUDIANTES SELECCIONAR LA RESPUESTA CORRECTA O ELIMINAR UNA OPCIÓN INCORRECTA.
HAGA QUE LAS RESPUESTAS DE DISTRACCIÓN SEAN ATRACTIVAS PARA EL ESTUDIANTE POCO INFORMADO.
VARIE LA LONGITUD DE LA RESPUESTA CORRECTA PARA ELIMINAR LA LONGITUD COMO UNA POSIBLE CLAVE.
UTILICE CON MUCHA PRECAUCIÓN LAS OPCIONES: “todas las anteriores” o “ninguna de las anteriores”
VARIE AL AZAR LA POSICIÓN DE LA RESPUESTA CORRECTA. •NO SEGUIR UNA PAUTA QUE PUEDA RESULTAR EVIDENTE PARA EL QUE RESPONDE EL TEST.
REGLAS PARA ELABORAR ITEMES DE TIPO VERDADERO-FALSO
INCLUYA EN CADA ENUNCIADO SOLAMENTE UNA IDEA CENTRAL SIGNIFICATIVA. SE DEBE EVITAR INCLUIR VARIAS IDEAS EN UN SOLO ITEM PORQUE TIENDE A SER CONFUSO Y A MEDIR HABILIDADES DE LECTURA, EN LUGAR DE RESULTADOS DE APRENDIZAJE.
REDACTE EL ENUNCIADO DE MANERA TAN PRECISA QUE SE PUEDA JUZGAR INEQUIVÓCAMENTE COMO VERDADERO O FALSO.
EVITE TÉRMINOS AMBIGUOS COMO: “RARAMENTE”, “POSIBLEMENTE” O “FRECUENTEMENTE”.
LOS ENUNCIADOS DEBEN SER BREVES Y DE ESTRUCTURA SENCILLA.
•USE LO MENOS POSIBLE ENUNCIADOS NEGATIVOS Y EVITE LA DOBLE NEGACIÓN. •EN CASO DE QUE SE UTILICEN ADVERBIOS DE NEGACIÓN DEBEN SUBRAYARSE O PONERSE EN LETRAS MAYÚSCULAS
•EVITE CLAVES AJENAS A LA RESPUESTA: LOS ENUNCIADOS CON TÉRMINOS ABSOLUTOS COMO “SIEMPRE”, “NUNCA”, “TODO”, O “NINGUNO”, TIENDEN A SER FALSOS. POR OTRA PARTE MODIFICADORES COMO “USUALMENTE” O “A VECES” TIENDEN A SER VERDADEROS.
•AL ESTRUCTURAR EL TEST HAY QUE EVITAR QUE LAS RESPUESTAS QUEDEN DISPUESTAS DE MANERA QUE DEN LUGAR A CIERTA PAUTA . EJ.: V ,F ; V ,F ; V ,F ; V.F
CÓMO ELABORAR ITEMES DE CORRESPONDENCIA • El ítem de correspondencia no es más que una forma modificada del ítem de opción múltiple. • En lugar de poner en lista las respuestas posibles bajo cada uno de los enunciados, se enlistan en una columna una serie de enunciados llamados premisas y las respuestas se enlistan en otra columna.
REGLAS PARA ELABORAR ITEMES DE CORRESPONDENCIA
• INCLUYA SOLAMENTE UN TIPO DE MATERIAL EN CADA ITEM DE CORRESPONDENCIA.
PUEDEN SER: AUTORES Y SUS OBRAS, CIENTÍFICOS Y SUS DESCUBRIMIENTOS HECHOS HISTÓRICOS Y SUS FECHAS.
PROCURE QUE EL MANDATO SEA CLARO INDICANDO CÓMO SE RELACIONARAN LAS PREMISAS Y LAS RESPUESTAS
•UTILICE UN NÚMERO DE RESPUESTAS MAYOR O MENOR, QUE EL DE LAS PREMISAS Y HAGA QUE LAS RESPUESTAS SE PUEDAN USAR MÁS DE UNA VEZ. •TANTO LA CORRESPONDENCIA DESIGUAL • COMO LA POSIBILIDAD DE QUE SE USE UNA RESPUESTA MÁS DE UNA VEZ, •REDUCE EL FACTOR DE RESPONDER POR TANTEO.
•CUANDO ALGUNAS RESPUESTAS SE PUEDAN USAR MÁS DE UNA VEZ O NO USARSE, ESPECIFÍQUELO EN LAS INSTRUCCIONES.
CÓMO SE PREPARA, APLICA Y EVALUA UN TEST. • La preparación final del test comprende: revisar y redactar los ítems, disponer los ítems en cierto orden lógico y preparar instrucciones claras. • Después que se ha aplicado y calificado el test es recomendable analizar los ítems para determinar la eficacia de cada uno de ellos.
CÓMO REVISAR Y REDACTAR LOS ITEMS • Para realizar una evaluación cuidadosa de los ítems debemos preguntarnos: • • • • •
¿Mide cada ítem un resultado importante del aprendizaje? ¿Presenta cada ítem una tarea claramente formulada? ¿Está el ítem redactado en lenguaje claro y sencillo? ¿Está el ítem libre de claves extrañas? ¿Es la dificultad del ítem adecuada al nivel de los estudiantes?
CÓMO DISPONER DE LOS ITEMS • 1.Todos los de igual tipo deben quedar dentro del mismo grupo. Esto permite formular instrucciones específicas para cada sección del test. • 2. Los ítems se deben disponer en orden de dificultad creciente. Esto tendrá un efecto motivador en los estudiantes. • 3. Primero se deben colocar los de verdaderofalso y los de opción múltiple, y al final los más complejos como los de ensayo.
CÓMO PREPARAR LAS INSTRUCCIONES • Las instrucciones de un test deben ser sencillas y concisas. Cuando en un mismo test hay dos o más tipos de ítems, se recomienda proporcionar instrucciones generales para la totalidad del test e instrucciones específicas para cada parte.
EL PROBLEMA DE RESPONDER AL TANTEO • El propósito de corregir las respuestas por tanteo tiene como objetivo desalentar a los alumnos que pretenden adivinar las respuestas. • Siempre que se vaya a realizar este procedimiento debe advertírseles a los estudiantes antes de iniciar el test.
FÓRMULA DE CORRECCIÓN DE RESPUESTAS POR TANTEO Puntuación = Aciertos – (Incorrectos / n-1) N = número de opciones de cada ítem. Si un estudiante tiene 40 ítems correctos y 6 incorrectos en un test de 50 ítems de cuatro opciones, su puntuación será: (40)-6/(4-1)= 40-2=38 La fórmula elimina dos de las respuestas correctas que se pueden explicar por aciertos casuales en el tanteo.
CÓMO ANALIZAR LOS ITEM • El análisis de ítem nos da información acerca de: • 1. La dificultad del ítem. • 2. El poder discriminativo del ítem. • 3. La eficacia de cada opción.
PROCEDIMIENTO DE ANÁLISIS DE ITEM. • 1. Ordene los tests desde la puntuación más alta hasta la más baja. • 2. Separe la tercera parte correspondiente a los tests con calificaciones más altas y el mismo número de tests con puntuaciones bajas • 3. Con cada ítem, cuente el número de estudiantes del grupo superior que eligió cada opción. Haga lo mismo con el grupo inferior. • 4. Estime la dificultad del ítem, determinando el porcentaje de estudiantes que respondieron correctamente a él. ( I.D = número de estudiantes que respondieron correctamente el test dividido entre el total de alumnos del grupo superior más el grupo inferior por cien )
ÍNDICE DE DISCRIMINACIÓN • Estime el poder discriminativo del ítem, comparando el número de estudiantes de los grupos superior e inferior que respondieron correctamente a él. • Decimos que un ítem discrimina positivamente cuando son más los estudiantes del grupo superior que responden correctamente él y decimos que discrimina negativamente cuando ocurre lo contrario. • Se obtiene un poder discriminativo nulo cuando el mismo número de estudiantes de ambos grupos aciertan en el ítem.
EFICACIA DE LOS DISTRACTORES • Determinamos la eficacia de las respuestas de distracción, comparando el número de estudiantes de los grupos superior e inferior que eligieron cada opción incorrecta. • Una buena respuesta de distracción resultará atractiva para más estudiantes del grupo inferior que del grupo superior. • Cuando un distractor no es seleccionado por ningún estudiante, decimos que no funcionó.
CARACTERÍSTICAS QUE DEBEN TENER LAS PRUEBAS • Son muchas las características que deben poseer pero nos vamos a referir a cinco de ellas que son: • • • • •
1- Validez 2- Confiabilidad 3-Objetividad 4-Amplitud 5-Practicidad
VALIDEZ • Por validez entendemos el hecho de que una prueba sea de tal manera concebida, elaborada y aplicada que mida realmente lo que nos proponemos medir.
CONFIABILIDAD • La confiabilidad es la exactitud o precisión con que un instrumento mide algo. Lo que un test mide puede ser que no sea lo que se proponía pero lo que mide lo mide bien; en este caso existe confiabilidad pero no tiene validez. • Un test puede ser confiable sin ser válido pero no puede ser válido sin ser confiable.
OBJETIVIDAD • Una prueba es objetiva cuando la opinión personal del examinador no afecta la calificación. • La objetividad es importante pero no tanto que tengamos que sacrificar la validez ya que hay algunos aspectos que no pueden ser medidos con ítemes objetivos.
AMPLITUD • Nos referimos a la extensión del instrumento es decir que mida la mayor cantidad de los temas tratados en el desarrollo del curso.
PRACTICABILIDAD • Un test puede ser altamente válido, confiable y objetivo pero si para administrarlo requiere una considerable inversión de tiempo, una técnica demasiado rigurosa o la ayuda de personal especializado, el instrumento no nos funciona.
• Espero haberles ayudado en algo, para mejorar este componente tan importante del proceso enseñanza/aprendizaje como lo es la evaluación educativa.