Las pruebas SABER
Julián P. Mariño* Subdirección Académica ICFES (Colombia)
En Colombia, el tema de la medición de la calidad de la educación básica (primaria y secundaria) se remonta a 1975, con la creación del Programa Nacional de Mejoramiento Cualitativo de la Educación. Sin embargo, sólo hasta la década de los ochenta se realizarían los primeros intentos de evaluar el rendimiento académico de los estudiantes.En ese entonces el objeto de la evaluación se centró en estudiar las diferencias entre la Escuela Nueva y la escuela rural tradicional. Los primeros pasos concretos en aras de la conformación del Sistema Nacional de Evaluación de la Calidad de la Educación (SNEE) se dieron a partir de 1991, cuando se aplicaron por primera vez pruebas de logro en las áreas de matemáticas, ciencias y lenguaje a una muestra de estudiantes de los grados 3°, 5°, 7° y 9° de educación básica. Posteriormente, en 1994 y 1997 se volvieron a aplicar las pruebas SABER, preservando, en buena medida, sus características conceptuales, metodológicas y logísticas. El nuevo milenio trajo importantes transformaciones en materia de evaluación de la educación en Colombia, con la promulgación de la Ley 715 en 2001. Con ella la evaluación se convirtió en una política de Estado, en contraposición a la década anterior en donde se derivaba de decisiones administrativas, provenientes del Ministerio de Educación y del ICFES. Esta Ley introdujo cambios principalmente en dos aspectos: en cuanto al carácter censal que debieron asumir estas pruebas y a la periodicidad con que deben llevarse a cabo, al volver obligatorio para el sistema educativo realizar evaluaciones de calidad cada tres años. Desde 1991, cuando se realizó en el país la primera evaluación de la calidad educativa, hasta la tercera realizada entre 1997 y 1999, la evaluación se concentraba en muestras diseñadas para producir resultados a niveles agregados. De una muestra representativa para algunas ciudades (1991), se pasó a una que daba cuenta de lo sucedido a nivel nacional y de las regiones que conforman el país (1993-95) y de ahí, a una muestra maestra nacional con representatividad a nivel departamental (1997-99). El carácter muestral de estos ejercicios impedía sin embargo obtener resultados a un nivel crucial para la toma de decisiones dentro del sistema: el de las instituciones educativas. Paralelo a lo que venía adelantando el ICFES en materia de evaluación, en la década de los noventa, algunas ciudades se interesaron en la evaluación censal de la calidad y empezaron a adelantar proyectos propios, siendo Bogotá el caso
Commented [V1]: Mira con atención esta primera parte del texto. ¿De qué te habla? ¿Puedes determinar cuál es su objetivo?
Commented [V2]: Analiza el lenguaje que se utiliza en este texto: ¿Es un lenguaje formal, académico? ¿Deja ver alguna posición específica sobre el tema tratado?
más destacable. Con estos ejercicios se hizo evidente la utilidad de las evaluaciones censales para proveer a las instituciones educativas de información clara y confiable sobre la educación que ofrecen a sus estudiantes. Esta información resultaba particularmente valiosa a la hora de diseñar planes de mejoramiento. De esa manera fue ganando terreno la percepción de la evaluación censal como herramienta imprescindible para medir el desempeño del sistema educativo colombiano en materia de aprendizajes de los estudiantes, hasta llegar a la institucionalización de ese modelo por la Ley 715. De otra parte, al establecer la obligatoriedad periódica de las evaluaciones, la Ley 715 apuntala otro aspecto fundamental de la evaluación. En efecto, sólo la regularidad de la evaluación hace posible concretar dos elementos claves de la política educativa: el concepto de mejoramiento y el concepto de seguimiento. El mejoramiento escolar deja de ser un tema etéreo, para traducirse en indicadores concretos que permiten a las instituciones educativas, a los municipios, a los departamentos y a la nación fijarse metas concretas y factibles. Esto termina asociándose directamente con el fortalecimiento de la gestión, al hacer operativo su seguimiento y evaluación, como herramienta para asegurar el mejoramiento continuo. No es suficiente conocer el estado de la educación, es indispensable aprehender su evolución, en pos de alcanzar los referentes e ideales en materia educativa. Desde que fue promulgada la Ley 715 se han realizado, sujetos a ella, dos grandes ejercicios de evaluación de la educación. El primer operativo censal se llevó a cabo entre 2002 y 2003, y el segundo entre 2005 y 2006, de acuerdo con los calendarios académicos (A y B) vigentes en las entidades territoriales. El próximo será en 2009. Desde el inicio de 2007, el ICFES, asesorado por el Educational Testing Service (ETS) norteamericano, ha estado trabajando en el diseño de la nueva aplicación con el objeto de construir sobre la experiencia adquirida en los ejercicios anteriores. Una de las primeras conclusiones de este trabajo y, tal vez, la que ha resultado más determinante, fue identificar la necesidad de realizar un diseño no para una aplicación particular sino para un conjunto de aplicaciones de forma que se garantice la medición de la evolución de los resultados por 12 años (cinco aplicaciones a partir de 2009). Partiendo de esta premisa, se ha planteado el diseño de un esquema de aplicación que asegure la continuidad durante el ciclo 2009-2021 de todos aquellos elementos que resulten indispensables para permitir las comparaciones en el tiempo, a la vez que permita introducir variaciones de acuerdo con las posibilidades, las prioridades y los intereses futuros. Para lograr esto se han adelantado, además de múltiples talleres, en los que se ha contado con la participación de actores del sector y miembros de la comunidad educativa, dos aplicaciones piloto en 2008 a nivel nacional. A continuación se presentan los rasgos fundamentales que se han definido para las aplicaciones 2009-2021 como fruto de ese trabajo en los siguientes aspectos: lo que se va a
Commented [V3]: Fíjate muy bien: en los dos párrafos que estás leyendo, la progresión temática está mostrando el avance histórico de las pruebas estandarizadas en el país.
evaluar, el diseño técnico elaborado para garantizar la calidad de la medición y los reportes que se van a producir. Lo que se va a evaluar
Commented [V4]: Los subtítulos indican aspectos del tema que se van a ampliar.
En la definición del objeto a evaluar, la selección de las áreas y grados en los cuales concentrar el ejercicio evaluador resulta de vital importancia. Entendiendo la educación como un proceso continuo, resulta indispensable establecer hitos en los cuales hacer un alto en el camino y voltear la mirada para revisar lo que hemos hecho como políticos, administradores, rectores, maestros y estudiantes. Tales hitos están dados en las áreas y grados evaluados. En primer lugar, a lo largo de su historia, las pruebas SABER han cubierto una amplia gama de grados y áreas. Han sido evaluados los grados 3º, 5º, 7º y 9º de la educación básica, en las áreas de matemáticas, lenguaje, ciencias sociales, ciencias naturales y competencias ciudadanas. En 2003 fueron aplicadas pruebas en las áreas de matemáticas, lenguaje, ciencias naturales y competencias ciudadanas. A su vez, en SABER 2005 se incluyeron las mismas áreas, además de ciencias sociales.
Commented [V5]: Conector al principio del párrafo, que nos indica un primer tema que se va presentar.
Igualmente relevante es mencionar que desde 2003, las pruebas se han concentrado en los grados 5º y 9º y está planteado seguir esa línea en 2009. Por razones presupuestales y logísticas, ante los enormes costos que implica el despliegue de aplicaciones censales, resulta necesario restringir los grados cubiertos. La selección de los grados de 5º y 9º se sustenta entonces en la estructura del sistema educativo colombiano: ellos son los grados de cierre de los ciclos de la básica primaria y de la básica secundaria, respectivamente. Esta definición no descarta sin embargo, la posibilidad de que, dentro del mismo esquema, en los años a venir, se incluya la aplicación de pruebas a muestras de estudiantes de otros grados o incluso, si se dispusiera de los recursos necesarios, que se haga censalmente. Lo que sí se plantea es que, dentro del esquema diseñado, 5° y 9° se deben evaluar sistemáticamente.
Commented [V6]: Nuevamente un conector que nos permite percibir que se va a presentar otro aspecto de igual relevancia que el anterior y que, al mismo tiempo, nos permite ver la relación entre ambos.
En cuanto a la áreas evaluadas, se hace igualmente necesario definir un esquema que garantice la continuidad de unos mínimos, a la vez que deje espacio para el manejo de variaciones. En este sentido se seleccionaron las áreas de Lenguaje y Matemáticas, por ser las áreas fundamentales de la enseñanza escolar sobre las cuales se construyen otros aprendizajes, como los ejes principales de la evaluación en los próximos años.
Commented [V7]: Tercer conector, que contribuye a una progresión temática armoniosa. Sigue observando los conectores de los párrafos subsecuentes.
Al igual que en el caso de los grados, queda abierta la posibilidad de realizar, según las prioridades y la capacidad del momento, evaluaciones de otras áreas en el marco de las aplicaciones de SABER. En particular, para SABER 2009 se prevé, además de la evaluación de estas dos áreas, la de las ciencias naturales.
Por otro lado, en consonancia con el propósito de las evaluaciones de calidad de la educación se determinó que la evaluación esté alineada con los estándares curriculares y, de acuerdo con ello, enfocada en las siguientes competencias.
Tabla 1. Competencias que serán evaluadas en el marco de SABER 2009 MATEMÁTICAS
Razonamiento y argumentación Comunicación y representación Modelación, planteamiento y resolución de problemas
LENGUAJE
Lectora Escritora
Commented [V8]: Las tablas ayudan a presentar de manera organizada la información.
CIENCIAS
Uso comprensivo del conocimiento científico Indagar Explicación de fenómenos
Asimismo, en cada una de las áreas evaluadas se tendrán en cuenta sus componentes. Éstos están relacionados con los ejes verticales de los estándares básicos de competencias, permitiendo establecer fortalezas y debilidades que promuevan acciones de mejoramiento. La tabla 2 enumera los componentes de cada una. Tabla 2. Componentes que serán evaluadas en el marco de SABER 2009 MATEMÁTICAS
Numérico – variacional Geométrico-métrico Aleatorio
LENGUAJE
Sintaxis Semántica Pragmática
CIENCIAS
Entorno vivo Entorno físico Ciencia, tecnología y sociedad
El diseño técnico En el diseño técnico de las aplicaciones del ciclo 2009 – 2021 se destacan los siguientes elementos. Primero, la construcción de preguntas a partir de un ejercicio de especificación basado en evidencias. Segundo, el respaldo a la aplicación censal con una aplicación muestral controlada.
Commented [V9]: En este párrafo, el autor hace una ordenación previa de los elementos a presentar en el apartado.
La herramienta fundamental para el desarrollo de pruebas en cualquier área son las especificaciones de la misma. El ejercicio de especificación basado en evidencias se desarrolló en talleres en los que participaron docentes en ejercicio y expertos en enseñanza de las áreas a evaluar. Partiendo de los estándares curriculares se desglosaron las competencias a evaluar sucesivamente en componentes, macro-afirmaciones, afirmaciones y evidencias. Estas últimas corresponden a los saberes específicos por cuyo despliegue se debe indagar en las preguntas de las pruebas. Posteriormente, el ejercicio de construcción de preguntas se hizo dirigido a cubrir las evidencias identificadas. Este modelo de especificación para la construcción busca garantizar una homogeneidad en los instrumentos desarrollados en un periodo largo de tiempo, en la medida en que proveen los elementos necesarios para que grupos diferentes de constructores puedan producir pruebas equivalentes. Además, unas especificaciones claras permiten generar pruebas cuyos puntajes proveen información explicita sobre lo que los estudiantes pueden o no hacer. Por otra parte, la aplicación censal se concibe como una herramienta provista por el Estado a las instituciones educativas para identificar fortalezas y debilidades y, con ello, apoyar el diseño, la implementación y la evaluación de los Planes de Mejoramiento Institucional. Sin embargo, las limitaciones presupuestales y logísticas de la administración gubernamental hacen necesario que las instituciones sean las responsables de la calidad de los datos en ellas recogidos. Si bien esto abre un mayor espacio a las instituciones educativas en la gestión del sistema de evaluación de la calidad, si se entiende que una cultura de la evaluación debe estar enmarcada en la transparencia de sus resultados, también pone en riesgo la medición de agregados y, en consecuencia, la posibilidad de contar con indicadores NACIONALES sólidos que permitan hacer seguimiento y formular políticas desde el orden nacional. Por lo sensible que este tema resulta para el sistema educativo y para la sociedad en su conjunto, resulta indispensable contar con mecanismos que aseguren la confiabilidad de dicha información. Para garantizar la producción de resultados agregados confiables sobre la calidad de los aprendizajes, que permitan evaluar y hacerle seguimiento a la totalidad del sistema educativo, en el esquema diseñado para el ciclo 2009-2021, se reproduce el modelo implementado en 2005 de respaldo de la aplicación censal mediante una aplicación muestral plenamente controlada. En el nuevo esquema, la aplicación censal debe proveer los resultados para las instituciones educativas individuales, mientras que los resultados agregados a nivel nacional y/o de ente territorial se obtienen exclusivamente a partir de la aplicación muestral controlada.
Reportes Un último aspecto que es importante resaltar del ejercicio de revisión del diseño de la las pruebas SABER para el ciclo 2009-2021, se relaciona con los resultados que serán entregados a la comunidad educativa para apoyar y nutrir procesos de toma
de decisiones en los diferentes niveles de organización del sistema educativo, desde los estudiantes y padres de familia, hasta los administradores gubernamentales y el conjunto de la sociedad.
Commented [V10]: En este párrafo se nos da a conocer que se acerca el cierre del texto.
Los resultados de las Pruebas SABER están estructurados en diferentes categorías, dependiendo de su funcionalidad dentro de la estructura y análisis de los aprendizajes, resultantes de su articulación con los estándares curriculares que rigen las áreas evaluadas. Para cada una de las instituciones educativas se generarán informes en los que se reporten para cada grado y área evaluada:
Los promedios y las dispersiones de los puntajes obtenidos por sus estudiantes. Las proporciones de estudiantes que alcanzan cada uno de tres niveles de logro con una descripción en términos del dominio a que corresponde cada nivel de las competencias y componentes de cada área. Las fortalezas y debilidades de la institución en términos del desempeño de sus estudiantes en las componentes y competencias.
Estos resultados de la institución aparecerán en el informe comparados con los promedios del nivel nacional y del ente territorial (cuando éstos se puedan obtener de la aplicación muestral), así como con los de cuatro a seis instituciones típicas, de forma que, puedan identificarse con las características de una de ellas (por ejemplo en términos de su ubicación – rural o urbana – o de su tamaño). Los resultados agregados para las instancias gubernamentales e investigativas del sector se producirán, por una parte, en informes con los promedios y las dispersiones de los puntajes obtenidos por los estudiantes y las proporciones de estudiantes que alcanzan cada uno de los niveles de logro en las áreas y grados evaluados desagregados por sector (público y privado), zona (rural y urbana) y sexo. Por otra parte, se producirá un informe del estudio de factores asociados, que se concibe como un instrumento de carácter analítico, que permitirá vincular los resultados alcanzados por los estudiantes en materia de aprendizajes con las acciones de mejoramiento institucional promovidas desde la política educativa y adoptada por las instituciones escolares. Los instrumentos de este ejercicio ya fueron piloteados en 2008. Finalmente, un informe presentará los resultados del estudio histórico comparativo de los promedios de calificaciones de las pruebas SABER que permitirá establecer la conexión entre los resultados del ciclo 2009-2021 y las aplicaciones anteriores. * Julián P. Mariño von Hildebrand es matemático de la Universidad de los Andes. Cursó estudios de doctorado en el Instituto de Lógica y Fundamentos de la Matemática de la Universidad Albert Ludwig de Friburgo, Alemania, y en la facultad de Ciencias de la Computación del Instituto de Tecnología Technion de Haifa, Israel. Se ha desempeñado como consultor en temas de evaluación
Commented [V11]: Este cierre es, evidentemente, muy corto. ¿Puedes determinar si se trata del cierre del artículo en general, o del apartado que se está tratando?
y análisis cuantitativo para el DNP, el Ministerio de Hacienda y la Secretaría de Hacienda del Distrito entre otros. Desde mediados de 2007 tiene a cargo la Subdirección Académica del ICFES.
TALLER DE GLOBALIZACIÓN DE INFORMACIÓN No. 1
1. De acuerdo con lo visto en la Unidad 1 y con las ampliaciones presentadas dentro del texto, ¿qué tipología textual tiene el escrito que acabas de leer? Justifica tu respuesta. 2. De acuerdo con el lenguaje utilizado en el texto, ¿a qué tipo de público crees que está dirigido? 3. El tema presentado es, claramente, las Pruebas SABER en Colombia. En la progresión temática del texto ¿es posible afirmar que existe conectividad entre los aspectos que se nos van presentando? ¿Por qué? 4. ¿Qué piensas acerca del párrafo de cierre del texto? Teniendo en cuenta la función de este párrafo en un texto, ¿qué podemos decir de él? 5. ¿Qué pudiste aprender acerca de las Pruebas SABER en el texto anterior? Sintetízalo en un mínimo de diez (10) líneas.