Académique Documents
Professionnel Documents
Culture Documents
ISSN 2216-1104
Editorial
Para el Programa de Investigacin del ICFES es un gusto presentarles la segunda edicin de nuestro boletn del ao 2013. En esta oportunidad les invitamos a leer el artculo Puntajes Promedio vs Valor Agregado, para determinar la efectividad escolar, a partir del cual quisiramos abrir el debate sobre la interpretacin de los Rankings educativos e introducir la estimacin del valor agregado como una metodologa alternativa para medir el impacto de la gestin educativa sobre los resultados de sus estudiantes en pruebas estandarizadas. Este artculo est basado en la investigacin de Ernesto San Martn y Alejandro Carrasco: Clasificacin de escuelas en la nueva institucionalidad educativa: contribucin de modelos de valor agregado para una responsabilizacin justa que fue presentada en nuestro III Seminario Internacional de Investigacin sobre Calidad de la Educacin. Desde entonces el ICFES se ha propuesto difundir y enriquecer la discusin en torno a este tema, por lo tanto en este boletn tambin presentaremos las respuestas que dio el profesor San Martn a las preguntas que surgieron durante su presentacin en el seminario. Al final del boletn encontrarn todo lo referente a las actividades que estamos adelantando en este ao, con el fin de incentivar a la comunidad educativa en el uso de las bases de datos del ICFES para la investigacin y as contribuir en el mejoramiento de la calidad de la educacin. Esperamos que esta edicin del boletn de investigacin sea de su agrado y utilidad. Del mismo modo ser de nuestro gusto poder contar con su participacin en todos los eventos del Programa de Investigacin del ICFES.
Adriana Molina Mantilla Jefe Oficina Asesora de Proyectos de Investigacin
Tabla de Contenido
Editorial... Puntajes Promedio vs Valor Agregado, para determinar la efectividad escolar..... Los investigadores responden. Sesiones Informativas Talleres para la formulacin de Proyectos de investigacin....... Curso de Bases de datos de pruebas estandarizadas..... Convocatoria para estudiantes de pregrado... Invitacin a presentar trabajos sobre sistemas escolares, evaluacin y calidad de la educacin.. 1 3 6 7 8 8 9 9
Los resultados de las pruebas de Estado (SABER 11 y SABER PRO), que reflejan el grado de desarrollo de las competencias de los estudiantes que estn terminando el ltimo grado de secundaria un programa de pregrado, son entregados semestralmente a la sociedad por el ICFES. A partir del promedio de los puntajes obtenidos por los estudiantes, entidades construyen rankings de colegios y universidades, con los cuales se realizan comparaciones entre las instituciones educativas y llegan a conclusiones sobre su evolucin y posicin dentro del sector. Estas clasificaciones brindan informacin til acerca de la preparacin con que se gradan los estudiantes, pero es importante preguntarse si realmente el fundamento de estas conclusiones es suficiente para evaluar la calidad de las instituciones y si los comportamientos evaluados obedecen nicamente a la gestin educativa realizada por los colegios y universidades. Ernesto San Martn1 y Alejandro Carrasco2 en su artculo Clasificacin de escuelas en la nueva institucionalidad educativa: contribucin de modelos de valor agregado para una responsabilizacin justa advierten sobre las clasificaciones errneas en las que se puede incurrir utilizando nicamente los promedios de las pruebas censales. En primera instancia, sealan que stas podran arrojar una clasificacin basada en las capacidades con las cuales los estudiantes ingresan al colegio o en factores socioeconmicos y no en la contribucin de la escuela. En este sentido tomar como referencia solamente el ranking construido a partir del promedio aritmtico, para obtener conclusiones acerca de la calidad de los colegios, puede llegar a ser insuficiente. Es entonces pertinente preguntarse por las mediciones que determinan el impacto que tiene la gestin educativa en el aprendizaje de los estudiantes. La respuesta se centra en lo que en la literatura ha designado el EfectoEscuela, definido como el aporte realizado de la gestin educativa de la entidad al desarrollo cognitivo de sus estudiantes. Pases como Chile estn adoptando sistemas de rendicin de cuentas en el mbito escolar enfocados en la evaluacin de la gestin educativa. El sistema desarrollado parte de la creacin de la Superintendencia de Educacin y la Agencia de calidad de la Educacin, donde esta ltima se encargar de clasificar las escuelas en trminos de su efectividad escolar, con el fin de informar el impacto real de las instituciones educativas.
Profesor asociado del Departamento de Estadstica en la Facultad de Matemticas de la Universidad Catlica de Chile, y miembro de Consejo Directivo del Centro de Medicin (MIDE UC). 2 Profesor Asistente de la Facultad de Educacin de la Universidad Catlica de Chile e Investigador Miembro del Centro de Estudios de Polticas y Prcticas en Educacin (CEPPE UC).
Para llevar esto a cabo, la Agencia se basa principalmente en los resultados de la prueba censal SIMCE3 y eventualmente en modelos de valor agregado. Estos ltimos tienen como objetivo medir la contribucin de una escuela, comparando el desempeo escolar de sus estudiantes en relacin con el que hubiesen alcanzado si hubieran estudiado en una escuela promedio. Para estimar estos modelos de valor agregado es necesario contar con dos mediciones en el tiempo del desempeo de los mismos estudiantes, una antes de empezar el ciclo escolar evaluado y otra al terminar, tanto de estudiantes de la escuela como de individuos que no pertenecen a ella y de esta manera lograr calcular el valor agregado. El valor agregado logra medir el efecto-escuela cuando se logra controlar los factores exgenos que pueden afectar la estimacin. Por ejemplo la seleccin no aleatoria de estudiantes puede llevar a que los resultados no sean el efecto neto de las prcticas educativas, sino de la habilidad de la escuela para escoger estudiantes con mejores condiciones para aprender. Teniendo esto en cuenta, San Martn y Carrasco incluyen en su estimacin indicadores de selectividad que recogen informacin de los cuestionarios de padres que aplica el SIMCE, donde se indaga si sus hijos fueron seleccionados para estudiar en esa escuela y as solucionar este problema de endogeneidad en la estimacin y poder afirmar que la efectividad de la escuela es independiente del tipo de estudiantes que educa. Como problema adicional, el puntaje inicial de un estudiante podra estar correlacionado con el efecto escuela cuando ste ya ha cursado aos de estudio en esa institucin cuando toma la prueba inicial. Para mitigar este efecto y asegurar que el puntaje inicial no est correlacionado, utilizan los datos de la prueba SIMCE que se aplica al finalizar el segundo ciclo acadmico, es decir en 4grado y la medicin final se hace al terminar el tercer ciclo acadmico (8 grado), partiendo de la idea de que los ciclos educativos son periodos de aprendizaje completos. En el artculo de San Martn y Carrasco se realiza una comparacin entre las clasificaciones de acuerdo a los resultados de SIMCE y el indicador de valor agregado que construyen. Al comparar las dos mediciones encuentran que el 41.4% de los colegios particulares subvencionados4 mejor su posicin si es reclasificado con puntajes SIMCE en lugar de emplear el indicador de VA. En cambio, el 48% de los establecimientos municipalizados5 que son reclasificados usando puntajes SIMCE en lugar del indicador de VA, descienden en su posicin de efectividad. (Ver tabla 1). Estos resultados indican la sensibilidad que tienen las clasificaciones respecto al tipo de metodologa que se utilice.
3
La prueba SIMCE evala el desempeo de los estudiantes chilenos al finalizar un ciclo escolar: en 4 Bsico, 8 Bsico y 2 Medio, esta prueba es equivalente a las pruebas SABER que aplica el ICFES al terminar los ciclos de educacin bsica en 5 y 9 y educacin media con la prueba de Estado SABER11.
4 5
Son instituciones que son administradas por entes privados pero que funcionan con recursos publicos. Son aquellos cuya gestin depende de la administracin municipal y que tienen como nica fuente la subvencin del Estado, ya que no cobran co-pago a los padres.
VA SIMCE
VA SIMCE
48.3% 18.6%
13.2% 41.4%
En este sentido, los modelos de valor agregado se constituyen como otra medida de la calidad educativa, complementaria al uso de los puntajes promedio de las pruebas estandarizadas. Ya que estos modelos aportan un indicador de efectividad escolar que sirve para explicar el mejoramiento de una escuela en trminos de su propia gestin, y que aade informacin til a la brindada por los promedios aritmticos. Adicionalmente, es importante tener en cuenta los elementos relevantes que brinda este tipo de estudios en la reflexin en torno a las mediciones de la calidad de la educacin. En particular la existencia de herramientas de evaluacin adicionales que permiten analizar de manera ms detallada las dinmicas de la educacin, que pueden ser de gran utilidad en la toma de decisiones de poltica pblica. No obstante, es sustancial tener en cuenta que dichos avances, como la medicin del valor agregado, se presenta como un reto para los institutos de evaluacin de la educacin, como el ICFES, dadas las complejidades metodolgicas que estos conllevan y la sensibilidad de las estimaciones. Invitamos a toda la comunidad acadmica a participar en el foro sobre valor agregado que se encuentra disponible en http://www.icfes.gov.co/investigacion/foros
(ver Florens&Mouchart, 1982); digamos de paso que las discusiones realizadas por Heckman tambin enfatizan los aspectos de dependencia; estos aspectos se formalizan usando el concepto de independencia condicional. Consideraciones similares podran extraerse de la discusin de causalidad desarrollada por Suppes en su libro A ProbabilisticTheory of Causality(1970). Otra perspectiva es la desarrollada en relacin a los potentialoutcomes(Rubin; Raudenbish) que tambin usan la herramienta probabilstica de independencia condicional. Las recientes contribuciones de M. Mouchart (mi antiguo supervisor; hoy profesor emrito del Instituto de Estadstica de la Universidad Catlica de Lovaina; ver http://www.uclouvain.be/isba) enfatiza, por un lado la dependencia, y por otro lado, la estabilidad estructural de una relacin de dependencia. Cuando ambas estn presentes (lo que se concluye de variados estudios empricos y discusiones sustantivas), es posible hablar de causalidad. Con esto en mente, retornemos a los modelos de VA controlando por endogenidad. El modelo que se propone es un modelo estructural. La definicin del efecto escuela es una definicin en trminos de dependencia; hace falta mayor discusin sustantiva de estas aproximaciones y ms estudios empricos para reportar estabilidad estructural. Con esto simplemente queremos decir que es posible responder a la pregunta pero despus de decidir una definicin de causalidad, y luego variados estudios empricos. Pregunta 4: Cmo se determinan los puntos de corte en la escala de valoracin de las escuelas para que sean lo ms equitativos posible, teniendo en cuenta las mltiples variables? Respuesta: Los modelos de valor agregado producen indicadores de valor agregado. Estos indicadores (junto a sus intervalos de prediccin) inducen un orden total (ranking) entre las escuelas. Ahora bien, en ese orden total se puede decidir introducir puntajes de corte. Sin embargo, este criterio es subjetivo. En efecto, se podra decidir definir grupos usando los cuartiles de la distribucin de los estimadores de valor agregado; otra aproximacin sera decidir cuntas escuelas deben quedar como inefectivas (decisin poltica) y as deducir el percentil correspondiente; etc. Por tanto, los puntajes de corte deben definirse de acuerdo a los usos que se les quiera dar a los indicadores de VA. Por lo dems, esto concuerda con lo que tpicamente se hace cuando se definen puntajes de corte usando un procedimiento de Standard Setting. As que la pregunta es: para qu queremos como Estado, por ejemplo, publicar indicadores de valor agregado? En Chile, por ejemplo, es para responsabilizar a las escuelas y eventualmente cerrarlas. An est en discusin cuntas escuelas deberan cerrarse; y de esa discusin depender el criterio de puntajes de corte. Pregunta 5: Cul es el nombre del paquete en R que usted cre y que permite estimar HLIM? Respuesta: El HLIM fue un procedimiento en R que los autores hicimos para realizar nuestras propias estimaciones. Esto lo hicimos para estar seguros de nuestras estimaciones. Ciertamente nuestro cdigo an no est a punto como suele estarlo una librera en R, pero parece posible poder compartirlo para fines de investigacin.