Vous êtes sur la page 1sur 10

Revista Mexicana de Investigacin Educativa

ISSN: 1405-6666
revista@comie.org.mx
Consejo Mexicano de Investigacin Educativa,
A.C.
Mxico

Garca Garduo, Jos Mara


El avance de la evaluacin en Mxico y sus antecedentes
Revista Mexicana de Investigacin Educativa, vol. 10, nm. 27, octubre-diciembre, 2005, pp. 1275-
1283
Consejo Mexicano de Investigacin Educativa, A.C.
Distrito Federal, Mxico

Disponible en: http://www.redalyc.org/articulo.oa?id=14002721

Cmo citar el artculo


Nmero completo
Sistema de Informacin Cientfica
Ms informacin del artculo Red de Revistas Cientficas de Amrica Latina, el Caribe, Espaa y Portugal
Pgina de la revista en redalyc.org Proyecto acadmico sin fines de lucro, desarrollado bajo la iniciativa de acceso abierto
EL AVANCE DE LA EVALUACIN
EN MXICO Y SUS ANTECEDENTES
JOS MARA GARCA GARDUO

n primer lugar, agradezco al COMIE , particularmente a Eduardo de la


E Garza, el haberme invitado a participar como comentarista en la pri-
mera seccin temtica de la RMIE dedicada a la evaluacin. Antes de ha-
blar sobre el artculo de Elisa Fernndez y Edna Luna (2004), al cual debo
la invitacin, quisiera que se me consintiese comenzar con la presentacin
sucinta del panorama de la evaluacin, en particular de dos de las reas
que aborda esta seccin temtica, evaluacin de programas y de la docen-
cia, y hacer un somero balance de las mismas dimensiones sobre su avance
en Mxico; posteriormente comentar el tema y artculo de Fernndez y
Luna.
Hoy en da en el sector educativo, y en otros ms, es muy comn hablar
de la evaluacin. El desarrollo de la evaluacin ha sido producto de dos
disciplinas que, posteriormente, convergieron en el camino: la psicologa
y la educacin. A la psicologa, en particular a la psicometra, se le debe el
desarrollo de los primeros tests de rendimiento como el Stanford Achievement
Test en 1923. Sin duda los psiclogos como Edward L. Thorndike tuvie-
ron mucho que ver en ese desarrollo. Sin embargo, es poco conocido que
a Ralph Tyler se le debe la creacin del trmino evaluacin y, posterior-
mente el de assessmen t, para referirse a la estimacin del desempeo esco-
lar, y que este gran educador e investigador fue el primero que dise
pruebas de rendimiento basadas en los objetivos del curso, tal y como se
conocen el da de hoy (Cordero y Garca Garduo, 2004), a principios de
la dcada de los treinta. La distincin entre assessment y evaluacin es muy
fina y, en ocasiones, hasta confusa. Por assessment los estadunidenses en-

Jos Mara Garca Garduo, Universidad Autnoma del Estado de Hidalgo. CE: josemariagarduno@yahoo.com.mx

Revista Mexicana de Investigacin Educativa 1275


Garca

tienden la evaluacin sistemtica, usualmente a travs de pruebas del des-


empeo escolar; en cambio, evaluacin es un trmino ms amplio.
Tyler es considerado el padre de la evaluacin educativa en todos los
sentidos. No slo acu el trmino de evaluacin y cre la metodologa
para construir pruebas objetivas de rendimiento, a principios de la dcada
de los treinta, sino que tambin ide el primer mtodo para evaluar pro-
gramas educativos a raz del estudio curricular ms grande que se haya
realizado en Estados Unidos: El estudio de los ocho aos (1933-1941) del
cual Tyler, junto con sus discpula y asistente Hilda Taba, fue el coordina-
dor de evaluacin de ese gran proyecto (Ridings, 1981). La evaluacin de
programas se inspir en los mismos principios del mtodo tyleriano para
disear tests de rendimiento: evaluar en qu medida se han logrado los
objetivos; estos mtodos para valorar el aprendizaje y los programas estu-
vieron sin cuestionarse por ms de 20 aos. El cuestionamiento comenz
en 1963 con la publicacin de un artculo de Lee Cronbach (otro discpu-
lo de Tyler) sobre el mejoramiento de los cursos a travs de la evaluacin.
Fue este gran psiclogo el primero en hablar sobre la evaluacin formativa,
sin usar ese trmino (Cronbach, 1983).
Posteriormente, a raz de la Guerra contra la pobreza y el Acta de educa-
cin elemental, promulgadas en 1965 por el Gobierno Federal estadouni-
dense, surge la necesidad de rendir cuentas sobre los miles de millones de
dlares destinados a la educacin y a otros programas sociales. Para llevar
a cabo la tarea se contrataron especialistas en evaluacin que determina-
ran la utilidad de los programas (Stufflebeam y Shinkfield, 1987). Estos
especialistas pronto se dieron cuenta que el mtodo tyleriano no provea
de toda la informacin necesaria sobre la marcha y utilidad de los mismos.
Entre 1966 y 1971 surgen las principales aportaciones terico-metodolgicas
sobre la evaluacin de programas que han dado pie al desarrollo de otras
modelos y variantes metodolgicas: el modelo CIPP (contexto, insumo proceso
y producto) de Stufflebeam, el orientado al consumidor de Scriven, el de
la figura de Stake (de inspiracin Tyleriana) y posteriormente su mtodo
cualitativo llamado evaluacin respondente. Este ltimo fue el primer mo-
delo cualtitativo basado en el estudio de casos.
En la presentacin a la seccin temtica que comentamos, De la Garza
(2004a) analiza los orgenes de los modelos naturalistas de evaluacin en
Inglaterra en los setenta. El autor provee de informacin poco conocida
sobre los orgenes de la tradicin naturalista. Stake fue participante de las

1276 Consejo Mexicano de Investigacin Educativa


El avance de la evaluacin en Mxico y sus antecedentes

conferencias que describe De la Garza; los trabajos de Parlett y Hamilton,


creadores del modelo de evaluacin iluminativa y participantes en esa con-
ferencia, fueron muy importantes para fundamentar su modelo de evalua-
cin respondente.
A partir de la dcada de los setenta la evaluacin empez una etapa de
profesionalizacin vertiginosa. En 1975 los evaluadores ms connotados
comenzaron a planear la construccin de estndares de evaluacin que guiarn
la prctica profesional; para ello fue creado el Comit Conjunto de Eva-
luacin Educativa que public en 1981 los primeros estndares de evalua-
cin de programas. En 1994 sali a la luz la segunda edicin de los estndares
(Joint Committee on Standars for Educational Evaluation, 1994), se divi-
den en cuatro grandes reas: utilidad, viabilidad, propiedad (tica) y pre-
cisin (mtodo) de la evaluacin. El estndar ms peculiar de la evaluacin,
y que la hace diferente de la investigacin, es que la evaluacin debe ser
til. Para realizar ese propsito es necesario que, adems de entregar in-
formes oportunos, el evaluador debe considerar las necesidades y expecta-
tivas del cliente y los grupos interesados en la evaluacin. Cuando se hace
sin que el evaluador se involucre con esos aspectos, considerando sola-
mente o en gran medida las creencias y expectativas del evaluador, se le
denomina evaluacin de caja negra (black box evaluation). El Comit Conjunto
recomienda que el proceso de metaevaluacin, evaluacin de la evalua-
cin, se lleve a cabo bajo los estndares citados.
Podra decirse que las obras de Tyler, Scriven, Stufflebeam y Stake han
sido las cumbre que han cobijado, inspirado y desarrollado el campo torico-
metodolgico de la evaluacin de programas. Todos ellos, con excepcin de
Tyler, estn vivos y activos dentro del campo. Recientemente Scriven fue
invitado por el Centro de Evaluacin de la Universidad de Western Michigan,
hasta hace poco dirigido por Daniel Stufflebleam, a dirigir el Journal of
Multidisciplinary Evaluation. Parece ser que dedicarse a la evaluacin est
asociado con longevidad y productividad intelectual. Para comprobarlo es
slo cuestin de mirar la actividad de esos padres (vivos) de la evaluacin.

La evaluacin de la docencia
Al igual que la evaluacin de programas, la de la docencia comenz y se
desarroll en Estados Unidos, pero han seguido caminos paralelos que
raramente se han entroncado. Herman Remmers de la Universidad de
Indiana, cre el primer cuestionario de evaluacin de la docencia ( CEDA )

Revista Mexicana de Investigacin Educativa 1277


Garca

en 1927 (Centra, 1993). Remmers y su equipo fueron, prcticamente los


nicos que investigaron sobre el tema durante los siguientes 25 aos.
El uso de los CEDA comenz a popularizarse a partir de finales de la
dcada de los sesenta. En un principio, las instituciones universitarias de
ese pas promovan la aplicacin voluntaria, posteriormente se hizo obli-
gatoria. Hoy en da ms de 90% de las instituciones estadunidenses eva-
lan la docencia por medio de esos cuestionarios (Seldin, 1993). El uso de
los CEDA ha promovido el desarrollo de la investigacin, principalmente
en Estados Unidos y Canad. Al respecto, se pueden distinguir al menos
cuatro fases en el desarrollo: la primera corresponde a la poca de Remmers;
la investigacin fue escasa y poco sistemtica; la segunda la podramos
situar en la dcada de los setenta donde la mayora estuvo dedicada a de-
terminar la validez y confiabilidad de los CEDA ; la tercera puede situarse
en los ochenta; aqu los investigadores estuvieron ms preocupados por
relacionar los resultados de los CEDA con caractersticas de los alumnos, la
disciplina y el profesor (Garca Garduo, 2000). A partir de los noventa,
despus de haber sido uno de los temas ms estudiados de la educacin
superior en dcadas anteriores, el inters de los investigadores comenz a
disminuir, pero algunos siguen elaborando sobre el tema. Otros, como
Herbert Marsh, probablemente el investigador ms importante desde los
ochenta, estn cambiando de objeto de investigacin. Sus intereses recien-
tes tienen que ver con el desarrollo del autoconcepto y su relacin con
constructor de la motivacin.

El desarrollo de la evaluacin en Mxico: un proceso interrumpido


El trabajo de Martnez Rizo (2001) presenta un panorama muy completo
del desarrollo de la evaluacin del aprendizaje y de las pruebas en el medio
internacional y en Mxico. De acuerdo con este autor, el nacimiento de la
evaluacin educativa y concretamente de la del aprendizaje en Mxico co-
menz muy temprano, en 1936, con el Instituto Nacional de Psicopedagoga.
Sin embargo, a decir del autor es en la dcada de los noventa con el lanza-
miento del Examen de Habilidades y Conocimientos Basicos ( EXHCOBA ),
la creacin del CENEVAL en 1994 y el rea de evaluacin de la SEP en 1995,
que se ha atendido de manera sistemtica la evaluacin del aprendizaje.
Puede colegirse que uno de los grandes problemas que se han tenido en
el pas y que ha impedido el desarrollo de la evaluacin y la continuidad
en los proyectos y programas es, por ejemplo, que en la evaluacin del

1278 Consejo Mexicano de Investigacin Educativa


El avance de la evaluacin en Mxico y sus antecedentes

aprendizaje los registros formales son escasos o inexistentes salvo por los
testimonios sobre el gran salto hacia delante que se tuvo durante la se-
gunda mitad de la dcada de los setenta, con la creacin de la Direccin
General de Evaluacin del SEP , encabezada por Ral Taln. En esa Direc-
cin se form un grupo, la mayora de jvenes psiclogos egresados de la
UNAM y de la UIA , que se dedic a elaboracin cientfica de pruebas de
rendimiento. Ese equipo, entre los que se cuentan ngel Lpez y Mestas,
Mara del Rayo Jimnez, Carlos Garca Camacho, Enoch Tamariz, Ar-
mando Vsquez, Mara Garca y Graciela Galindo, tradujeron artculos
sobre el tema, desarrollaron manuales de elaboracin de reactivos y de
anlisis de tems; construyeron y aplicaron pruebas de rendimiento a muestras
nacionales. Sin embargo, el trabajo del grupo, el tiempo y el dinero inver-
tido ha quedado perdido en algn archivo muerto de la SEP . La historia
comenz nuevamente a partir de la dcada de los noventa. A pesar de todo
ello, es en la evaluacin del aprendizaje donde Mxico tiene los avances
importantes en esta materia. Existen tres instituciones importantes dedi-
cadas al cultivo de la disciplina: el Instituto de Investigacin y Desarrollo
Educativo de la UABC ( IIDE ), el CENEVAL y el INEE .
En materia de evaluacin de programas podra afirmarse que, en com-
paracin con el desarrollo internacional y con el de otros pases de la re-
gin, es una de las reas que en Mxico ha tenido menos desarrollo, a
pesar de que se public en espaol uno de lo primeros textos dedicados al
tema, me refiero a la obra de Carol Weiss (1975): Investigacin evaluativa .
Ese nivel escaso de desarrollo se manifiesta, por ejemplo, en que la ma-
yora de los trabajos de evaluacin publicados se basan en el modelo de
caja negra; que poco se preocupa de la utilidad de la evaluacin y toma en
cuenta los intereses de los usuarios del programa; bsicamente, se lleva a
cabo bajo la orientacin tyleriana de los objetivos. Asimismo, no adopta
los mtodos y estndares derivados de los enfoques ms importantes de la
evaluacin de programas, o emplea trminos como evaluaciones cuantita-
tivas o cualitativas, cuando en el escenario internacional se ha dejado de
emplear esa terminologa, la cual fue derivada de la pugna entre lo cualita-
tivo versus lo cuantitativo acaecida en las dcadas de los setenta y ochenta.
En el campo de la evaluacin, esa pugna concluy a principios de los no-
venta. De acuerdo con los estndares del Comit Conjunto (Joint Committee,
1994), los informes de evaluacin deben incluir tanto informacin cuan-
titativa como cualitativa.

Revista Mexicana de Investigacin Educativa 1279


Garca

En materia de la profesionalizacin de la evaluacin, algunos pases de la


regin muestran avances ms notables que Mxico, por ejemplo, en 1989 se
cre la Asociacin Centroamericana de Evaluacin, con sede en Costa Rica.
En el 2002 se crearon organizaciones profesionales de evaluacin en Brasil
Colombia y Per (Chianca y Youker, 2004). En Mxico, a pesar del dinero
y esfuerzo dedicado no se ha formado ninguna asociacin profesional.

Evaluacin de la docencia
La excepcin ha sido la evaluacin de la docencia . En esta rea Mxico ha
hecho progresos notables. El uso de los cuestionarios comenz casi a la par
en que inici su uso sistemtico en Estados Unidos, a finales de la dcada
de los sesenta. El introductor en Mxico fue el padre Ernesto Meneses
Morales, sj, de la Universidad Iberoamericana. En 1971, en la UIA se crea
el primer cuestionario mexicano de evaluacin docente. En esa dcada en
la UNAM se hacen varios trabajos de investigacin sobre el tema. Durante
la segunda mitad de los ochenta ciertas universidades pblicas y privadas
comenzaron a emplear CEDA de manera sistemtica en la evaluacin de las
tareas docentes. En 1984 Arias Galicia public, por primera vez, las carac-
tersticas psicomtricas de un instrumento de evaluacin docente.
A partir de los noventa, a la luz de los programas de estmulo, los cues-
tionarios de evaluacin comenzaron a ser un tema comn y aceptado den-
tro de las universidades pblicas. A mediados de esta poca se crea el Grupo
Interinstitucional de la Evaluacin de la Docencia, al que pertenecen dos
de las autoras de la seccin temtica publicados en este nmero. En este
grupo, que se form bajo el liderazgo de acadmicos de la UNAM , estn
involucradas, segn la numeralia de Eduardo Garza (2004b), ocho insti-
tuciones de educacin superior (seis pblicas y dos privadas).
Durante los ocho aos de vida, el Grupo Interinstitucional de Evalua-
cin de la Docencia ha producido una cantidad notable de libros, tesis,
nmeros temticos y artculos sueltos, adems de haber realizado varias reuniones
internacionales sobre el tema. Al respeto se est preparando un artculo de
investigacin que analiza el desarrollo y produccin de este grupo.
Uno de los dos trabajos de este grupo presentado en el reciente nmero
que comentamos de la RMIE es el de Elisa Fernndez y Edna Luna. Las
autoras buscaron indagar cules son los componentes de la docencia que
los profesores de los programas del rea de ingeniera y tecnologa consi-
deran relevantes de integrar al cuestionario de evaluacin de la docencia

1280 Consejo Mexicano de Investigacin Educativa


El avance de la evaluacin en Mxico y sus antecedentes

por los alumnos. Si slo nos atuviramos al objetivo del trabajo se podra
concluir, errneamente, que la investigacin es simple y que no vale mu-
cho la pena invertir tiempo y recursos en llevar a cabo una investigacin
de tal naturaleza. Sin embargo, el tema es valioso por s mismo.
A pesar de la popularidad creciente de los cuestionarios de evaluacin,
y segn lo informado en diversas investigaciones producidas por el grupo
mencionado (Arbes, 2004; Gilio, 2000; Loredo y Grijalva, 2000), el do-
cente no ha sido, en la mayora de los casos, un partcipe activo en el
proceso de evaluacin de su desempeo. Para llevar a cabo el trabajo las
autoras siguieron una metodologa original y vlida, pues ya haba sido
probada en otros estudios de una de las autoras del artculo (Luna, 2002).
Los resultados de su investigacin confirman los hallazgos internacio-
nales (Cashin, 1990) y nacionales (Garca Garduo, 2003): las disciplinas
le otorgan un peso diferente a ciertos aspectos de la evaluacin docente.
Asimismo, que los profesores universitarios aceptan y consideran justo y
necesario ser parte activa en este proceso de evaluacin. Por otro lado, el
estudio seala la importancia de los profesores en el mejoramiento de este
tipo de instrumentos. La retroalimentacin que dieron nos muestra que
en la enseanza de las ingenieras es importante la solucin de problemas
y que la enseanza en reas que integran el plan de estudios puede se dife-
rente. Adems, que los aspectos a evaluar sobre el desempeo docente va-
ran de acuerdo con el tipo de curso y el nivel en que se encuentre situado
dentro del plan de estudios.
El estudio de las autoras puede ser til para iniciar una discusin siste-
mtica sobre la posibilidad de que los CEDA incluyan aspectos generales
aplicados a toda la poblacin universitaria y una seccin propia para cada
disciplina o rea de conocimiento. Cules seran las limitaciones y bon-
dades de tener un cuestionario que incluyera aspectos generales para eva-
luar la docencia de toda la institucin y que adems incluyera otros reactivos
dirigidos a satisfacer las necesidades de evaluacin especficas de las dife-
rentes disciplinas o carreras? Esta estrategia es conocida como el mtodo
de cafetera , creada en la Universidad de Indiana en Estados Unidos. El
nombre es una analoga de la manera en que el comensal elige los alimen-
tos en una cafetera de autoservicio; de la misma forma se escogen los reactivos
del cuestionario para evaluar al docente.
Podemos apreciar que en Mxico la investigacin sobre la evaluacin
de la docencia ha hecho progresos notables que sealan un desarrollo im-

Revista Mexicana de Investigacin Educativa 1281


Garca

portante y propio. Los programas de estmulo salarial y el Grupo Inter-


institucional de Evaluacin de la Docencia han sido las piedras de toque
para tal desarrollo.
Finalmente, puede concluirse que el desarrollo del campo de la evalua-
cin en Mxico ha sido, de alguna manera, ahistrico. Poco ha servido lo
que se hizo antes de la dcada de los noventa para la nueva etapa que
comenz en esos mismos aos. Para favorecer su desarrollo y continuidad
convendra pensar en la creacin de una gran asociacin mexicana de eva-
luacin. Esta asociacin podra crear una revista de mayor alcance que las
actuales, que difundiera los avances de la disciplina y los hallazgos produ-
cidos. Asimismo el INEE y el CENEVAL bien podran auspiciar la forma-
cin de una asociacin profesional para superar el aislamiento y promover
el desarrollo de la disciplina en Mxico, como est ocurriendo en otros
pases de la regin.

Referencias
Arbes, Ma. I. (2004). Evaluacin de la docencia: Una propuesta alternativa que consi-
dera la participacin de los profesores, Revista Mexicana de Investigacin Educativa,
9, nm. 23, pp. 863-890.
Cashin, W. E. (1990). Students do Rate Different Academic Fields Differently, en Theall
y Franklin (eds.), Student Ratings of Instruction, New Directions for Teaching and Learning,
nm. 43, San Francisco: Jossey-Bass, pp. 113-121.
Chianca, Th. y Youker B. (2004). La evaluacin en Amrica Latina y el caribe: Visin
general de los desarrollos recientes, publicado originalmente en ingls en noviembre
de 2004 en el primer nmero del Journal of Multidisciplinary Evaluation, y disponible
en web:http://evaluation.wmich.edu/jmde/.
Centra, J. A. (1993). Reflective faculty evaluation, San Francisco: Jossey-Bass.
Cordero, G. y Garca Garduo, J. M. (2004). The Tylerian curriculum model and the
reconceptualists. Interview with Ralph W. Tyler (1902-1994), Revista Electrnica de
Investigacin Educativa, 6 (2), disponible en http://redie.uabc.mx/vol6no2/conteni-
do-cordero.html.
De la Garza, E. (2004a). La evaluacin educativa, Revista Mexicana de Investigacin
Educativa, 9, nm. 23, pp. 807-816.
De la Garza, E. (2004b). Evaluacin de la docencia en la educacin superior, resea,
Revista Mexicana de Investigacin Educativa, 9, nm. 23, pp. 933-946.
Fernndez, E. y Luna, E. (2004). Evaluacin de la docencia en el contexto disciplinario:
La opinin de los profesores en el caso de la ingeniera y tecnologa, Revista Mexicana
de Investigacin Educativa, 9, nm. 23, pp. 891-911.
Garca Garduo, J. M. (2000). Las dimensiones de la efectividad docente, validez y
confiabilidad de los cuestionarios de evaluacin de la docencia: sntesis de investi-

1282 Consejo Mexicano de Investigacin Educativa


El avance de la evaluacin en Mxico y sus antecedentes

gacin internacional, en Rueda y Daz-Barriga (compiladores), Evaluacin de la


docencia , Mxico: Paids, pp. 41-62.
Garca Garduo, J. M. (2003). Profesores universitarios y su efectividad docente. Un
estudio comparativo entre Mxico y Estados Unidos, en Perfiles Educativos, 25 (100),
pp. 42-55.
Gilio, Ma. C (2000). La evaluacin docente desde una perspectiva participativa: el caso
de la licenciatura en Qumica de la Universidad Autnoma de Quertaro, en Rueda y
Daz Barriga (coords.) Evaluacin de la docencia, Mxico: Paids, pp. 85-101.
Joint Committee on Standards for Educational Evaluation (1994). The program Evaluation
Standards (2a ed.). Thousand Oaks, CA: Sage. Existe traduccin al espaol: Comit
Conjunto de Estndares para la Evaluacin Educativa (1998). Estndares para la eva-
luacin de programas, Bilbao: Ediciones Mensajero.
Loredo, J. y Grijalva, O. (2000). Propuesta de un instrumento de evaluacin de la do-
cencia para estudios de posgrado. Quertaro, en Rueda y Daz Barriga, Evaluacin de
la docencia, Mxico: Paids, pp. 103-131.
Luna, E. (2002). La participacin de los docentes y estudiantes en la evaluacin de la docen-
cia, Mxico: Universidad Autnoma de Baja California/Plaza y Valds.
Ridings, J. (1981). An interview with Ralph Tyler, Occasional papers, nm. 13, noviem-
bre, disponible en http://www.wmich.edu/evalctr/pubs/ ops/
Martnez Rizo, F. (2001). Evaluacin educativa y pruebas estandarizadas. Elementos
para enriquecer el debate, Revista de la Educacin Superior, 30 (120), pp. 71-85,
disponible en: www.anuies.mx/principal/servicios/publicaciones/revsup/rres120/
men5.htm.
Seldin, P. (1993 ). The Use and Abuse of Student Ratings of Professors,The Chronicle of
Higher Education, vol. 39, julio 21, p. 40.
Stufflebam, D. y Shinkfield, A. (1987). Evaluacin sistemtica, Barcelona: Paids.
Weiss, C. (1975). Investigacin evaluativa , Mxico: Trillas.

Revista Mexicana de Investigacin Educativa 1283