PROFESORADO PARA TÉCNICOS

LA EDUCACIÓN EN EL CONTEXTO ACTUAL (1)

LA EVALUACIÓN

Los Modelos de Aprendizaje y de Enseñanza encarnan las distintas conceptualizaciones y alcances de la Didáctica General, y dentro de ésta, la evaluación tiene un capítulo especial y muy importante

Siempre que enseñes,

enseña a la vez a dudar de lo que enseñes.

José Ortega y Gasset

La evaluación tiene múltiples dimensiones y el docente debe conocerlas en profundidad desde cada rol.

Comenzaremos de lo general a lo particular…

TEMA: LA EVALUACIÓN

Introducción - Generalidades- Tipos- Funciones – Instrumentos- Problemática

Introducción

Es innumerable la variedad de definiciones que podemos hallar sobre evaluación, al igual que cualquier otro concepto relacionado con la educación. Todos los que, en algún momento pasamos por las aulas, hemos construido un concepto propio de la evaluación en relación a las experiencias vividas y según el rol que hemos ocupado. Sin embargo, el término no se remite sólo al ámbito de la educación, lo trasciende superando la idea de calificación, hacia una con mayor alcance que implica la valoración o juicio.

La evaluación como juicio corresponde a la acepción más antigua y ya está presente en la antigua China antes de Cristo en su administración pública. En las ordenanzas escolares sajonas se encuentran desde 1.430 principalmente en el juicio oral que grupos de jueces emitían sobre admisiones, promociones y rendimientos finales del alumnado. Ya en el Renacimiento también es posible encontrar este tipo de evaluación en las disputas o presentaciones públicas en las cuales se evaluaban (juzgaban) las discusiones sobre temas de controversia y las exposiciones de cada participante (Castro, 2004).

La palabra ‘evaluación’ evoca situaciones vinculadas a sensaciones de rigor, tensión, ansiedad y, finalmente, a ideas de justicia o injusticia. Por ello, independientemente del ámbito en ámbito del que se trate – empresarial, comercial, político, educativo, etc. - la evaluación no es bien aceptada, por el contrario, se desconfía de quien la aplica, del instrumento, del tratamiento que se le dará a los datos y fundamentalmente, de las consecuencias negativas que producto de la misma devengan. No se circunscribe solamente a la búsqueda de información, la aplicación de cuestionarios o la implementación de cualquier forma de observación. La evaluación está íntimamente relacionada a las decisiones.

Generalidades

En los albores del siglo XX aparecen los tests destinados a medir la capacidad mental de una persona. Posteriormente y en pos de encontrar y perfeccionar una medición objetiva, participan otros investigadores como: Thorndike, Stone, Binet, Simon, Terman, Decroly, entre otros. Este movimiento de tipo psicológico da como producto la aparición de los tests objetivos de rendimiento, los que se inscriben en las nuevas formas de la evaluación. Esta acepción de medición tiene como principal característica su pretensión de poseer carácter científico, el que se incrementaba en la medida que los datos pudieran trabajarse en forma estadística mediante indicadores globales de comportamiento. Con ello, se le atribuía altos niveles de objetividad impidiendo la emisión de juicios personales por parte del profesor. Sin embargo y al correr del tiempo, esta acepción comenzó a ser cuestionada fundamentalmente por su imposibilidad de medir todos los aspectos involucrados en el proceso educativo y también por la mala calidad de los tests elaborados. Estos antecedentes sentaron las bases para que se comenzara a tener cautela con respecto al uso exagerado de la psicometría en los procesos de instrucción (Castro, 2004).

Hacia 1930 se revoluciona el ámbito de la evaluación con la aparición de los postulados de Ralph Tyler a través de los cuales se sugería que las pruebas debían medir los cambios producidos por los medios educativos. Desde este instante el cambio conductual, cuya expresión habla de los ‘objetivos instruccionales’, motiva la génesis de una nueva concepción de la evaluación, sustentada fuertemente en el desempeño en relación a metas prefijadas. Su importancia fundamental radica en que a través de ella se puede relacionar el proceso evaluativo con otros aspectos del currículum escolar como son: el profesor, los planes y programas de estudio, los medios, infraestructura, entre otros. Su aplicación basada en la evaluación del avance o progreso de un proceso sentó bases para dar mayor importancia a los procesos educativos y no sólo centrarse en los resultados o productos, los que generalmente se adscriben al concepto de rendimiento (Castro, 2004).

Hay una amplia bibliografía que remite a diferentes concepciones sobre evaluación, desde una perspectiva general hasta la educativa en particular, coexistiendo entre las más conocidas las que la entienden como juicio, es decir que se vincula con la valoración, otra es la de medición, que se relaciona con la cuantificación, también se presenta la acepción de congruencia, que se relaciona con las actividades de comparación. Asimismo encontramos aquella cuyo sentido se relaciona con la decisión lo que conlleva actividades de acumulación y, por último, aquella que se relaciona con la acción y ésta con la consecuente la modificación.

La definición que ha adoptado el Joint Committee on Standards for Educational Evaluation considera que: “la evaluación es el enjuiciamiento sistemático de la valía o mérito de un objeto” y que tiene como requisitos: ‘la utilidad’, ‘la factibilidad’, ‘la ética’, y ‘la exactitud’ (Stufflebeam y Shinkfield, 1993, pp. 19 y 27).

Otra que la aborda desde esta mirada amplia es la elaborada por Stufflebeam y Shinkfield (1993) quienes sostienen que la evaluación “(…) supone comparar objetivos y resultados” (p.19). O la de Bloom, quien concibe que:

La evaluación se define como la formación de juicios sobre el valor de ideas, obras, soluciones, métodos, materiales, etcétera, según algún propósito determinado. Implica el uso de criterios y pautas para valorar la medida en que los elementos particulares son exactos, efectivos, económicos o satisfactorios (Bloom, 1986, p. 118).

En el ámbito netamente educativo las definiciones se multiplican incorporando fundamentalmente los requisitos de sistematicidad y la toma de decisiones. Se puede decir que la evaluación es una actividad inherente a toda actividad humana intencional, por lo que debe ser sistemática y su objetivo debe ser determinar el valor de algo (Popham, 1980).

Al mismo tiempo, siempre que se evalúa debe ser para tomar decisiones. No alcanza con recoger información sobre los resultados del proceso educativo y emitir una calificación. Sino que implica alguna decisión. En este sentido, se considera que la evaluación es una actividad o proceso sistemático de identificación, recogida o tratamiento de datos sobre los elementos o hechos educativos, con el objetivo de valorarlos primero y, luego tomar decisiones (García Ramos, 1989). Cabe señalar aquí que si hablamos de toma de decisiones luego de una evaluación en el campo de la educación, es de suponer que se deberán vincular éstas últimas al mejoramiento. Aquí podríamos redondear la idea de evaluación como “(…) el proceso de recolección sistemática de evidencias con las cuales se pretende determinar el mérito de algo para su mejor desarrollo” (Larrondo, 1996). En este caso, Larrondo le incorpora al requisito de la evaluación, la toma de decisión definida como mejora.

Cabe aquí señalar que la evaluación se relaciona con la toma de decisiones y se circunscribe al contexto (Fernández Ballesteros (1995), mientras que la finalidad de la investigación es la búsqueda del conocimiento con pretensión de que su alcance sea generalizable (Samaja, 2004).

En el terreno netamente educativo, emergen otras especificaciones como el término calificación, el cual se refiere exclusivamente a la valoración de la conducta de los/as alumnos/as – calificación escolar. La calificación es entonces, una acción restringida de la evaluación, la que podrá ser cuantitativa (con 10, 9, 8…) o cualitativa (apto o no apto, excelente muy bueno…) señalando el juicio de valor que se ha emitido sobre los logros del estudiante en cuanto a su conducta, destreza, conocimientos u otras.

De una u otra manera, corresponde a una cuantificación, tal como decía Edward Thorndike, considerado el padre de las ‘modernas mediciones educacionales’, aunque en 1864 George Fisher ya había publicado los ‘Manuales de escalas de evaluación’ coincidente con el gran auge de los exámenes de admisión que se produce a finales del siglo XIX. Thorndike fue un ferviente defensor del experimento y la medición y decía que todo lo que existe, existe en cierta cantidad y conocerlo exhaustivamente implica conocer su cantidad lo mismo que su calidad (Thorndike, 2009).

Thorndike es difícilmente rebatible epistemológicamente, pero esconde problemas para el conocimiento concreto del objeto, porque requiere disponer de teorías pertinentes sobre la naturaleza del mismo e instrumentos adecuados para su estudio. Esto reviste un trabajo renovado tanto de educadores como de disciplinas auxiliares de la educación porque aún son insuficientes, por ejemplo, en el caso del aprendizaje.

La perspectiva de Thorndike, relacionada con el apogeo de los modelos experimentales de los trabajos del campo de la Psicología, tiene gran impacto en el ámbito educativo porque cuando se habla de evaluación de los aprendizajes se la relaciona con la medición. Se le adjudica a la evaluación el significado de medir resultados utilizando algún tipo de instrumento formalizado que produce información para ser comparada con alguna clase de escala estandarizada. (Pizzarro, 1996).

Tipos de evaluación

En las décadas comprendidas entre las dos guerras mundiales hubo un vertiginoso perfeccionamiento de las técnicas para la medición educacional y su aplicación, teniendo un correlato directo con la proliferación de los tests y su empleo en distintas áreas de la práctica social con propósitos no solo científicos, sino de selección y clasificación de personas para distintos efectos (Stufflebeam, 1993).

Con el transcurrir del tiempo y en virtud de las distintas prácticas y postulados de Ralph Tyler, los cuales sugieren que las pruebas deberían medir los cambios producidos en relación a objetivos previamente prefijados, se empieza a visualizar un cambio de acepción. Dos décadas después, se manifiestan claramente nuevas preocupaciones éticas y sociales respecto a la problemática evaluativa, que desarrollarían en la década del setenta otros enfoques como las alternativas cualitativas. Y así, podemos llegar a concebir a la evaluación educativa ya no como una finalidad de la enseñanza sino como un medio de perfeccionamiento y mejora constante (Castro, 2004; Fernández Ballesteros, 1995; Stufflebeam, 1993).

Según el proceso histórico se pueden reconocer diferentes concepciones de evaluación. Desde el paradigma cuantitativo ésta puede ser entendida como objetiva, neutral y predictiva centrándose en la eficiencia y la eficacia. Lo que se evalúa es pues, los productos observables.

Pero desde una perspectiva cualitativa, la evaluación se basa en reconocer lo que esta sucediendo y comprender qué significado tiene para las diferentes personas, en este caso no solamente se evalúa el producto, sino que también considera el proceso.

Desde una perspectiva crítica, la evaluación no se basa solamente en recoger información, sino que también implica diálogo y autorreflexión (Santos Guerra, 1993).

Otra dimensión de análisis respecto a las evaluaciones educativas se refiere a tres roles distintos que pueden cumplir según el momento de aplicación en el proceso de enseñanza-aprendizaje. De esta manera, pueden ser sumativas, formativas o de diagnóstico.

La ‘evaluación sumativa’ es conocida también como evaluación de productos, evalúa procesos acabados, con realizaciones precisas y valorables. Su única pretensión es determinar la valoración en función del uso que se va a desarrollar, por lo que la calificación suele ser bipolar, del tipo apto o no apto, aceptado o rechazado, promociona o no promociona, aprobado o no aprobado.

La ‘evaluación formativa’ conocida también como evaluación continua, o evaluación de procesos, tiene una clara intencionalidad de modificación, mejora o ajuste del propio proceso educativo en curso, en su totalidad o en alguno de sus componentes o elementos.

Por último, la ‘evaluación diagnóstica’ tiene como objetivo pronosticar. Consiste en recabar, información sobre las competencias de un estudiante para poder comenzar un nuevo aprendizaje (Castro, 2004).

Finalmente, podemos decir que entre las acepciones modernas, la evaluación es considerada como la acción de permitir un juicio de valor sobre un determinado objeto o tema, no sólo desde las características del mismo, sino comparándolo con determinados y consensuados parámetros. Estos factores incorporados a la definición, y que se los señala como imprescindibles en todo sistema operativo, porque además van íntimamente vinculados a la toma de decisiones, tiene implicancias democráticas, flexibles y de ajuste al contexto que hasta el momento no eran tenidas en cuenta (Santos Guerra, 1993).

Mientras que la evaluación educativa es considerada como un proceso complejo y continuo de valoración de las situaciones pedagógicas, de sus resultados, de los contextos y condiciones en que éstas se producen.

Forma parte intrínseca de los procesos de enseñanza y de aprendizaje, y su función es la de proporcionar la comprensión de estos procesos, en esos contextos y condiciones, para orientar la toma de decisiones que posibiliten su mejoramiento (Santos Guerra, 1996). En este sentido, los tipo de evaluación planteados se pueden vincular con las necesidades u objetivos que se persigan y consecuentemente aparecen otras ideas como la evaluación del tipo global, integradora, parcial, la manifiesta de manera explícita o implícita (Castro, 2004).

Funciones de la evaluación

Desde una perspectiva social, es posible identificar diversas funciones de la evaluación. Se puede evaluar para:

- Seleccionar: históricamente y actualmente, la evaluación ha servido para seleccionar y controlar socialmente. Tal como señala Foucault la evaluación o el examen relacionan mecanismos de jerarquización para vigilar y para sancionar que terminan normalizando. Es una mirada normalizadora, una vigilancia que permite calificar, clasificar y castigar. Esto se debe a que pone de manifiesto diferencia entre el individuo y el criterio normativo para sancionar (Foucault, 1993). De manera que el examen es el instrumento que convierte los problemas sociales en pedagógicos.

- Medir la calidad del sistema educativo o controlar el sistema: Según la tendencia actual, se entiende a la evaluación como una actividad política y administrativa. Por lo tanto constituye una tarea sistémica en las políticas sociales y de administración pública debido que se consideran, tanto las políticas y los servicios públicos, como objetos de evaluación. Las causas de este fenómeno se deben a ‘razones económicas y presupuestarias’, como la contención del gasto público y prioridades en la asignación de recursos; y, también, por ‘presión de la opinión pública’, comúnmente denominado ‘rendición de cuentas’ vinculadas a la exigencia de transparencia y en armonía con los principios de una gestión democrática (De Ketele, 1984; Fernández Ballesteros, 1995). Consecuentemente, se produce un cambio en la administración pública mediante los modelos de control para llegar a otra nueva formalidad que se asienta en esquemas de racionalidad burocrática, en donde se miden los resultados de las políticas propuestas.

- Promocionar, acreditar y certificar: estas funciones, aún cuando pueden ser analizadas desde un punto de vista pedagógico, poseen también claras dimensiones sociales en tanto suponen, entre otros aspectos, la legitimación de competencias profesionales frente al resto de la sociedad.

A esta clasificación, Santos Guerra (1993) incorpora dos funciones posibles más como son la comunicación y la formación.

Los instrumentos de evaluación

Un instrumento de evaluación es, fundamentalmente, una herramienta para recolectar los datos que necesita el evaluador para acercarse a los fenómenos y extraer de ellos información. Dentro de cada instrumento concreto pueden distinguirse dos aspectos diferentes: forma y contenido. La forma del instrumento se refiere al tipo de aproximación que establecemos con lo empírico y a las técnicas que utilizamos para esta tarea. En cuanto al contenido, este queda expresado en la especificación de los datos que necesitamos escribir; se concreta, por lo tanto, en una serie de ítems que son los indicadores que permiten medir las variables, pero que asumen ahora la forma de preguntas, puntos a observar, elementos a registrar, etc..

Es mediante una adecuada construcción de los instrumentos de recolección que la evaluación alcanza la necesaria correspondencia entre teoría y hechos. Es más, podríamos decir que es gracias a ellos que ambos términos efectivamente se vinculan. Si en una investigación los instrumentos son defectuosos se producirán, inevitablemente, alguna de las dificultades siguientes: o bien los datos recogidos no servirán para satisfacer los interrogantes iniciales o bien los datos que obtengamos vendrán falseados y distorsionados, porque el instrumento escogido no se adecua al tipo de hechos en estudio (Escalante, 2002).

Como hemos mencionado, la evaluación puede ser aplicada para controlar desde lo social porque fija parámetros y legitima niveles de acreditación. Sin embargo, una mirada reflexiva implica pensar a los instrumentos como herramientas que posibilitan identificar el modo en que los estudiantes construyen su conocimiento. Esto implica por un lado, comprender el significado de las respuestas elaboradas por el/la alumno/a. Y por el otro, considerar el tipo de información relevada por el docente en relación al proceso de aprendizaje y al proceso de producción.

Existen diversos instrumentos de evaluación y se clasifican según estén orientadas hacia los procesos o hacia los productos. En el primer grupo se mencionan los portafolios, las entrevistas, las observaciones documentadas, los registros de aprendizajes diarios, la auto-evaluación, los informes de entrevistas sobre proyectos, productos y muestras de los estudiantes y la expresión en voz alta del pensamiento. Más orientadas a la evaluación de productos encontramos instrumentos tales como las pruebas de ensayo, que pueden ser de respuesta extensa o limitada, los proyectos, las carpetas de trabajos, muestras, investigaciones, productos de expresión artística y los test.

Dado el nivel de importancia e impacto que reviste la información que se puede obtener, es propio señalar que los instrumentos de evaluación, no pueden plantearse al margen de los criterios de validez, confiabilidad, practicidad y utilidad que mencionaremos a continuación:

· Validez: Indica la capacidad del instrumento para medir las cualidades para las cuales ha sido construida y no otras parecidas. Si midiese indicadores o variables superpuestas se considera confuso y por lo tanto, los resultados que arroje no tienen validez. Un instrumento tiene validez cuando verdaderamente mide lo que afirma medir (Kerlinger, 1975; Hernández Sampieri et al., 1998; Ander Egg, 1993, Escalante, 2002).

Sobre este concepto se pueden recabar tres tipos de evidencias. Una de ellas se relaciona con el ‘contenido’ y se refiere al grado en que un instrumento refleja un dominio específico del contenido de lo que se mide. La otra evidencia es la que se relaciona con el ‘criterio’ y es producto de la comparación con un patrón normalizado o referente externo. La tercera es la evidencia que se relaciona con el ‘constructo’ y se refiere: “al grado en que una medición se relaciona consistentemente con otras mediciones de acuerdo con hipótesis derivadas teóricamente y que conciernen a los conceptos (o constructos) que están siendo medidos” (Hernández Sampieri et al., 1998, pp. 237-238). Para poder conseguir las evidencias necesarias de validez en cualquiera de estos requisitos se realizan distintos estudios presentes en la bibliografía citada.

· Confiabilidad: es una medida de consistencia que evalúa la capacidad para discriminar en forma constante entre un valor y otro. Se puede confiar en un instrumento cuando produce constantemente los mismos resultados al aplicarla a una misma muestra, es decir, cuando siempre los mismos objetos aparezcan valorados en la misma forma. Esta medida se refiere al grado de exactitud con que se mide un determinado rasgo por lo tanto, para que un instrumento sea considerado confiable debe ser estable y objetivo, independientemente de quien lo utilice (Kerlinger, 1975; Hernández Sampieri et al., 1998; Ander Egg, 1993, Escalante, 2002).

· Practicidad: se refiere a la viabilidad de la construcción, administración y análisis de resultados (Camilloni, 2003).

· Utilidad: refiere a la medida en que una evaluación resulta últil para la orientación tanto de los alumnos como de los docentes, la escuela o a los sectores interesados en la calidad de la educación (Camilloni, 2003).

Problemática de la evaluación

En la relación entre la evaluación y la acreditación de los aprendizajes reside uno de los debates más controvertidos en los ámbitos académicos. Un sinfín de aspectos constitutivos de la evaluación son seriamente discutidos con el sólo objetivo de poner en evidencia la necesidad de un análisis más profundo y abierto al respecto. Entre ellos se puede señalar como preocupante la emergencia de una súper especificación de códigos y normativas institucionales que conspiran con la tan mentada innovación de las prácticas docentes. De esta manera, la evaluación se circunscribe a parámetros rígidos en función de una pretendida objetividad evaluativa (Osimani, 2002).

El autor agrega que: “Esta demanda de objetividad, […] se caracteriza por una marcada ambición de ‘precisión evaluativa’ y estaría motivada, entre otras causas, por un fuerte sentimiento de inseguridad del docente a la hora de fundamentar una calificación determinada” (Osimani, 2002, pp. 91-92). Este paradigma, con vestigios autoritarios permanece tácitamente en las prácticas docentes e institucionales. Como así también, el ajuste de los instrumentos de evaluación al resultado o apropiación de contenidos en desmedro de la calidad y profundidad del razonamiento y del conocimiento (Fader, 2000).

A la idea de arbitrariedad que radica en la evaluación por ser el evaluador quien determina qué es lo importante, se agrega una arbitrariedad mayor referida al otorgamiento de mayor importancia a la expresión escrita y, ocasionalmente, la expresión oral, favoreciendo principalmente, los procesos de pensamiento convergente. Al mismo tiempo agrega que:

… las formas convencionales de evaluación someten al sujeto a un estado de estrés tal, que lo disponen de modo negativo respecto de la expresión de los contenidos y competencias que intentan evaluarse. Producen un efecto inhibidor que se traduce en un bloqueo expresivo (Osimani, 2002, p. 92).

Estos aspectos parecieran permanecer ignorados en las prácticas evaluativas que se desarrollan en la Educación Superior, debido a que los criterios de la valoración que se les otorga a los resultados de las evaluaciones tienen hoy pleno acuerdo, tanto de los alumnos/as postulantes como al interior de la institución, ya que los mismos son utilizados administrativa y académicamente sin grandes objeciones (Stufflebeam, 1993; Pizarro, 1996). Sin embargo, existen algunas consideraciones que podríamos analizar con detalle.

“Saber quiénes somos y qué tenemos nos ayuda a esclarecer qué podemos ser y hacer”

(de la Torre, 1995, p 173).

Referencias Bibliográficas

Ander Egg, E. (1993). Técnicas de Investigación Social. Buenos Aires: Magisterio del Río de la plata.

Bloom, B. (1986). Taxonomía de los objetivos de la educación: la clasificación de las metas educacionales. Buenos Aires: Editorial El Ateneo.

Camilloni, A. (1998). La calidad de los programas de evaluación y de los instrumentos que los integran. En A. Camilloni, S. Celman, E. Littwin, & M. Palou, La evaluación de los aprendizajes en el debate didáctivo contemporáneo. Buenos Aires: Paidós.

Castro, A. (2004). La evaluación exigente: atender y valorar los procesos. Dinámica Educativa (34), 2-13.

Escalante, E. (2002). Metodología de la Investigación Educacional. Valparaíso: UPLA.

Fader, R. M. (2000). Pertinencia de los recursos lúdicos y de las estrategias propias de las áreas expresivas como instrumentos de evaluación y acreditación en el segundo diclo de la EGB. Mendoza: UNCuyo.

Fernández Ballesteros, R. (1995). Evaluación de programas: una guía práctica en ámbitos sociales, educativos y de salud. Madrid: Síntesis.

García Ramos, J. (1989). Bases pedagógicas de la evaluación. Madrid: Síntesis.

Hernández Sampieri, R., Fernández Collado, C., & Baptista, L. (1998). Metodología de la investigación. México: Mc Graw-Hill Interamericana.

Kerlinger, F. (1975). Investigación del comportamiento: técnicas y metodologías. México: Nueva Editorial interamericana.

Larrondo, T. (1996). La evaluación centrada en un modelo de logro. En P. e. Ahumada, La evaluación en un modelo de logro. Valparaíso: OEA.

Osimani, J. (2002). Estrategias de Evaluación. En R. Fader, Juegos y creatividad en educación. Mendoza: Zeta.

Pizarro, H. (1996). Calificación por objetivos logrados. En P. e. Ahumada, La evaluación en un modelo de logro. Valparaíso: OEA.

Popham, J. (1978). Criterion referenced measurement. Englewood Cliffs: Prentice-Hall.

Samaja, J. (2004). Proceso, diselo y proyecto de investigación científica. Buenos Aires: JVE.

Santos Guerra, M. Á. (1996). Evaluación educativa 2. Buenos Aires: Magisterio del Río de la Plata.

Santos Guerra, M. Á. (1993). La evaluación: un proceso de diálogo, comprensión y mejora. Málaga: Aljibe.

Stufflebeam, D. L., & Shinkfield, A. .. (1993). La evaluación sistemática. Buenos Aires: Paidós.

Thorndike. E. (2009). En Encyclopædia Britannica. Recuperado el 3 de setiembre de 2009, de Encyclopædia Britannica Online:

http://www.britannica.com/EBchecked/topic/593342/Edward-L-Thorndike

Diálogo Creativo Nani Pardo

lunes, 4 de enero de 2010

LA EVALUACIÓN- LA EDUCACIÓN EN EL CONTEXTO ACTUAL (1)