CAPÍTULO 8: LA DIVERSIFICACIÓN LINGÜÍSTICA Y EL CURRÍCULO
8.4. Evaluación y aprendizaje escolar, extraescolar y posterior
8.4.3. Un enfoque multidimensional y modular
Este capítulo pretende llamar la atención de forma general sobre el cambio de enfoque o, cuando menos, la paulatina complejidad del diseño curricular y sobre sus consecuencias pa-ra la evaluación y la certificación. Resulta muy importante definir etapas en relación con el contenido y la progresión. Esto se puede realizar en función de un componente principal (lin-güístico o nocional y funcional, por ejemplo) o bien fomentando el progreso en todas las di-mensiones respecto a una lengua concreta. Resulta también importante distinguir con clari-dad los componentes de un currículo multidimensional (teniendo muy en cuenta las distintas dimensiones del marco de referencia) y diferenciar los métodos de evaluación, trabajando pa-ra conseguir un aprendizaje modular y unos sistemas de certificación. Esto permitiría, de for-ma sincrónica (es decir, en un momento dado del itinerario de aprendizaje) o diacrónica (es decir, a través de etapas diferenciadas de ese itinerario), el desarrollo y reconocimiento de las competencias plurilingües y pluriculturales con «geometría variable» (es decir, cuya estructu-ra y componentes varían de un individuo a otro y cambian con el tiempo en un individuo con-creto).
En determinados momentos de la trayectoria escolar del alumno se podrían introducir, si-guiendo el currículo escolar y los escenarios trazados con concisión anteriormente, breves mó-dulos intercurriculares que impliquen a las distintas lenguas. Dichos mómó-dulos de «translengua»
podrían abarcar una variedad de enfoques y recursos de aprendizaje, las formas de utilizar el entorno exterior al centro escolar y de enfrentarse a los malentendidos en las relaciones inter-culturales. Darían una mayor coherencia y transparencia de conjunto a las elecciones curricu-lares subyacentes y mejorarían la estructura general sin perjudicar a los programas diseñados para otras materias.
Además, un enfoque modular de las certificaciones permitiría que se realizara una eva-luación específica, en un módulo ad hoc, de las capacidades de desenvolvimiento plurilingüe y pluricultural mencionadas anteriormente.
175
La multidimensionalidad y la modularidad aparecen, por tanto, como conceptos clave en el desarrollo de una base sólida para la diversificación lingüística del currículo y de la evalua-ción. El Marco de referencia está estructurado de manera que permite, mediante las categorías que ofrece, indicar las direcciones que se han de seguir para conseguir tal organización mo-dular o multidimensional. Sin embargo, este camino abierto requiere claramente desarrollar proyectos y trabajos experimentales en el entorno escolar y en una variedad de contextos.
Los usuarios del
Marco de referenciapueden tener presente y, en su caso, determinar:
– Si los alumnos implicados tienen alguna experiencia de la pluralidad lingüística y cultural y de la naturaleza de su experiencia.
– Si los alumnos ya son capaces, aunque sólo sea a un nivel básico, de funcionar en varias co-munidades lingüísticas y culturales, y cómo se distribuye y se diferencia esta competencia se-gún los contextos del uso de la lengua y de las actividades lingüísticas.
– Qué experiencia de diversidad lingüística y cultural pueden tener los alumnos durante su apren-dizaje (por ejemplo, de forma paralela a su asistencia a un centro educativo y fuera de éste).
– Cómo se puede introducir esta experiencia en el proceso de aprendizaje.
– Qué tipos de objetivos parecen más apropiados para los alumnos (véase la sección 1.2) en un momento dado del desarrollo de la competencia plurilingüe y pluricultural teniendo en cuenta sus características, expectativas, intereses, planes y necesidades, así como su itinerario de aprendi-zaje previo y sus recursos.
– Cómo fomentar en los alumnos la no segmentación y el establecimiento de una relación eficaz entre los distintos componentes de la competencia plurilingüe y pluricultural en el proceso de su desarrollo; en concreto, cómo centrar la atención en los conocimientos y destrezas de carácter transferible y transversal que tienen los alumnos, y cómo utilizarlos.
– Qué competencias parciales (de qué tipo y para qué fines) podrían enriquecer, hacer más com-plejas y diferenciar las competencias existentes de los alumnos.
– Cómo encajar de forma coherente el aprendizaje relativo a una lengua o cultura concreta en un currículo general que desarrolle la experiencia de varias lenguas y culturas.
– Qué opciones o qué formas existen de diferenciación de escenarios curriculares para controlar el desarrollo de una competencia diversificada para alumnos concretos; qué simplificación de es-calas pueden preverse y alcanzarse, en caso de considerarse adecuado.
– Qué formas de organización del aprendizaje (un enfoque modular, por ejemplo) es probable que favorezcan el control del itinerario de aprendizaje en el caso de los alumnos en cuestión.
– Qué enfoque de la evaluación hace posible tener en cuenta el reconocimiento de las
competen-cias parciales y la competencia plurilingüe y pluricultural diversificada de los alumnos.
La evaluación
9 9
177
9.1. Introducción
El término «evaluación» se utiliza en este capítulo con el sentido concreto de valoración del grado de dominio lingüístico que tiene el usuario. Todas las pruebas son una forma de evaluación, si bien hay otras muchas formas de evaluar (por ejemplo, las listas de control uti-lizadas en la evaluación continua, la observación cotidiana del profesor) que no podrían con-siderarse como «pruebas». Evaluar es un concepto más amplio que medir o valorar la com-petencia o el dominio de la lengua. Toda medición o valoración es una forma de evaluación, pero en un programa de lenguas se evalúan aspectos, no propiamente del dominio lingüísti-co, como la eficacia de métodos y materiales concretos, el tipo y la calidad del discurso pro-ducido a lo largo del programa, la satisfacción del alumno y del profesor, la eficacia de la en-señanza, etc. Este capítulo se ocupa concretamente de la evaluación del dominio lingüístico y no de la evaluación en su sentido más amplio.
Hay tres conceptos que tradicionalmente se consideran fundamentales en cualquier aná-lisis de la evaluación: la validez, la fiabilidad y la viabilidad. Resulta útil respecto al anáaná-lisis de este capítulo tener una idea general de lo que quieren decir estos términos, cómo se relacio-nan entre sí y cómo se adecuan al Marco de referencia.
La validez es el concepto del que se ocupa el Marco. Se puede decir que una prueba o un procedimiento de evaluación tiene validez en la medida en que pueda demostrarse que lo que se evalúa realmente (el constructo) es lo que, en el contexto en cuestión, se debería evaluar y que la información obtenida es una representación exacta del dominio lingüístico que poseen los alumnos o candidatos que realizan el examen.
La fiabilidad, por otro lado, es un término técnico. Es básicamente el grado en que se re-pite el mismo orden de los candidatos en cuanto a las calificaciones obtenidas en dos convo-catorias distintas (reales o simuladas) de la misma prueba de evaluación.
Pero más importante que la fiabilidad es la precisión de las decisiones que se adoptan en re-lación con un determinado nivel de exigencia. Si el informe de la evaluación da resultados ta-les como aprobado o suspenso, o Niveta-les A2+, B1 o B1+, ¿qué exactitud tienen estas deci-siones? La exactitud de las decisiones depende de la validez que tenga el nivel concreto (por ejemplo, el nivel B1) para el contexto. También depende de la validez de los criterios utiliza-dos para tomar la decisión y de la validez de los procedimientos mediante los cuales se apli-caron esos criterios.
Si dos organizaciones o regiones distintas utilizan criterios referidos a los mismos niveles de exigencia para determinar sus decisiones de evaluación con respecto a la misma destreza y si los niveles mismos son válidos y apropiados para los dos entornos implicados y se inter-pretan de forma consistente en el diseño de las tareas de evaluación y en la interpretación de las actuaciones, entonces los resultados de los dos sistemas guardarán correlación. Tradicio-nalmente, la correlación entre dos pruebas que se supone que evalúan el mismo constructo se conoce como «validez concurrente»; un concepto que se relaciona, evidentemente, con la fia-bilidad, pues las pruebas que no son fiables no guardan correlación. Sin embargo, lo
funda-178
mental es el grado de coincidencia entre las dos pruebas respecto a lo que se evalúa y a cómo se interpreta la actuación.
De estas dos cuestiones se ocupa el Marco de referencia. La siguiente sección describe tres formas principales de utilizar el Marco:
1. Para especificar el contenido de las pruebas y de los exámenes: lo que se evalúa
2. Para establecer los criterios con los que se determina la consecución cómo se interpreta la actuación de un objetivo de aprendizaje:
3. Para describir los niveles de dominio lingüístico en pruebas y exámenes cómo se pueden realizar las existentes, permitiendo así realizar comparaciones entre distintos comparaciones
sistemas de certificados:
Hay muchos tipos diferentes de evaluación y estos asuntos tienen que ver con ellos. Es un error suponer que un enfoque (por ejemplo, un examen público) es necesariamente superior en sus efectos educativos que, por ejemplo, la evaluación que realiza el profesor. Efectiva-mente, constituye una ventaja importante el hecho de que una serie de niveles comunes –co-mo son los niveles comunes de referencia del Marco– posibiliten la relación entre sí de for-mas distintas de evaluación.
La tercera sección del capítulo presenta las opciones entre distintos tipos de evaluación.
Estas opciones se presentan en forma de pares opuestos; en cada caso se definen los términos utilizados y se analizan las relativas ventajas y desventajas con respecto al propósito de la eva-luación en su entorno educativo. También se exponen las consecuencias que conlleva el ejer-cicio de una u otra de las opciones alternativas, para después indicar la adecuación del Mar-co de referencia Mar-con el tipo de evaluación Mar-concreta.
Un procedimiento de evaluación también tiene que ser práctico, viable; la viabilidad tiene que ver concretamente con la evaluación de la actuación. Los examinadores trabajan bajo la presión del tiempo; sólo ven una muestra limitada de la actuación y existen límites definidos del tipo y del número de categorías que pueden manejar como criterios. El Marco de referen-cia pretende proporcionar un punto de referenreferen-cia, no un instrumento práctico de evaluación;
tiene que ser integrador, pero todos sus usuarios deben ser selectivos, lo que supondría el uso de un esquema operativo más simple que sintetice las categorías separadas del Marco. Por ejemplo, las categorías utilizadas en las escalas ilustrativas de descriptores que están yuxta-puestas al texto en los capítulos 4 y 5 son generalmente mucho más sencillas que las catego-rías y exponentes que se desarrollan en el texto mismo. Para ello, la última sección de este ca-pítulo analiza este tema con ejemplos.
9.2. El Marco de referencia como recurso de evaluación
9.2.1. La especificación del contenido de las pruebas y los exámenes
Se puede consultar la descripción de «El uso de la lengua y el usuario o alumno» realizada en el capítulo 4, en concreto en la sección 4.4, que se ocupa de las actividades lingüísticas municativas, cuando se vaya a preparar la especificación de una tarea para una evaluación co-municativa. Se va aceptando paulatinamente que la evaluación auténtica requiere el muestreo de una serie de tipos de discurso relevantes; por ejemplo, respecto a los exámenes de expresión oral,
179
una prueba elaborada recientemente es ilustrativa al respecto. En primer lugar, hay una conver-sación simulada que funciona como introducción y después se da un debate informal sobre temas por los que el examinando declara su interés. A esto le sigue una fase de transacción en forma de actividad –ya sea cara a cara o simulada– de búsqueda de información por teléfono. A conti-nuación, se desarrolla una fase de expresión basada en un informe escrito en el que el examinan-do ofrece una descripción de su área de especialidad académica y de sus planes. Por último, hay una cooperación centrada en el objetivo, una tarea de consenso entre los examinandos.
En resumen, las categorías que el Marco de referencia utiliza para las actividades comuni-cativas son las siguientes:
Interacción Expresión
(Espontánea, turnos breves) (Preparada, turnos largos)
Orales Conversación Descripción de su especialidad
Debate informal académica
Cooperación centrada en el objetivo
Escritas Informe o descripción de su
especialidad académica
Para elaborar los detalles de las especificaciones de la tarea, el usuario puede consultar la sección 4.1, «el contexto del uso de la lengua» (ámbitos, condiciones y restricciones, contexto mental), la sección 4.6, que se ocupa de los «textos» y el capítulo 7, que analiza «las tareas y su papel en la enseñanza de la lengua», sobre todo la sección 7.3, que estudia «la dificultad de la tarea».
La sección 5.2, que se ocupa de «las competencias lingüísticas comunicativas» perfeccio-na la elaboración de los ítems de la prueba o de las fases de uperfeccio-na prueba oral con el fin de con-seguir evidencia de las competencias lingüística, sociolingüística y pragmática relevantes. El conjunto de especificaciones de contenidos de Threshold Level, desarrolladas por el Consejo de Europa para más de veinte lenguas europeas (véase la bibliografía para el capítulo 2 en el apar-tado de Bibliografía general), así como de los niveles Waystage y Vantage para el inglés, más sus equivalentes en el caso de haberse desarrollado para otras lenguas y niveles, pueden con-siderarse como auxiliares del documento principal del Marco de referencia. En estas especifi-caciones se incluyen ejemplos, en un nivel más detallado, que ofrecen orientaciones útiles pa-ra elabopa-rar pruebas y exámenes de los niveles A1, A2, B1 y B2.
9.2.2. Criterios para el logro de los objetivos de aprendizaje
Las escalas constituyen una fuente para el desarrollo de escalas de valoración que evalúan el logro de un objetivo concreto de aprendizaje, y los descriptores pueden contribuir a la for-mulación de los criterios. El objetivo puede ser un nivel amplio de dominio lingüístico gene-ral, expresado en un nivel común de referencia (por ejemplo, B1). Puede ser, por el contrario, un conjunto de actividades, destrezas y competencias, como se analizó en la sección 6.1.2, que se ocupa de «las competencias parciales y la variedad de objetivos con relación al Marco de referencia». Un objetivo modular de este tipo se podría perfilar en una «parrilla» de cate-gorías por niveles, como la que se ha presentado en el Cuadro 2.
Al analizar la utilización de descriptores, resulta esencial distinguir entre:
180
1. Descriptores de actividades comunicativas, que se encuentran en el capítulo 4.
2. Descriptores de aspectos del dominio de la lengua relacionados con competencias con-cretas, que se encuentran en el capítulo 5.
Los primeros son muy apropiados para la evaluación que realiza el profesor o para la au-toevaluación respecto a tareas de la vida real. Estos dos tipos de evaluación se realizan sobre la base de una representación muy pormenorizada de la capacidad lingüística del alumno des-arrollada durante el curso en cuestión y son atractivos porque pueden ayudar tanto a alum-nos como a profesores a centrarse en un enfoque orientado a la acción.
Sin embargo, no suele ser aconsejable incluir descriptores de actividades comunicativas en los criterios que utiliza un examinador para medir o valorar la actuación en una prueba con-creta de comprensión oral o escrita si lo que interesa es informar de resultados en cuanto al nivel de dominio lingüístico alcanzado. Esto es así porque, para informar sobre el dominio lin-güístico, la evaluación no debería tener en cuenta principalmente ninguna actuación concre-ta, sino que debería intentar valorar las competencias generalizables que se muestran en esa actuación. Naturalmente, tiene que haber sólidas razones de carácter educativo para centrar-se en lograr el éxito en la realización de una actividad dada, sobre todo en el caso de los usua-rios básicos más jóvenes (niveles A1 y A2). Dichos resultados serán menos generalizables, pe-ro el carácter generalizable de los resultados no suele ser el centpe-ro de atención en las primeras etapas del aprendizaje de la lengua.
Esto refuerza el hecho de que las valoraciones pueden tener muchas funciones diferentes;
lo que resulta apropiado para una finalidad puede no serlo para otra.
9.2.2.1. Descriptores de actividades comunicativas
Los descriptores de actividades comunicativas (capítulo 4) se pueden utilizar de tres for-mas distintas respecto al logro de los objetivos.
1. Construcción: Como se vio en la sección 9.2.1, las escalas de las actividades comuni-cativas ayudan a definir las especificaciones para el diseño de tareas de evaluación.
2. Informe: Las escalas de las actividades comunicativas también pueden ser muy útiles para informar de los resultados. A las personas interesadas en los resultados del siste-ma educativo, como, por ejemplo, los empresarios, suelen interesarles los resultados de conjunto más que un perfil detallado de competencia.
3. Autoevaluación del alumno y evaluación por el profesor: Por último, los descripto-res de las actividades comunicativas se pueden utilizar para la autoevaluación que realiza el propio alumno y para la evaluación que realiza el profesor de varias maneras, de las cuales ofrecemos algunos ejemplos:
• Lista de control: Para la evaluación continua o para la evaluación sumativa al final de un curso. Los descriptores de un nivel concreto se pueden recoger en una lista.
Como alternativa, el contenido de los descriptores se puede «fragmentar». Por ejemplo, el descriptor Pide y ofrece información personal puede ser fragmentado en componentes explícitos como Sé presentarme; digo dónde vivo; digo mi dirección en francés; digo la edad que tengo, etc., y Pregunto a alguien cómo se llama; pregunto a al-guien dónde vive; pregunto a alal-guien qué edad tiene, etc.
• «Parrilla»: Para la evaluación continua o la sumativa, definiendo un perfil en una
«parrilla» de categorías seleccionadas (por ejemplo: Conversación; Debate; Intercam-bio de información) y definidas en distintos niveles (B1+, B2, B2+).
181
Este uso de los descriptores ha venido siendo cada vez más habitual durante los últimos diez años. La experiencia ha demostrado que la consistencia con que profesores y alumnos pueden interpretar los descriptores se mejora si éstos describen no sólo LO QUE el alumno sabe hacer, sino también EN QUÉ MEDIDA lo hace bien o mal.
9.2.2.2. Descriptores de aspectos del dominio lingüístico referidos a competencias concretas
Los descriptores de aspectos del dominio lingüístico se pueden utilizar de dos formas en relación con el logro de los objetivos.
– Autoevaluación del alumno y evaluación por el profesor: Siempre que los descrip-tores sean enunciados positivos e independientes, se pueden incluir en listas de control para la autoevaluación del alumno o para la evaluación por el profesor. Sin embargo, la mayoría de las escalas existentes tienen el problema de que los descriptores a menudo están redactados de forma negativa en los niveles inferiores y con referencia a la norma hacia la mitad de la escala. También establecen, a menudo, distinciones puramente ver-bales entre niveles sustituyendo una o dos palabras de descripciones contiguas que tie-nen poco significado fuera del texto de la escala. En el anejo A se analizan algunas for-mas de desarrollar descriptores que eviten estos problefor-mas.
– Valoración de la actuación: Un uso más evidente de las escalas de descriptores del ca-pítulo 5 que tratan aspectos de las competencias es ofrecer puntos de partida para el desarrollo de criterios de evaluación. Transformando las impresiones personales –no sistemáticas– en juicios ponderados, dichos descriptores pueden contribuir al desarro-llo de un marco compartido de referencia entre un grupo de examinadores.
Existen básicamente tres formas de presentar los descriptores para que se puedan utilizar como criterios de evaluación:
• En primer lugar, se pueden presentar los descriptores como una escala, a menudo com-binando descriptores de distintas categorías en un párrafo holístico por cada nivel. Es-te enfoque es muy frecuenEs-te.
• En segundo lugar, se pueden presentar como una lista de control, generalmente una lista por nivel, a menudo con descriptores agrupados bajo encabezamientos, es decir, en categorías. Las listas de control son menos corrientes para la evaluación que se realiza en el acto.
• En tercer lugar, se pueden presentar como una «parrilla» de categorías seleccionadas, en realidad como un conjunto de escalas paralelas para categorías separadas. Este en-foque posibilita un perfil de diagnóstico. Sin embargo, existen límites al número de ca-tegorías que los examinadores pueden manejar.
Hay dos formas diferenciadas de proporcionar un cuadro de subescalas:
– Escala de dominio: Se presenta un cuadro descriptivo que defina los niveles adecuados para determinadas categorías; por ejemplo, desde el nivel A2 al B2. La evaluación en-tonces se realiza directamente en esos niveles, utilizando posiblemente otras mejoras, como, por ejemplo, un segundo dígito o signos de suma para conseguir una mayor di-ferenciación si se desea. De ese modo, aunque la prueba de actuación fuera dirigida al nivel B1, y aunque ninguno de los alumnos alcanzase el nivel B2, todavía sería posible que los mejores alumnos consiguieran el nivel B1+, B1++ o B1.8.
182
– Escala de valoración: Se selecciona o define un descriptor para cada una de las categorías que describa el nivel de exigencia requerido para aprobar un módulo o un examen con-creto de esa categoría. A ese descriptor se le denomina entonces «Aprobado» o «3» y la escala es referida a la norma respecto a ese nivel (una actuación muy deficiente = «1»;
una excelente actuación = «5»). La formulación de «1» y «5» podrían constituirla otros descriptores extraídos o adaptados de los niveles contiguos de la escala que aparece en la sección apropiada del capítulo 5; también el descriptor puede ser formulado en rela-ción con la redacrela-ción del descriptor definido como «3».
9.2.3. Descripción de los niveles de dominio de la lengua para facilitar la comparación de pruebas y exámenes
Las escalas de los niveles comunes de referencia pretenden facilitar la descripción del ni-vel de dominio lingüístico alcanzado en los diplomas y certificados existentes y de esa forma permitir la comparación entre sistemas. Los estudios de medición reconocen cinco formas clá-sicas de relacionar evaluaciones separadas: (1) equiparación; (2) calibración; (3) moderación
Las escalas de los niveles comunes de referencia pretenden facilitar la descripción del ni-vel de dominio lingüístico alcanzado en los diplomas y certificados existentes y de esa forma permitir la comparación entre sistemas. Los estudios de medición reconocen cinco formas clá-sicas de relacionar evaluaciones separadas: (1) equiparación; (2) calibración; (3) moderación