sexta-feira, 29 de junho de 2012

Exames nacionais - apontamentos (8)

Neste momento está a decorrer o período em que os professores se dedicam a avaliar e a classificar as provas dos exames nacionais. Esta é provavelmente a fase mais crítica de todo o processo que envolve a realização deste tipo de provas e onde a sua fiabilidade/fidelidade deve ser particularmente escrutinada.
Depois de nos textos anteriores ter passado os olhos pela fase de selecção das aprendizagens a avaliar, pela fase de escolha do tipo de perguntas e pela fase de formulação/redacção das perguntas, procurarei agora recordar alguns graves problemas que a fase de classificação das provas suscita. Todos os professores conhecem estes problemas, o estranho é que alguns os esqueçam, quando defendem a superlativa capacidade avaliativa dos exames nacionais e quando pretendem que eles se generalizem a todas as disciplinas e que possuam peso determinante na aprovação do aluno. É estranho, em especial, que seja esquecido este facto: os problemas técnicos de docimologia que são comuns a provas realizadas a nível de turma e a provas realizadas a nível nacional assumem, nestas  últimas, consequências particularmente graves e com carácter irreversível, para o aluno.

As enorme dificuldades e as múltiplas insuficiências de que o acto classificativo de uma prova enferma constituem um rol imenso que a literatura sobre a matéria já há muito elencou — naturalmente que o grau e a natureza das dificuldades e das insuficiências variam consoante a disciplina e o nível de ensino,  por isso, assinalo que estas observações estão focalizadas sobretudo nos exames nacionais do ensino secundário.
O problema das classificações dos exames reside obviamente na sua fidelidade/subjectividade. Saber se uma prova foi bem ou mal classificada é aquilo que legitimamente preocupa alunos e pais. Os professores partilham dessa preocupação e acrescentam uma outra: sabendo, como sabem, que a fidelidade absoluta ou a ausência de subjectividade não são possíveis, interrogam-se sobre o caminho que deve ser seguido e como deve ser seguido.
Como já foi lembrado em textos anteriores, a tentativa de ultrapassar o problema da subjectividade através da formulação de perguntas de resposta de escolha-múltipla esbarra com dois óbices: a) este tipo de pergunta não consegue avaliar várias aprendizagens e competências complexas; b) neste tipo de pergunta, o problema da subjectividade desloca-se do momento classificativo das respostas para o momento da redacção das perguntas e da sua interpretação.
Por estas duas razões, e porque não faria sentido que um exame nacional avaliasse somente aprendizagens e competências básicas, é necessário formular perguntas de resposta longa que obrigam à formulação de juízos avaliativos e classificativos por parte de centenas ou milhares de professores, consoante a dimensão do país. Ora, esta circunstância introduz de modo incontornável o problema da subjectividade/fidelidade avaliativa. 
Relembrando alguns dados que todos conhecemos, mas que alguns aparentemente esquecem:
1. Em milhares de experiências realizadas em todo o mundo, a conclusão é sempre a mesma e é dupla:
a) existe uma enorme divergência nas classificações atribuídas por diferentes professores à mesma prova (com perguntas de resposta longa) — as divergências são muitas vezes assustadoras, há casos para todos os gostos: a mesma prova obter de uns professores a classificação de 7 valores e obter de outros professores a classificação de 11 valores; uma outra prova obter de uns professores a classificação de 12 valores e obter de outros professores a classificação de 19 valores, etc.
b) existe uma significativa divergência entre classificações atribuídas, em momentos diferentes, pelo mesmo professor à mesma prova — uma nova classificação atribuída um ou dois meses depois pode variar entre mais ou menos 4 valores.
Como todos sabemos também, estas discrepâncias registam-se em todas as provas, inclusive nas provas de matemática. Estas conclusões são do conhecimento de todos os professores, os estudos estão publicados em todo o lado.
2. O aprofundamento analítico dos critérios de classificação, quer quanto à forma quer quanto ao conteúdo, não resolve o problema. Em alguns casos melhora a situação, em outros casos agrava-a.
3. Os elementos subjectivos que intervêm na leitura e interpretação de uma resposta e depois na aplicação dos critérios de classificação dessa resposta são múltiplos e não são passíveis de homogeneização. Não o são a nível individual e muito menos entre pares.
4. Nas perguntas de resposta longa, os alunos com mais facilidade na expressão escrita são claramente beneficiados nas classificações, independentemente do conteúdo objectivo da resposta o justificar ou não.

Estes e outros problemas existem e não devem ser escondidos. Em contexto de exame nacional, a sua gravidade aumenta de modo significativo, porque aquilo que pode ser minimizado no processo de ensino-aprendizagem, que ocorre durante um ano lectivo, não o pode ser numa prova nacional única com peso determinante.

(Continua)