Comparer plutôt que juger, pour une meilleure objectivité de l'évaluation
L’évaluation traditionnelle d’un texte ou d’une production écrite dépend souvent de jugements absolus qu’un enseignant va être amené à juger. Lorsqu’il corrige, un enseignant regarde le texte de la réponse et tente de décider quelle note lui convient le mieux.
Cependant, les humains sont très mauvais pour porter de tels jugements absolus. Ce n’est pas seulement vrai des essais de notation, mais aussi de toutes sortes de jugements absolus.
Par exemple, imaginons que nous recevions un morceau de tissu gris. Il nous est alors demandé d’évaluer sa nuance, entre le noir et le blanc, d’un à dix. Sans disposer d’une échelle de référence, c’est particulièrement difficile. La même difficulté se pose si nous demandons d’évaluer sur une échelle d’un à dix la température de l’eau, entre froid et chaud.
Par contre, si nous recevons deux morceaux de tissu gris différents, ou deux récipients remplis d’eau de température différente, il est nettement plus simple de déterminer lequel des deux est plus foncé ou plus chaud.
Si le jugement absolu est difficile, le jugement comparatif est en réalité beaucoup plus accessible. Malheureusement, le mode traditionnel d’évaluation des productions écrites fonctionne principalement sur le principe du jugement absolu.
Le fait de comparer une réponse écrite à d’autres est une meilleure démarche que le fait de juger seulement sur pièce d’une réponse écrite.
Pour contourner la subjectivité de l’évaluation dans la pose d’un jugement, les enseignants ont généralement recours à des critères d’évaluation ou à une grille critériée en lien avec les objectifs d’apprentissage concernés.
Mais de nouveau, il peut y avoir une faiblesse à la démarche. Traditionnellement, l’évaluation de productions écrites se fonde sur des critères eux-mêmes textuels, qui décrivent verbalement la performance et servent à construire une grille d’évaluation.
Le principe est que les évaluateurs peuvent utiliser ces descriptions pour guider leur jugement.
Le risque est que ces descriptions, aussi factuelles soient-elles, prêtent à une interprétation subjective. Cette dernière tend à distribuer et écarter les notes les unes des autres, selon la sensibilité de l’évaluateur.
Dès lors, aussi précis soient-ils, les critères descriptifs présentent une fiabilité limitée. Plutôt que des critères descriptifs, la comparaison pourrait mieux se faire à partir d’exemples qui correspondent aux différentes valeurs des notes. L’élément le plus crucial à ce titre est de pouvoir comparer avec ce qui correspond au seuil de réussite et d’objectiver mieux ce qui rend une réponse réussie dans un contexte donné.