Définition de l’évaluation et de ses caractéristiques : pertinence, validité et fiabilité
L’évaluation scolaire est définie comme un processus qui consiste (Allal, 2008) :
À définir un objet d’évaluation (ce que l’on souhaite évaluer)
À collecter de l’information (en proposant un exercice ou une mise en situation à un élève et en observant ce qu’il fait ou produit)
À interpréter ces informations (en portant un jugement sur ce que l’élève a fait ou produit)
À prendre une décision et à agir en conséquence.
Selon un article de synthèse de De Ketele & Gérard (2005) :
La pertinence d’une évaluation :
Caractère plus ou moins approprié de l’épreuve, selon qu’elle s’inscrit dans la ligne des objectifs, sa compatibilité avec les autres éléments du système auquel elle appartient.
La validité d’une évaluation :
Degré d’adéquation entre ce que l’on déclare faire (évaluer telle ou telle dimension) et ce que l’on fait réellement, entre ce que l’outil mesure et ce qu’il prétend mesurer.
La fiabilité d’une évaluation :
Le degré de confiance que l’on peut accorder aux résultats observés. Seront-ils les mêmes si on recueille l’information à un autre moment, avec un autre outil, par un autre évalué/évaluateur, etc. ?
Dès lors, l’évaluation s’accompagne d’un flot de questionnements légitimes. L’ensemble de ces limites doit nous amener à relativiser l’importance accordée à l’acte d’évaluer et à son résultat, quand il est pris isolément. Il ne peut être considéré sans un recul critique qui permet une interprétation circonstanciée :
Identifier ce que l’on mesure exactement :
Ce que l’on cherche à évaluer n’est pas toujours évident :
Si l’on cherche à mesurer la taille d’un individu, il existe une échelle de mesure absolue.
Si l’on cherche à apprécier le niveau d’un élève en mathématiques par exemple, il est difficile d’en dire autant.
Deux évaluations qui mesurent la capacité des élèves à manipuler des fractions peuvent présenter des niveaux de difficulté très dissemblables par exemple et des résultats qui les ont autant.
S’assurer que l’on mesure un apprentissage et non une performance :
Dans quelle mesure une production réalisée à un moment donné permet-elle de révéler une performance à court terme ou un apprentissage durable ?
Prendre en compte l’impact de facteurs externes :
De quelle manière, la fatigue, le stress, la longueur d’une évaluation, le temps imparti, le moment de la passation et les conditions du lieu sont-ils autant d’aléas qui peuvent impacter les résultats d’un élève ?
Prendre en compte l’impact de facteurs internes :
Quelle est la part de subjectivité de l’évaluateur ? Qu’est-ce qui est mis en place pour limiter l’expression de divers biais liés à la correction ?
Qu’en est-il de la potentielle mauvaise interprétation de consignes floues ou de questions imprécises ?