Définition de l’évaluation et de ses caractéristiques : pertinence, validité et fiabilité

Nov 25, 2023

L’évaluation scolaire est définie comme un processus qui consiste (Allal, 2008) :

À définir un objet d’évaluation (ce que l’on souhaite évaluer)
À collecter de l’information (en proposant un exercice ou une mise en situation à un élève et en observant ce qu’il fait ou produit)
À interpréter ces informations (en portant un jugement sur ce que l’élève a fait ou produit)
À prendre une décision et à agir en conséquence.

Selon un article de synthèse de De Ketele & Gérard (2005) :

La pertinence d’une évaluation :
- La pertinence est le caractère plus ou moins approprié de l’épreuve, selon
  qu’elle s’inscrit dans la ligne des objectifs visés (De Ketele, Chastrette,
  Cros, Mettelin & Thomas, 1989). C’est son degré de «compatibilité» avec
  les autres éléments du système auquel elle appartient (Raynal & Rieunier,
  2003).
La validité d’une évaluation :
- Degré d’adéquation entre ce que l’on déclare faire (évaluer telle ou telle dimension) et ce que l’on fait réellement, entre ce que l’outil mesure et ce qu’il prétend mesurer.
La fiabilité d’une évaluation :
- Le degré de confiance que l’on peut accorder aux résultats observés. Seront-ils les mêmes si on recueille l’information à un autre moment, avec un autre outil, par un autre évalué/évaluateur, etc. ?

Dès lors, l’évaluation s’accompagne d’un flot de questionnements légitimes. L’ensemble de ces limites doit nous amener à relativiser l’importance accordée à l’acte d’évaluer et à son résultat, quand il est pris isolément. Il ne peut être considéré sans un recul critique qui permet une interprétation circonstanciée :

Identifier ce que l’on mesure exactement :
- Ce que l’on cherche à évaluer n’est pas toujours évident :
  - Si l’on cherche à mesurer la taille d’un individu, il existe une échelle de mesure absolue.
  - Si l’on cherche à apprécier le niveau d’un élève en mathématiques par exemple, il est difficile d’en dire autant.
- Deux évaluations qui mesurent la capacité des élèves à manipuler des fractions peuvent présenter des niveaux de difficulté très dissemblables par exemple et des résultats qui les ont autant.
S’assurer que l’on mesure un apprentissage et non une performance :
- Dans quelle mesure une production réalisée à un moment donné permet-elle de révéler une performance à court terme ou un apprentissage durable ?
Prendre en compte l’impact de facteurs externes :
- De quelle manière, la fatigue, le stress, la longueur d’une évaluation, le temps imparti, le moment de la passation et les conditions du lieu sont-ils autant d’aléas qui peuvent impacter les résultats d’un élève ?
Prendre en compte l’impact de facteurs internes :
- Quelle est la part de subjectivité de l’évaluateur ? Qu’est-ce qui est mis en place pour limiter l’expression de divers biais liés à la correction ?
- Qu’en est-il de la potentielle mauvaise interprétation de consignes floues ou de questions imprécises ?

source - artwork

Par temps clair

Discussion about this post