La docimologie, science qui étudie l’évaluation chiffrée des élèves, a montré la subjectivité des notes attribuées à l’école. Outre le fait qu’une note ne dit pas grand-chose sur les acquis de l’élève, elle constitue souvent, lors les examens, une sentence sans appel qui condamne certains à l’enfer d’un échec immérité. Car de nombreux facteurs jouent dans la manière de noter des professeurs, de sorte qu’une même copie corrigée par des professeurs différents peut afficher des écarts de notes importants.

Les jugements portés dans l’enseignement scolaire sur le niveau des élèves ne sont pas toujours objectifs et justes. Ils le sont d’autant moins lorsque la différence en termes d’acquis entre les élèves n’est pas importante. Cela a été démontré par la recherche pédagogique depuis les années 1930 et confirmé par de nombreuses études récentes sur l’évaluation des élèves.
La docimologie est la science qui étudie la manière dont les élèves sont notés et les facteurs qui interviennent dans le jugement des professeurs. L’une de ses toutes premières études date de 1938 lorsque Laugier et Weinberg eurent l’idée d’expérimenter la correction d’un même lot de copies par deux jurys différents composés de 76 correcteurs au total.
Ils constatèrent alors des écarts de notes allant en moyenne de 2 à 3 points en mathématiques et en physique, et de 4 points en français et en philosophie. Mais un constat était encore plus parlant dans leur étude : en prenant en considération les écarts extrêmes, c’est-à-dire la note la plus basse et la note la plus élevée données à une même dissertation, ils ont relevé un écart de 13 points sur 20. La conclusion était donc claire : contrairement à une idée bien répandue, l’objectivité n’est pas à l’œuvre dans les notes attribuées aux élèves à l’école.
Depuis, toutes les études sur l’évaluation des élèves confirment le caractère subjectif des notes. Dans Pédagogie, dictionnaire des concepts clés, Françoise Reynal et Alain Rieunier font état de cette autre recherche menée en 1963 par Henri Piéron : « Piéron (1963) a comparé les moyennes des notes données par des jurys parallèles du baccalauréat français. Les différences atteignaient 4 à 5 points sur 20 en mathématiques et en physique, faisant passer le taux de réussite de 53% à 31% d’un jury à l’autre pour une même population de candidats. ». D’où son idée que, pour atteindre l’objectivité dans la notation, il faudrait qu’une même copie soit corrigée par un certain nombre de correcteurs et qu’on retienne comme « vraie » note la moyenne de toutes celles qui ont été attribuées.
Cependant, outre le fait qu’il est impossible de mettre cela en application dans le quotidien de la classe ou lors des examens, le nombre de correcteurs devant intervenir pour que la moyenne soit stable varie d’une matière à l’autre. Globalement, les matières littéraires demandent un nombre plus important de correcteurs que les matières scientifiques. D’après les calculs de Piéron, il faudrait 127 correcteurs en dissertation philosophique, 78 correcteurs en composition française, 19 en version latine, 16 en physique, 13 en mathématiques et 8 en anglais 2ème langue vivante.
Mais la « vraie » note existe-t-elle vraiment ? De l’avis général des chercheurs en didactique, la réponse est négative. D’autant qu’une même copie corrigée par un même professeur à des moments différents obtient des notes différentes. En effet, de nombreux facteurs influencent le jugement des professeurs lors des corrections : leur humeur du moment, leur relation avec la classe, leur origine sociale, les résultats qu’ils ont eux-mêmes obtenus à l’école, les notes précédentes obtenues par leurs élèves etc.
On sait, par exemple, que les premières notes obtenues par un élève jouent, par effet de stéréotypie, sur la suite de ses résultats avec le même enseignant. Même l’ordre dans lequel les copies sont corrigées impacte la notation : une copie moyenne corrigée après une excellente copie obtient une moins bonne note que si elle est corrigée après une série de mauvaises copies. La fibre sociale des enseignants entre également en ligne de compte : certains professeurs ont tendance à ramener toutes les notes vers la moyenne – par exemple entre 7 sur 20 et 14 sur 20 –, comme s’ils cherchaient à mettre tous les élèves à égalité. D’autres, en revanche, survalorisent les « bons » élèves et sous-évaluent les moins performants, creusant l’écart entre les uns et les autres.
Enfin, comme l’a montré André Antibi dans La Constante macabre, une pression sociale insidieuse s’exerce aussi sur la façon de noter des enseignants. L’exemple qu’il donne illustre bien son propos : si un professeur donne tout le temps de bonnes notes à tous ses élèves, on ne dira pas de lui que c’est un enseignant qui fait réussir tous ses élèves. On dira plutôt qu’il est trop gentil et que les enfants n’apprendront pas grand-chose. Car, dans l’imaginaire collectif, il faut toujours qu’il y ait une proportion de bonnes notes, une proportion de notes moyennes et une proportion de mauvaises notes. C’est ce que les pédagogues appellent la « courbe de Gauss ».
Dans leur quête d’objectivité et de justice, les études sur l’évaluation ont donc été conduites peu à peu à se centrer sur la validation des acquis réels des élèves plutôt que sur le classement de ces derniers les uns par rapport aux autres. En effet, la notation chiffrée ne dit pas grand-chose sur ce que les élèves ont appris. En revanche, la validation des acquis montre ce que l’enfant sait ou ne sait pas faire. C’est pourquoi, de nombreuses écoles primaires françaises n’utilisent plus les notes, mais des grilles de compétences à valider. Les collèges français s’y sont également mis, même s’ils ont gardé pour la plupart un système hybride comportant à la fois des notes et des grilles de compétences.
En somme, pour plus de justice à l’école, il est nécessaire que les pays qui utilisent encore le système des notes engagent une réflexion visant à atténuer son poids sur le destin des élèves. Car qui peut dire avec certitude que l’élève qui obtient son bac avec 10 sur 20 de moyenne est plus compétent que celui qui échoue avec 9 sur 20 de moyenne ? Comme l’écrivait le sociologue François Dubet en 2004 dans L’école des chances – Qu’est-ce qu’une école juste ? :
« Bien sûr, il ne s’agit pas de dire que la notation ne mesure rien et qu’elle ne traduit aucune forme de mérite, mais il convient de rappeler que la mesure du mérite scolaire reste un exercice incertain, construit : elle n’a pas la précision du chronomètre électronique qui désigne le vainqueur d’un 100 mètres. Si les meilleurs et les moins bons des élèves peuvent être distingués de façon peu discutable, les différences plus fines, celles qui condamnent parfois à l’enfer de l’échec ou au paradis du succès, relèvent autant du jugement et de la croyance que d’une science exacte. Cependant, les doutes de la docimologie affectent bien peu le monde de l’école : le mérite est une croyance d’autant plus solide que les enseignants, anciens bons élèves souvent, en ont été les bénéficiaires ; comment ne pas croire à l’objectivité du concours qui m’a fait ce que je suis ? ».

Denis Dambré