En 1990 et 1991, les premiers essais à grande échelle des nouvelles évaluations standardisées pour les enfants de 7 ans ont eu lieu. Contrairement aux tests chronométrés de courte durée, ils exigeaient beaucoup de préparation et d'organisation de la part des enseignants. Pour beaucoup de ceux qui n'avaient jamais planifié un travail thématique avec des objectifs clairs servant à évaluer l'apprentissage des élèves, les tests étaient à la fois exigeants et perturbants. Cela s'explique en partie par le fait que les concepteurs évaluations standardisées n’avaient pas eu suffisamment de temps pour mettre à l'essai un nouveau type d'exercice et ajuster le niveau de la demande, et en partie par le fait que le temps et les ressources nécessaires pour préparer les enseignants - qui n'avaient jamais participé à des examens publics auparavant – à ces exercices assez novateurs étaient insuffisants.
De nombreux enseignants du primaire se sont plaints de la méconnaissance et de la charge de travail et ont reçu beaucoup d'attention de la part des médias ; leurs préoccupations ont été utilisées par ceux qui s'opposaient à la stratégie dans son ensemble pour plaider en faveur d'un retour aux tests antérieurs. D'autres, qui ont reçu moins d'attention, ont accueilli les tests parce qu'ils les considéraient comme un modèle pour améliorer la conception de leur enseignement. Un an plus tard, les premiers tests pour les jeunes de 14 ans reçurent une attention similaire, bien que les enseignants du secondaire aient été plus favorables aux aspects inhabituels des tests, peut-être en raison de leur participation aux développements de l'évaluation dans la préparation des nouveaux programmes des lycées en 1988.
Toutefois les difficultés techniques étaient considérables. Les séquences de progression spécifiées par les énoncés en termes de niveaux dans les programmes scolaires étaient basées sur très peu de preuves empiriques. Les problèmes sont devenus évidents lorsque de nombreux élèves ont réussi, par exemple, un énoncé de niveau 6 alors qu'ils échouaient à l'énoncé de niveau 4 (inférieur) dans le même sujet. Il y avait également des problèmes de fiabilité, car les tests devaient permettre d'évaluer le niveau de réussite de chaque élève dans plusieurs domaines, mais pas dans la totalité, avec un temps de test limité et sans la possibilité de vérifier la cohérence entre les différents domaines, et encore moins de les modifier.
En même temps, les évaluations par les enseignants sont également devenues un problème. Ces derniers se sont largement plaints du fait que la charge de travail supplémentaire que représentait l'évaluation leur enlevait du temps d'enseignement. Des enquêtes ont montré que de nombreux enseignants du primaire avait " fait " leur évaluation sur une période d'environ 3 semaines peu avant la mise en place évaluations standardisées. Selon eux, l’évaluation standardisée n’était qu’une charge Cela renforçait la dimension de l’évaluation sommative sans rapport avec l'apprentissage des élèves. Une enquête révélait l'émergence de trois types de réponses des enseignants dans les écoles primaires. Quelques-uns procédaient à de véritables évaluations formatives, passant en revue les résultats de tous les élèves environ une fois par semaine afin d'établir des progressions pour la semaine suivante. D'autres étaient devenus des « copies-conformes », recueillant et conservant les données mais n'en faisant que peu usage pour ajuster leur enseignement aux élèves.
Ces enseignants se plaignaient du fardeau de l'évaluation parce que, pour eux, il s'agissait effectivement d'un supplément inutile à leur travail. Un troisième groupe ignorait l'ensemble de l'affaire, soit en la considérant comme une imposition arbitraire qui ne devrait pas être autorisée à perturber leurs propres pratiques, soit en jugeant que les différends et les changements qui accompagnaient la nouvelle politique justifiaient l'inaction. Au fur et à mesure que s’élaboraient les cahiers des charges, il devenait évident que ces évaluations présentaient une lourdeur excessive pour les enseignants du primaire.
Dans la série:
La Loi sur la réforme de l'éducation de 1988 fut t l'aboutissement d'un long débat qui s'est développé pendant au moins 20 ans. L’un des motifs est le désir du ministère de l’éducation d'exercer une influence sur les programmes scolaires. Le second est le fait que les hommes politiques de Droite et de Gauche exprimaient des inquiétudes face au déclin supposé du pays, certains se concentrant principalement sur le déclin économique et d'autres sur la perte des valeurs et de la culture traditionnelles.
Voici ce qu'avait recommandé le groupe national d'experts avant la mise en oeuvre des évaluations nationales en Grande-Bretagne : 1. Les évaluations nationales devraient être fondées sur une combinaison d'évaluation par les enseignants et de tâches fixées à l'extérieur, appelées tâches d'évaluation standardisée (SAT). 2. L'objectif principal de l'évaluation, outre celui de l'évaluation à l'âge de 16 ans, devrait être de fournir un feed-back fréquent sur l'apprentissage des élèves afin que l'enseignement puisse s'adapter à leurs besoins (c'est-à-dire être formatif) ;
Les évaluations nationales en Grande Bretagne : (3) Priorité excessive aux évaluations standardisées
Cinq mois après la publication du rapport du groupe national d’experts en 1987, le ministre de l'Éducation annonçait qu'il acceptait la plupart des recommandations, même si cet engagement était formulé en termes vagues à plusieurs reprises. Les groupes mis sur pied pour élaborer les recommandations des programmes scolaires devaient travailler selon le cadre à dix niveaux en utilisant une approche fondée sur ces critères.
En 1990 et 1991, les premiers essais à grande échelle des nouvelles évaluations standardisées pour les enfants de 7 ans ont eu lieu. Contrairement aux tests chronométrés de courte durée, ils exigeaient beaucoup de préparation et d'organisation de la part des enseignants. Pour beaucoup de ceux qui n'avaient jamais planifié un travail thématique avec des objectifs clairs servant à évaluer l'apprentissage des élèves, les tests étaient à la fois exigeants et perturbants.
Le rapport du groupe national d’experts avait pourtant attiré l'attention sur le danger d’une lourdeur excessive et avait recommandé une réduction des composantes du profil entre les matières et d’une matière à l’autre pour produire un plus petit nombre de composantes génériques ou de base notamment pour les groupes d'âge les plus jeunes. Cette question ne fut jamais abordée. Les ministres et les fonctionnaires considéraient les matières choisies comme évidemment nécessaires, et toute théorie globale qui aurait pu servir à définir leurs limites,
Il semble que les contenus des recommandations du groupe d’experts (TGAT) n’ont guère étaient pris au sérieux par les décideurs politiques. Par ailleurs, si le nouveau système avait été moins compliqué et ambitieux, il aurait pu être plus robuste et, par conséquent, aurait pu mobiliser plus efficacement les acteurs de l’éducation. En résumé, il est clair que cette inefficacité dans la mise en œuvre possède plusieurs causes.
Commentaires