“In 1883 keerde men de cijfers om. Nu betekende 5 zeer goed, 4 goed, 3 voldoende, 2 onvoldoende, en 1 slecht.” [Fortgens, 1965, ‘Zeshonderd jaar Stedelijk Gymnasium Middelburg’ blz. 60] Dit soort regelgeving blijft me verbazen. Het heeft wel consequenties hè!
Nu zou je denken: goed dat deze school kennelijk al vroeg werkte met cijfers, in plaats van rangorde van de leerlingen. Maar dat is te snel geconcludeerd. Cijfers zijn een vernieuwing, maar deze school gebruikt ze om er ouderwets mee te rangordenen.
Dit gymnasium kende een ‘Klein Examen’: een maandelijkse oploop van alle klassen in de vergadering van curatoren en leraren, om vorderingen, gedrag en vlijt door te nemen. Op basis daarvan werden leerlingen op een nieuwe rangorde geplaatst. Zij waren op komen draven in de oude.
Duh. Toch? Rector Dokkum stelde deze archaïsche toestand ter discussie. In 1917 nog! Maar curatoren wilden er niet zomaar van af. O ja, dit circus ging gepaard met een tsunami aan proefwerken, iedere maand opnieuw, om cijfers over de ‘vorderingen’ te leveren. [blz. 68-69]
Overigens ben ik oud genoeg om zelf nog aan den lijve te hebben meegemaakt hoe mijn klas werd gerangordend aan de hand van de behaalde cijfers. Je rangorde werd vermeld in het het rapport dat driemaal per jaar mee naar huis moest voor een handtekening van vaders. 1e klas LO.
Het oude rangordenen in het onderwijs gebeurde op basis van behaalde punten (aantal gemaakte fouten, slechte punten voor gedrag of vlijt). Cijfers waren een nieuwigheid die de punten niet vervingen, maar ze vertaalden naar een pseudo-objectieve schaal, van 1 tot 5 bijvoorbeeld.
Wij zijn gewend dat het uiteindelijk om de cijfers gaat, maar er is kennelijk een lange overgangsperiode geweest waarin scholen het oude systeem van rangordenen niet los konden laten, ondanks de overgang van een puntenstelsel naar cijfergeven. Zie ook benwilbrink.nl/publicaties/97…
“Nu betekende 5 zeer goed, 4 goed, 3 voldoende, 2 onvoldoende, en 1 slecht.” Daar zit een zekere logica in? Evenveel ruimte onder de voldoende, als erboven. Consequentie van deze manier van denken: veel onvoldoendes geven, en veel zittenblijven is ‘normaal’. Een onderwijsramp.
Want wat gebeurt er? Een omkering: omdat er ‘onder’ de voldoende nog zoveel ruimte is, moet die ook worden gevuld. Het wordt ineens gek om proefwerken te geven waar alleen maar voldoendes of beter uit rollen. Dat cijfergeven brengt een eigen, negatieve, dynamiek mee. Stop ermee.
Een ander probleem, waar ook A.D. de Groot, en zeer veel anderen, op wezen: die cijfers blijven zelf nog steeds RANGcijfers. Omdat we collectief in de pseudo-objectiviteitsval trappen, zijn we die cijfers gaan optellen, middelen, wat niet al (Klein Examen in Middelburg).
Maar dat slaat natuurlijk nergens op. Zeker, we kunnen afspreken dat die cijfers opgeteld en gemiddeld mogen worden. Maar dat is niet meer dan een spelregel hè! De afstanden tussen die cijfers zijn niet ‘gelijk’, en dat is wel een voorwaarde wil dat middelen zinvol zijn.
Vanuit het perspectief van de leerlingen verandert er ook veel bij de introductie van cijfers. Door de gekkigheid van de de grens tussen voldoende en onvoldoende komen leerlingen in de positie dat ze het systeem kunnen ‘gamen’. Een nipte voldoende is immers al goed genoeg.
Negatieve krachten versterken elkaar in cijferstelsels. Leerlingen komen als collectief tegenover hun leraren, ook als collectief, te staan. Interessant hoor, lees maar: benwilbrink.nl/publicaties/92… (maakt gebruik van Coleman’s ‘Foundations of social theory.’) ‘Vijven en zessen’ 2.0.
Onderwijsonderzoekers zijn zich nauwelijks of helemaal niet bewust van wat dit doet met conclusies uit onderzoeken waarin studieresultaten een rol spelen. Studieresultaten zijn niet altijd wat ze lijken te zijn, zeg maar. Dubin & Taveggia wezen er al eens op in de 60er jaren:
Als het lukt om onderwijs echt te verbeteren, maar het systeem van beoordelen van studenten blijft onaangetast, dan zullen studenten zich de winst van de verbetering proberen toe te eigenen: gemeten resultaten blijven ongeveer gelijk, studenten meten zich meer vrije tijd toe.
Al die cijferstelsels, ook het angelsaksische A B C D F, komen op hetzelfde neer, al zijn er wel verschillen in aard van de onbedoelde neveneffecten. Alle cijferstelsels zijn pseudo-objectieve schalen van inhoudelijke oordelen (goed/fout) naar waarderingen (slecht, uitstekend).
Het oude stelsel van rangordenen was in deze zin nog zuiver van aard: in wezen telde het aantallen fouten in opgegeven werk. Er was uiteindelijk ook wel een waardering: de beste leerlingen kregen aan het eind van het jaar een prijsboek. Het humanisme verving lijfstraffen door beloningen. Het probleem was: als alleen de beste leerlingen/studenten worden beloond, dan werkt dat niet bepaald motiverend voor leerlingen die weten nooit die beste te zullen zijn. Dit probleem is vele eeuwen lang wel erkend, maar er kwam nooit een oplossing voor.
Ook de rangorde zèlf was niet echt bevredigend. De ‘beste’ zijn is niet hetzelfde in een groepje van 5, of van 100. Enzovoort. In de eeuw van de statistieken, de 19e eeuw, kwam een soort standaardisatie van de rangorde in zwang, bij de Franse Agrégation: de cijferschaal. Mijn bron was dit boek: André Chervel (1993). Histoire de l’Agrégation. Contribution à l’histoire de la culture scolaire. Paris: INRP Editions Kime. Bespreking: persee.fr/doc/refor_0988……
Bij het cijfergeven waarmee heel ons onderwijs zo is bezwangerd, blijft veel te veel aandacht hangen bij de cijfers, de waarderingen. Die cijfers zijn immers zo relatief als wat, duivels elastisch. Terwijl de inhoudelijke oordelen die eronder liggen: díe zijn de core business .
Leg meer de nadruk op het inhoudelijk oordelen, dan komt men vanzelf bij wat elders wel formatief toetsen heet. Ik heb zelf een lichte voorkeur om het ‘integer toetsen’ te noemen, een nuance verschillend van ‘eerlijk onderwijs’. Zie deze vingeroefening: benwilbrink.nl/publicaties/04…