Relatief beoordelen, mag dat iets minder?

Fijne promotie vandaag, 27 november : ‘Juridisch correct examineren’, Henk van Berkel. Soort update van het proefschrift van Job Cohen, 1981: ‘Studierechten’. Ontspannen en humoristische oppositie (o.a. Job Cohen, Henk Schmidt, Ben Vermeulen), met bijpassende verdediging van Henk. #chapeau

Wie nieuwsgierig is naar die proefschriften: dat van Job staat gescand op mijn website, dat van Henk is voorlopig alleen op papier verkrijgbaar door een e-mail te sturen, met postadres, naar de auteur: henkvanberkel22@gmail.com. De kosten bedragen € 55.

Henk van Berkel gaf voorafgaand aan de verdediging een samenvatting, in kort bestek. Eerder (2017) gaf hij al eens een uitgebreider voordracht, met een informatieve powerpoint:

Click to access Henk-van-Berkel.pdf

Kent u de wet? Kent u artikel 7.10. lid 2 WHW?
“Elk tentamen omvat een onderzoek naar de kennis, het inzicht en de vaardigheden van de examinandus, alsmede de beoordeling van de uitkomsten van dat onderzoek.” (zoals geciteerd door vVan Berkel, blz. 364).

Dus prestaties van andere studenten zouden er niet toe moeten doen?

Deze thematiek staat onder onderwijskundigen bekend als die van absoluut versus relatief beoordelen. Vat dat niet absoluut op: alle beoordelen is uiteindelijk relatief. Maar we kunnen het ook te gek maken, en per definitie relatief beoordelen: hoogste 25%, laagste 10%, etc.

Er zijn toetsen die zo worden beoordeeld. Zoals de Maastrichtse voortgangstoets, waar u nog nooit van hebt gehoord. Of het leerlingvolgsysteem LVS van het Cito in het po, dat u wellicht heel goed kent. Of dat LVS een test of een toets is, mwah, doet dat er toe?

De WHW gaat niet over het primair onderwijs. Maar wel over die voortgangstoets in Maastricht: is die toets in strijd met de wet? Afgezien van legaliteit, zijn er ook ethische vraagtekens te plaatsen bij deze vorm van relatief beoordelen. Afijn, Job Cohen had een voorstel.

Job Cohen had niet zozeer een vraag aan de promovendus, als wel een opdracht: begin de dag na de promotie met het schrijven van een artikel over dat relatief beoordelen. Naar ik begrijp: niet voor een wetenschappelijk tijdschrift, maar een publicatie die landt in het onderwijs.

Het is een verdraaid belangrijk onderwerp. In mijn eigen werk is het bijna een rode draad. Bijv. over dat LVS: naar mijn bescheiden mening is dat in strijd met de rechten van het kind: kinderen laten weten dat zij bij de onderste 10% in NL scoren is misdadig.

Laat ik eens meedenken met Henk van Berkel. Wat is relatief beoordelen: scoort Marie beter dan Mohammed. Het wiskundig apparaat lijkt dat van de psychologische testleer te zijn (de psychometrie) (daar valt later meer over te zeggen). Leraren let op: Wetmatigheid van Posthumus.

Er bestaat ook een andere vorm van relatief beoordelen: naar een vastgelegde norm/doel/beheersing: criterium-gerefereerd toetsen. Daar hoort een ander wiskundig apparaat bij (bv: als iedereen de stof beheerst heeft de toets klassieke betrouwbaarheid nul). En een andere didactiek.

Een bijzonder voorbeeld is het 2-sigma-experiment van Benjamin Bloom (jawel: diezelfde Bloom). Ik schreef er een blog over
https://benwilbrink.wordpress.com/2018/09/28/benjamin-s-bloom-human-characteristics-and-school-learning/
Het didactisch concept van de Londense Michaela school past hierbij. In 2019 meteen behorend tot top-5 in GCSE resultaten.

De inzet is hoog: naarmate het waar is dat de op beheersing gerichte didactieken resulteren in kleinere verschillen tussen leerlingen met verschillende SES-achtergrond, zijn relatieve beoordeling en bijbehorende didactieken in strijd met ons streven naar eerlijk onderwijs.

Het gaat om een principiële keuze: sturen we (leerkrachten, leiding, bestuur, OCW, ministers) op verschillen tussen leerlingen, op sturen we op het bereiken van adequate beheersing voor alle leerlingen? Dat zijn twee werelden apart, ook in termen van eerlijk onderwijs.

Oké, het wetenschappelijk onderwijs is toch iets anders dan po en vwo, hier wordt relatief beoordelen dus wat ingewikkelder. Hebben we dat begripsmatig en wiskundig op een rijtje? In beginsel wel, want al in 1888! schreef Edgeworth het uitstekend op, zie
http://benwilbrink.nl/projecten/loten_nf.htm#Edgeworth

Het gaat dan om de toelatingsexamens voor de Civil Service, quota-selectie (vgl onze numerus fixus). Die examens zijn onnauwkeurig. Je kunt op een puntje verschil zakken of slagen, dat puntje is never ever inhoudelijk te onderbouwen (dat was ook de wanhoop van A.D. de Groot).

Is dat dan oneerlijk? Nee, op zich niet, rond die zak-slaaggrens zijn de kansen weliswaar ongeveer fifty-fify, maar door extra inspanning in de voorbereiding kan de kandidaat zijn kansen verbeteren (mikken boven die grens). Dat is de regel van het spel. PM: SES-verschillen.

Nu zijn er ook (vele) situaties van vergelijkende selectie, terwijl verschillen tussen de kandidaten marginaal zijn, ook bv op basis van de wet (bv: toelaatbaarheid tot ho met relevant eindexamen) (eigenlijk) geen rol mogen spelen. Van Berkel gaat erop in (decentrale selectie).

Ik kom terug op een eerder puntje: is de psychometrie het wiskundig apparaat waarmee beoordelen in het onderwijs valt te beschrijven? Henk van Berkel promoveerde al eens eerder, bij Robert van Naerssen, en hij weet dus dat toetsen in het onderwijs ≠ testen in de psychologie.

Het is de grote en vooral onbegrepen verdienste van Robert van Naerssen dat hij in 1970 de nadruk legde op de essentie van toetsen: daar bereiden studenten zich gericht op voor. ‘Over optimaal studeren en tentamens combineren
http://benwilbrink.nl/publicaties/70vNaerssenLes.htm
Waarachtig nog 100% actueel.

De spannende vraag is dan (Cohen): heeft de ‘mainstream’ opvatting dat toetsen relatief is en dus de psychometrie van Edward Thorndike (1904) ‘Theory of mental and social measurements’ etc. het wiskundig apparaat van voorkeur, heeft die opvatting het onderwijs schade berokkend, en moeten we er zo snel mogelijk vanaf?

Er zijn duizenden details en verdere vragen. We moeten het doen met een helikoptervisie op het slagveld van het onderwijs (strijd tussen maatschappelijke groepen, onderwijsbeleid is oorlog; eerlijk onderwijs), maar wel onderbouwd met relevante literatuur.

Aanvulling.

Bedenk dat doorheen de onderwijsgeschiedenis het examineren vaak sterk relatief is: wie is de beste, wie wint het dispuut. http://benwilbrink.nl/publicaties/97AssessmentStEE.htm
Het zit in de haarvaten van de onderwijscultuur. Terugdringen van dat relatieve beoordelen zal een taaie strijd zijn.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Google photo

You are commenting using your Google account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s