Zoals ik in WiskundE-brief 889 besprak, werden de N-termen bij de eindexamens
van 2021 anders bepaald dan gebruikelijk. Een vergelijking van de
behaalde scores en de toegekende cijfers voor de wiskunde-examens
maakt duidelijk dat de N-termen dit jaar een zeer belangrijke rol
hebben gespeeld. Zie hiervoor ook WiskundE-brief 892. Het is daarom toe te juichen dat
vanuit Cito onlangs gedetailleerd is toegelicht hoe die normering
tot stand is gekomen.
In het oktobernummer van
Euclides, het tijdschrift van de
Nederlandse Vereniging van Wiskundeleraren (NVvW), staat een artikel van
Paul van der Molen, die bij het Cito verantwoordelijk is voor het
technisch normeringsadvies. In dit artikel laat hij aan de hand van
het havo wiskunde A examen heel precies zien hoe de N-termen voor de
drie tijdvakken tot stand zijn gekomen. Ik vat hieronder voor u dit artikel
nog eens samen. Daarna ga ik in op de situatie bij havo wiskunde B.
Havo wiskunde A eerste tijdvak
Aan de basis voor de procedure van het bepalen van de N-term liggen
de gegevens die examinatoren insturen via Wolf. Normaal gesproken doen
nagenoeg alle kandidaten mee aan het eerste tijdvak. Dat was het
afgelopen examen echter anders; kandidaten konden ervoor kiezen om
pas in het tweede tijdvak hun eerste kans te wagen. Verwacht werd
dat vooral de zwakkere kandidaten van die mogelijkheid gebruik zouden
gaan maken. In dat geval zou de groep van kandidaten die aan het eerste
tijdvak deelnam niet representatief zijn voor de hele populatie.
Om dit probleem te ondervangen, is via Wolf aan de examinatoren gevraagd
of de groep die aan het eerste tijdvak deelnam, representatief was voor
de gehele groep. Als er op die vraag ontkennend of weifelend werd geantwoord
dan werden de betreffende gegevens niet meegeteld. Dat kwam er
uiteindelijk op neer dat ongeveer de helft van de resultaten buiten de
steekproef werden gelaten.
Voor de overblijvende groep werd vervolgens berekend welke N-term
er nodig was om uit te komen op ongeveer hetzelfde cijfer als het
gemiddelde over de jaren 2017-2019. Dat gemiddelde was een 6,4 en
een N-term van 1,0 bleek hiervoor voldoende te zijn.
Daarna keek men naar het oordeel van de examinatoren. Door aan te geven bij welke
score een 5,5 als cijfer zou moeten horen, gaven de examinatoren indirect
aan wat naar hun idee de N-term zou moeten zijn. Die oordelen liepen
nogal uiteen. Zelfs als de 5% hoogst en 5% laagst geopperde N-termen
buiten beschouwing worden gelaten, varieerden de suggesties nog van
N=0,8 tot N=1,5. Maar zoals afgesproken keek men alleen naar de middelste
33% van de oordelen. In dat gedeelte varieerde het oordeel van
N=1,1 tot N=1,3. Op basis hiervan stelde men een nieuwe voorlopige N-term
van 1,1 vast. Vergelijking met de N-termen uit 2017 (1,5), 2018 (1,2) en
2019 (1,0) bracht daar geen verandering in en daarom werd de N-term
definitief vastgesteld op 1,1.
Uiteindelijk werd de N-term vastgesteld op 1,2. Dat had te maken met signalen
'uit het veld' dat het examen nogal lang was en sommige kandidaten hierdoor
in tijdnood kwamen.
Havo wiskunde A tweede tijdvak
De normeringsprocedure voor degenen die een examen herkansen is een
andere dan die voor kandidaten die voor het eerst examen doen. In
WiskundE-brief 818 heb ik die procedure al eens uitvoerig behandeld. In eerste
instantie werd er daarom voor de kandidaten die het examen voor de
eerste keer maakten en voor de herkansers aparte N-termen berekend.
Van alle kandidaten die in het tweede tijdvak voor het eerst examen
deden, werden vervolgens alleen de kandidaten geselecteerd waarvan
de examinatoren in het eerste tijdvak al hadden aangegeven dat het
om een representatieve groep ging. Deze groep bleek erg laag te scoren
zodat een N-term van 2,3 nodig zou zijn om op het gemiddelde van de
periode 2017-2019 uit te komen. Het oordeel van de middelste 33% van
de examinatoren was met N=1,2 tot N=1,4 minder extreem. Alles bij
elkaar leverde dit N=1,4 als tussenstand op.
De resultaten van de herkansers die in de eerste termijn een onvoldoende
haalden, wezen erop dat het examen iets moeilijker was dan het examen
van het eerste tijdvak. Deze constatering zou moeten resulteren in een
N-term van 1,3 voor de groep van herkansers. Omdat er afgesproken was
dat voor het tweede tijdvak slechts één N-term zou worden gehanteerd
en daarbij de groep van herkansers veel groter was dan de groep van
'eerstekansers', werd de N-term uiteindelijk op 1,3 vastgesteld.
Havo wiskunde A derde tijdvak
Aan het derde tijdvak namen slechts enkele honderden kandidaten deel.
Alle deelnemers aan het derde tijdvak waren herkansers maar toch werd
er onderscheid gemaakt tussen kandidaten die hun eerste kans tijdens
het eerste tijdvak hadden gewaagd en kandidaten die pas in het tweede
tijdvak in actie waren gekomen. Opvallend was dat berekening van de
N-term voor eerstgenoemde groep aanzienlijk hoger uitkwam dan voor de
tweede groep: N=1,4 tegen N=1,0. Omdat beide groepen ongeveer even groot
waren, werd de N-term uiteindelijk vastgesteld op 1,2.
En havo wiskunde B?
De keuze voor het examen havo wiskunde A is begrijpelijk. Dit examen
wordt door veel leerlingen gemaakt en is in zekere zin als een mediaan
wiskunde-examen te beschouwen. Echter, wat betreft de resultaten bleek
nu juist het examen havo wiskunde A een uitzondering te vormen.
In tegenstelling tot veel andere wiskunde-examens waren de scores in
het eerste tijdvak voor dit examen namelijk best redelijk. Zie ook
WiskundE-brief 892.
Om die reden is het interessant om ook naar de vaststelling van de N-term
van een ander examen te kijken en gelukkig waren Cito en CvTE bereid om
ook de gegevens van het examen havo wiskunde B met ons te delen.
Havo wiskunde B eerste tijdvak
Op het examen havo wiskunde B werd in het eerste tijdvak zeer slecht
gescoord. De gemiddelde score bedroeg nog geen 50%. In de jaren 2017
tot en met 2019 waren de scores hoger en waren de cijfers, zo'n 6,7
gemiddeld, heel behoorlijk. Om ook bij dit examen op een dergelijk cijfer
uit te komen, zou een N-term van maar liefst 2,4 nodig zijn geweest.
Het oordeel van de middelste 33% van de examinatoren kwam met N=1,4 tot
N=1,7 heel wat lager uit. Omdat het hoogste oordeel van de middengroep
van examinatoren binnen de historische reeks van N-termen viel, werd de
voorlopige N-term op 1,7 gesteld. Omdat het examen, net als het examen
wiskunde A, door het veld als te lang werd beoordeeld, werd de definitieve
N-term op 1,8 vastgesteld.
Het grote verschil tussen de examens havo wiskunde A en B wat betreft
de vaststelling van de N-term voor het eerste tijdvak laat zich als
volgt illustreren:
Boven 'nodig' staat de N-term afgebeeld die het gemiddelde cijfer op het
niveau van de jaren 2017-2019 zou hebben gebracht. Boven 'docenten' staat
het oordeel van de middelste 90% van de examinatoren (de lichtblauwe balk)
en van de middelste 33% van de examinatoren (de donkerblauwe balk). Boven
'N-term' staat de uiteindelijk vastgestelde N-term.
Havo wiskunde B tweede tijdvak
Net als bij wiskunde A waren in het tweede tijdvak de verschillen tussen
'eerstekansers' en herkansers groot. De 'eerstekansers' maakten dit
examen zo slecht dat er een N-term van 2,9 nodig zou zijn om op het
cijferniveau van de examens van 2017-2019 te komen. Ook de examinatoren
vonden het examen lastig; de 33% middengroep stelde N=1,5 tot N=1,8
voor. Voor de groep 'eerstekansers' werd virtueel een N-term van 1,8
vastgesteld. Omdat de berekening voor de herkansers met N=1,4 een stuk lager
uitkwam en de groep van herkansers ook een stuk groter was, werd de N-term
uiteindelijk op 1,5 vastgesteld.
gk