Summatief evalueren

Summatief evalueren

Je bent nog niet begonnen met je onderwijs of je krijgt alweer de vraag: ‘Wordt dit beoordeeld?’ Waarom moet het altijd over het examen of de toets gaan? De afgelopen jaren is een duidelijke beweging gaande waarin meer aandacht wordt gegeven aan de lerende functie van examens, onder andere vanuit de hoop dat studenten zich niet meer zo richten op het eindresultaat maar meer op het leerproces. Tegelijk zullen we toch af en toe een beslissing moeten maken over de competentie van studenten. Hoe doen we dit dan? We duiken in het begrip summatief evalueren.

Formatief en summatief

Formatief handelen (voorheen formatief evalueren) en summatief evalueren worden nog wel eens tegenover elkaar gezet als een soort tegenpolen. Summatieve evaluaties gaan over het vormen van een eindoordeel: kan een student iets, en in welke mate dan? Aan deze examens of toetsen zitten waarderingen vast in de vorm van studiepunten of (uiteindelijk) behaalde diploma’s. Haal je ze niet, dan kan je niet verder in je studie. Tegenover summatieve evaluaties staan dan formatieve evaluaties die gaan over het leren in plaats van het eindoordeel¹. In de praktijk is het niet handig om formatief en summatief als twee tegengestelde vormen van evalueren te zien. Een examen of toets zonder eindoordeel is namelijk niet per definitie formatief. Formatief handelen is veel meer een didactische aanpak die wordt ingezet als middel om van te leren. Onderzoekers zijn expres afgestapt van de term ‘formatief evalueren’ omdat deze nog te vaak de impliciete boodschap geeft dat formatief handelen altijd en alleen over evalueren of toetsen gaat. Lees hier verder over formatief handelen.

Hoe geven we het oordeel?

Goed, terug naar summatief evalueren. We geven dus een eindoordeel, en zo’n oordeel kan je op verschillende manieren geven. Meestal geven we cijfers. Het geven van cijfers staat enigszins ter discussie. Onlangs verscheen in Nederland bijvoorbeeld het boek ‘Is het voor een cijfer?waarin onderzoeksjournalist Johannes Visser de huidige testcultuur in Nederland kritisch onder de loep neemt. Aan het geven van cijfers kleven inderdaad meerdere nadelen. Zo verlagen ze bijvoorbeeld de intrinsieke motivatie, verleggen de focus van studenten van leren naar presteren, zorgen voor ongezonde competitie, en geven stress en angstgevoelens². Verder leiden summatieve evaluaties met cijfers veelal tot oppervlakkig leren³. Dit houdt in dat studenten vooral leren voor het examen en informatie niet diep genoeg verwerken om deze echt geïnternaliseerd te hebben. Hier komt de vraag ‘Wordt dit beoordeeld?’ naar boven. 

Betekenen al die negatieve effecten dan dat we geen cijfers moeten geven? Niet per se. In sommige gevallen hebben cijfers wel degelijk een functie. Ten eerste is het een heel efficiënte manier om prestatieniveaus te onderscheiden. Als je doel is om studenten te onderscheiden in bekwaamheidsniveau voor een selectie, dan heb je met cijfers een goed middel. Omdat je iedereen op een vergelijkbare schaal zet kan dit voor een eerlijk oordeel zorgen. Sterker nog, cijfers zijn ooit bedacht om het beoordelen eerlijker te maken². Ook kun je makkelijker groepen studenten onderling vergelijken. Cijfers maken het daarnaast mogelijk klasgemiddelden te berekenen die iets kunnen zeggen over de algehele leertrend op een school. Deze toepassingen vragen natuurlijk wel om een betrouwbare en valide toetsing en dat gebeurt dan weer niet altijd⁴

Cijferloos beoordelen

Wat als je van de cijfers af wil? Er zijn andere manieren waarop je summatief kan evalueren, al blijkt ook hier geen enkel middel perfect. Er is onderzoek gedaan naar wat er gebeurt als je evalueert zonder cijfers te geven. De afwezigheid van cijfers zorgt over het algemeen voor minder oppervlakkig leren, minder stress en meer motivatie². Het is nog niet geheel duidelijk wat een gebrek aan cijfers doet met de studieprestaties. Er bestaan zorgen dat de studieprestaties zouden afnemen omdat studenten geen grote druk meer voelen om veel cijfers te halen⁴. De resultaten hierover zijn alleen niet eenduidig en soms ontbreekt het nog aan voldoende data om goede conclusies te trekken². Ook is niet elke studie meteen naar de Nederlandse/Vlaamse context te vertalen

Alternatieven lijken veelbelovend, maar ook hier zijn er zaken om rekening mee te houden. Er bestaan voorbeelden van scholen die alleen nog een soort CV aan studenten geven bij het afstuderen. Dit blijkt wel lastig op grote schaal uit te voeren. Ga je over naar alleen het geven van een voldoende/onvoldoende, dan kunnen de voordelen van het cijferloos werken tegengewerkt worden door de heersende status quo. In een onderwijsinstelling waar nog steeds cijfers de norm zijn, zullen studenten voor een vak zonder cijfers mogelijk minder aandacht besteden aan dat cijferloze vak

In een onderwijsinstelling of studie die in het geheel overgaat naar cijferloos beoordelen zal in ieder geval zowel bij docenten als studenten veel aandacht besteed moeten worden aan het wennen aan deze manier van werken²,⁴. We zijn immers allemaal gewend aan werken met cijfers. Het gevaar bestaat dat je toch een onderscheid wil maken voor mensen die bijvoorbeeld excelleren, waardoor je alsnog een soort schaal gaat maken van verschillende prestatieniveaus. Als je gaat werken met sterretjes of letters kom je snel weer terug op een puntensysteem, met de bijbehorende gedachten zoals ‘Ik heb maar een B’. Eigenlijk ben je dan weer terug bij af. 

En nu?

Uiteindelijk kom je er niet onderuit om een oordeel te geven over de prestaties van een student. Je zal immers moeten borgen dat iemand de standaard haalt die vereist is voor een diploma. Ook zorgen summatieve beoordelingen ervoor dat je onderwijskwaliteit kan borgen door resultaten over jaren heen te vergelijken. De negatieve effecten van summatieve evaluaties zullen dus altijd enigszins blijven bestaan. 

Je kan wel nadenken over wanneer en hoe vaak je deze evaluaties inzet en welke vorm je kiest. Daarmee beperk je de negatieve effecten waar mogelijk. Misschien is het in jouw situatie wel mogelijk om minder te evalueren en toch een beeld te krijgen van het leren van studenten door formatief handelen. Maar als je bijvoorbeeld studenten wil selecteren naar prestatieniveau zul je misschien juist cijfers willen gebruiken.

In alle gevallen wil je ervoor zorgen dat een summatief oordeel betrouwbaar en valide tot stand komt. Bij de complexere taken die je toetst in het hoger onderwijs is comparatief beoordelen een geschikte methode om dit te doen. Deze manier van beoordelen leidt namelijk tot een hoge validiteit en betrouwbaarheid⁶,⁷. Comparatief beoordelen werkt vanuit vergelijken, een natuurlijk proces waarmee je consistentere beslissingen neemt dan door een criterialijst te gebruiken. Een eindoordeel is op deze manier ook niet afhankelijk van de beoordeling van één docent. Door samen te vergelijken construeer je een rangorde van het minst goede naar het beste werk. Deze rangorde kan je vervolgens eenvoudig omzetten in punten.

Meer weten? Download het e-book of lees meer over de achtergrond van deze werkwijze. Of contacteer ons en we vertellen je meer. 

Literatuur

¹Black, P., & Wiliam, D. (2009). Developing the theory of formative assessment. Educational Assessment, Evaluation & Accountability, 21, 5–31. https://doi.org/10.1007/s11092-008-9068-5

²Kjærgaard, A., Buhl-Wiggers, J., & Mikkelsen, E. N. (2023). Does gradeless learning affect students’ academic performance? A study of effects over time. Studies in Higher Education. https://doi.org/10.1080/03075079.2023.2233007 

³Biggs, J. (1998). Assessment and classroom learning: A role for summative assessment? Assessment in Education: Principles, Policy & Practice, 5(1), 103-110. https://doi.org/10.1080/0969595980050106 

McMorran, C., Ragupathi, K., & Luo, S. (2015). Assessment and learning without grades? Motivations and concerns with implementing gradeless learning in higher education. Assessment & Evaluation in Higher Education, 42(3), 361-377. http://dx.doi.org/10.1080/02602938.2015.1114584 

⁵Tannock, S. (2015): No grades in higher education now! Revisiting the place of graded assessment in the reimagination of the public university. Studies in Higher Education, 42(8), 1345-1357. http://dx.doi.org/10.1080/03075079.2015.1092131 

⁶van Daal, T., Lesterhuis, M., Coertjens, L., Donche, V., & De Maeyer, S. (2019). Validity of comparative judgement to assess academic writing: Examining implications of its holistic character and building on a shared consensus. Assessment in Education: Principles, Policy & Practice, 26(1), 59-74. https://doi.org/10.1080/0969594X.2016.1253542 

⁷Verhavert, S., Bouwer, R., Donche, V., & De Maeyer, S. (2019). A meta-analysis on the reliability of comparative judgement. Assessment in Education: Principles, policy & practice, 26(5), 541-562. https://doi.org/10.1080/0969594X.2019.1602027

Share this