Professional Documents
Culture Documents
Bewezen
Beleid
in het
Onderwijs
Essaybundel
Bewezen
Beleid
in het
Onderwijs
Essaybundel
Bewezen
Beleid
in het
Onderwijs
Essaybundel
Bewezen
Beleid
in het
Onderwijs
Bewezen
Beleid
in het
Onderwijs
Inhoudsopgave
Inhoudsopgave 2
Voorwoord 5
Koos van der Steenhoven
01 Wetenschap en onderwijsbeleid: 8
een liefdevolle LAT?
Wim Meijnen en Jo Kloprogge
Maar wanneer is iets bewezen? Daarover woedt een fel debat, zowel in
wetenschappelijke kringen en beleidskringen, als in de praktijken van
onderwijs en cultuur (en daarbuiten, zoals in deze bundel valt te lezen over
onder meer ontwikkelingssamenwerking en jeugdzorg). Met deze bundel
willen we dat debat stimuleren, en hopelijk ook verder brengen. In
verschillende bijdragen komen de posities aan bod die in het debat over
evidence based beleid en praktijk worden ingenomen.
Ministerie van Onderwijs, Cultuur en Wetenschap Essaybundel Bewezen Beleid in het Onderwijs | 5
op leerlingniveau de samenstelling van de onderzoeksgroepen op basis
van loting worden bepaald.
Dit type onderzoek wordt nog weinig verricht in Nederland. Daarom heeft
het ministerie van OCW het initiatief tot oprichting van een nieuw
onderzoeksinstituut op dit terrein van harte gesteund. Dit is TIER
geworden, het Top Institute for Evidence Based Education Research waarin
de universiteiten van Amsterdam, Groningen en Maastricht samenwerken.
Dit instituut heeft onder meer tot doel om gerandomiseerde designs toe te
passen.
De vraag is of dat nodig is. De auteurs wijzen in deze bundel uitwegen uit
de impasse. De eerste uitweg is die van het afstemmen van het onder-
zoeksdesign op de specifieke context en vraagstelling en op de fase van
beleidsontwikkeling. Als problemen nog niet helder zijn of interventies
nog niet uitontwikkeld, kan kwalitatief onderzoek nuttiger zijn dan een
grootschalig opgezet beleidsexperiment. In die zin hanteert OCW een
opvatting van methodisch pluralisme: verschillende situaties vragen om
verschillende methoden, die ook verschillende typen kennis opleveren.
6 | Essaybundel Bewezen Beleid in het Onderwijs Ministerie van Onderwijs, Cultuur en Wetenschap
De tweede uitweg is die van het stapelen, dat wil zeggen maak in opvol-
gende fasen van de beleidsontwikkeling gebruik van verschillende
designs. Ontwerp een zorgvuldige opbouw van onderzoek als je een
bepaalde beleidsinterventie wilt plegen als je nog niets of weinig weet over
de effecten van die interventie.
Daarnaast willen we met deze bundel ook een bijdrage leveren aan het
voortdurende debat over de vraag met welk bewijs beleid en onderwijs
sterker kunnen worden. Als OCW zetten we in op een praktijk waarbij
experimenteel onderzoek in de beleids- en onderwijspraktijk routine is.
Alleen zo wordt lerend beleid mogelijk: eerst maatregelen praktisch testen
in experimenten voordat sprake is van een brede invoering.
Een cultuur waarin het uitvoeren van experimenteel onderzoek routine is,
beschikt over een breed palet van onderzoeksmethoden. Niet alle vragen
kunnen immers door middel van experimenteel onderzoek beantwoord
worden. Experimenteel onderzoek moet een essentieel onderdeel zijn van
ieder beleidsproces, maar ook andere kennisbronnen horen erbij. Als we
onze kennis van het onderwijs rijker, diepgaander en exacter maken
omdat we verschillende onderzoeksmethoden benutten, wordt uiteinde-
lijk ook het beleid rijker, dat wil zeggen beter doordacht, effectiever en
maatschappelijk breed gedragen.
Ministerie van Onderwijs, Cultuur en Wetenschap Essaybundel Bewezen Beleid in het Onderwijs | 7
01
Wetenschap en
onderwijsbeleid:
een liefdevolle LAT?
Wim Meijnen
Voorzitter NWO/PROO
&
Jo Kloprogge
Adviseur Sardes
8 | Essaybundel Bewezen Beleid in het Onderwijs Ministerie van Onderwijs, Cultuur en Wetenschap
1.1 Inleiding
In 1979 bundelde Van Kemenade enkele voordrachten die hij in de
voorafgaande jaren had gehouden. Daarbij waren uiteraard zijn ervaringen
als minister van Onderwijs (1972-1977) een belangrijke inspiratiebron. Eén
van de essays is getiteld: ‘Onderwijsresearch en Onderwijsbeleid’. Hij
constateert: ‘Ondanks die toenemende belangstelling van de sociale wetenschappen
voor onderwijs en onderwijsbeleid en van de beleidsinstanties op velerlei niveau voor de
sociaal-wetenschappelijke deskundigheid, is de relatie tussen onderwijsresearch en
onderwijsbeleid in vele opzichten onbevredigend’ (Van Kemenade, 1979, p.211/212).
Nu, dertig jaar later heeft deze uitspraak nog weinig aan geldigheid
ingeboet. De kern van het probleem ligt volgens hem in het feit dat door
beleidsinstanties, onderwijspraktijk en onderzoekers geen gericht
wetenschaps- en onderzoeksbeleid wordt gevoerd.
Ministerie van Onderwijs, Cultuur en Wetenschap Essaybundel Bewezen Beleid in het Onderwijs | 9
Broekkamp e.a. (2009) benoemen op basis van literatuuronderzoek vier
thema’s die in principe dekkend zijn om de kloof te beschrijven tussen
onderwijsonderzoek en de praktijk. Thema’s waarbinnen maatregelen te
treffen zijn om de kloof te verkleinen. De thema’s zijn:
1. De beperkte bewijskracht van onderwijsonderzoek. Een veelvoud aan factoren
zoals te weinig experimentele studies, een te gering budget, te weinig
controle over de onderwijsomgeving, onvoldoende competentie van
onderzoekers en botsende onderzoeksperspectieven zouden de
overtuigingskracht van onderzoeksresultaten schaden.
2. Het potentiële nut van onderwijsonderzoek. De inzetbaarheid van de resulta-
ten van onderwijsonderzoek is beperkt. Veel onderzoeksresultaten laten
zich niet één op één vertalen naar handelingsvoorschriften voor
potentiële gebruikers. De complexiteit en de unieke context die elke
onderwijssituatie kenmerkt, conflicteert met het standaardiseren van
handelingsvoorschriften voor potentiële gebruikers. Vereist is dus een
hoge mate van professionele deskundigheid van de afnemers.
3. Percepties van onderwijsonderzoek. Veel gebruikers hebben (onterecht) een
negatief beeld van de bruikbaarheid van onderwijsonderzoek.
4. Het gebruik van onderwijsonderzoek. Werkt de negatieve beeldvorming al
niet mee, het ontbreken van scholing in onderzoek waardoor men
onderzoeksartikelen niet kan lezen en daardoor niet op waarde kan
schatten, werkt als een barrière. Scholing verdient dus hoge prioriteit.
10 | Essaybundel Bewezen Beleid in het Onderwijs Ministerie van Onderwijs, Cultuur en Wetenschap
Een analyse van de relatie tussen onderwijsbeleid en onderwijsresearch
dient met deze factoren rekening te houden en het is dus verre van
duidelijk hoe deze relatie er op termijn uit zou kunnen zien. Dat laat
onverlet dat aan de kennisketen in het onderwijs nog veel verbeterd kan
worden.
Het ministerie van Onderwijs kan door tal van bestuurlijke instrumenten
invloed uitoefenen op het functioneren van deze kennisketen. In deze
bijdrage zal getracht worden in grote lijnen een beeld te schetsen hoe de
overheid in de afgelopen vijftig jaar de kennisketen mede heeft vorm
gegeven. Voorts zal exemplarisch, middels twee casussen, worden
beschreven hoe het ministerie onderzoeksresultaten in zijn beleid
verdisconteert en hoe het beleid heeft uitgewerkt. Beide casussen
verschaffen inzicht in de lange weg van onderzoeksresultaten, planning en
uitvoering van beleid naar de uitvoeringspraktijk in scholen en klassen.
Aan het eind van deze bijdrage zullen enkele suggesties worden gedaan
om de kloof te verkleinen die zijn terug te voeren op één der bovenge-
noemde thema’s. In het bijzonder zal daarbij worden gewezen op de rol die
het ministerie van Onderwijs daarbij kan spelen.
Ministerie van Onderwijs, Cultuur en Wetenschap Essaybundel Bewezen Beleid in het Onderwijs | 11
praktijk. Adviezen aan scholen zouden mede worden gegeven op basis van
de meest relevante en recente verworvenheden uit de onderwijsresearch.
Rekrutering van medewerkers vond in den beginne vooral plaats onder
praktijkmensen met veel ervaring. Later werd een academische voor
opleiding een gangbare eis.
12 | Essaybundel Bewezen Beleid in het Onderwijs Ministerie van Onderwijs, Cultuur en Wetenschap
noodzakelijk was en dat voor op zichzelf staand onderzoek, of met
onderzoek samenhangend ontwikkelingswerk ten behoeve van een
bepaald onderwijsaspect, gespecialiseerde instituten noodzakelijk waren.
1.2.3 Onderwijsonderzoek
Het tijdperk voorafgaande aan de SVO
Begin jaren zestig begon de ‘constructieve’ periode van het onderwijsbe-
leid, waarbij de overheid niet meer volstond met het verdelen van
financiële middelen (allocatief beleid) maar de ontwikkeling van het
onderwijs actief probeerde te beïnvloeden. De vraag naar onderzoek nam
hierdoor snel toe. Uit een potje van de afdeling Research en Onderzoek op
het ministerie van Onderwijs en Wetenschap konden onderzoeken worden
gefinancierd. De regel was dat wie het eerst vroeg, het meest kreeg.
Halverwege het jaar was het geld op. Er ontstond behoefte aan een meer
gerichte benadering. Mede onder invloed van invloedrijke hoogleraren als
A.D. de Groot en Ph. Idenburg werd besloten de behartiging van het
onderwijsonderzoek te verzelfstandigen in een stichting (Van Kemenade
e.a., 1986). Gelijktijdig werden de geldmiddelen voor onderwijsresearch
verruimd. In 1965 werd aldus de Stichting voor Onderzoek van het
Onderwijs opgericht, na uitvoerige discussie over de vraag of deze
stichting moest worden gezien als een adviesorgaan of als een beleidsor-
gaan. De spanning tussen deze beide insteken, met als kernvraag hoe
onafhankelijk het door het ministerie gefinancierde onderzoek mocht
zijn, heeft SVO gedurende zijn hele bestaan achtervolgd.
Het SVO-tijdperk
De Stichting voor Onderzoek van het Onderwijs had als doelstelling het
bevorderen van onderzoek met betrekking tot het onderwijs. Dit hield in
het steunen, doen uitvoeren, coördineren en anderszins bevorderen van
wetenschappelijk onderzoek met betrekking tot het onderwijs. Later
kwam daar bij het publiek maken van onderzoeksresultaten door het
verspreiden van persberichten, brochures en (vanaf 1970) het nog steeds
Ministerie van Onderwijs, Cultuur en Wetenschap Essaybundel Bewezen Beleid in het Onderwijs | 13
florerende maandblad Didaktief. SVO mocht dus zelf géén onderzoek
uitvoeren. Men hield zich bezig met programmering, financiering en
disseminatie van onderzoek. De uitvoering van het onderzoek geschiedde
overwegend door de aan SVO gelieerde para –universitaire instituten zoals
ITS, SCO- Kohnstamm Instituut, RION (later GION), ISOR, LISBO en door
universitaire vakgroepen. De werkwijze van SVO werd in de loop der jaren
regelmatig bijgesteld.
■■ speciaal onderwijs
14 | Essaybundel Bewezen Beleid in het Onderwijs Ministerie van Onderwijs, Cultuur en Wetenschap
■■ hoger onderwijs en lerarenopleidingen
■■ volwasseneneducatie/levenslang leren
■■ gelijke-kansenonderwijs (incl. emancipatie-onderwijs)
■■ onderwijswetgeving en bestuur
Ministerie van Onderwijs, Cultuur en Wetenschap Essaybundel Bewezen Beleid in het Onderwijs | 15
beleid soms frustreerde. Per 1 december 1996 kwam er daarom een einde
aan deze fase in het onderwijsonderzoek
De post-SVO periode
De beschikbare gelden voor onderzoek werden vanaf 1997 op een nieuwe
manier verdeeld. Daarbij werd de bij SVO gehanteerde verdeling over
beleidsonderzoek, veldonderzoek en fundamenteel onderzoek aan
gehouden. Het grootste deel van de middelen ging naar NWO, de
Nederlandse Organisatie voor Wetenschappelijk Onderzoek.
De Programmaraad voor Onderwijsonderzoek (NWO/PROO) werd
opgericht om fundamenteel onderwijsonderzoek te programmeren en tot
uitvoering te brengen. De keuze van programmalijnen komt tot stand na
overleg met wetenschappers, het onderwijsveld en het ministerie.
Vervolgens wordt voor elke programmalijn een kader uitgewerkt waarbin-
nen universitaire wetenschappers een onderzoeksplan kunnen indienen.
Uit een recente evaluatie van de PROO blijkt dat de universitaire vak
groepen onderwijskunde zeer geprofiteerd hebben van de werkwijze van
de PROO. Hun productie is voor een groot deel gebaseerd op de onder-
zoekssubsidies die zij via de PROO hebben verworven (NWO/PROO, 2009).
Ook het meer beleidsgerichte onderzoek voor het primair onderwijs werd
ondergebracht bij NWO onder de titel BOPO (Beleidsgericht Onderwijs
onderzoek Primair Onderwijs). De BOPO programmeert onderzoek op een
aantal beleidsterreinen van het primair onderwijs. Men laat hiervoor
programma’s schrijven door onderzoekers, die worden aanbesteed bij
vooral universitaire onderzoeksinstituten. Voor de periode 2009-2012
heeft de BOPO ook de opdracht om het evaluatieonderzoek naar de
hoofdlijnen van het beleid voor het primair onderwijs te programmeren,
te doen uitvoeren, te begeleiden en te communiceren.
Bij de opheffing van SVO ging verder een deel van het geld terug naar het
ministerie voor beleidsonderzoek en werd een deel beschikbaar gesteld
aan de Landelijke Pedagogische Centra. De KPC Groep is belast met de
dagelijkse uitvoering. Er worden in dit kader onderzoeksvragen geïnventa-
riseerd bij scholen, waarna een kaderplan en onderzoekprogramma wordt
geformuleerd. De onderzoeksopdrachten worden, in samenwerking met
de betreffende scholen, uitgevoerd door geselecteerde onderzoekinstitu-
ten. Jaarlijks kunnen tot 1 september hier aanvragen voor onderzoek
worden ingediend.
In een brief aan de Tweede Kamer van 12 juni 2009 maakt de minister het
voornemen bekend om naar aanleiding van de evaluatie van de PROO het
convenant met NWO per 1 januari 2010 aan te passen en daarnaast de hele
sector van het onderwijsonderzoek in kaart te laten brengen. Het gaat er
16 | Essaybundel Bewezen Beleid in het Onderwijs Ministerie van Onderwijs, Cultuur en Wetenschap
daarbij om zowel de wetenschappelijke waarde van de onderwijsweten-
schappen als geheel in kaart te brengen als ook de maatschappelijke
waarde. Dit moet leiden tot een sectorplan onderwijsonderzoek.
1.3.1 Achterstandenbeleid
De landelijke evaluatie van het onderwijsvoorrangsbeleid vond plaats van
augustus 1986 tot medio 1997. Dit evaluatieprogramma was met een
jaarlijks budget van anderhalf miljoen gulden in die periode een van de
meest omvangrijke in de sociale sector. Aanleiding tot de inrichting van
een zo omvangrijke evaluatie was de politieke discussie over de voortzet-
ting van het onderwijsachterstandenbeleid in de jaren 1984 tot 1986. Na
ampele overwegingen werd besloten dit beleid in vernieuwde vorm voort
te zetten, maar om het daarbij wel te doen vergezellen door een stevige
evaluatie. Hoewel de evaluatie in 1997 werd beëindigd, zijn belangrijke
onderdelen tot op heden nog operationeel. De cohortstudies die werden
opgezet in het evaluatieprogramma als LEO (landelijke evaluatie
onderwijsvoorrangsbeleid)-cohorten zijn later in de vorm van de PRIMA-
cohorten en nu als ‘Cool 5-18 cohort’ nog steeds terug te vinden. In de
oorspronkelijke LEO- cohorten werden jaarlijks 40.000 kinderen in groep
vier, zes en acht van de basisschool getoetst op taal en rekenen en gevolgd
in hun schoolloopbaan. Een aansluitend cohort was er voor het voortgezet
Ministerie van Onderwijs, Cultuur en Wetenschap Essaybundel Bewezen Beleid in het Onderwijs | 17
onderwijs. De ontwikkeling van kinderen uit de doelgroepen van het
beleid, zowel autochtone als allochtone achterstandsleerlingen, kon zo
worden gevolgd, vergeleken met die van andere kinderen en gerelateerd
aan factoren variërend van de inzet van faciliteiten in de scholen tot de
kwaliteit van de leerkracht en het ondersteunend gedrag van ouders in de
thuissituatie.
18 | Essaybundel Bewezen Beleid in het Onderwijs Ministerie van Onderwijs, Cultuur en Wetenschap
rangsbeleid of om de vrijblijvendheid bij de inzet van middelen te
beperken, werden vrijwel jaarlijks vruchteloos herhaald. Op andere
punten volgde het beleid wel de evaluatie.
laten zien dat in deze periode nog slechts tien tot 15% van de leerkrach-
ten en directeuren in het basisonderwijs hier belang aan hechtte.
■■ Grotendeels ongedaan maken van een grote bezuiniging op het beleid
Ministerie van Onderwijs, Cultuur en Wetenschap Essaybundel Bewezen Beleid in het Onderwijs | 19
leerlingen hun achterstand enigszins inlopen. Helaas geldt dat niet voor
de autochtone leerlingen (Mulder e.a., 2005).
20 | Essaybundel Bewezen Beleid in het Onderwijs Ministerie van Onderwijs, Cultuur en Wetenschap
werd niet gevonden, wel samenhang in leerjaren met jonge leerlingen
(Bosker, Blatchford & Meijnen, 1999)1.
Ministerie van Onderwijs, Cultuur en Wetenschap Essaybundel Bewezen Beleid in het Onderwijs | 21
zouden moeten krijgen. De oormerking van de middelen, zoals door de
commissie Van Eijndhoven voorgesteld, zou daarop een te forse inbreuk
betekenen. Niet verwonderlijk is daarom vier jaar later ook de oormerking
voor de onderbouw geheel losgelaten.
22 | Essaybundel Bewezen Beleid in het Onderwijs Ministerie van Onderwijs, Cultuur en Wetenschap
prestaties lost in groep drie weer op, maar roept wel de vraag op hoe de
extra hulp beter benut zou kunnen worden. Zeer kleine en zeer ‘zwarte’
scholen waren niet in dit onderzoek meegenomen.
Ook dit onderzoek geeft in strikte zin geen antwoord op de effecten van
het uitgevoerde beleid als het gaat om het didactisch handelen van de
leerkracht en de leeropbrengsten. Een experimentele opzet met variatie in
modellen van formatie-inzet had ook hier meer inzicht kunnen opleveren.
Bosker en Meijnen hebben in 1997 daartoe een onderzoeksvoorstel bij het
ministerie van OCW ingediend. Honorering van het voorstel zou wel
inhouden dat de landelijke uitrol van het beleid met minimaal twee jaar
zou moeten worden opgeschort. Het voorstel heeft in de besluitvorming
nooit een rol gespeeld.
Ministerie van Onderwijs, Cultuur en Wetenschap Essaybundel Bewezen Beleid in het Onderwijs | 23
1.4 Slot
Het meest opvallende aan de kennisketen in de onderwijssector is
versnippering. Subsidies voor onderzoek worden door de rijksoverheid bij
veel instellingen ondergebracht, terwijl de overheid ook in toenemende
mate optreedt als directe financier. De onderlinge afstemming qua
programmering is miniem en ook de procedures voor het verwerven van
subsidies door onderzoeksinstellingen of onderwijsinstellingen variëren
zeer evenals de kwalitatieve eisen waaraan onderzoeksvoorstellen moeten
voldoen.
Uiteraard zijn met een betere organisatie de problemen met betrekking tot
de inhoudelijke versterking van de schakels in de kennisketen nog niet
opgelost. Maar die verantwoordelijkheid ligt dan voor een belangrijk deel
bij actoren in het onderwijsveld waartoe zowel universitaire onderzoekers
en adviseurs uit de infrastructuur als sectorraden en schoolbesturen
horen.
24 | Essaybundel Bewezen Beleid in het Onderwijs Ministerie van Onderwijs, Cultuur en Wetenschap
Literatuur
Appelhof, P. H. van Gennip, W. de Geus, E. Jacobs, L. Mulder, L. van Tilborg, W. de Wit (1997).
En toen was het OVB er niet meer… Utrecht, Sardes.
De Boer, Y (2009). Onderwijs onderzocht, 12,5 jaar PROO. Den Haag; NWO.
Broekkamp. H, R. Vanderlinde, B.H.A.M. Van Hout-Wolters en J. Van Braak (2009). De relatie
tussen onderwijsonderzoek en onderwijspraktijk verkend in Nederland en Vlaanderen.
Pedagogische Studiën, 86, (4), 313-320.
Chelimsky, E. (1987). What have we learned about the politics of program evaluation, in:
Educational evaluation and policy analysis, 9, (3), 199-213.
Creemers. B. en W. Hoeben (1984). Onderzoek tussen onderwijsontwikkeling en weten-
schapsontwikkeling, Den Haag; SVO.
Kemenade, J.A. van (1979). Onderwijsresearch en onderwijsbeleid. In: J.A. van Kemenade,
Als de smalle weegbree bloeit. Opstellen over onderwijs en onderwijsbeleid. Amsterdam: Bert
Bakker.
Kemenade, J.A. van, N. van Lagerweij, J. Leune, J. Ritzen (1986). Onderwijs bestel en beleid 1.
Groningen: Wolters-Noordhoff.
Ministerie van OCW (1996). Groepsgrootte in onderbouw maximaal 25; bovenbouw 34.
Persbericht 22-1-1996. Directie Communicatie.
Ministerie van OCW (2003). Tiende voortgangsrapportage ‘Groepsgrootte en kwaliteit’. Den
Haag: Ministerie van OCW.
Ministerie van OCW (2009). Brief aan de Tweede Kamer in zake onderwijsonderzoek, ref
128984. Den Haag, SDU.
Mulder, L., J. Roeleveld, I. van der Veen en H. Vierke (2005). Onderwijsachterstanden tussen
1988 en 2002. Ontwikkelingen in basis- en voortgezet onderwijs. Nijmegen: ITS/SCO-
Kohnstamm Instituut.
NWO-PROO (2009). Onderwijs onderzocht. Den Haag: NWO.
Tromp, H. (1997). Opkomst en teloorgang van een instituut, dertig jaar SVO. In: G. Kerkvliet &
F. Vanderwilt, Terugblik op dertig jaar SVO. Den Haag: SVO.
Vanderwilt, F. (1996). Evaluatie onderwijsvoorrangsbeleid, In: G. Kerkvliet & F. Vanderwilt,
Terugblik op dertig jaar SVO. Den Haag: SVO.
Vereniging de Samenwerkende Landelijke Pedagogische Centra (2008). De R&D-functie van
de LPC in het kader van de SLOA. ‘s-Hertogenbosch: KPC.
Weiss, C. (1980). Social Science Research and Decisionmaking. New York: Columbia University
Press.
Ministerie van Onderwijs, Cultuur en Wetenschap Essaybundel Bewezen Beleid in het Onderwijs | 25
02
Experimentele
designs in
onderwijs
onderzoek
Roel Bosker
Hoogleraar onderwijskunde, RUG - TIER
26 | Essaybundel Bewezen Beleid in het Onderwijs Ministerie van Onderwijs, Cultuur en Wetenschap
2.1 Het “echte” experiment
In de Nederlandse onderwijswetgeving komt ook de Experimentenwet
onderwijs voor. Het cruciale deel bestaat uit lid 1 van artikel 2 uit die wet
en luidt: “Indien het bevoegd gezag bij wijze van experiment onderwijs
wenst te geven dat valt buiten de kaders van de afzonderlijke onderwijs-
wetten, kan Onze minister beslissen dat dit onderwijs uit de openbare kas
wordt bekostigd.” Onze zuiderburen hebben het over proeftuinen in plaats
van experimenten, en de discussie over het gebruik van experimenten in
het onderwijsonderzoek zou er sterk bij gebaat zijn als we de
Experimentenwet zouden omdopen in een Proeftuinenwet. Waarom?
Omdat met de wet wordt gedoeld op een “proefneming om nieuwe
werkwijzen, inrichtingen, enz. te proberen”, zoals de Van Dale de tweede
betekenis van het woord experiment omschrijft, en volwassenen en
kinderen die deel uitmaken van zo’n experiment zijn proefkonijnen in een
proeftuin.
Ministerie van Onderwijs, Cultuur en Wetenschap Essaybundel Bewezen Beleid in het Onderwijs | 27
rekenonderwijs te verzorgen zullen de leerlingen in staat zijn een hoog
rekenvaardigheidsniveau te bereiken. De leerlingen hebben een hoog
rekenvaardigheidsniveau, dan moet de leraar op adequate wijze het
rekenen onderwezen hebben. Als A een voldoende voorwaarde is voor B
dan geldt dat als A optreedt ook B zal optreden. Maar het is in dit geval niet
zo dat als B optreedt ook A het geval moet zijn. Bijvoorbeeld: als een
leerling dag in dag uit gepest wordt zal hij zich onzeker voelen. De leerling
wordt continu gepest, dan zal hij zich onzeker voelen. Maar niet elke
leerling die zich onzeker voelt is continu gepest. Nu was dit een negatief
voorbeeld, maar we zijn natuurlijk op zoek naar voldoende voorwaarden
voor een positieve ontwikkeling van leerlingen. Om te kunnen vaststellen
of A een voldoende voorwaarde voor B is kunnen we te werk gaan via de
methode van de counterfactual. We creëren een situatie waar A niet wordt
toegepast. Als dan toch B optreedt, weten we dat A niet een voldoende
voorwaarde voor B was. Zie hier het idee van het experiment: een
controlegroep die niet de interventie ondergaat.
28 | Essaybundel Bewezen Beleid in het Onderwijs Ministerie van Onderwijs, Cultuur en Wetenschap
Om over causaliteit te kunnen spreken is het wezenlijk dat:
1. de oorzaak A (de leerkracht doet zus) vooraf gaat aan het gevolg B
(de leerling ontwikkelt zich zo);
2. variaties in de oorzaak A samenhangen met variaties in het gevolg B;
3. er geen andere oorzaken voor het betreffende gevolg B zijn aan te
wijzen.
Het is met name de laatste voorwaarde die het experiment tot de gouden
standaard verheft: geen enkel ander type onderzoeksontwerp kan zo goed
aan die voorwaarde voldoen. De reden daarvoor is, dat alleen in het
experiment de onderzoeker én controle over de toewijzing van proefper-
sonen (bijvoorbeeld leerlingen, leraren) aan de condities én over de
condities zelf heeft. Hij zorgt ervoor dat de te vergelijken groepen
equivalent zijn, zodat alle verschillen na afloop van het experiment alleen
nog maar te maken kunnen hebben met verschillen tussen de condities.
En omdat de onderzoeker de experimentele en controleconditie zelf in de
hand heeft, manipuleert hij zelf de onafhankelijke variabele – de oorzaak
– in zijn onderzoek. In onderstaande tabel wordt dit schematisch
weergegeven:
Ministerie van Onderwijs, Cultuur en Wetenschap Essaybundel Bewezen Beleid in het Onderwijs | 29
Er zijn nog drie belangrijke randvoorwaarden: de deelnemende leerlingen
mogen niet weten dat ze meedoen aan een experiment (anders gaan ze
zich wellicht anders gedragen dan ze normaal zouden doen). Ook de
“testleiders” - in dit geval degenen die de leerlingen aan het werk zetten
met de computer respectievelijk het leerboek - mogen dit niet weten. Dit
wordt het “dubbel-blind” principe genoemd. Voorts geldt dat elke leerling
volstrekt individueel en ongestoord bezig is. Dit laatste heeft met de
controle over de experimentele conditie te maken. Alleen het aldus
opgezette experiment kan uitsluitsel geven over oorzaak-gevolg relaties:
dat leerlingen in de experimentele groep zitten (en niet in de controle-
groep) is de enige reden dat de leerlingen anders zullen scoren op een
testje dat na afloop van het onderzoek wordt afgenomen. In onderstaande
figuur wordt schematisch de opzet van het experiment weergegeven.
onderzoeker die controleert. Als er al iets bijzonders gebeurt dan zal het
evenzeer de proefpersonen in de controlegroep betreffen als in de
interventieconditie.
■■ door de randomisatieprocedure weten we dat de interventie- en
30 | Essaybundel Bewezen Beleid in het Onderwijs Ministerie van Onderwijs, Cultuur en Wetenschap
Dan zijn er nog een reeks bedreigers van de interne validiteit die in het
experiment evenzo goed als in het quasi-experiment, gecontroleerd
worden, zoals rijping (tussen het begin en het eind van het onderzoek
ontwikkelen de leerlingen zich sowieso, en dat is op zich geen gevolg van
de interventie) of regressie-naar-het-gemiddelde (laagpresteerders gaan
gemiddeld genomen vooruit en hoogpresteerders achteruit omdat testen
nooit perfect betrouwbaar zijn – dit verschijnsel treedt met name op als
men geïnteresseerd is in extreme groepen leerlingen, zoals zorgleerlingen
of hoogbegaafden). Deze bedreigers spelen daarom geen rol, omdat ze in
dezelfde mate in de interventie- en de controlegroep voorkomen.
2.3 De rol van het experiment bij de gang naar meer evidence
based onderwijs
Om te verhelderen wat de rol van het experiment is bij de lange weg naar
meer evidence based onderwijs, is het allereerst van belang soorten kennis te
onderscheiden, althans onderscheiden naar type onderzoek dat is ingezet
om tot die kennis te komen (Onderwijsraad, 2006). Daarbij kan Figuur 2
behulpzaam zijn.
1 2 3 4 5 6 7 8
Ministerie van Onderwijs, Cultuur en Wetenschap Essaybundel Bewezen Beleid in het Onderwijs | 31
In de figuur wordt kennis weergegeven als een proces van stapeling. Links
onderaan de berg staat het beginpunt: de praktijkkennis (1), soms vaak
impliciete kennis van de leraar, die bijvoorbeeld de groep klein probeert te
houden omdat hij daarmee de meest positieve ervaringen heeft. Dan volgt
de kennis die we opdoen uit gevalsstudies (2) waarbij één of enkele
onderwijspraktijken systematisch worden onderzocht. Zo kan bijvoor-
beeld het onderwijs in een wat grotere klas vergeleken worden met een
wat kleinere. Men zou kunnen zeggen dat dit onderzoek geen wetenschap-
pelijk kennis oplevert, maar in de fase van het doen van ontdekkingen en
het opperen van theorieën waarmee een en ander verklaard zou kunnen
worden – ook wel de context of discovery genoemd – hoeven minder harde
eisen aan het onderzoek te worden gesteld.
32 | Essaybundel Bewezen Beleid in het Onderwijs Ministerie van Onderwijs, Cultuur en Wetenschap
context of justification genoemd. Hier worden harde eisen gesteld aan
transparantie, betrouwbare en valide metingen en repliceerbaarheid. Toch
zijn we nog niet op de top van de berg, want daar bevindt zich de review en
de meta-analyse (8): de samenvatting van wat al het onderzoek op het
betreffende terrein ons leert (zie bijvoorbeeld: Hattie,2009). Daarvoor
geldt overigens: de kwaliteit van de onderzoeken die in zo’n meta-analyse
worden samengebald, bepalen de kwaliteit van de meta-analyse. Een
review van 10 gevalsstudies is natuurlijk minder waard dan een meta-ana-
lyse van 10 echte experimenten.
Men zou de weg naar het eerste experiment als een ontwikkelingstraject
(research & development) kunnen zien (cf Raudenbush, 2005), waarbij
kleinschalig proeftuinen worden ingericht op basis van theoretische en/of
praktische inzichten. Dan volgt er kleinschalig kwalitatief of kwantitatief
onderzoek naar de effecten van de innovatie, gevolgd door een quasi-
experiment. De onderzoeker gaat vervolgens de implementatiecondities
nauwkeurig uitwerken (bijvoorbeeld dat leerkrachten extra scholing
behoeven om een en ander goed uit te kunnen voeren) en de innovatie
wordt opgeschaald. Tenslotte kan een grootschalig experiment plaatsvin-
den om te bepalen of de innovatie het gewenste effect bij leerlingen
teweeg brengt. Dat het bij innovaties zo hoort te gaan, is ook de zienswijze
die door de commissie Dijsselbloem is ontvouwd (Commisie Parlementair
Onderzoek Onderwijsvernieuwingen, 2008).
Ministerie van Onderwijs, Cultuur en Wetenschap Essaybundel Bewezen Beleid in het Onderwijs | 33
34 | Essaybundel Bewezen Beleid in het Onderwijs Ministerie van Onderwijs, Cultuur en Wetenschap
resultaten kunnen dan geheel en al afhankelijk zijn van de eigenschappen
van die twee leraren en hun klassen. Verder kan natuurlijk nooit het
dubbel-blind principe worden toegepast: in elk geval de leraren, maar ook
de leerlingen, zullen weten dat ze deel uitmaken van een experiment. En
nu zullen de leerlingen niet meer individueel ongestoord, maar in een
groep leren. Voorts zal het wenselijk zijn om toch ook maar een voortoets
af te nemen om enerzijds na te kunnen gaan of de groepen echt equivalent
zijn en anderzijds om te kunnen onderzoeken of het experiment anders
uitpakt voor leerlingen die verschillend scoren op de voortoets (meestal
treden de gunstigste effecten op voor initiële laagpresteerders).
Bijkomend voordeel is dat als onderweg leerlingen om wat voor reden dan
ook uitvallen, we na kunnen gaan of de uitval in de interventiegroep
anders is dan in de controlegroep. Tenslotte zullen we de controlegroep
niet verstoken kunnen laten van onderwijs: deze leerlingen zal in elk geval
de staande praktijk moeten worden aangeboden. In onderstaande figuur
wordt de opzet van dit onderzoek weergegeven.
Ministerie van Onderwijs, Cultuur en Wetenschap Essaybundel Bewezen Beleid in het Onderwijs | 35
3. Geen systematische verschillen tussen de experimentele en de
controlegroep
4. Valide en betrouwbaar gemeten uitkomstmaten
5. (Bijna) geen experimentele “sterfte”, dat wil zeggen uitval
6. Rapportage van effecten bij afgebroken behandeling
7. Rapportage van lange termijn effecten: beklijven effecten?
8. Rapportage van de grootte van het effect en significantie-niveaus
9. Rapportage van differentiele effecten
10.Rapportage van alle effecten (ook negatieve en non-effecten).
In het verlengde van het ethische bezwaar vraagt men zich af hoe je
scholen bereid kunt vinden om in de controlegroep plaats te nemen. Ik zie
twee oplossingen: het werken met wachtlijsten waarbij scholen pas na een
tijd als controleschool te hebben gefunctioneerd de interventie mogen
gaan toepassen (bijv. Bosker, Branderhorst, & Visscher, 2007). Of het
gebruik van een crossover design: de groep scholen die bijvoorbeeld met de
jongste leerlingen in de interventieconditie zit, vormt met oudere
leerlingen de controleconditie en voor een andere groep scholen geldt het
omgekeerde (bijv. Borman et al, 2005, 2007).
Dan bepleit men het belang van procesgerichte causaliteit (waarom werkt
iets?) boven dat van de productgerichte causaliteit (dat het werkt).
Daarover kan ik kort zijn: wie is er nu geïnteresseerd in hoe iets werkt als
het niet werkt?
Verder wijst men op het probleem van de early adopters: de interventie werkt
wellicht alleen bij de eerste groep leraren die er in het kader van het
experiment enthousiast mee aan de slag zijn gegaan. Of het ook bij andere
36 | Essaybundel Bewezen Beleid in het Onderwijs Ministerie van Onderwijs, Cultuur en Wetenschap
leraren gaat werken blijft de vraag. Dit probleem verwijst naar het meer
algemene probleem waar ook een experiment zonder dubbel-blind
procedures niet tegen opgewassen is: het mogelijk optreden van
Hawthorne-effecten (enthousiaste leraren in de interventieconditie). Op
dit bezwaar heb ik maar één reactie: de hoop dat de beroepseer van de
leraren hen ertoe zal brengen om ook met enthousiasme, in het belang
van hun leerlingen, met de bewezen effectieve innovatie aan de slag te
gaan.
Ministerie van Onderwijs, Cultuur en Wetenschap Essaybundel Bewezen Beleid in het Onderwijs | 37
Literatuur
Borman, G. D., Slavin, R. E., Cheung, A., Chamberlain, A. M., Madden, N. A., & Chambers, B.
(2005). Success for All: First-year results from the national randomized field trial.
Educational Evaluation and Policy Analysis, 27, 1-22.
Borman, G. D., Slavin, R. E., Cheung, A., Chamberlain, A. M., Madden, N. A., & Chambers, B.
(2007). Final reading outcomes of the national randomized field trial of success for all.
American Educational Research Journal, 44, 701-731.
Bosker, R. J. (2008a). Naar meer evidence based onderwijs! Pedagogische Studiën, 85, 49-51.
Bosker, R. J. (2008b). Tripliek: een onnodig gecompliceerde voorstelling van zaken.
Pedagogische Studiën, 85, 305-308.
Bosker, R. J., Branderhorst, E. M., & Visscher, A. J. (2007).Improving the utilisation of
management information systems in secondary schools. School Effectiveness and School
Improvement, 18, 451-467.
Coalition for Evidence Based Policy (2003). Identifying and implementing educational
practices supported by rigorous evidence: A user friendly guide. Washington: United States
Department of Education.
Commisie Parlementair Onderzoek Onderwijsvernieuwingen (2008). Tijd voor onderwijs.
Eindrapport. Den Haag: SDU.
Finn, J. D., & Achilles, C. M. (1990). Answers and questions about class size: A statewide
experiment. American Educational Research Journal, 27, 557–577.
Gravemeijer, K. P. E., & Kirschner, O. A. (2007). Naar meer evidence based onderwijs?
Pedagogische Studiën, 84, 463-471.
Gravemeijer, K. P. E., & Kirschner, O. A. (2008). Dupliek: een te simpele voorstelling van zaken.
Pedagogische Studiën, 85, 195-197.
Hattie, J. (2009). Visible learning. A synthesis of over 800 meta-analyses relating to
achievement. Londen: Routledge.
Luyten, H. (2006). Het effect van een jaar onderwijs op de wiskundeprestaties in groep 5 en 6
en de verschillen tussen scholen. Pedagogische Studiën, 83(6), 432-451.
Mackie, J. L. (1974). The cement of the universe: A study of causation. Oxford: Oxford
University Press.
Onderwijsraad (2006). Naar meer evidence based onderwijs. Den Haag: Onderwijsraad.
Raudenbush, S. W. (2005). Learning from attempts to improve schooling: The contribution of
methodological diversity. Educational Researcher, 34(5), 25-31.
Rubin, D. B. (1974). Estimating causal effects of treatments in randomized and nonrandomi-
zed studies. Journal of Educational Psychology, 66, 688-701.
Shadish, W. R., Cook, T. D., & Campbell, D. T. (2002). Experimental and quasi-experimental
designs for generalized causal inference. Boston / New York: Houghton Mifflin company.
38 | Essaybundel Bewezen Beleid in het Onderwijs Ministerie van Onderwijs, Cultuur en Wetenschap
Ministerie van Onderwijs, Cultuur en Wetenschap Essaybundel Bewezen Beleid in het Onderwijs | 39
03
Kwalitatieve
methoden in
onderwijs
onderzoek
Lennart Vriens
Emeritus-hoogleraar vredespedagogiek, UU
40 | Essaybundel Bewezen Beleid in het Onderwijs Ministerie van Onderwijs, Cultuur en Wetenschap
3.1 Inleiding
In 1976 publiceerde de Groningse hoogleraar Noordam een kritisch artikel
over de nieuwe discipline onderwijskunde. Hij stelde dat deze zich steeds
meer ontwikkelde tot een systeem van lege codes waarmee onderwijskun-
digen wel met elkaar communiceerden, maar dat nog nauwelijks sloeg op
de praktijk waarover het pretendeerde te gaan. Noordams kritiek was
wellicht kort door de bocht, maar wel interessant. Ze illustreert een aantal
problemen als een wetenschap tegelijkertijd academische aspiraties heeft
en de pretentie een bijdrage te leveren aan verbeteringen van een
cultureel-maatschappelijke praktijk.
Ministerie van Onderwijs, Cultuur en Wetenschap Essaybundel Bewezen Beleid in het Onderwijs | 41
schappen, inclusief de onderwijskunde. Belangrijke argumenten voor deze
keuze zijn de gepretendeerde exactheid en geldigheid van resultaten, de
universele toepasbaarheid en de methodische helderheid. Op deze punten
scoren de kwalitatieve onderzoeksmethoden aanzienlijk minder en dat
betekent dat de onderwijskundig onderzoeker die zich van kwalitatieve
methoden wil bedienen, deze keuze uitgebreid moet motiveren en merkt
dat zijn onderzoek in veler ogen minder status heeft.
In de jaren tachtig begon weliswaar een revival van kwalitatieve onder-
zoeksmethoden en internationaal lijken deze inmiddels weer volkomen
geaccepteerd (Kelchtermans, 2002), maar deze trend lijkt aan de
Nederlandse onderwijskunde te zijn voorbijgegaan. Kwantitatief onder-
zoek is dominant, kwalitatief onderzoek wordt weliswaar niet categorisch
afgewezen, maar bijna altijd speelt de (on)uitgesproken vraag of er toch
niet beter een kwantitatief onderzoek had kunnen plaatsvinden. Een korte
schets van de ontwikkeling van de onderwijskunde kan duidelijk maken
hoe dit gekomen is.
42 | Essaybundel Bewezen Beleid in het Onderwijs Ministerie van Onderwijs, Cultuur en Wetenschap
het ware smeekten om nieuwe leertheorieën en daarvoor benodigd
onderzoek. Die kwamen er ook, de cognitivistische psychologie werd
verdrongen door het constructivisme en coöperatief leren werd een nieuw
speerpunt in het onderzoek. Maar ook veel van deze onderzoeken waren
meer gericht op de hoe-vragen van de kunde dan op de wat- en waarom-
vragen van de wetenschap. In opzet en uitvoering waren ze vooral geënt
op kwantitatief onderzoek met eventueel kwalitatieve elementen, waarbij
veelal de methodologische eisen van de kwantitatieve methoden norma-
tief bleven.
Ministerie van Onderwijs, Cultuur en Wetenschap Essaybundel Bewezen Beleid in het Onderwijs | 43
problemen. Onderzoek is dan bedoeld om een bijdrage te leveren aan
verbetering van of binnen de praktijk. Uiteraard is deze tweedeling niet
absoluut; in de meeste wetenschappen vullen menselijke weetgierigheid
en praktische intentie elkaar aan en worden de onderlinge verhoudingen
in de praktijk van de betreffende discipline bepaald. Daarmee wordt tevens
bepaald wat de in onderzoek opgedane kennis binnen de betreffende
discipline waard is, meestal in termen van waarheid en bruikbaarheid.
Grofweg kunnen we stellen dat naarmate een wetenschappelijke discipline
meer gestuurd wordt vanuit weetgierigheid, men zich meer richt op het
criterium waarheid en dat in wetenschappen waar het vooral gaat om
oplossing van ‘praktische’ problemen, relevantie en bruikbaarheid een
grotere rol spelen.
vormgegeven;
■■ Mogelijkheden tot verbetering van bestaande onderwijsstructuren en
44 | Essaybundel Bewezen Beleid in het Onderwijs Ministerie van Onderwijs, Cultuur en Wetenschap
veranderingen. De vraag hoe onderwijskunde als wetenschap zich tot deze
complexiteit verhoudt, bepaalt in belangrijke mate de keuze van onder-
zoeksvragen en -methodes.
In principe is deze gang van zaken ook bij kwantitatief onderzoek terug te
vinden, maar in de familie van kwalitatieve onderzoekstechnieken gaat
het niet om het vinden van ‘wetmatigheden’, maar om het zo volledig
mogelijk begrijpen van fenomenen in hun context. Daarom is er veel
aandacht voor het particuliere, dat dan echter wel in zijn context moet
worden begrepen. De aandacht voor interpretatie komt voort uit de wens
tot de betekenis van fenomenen door te dringen. Om deze reden wordt
ook wel voorgesteld de term kwalitatief onderzoek te vervangen door de
term interpretatief onderzoek ( Levering & Smeyers 2003, p. 25), mede
omdat ook kwantitatief onderzoek van goede kwaliteit kan zijn. Echter,
taal laat zich slechts zelden dwingen door wetenschappelijke normen en
dat is zelfs het geval voor wetenschappelijke taal. Ook het voorstel om te
Ministerie van Onderwijs, Cultuur en Wetenschap Essaybundel Bewezen Beleid in het Onderwijs | 45
spreken van ‘fixed designs’ tegenover ‘flexible designs’ (Robson 2002, p.
XII) heeft weinig navolging gevonden.
46 | Essaybundel Bewezen Beleid in het Onderwijs Ministerie van Onderwijs, Cultuur en Wetenschap
met erkenning van de vakkennis als onmisbaar element van de identiteit
en bekwaamheden van leraar, kunnen wijzen op het gegeven dat goed
leraarschap een combinatie is van zaken als vakkennis, beschikbaarheid
als identificatiemodel (ook moreel), pedagogische bekwaamheden om de
leerling uit te dagen, ontwikkelingspsychologische kennis van de
leeftijdsgroep waaraan men les geeft, en bewaker van de leerprocessen
van leerlingen. Dan had men in plaats van alle nadruk op het ‘nieuwe
leren’ te leggen op een beargumenteerde wijze een middenweg kunnen
bereiken tussen de noodzaak om (basis)kennis te oefenen en ruimte
krijgen om tot zelfstandig ontdekkend leren te komen. Want de construc-
tivistische opvattingen die men in de onderwijskunde voor dat laatste te
hulp roept, stellen de epistemologische theorie van het constructivisme te
vaak bijna naadloos gelijk aan de leerpsychologie en de didactiek, wat
sympathiek klinkt maar analytisch rammelt (Vriens 2007, p. 63).
Kwalitatief onderzoek is echter niet alleen van belang voor een kritische
analyse en verantwoording van doelstellingen in relatie tot beleid en
cultuur. Het kan bijna niet gemist worden waar de subjectiviteit in het veld
tot haar recht moet komen. Dat is bijvoorbeeld het geval bij de pedagogi-
sche dimensie van de schoolpraktijk, wanneer men inzicht wil krijgen in
de belevingswereld van kinderen en jongeren zonder deze al bij voorbaat
vanuit theoretische categorieën te beschrijven. In zo’n geval kan bele-
vingsonderzoek vanuit een fenomenologisch-hermeneutische traditie tot
belangrijke inzichten leiden, al moet men voorzichtig zijn met
generaliseren.
Maar het hoeft niet alleen om kinderen en jongeren te gaan. Van Manen
(1990; 1991) gebruikte belevingsonderzoek in de opleiding van leer-
Ministerie van Onderwijs, Cultuur en Wetenschap Essaybundel Bewezen Beleid in het Onderwijs | 47
krachten om ze hun pedagogische invloed en verantwoordelijkheid te
laten ontdekken. Ook de biografische of narratieve methoden
(Kelchtermans1994; Richardson 1996) en diverse vormen van beschrij-
vende en interpreterende casestudies (Barritt, 1996) plaatsen zich bewust
in de praktijk die ze willen begrijpen en optimaliseren. Empirie is hierbij
geen objectieve informatie die door een buitenstaander geleverd wordt,
maar contextueel en met de dynamiek van de eigen situatie en gedeelde
belevingswereld verbonden. Ofwel, men onderzoekt om inzicht te
verkrijgen in de veranderingsprocessen waar men zelf in zit en waarvan
het onderzoek deel uitmaakt. Dat betekent dat men niet kan toetsen, maar
wel dat men de ontwikkelingen zo goed mogelijk in kaart brengt en
verantwoordt hoe men aan zijn gegevens gekomen is.
3.5 Slot
Onderwijs is een cultureel-maatschappelijke institutie die bedoeld is om
mensen te helpen beter hun weg te vinden in samenleving en cultuur.
Onderwijsresearch maakt daar deel van uit, maar probeert op zo goed
mogelijke en wetenschappelijk verantwoorde wijze een bijdrage te leveren
aan de kennis van dit veld. De veelheid aan vragen die in dit veld leven kan
niet alleen met de bekende kwantitatieve methoden gedekt worden, voor
een aantal vragen is kwalitatief onderzoek meer geëigend. Binnen de
familie van kwalitatieve onderzoeksmethoden liggen de spelregels
hiervoor niet volledig vast, maar is de onderzoeker wel gehouden aan
intellectuele integriteit en het zo goed mogelijk verantwoorden van de
door hem gebruikte procedures. Anders kan de relevantie van onderzoek
nooit beoordeeld worden.
48 | Essaybundel Bewezen Beleid in het Onderwijs Ministerie van Onderwijs, Cultuur en Wetenschap
Literatuur
Ministerie van Onderwijs, Cultuur en Wetenschap Essaybundel Bewezen Beleid in het Onderwijs | 49
04
Leren over leren
Lex Borghans
Hoogleraar Arbeidsmarkteconomie, UM
50 | Essaybundel Bewezen Beleid in het Onderwijs Ministerie van Onderwijs, Cultuur en Wetenschap
Terwijl van werkenden verwacht wordt dat ze levenslang leren, is het
voor scholen en de overheid heel normaal om beleid te voeren zonder
daarbij rekening te houden met het belang om te leren over de
effectiviteit van de manier van werken. Vanwege het toenemend
belang van onderwijs en de dalende kosten van onderzoek, zou ook de
maatschappij moeten willen leren van wat ze doet. Dit vraagt erom
experimenten een standaard onderdeel van beleid te maken. Net zoals
mensen op het werk leren terwijl hun productieve arbeid doorloopt,
kan het onderwijs ook leren zonder dat dit het reguliere onderwijspro-
ces te veel verstoort. Er zal echter een balans moeten worden gezocht
zodat niet alleen zo goed mogelijk onderwijs wordt gegeven op basis
van de huidige inzichten, maar de maatschappij ook blijft leren hoe
het nog beter kan.
4.1 Inleiding
Het afgelopen decennium is de aandacht voor het belang van kennis en
dus van leren enorm toegenomen. Met als noemer “de kenniseconomie”
wordt erop gewezen dat kennis een doorslaggevende factor is voor
economisch succes en wordt daarom met extra aandacht gekeken naar de
opbrengst van het onderwijs en is ook het thema levenslang leren op de
agenda komen te staan. In veel Westerse landen is er een trendmatige
groei in de vraag naar hoger opgeleiden die een extra versnelling heeft
gekregen door de ICT-golf van de jaren ’80 en ’90. Leren loont daarom
steeds meer en dus ligt het voor de hand ook meer in onderwijs te
investeren.
Er is echter een keerzijde bij deze ontwikkeling en dat is het feit dat
onderwijs zelf zeer duur is. Hierbij gaat het niet alleen om de 25 miljard
euro die ieder jaar door het Ministerie van Onderwijs, Cultuur en
Wetenschap aan onderwijs worden uitgegeven, maar ook om de enorme
gederfde inkomsten omdat leerlingen die op school zitten of studeren,
niet werken. Uit tijdbestedingsonderzoek blijkt dat Nederlanders gemid-
deld ongeveer evenveel tijd besteden aan onderwijs als aan werken2. Door
langer te studeren zal de tijd die beschikbaar is voor werk gereduceerd
worden en worden de mogelijkheden om de verworven kennis ook
daadwerkelijk te benutten steeds kleiner.
Ministerie van Onderwijs, Cultuur en Wetenschap Essaybundel Bewezen Beleid in het Onderwijs | 51
hoe dat moet. De kern van het antwoord is dat we ook dat moeten leren.
Net zoals we van mensen verwachten dat ze zich door te leren ontwikkelen
en productiever worden in hun werk, zo zou ook van de maatschappij
verwacht moeten worden dat ze leert en zo probeert haar productiviteit te
vergroten. Systematische experimenten zijn hierbij cruciaal.
52 | Essaybundel Bewezen Beleid in het Onderwijs Ministerie van Onderwijs, Cultuur en Wetenschap
toeval is, maar na een paar keer wordt het hem duidelijk dat deze andere
aanpak echt beter werkt. Voortaan kiest hij deze aanpak zodat het
langzamerhand routine wordt.
De jonge leraar is dus aan het experimenteren en dit heeft gevolgen voor
zijn productiviteit. In plaats van alleen maar de beste methode te
benutten, probeert hij verschillende mogelijkheden uit. Een deel van de
tijd krijgen de leerlingen dus les op basis van een aanpak die niet optimaal
is. Toch zal niemand zeggen dat deze leraar niet zou mogen experimente-
ren. Het alternatief zou zijn dat hij vasthoudt aan de aanpak die hij de
eerste dag hanteert, en de kans is groot dat dat niet de beste aanpak is. Een
goede instructie tijdens de lerarenopleiding over wat doorgaans werkt en
wat niet, kan veel onnodig experimenteren voorkomen, maar uiteindelijk
wordt de docent alleen beter als we hem gunnen om te variëren en te
experimenteren met hoe hij lesgeeft, ook al gaat het daardoor soms een
keer mis. Uit het onderzoek van Rivkin et al. blijkt dat leerlingen veel beter
af zijn met een docent met meer ervaring, maar iedereen accepteert dat
ook jonge leraren ervaring op moeten doen en dus les zullen moeten
geven om uiteindelijk ook een goede docent te worden.
Het belang van al doende ervaring op doen speelt niet alleen in het
onderwijs maar in alle beroepen. Uit de Enquête Levenslang Leren4 komt
naar voren dat 94% van de tijd die mensen besteden aan leren op het werk,
informeel leren betreft. Slechts 6% van de tijd dat mensen leren, gaat het
om het volgen van een cursus of opleiding. Toch kan een cursus een
belangrijke rol spelen in het leerproces. Stel er wordt een nieuw compu-
terprogramma geïntroduceerd. Medewerkers gaan dan een middag naar
een cursus om te leren hoe dit programma werkt. Wat er feitelijk gebeurt,
is dat men tijdens die middag een overzicht krijgt van de mogelijkheden
van het programma en gewezen wordt op de dingen die mis kunnen gaan.
Het echte leren begint pas als men weer terug is op het werk. Daar gaat
men met het nieuwe programma werken en gaat er dus van alles mis.
Opnieuw volgt er een langere periode van uitproberen en experimenteren.
Dit gaat ten koste van de productiviteit, maar betekent wel dat de
betreffende medewerkers steeds handiger worden in het gebruiken van dit
programma en uiteindelijk dus veel productiever zullen worden.
Ministerie van Onderwijs, Cultuur en Wetenschap Essaybundel Bewezen Beleid in het Onderwijs | 53
Niet iedereen staat open voor vernieuwing. Werknemers hebben na
verloop van tijd een goed werkende aanpak ontwikkeld en deze aanpak is
geautomatiseerd, zodat ze niet meer heel nadrukkelijk stil staan bij hoe ze
het doen, maar gewoon weten of voelen wat werkt en wat niet. Als de
omstandigheden veranderen of de bedrijfsleiding een nieuwe aanpak
introduceert omdat elders gebleken is dat deze zeer succesvol is, staan ze
niet meer open voor deze verandering en hebben ze het gevoel dat ze zelf
beter weten wat goed is en wat niet.
Op het werk gaan werken en leren dus hand in hand. Toch hebben
bedrijven hierbij een keuzemogelijkheid. Voor iedere medewerker geldt
dat er taken zijn waarin hij heel productief is en dat er taken zijn waar hij
veel van leert. Als een medewerker taken krijgt toebedeeld die erop zijn
gericht zijn productiviteit zoveel mogelijk te benutten, zal hij ook nog
ervaring opdoen en dus leren. Een bedrijf kan ook bij de toewijzing van
taken zoveel mogelijk het leereffect optimaliseren. In dat geval kan de
medewerker nog steeds productief zijn, maar de productiviteit zal lager
zijn dan in het eerste geval. Door het takenpakket aan te passen kan een
bedrijf dus gradueel variëren van een hoge productiviteit met een laag
leereffect naar een lage productiviteit met een hoog leereffect. Vanuit een
bedrijfseconomisch perspectief zijn kleine veranderingen in het takenpak-
ket waardoor de productiviteit vrijwel op peil blijft maar de medewerker
wel veel meer leert, het interessantst. Ook hier hangt echter een kleine
prijs aan vast in de vorm van een lichte productiviteitsdaling en het is
bekend uit de literatuur dat de verleiding groot is om deze investering niet
te doen. Vooral als het druk is op het werk, is de neiging groot om
investeringen in de ontwikkeling van mensen door hen ervaringsrijke
taken te geven achterwege te laten.
6
John Anderson, Learning and Memory, John Wiley, New York, 1995 laat zien dat het gedrag
van mensen die leren inderdaad vanuit dit perspectief geïnterpreteerd kan worden.
54 | Essaybundel Bewezen Beleid in het Onderwijs Ministerie van Onderwijs, Cultuur en Wetenschap
Er is er een statistische regel die zegt dat de significantie van een waarge-
nomen effect - dat is de mate waarin er zekerheid bestaat over de omvang
van een effect - afhangt van de wortel van het aantal gevallen en de
werkelijke omvang van het effect:
De vraag of een manier van lesgeven effect heeft op de aandacht van een
leerling voor de les, is dus typisch een vraag die een docent zelf al
experimenterende goed kan beantwoorden. Als hij 40 weken lang 30 uur
per week lesgeeft, is er sprake van 1200 gevallen, waarbij hij meteen de
effecten vast kan stellen en waarbij de effecten in het algemeen ook vrij
groot zijn. De vraag welke wiskundemethode beter werkt, wordt al lastiger
maar is nog steeds doenlijk. De leraar kan niet van les op les van methode
veranderen omdat de effecten ervan het resultaat zijn van langduriger
gebruik, maar als de effecten groot genoeg zijn, kan hij door vergelijking
van wat de leerlingen in het ene jaar en in het ander jaar opsteken van de
les toch een ruwe inschatting van de effectiviteit maken. Er zijn echter
talloze relevante vragen over het onderwijs die aan het zicht van de
individuele docent ontsnappen. Dat kan zijn omdat hij te weinig gevallen
tegenkomt (“Hoe kan je het beste omgaan met leerlingen met een heel
specifieke aandoening?”), de effecten te klein zijn om goed waar te
kunnen nemen (“Groeit het moreel besef van leerlingen als er in de les af
en toe tijd wordt besteed aan een discussie over ethische zaken?”) en
vooral omdat de belangrijkste effecten van onderwijs op een veel langere
termijn spelen dan een jaar.
Ministerie van Onderwijs, Cultuur en Wetenschap Essaybundel Bewezen Beleid in het Onderwijs | 55
56 | Essaybundel Bewezen Beleid in het Onderwijs Ministerie van Onderwijs, Cultuur en Wetenschap
uitproberen en vergelijken van mogelijkheden en (3) automatiseren. Bij
zelfreflectie gaat het er om goed op een rij te zetten wat er al bekend is
over het onderwijs, welke aanwijzingen er zijn over kansrijke verbeterin-
gen. Naarmate er meer ervaring wordt opgebouwd, ontstaan er theorieën
die gebruikt kunnen worden om de effecten van nieuwe initiatieven al bij
voorbaat in te schatten. Deze inschattingen kunnen achteraf onjuist
blijken te zijn, maar helpen in ieder geval bij het maken van keuzes voor
veranderingen die kunnen worden overwogen.
Eigenlijk werkt leren voor de maatschappij dus niet anders dan leren voor
individuen. Toch is leren voor de maatschappij nog alles behalve
vanzelfsprekend.
Ten eerste bestaat er nauwelijks een beeld over wat we zouden willen leren
over leren. Er is een groeiend besef van het belang van “evidence based”
beleid, maar als er plotseling een groot budget beschikbaar zou komen
voor een aantal grote experimenten in het onderwijs, wie geeft dan
antwoord op de vraag welke experimenten gekozen zouden moeten
worden omdat ze de grootste toegevoegde waarde voor het onderwijs
Ministerie van Onderwijs, Cultuur en Wetenschap Essaybundel Bewezen Beleid in het Onderwijs | 57
hebben? En als deze experimenten zijn uitgevoerd, wat gaan we dan doen
met de uitkomsten? Als niet duidelijk is op welke wijze we het onderwijs
gaan aanpassen aan de bevindingen van deze experimenten, is het
wellicht ook niet zinvol de experimenten uit te voeren. Wat ontbreekt is
een goede beschrijving van wat we weten en wat we niet weten over
onderwijs en de wijze waarop de verschillende onderdelen van het
onderwijs met elkaar samenhangen. Net zoals het Centraal Planbureau de
effecten van het beleid door kan rekenen, zou er een model moeten zijn
om mogelijke aanpassingen in het onderwijs door te rekenen om zo te
kunnen vaststellen waar de meest kansrijke mogelijkheden voor het
onderwijs zitten. Heel basale principes over dat meer tijd voor het een,
minder tijd voor iets anders betekent en over de vraag hoe mensen
reageren op veranderde omstandigheden, worden vaak over het hoofd
gezien. Door voorstellen voor veranderingen in een eenvoudig theoretisch
perspectief te plaatsen, kunnen vaak mogelijke neveneffecten worden
vastgesteld die anders onopgemerkt blijven.
7
Iedereen die wil ervaren hoe belangrijk exogene variatie is om verantwoorde conclusies te
trekken kan op www.socialeconomics.nl terecht voor een aantal beleids-sudoku’s.
8
Vaak is er ook sprake van misverstanden. Een veel gehoord argument is dat onderwijs te
complex is voor experimenten. Omdat er zoveel factoren een rol spelen bij de ontwikke-
ling van leerlingen is het onmogelijk om in een experiment alle andere omstandigheden
onder controle te houden is de gedachte. Deze veelheid aan invloeden is echter juist de
raison d’être van het experiment. Alleen op basis van exogene variatie kunnen de effecten
van een aspect worden onderscheiden van deze andere invloeden. Inspanningen om
omstandigheden onder controle te houden worden alleen gedaan om daarmee de
benodigde steekproef te beperken.
58 | Essaybundel Bewezen Beleid in het Onderwijs Ministerie van Onderwijs, Cultuur en Wetenschap
Ook leren door te experimenteren kan heel goed al doende gebeuren. Ook
hier moet gezocht worden naar een goede mix tussen het belang van de
reguliere activiteiten van een school en het belang om te leren over de
beste manier van werken. Een experiment kan zo worden opgezet dat het
leereffect wordt gemaximaliseerd. Ook dan zullen de leerlingen nog profijt
hebben van het onderwijs maar het belang van het experiment staat
voorop. Het is logisch dat het onderwijs hier niet op zit te wachten.
Omgekeerd is er echter ook bij beleidsmakers en het onderwijsveld soms
weinig bereidheid en interesse om vernieuwingen in het onderwijs op een
experimentele wijze door te voeren. Men is dan zo overtuigd van de
effectiviteit van het nieuwe beleid dat men een analyse niet nodig acht, of
zelfs liever heeft dat nooit duidelijk wordt wat de werkelijke effectiviteit is.
Ook bestaat er vaak een naïef beeld dat onderzoekers beleid kunnen
evalueren zonder dat er bij de opzet van het beleid rekening gehouden
hoeft te worden met deze evaluatie. Dit is een illusie. Effectmetingen zijn
alleen mogelijk als op een systematische manier verschillen worden
gemaakt tussen verschillende individuen of groepen. Econometristen die
analyses doen zonder experimentele variatie, gaan op zoek naar het kleine
beetje toeval dat toevallig is ontstaan. Doorgaans is deze variatie te klein
om betrouwbare uitspraken te kunnen doen. Dit betekent dus dat bij de
implementatie van een nieuwe lesmethode of beleid rekening gehouden
moet worden met het belang van de effectmeting. Vrijwel altijd is het
mogelijk om met kleine aanpassingen in het beleid een adequate
effectmeting mogelijk te maken, maar dit vraagt wel om een serieuze
afweging van beide belangen en dus ook om tijdig overleg met
onderzoekers.
Experimenten hebben vooral een grote toegevoegde waarde als het gaat
om effecten die door individuele docenten of afzonderlijke scholen niet
goed vastgesteld kunnen worden. Dat zijn relatief kleine effecten die
spelen op de lange termijn en een grote steekproef vergen. De experimen-
ten die momenteel worden uitgevoerd, zijn echter toch vaak kleinschalig
en gericht op grote effecten op de korte termijn. De reden hiervoor is dat
ook onderzoekers kosten-baten-afwegingen maken. Onderzoekers
worden steeds meer beoordeeld op hun publicaties. Voor hen is het
daardoor aantrekkelijker om snel te kunnen publiceren dan om lang bezig
te zijn met een duur onderzoek dat wellicht relevanter zou zijn geweest
vanuit het perspectief van het onderwijs.
Ministerie van Onderwijs, Cultuur en Wetenschap Essaybundel Bewezen Beleid in het Onderwijs | 59
efficiëntieverhogingen steeds profijtelijker worden. Aan de andere kant
dalen de kosten voor experimenteel onderzoek snel omdat meer en meer
informatie over het onderwijs op computers wordt opgeslagen en omdat
gegevens over onderwijs gekoppeld kunnen worden aan latere uitkomsten
van individuen. Nederland heeft hierbij een uitstekende positie. Het
Sociaal Statistisch Bestand van het Centraal Bureau voor de Statistiek biedt
een erg goede infrastructuur om leerlingen op lange termijn te kunnen
volgen.
Door in Nederland sterk te stimuleren dat niet alleen levenslang leren van
individuen maar ook doorlopend leren van scholen en de maatschappij de
normaalste zaak van de wereld wordt, kan Nederland een voorsprong
opbouwen bij het gericht verhogen van efficiëntie van het onderwijs. Dit
zal een kwestie zijn van vallen en opstaan. Experimenteel onderzoek van
het onderwijs kent nog talloze haken en ogen. Het is echter onverstandig
om te wachten tot voor alle mogelijke complicaties een oplossing is
gevonden. Uitproberen en leren van de fouten hoort immers bij een
serieus leerproces.
In de eerste plaats zou van scholen verwacht kunnen worden dat ze alleen
veranderingen doorvoeren als hiervoor voldoende bewijs van effectiviteit
is en zij ook actief meerwerken aan experimenten die onze kennis
vergroten over de werking van het onderwijs. Experimenteel onderzoek is
in essentie niet duur. Met relatief kleine inspanningen kan de introductie
van nieuwe methodes routinematig via een experimenteel design worden
doorgevoerd en zouden scholen cruciale aspecten van het onderwijs
kunnen randomiseren om zo strategisch belangrijke informatie over het
onderwijs te vergaren. Het ligt voor de hand dat de keuzes voor de
ontwikkelingen van onderzoek niet alleen door de overheid worden
gemaakt, maar dat scholen hierbij ook een belangrijke rol krijgen. Dit
maakt het ook mogelijk dat scholen op basis van een doelgerichte
ontwikkeling hun eigen profiel creëren. Veel experimenteel onderzoek
vraagt echter om een grotere schaal dan een afzonderlijke school. Scholen
zouden daarom samenwerkingsverbanden kunnen vormen waarin samen
wordt gewerkt aan de verbetering van het onderwijs. Dergelijke samenwer-
king hoeft niet regionaal te zijn, maar is juist extra interessant als scholen
overeenkomsten hebben in hun visie op onderwijs.
60 | Essaybundel Bewezen Beleid in het Onderwijs Ministerie van Onderwijs, Cultuur en Wetenschap
Uitgebreide metingen van effecten op korte en langere termijn zijn
cruciaal voor goede experimentele analyses. Als dergelijke metingen
afzonderlijk per onderzoek opgezet moeten worden, werkt dat sterk
kostenverhogend. Het is daarom belangrijk om standaard een goed
meetinstrumentarium te hebben waarmee de inputs in het onderwijspro-
ces in kaart worden gebracht en de vorderingen van leerlingen in het
onderwijs worden gevolgd. Hierbij is het van belang dat adequate keuzes
worden gemaakt over de gegevens die worden verzameld. Omdat derge-
lijke informatie ook van groot belang is om adequaat sturing te geven aan
een school, gaan de belangen van experimenteel onderzoek en resultaat-
gericht onderwijs hier hand in hand.
Ten slotte is ook openheid van de gegevens voor het onderzoek van groot
belang voor het slagen van deze expeditie. Goed onderzoek kan niet
worden afgedwongen door alleen methodologische eisen te stellen aan
het onderzoeksdesign. Door ook het praktijkgeoriënteerde onderwijson-
derzoek bloot te stellen aan de wetenschappelijke discussie blijven de
betrokkenen scherp en ontstaan nieuwe inzichten en nieuwe interpreta-
ties. Bovendien is het beschikbaar stellen van onderzoeksdata de eenvou-
digste manier om het onderzoek van wetenschappers in Nederland en
daarbuiten te richten op voor ons land beleidsrelevante kwesties9. En dat is
belangrijk want – om een beroemde econoom te citeren – experimenten
kunnen heel nuttig zijn voor onderzoek maar mogen nooit een reden zijn
om te stoppen met denken.
9
Lex Borghans, Nederlandse data zijn te duur, Economisch Statistische Berichten, 88(4397),
2003, pp. 132‑133.
Ministerie van Onderwijs, Cultuur en Wetenschap Essaybundel Bewezen Beleid in het Onderwijs | 61
Literatuur
Anderson, J. Learning and Memory, John Wiley, New York, 1995 laat zien dat het gedrag van
mensen die leren inderdaad vanuit dit perspectief geïnterpreteerd kan worden.
Borghans, L. (2006). “Zonder van de Tijd” Leren in Nederland vanuit een economisch
perspectief. Oratie Universiteit Maastricht.
Borghans, L. Nederlandse data zijn te duur, Economisch Statistische Berichten, 88(4397),
2003, 132‑133.
Borghans, L., B. Golsteyn en A. de Grip (2006). Meer werken is meer leren; Determinanten van
kennisontwikkeling. CINOP, Den Bosch.
Rivkin, S., E. Hanushek en J. Kahn. Teachers (2005). Schools and Academic Achievement.
Econometrica, 73-2, 417-458, 2005.
Loo, J. van, Training, Labor Market Outcomes and Self-Management. Proefschrift,
Universiteit Utrecht.
62 | Essaybundel Bewezen Beleid in het Onderwijs Ministerie van Onderwijs, Cultuur en Wetenschap
Ministerie van Onderwijs, Cultuur en Wetenschap Essaybundel Bewezen Beleid in het Onderwijs | 63
05
Naar een nieuwe
opzet van de
onderwijsweten
schappen?
Jacquelien Bulterman-Bos
Oprichter van Open Doors Education
64 | Essaybundel Bewezen Beleid in het Onderwijs Ministerie van Onderwijs, Cultuur en Wetenschap
In dit artikel probeer ik een aantal factoren op het spoor te komen die
de kloof tussen onderzoek en praktijk in de hand werken. Met opzet
begin ik met een evidence based onderzoek, gefinancierd uit het
‘experimenteerbudget’ dat bedoeld is om een bijdrage te leveren aan
evidence based beleid. De studie gaat over vroege selectie in het
voortgezet onderwijs en is daarmee nauw gelieerd aan discussies
rondom de basisvorming, een van de (mislukte) onderwijsvernieuwin-
gen. Geeft evidence based onderzoek betrouwbaarder informatie,
waardoor onderwijsvernieuwingen niet meer hoeven te mislukken? Ik
laat zien dat het gecompliceerder is. Ook het soort kennis dat leraren
nodig hebben moet in de analyse meegenomen worden. Iedere
succesvolle aanpak komt mede tot stand dankzij de persoonlijke
vaardigheden van leraren. Die kennis is onlosmakelijk verbonden met
de mensen die bij de aanpak betrokken zijn. Onderzoekers ontwikke-
len kennis over onderwijs, dat is iets anders dan kennis hebben van
onderwijzen. De medische wetenschap functioneert anders. Medische
wetenschappers ontwikkelen geen theorie over genezen, maar ze
ontwikkelen praktijken waarin mensen genezen worden. In de
medische wetenschap zijn ‘kennen’ en ‘handelen’ met elkaar verbon-
den. In deze bijdrage stel ik de vraag of er voor de scheiding tussen
kennen en handelen in de onderwijswetenschappen tegenwoordig
nog goede argumenten zijn. Ik betoog dat een verbinding tussen
kennen en handelen perspectieven biedt op een betere relatie tussen
onderzoek en praktijk. Dat betekent een nieuwe opzet van de onder-
wijswetenschap, één waarbij de disciplinaire standaarden in de
medische wetenschap als voorbeeld dienen.
5.1 Inleiding
De teleurstellingen over de onderwijsvernieuwingen van de laatste
decennia hebben de kwaliteit van het onderwijsbeleid ter discussie
gesteld. Was er wel voldoende ‘evidence’ om de onderwijsvernieuwingen
door te voeren? Zou het onderwijsbeleid en onderwijsonderzoek in het
vervolg niet meer evidence based moeten worden? Ook in onderzoeks-
kringen valt de term evidence based regelmatig. Nieuwe instituten worden
geopend en bestaande instituten sieren zich met die naam. Eigenlijk is dit
verwonderlijk. Is wetenschappelijk onderzoek dan niet per definitie
evidence based?
De discussie over evidence based onderzoek kan niet los gezien worden
van de kritiek op de onderwijswetenschappen. Sommigen spreken zelfs
van een crisis in de geloofwaardigheid van de onderwijswetenschap (Kelly,
2003; Lageman & Shulman, 1999; Lagemann, 2000).
Ministerie van Onderwijs, Cultuur en Wetenschap Essaybundel Bewezen Beleid in het Onderwijs | 65
De evidence based beweging in de Verenigde Staten kan gezien worden als
één van de antwoorden die op deze crisis wordt gegeven (Feuer, Towne &
Shavelson, 2002). Door middel van strengere methodologische eisen
probeert deze beweging de kwaliteit van het onderwijsonderzoek en
-beleid te verbeteren. De beweging heeft een sterke voorkeur voor een
experimentele aanpak met grote groepen die het liefst at random zijn
samengesteld. De Onderwijsraad (2006) spreekt ook een voorkeur uit voor
experimenten met grote groepen, maar wil toch onderzoek dat tot minder
harde kennis leidt, in ere houden. Alvorens ik dieper in ga op de kloof
tussen onderzoek en praktijk, wil ik de vraag beantwoorden of het
waarschijnlijk is dat deze nieuwe aanpak in de toekomst tot succesvoller
onderwijsbeleid zal leiden. Daartoe gebruik ik een voorbeeld van een
onderzoek over uitstel van selectie. Daarna probeer ik aan de hand van dit
onderzoek factoren op het spoor te komen die de kloof tussen onderzoek
en praktijk in de hand werken.
Bij beide groepen, die bij aanvang even intelligent bleken, ging het CPB na
hoeveel leerlingen in het hoger onderwijs terecht waren gekomen. Uit de
studie bleek dat de groep die ooit in een heterogene mh(v)-klas terecht
was gekomen, beduidend meer kans had op participatie in het hoger
onderwijs. Vervolgens onderzocht het CPB of heterogene klassen de kans
voor de havisten op participatie in het hoger onderwijs beïnvloedde, maar
nee: havisten die met een mavo’er in de brugklas hadden gezeten, hadden
even veel kans op participatie in het hoger onderwijs als de anderen.
Eindelijk leek er evidence te zijn voor wat zo velen altijd al hadden gedacht:
vroege selectie belemmert de participatie in het hoger onderwijs. De
effecten van de plaatsing in het eerste jaar van het voortgezet onderwijs
waren nog jaren later te merken, constateerde het Planbureau. Het
concludeerde dat de deelname aan het hoger onderwijs vergroot kan
66 | Essaybundel Bewezen Beleid in het Onderwijs Ministerie van Onderwijs, Cultuur en Wetenschap
worden door het stimuleren van gecombineerde brugklassen, waarin
leerlingen met mavo- of havo-advies één of twee jaar bij elkaar gehouden
worden. De kranten stonden er vol van: “mavo’er gebaat bij gemengde
brugklas” (Trouw 6-3-09) en “Brugklassers halen hogere diploma’s”
(Volkskrant 5-3-09).
In het rapport is een tabel te vinden, waarin bij het eerste cohort uit 1989
per jaar precies staat aangegeven in welk schooltype de leerlingen zich
bevinden. In het eerste jaar zit de ene groep op een categorale mavo en de
andere groep in een mh(v)-klas. Na dat jaar zie je de opstroom naar de
havo in de heterogene klassen, die er (uiteraard) in de homogene klassen
niet is. Na 9 jaren zie je dat er 5% meer mh(v)’ers in het hoger onderwijs
zitten dan categorale mavoërs. De conclusies van het CPB zijn dus op de
‘feiten’ gebaseerd. Maar de tabel, die alleen voor het eerste cohort in het
rapport staat, laat ook nog iets anders zien wat de onderzoekers laten
liggen. Direct na het eerste jaar is de stroom van de leerlingen die lager
dan de mavo terecht komt 5% groter in de heterogene klassen. Na 9 jaar
participeert uit de heterogene klassen 5% meer leerlingen in het hoger
onderwijs, maar er heeft ook 5% meer leerlingen het onderwijs verlaten,
terwijl die 5% in de homogene klassen nog op school zit. Let het CPB wel
op participatie in hoger onderwijs, maar niet op afstroom en uitstroom?
Deze vraag wordt urgenter als ik in een krantenartikel uit 2002 lees dat het
CPB heeft vastgesteld dat het aantal scholieren dat moet overstappen naar
een lager schooltype, sinds begin jaren negentig bijna is verdubbeld
(Volkskrant, 18-4-2002 “Middelbare scholier grijpt vaak te hoog”). Als
verklaring stelt het CPB dat de groei van het aantal brede scholengemeen-
schappen de afstroom in de hand werkt. Beide onderzoeken bestrijken
dezelfde tijdsperiode. Hoe zit dit? Hebben leerlingen in heterogene
groepen een grotere kans op participatie in het hoger onderwijs, maar ook
een grotere kans om lager dan de mavo terecht te komen?
Ministerie van Onderwijs, Cultuur en Wetenschap Essaybundel Bewezen Beleid in het Onderwijs | 67
Met deze prangende vraag heb ik een van de onderzoeker van het CPB
opgebeld: acht hij het mogelijk dat meer kans op participatie in het hoger
onderwijs samen gaat met meer kans op participatie in schooltypen lager
dan de mavo? Zijn reactie was dat deze vraag geen onderdeel was geweest
van het onderzoek. Het CPB had gekeken wat de kansen waren voor
leerlingen uit verschillende brugklassen om in het hoger onderwijs
terecht te komen, want het CPB wilde nagaan wat er wáár is van de
opvatting (geventileerd in de internationale literatuur en o.a. de OECD) dat
vroege selectie de participatie in het hoger onderwijs in gevaar brengt.
Ook de conclusie dat havisten niet onder een mh(v)-brugklas lijden roept
vragen op: als het voor leerlingen met een mavoadvies goed is om in
klassen te zitten met havisten, waarom zou het dan voor havisten niet ook
goed zijn om met vwo’ers in de klas te zitten? Uit het rapport blijkt echter
dat het CPB een bepaalde definitie van hoger onderwijs hanteert: het hbo
en het wo worden als één groep behandeld. Tussen mbo en hbo maakt het
CPB dus wel onderscheid, maar tussen hbo en wo niet. Zo wordt uit de
onderzoeksresultaten niet duidelijk of een havist in een mh-klas soms
minder kans heeft om door te stromen naar het wo. Daarom stelde ik de
onderzoeker ook de vraag of de conclusie dat havisten geen schade
ondervinden van brugklassen met mavoërs, mede verklaard wordt door de
definitie van hoger onderwijs van het CPB. Zijn reactie was dat het CPB
dezelfde definitie van hoger onderwijs had gehanteerd als in de Lissabon-
doelstellingen; daarin wordt ook geen onderscheid gemaakt tussen hbo en
wo, maar wel tussen mbo en hbo.
Het lijkt zeer waarschijnlijk dat de conclusies van het CPB de samenleving
op het verkeerde been zetten. Van de evidente voordelen van heterogene
brugklassen blijft weinig over als heterogene klassen zowel de kansen op
participatie in het hoger onderwijs vergroten als de kansen op uitval of
afstroom vergroten. Wat zou er gebeuren als dit evidence based onderzoek
zou worden omgezet in evidence based beleid? Zou dit dan weer tot
nieuwe teleurstelling leiden, zoals dat bij de basisvorming ook is gebeurd?
68 | Essaybundel Bewezen Beleid in het Onderwijs Ministerie van Onderwijs, Cultuur en Wetenschap
hoger op te komen. Dit feit is echter een fragment uit een complex geheel.
Wanneer andere fragmenten aan dit feit worden toegevoegd ontstaat een
compleet ander beeld. Het CPB-onderzoek laat zien dat de keuze van de
onderzoeksvragen heel duidelijk van invloed is op de resultaten die het
onderzoek oplevert. Dit illustreert dat de onderzoeker – ook de harde
evidence based onderzoeker – geen objectieve kennis aanlevert, maar aan
de hand van empirische gegevens bepaalde inzichten construeert.
Het onderzoek van het CPB is slechts één voorbeeld van een onderzoek dat
een fragment uit de werkelijkheid vergroot. In het algemeen geldt echter
dat onderzoekers uit een oneindig aantal factoren moeten besluiten wat ze
wel en wat ze niet gaan onderzoeken. Ze zijn dus altijd fragmentarisch
bezig. Dit geldt - op een andere manier en wellicht (soms) in mindere mate
- ook voor kwalitatieve onderzoekers. Vervolgens worden de resultaten
niet alleen mede bepaald door de manier waarop zij vragen stellen, maar
ook door de manier waarop zij onderzoeksinstrumenten ontwerpen, data
interpreteren en conclusies afleiden. Alle onderzoekers construeren dus
kennis met behulp van hun eigen vooronderstellingen.
Ministerie van Onderwijs, Cultuur en Wetenschap Essaybundel Bewezen Beleid in het Onderwijs | 69
het terrein van vroege selectie, is Jeanie Oakes (1985), die op allerlei
manieren aantoont hoe zwakke leerlingen daar de dupe van zijn. Haar
publicaties worden overal ter wereld gebruikt.
70 | Essaybundel Bewezen Beleid in het Onderwijs Ministerie van Onderwijs, Cultuur en Wetenschap
1985; Wineburg, 1987) - kan het ontzettend lang duren eer het inzicht in de
onderzoeksgemeenschap doordringt. Een onderzoeker moet een kritische
publicatie hierover toevallig treffen!
Het kan gebeuren dat de OECD, die zich ook graag op wetenschap wil
baseren, de theorie leest en Nederland kapittelt vanwege de vroege
selectie (terwijl Nederland behoort tot de landen met de kleinste spreiding
van onderwijsresultaten in wiskunde en leesvaardigheid; juist aan de
onderkant van de verdeling doen we het goed (Van der Werfhorst & Mijs,
2007). Vervolgens tonen onderzoekers van het CPB met harde gegevens het
gelijk van de theorie aan en de OECD aan. De ene waarheid bevestigt de
andere, maar van wat er werkelijk in het onderwijs gebeurt, kan het ver af
staan.
Ministerie van Onderwijs, Cultuur en Wetenschap Essaybundel Bewezen Beleid in het Onderwijs | 71
interpretatie, tussen bruikbare en onbruikbare interpretaties. De vraag is
dus niet of onderzoekers kennis construeren, maar hoe ze dat doen.
Construeren onderzoekers kennis op een manier die relevant is voor de
praktijk? Een volgende vraag is of onderzoekers de praktijk voldoende
kennen om te kunnen weten wat relevant is voor de praktijk. Als niet de
vraag is hoe onderzoekers zo min mogelijk interpreteren (wat het geval is
bij het misplaatste ideaal van objectiviteit), maar hoe onderzoekers zo
goed mogelijk interpreteren, zouden onderzoekers dan niet veel meer in
het onderwijsveld moeten werken in plaats van er naast?
72 | Essaybundel Bewezen Beleid in het Onderwijs Ministerie van Onderwijs, Cultuur en Wetenschap
Ministerie van Onderwijs, Cultuur en Wetenschap Essaybundel Bewezen Beleid in het Onderwijs | 73
Juist op het vlak van dit soort vaardigheden ligt een belangrijke oorzaak
van de kloof tussen onderzoek en praktijk. Goede leraren hebben meer
kennis nodig dan de kennis die in boeken opgenomen kan worden. Ze
moeten weten hoe ze sfeer kunnen scheppen, leerlingen motiveren etc.
Deze kennis verwerven zij onder andere door ervaring, door handelen.
Evidence based onderzoek kan best uitwijzen dat een bepaalde aanpak
effectief was. Kennelijk hebben leraren en leerlingen in kwestie dan over
de juiste kennis en vaardigheden beschikt en voldaan aan de eisen die de
onderzoekers in hun hoofd hadden. Dat gegeven garandeert echter niet
dat andere leraren, die een wetenschappelijke beschrijving van die aanpak
krijgen, die vaardigheden automatisch ook hebben. Wie denkt dat
evidence based beleid aanpakken kan voorschrijven waarvan de effectivi-
teit bewezen is, veronderstelt ten onrechte dat leraren al hun kennis
rechtsreeks uit de boekenkast kunnen halen. Was het maar wáár dat
onderwijzen zo eenvoudig was!
74 | Essaybundel Bewezen Beleid in het Onderwijs Ministerie van Onderwijs, Cultuur en Wetenschap
5.8 Onderzoek leidt niet tot waarheden die op zichzelf
kunnen staan
De aanname dat onderwijs evidence based zou kunnen zijn, waarbij
gebruik wordt gemaakt van harde kennis en werkzame aanpakken verraadt
dat onderwijs geconceptualiseerd wordt alsof het een technische activiteit
zou zijn. Met deze begrippen wordt een dynamisch-relationeel object als
onderwijs door een statisch-mechanistische bril bekeken – en zo ontstaat
een vertekend beeld. Alleen al dit taalgebruik weerspiegelt de kloof tussen
onderzoek en praktijk! Zoals Schön (1983) zo overtuigend heeft aan-
getoond, voldoet het model van de technische rationaliteit in de (onder-
wijs)praktijk niet. Iedere situatie is weer anders. Daarom is het tamelijk
grote onzin om te spreken van harde kennis over werkzame aanpakken.
Door ervaring kunnen leraren veel leren, maar er blijft gelden dat in het
verleden behaalde resultaten geen garantie geven voor de toekomst. De
werkzaamheid van bepaalde aanpakken bestaat juist uit de flexibiliteit van
de leraar om de aanpak aan de omstandigheden aan te passen. Kwalitatief
hoogwaardig onderwijs moeten op de werkvloer iedere keer opnieuw
geconstrueerd worden en kan dus niet van bovenaf worden georganiseerd.
Ministerie van Onderwijs, Cultuur en Wetenschap Essaybundel Bewezen Beleid in het Onderwijs | 75
Onderwijzen is niet alleen een kunst, maar ook een kunde – dat ben ik met
Bosker (2008) eens. Kennis die wél in boeken weergegeven kan worden, is
uiteraard ook belangrijk voor leraren. Iedere praktijkbeoefenaar heeft
bovendien behoefte aan een goede theorie – leraren dus ook. We hebben
echter gezien dat de uitkomsten van onderzoek een gevolg zijn van een
constructieproces, waarbij het onvermijdelijk is dat de vooronder-
stellingen van onderzoekers binnen sluipen. Die vooronderstellingen
worden gevormd door de literatuur en we hebben gezien dat die nogal
eens een eigen leven leidt en ver van de (locale) praktijk af staat. We
hebben ook gezien dat onderzoeksresultaten niet als op zichzelf staande
waarheden beschouwd kunnen worden. Zijn onderzoekers, die zo ver van
de praktijk af staan, geëquipeerd om de kennis te construeren die voor de
mensen in de klas relevant is? Wie nooit met groepen kinderen in
aanraking komt, heeft een ander referentiekader dan wie de hele dag met
leerlingen bezig is. Als onderwijzen zowel een kunst als een kunde is, dan
is het de vraag of de kunde ontwikkeld kan worden door mensen die de
kunst niet verstaan!
Het begrip tacit knowledge van Polanyi (1958, 1967) wordt vaak geciteerd in
de onderwijswetenschappen, maar wordt dan alleen op practici van
toepassing geacht. Daarbij wordt vergeten dat Polanyi wetenschaps-
filosoof was, die benadrukte dat alle vormen van wetenschappelijke
kennis door dagelijkse kennis worden gevoed (Gelwick, 1977). Na een
carrière in de exacte wetenschappen wijdde hij zich aan de wetenschapsfi-
losofie, omdat hij om zich zorgen maakte over misplaatste opvattingen
over wetenschappelijke distantie die hij met name in de sociale weten-
schappen signaleerde. Volgens hem was die wetenschappelijke distantie
destructief en werkte voornamelijk leegheid van onderzoek in de hand. Hij
liet zien dat onderzoekers heel intensief met het object van studie moeten
omgaan, iets wat in veel exacte wetenschappen vanzelf spreekt. Intensieve
omgang met het object van studie verandert de onderzoeker, waardoor hij
of zij nieuwe aspecten van het onderzoeksobject leert zien en vruchtbaar-
dere manieren kan ontwikkelen om fragmenten van kennis met elkaar in
verband te brengen. Polanyi benadrukte dus niet dat leraren tacit
knowledge nodig hebben, maar dat onderzoekers deze nodig hebben!
76 | Essaybundel Bewezen Beleid in het Onderwijs Ministerie van Onderwijs, Cultuur en Wetenschap
middel kan zijn, maar niet noodzakelijk het enige middel is (Toulmin,
2001).
Niet in alle hoeken van de medische sector wordt het object van onderzoek
gevormd door patiënten. Er zijn ook wetenschappers die zich richten op
cellen, of op bacteriën. Niet alle medische onderzoekers gaan met
patiënten om, maar er geldt wel dat iedereen intensief betrokken is bij zijn
of haar object van onderzoek.
Ministerie van Onderwijs, Cultuur en Wetenschap Essaybundel Bewezen Beleid in het Onderwijs | 77
aan een nieuwe onderwijswetenschap met een klinische opzet. Wanneer
onderwijsonderzoekers concrete verantwoordelijkheid in de onderwijs-
praktijk dragen, ontwikkelen zij een gevoeligheid die kan helpen om
fragmenten van kennis uit onderzoek beter tot een zinvol geheel samen te
smeden. Ze leren zien welke factoren in de praktijk relevant zijn en welke
niet. Theoretische inzichten worden voortdurend aan lokale praktische
omstandigheden getoetst, wat inzichten nuanceert en verdiept. Zo kan
worden voorkomen dat theorie een eigen leven gaat leiden. Door naast
hun werk als onderzoeker ook praktisch met onderwijs bezig te zijn,
ontwikkelen onderzoekers vaardigheden die hen in staat stellen om te
weten waar ze over praten als ze anderen iets aanraden. Daarnaast wordt
zo voorkomen dat onderwijswetenschap een tamelijk leeg begrippenspel
wordt. Onderzoekers hoeven zich dan niet langer te beperken tot het
ontwikkelen van theorie over onderwijs, maar kunnen zij mede dankzij
hun onderzoek bestaande praktijken verbeteren en inspirerende voor-
beeldpraktijken creëren.
Probleem is wel dat veel onderzoekers vaak geen kennis van een schoolvak
hebben en geen ervaring als leraar waardoor er van de overlappende rol
niet altijd even veel terecht komt. De overlappende rol van de onderzoeker
met de leraar wordt ook gestimuleerd doordat er recent in den lande
allerlei initiatieven genomen zijn om de wetenschappelijke studie
pedagogiek of onderwijskunde te combineren met een opleiding tot
leraar. Last but not least zijn er de initiatieven om (ervaren) leraren op te
leiden als onderwijsonderzoeker, waarbij het de bedoeling is dat zij (als
onderzoeker) carrière maken, maar tegelijkertijd in de onderwijspraktijk
actief blijven. Te denken valt aan de academische school, maar ook aan het
initiatief van het Nederlands Instituut voor Masters in Educatie om in
78 | Essaybundel Bewezen Beleid in het Onderwijs Ministerie van Onderwijs, Cultuur en Wetenschap
samenwerking met enkele universiteiten aan ervaren leraren een
academische master in education aan te bieden, die de werkgever betaalt
en waarvoor leraren gedeeltelijk uitgeroosterd worden. Her en der worden
vergelijkbare initiatieven genomen waarin leraren hun werk voor de klas
combineren met een taak als onderzoeker.
Een klinische opzet zou ook daarin de overheid de hand kunnen reiken.
Een transformatie naar klinische disciplinaire standaarden zou immers
een omkering van de beroepskolom betekenen. Momenteel verkeren we
in een situatie waarin de praktische ervaring met leerlingen afneemt
naarmate je hoger in de kolom komt (Lanier & Little, 1986; Zeichner, 1999).
Ministerie van Onderwijs, Cultuur en Wetenschap Essaybundel Bewezen Beleid in het Onderwijs | 79
Wanneer de overheid zich door het veld laat adviseren, loopt de overheid
onder de huidige omstandigheden grote kans dat de mensen op de
werkvloer – die onderaan in de hiërarchie staan – niet aan het woord
komen. Als onderwijskunde een klinische wetenschap wordt, zou dat
betekenen er tot op het hoogste niveau met leerlingen wordt gewerkt.
Onderwijsvernieuwingen worden dan binnen het werkveld zelf bedacht en
onderzocht. De overheid hoeft dan pas aan het einde van het traject op te
treden, als de vernieuwing volwassen is geworden en de ervaringen in het
veld een wijziging van beleid rechtvaardigen. Dat zou pas echt bewezen
beleid zijn!
80 | Essaybundel Bewezen Beleid in het Onderwijs Ministerie van Onderwijs, Cultuur en Wetenschap
Literatuur
Berliner, D.C. (2001). Learning about and learning from experts. International journal of
educational research 35(5) 463-482.
Berliner, D.C. (2002). Educational research: the hardest science of all. Educational Researcher
31(8), 18-20.
Boekaerts, M., Pintrich, P.R., & Zeicher, M. (Eds.) Handbook of self-regulation. San Diego:
Academic Press.
Bosker, R.J. (2008). Naar meer evidence-based onderwijs. Pedagogische Studiën 85, 49-51.
Bronowski, J. (1978). The origins of knowledge and imagination. New Haven and London:
Yale University Press.
Bulterman-Bos, J. A. (2004). Teaching Diverse Learners: A Practice Based Perspective.
Amsterdam: academisch proefschrift Vrije Universiteit.
Bulterman-Bos, J.A. (2007). “Bij de groep horen”: hoe de imitatietendens het leraren moeilijk
kan maken om adaptief onderwijs vorm te geven. Pedagogische Studiën, 84(3), 159-175.
Bulterman-Bos, J.A. (2008a). Will a clinical approach make educational research more
relevant for practice? Educational Researcher, 37(7) 412-420.
Bulterman-Bos, J.A. (2008b). Clinical study: A pursuit of responsibility as the basis of
Education Research. Educational Researcher, 37(7) 439-445.
Dam, G. ten, Volman, M. & Wardekker, W.L. (2005). Samen werken aan innovatieve
leerpraktijken: inleiding op het themanummer. Pedagogische Studiën 82(4), 259-261.
Dar, Y. & N. Resh (1994). Separating and mixing students for learning: Concepts and research.
Pedagogisch Tijdschrift 19(2), 109-126.
Dar, Y. & Resh, N. (1985). Homogeneity and heterogeneity in education: The psychological
price argument. Psychology and counselling in education (Yearbook pp. 39-62) (Hebrew).
Dar, Y. & Resh, N. (1986). Classroom intellectual composition and academic achievement.
American Educational Research Journal, 23(3), 357-374.
Dusek, J.B., Hall, V.C. & Meyer, W.J. (Eds.) (1985). Teacher expectancies. Hillsdale, NJ:
Lawrence Erlbaum.
Eisner, E.W. (1992). Objectivity in educational research. Curriculum Inquiry, 22(1), 9-15.
Elk, R. van, Steeg, M. van der, Webbink, D. (2009). The effect of early tracking on participation
in higher education. CPB document 182. Den Haag: CPB.
Feuer, M.J., Towne, L. Shavelson, R.J. (2002). Scientific culture and educational research.
Educational Researcher 31(8), 4-14.
Gelwick, R. (1977). The way of discovery. An introduction to the thought of Michael Polanyi. New
York: Oxford University Press.
Jolles, J. (2006). Waarom de tijd rijp is voor het slaan van bruggen tussen hersen- en
cognitieve wetenschap en de onderwijspraktijk. Over kennis en inzichten over ‘Brein en
Leren’ die relevant kunnen zijn voor onderwijs-innovatie. Webcomment 28 mei
2006Kelchtermans, G. (1996). Teacher vulnerability: Understanding its moral and political
roots, Cambridge Journal of Education 26 (3) (1996), pp. 307–323.
Kelly, A.E. (2003). The role of design in educational research. Theme issue. Educational
Researcher 32(1), 3-37.
Ministerie van Onderwijs, Cultuur en Wetenschap Essaybundel Bewezen Beleid in het Onderwijs | 81
Lagemann, E. Condliffe (2000). An Elusive Science: The Troubling History of Education
Research. Chicago: University of Chicago Press, 2000.
Lagemann, E. C. & Shulman, L.S. (Eds.) (1999). Issues in educational research: Problems and
possibilities. San Francisco: Jossey-Bass.
Lampert, M. (1985). How do teachers manage to teach? Perspectives on problems in
practice. Harvard Educational Review 55 (2), 178-194.
Lanier, J. & Little, J.W. (1986). Research on teacher education. In M. Wittrock (Ed.), Handbook
of research on teaching (3th ed, 527-568. New York: Macmillan.
Oakes, J. (1985). Keeping track: How schools structure inequality. New Haven, CT: Yale
University Press.
Onderwijsraad (2006). Naar meer evidence based onderwijs. Den Haag: Onderwijsraad.
Polanyi, M. (1958). Personal Knowledge: Towards a post-critical philosophy. Chicago:
University of Chicago Press.
Polanyi, M. (1967). The tacit dimension. London: Routledge & Kegan Paul.
Schön, D. A. (1983). The reflective practitioner. How professionals think in action. New York: Basic
Books.
Slavin, R.E. (2002). Evidence-based education policies: transforming educational practice
and research. Educational Researcher, 31(7), 15-21.
Sligte, H., Bulterman-Bos, J., Huizinga, M. (2009). Maatwerk voor latente talenten?
Uitblinken op alle niveaus. Amsterdam: SCO-Kohnstamminstituut.
St. Clair, R. (2005). Similarities and superunknowns: An essay on the challenges of
educational research. Havard Educational Review, 75 (4), 435-453.
Toulmin, S. (2001). Return to reason. Cambridge, MA: Harvard University Press.
Vandenberghe, R. (2005). Samenwerking onderzoek en praktijk: mogelijkheden en grenzen
(Cooperation between research and practice: possibilities and limitations). Pedagogische
Studien, 82(4).
Vries, A.M. de (1992). Hoe breder hoe beter? De effecten van heterogeen groeperen in het
voortgezet onderwijs in Nederland. Dissertatie, Groningen: RION.
Werfhorst, H.G. van der, & Mijs, J.J. (2007). Onderwijsdifferentiatie en ongelijkheid.
Nederland in vergelijkend perspectief. Rapport in opdracht van het Ministerie van
Onderwijs, Cultuur en Wetenschappen. Amsterdam: AIAS, ASSR.
Wineburg, S.S. (1987). The self-fulfillment of the self-fulfilling prophecy. Educational
Researcher, (6), December 1987, 28-37.
Zeichner, K. (1999). The new scholarship in teacher education. Educational Researcher, 28(9),
4-15.
82 | Essaybundel Bewezen Beleid in het Onderwijs Ministerie van Onderwijs, Cultuur en Wetenschap
Ministerie van Onderwijs, Cultuur en Wetenschap Essaybundel Bewezen Beleid in het Onderwijs | 83
06
Onderwijs op de
ladder: maatwerk
in het onderzoek
naar effectiviteit
Tom van Yperen
Bijzonder Hoogleraar Onderzoek en ontwikkeling effectieve jeugdzorg,
UU
&
Bas Bijl
Programmaleider Onderzoek, PI Research Amsterdam
84 | Essaybundel Bewezen Beleid in het Onderwijs Ministerie van Onderwijs, Cultuur en Wetenschap
6.1 Inleiding
Werken aan de kwaliteit van het onderwijs en de jeugdzorg is een
voorwaarde voor een goed functionerend stelsel. Bestaande onderwijsme-
thoden, psychosociale interventies, of beleidsmaatregelen moeten op hun
waarde worden getoetst. Onderzoek naar de effecten van die aanpakken
vormt een essentieel onderdeel van de ontwikkeling van het aanbod. Leidt
de ene leesmethode tot betere vaardigheden van leerlingen dan de
andere? Zorgt een training tegen faalangst van leerlingen dat ze beter gaan
presteren bij toetsen en examens? Wat is een goede methode voor
klassenmanagement door leerkrachten, dat taakgericht gedrag bevordert
en lesverstoringen doet afnemen?
Er is veel discussie over de vraag welk type onderzoek het meest aangewe-
zen is om dit soort vragen van een antwoord te voorzien. Er bestaan in de
literatuur verschillende classificaties om de kwaliteit van effectonderzoek,
en daarmee de ‘hardheid’ van bewijs voor de effectiviteit van een interven-
tie, te bepalen. Zo hebben West et al. (2002) meer dan 100 systemen voor
het typeren van de kwaliteit van studies bestudeerd. In veel van deze
systemen staat het experimentele onderzoek bovenaan, als de ultieme of
zelfs enige vorm waarmee de effectvraag afdoende is te beantwoorden.
Voorstanders van het experimentele onderzoek noemen dit type design
vaak de ‘gouden standaard’ van effectstudies; anderen geven aan dat deze
kwalificatie principieel onjuist of onhaalbaar is voor de praktijk.
Ministerie van Onderwijs, Cultuur en Wetenschap Essaybundel Bewezen Beleid in het Onderwijs | 85
aan de groepen door toeval (at random) wordt gedaan, bijvoorbeeld door
loting of op volgorde van binnenkomst. Deze opzet heet voluit de
Randomized Controlled Trial (RCT). Hierdoor hoopt men kenmerken van
subjecten (zoals leeftijd, geslacht, motivatie voor een bepaalde aanpak, de
kans dat iemand heeft op spontaan herstel) willekeurig over de twee
condities te verdelen. Het enige waarin de groepen verschillen is – als het
goed is – het al dan niet ondergaan van de experimentele aanpak. Hanteert
men verschillende groepen, maar worden de subjecten niet via toeval
ingedeeld, dan spreekt men van een quasi-experiment. Het derde kenmerk
houdt in dat men via voor- en nameting de mate van toename van
vaardigheden of afname van problematiek in de verschillende groepen
meet. Via statistische toetsing gaan de onderzoekers na of de geconsta-
teerde veranderingen in de experimentele groep verschilt van die in de
controlegroep. Is er een significant verschil, dan is dit volgens deze opzet
met een grote mate van zekerheid toe te schrijven aan het al dan niet
ondergaan van de experimentele aanpak. Dit heet de causale bewijskracht
van het design: het gevonden verschil wordt veroorzaakt door de experi-
mentele conditie.
De experimentele opzet geldt over het algemeen als een krachtig model
waarmee effecten van nieuwe aanpakken te toetsen zijn. De kracht schuilt
vooral in het feit dat allerlei alternatieve verklaringen voor het effect
ermee zijn uit te sluiten (zie bijvoorbeeld Shadish e.a., 2002)
86 | Essaybundel Bewezen Beleid in het Onderwijs Ministerie van Onderwijs, Cultuur en Wetenschap
6.2.2 De aanpak onder kritiek
Ondanks de kracht van het model staat, zoals gezegd, de toepassing van
dit design vaak ter discussie. Cook (2003) vatte deze discussie voor het
onderwijs in een artikel samen en noemde vijf typen argumenten om de
experimentele opzet niet toe te willen passen.
Filosofische argumenten
Men bekritiseert bijvoorbeeld onderzoekers die met de experimentele
opzetten de pretentie hebben dat effecten ermee op een objectieve
(unbiased) manier zijn te meten. Volgens deze kritiek bestaat objectief
meten niet; er zijn bijvoorbeeld altijd informanten in het spel die op een
bepaalde manier het tegen de veranderingen bij de jeugdigen of leerkrach-
ten aankijken. De zekerheid die wetenschappers met het design claimen
zou volgens deze opvatting dan ook een schijnzekerheid zijn. Daar komt
bij dat het design vooral eenvoudige causale relaties test, terwijl in de
dagelijkse werkelijkheid de causaliteit door een complex van relaties wordt
bepaald. Bestudering van de complexe interacties die zich afspelen wordt
door dit design sterk beperkt, terwijl die complexe relaties voor een juist
begrip van de werkelijkheid essentieel zijn. Ook komt men ethische
argumenten tegen. Bijvoorbeeld, men maakt bezwaar tegen het feit dat
aan jeugdigen, ouders of leerkrachten bewust een potentieel krachtige, op
zijn minst veelbelovende aanpak wordt onthouden (zie ook Shadish e.a.,
2002).
Praktische argumenten
De uitvoering van de RCT blijkt in de praktijk vaak moeilijk te realiseren.
Zo komt het voor dat ouders of leerlingen van de nieuwe aanpak horen en
daarom niet (meer) willen meedoen in een controlegroep. Of een
secretaris die verantwoordelijk is voor de random toewijzing houdt zich
niet aan de spelregels, en blijkt later ook afstand tussen woonplaats van
een leerling en behandellocatie meegewogen te hebben. Ook kan achteraf
de randomisatie niet goed blijken te werken, waardoor de experimentele
groep bij aanvang faalangstiger bleek te zijn dan de controlegroep etc. Een
RCT vereist een nauwkeurige en zorgvuldige voorbereiding, hetgeen een
relatief groot beslag legt op tijd en financiën.
Ministerie van Onderwijs, Cultuur en Wetenschap Essaybundel Bewezen Beleid in het Onderwijs | 87
daarom een te gunstig beeld kunnen geven van de werkelijkheid. Ook kan
ze een ongunstiger beeld geven omdat onderzoekers bijvoorbeeld pas van
belangrijke verschillen praten als ze statistisch significant zijn. Hierdoor
kunnen minder robuuste effecten buiten beeld blijven.
88 | Essaybundel Bewezen Beleid in het Onderwijs Ministerie van Onderwijs, Cultuur en Wetenschap
dit een goede aanpak zou zijn. Op niveau 1 is er sprake van een goed
omschreven interventie: de doelgroep is helder, de doelen zijn geëxplici-
teerd en de aanpak staat duidelijk op papier. Interventies op niveau 2 zijn
goed omschreven en hebben tevens een geloofwaardige theoretische
onderbouwing. In deze theorie is aannemelijk gemaakt waarom deze
aanpak bij deze doelgroep zou kunnen leiden tot de gestelde doelen. Op
niveau 3 is er sprake van enig empirisch materiaal waaruit blijkt dat de
doelen van de interventie voldoende worden gehaald, dat cliënten
tevreden zijn, of dat problemen (blijkens voor- en nametingen) voldoende
afnemen tijdens de toepassing van de interventie. Op niveau 4 is er ook
empirisch materiaal dat erop wijst dat de interventie verantwoordelijk is
voor de geobserveerde resultaten, i.e. er is causale bewijskracht voor de
werkzaamheid van de interventie.
Voor een uitgebreide toelichting zie *Van Yperen & Veerman, 2008; **Van Yperen & Van
Bommel, 2009
Ministerie van Onderwijs, Cultuur en Wetenschap Essaybundel Bewezen Beleid in het Onderwijs | 89
Naast de soorten onderzoek die in figuur 1 aan de vier niveaus van de
effectladder zijn gekoppeld, is ‘kosteneffectiviteitsonderzoek’ als vijfde
soort te onderscheiden. Dit type heeft niet alleen tot doel de werkzaam-
heid van de interventie aan te tonen, maar ook de meerwaarde (t.o.v.
alternatieven) in economische zin (Rutten-Van Mölken, Van Busschbach &
Rutten, 2000).
Kern van dit model is nu dat niet het onderzoek op de hoogste sport van de
effectladder de ‘gouden standaard’ vertegenwoordigt, maar het onderzoek
dat het beste past bij het ontwikkelingsstadium van een interventie. Zo
heeft het geen enkele zin om al een RCT uit te voeren als de theorie nog
onvoldoende specificeert wat de werkzame factoren zijn en als er nog geen
voorlopig onderzoeksmateriaal op tafel ligt dat laat zien dat tijdens de
uitvoering van de interventie de problemen van de cliënten voldoende
afnemen. Verstandiger is het in dat geval eerst verder te werken aan de
theorie en de monitoring van resultaten. Daarvoor gebruikt men andere,
meer passende onderzoeksmethoden. Elk stadium en daarbij horend
onderzoek draagt zo bij aan het beeld van de effectiviteit van de
interventie.
90 | Essaybundel Bewezen Beleid in het Onderwijs Ministerie van Onderwijs, Cultuur en Wetenschap
hangt voorts af van de aard van het effect (is het effect zoals bedoeld?, zijn
er ongunstige neveneffecten?), de grootte van het effect (levert het
voldoende winst op ten opzichte van de oude situatie?) en het aantal
studies (is het effect gerepliceerd? Hoe vaak?). Sommige niveaus van de
effectladder hebben geen equivalent in de erkenning van interventies.
Studies op niveau 1 (beschrijvend onderzoek) en 3 (met name onderzoek
met een zwakke bewijskracht, zoals onderzoek naar cliënttevredenheid,
doelrealisatie en veranderingsonderzoek zonder benchmark) worden
gezien als belangrijke tussenstappen om tot een erkenning te komen. De
kosteneffectiviteit is nog geen onderwerp op de effectladder; de erken-
ningscommissie geeft er ook nog geen keurmerk voor af. De verwachting
is dat dit in de toekomst wel een belangrijke rol gaat spelen.
Ministerie van Onderwijs, Cultuur en Wetenschap Essaybundel Bewezen Beleid in het Onderwijs | 91
92 | Essaybundel Bewezen Beleid in het Onderwijs Ministerie van Onderwijs, Cultuur en Wetenschap
theoretische verantwoording is te beschouwen als het minimale niveau
van verantwoording, omdat empirisch onderzoek naar de effectiviteit vaak
nog mist. De onderbouwing maakt dan aannemelijk dat de interventie zou
kunnen werken. Dat onderscheidt de professional van de leek: van de leek
mag men accepteren dat intuïtie het handelen stuurt, de professional
moet minstens in theorie kunnen verantwoorden wat hij doet. De
onderbouwing is bovendien een voorwaarde voor goed effectonderzoek.
Met een theorie is immers te specificeren welke uitkomsten te voorspellen
zijn, welke moderatoren en mediatoren er in het spel zijn en welke
concepten in dit licht relevant zijn om te meten.
Tevredenheidsonderzoek
Tevredenheidsonderzoek is een eenvoudige en vaak aansprekende vorm
van effectonderzoek. Het is een vorm van consumentenevaluatie, waarbij
individuen die een interventie hebben ontvangen na beëindiging van de
verleende dienst (bijv. een lespakket, cursus of begeleiding) worden
gevraagd naar hun tevredenheid over het resultaat. De mogelijke effecten
van een interventie – zo is de onderliggende gedachte – zijn het meest
eenvoudig te meten door de betrokken leerlingen of ouders te vragen of (1)
ze die effecten ervaren en (2) ze tevreden zijn over die effecten.
Tevredenheidsonderzoek is gemakkelijk uitvoerbaar. Tegelijkertijd is het
ook kwetsbaar, omdat vertekeningen in de resultaten kunnen optreden.
Door het retrospectieve karakter, bijvoorbeeld, wordt een beroep op het
geheugen van respondenten gedaan en dat het menselijk geheugen geen
onfeilbaar instrument is, is genoegzaam bekend.
Ministerie van Onderwijs, Cultuur en Wetenschap Essaybundel Bewezen Beleid in het Onderwijs | 93
Onderzoek naar doelrealisatie
Een trefzekerder beeld geeft het onderzoek naar doelrealisatie. In zijn
meest simpele vorm wordt nagegaan in welke mate de vooraf, in het
handelings-, begeleidings- of lesplan gestelde doelen zijn bereikt. Het
meten van doelbereiking is een cruciale toetssteen om al dan niet van een
geslaagde interventie te spreken. Naarmate we meer kunnen vaststellen
dat met de interventie de doelen worden bereikt, wordt de aanwijzing
sterker dat de ingreep inderdaad effectief is. Echter, de kwaliteit van de
gegevens is zo goed als de kwaliteit van de gestelde doelen. Het stellen van
goed geformuleerde doelen is niet zo eenvoudig en vergt enige oefening.
Verder betreft het ook hier een evaluatie-achteraf en kent daardoor
methodologisch gezien dezelfde beperkingen als het
tevredenheidsonderzoek.
Veranderingsonderzoek
Hoofdkenmerk van veranderingsonderzoek is dat er aan het begin en aan
het eind van de interventie wordt gemeten met behulp van gestandaardi-
seerde instrumenten (zoals vaardigheidstoetsen of probleemvragenlijs-
ten). Verschillen tussen de scores van begin- en eindmeting, worden
geïnterpreteerd in termen van, bijvoorbeeld, competentietoename of
probleemafname. De geconstateerde veranderingen worden voorzien van
kwalificaties die iets zeggen over de statistische hardheid van de verschil-
len (zoals de significantie van groepsverschillen of de effect size van een
interventie). De beginmeting geeft bovendien zicht op de kenmerken van
de doelgroep. Zo kan men nagaan of de interventie plaatsvond bij de
beoogde doelgroep. Dit alles maakt de practice based evidence weer wat
sterker. Ondanks deze pluspunten willen we ervoor waarschuwen dat men
niet te gretig mag zijn bij het toeschrijven van de verandering aan de
interventie. We kunnen immers niet uitsluiten dat de gemeten verande-
ring is toe te schrijven aan andere factoren.
Sterkere bewijskracht
De bewijsvoering wordt overtuigender als geconstateerde veranderingen
bij leerlingen blijken te stroken met de onderliggende theorie over de
werking van de interventie. Met andere woorden, het theoretisch
voorspelde effect wordt in de praktijk bevestigd door onderzoeksresulta-
ten. Benchmarkstudies en veranderingstheoretisch onderzoek zijn typen
van onderzoek waarin de hypothese wordt getoetst dat de interventie het
verschil maakt.
Benchmarkstudie
Benchmarkstudies liggen in het verlengde van de hiervoor besproken
opzetten. Wat ze eraan toevoegen is dat er een expliciete norm is gesteld
ten aanzien van wat als een goede uitkomst van het onderzoek te beschou-
94 | Essaybundel Bewezen Beleid in het Onderwijs Ministerie van Onderwijs, Cultuur en Wetenschap
wen is. De zekerheid over de causale relatie tussen de interventie en de
gemeten verandering wordt niet alleen ontleend aan de richting van het
effect, maar vooral ook aan de hoogte of sterkte ervan. Het theoretisch
voorspelde succes – of zo men wil: de hypothese – wordt hiermee
nauwkeuriger gespecificeerd: “Als deze interventie werkt, dan moet het
resultaat minstens zus of zo zijn.” Een benchmarkstudie is een bijzondere
vorm van doelrealisatieonderzoek: op collectief niveau (de doelgroep)
wordt getoetst of het beoogde resultaat is gehaald gegeven een kwantita-
tieve norm. Deze normen of benchmarks worden vaak ontleend aan
eerdere of elders behaalde successen of aan meta-analyses, op grond
waarvan minstens te verwachten effecten worden bepaald. De valkuilen in
dit soort onderzoek zijn grotendeels dezelfde als die bij het veranderings-
onderzoek aan de orde zijn geweest. Daarbij komt dat het in dit specifieke
geval van belang is de norm realistisch te stellen. Een te lage norm is te
gemakkelijk en werkt niet stimulerend. Een te hoge norm werkt mogelijk
demotiverend en diskwalificerend.
Veranderingstheoretisch onderzoek
Zoals de naam reeds aangeeft worden ook bij dit type onderzoek verande-
ringen gemeten. Maar daarnaast is veranderingstheoretisch onderzoek
erop gericht de effectiviteit van specifieke ingrediënten van de interventie
te exploreren. Een goed uitgewerkte theorie is vereist, waarin precies is
beschreven wat de specifiek werkzame factoren van de interventie zijn,
hoe deze factoren inwerken op de problemen of vaardigheden van
leerlingen en welke uitkomsten als gevolg daarvan te verwachten zijn. De
theorie veronderstelt een causale keten van activiteiten en resultaten
(bijvoorbeeld: hoe meer een leerling het huiswerk van de faalangsttrai-
ning heeft gedaan, hoe beter de resultaten van de training) en het
onderzoek heeft tot doel het bestaan van die keten empirisch te onder-
bouwen. Naarmate men daar beter in slaagt neemt de bewijskracht toe.
Daarbij moeten we ons wel realiseren dat alle waarnemingen worden
gedaan bij één groep, te weten de groep leerlingen die de interventie heeft
ontvangen. Voorts heeft de exploratie hoofdzakelijk een correlationeel
karakter. Hoe krachtig en logisch dwingend de interventietheorie moge
zijn, voor de sterkste bewijsvoering zijn onderzoeksopzetten vereist die
vergelijkingen maken met condities, waarin geen of een alternatieve
interventie wordt geboden.
Ministerie van Onderwijs, Cultuur en Wetenschap Essaybundel Bewezen Beleid in het Onderwijs | 95
Quasi-experimenteel onderzoek
Quasi-experimenteel onderzoek is wellicht de meest bekende vorm van
effectonderzoek. Het belangrijkste verschil met de RCT is dat de onder-
zoeksgroepen niet speciaal voor het onderzoek worden samengesteld,
maar op een ‘natuurlijke wijze’ tot stand zijn gekomen (bijv. twee
bestaande schoolklassen of inspectieregio’s). Als we vinden dat de
resultaten van de experimentele groep aantoonbaar beter zijn dan die van
de controlegroep, ligt de conclusie voor de hand dat de interventie
daarvan de oorzaak is. Echter, dan moeten we tevens kunnen aantonen dat
beide groepen niet wezenlijk van elkaar verschillen en dus vergelijkbaar
zijn. In de praktijk is het niet altijd eenvoudig om dit hard te maken.
Daarmee rest bij quasi-experimenteel onderzoek altijd een bepaalde mate
van onzekerheid over de causale relatie tussen interventie en effect.
Experimenteel onderzoek
Experimenteel onderzoek in de vorm van RCT’s geldt als de meest
krachtige onderzoeksopzet als we uitspraken willen doen over de
effectiviteit van interventies. Omdat we in het voorafgaande deze opzet
uitgebreid hebben besproken, volstaan we op deze plaats met een
verwijzing daarnaar.
96 | Essaybundel Bewezen Beleid in het Onderwijs Ministerie van Onderwijs, Cultuur en Wetenschap
faalangsttraining veel betere resultaten oplevert dan andere methoden
waarover in de literatuur is gerapporteerd, of als uit drie grootschalige
correlationele studies blijkt dat er een sterke positieve relatie is tussen de
mate waarin leerkrachten zich de principes van goed klassenmanagement
eigen maken – en deze toepassen – en de mate waarin regelovertredend
gedrag in de klas afneemt, wat wil men daar dan aan onderzoek nog aan
toevoegen? Wij als onderzoekers willen graag voor alle zekerheid een studie
met de sterkste bewijskracht uitvoeren. Scholen en beleidsmakers zullen
ondertussen echter moeten beslissen of ze op de uitkomsten daarvan
wachten, of dat ze de leerlingen en leerkrachten al laten profiteren van de
nieuwe aanpakken. Het is te vergelijken met het besluit van een onderzoe-
ker om zich wel of niet aan een RCT te wagen. In dit krachtenveld hanteert
een ieder zijn standaarden: soms staat men al hoog genoeg op de ladder om
de risico’s van een besluit te kunnen overzien.
6.6 Slot
Hoewel het experimenteel onderzoek de sterkste bewijskracht heeft, laat de
effectvraag zich niet alleen met dit type studie beantwoorden. Sterker nog,
het kan voorbarig en bijzonder inefficiënt zijn om experimenteel onderzoek
uit te voeren bij interventies die niet eerst aan studies met een andere opzet
zijn onderworpen. Voor een goede ontwikkeling van een interventie zijn
verschillende typen onderzoek nodig die elk passen bij het stadium waarin
de ontwikkeling verkeert:
1 Beschrijvend onderzoek moet antwoord geven op de vragen als: welk
effect beoogt men, bij welke doelgroep en met welke activiteiten?
2 Literatuurstudie en onderzoek dat de inzichten van experts verheldert,
moet licht werpen op de vraag waarom men denkt dat deze interventie
zou kunnen werken, wat daarbij relevante factoren zijn en welke in dat
licht van belang zijn om in empirisch onderzoek te meten.
3 Onderzoek naar de doeltreffendheid moet de eerste indicaties geven dat
tijdens de uitvoering van de interventies de doelen worden bereikt,
problemen voldoende afnemen en de betrokkenen voldoende tevreden
zijn. Deze indicaties moeten ook aangeven of geavanceerder onderzoek
naar de werkzaamheid de moeite waard is.
4 Voor het beantwoorden van de vraag of de interventie de gevonden
resultaten ‘veroorzaakt’ is onderzoek nodig in de vorm van een RCT, een
herhaalde case study, of andere opzetten die licht werpen op de
causaliteit.
Kern bij dit alles is dat de ‘gouden standaard’ van het effectonderzoek niet
per definitie het laatstgenoemde type studie betreft. ‘Goud’ is het type
effectonderzoek dat past bij het ontwikkelingsstadium waarin een interven-
tie verkeert - passend onderzoek, zo men wil. De hoogste sport op de
effectladder levert de sterkste bewijskracht op, en daarmee veel zekerheids-
Ministerie van Onderwijs, Cultuur en Wetenschap Essaybundel Bewezen Beleid in het Onderwijs | 97
graden bij het nemen van de beslissing om wel of niet met een bepaalde
aanpak te werken. Dat neemt echter niet weg dat men bij andere vormen
van onderzoek dan het experimentele design soms al hoog genoeg op de
ladder staat om de risico’s van besluiten te overzien. Hogerop klimmen
kan altijd, maar is uit oogpunt van de benodigde bewijsvoering niet altijd
een absolute ‘must’.
98 | Essaybundel Bewezen Beleid in het Onderwijs Ministerie van Onderwijs, Cultuur en Wetenschap
Literatuur
Ministerie van Onderwijs, Cultuur en Wetenschap Essaybundel Bewezen Beleid in het Onderwijs | 99
07
De bijdrage van
internationaal
onderwijs
onderzoek
Dirk van Damme
Hoofd van het Centre for Educational Research
and Innovation (CERI), OESO (Parijs)
100 | Essaybundel Bewezen Beleid in het Onderwijs Ministerie van Onderwijs, Cultuur en Wetenschap
7.1 Inleiding
Het is een hardnekkig en door sommigen sterk gekoesterd idee dat
onderwijs zozeer met nationale traditie, cultuur, taal en geschiedenis is
verbonden dat het niet anders dan vanuit een nationaal perspectief
bestudeerd kan worden. In de politieke besluitvorming wordt elke stap
naar supra-nationale beleidsvoering met zeer veel tegenstand geconfron-
teerd. Denk maar aan de eensgezinde weigering van nationale staten om
de Europese Unie een heldere bevoegdheid over onderwijsaangelegenhe-
den te geven. Er is veel voor te zeggen om de Europese integratie ook door
middel van een Europees onderwijsbeleid vorm te geven, zeker wanneer
het sociaaleconomische en arbeidsmarktbeleid steeds meer op Europees
niveau worden aangestuurd. De Europese Commissie heeft via haar
mobiliteitsprogramma’s en andere instrumenten uiteraard de facto wel een
Europees onderwijsbeleid gevoerd, en met de ontwikkeling naar beleids-
instrumenten zoals de ‘open method of coordination’ en de Lissabon-
agenda zijn er ook op het vlak van onderwijs Europese beleidsdoelstellin-
gen legitiem geworden. Maar toch moet men vaststellen dat bij elke
herziening van de Europese verdragen het niet mogelijk blijft om ook
wettelijk te erkennen dat onderwijs niet langer meer exclusief door de
nationale context maar steeds meer door de internationale omgeving
wordt beïnvloed en aangestuurd.
Ministerie van Onderwijs, Cultuur en Wetenschap Essaybundel Bewezen Beleid in het Onderwijs | 101
helemaal niet geïsoleerd van de internationale context. Eigenlijk is er van
internationale interactie en zelfs convergentie in de ontwikkeling van
onderwijssystemen al erg vroeg sprake. Staatsvorming was in het
vroegmoderne Europa immers een erg complex gegeven en de consolida-
tie van de nationale staten heeft in Europa slechts in de negentiende en
eerste helft van de twintigste eeuw plaats gegrepen, dit wil zeggen nadat
de onderwijssystemen zich in hun basiskarakteristieken al tot ontplooiing
waren gekomen. Dat impliceert dat er al vroeg een vrij sterke gelijkvormig-
heid was in die basiskenmerken van het onderwijsbestel. Een twintigtal
jaar geleden heb ik dit proces in mijn proefschrift bestudeerd voor wat de
armenzorg en de pedagogische problematisering van de armoede betreft
(Van Damme, 1990). Soortgelijke vaststellingen kunnen worden gedaan
voor veel aspecten van moderne onderwijssystemen.
102 | Essaybundel Bewezen Beleid in het Onderwijs Ministerie van Onderwijs, Cultuur en Wetenschap
teit van moderne onderwijssystemen, ook zelf het gevolg van processen
van decentralisering en deregulering waardoor steeds meer actoren
betrokken worden bij sturingsprocessen, vraagt om steeds meer gesofisti-
ceerde informatie. In vergelijking met bijvoorbeeld de gezondheidszorg is
in onderwijs de kennisintensiviteit van sturingsprocessen nog steeds
eerder gering, maar ze is gedurende de voorbije decennia wel sterk
toegenomen. Wetenschappelijke ontwikkelingen maken de methoden
mogelijk om complexe onderwijs- en leerprocessen meetbaar te maken en
beleidsvoerders komen onder steeds grotere druk te staan van stakehol-
ders en de bredere samenleving om beleidskeuzes te legitimeren met
empirische ‘evidence’ (OECD/CERI, 2007).
Ministerie van Onderwijs, Cultuur en Wetenschap Essaybundel Bewezen Beleid in het Onderwijs | 103
tiedruk ging uitoefenen. Tegelijk veranderden ook de sturingsopvattingen
over onderwijs: er kwam steeds meer nadruk te liggen op outputfactoren
dan op input; het hernieuwde inzicht dat onderwijs een investeringsgoed
is deed beleidsvoerders de vraag stellen naar interne en externe efficiëntie
van onderwijsprocessen; het besef groeide dat onderpresterende scholen
een bedreiging vormden voor de effectiviteit van het gehele onderwijsbe-
stel, enz. De vragen die aan de wetenschappelijke onderwijskennis werden
gesteld veranderden, de steeds meer toegankelijke internationale
voorbeelden toonden aan dat die kennis ook kon aangeleverd worden, en
de druk nam toe om zich aan die internationale standaarden te meten
(Crossley & Watson, 2003).
104 | Essaybundel Bewezen Beleid in het Onderwijs Ministerie van Onderwijs, Cultuur en Wetenschap
geen enkele wetenschappelijk aanvaardbare meting van de geletterdheid
van de bevolking is uitgevoerd. Men hanteert gewoon het aantal mensen
dat minimaal vier jaar formele scholing heeft gelopen als maat voor het
aantal geletterden in de bevolking.
Het weinig bekende voorbeeld van Frankrijk is illustratief, waar tot op het
niveau van de president de discussie over de al dan niet publicatie van de
slechte Franse resultaten werd gevoerd en inderdaad tot de niet-publicatie
en de terugtrekking van Frankrijk uit het consortium werd besloten. De
publieke en politieke discussie over dergelijke data is natuurlijk het meest
zichtbaar, maar de reële impact van het meten en publiceren van vergelijk-
Ministerie van Onderwijs, Cultuur en Wetenschap Essaybundel Bewezen Beleid in het Onderwijs | 105
bare leerresultaten strekt veel verder: er zijn voorbeelden bekend van
belangrijke investeringsbeslissingen van multinationale ondernemingen
waarbij de beschikbaarheid van dergelijke gegevens een rol hebben
gespeeld. Sinds Finland in de PISA-rankings als het land met de beste
leerresultaten staat geboekstaafd, is er een constante stroom van
onderwijsprofessionals en -wetenschappers richting Finland op gang
gekomen, die allen het geheim van het Finse PISA-succes willen te weten
komen.
106 | Essaybundel Bewezen Beleid in het Onderwijs Ministerie van Onderwijs, Cultuur en Wetenschap
surveys van leerresultaten. Bij een aantal onder hen is die kritiek vaak erg
ideologisch getint en beschouwt men PISA en bij uitbreiding het interna-
tionale onderzoekswerk van de OESO als een exponent van een neolibe-
raal en marktgericht offensief in het onderwijs. Sotiria Grek (2009), Martin
Lawn en anderen in het Europees onderzoeksproject ‘Governing by
numbers’ bijvoorbeeld bekritiseren de drang van nationale onderwijsover-
heden om zich te ranken en te vergelijken met andere landen als een vorm
van vermarkten van het onderwijsbeleid. Spring (2008) vertolkt de wijd
verbreide mening dat PISA tot een algemene standaardisering van
curricula en onderwijsdoelen in functie van de globaliserende markteco-
nomie leidt. Nog anderen hebben PISA vooral op methodologische
gronden bekritiseerd, maar de meeste pogingen om dit te doen zijn van
een kale kermis teruggekomen: onafhankelijke methodologische reviews
hebben keer op keer de wetenschappelijke deugdelijkheid van de gehan-
teerde methodologie bevestigd.
Ministerie van Onderwijs, Cultuur en Wetenschap Essaybundel Bewezen Beleid in het Onderwijs | 107
tot negatievere resultaten zou kunnen leiden in plaats van tot de gewenste
verbetering. Internationale statistieken hebben ook de impliciete neiging
dat het gemiddelde of een ander punt op de schaal als een soort van
normatieve benchmark gaat opereren. Beleidsaanbevelingen maken op
grond van het afwijken van een bepaalde statistische norm is een
reductionistische en dus potentieel risicovolle onderneming. PISA-data en
andere vormen van internationaal onderwijsonderzoek moeten, mis-
schien meer nog dan uitkomsten van ander soort onderzoek, als een
uitnodiging worden gezien om dieper in de werkelijkheid af te dalen, en
niet als een soort eenvoudige statistische werkelijkheid die als norm
fungeert.
108 | Essaybundel Bewezen Beleid in het Onderwijs Ministerie van Onderwijs, Cultuur en Wetenschap
Literatuur
Cowen, R. & A.M. Kazamias (eds.) (2009). International Handbook of Comparative Education
(Dordrecht: Springer).
Crossley, M. & K. Watson (2003). Comparative and international research in education.
Globalization, context and difference (London: Routledge).
Daele, H. van (1993). L’Education comparée (Paris: PUF).
Damme, D. van (1990). Armenzorg en de staat. Comparatief-historische studie van de origines van
de moderne verzorgingsstaat in West-Europa (Gent: MIOS).
Damme, D. van (1998). ‘Wat leert ons de International Adult Literacy Survey?
Beleidsaanbevelingen op basis van de internationale en Vlaamse IALS-resultaten’,
Tijdschrift voor Onderwijsrecht en Onderwijsbeleid, 3-4, 248-261.
Damme, D. van(2009). ‘The search for transparency: convergence and diversity in the
Bologna process’, in: F. Van Vught (ed.), Mapping the higher education landscape. Towards
a European classification of higher education (Dordrecht: Springer), 39-56.
Doyle, A. (2008). ‘Educational performance or educational inequality: what can we learn
from PISA about France and England?’, Compare: A Journal of Comparative and International
Education, 38(2), 205-217.
Ertl, H. (2006). ‘Educational standards and the changing discourse on education: the
reception and consequences of the PISA study in Germany’, Oxford Review of Education,
32(5), 619-634.
Grek, S. (2009), ‘Governing by numbers: the PISA ‘effect’ in Europe’, Journal of Education Policy,
24(1), 23-37.
Grek, S. e.a. (2009). ‘National policy brokering and the construction of the European
Education Space in England, Sweden, Finland and Scotland’, Comparative Education, 45(1),
5-21.
Heinze, T. & Chr. Knill (2008). ‘Analysing the differential impact of the Bologna Process:
Theoretical considerations on national conditions for international policy convergence’,
Higher Education. 56, 493-510.
OECD/CERI (2007). Evidence in education. Linking research and policy (Paris: OECD).
Spring, J. (2008). ‘Research on globalization and education’, Review of Educational Research,
78(2), 330-363.
Ministerie van Onderwijs, Cultuur en Wetenschap Essaybundel Bewezen Beleid in het Onderwijs | 109
08
Evidence based
policy in
ontwikkelings
samenwerking10
Frans Leeuw
Directeur WODC
&
Jos Vaessen
Universitair docent, UM
10
Dank aan Rien Rouw, (OCW), voor suggesties met betrekking tot de redactie en de
bereidheid de samenvatting van het Nonie Guidance document (Leeuw & Vaessen, 2009)
te laten vertalen. Het belangrijkste deel van dit hoofdstuk is hierop gebaseerd.
110 | Essaybundel Bewezen Beleid in het Onderwijs Ministerie van Onderwijs, Cultuur en Wetenschap
8.1 Inleiding
Discussies over het belang van evidence based beleid en de rol van
evaluaties daarbij spelen niet alleen op het terrein van het onderwijs. In de
strijd tegen criminaliteit werd al in de jaren tachtig onder de titel ‘what
works’ intensief over een soortgelijk vraagstuk gesproken. Een hoogte-
punt werd midden jaren negentig bereikt toen de Amerikaanse Minister
van Justitie hoogleraar Lawrence Sherman verzocht de stand van zaken op
te maken van de vele honderden interventies én van de daarbij passende
evaluaties. Zijn vraag was wat er nu eigenlijk bekend was over de effectivi-
teit van interventies en hoe serieus (dat wil zeggen wetenschappelijk) dat
was vastgesteld. Het leidde tot een kloek rapport dat drie consequenties
had.
Ministerie van Onderwijs, Cultuur en Wetenschap Essaybundel Bewezen Beleid in het Onderwijs | 111
rapport van het Center for Global Development (2006) geconstateerd werd
dat er eigenlijk weinig bekend was over de ‘impact’ van de diverse vormen
van ontwikkelingssamenwerking. In belangrijke mate had dat te maken
met de aard van de evaluatieonderzoeken die bij honderden, zoniet
duizenden, jaarlijks verricht worden door de ‘evaluatie-industrie’ in dit
veld (vgl. Leeuw & Cooksey, 2005).
Net zoals dat door Sherman e.a. (1997) gebeurde, zette het rapport ‘When
will we ever learn’ van het Center for Global Development een beweging in
gang om meer werk te maken van ‘robuuste impactevaluaties’. Ook hier
niet zonder hevige discussies. Zo is beweerd dat de wereld van de ontwik-
kelingssamenwerking zich niet ‘zou lenen’ (om politieke en ethische
redenen) voor experimentele en quasi-experimentele effectstudies, dat de
studies data gebruiken die invalide en onbetrouwbaar zijn en dat alleen
korte-termijn-effecten op deze manier getraceerd worden. Voor evaluato-
ren die vooral experimenteel willen werken bestaat al een soort van
scheldwoord, de ‘randomistas’ (Leeuw & Vaessen, 2009; Ravallion, 2009).
Echter, ook hier is de ontwikkeling naar meer robuuste evaluaties evident.
Recente initiatieven zoals de “poverty action lab” en “poverty in action”
financieren en implementeren vooral studies gebaseerd op experimentele
ontwerpen. Andere organisaties zijn ook voorstander van dergelijke
benaderingen maar stimuleren een bredere waaier van robuuste metho-
den voor impact evaluatie. Voorbeelden zijn de Wereldbank en een
semi-private organisatie ‘International Initiative for Impact Evaluation’
(3ie). Ook bestaat er het NONIE, het ‘Network of Networks Impact
Evaluation Initiative’ (www.worldbank.org/ieg/nonie), dat zich ten doel
stelt kwalitatief sterke effectevaluaties te laten verrichten.
112 | Essaybundel Bewezen Beleid in het Onderwijs Ministerie van Onderwijs, Cultuur en Wetenschap
evaluatienetwerken van bilaterale en multilaterale ontwikkelingsorgani-
saties en netwerken van evaluatoren van ontwikkelingslanden. Deze
aangesloten netwerken voeren een breed pakket evaluaties uit, die zich
richten op zaken als de prestaties van projecten en strategieën, institutio-
nele ontwikkeling of de effectiviteit van hulp. De focus van NONIE is
echter meer toegespitst. Door het verspreiden van methodologische
benaderingen en het stimuleren van ‘learning by doing’ op het gebied van
impactevaluaties wil NONIE bevorderen dat de leden deze meer specifieke
aanpak gaan gebruiken in hun bredere evaluatieportefeuille.
Ministerie van Onderwijs, Cultuur en Wetenschap Essaybundel Bewezen Beleid in het Onderwijs | 113
Deze twee vooronderstellingen betekenen echter niet dat er een aantal
methoden en designs kan worden vastgesteld die in alle situaties te verkiezen
zijn boven alle andere. In dit stuk benadrukken we daarom dat:
■■ Er niet één beste methode is om in te gaan op de vele verschillende
Voor wie is de interventie van belang, wie zijn de stakeholders? Welke waarden en
belangen hebben die stakeholders?
■■ Verwoord zorgvuldig de theorie die aan de interventies ten grondslag
Hoe kun je vaststellen dat een interventie onlosmakelijk is verbonden met waargeno-
men effecten?
■■ Hanteer een mix van methoden (oftewel: werk in lijn van de logica van
114 | Essaybundel Bewezen Beleid in het Onderwijs Ministerie van Onderwijs, Cultuur en Wetenschap
Daarnaast hebben we drie richtlijnen voor het managen van impactevalua-
ties onderscheiden:
■■ Bepaal of een impactevaluatie haalbaar is en het geld waard is.
Omdat een impactevaluatie duur is, is het belangrijk om zich vooraf te verzekeren dat
de resultaten gebruikt gaan worden.
■■ Begin tijdig met het verzamelen van gegevens.
Schenk vanaf het begin van de evaluatie aandacht aan het latere gebruik ervan.
In de praktijk van het evalueren van beleid zijn vooral de punten 3 tot en
met 6 relevant. In de volgende paragrafen worden deze punten dan ook
verder toegelicht.
Nadat de veronderstellingen ten aanzien van het effect van een interventie
op resultaten en impacts zijn verwoord, moeten deze veronderstellingen
worden getoetst. Dit kan op twee manieren worden gedaan: door
zorgvuldig het causale ‘verhaal’ te construeren dat weergeeft hoe de
interventie tot resultaten heeft geleid (bijvoorbeeld met behulp van
‘causal contribution analysis’), of door de causale veronderstellingen
formeel te toetsen aan de hand van geschikte methoden.
Ministerie van Onderwijs, Cultuur en Wetenschap Essaybundel Bewezen Beleid in het Onderwijs | 115
invloed kunnen hebben op ‘wat heeft plaatsgevonden’, is het bij een
impactevaluatie juist wezenlijk om verder te kijken, om inzicht te krijgen
in de toegevoegde waarde van de betreffende beleidsinterventie, los van die andere
factoren.
a
➜Value target variable
Before After
Time ➜
116 | Essaybundel Bewezen Beleid in het Onderwijs Ministerie van Onderwijs, Cultuur en Wetenschap
Bij het uitvoeren van impactevaluaties is er geen ‘gouden standaard’ (in de
zin van één methode of design die in alle gevallen het beste is). Afhankelijk
van factoren zoals de reikwijdte, de doelstellingen en het ontwerp van de
interventie, en de beschikbaarheid van gegevens, kunnen in specifieke
gevallen bepaalde methoden/designs beter zijn dan andere.
Ministerie van Onderwijs, Cultuur en Wetenschap Essaybundel Bewezen Beleid in het Onderwijs | 117
118 | Essaybundel Bewezen Beleid in het Onderwijs Ministerie van Onderwijs, Cultuur en Wetenschap
Pijplijnbenaderingen zijn echter alleen betrouwbaar als de behandelings-
en de controlegroep dezelfde kenmerken hebben. Er kan een selectiebias
ontstaan door zelfselectie (wie het liefst wil deelnemen, komt het eerst
aan de beurt) of door geografische vertekeningen (zoals een verschuiving
van landelijke naar stedelijke gebieden).
Ministerie van Onderwijs, Cultuur en Wetenschap Essaybundel Bewezen Beleid in het Onderwijs | 119
Omgaan met niet-waarneembare variabelen en endogeniteit: bij ‘differen-
ce-in-difference’-benaderingen in een regressiemodel, die onderzoeken
hoe groepen in de loop van de tijd veranderen, kunnen niet-waargenomen
(tijdsinvariante) variabelen wegvallen uit de vergelijking. De benadering is
vergelijkbaar met een regressiemodel met vaste effecten. ‘Instrumentele
variabelen’ kunnen behulpzaam zijn bij endogeniteit, omdat een goed
instrument correleert met de originele endogene variabele in de vergelij-
king, maar niet met de ‘error term’. De ‘difference-in-difference’-methode
is echter gevoeliger voor meetfouten in de gegevens dan andere methoden
en afhankelijk van de beschikbare gegevens is het niet altijd mogelijk om
goede instrumenten te vinden.
120 | Essaybundel Bewezen Beleid in het Onderwijs Ministerie van Onderwijs, Cultuur en Wetenschap
settings. Toch kunnen ze bij impactevaluaties wel nuttig zijn om informa-
tie te verkrijgen over de reikwijdte, de doelstellingen en de onderliggende
interventietheorie, en ook om gegevens en bewijsmateriaal te genereren
of aan te vullen.
Participatieve benaderingen zijn van een geheel andere signatuur. Het zijn
niet-kwantitatieve instrumenten, die uitgaan van het principe dat
stakeholders moeten worden betrokken bij bepaalde of alle fasen van de
evaluatie. In het geval van impactevaluatie gaat het daarbij onder meer om
aspecten zoals het vaststellen van de doelstellingen, de in aanmerking te
nemen indicatoren en deelname van stakeholders aan het verzamelen en
analyseren van gegevens. De diverse methoden in deze categorie berusten
op verschillende maten van participatie, uiteenlopend van raadpleging tot
samenwerking tot gezamenlijke besluitvorming. Participatieve benaderin-
gen kunnen handig zijn om te komen tot een meer volledige en/of meer
geschikte reeks gewaardeerde impacts, meer betrokkenheid en meer
begrip tussen stakeholders onderling, en beter inzicht in veranderingspro-
cessen en de manieren waarop mensen door interventies worden
beïnvloed. Maar hoe hoger de mate van participatie, des te kostbaarder en
lastiger het is om een impactevaluatie op te zetten. Participatieve
benadering is dan ook ongeschikt voor grootschalige, uitgebreide
interventies zoals sectorprogramma’s. Bovendien kleven er serieuze
nadelen aan de validiteit van informatie die uitsluitend is gebaseerd op de
beleving en ervaringen van stakeholders. Tot slot kan de validiteit van de
gegevensverzameling en -analyse ook nog worden beïnvloed doordat
stakeholders strategische antwoorden geven, gegevens manipuleren of
bepaalde belangen op de voorgrond plaatsen.
In het algemeen geldt voor impactevaluaties dat, met het oog op het
attributieprobleem, goed ontworpen kwantitatieve methoden doorgaans
de voorkeur hebben. Kwalitatieve technieken kunnen de veranderingen
die aan interventies zijn toe te schrijven, niet kwantificeren, maar moeten
wel worden gebruikt om belangrijke aspecten te evalueren waarvoor
kwantificering niet mogelijk of niet praktisch is en om aanvullende en
diepgaande perspectieven op veranderingsprocessen ten gevolge van
interventies te ontwikkelen.
Ministerie van Onderwijs, Cultuur en Wetenschap Essaybundel Bewezen Beleid in het Onderwijs | 121
Deze vier soorten zijn:
■■ Interne validiteit: vaststellen dat er een causaal verband is tussen de
andere settings.
■■ Statistische conclusievaliditeit: bij kwantitatieve technieken, waarbor-
Qua interne validiteit zijn RCT’s aantoonbaar beter dan de meeste andere
methoden. Als ze goed zijn ontworpen, kan de counterfactual worden
vastgesteld; de gerandomiseerde projectvoordelen (binnen een relatief
homogene populatie) zorgen ervoor dat er geen systematische verschillen
zijn tussen de ontvangers en de niet-ontvangers van de voordelen. Echter
RCT’s controleren op verschillen tussen groepen binnen de specifieke
setting waarop de evaluatie betrekking heeft. Andere settings hebben
andere kenmerken die niet worden gecontroleerd, zodat de externe
validiteit van dergelijke RCT’s beperkt kan zijn, tenzij er een systematische
en grote reeks RCT’s is uitgevoerd, die de interventie evalueren over het
gehele spectrum van daadwerkelijk voorkomende settings en beleidsop-
ties. Dit is in de meeste gevallen niet haalbaar of onrealistisch.
Ook kan er een mix van methoden worden gebruikt, ‘triangulatie’ van
informatie van verschillende benaderingen, om verschillende facetten van
122 | Essaybundel Bewezen Beleid in het Onderwijs Ministerie van Onderwijs, Cultuur en Wetenschap
complexe uitkomsten of impacts te beoordelen, wat een grotere validiteit
oplevert dan één enkele methode. Als het bijvoorbeeld gaat om de impact
van stimuleringsmaatregelen op de benutting van het arbeidspotentieel
en de middelen van bestaan van boeren, kan de effectiviteit van verschil-
lende afzonderlijke maatregelen voor arbeid en inkomenseffecten worden
getoetst met een gerandomiseerd experiment (toetsing van de interne
validiteit). Deze analyse kan worden verdiept aan de hand van onderzoeks-
gegevens en casestudy’s door te kijken naar de verdeling van deze effecten
over verschillende soorten boerenhuishoudens (triangulatie met de
RCT-informatie over de interne validiteit en vergroting van de externe
validiteit). Daarnaast kunnen semi-gestructureerde interviews en
focusgroepgesprekken meer algemene informatie opleveren over de aard
van de effecten in termen van productie, consumptie, armoede enz.
(vaststelling van de constructvaliditeit).
Een laatste punt is dat een analyse van de verdeling van kosten en baten als
gevolg van een interventie, waarbij onderscheid wordt gemaakt tussen
bereik, effecten voor direct betrokkenen en indirecte effecten, niet met
één bepaalde methode kan worden uitgevoerd. Wie in al deze aspecten is
geïnteresseerd, zal onvermijdelijk een combinatie van meerdere metho-
den en bronnen moeten gebruiken.
8.2.6 Maak gebruik van bestaande kennis over de impact van interventies
Review- en synthesemethoden kunnen een centrale rol spelen bij het
bundelen van bestaande kennis om de kracht en de validiteit van een
impactevaluatie te vergroten, om bij te dragen tot toekomstige kennisop-
bouw en om in de informatiebehoefte van stakeholders te voorzien.
Ministerie van Onderwijs, Cultuur en Wetenschap Essaybundel Bewezen Beleid in het Onderwijs | 123
impact van een vergelijkbare reeks interventies uit een aantal afzonder-
lijke studies uit verschillende omgevingen. Hierbij wordt een vaste
procedure gevolgd om geschikte kennis te zoeken en te selecteren,
gewoonlijk aan de hand van een hiërarchie van methoden, waarbij
robuuste kwantitatieve (experimentele) studies hoger scoren in de
hiërarchie van informatiebronnen.
■■ ‘Narrative reviews’ zijn verslagen van interventieprocessen en/of
resultaten van een reeks interventies, waarbij wordt uitgegaan van een
gezamenlijk analytisch kader en sjabloon om gegevens uit de afzonder-
lijke studies te extraheren en de voornaamste bevindingen samen te
vatten in een narratief verslag en/of tabellen en matrices waarin
belangrijke aspecten van de interventies worden weergegeven.
■■ ‘Realist’ syntheses zijn ‘theory-driven’ en maken expliciet niet gebruik
Tot zover de kern van het NONIE Guidance Document on Impact Evaluation
and Development (Leeuw & Vaessen, 2009).
Tot slot stellen we de vraag wat de kans op een succesvol gebruik van dit
‘handboek’ van NONIE is. In hoeverre draagt het bij aan betere evaluaties
en meer evidence-based ontwikkelingssamenwerking?
Ten eerste is er, in lijn met de titel van het rapport van het Center for
Global Development (‘When will we ever learn’), in brede zin een behoefte
om echt te weten wat wel, wat niet of minder en wat anders werkt. Ten
tweede staan in de wereld van ontwikkelingssamenwerking veel zaken in
het teken van ‘leren’ van ervaringen uit het verleden. Dit zien we ook in
Nederland. Debatten in de Tweede Kamer over de effectiviteit van beleid
op het terrein van ontwikkelingssamenwerking, de positie en deskundig-
heid van de Inspectie Ontwikkelingssamenwerking en Beleidsevaluatie
(IOB) van het Ministerie van Buitenlandse Zaken en specifieke IOB
evaluatierapporten laten dat goed zien (Van Gils & Leeuw, in
voorbereiding).
124 | Essaybundel Bewezen Beleid in het Onderwijs Ministerie van Onderwijs, Cultuur en Wetenschap
Ten derde stimuleert de Minister van Ontwikkelingssamenwerking,
Koenders, wat hij zelf noemt, slim effectiviteitonderzoek. Theoriegestuurd
impact onderzoek, zoals hierboven toegelicht, maakt daar een essentieel
onderdeel van uit. Ten vierde maakt de Inspectie Ontwikkelings
samenwerking en Beleidsevaluatie sinds enkele jaren een duidelijke
beweging juist naar het doen en uitbesteden van meer robuuste impacte-
valuaties, waarbij experimentele en quasi-experimentele designs niet
uitgesloten worden, maar juist opgezocht worden.
Ministerie van Onderwijs, Cultuur en Wetenschap Essaybundel Bewezen Beleid in het Onderwijs | 125
Literatuur
Center for Global Development, (2006) When Will We Ever Learn? Improving Lives through
Impact Evaluation, Report of the Evaluation Gap Working Group, Center for Global
Development, Washington, DC.
Gils, G.H.C. van & Frans L. Leeuw (in druk), Leren van evalueren (op de Apenrots) (werktitel);
een onderzoek naar de benutting van evaluatieonderzoek bij het Ministerie van
Buitenlandse Zaken.
Kleemans, Edward, Carolien Klein Haarhuis, Frans Leeuw en Marianne van Ooyen-Houben,
Law enforcement interventions in the Netherlands: mapping interventions and ‘browsing’
for evidence, in: Evidence & Policy, (4), 2007: 487-504.
Knaap, L.M. van der, F.L. Leeuw, S. Bogaerts en L.T.J. Nijssen (2008) “Combining Campbell
standards and the realist evaluation approach—the best of two worlds?” American Journal
of Evaluation 29(1), 48–57.
Laar, M. van & M. van Ooyen-Houben (red) (2009), Evaluatie van het Nederlandse
drugsbeleid, Trimbos Instituut & WOdC, Den Haag/Utrecht.
Leeuw,Frans & Jos Vaessen (2009), Impact Evaluations and Development, Nonie Guidance
on Impact Evaluation, Worldbank, Washington.
Leeuw, Frans L. and Leslie Cooksy, Evaluating the performance of development agencies: the
role of meta-evaluations, in: G. Keith Pitman et al (eds), Evaluating development effectiveness,
World Bank Series on Evaluation and Development, Vol 7, Transaction Publishers, Rutgers,
2004: 85-108.
Nelen, Hans. ‘Evidence maze; het doolhof van het evaluatieonderzoek’, Oratie Universiteit
Maastricht, 2008.
Ravallion (2009), Should the randomistas rule? The Berkeley Electronic Press, Economists’ Voice,
www.bepress.com/ev February, 1-5.
Sherman, L.W., D.C. Gottfredson, D.L. MacKenzie, J.E. Eck, P. Reuter, & S.D. Bushway (1997).
Preventing crime: What works, what doesn’t, what’s promising, Washington, National
Institute of Justice, US Department of Justice.
Wartna, B. (2009), In de oude fout, Dissertatie Universiteit Leiden, Leiden, Boom Juridische
Uitgeverij/WODC, Den Haag.
126 | Essaybundel Bewezen Beleid in het Onderwijs Ministerie van Onderwijs, Cultuur en Wetenschap
Ministerie van Onderwijs, Cultuur en Wetenschap Essaybundel Bewezen Beleid in het Onderwijs | 127
09
Helpen straffen.
Evidence based
policy op het terrein
van Justitie
Bouke Wartna
Senior onderzoeker, WODC
128 | Essaybundel Bewezen Beleid in het Onderwijs Ministerie van Onderwijs, Cultuur en Wetenschap
Stel dat de rechters in ons land zouden beschikken over een sanctie die
elke delinquent ervan weerhoudt ooit nog een delict te plegen. Zouden
we deze sanctie dan altijd toegepast willen zien? Natuurlijk – zou men
op het eerste gezicht zeggen, maar bij nader inzien is deze kwestie toch
wat ingewikkelder. Strafrechtelijke interventies moeten aan tal van
eisen voldoen. Op de eerste plaats moet de straf ethisch aanvaardbaar
zijn. Ze moet passen in onze eigen sociaal-culturele en juridische
kaders en overeenstemmen met de internationale verdragen die op dit
terrein geldig zijn. We willen in Nederland geen draconische maatrege-
len zoals lijfstraffen, doodstraf of levenslange opsluiting. Aan de
andere kant willen we wel dat het straffen van de dader genoegdoening
oplevert voor het slachtoffer en voor samenleving in het geheel. En er
moet een element van leedtoevoeging aankleven, al was het maar om
anderen, potentiële daders, af te schrikken. De uitvoerbaarheid van de
sancties en de kosten ervan vormen tot slot uiteraard ook nog een
overweging.
Een aanvaardbare sanctie die elke delinquent weerhoudt ooit nog een
delict te plegen bestaat niet. Dat maken de cijfers van figuur 1 snel
duidelijk. De figuur geeft de ontwikkeling te zien in de prevalentie van de
strafrechtelijke recidive van personen die tussen 1997 en 2004 in
Nederland in aanraking zijn gekomen met justitie. De cijfers zijn afkomstig
uit de Recidivemonitor, een doorlopend onderzoeksproject van het weten-
schappelijk onderzoek- en documentatiecentrum (WODC) van het
Ministerie van Justitie. Het onderzoek brengt de terugval in kaart van
praktisch iedereen die wegens het plegen van een misdrijf werd vervolgd
en bestraft. De grafiek onderscheidt vier daderpopulaties: volwassen
daders, jeugdige daders, en twee groepen die daarvan een selectie
vormen, de ex-gedetineerden en de jongeren die uitstroomden uit een
justitiële jeugdinrichting. In de laatste twee groepen is de strafrechtelijke
recidive het hoogst. Daarnaast wordt duidelijk dat jongeren over het
algemeen vaker recidiveren dan volwassenen. Dat wil zeggen: personen
die op jonge leeftijd in contact komen met justitie vertonen een hoger
risico om in het systeem terug te keren dan personen die op latere leeftijd
worden vervolgd.11
Ministerie van Onderwijs, Cultuur en Wetenschap Essaybundel Bewezen Beleid in het Onderwijs | 129
Figuur 1 Gecorrigeerde percentages algemene recidive twee jaar na oplegging van de
straf c.q. vertrek uit de inrichting; naar jaar van oplegging/uitstroom
70
60
50
percentage recidivisten
40
30
20
10
0
1997 1998 1999 2000 2001 2002 2003 2004
ex-JJI-pupillen 60,2 57,6 58,4 57,4 57,5 53,5 56,1 54,3
ex-gedetineerden 55,1 55,7 57,3 58,9 60,1 60,6 60,4 58,6
jeugdige daders 36,1 37,2 36,5 37,1 37,5 39,4 41,1 41,6
volwassen daders 26,1 27,2 26,6 27,3 28,0 29,0 29,2 29,1
12
Deze doelstelling geldt voor de recidive gemeten bij een observatieperiode met een lengte
van 7 jaar. De prevalentie van de 2-jarige recidive moet met respectievelijk 7,7 en 5,8
procentpunten omlaag.
130 | Essaybundel Bewezen Beleid in het Onderwijs Ministerie van Onderwijs, Cultuur en Wetenschap
Een deel van dat vertrouwen berust op denkbeelden uit de criminologie.
In de jaren negentig van de vorige eeuw deed zich een omslag voor in het
denken over interventiestrategieën voor justitiabelen. Jarenlang heerste er
een zeker pessimisme over de mogelijkheden van het strafrecht om
delinquenten te verbeteren. Het motto gold: ‘nothing works’. Maar op een
goed moment drongen vanuit Canada en de Verenigde Staten nieuwe
geluiden door over de ‘rehabilitation of offenders’. Auteurs als Palmer
(1975), Gendreau & Ross (1979, 1987) en Andrews & Bonta (1995, 2003)
toonden met empirisch onderzoek aan dat interventies in een justitiële
setting wel degelijk succesvol kunnen zijn, mits zij zijn afgestemd op het
recidiverisico, de leerstijl en de specifieke criminogene factoren van de
betreffende dadergroep. Deze drie aspecten zijn nog steeds de basisprinci-
pes van wat wordt gezien als ‘effectieve interventies’ op het terrein van
criminal justice. Het zijn de hoekstenen van wat in de criminologie bekend is
komen te staan onder de ‘what works’-benadering, een sterk op de
uitvoeringspraktijk gerichte beweging waarin men met empirisch
onderzoek tracht na te gaan onder welke condities strafrechtelijke
interventies uitzicht bieden op preventie.
Ministerie van Onderwijs, Cultuur en Wetenschap Essaybundel Bewezen Beleid in het Onderwijs | 131
Box: 1 Kwaliteitscriteria voor interventies gericht recidivereductie
1 Theoretische onderbouwing: de gedragsinterventie is gebaseerd op een analyse van het delictgedrag en een expliciet
veranderingsmodel waarvan de werking wetenschappelijk is aangetoond.
2 Selectie van justitiabelen: het type justitiabele waarop de gedragsinterventie zich richt wordt duidelijk gespecificeerd en
geselecteerd.
3 Dynamische criminogene en protectieve factoren: de gedragsinterventie is gericht op het beïnvloeden van veranderbare
risicofactoren en op protectieve factoren die samenhangen met het criminele gedrag.
4 Effectieve (behandel)methoden: er worden (behandel)methoden toegepast die aantoonbaar effectief of veelbelovend
zijn.
5 Vaardigheden: de aanpak is mede gericht op het leren van praktische, sociale en probleemoplossende vaardigheden.
6 Fasering, intensiteit en duur: de intensiteit en duur van de gedragsinterventie sluit aan bij de problematiek van de
deelnemer.
7 Betrokkenheid en motivatie: betrokkenheid van de deelnemer bij de gedragsinterventie en motivatie voor deelname
moeten worden bevorderd en gestimuleerd.
8 Continuïteit: er moeten duidelijke verbindingen zijn tussen de gedragsinterventie en de totale begeleiding van de
justitiabele.
9 Interventie-integriteit: de gedragsinterventie wordt uitgevoerd zoals het bedoeld is.
10 Evaluatie: een doorlopende evaluatie geeft inzicht in de effectiviteit van de gedragsinterventie.
132 | Essaybundel Bewezen Beleid in het Onderwijs Ministerie van Onderwijs, Cultuur en Wetenschap
9.2 De eis tot evaluatie
In november 2009 vond in Utrecht een conferentie plaats over de positie
van de erkenningscommissie. Beleidsmedewerkers, veldorganisaties,
methodiekontwikkelaars en onderzoekers wisselden van gedachten en
spraken over hun ervaringen met de procedures die het werk van de
commissie omgeven. De erkenningscommissie riep die dag –bedoeld of
onbedoeld - het beeld op van een strenge, soms wat onbegrepen maar
altijd gerespecteerde schoolmeester die niet van plan is zijn normen bij
het nakijken van het huiswerk te verlichten. De uitvoeringsorganisaties
- men moet hier denken aan de reclasseringsinstellingen, penitentiaire
inrichtingen of de Raad voor de Kinderbescherming - onderschrijven de
koers die het beleid heeft ingezet, maar kreunen onder het vele werk dat
vastzit aan ‘het ontwikkelen, beschrijven, beoordelen, implementeren en
evalueren van gedragsinterventies’. Zij zoeken –en niet geheel onterecht
– hulp bij beleid, onderzoek en wetenschap.
Ministerie van Onderwijs, Cultuur en Wetenschap Essaybundel Bewezen Beleid in het Onderwijs | 133
derzoek tijd vergt. Om de eventuele terugval betrouwbaar te meten, geldt
een observatieperiode van een zekere minimale duur, meestal is dat twee
jaar. Bovendien kan het recidiveonderzoek pas beginnen als de interventie
vaste grond onder de voeten heeft gekregen. Bij de implementatie van
daderprogramma’s doen zich hoe dan ook kinderziekten en aanlooppro-
blemen voor. Zolang de opzet van het programma nog belangrijke
bijstellingen ondergaat, heeft het geen zin een recidivemeting te starten.
Tegen de tijd dat de meting is afgerond, is het programma immers
gewijzigd en heeft men uitkomsten in handen van iets dat niet meer
bestaat.
Sinds de jaren zeventig van de vorige eeuw zijn tot in 2008 meer dan
honderd van dergelijke recidivestudies verschenen. Geen enkele evaluatie
maakte gebruik van random toewijzing (score 5). In Nederland en België
zijn, als het gaat om de evaluatie van strafrechtelijke interventies met
behulp van recidivecijfers, geen voorbeelden van RCT´s bekend. In meer
dan 40% van de gevallen ontbrak het helemaal aan een vergelijkingsgroep,
alleen de recidive in de behandelde groep werd berekend (score 2). De
scores 3 en 4 horen bij het quasi-experimentele onderzoek. Dit is onder-
zoek waarbij geen sprake is van random toewijzing maar waarbij wel wordt
gewerkt met controlegroepen. Ongeveer een kwart van de studies heeft
een SMS-score van 4. Bij studies van niveau 4 wordt een vorm van
statistische controle gebruikt om rekening te houden met instroomver-
schillen tussen deelnemers en leden van de controlegroep. In slechts
twaalf van de 102 gevallen waren de aantallen in de behandel- en de
controlegroep groot genoeg voor een ‘power’ van 70% of meer. De power
is de zekerheid waarmee een bestaand verschil in de hoogte van de
recidive kan worden gevonden. Deze moet uiteraard zo hoog mogelijk
zijn, anders loopt men het gevaar dat men op basis van het onderzoek een
onjuiste conclusie trekt.
134 | Essaybundel Bewezen Beleid in het Onderwijs Ministerie van Onderwijs, Cultuur en Wetenschap
Tabel 1 Onderzoeksdesign van Nederlandse en Vlaamse evaluaties
van strafrechtelijke interventies waarbij gebruik is gemaakt
van recidivecijfers; naar jaar van publicatie
Score
≤ 1979 5 3 6 0 14
1980-1989 3 4 2 0 9
1990-1999 23 12 11 0 46
≥ 2000 13 13 8 0 33
Totaal 44 32 27 0 102
Ministerie van Onderwijs, Cultuur en Wetenschap Essaybundel Bewezen Beleid in het Onderwijs | 135
De evaluatieketen van daderprogramma’s
Uitvoering
Ontwerp Implementatie Consolidatie
ti t0 tpi tn trm
output&impact outcome
136 | Essaybundel Bewezen Beleid in het Onderwijs Ministerie van Onderwijs, Cultuur en Wetenschap
moeten zijn van het antwoord op de vraag of men binnen vijf jaar de
resultaten van een state of the art-recidiveonderzoek kan overleggen. Veel
meer moet het gaan om de vraag hoe de evidence base die de interventie
onderstut, kan worden verstevigd met eigen onderzoek.
Ministerie van Onderwijs, Cultuur en Wetenschap Essaybundel Bewezen Beleid in het Onderwijs | 137
Literatuur
Andrews, D.A., & Bonta, J. (2003). The psychology of criminal conduct (3e ed.). Cincinnati, OH:
Anderson Publishing.
Andrews, D.A. (1995). The psychology of criminal conduct and effective treatment. In J.
McGuire (red.), What works. Reducing reoffending. Guidelines from research and practice (35-62).
New York: John Wiley and sons.
Erkenningscommissie (2005). Erkenningscommissie gedragsinterventies Justitie. Den Haag:
Farrington, D.P., Gottfredson, D.C., Sherman, L.W., & Welsh, B.C. (2002). The Maryland
Scientific Methods Scale. In L.W. Sherman, D.P. Farrington, B.C. Welsh & D.L. MacKenzie (red.),
Evidence-based crime prevention (13-21). Londen: Routledge.
Gendreau, P., & Ross, R.R. (1979). Effective correctional treatment. Bibliotherapy for cynics. Crime
and Delinquency, 25, 463-489.
Gendreau, P., & Ross, R.R. (1987). Revivification of rehabilitation: Evidence from the 1980s.
Justice Quarterly, 4, 349-407.
Ministerie van Justitie. VbbV (2007). Veiligheid begint bij Voorkomen: Voortbouwen aan een
veiliger samenleving. Den Haag: Ministerie van Justitie/Ministerie van Binnenlandse Zaken en
Koninkrijksrelaties.
Palmer, T. (1975). Martinson revisited. Journal of Research in Crime and Delinquency, 12(2),
133-152.
Sherman, L.W. (1997) Thinking about crime. In L.W. Sherman, D.C. Gottfredson, D.L. MacKenzie,
J. Eck, P. Reuter & S.D. Bushway (red.), Preventing crime: What works, what doesn´t, what´s
promising. Washington, DC: National Institute of Justice, US Department of Justice.
Veerman, J.W. (2006). Meer zicht op effectieve jeugdzorginterventies via praktijkgestuurd
effectonderzoek. Kind en Adolescent, 27(4), 245-248.
Wartna, B.S.J. (2009) In de oude fout. Over het meten van recidive en het vaststellen van het succes van
strafrechtelijke interventies. Den Haag, Boom Juridische uitgevers.
138 | Essaybundel Bewezen Beleid in het Onderwijs Ministerie van Onderwijs, Cultuur en Wetenschap