Nederlandse kiezers als kuddedieren; zetelpeilingen als self-fulfilling prophecies
Een ingekorte versie van dit artikel stond donderdag 5 juli in NRC-Handelsblad
Berichtgeving over opiniepeilingen zetten Nederlanders aan tot meelopersgedrag
Tom van der Meer & Armèn Hakhverdian
Tien weken voor de Tweede-Kamerverkiezingen worden we weer bestookt met zetelpeilingen. Zoals bij elke verkiezing waarschuwen politicologen opnieuw voor mogelijke perverse effecten van opiniepeilingen. Zo zouden kiezers bijvoorbeeld de neiging hebben om op partijen te stemmen die het goed doen in de peilingen. Tot nu toe was er geen direct bewijs voor dit zogenaamde bandwagon effect. Bestaand onderzoek bestond vooral uit experimenten onder studenten met verzonnen peilingen. Maar of feitelijke peilingen daadwerkelijke kiezers ook echt beïnvloeden, bleef onduidelijk. Tot nu.
Experiment
Om vast te stellen of (Nederlandse) kiezers zich laten beïnvloeden door realistische peilingen hebben we daarom met medewerking van EenVandaag een experiment uitgevoerd onder het EenVandaag Opiniepanel. Ruim 23.000 deelnemers werden half mei automatisch ingedeeld in willekeurige groepen. De deelnemers kregen een uitgebreide vragenlijst voorgelegd, waarbij slechts één vraag per groep verschilde. We stelden alle groepen bloot aan dezelfde feitelijke uitslag van peil.nl van het voorgaande weekend, maar met verschillende begeleidende teksten over de PvdA. Deze tekst varieerde van positief over de PvdA (‘groei sinds vertrek Cohen’) via neutraal (‘nagenoeg onveranderd sinds vorige week’) tot negatief (‘verlies sinds 2010’). Eén groep kreeg alleen de droge peilingsuitslag te zien zonder enige tekstuele duiding en een laatste groep kreeg in het geheel geen peilingsuitslag te lezen. Uiteindelijk stelden we in alle groepen dezelfde slotvraag: hun stemintentie.
De uitkomsten van het onderzoek wijzen op een bandwagon effect, maar niet zoals we die ons vaak voorstellen. De droge uitkomst van de peiling beïnvloedt de kiezers geenszins: ongeacht het zien van een peiling steunde 15,2% de PvdA. Een neutrale duiding heeft nauwelijks invloed. Maar op basis van precies diezelfde peiling met een positieve duiding, kreeg de PvdA liefst 17,1% van de stemmen. Blootstelling aan peilingen an sich heeft geen consequentie voor stemgedrag; het is de interpretatie daaromheen die het verschil maakt. Meelopersgedrag dus.
Dit bandwagon effect is statistisch zwak (nipt significant), maar in maatschappelijk opzicht fors: een enkele peiling leidde al tot drie extra Kamerzetels voor de PvdA. Met die extra zetels zou de PvdA in 2010 het voortouw hebben bij de regeringsformatie, niet de VVD. Ook in 2006 was de PvdA met die drie zetels erbij groter geweest dan het CDA.
We benadrukken dat dit verschil van 3 zetels een zeer conservatieve schatting van het bandwagon effect is. Ten eerste ontvangen kiezers over het algemeen informatie over peilingen over een langere periode en via verschillende kanalen. Het effect dat wij hebben gevonden werkt dus ‘in de echte wereld’ hoogstwaarschijnlijk op cumulatieve wijze. Daarnaast werkt het EenVandaag Opiniepanel met zelf-aanmelding, waardoor de kiezers in dit panel op een aantal cruciale punten (opleiding, politieke interesse, etc.) afwijken van de gemiddelde kiezer. Als we ons experiment hadden uitgevoerd onder een meer representatieve steekproef was het effect hoogstwaarschijnlijk groter aangezien doorsnee kiezers minder resistent zijn voor media-effecten dan die van het panel. Bovendien had de daadwerkelijke peiling (van zondag) al enkele dagen via de media doorgewerkt op de attitudes van de deelnemers van het EenVandaag Opiniepanel. Het effect was dus al deels verdisconteerd.
Opiniepeilingen creëren de werkelijkheid die ze willen rapporteren
Nederlandse kiezers vertonen dus kuddegedrag: ze stemmen graag op een winnaar. Dit is op zich niet erg. Het is volstrekt legitiem als kiezers hun stem bepalen op basis van trends in opiniepeilingen. Althans, dat is niet beter of slechter dan stemmen op basis van traditie, verkiezingsprogramma’s, Stemwijzers of het kontje van de lijsttrekker. Maar dan moet de berichtgeving over opiniepeilingen wel kloppen.
En daar gaat het consequent fout.
Wekelijks halen opiniepeilers het nieuws door de laatste verschuivingen in hun onderzoek te rapporteren. Bijna al die (twee-)wekelijkse verschuivingen zijn echter betekenisloos en niet-significant. Ze zijn het resultaat van meetonzuiverheid, niet van daadwerkelijke verschuivingen onder het Nederlandse electoraat. Desondanks lezen we in de media over grote winsten en historische dieptepunten van politieke partijen. Want, zo stellen peilers regelmatig, ze beschrijven de uiteindelijke langere trend toch goed? Als het de peilers daadwerkelijk gaat om ontwikkelingen op de langere termijn lijkt het ons volkomen overbodig om wekelijks in persberichten verslag te doen van minimale verschuivinkjes. Presenteer dan alleen (maandelijkse) verschuivingen die ook daadwerkelijk onder de Nederlandse bevolking voorkomen, niet verschuivingen die van week tot week het resultaat zijn van statistische ruis.
Een groter probleem is dat peilers en media die trends deels zelf creëren. Burgers gaan zich ernaar gedragen, waarmee zetelpeilingen een self-fulfilling prophecy worden.
Lui en ontoelaatbaar
Zo beschouwd hebben de wekelijkse zetelpeilingen inderdaad perverse effecten. De verantwoordelijkheid hiervoor ligt keihard bij de media. Immers, kiezers worden niet beïnvloed door de peilingen zelf, maar door de vaak onjuiste rapportage daarover. Ook Peter Kanne (TNS-Nipo) en Reinier Heutink (Ipsos Synovate) beklaagden zich daar recent over. En terecht. Zo lazen we deze week van persbureau Novum: ‘De partij van Jolande Sap daalt van vijf naar vier zetels in de peiling van TNS Nipo.’ En het ANP bracht: ‘De VVD heeft twee zetels verloren in de wekelijkse politieke peiling van Maurice de Hond en staat nu op 26 Kamerzetels.’ Die uitspraken zijn boterzacht, maar beïnvloeden kiezers wel degelijk.
Het kan ook anders. In de aanloop naar de Franse presidentsverkiezingen verscheen de ene na de andere peiling over de populariteit van Nicolas Sarkozy en François Hollande. Volgens een peiling van Ifop/Fiducial van 13 maart 2012 kon Sarkozy rekenen op 28.5% tegenover 27% van Hollande; een verschil dat ruim binnen de gangbare foutmarge van 3% valt. Met andere woorden, de steun voor beide heren onder de Franse bevolking is hoogstwaarschijnlijk gelijk. De New York Times berichtte geheel correct over deze peiling in termen van een ‘virtual dead heat’, ‘neck and neck’, en een ‘horse race’ en repte met geen woord over een voorsprong voor Sarkozy. Drie maal raden waar de Nederlandse media mee op hun websites kwamen aanzetten. Juist, ‘Sarkozy leidt voor het eerst in peiling verkiezingen’.
Media misbruiken de opiniepeilingen. Doordat zij de berichtgeving over zetelpeilingen klakkeloos overnemen, beïnvloeden zij kiezers met misinformatie. Dit moet stoppen. De New York Times heeft ethische richtlijnen rondom het rapporteren van peilingen waarin geopend wordt met: ‘Reporting on polls is no different from reporting on any other information we give readers […] If we get it wrong, we’ve not only misled our readers, but also damaged our credibility.’ Het wordt de hoogste tijd dat Nederlandse journalisten deze richtlijnen gaan toepassen in hun eigen berichtgeving over zetelpeilingen. Goede overzichten van die richtlijnen zijn er te over, zie hier en hier.
Veel inhoudelijke peilingen bieden een waardevolle bijdrage aan de politieke besluitvorming. Zo is het kwalitatieve onderzoek interessant naar de motievenwaarom Nederlanders van partij veranderen. En ook is het nuttig om de stemming in Nederland rondom vraagstukken over Europese integratie, immigratie, pensioenen, volksgezondheid etc. in kaart te brengen. We zijn het dan ook eens met Maurice de Hond dat dergelijke inhoudelijke peilingen een positieve impact op de legitimiteit van politieke besluitvorming kunnen hebben.
Maar het misbruik van zetelpeilingen is een reëel en serieus probleem. Het is gemakzuchtig en ontoelaatbaar. Journalisten kennen de kritiek, maar negeren het massaal. Alleen de NOS geeft met de Peilingwijzer van politicoloog Tom Louwerse het goede voorbeeld. Ook EenVandaag komt binnenkort met een genuanceerde zetelpeiling. Wie volgt?
[...] onderzoek blijkt dat de Nederlandse kiezer zich als makke lammeren naar de stembureaus laat voeren. Ze bepalen hun keus daar aangekomen op factoren die maar weinig met overtuiging of politieke [...]
De beste manier van peilingen is niet mensen bevragen, maar gewoon luisteren naar wat er gezegd wordt. Dat doet Buzzpeil, luisteren naar wat gezegd wordt op internet en dat omzetten tot peilingen. Geen zelfaanmeldingen, een enorme steekproef (meer dan 100.000 berichten per week) en een goed beeld van de trend. Op [hun website] is meer te zien.
Vreemde reactie direct hierboven. Een mate van zelfhype die neigt naar spam.
En tegen die hype valt wel het een en ander in te brengen.
1. De beste manier van peilen is luisteren? Eens, maar dan in hun eigen setting. En dat is Twitter niet. Jullie meten waarover publiekelijk gesproken wordt; niet waar men op wil stemmen. Hoe trekken jullie die assumptie? Waar baseren jullie dit op?
2. Hoe weten jullie dat dit de beste manier van peilingen is? Jullie hebben geen toetsbare verwachtingen gehad. En jullie zijn nog nooit geijkt. Vooralsnog lijkt me dit speculatie. Ondanks alle problemen kan je dat voor bestaande peilmethodes niet zeggen.
3. Geen zelfaanmeldingen? Wat een onzin. Twitter is een en al zelfaanmelding. Alleen degenen die willen twitteren worden gehoord. Bovendien zijn dit veelal opinieleiders.
4. Een enorme steekproef? Ja, 100.000 berichten per week is veel. Maar hoeveel individuele twitteraars zijn dat? 1500? 2000? Dat is jullie eigenlijke steekproefgrootte. Als je die 100.000 berichten als steekproef nemen, geef je de frequente twitteraars een grotere invloed. Is dat terecht? Niet als je stemgedrag wil voorspellen, alleen als je wilt analyseren wat er publiekelijk allemaal aan berichten de media inkomen. Maar dat lijkt (zie jullie eerste zin) niet jullie doel.
En 5. Met referentie naar het bovenstaande artikel: jullie onderzoek zou aan dezelfde problemen leiden als het eerdere onderzoek. Jullie stellen een goed beeld van de trend te geven. Jullie enige ijkpunt zijn…de opiniepeilingen (die jullie hier zelf bekritiseren). Als peilingen niet deugen, hoe weet je dan dat jullie peilingen wel deugen? En als peilers een trend creëren (bandwagon effect), dan is dat toch deels wat jullie oppikken (en vervolgens kunnen versterken als jullie breder worden opgepikt)?
Interessant onderzoek. Wel heb ik een paar vragen/opmerkingen…
1. Vier van de vijf groepen kregen de wekelijkse peiling van de Hond te zien, al dan niet met een tekst over de PvdA. Ik vraag me af hoe deze peiling getoond werd: alleen de peiling van die week, of ook een kolom met de peiling van de week ervoor en/of een kolom met de huidige samenstelling van de Tweede Kamer. Ik vermoed het eerste, maar wil het toch even checken.
2. Naar mijn mening wordt te gemakkelijk een brug geslagen tussen het beinvloeden van iemand bij het invullen van een vragenlijst (wat in het onderzoek is gebeurd) en het beinvloeden van kiezers bij een daadwerkelijke verkiezing. Meer concreet: in het stuk staat dat het verschil van drie zetels een zeer conservatieve schatting van het bandwagon-effect is en dat het daadwerkelijke effect dus veel groter is. Ik zeg niet dat het effect er niet is, maar wil aangeven dat gewaakt moet worden voor een overschatting.
2a. In dit onderzoek vond de ‘stemming’ neem ik aan direct plaats na het tonen van de peiling (al dan niet met tekst). Bij daadwerkelijke verkiezingen krijgen we (gelukkig) niet in het stemhokje een peiling met een tekst te zien. We worden niet een kant op getriggerd vlak vantevoren, maar krijgen (des)informatie in de dagen en weken voor de verkiezingen. Deels kan hier inderdaad sprake zijn van een cumulatief effect, maar aan de andere kant zal de langere tijdsspanne het effect verminderen.
2b. Ik denk dat stemmers bij een internetpeiling een minder afgewogen beslissing nemen (en dus eenvoudiger te beinvloeden zijn) dan bij een daadwerkelijke verkiezing. Niet alleen hoop ik dat met bij een verkiezing wat meer nadenkt over de keuze, ook heb ik het idee dat bij een internetpeiling men meer een sociaal wenselijk antwoord geeft. En bij de ‘winnaars’ horen is ook sociaal wenselijk.
3a. De relatie tussen het uitgevoerde onderzoek en het verhaal over de berichtgeving omtrent peilingen vind ik onduidelijk. De verschillende begeleidende teksten bij de peiling zijn op zich allemaal correct: er is inderdaad een grote daling t.o.v. 2010, er is een stijging sinds het vertrek van Cohen en er waren nauwelijks verschillen t.o.v. de week ervoor. Wat voor berichtgeving zou hier dan op zijn plaats zijn geweest?
3b. In het verlengde hiervan het volgende. Dat bij vier groepen de PvdA circa 15% van de stemmen kreeg en bij een positieve tekst 17%, suggereert dat de beinvloeding plaatsvond bij de positieve tekst en dat dit ongewenst is. Is het uw mening dat een begeleidende tekst geen invloed zou moeten hebben op het resultaat? Of vindt u (naar die mening neig ik) dat het goed kan dat (in bepaalde situaties) de begeleidende tekst voor de respondent nieuwe informatie bevat en de tekst daardoor het resultaat beinvloedt?
4. Tot slot een korte vraag: heeft u een idee waarom een negatieve begeleidende tekst geen invloed heeft? Er bestaat geen negatieve bandwagon?
Goede punten:
1. We hebben alleen het eerste gedaan: de feitelijke uitslag van de peiling, zonder die van de vorige week of het zeteltal in de Tweede Kamer.
2. Inderdaad geldt dat de ‘stemming’ direct na de peilingsvraag aan bod kwam. We zijn ons er van bewust dat dat specifieke element onze prikkel juist weer minder conservatief maakt. Tegelijkertijd geldt echter: de prikkel was in dit geval op slechts 1 partij gericht met slechts 1 aanvullende prikkel van 2 zinnetjes (geen uitgebreide analyses, laat staan dagelijks in verscheidene media, waarbij ook kiezers elkaar weer versterken). Daarnaast had de feitelijke uitslag (en duiding) waarschijnlijk al in de vier dagen voor dit onderzoek doorgewerkt op de voorkeuren (wat het verschil met de referentiegroep kleiner maakt), en lekte op de dag van de peiling onverwachts het Kunduz-akkoord uit (wat weer andere prikkels veroorzaakte).
Bij elke enquete geldt inderdaad dat mensen daar sociaal wenselijker zijn.
3. Ons onderzoek geeft op zichzelf geen morele uitspraak over de invloed van peilingen: we keken alleen (op basis van verschillende feitelijk juiste interpretaties) wat de gevolgen zijn voor het stemgedrag. In het tweede deel van ons artikel stellen we dat media zich hier bewust van moeten zijn. Op zich is het te billijken als kiezers zich op zulke informatie baseren. Maar dan moet die informatie die media verstrekken wel kloppen. En daar gaat het vaak fout. Immers, veel van de wekelijkse succes-verhalen zijn gebaseerd op veranderingen die statistisch gezien niet hard te maken zijn. Daar waarschuwen we in het tweede deel voor.
4. We weten niet waarom negatieve teksten geen invloed hebben. Ik denk dat het vooral is dat elke aandacht op zichzelf al een positieve invloed heeft, zelfs negatieve aandacht. Maar dat zullen we verder moeten onderzoeken.
[...] effecten peilingen op het stemgedrag hebben is ongewis. Volgens de onderzoekers Tom van der Meer en Armèn Hakhverdian bestaat er een klein, maar belangrijk bandwagon effect. De onderzoekers tonen aan dat niet de [...]
Het overgrote deel van de Nederlandse kiezers, kiest uit gewoonte, emotie of waan van de dag. Ondanks dat gevestigde partijen als PvdA, CDA, VVD en in iets mindere mate D66 al decennia laten blijken dat zij niet in staat zijn een land te besturen, trappen de kiezers er telkens weer in, om daarna weer heerlijk te af te geven op de ‘zakkenvullers’die er niets van bakken. Visie hebben zij nooit gehad en hadden zij het wel dan smaken wij nu de gevolgen. Laten we daarom de SP eens een kans geven om het beter te doen. Ik ben helemaal geen SP aanhanger, ik woon zelfs al jaren niet meer in Nederland, maar het alternatief kennen we inmiddels wel, namelijk, meer van hetzelfde.
[...] dat u van ons af was. Af van die politicologen die maar blijven klagen over de hoogst onzorgvuldige omgang van nationale media met opiniepeilingen. Snel na de verkiezingen wezen journalisten de peilers (en [...]