De feiten: Studie zegt dat je hersenactiviteit verandert door gebruik ChatGPT
Bron: Arxiv, MIT, Scientific AmericanCreëert ChatGPT luie hersenen? Wetenschappers van het Massachusetts Institute of Technology (MIT) hebben onderzocht wat er in het brein van proefpersonen gebeurt als ze bij het uitvoeren van een schrijfopdracht gebruik maken van zogeheten Large Language Models, zoals ChatGPT.
Opstel schrijven met of zonder ChatGPT-hulp vergeleken
De onderzoekers lieten 54 proefpersonen, verdeeld over drie groepen, een opstel schrijven. Groep 1 mocht gebruikmaken van een AI-tool, ChatGPT in dit geval. Groep 2 mocht alleen gebruikmaken van zoekmachine Google. Tot slot had groep 3 geen enkele toegang tot online hulp.
Tijdens het schrijven werd de hersenactiviteit van de deelnemers gemeten met een EEG. Hierdoor konden de onderzoekers zien welke grote delen van de hersenen met elkaar ‘praatten’. Ook vroegen ze de proefpersonen na afloop of ze enkele zinnen uit hun opstel konden citeren.
Resultaten tonen minder hersenactiviteit bij ChatGPT-gebruik
De onderzoekers zagen aan de EEG-resultaten dat de hersenen van mensen die ChatGPT hadden gebruikt minder verbindingen maakten en informatie uitwisselden dan die van mensen die geen online tools mochten gebruiken.
Ook kon vrijwel niemand uit de ChatGPT-groep een volledige zin uit zijn of haar opstel citeren, terwijl de deelnemers uit de andere twee groepen daar minder of geen moeite mee hadden.
Waarom interpreteren wetenschappers de resultaten verschillend?
Althans, dat is wat de MIT-wetenschappers schrijven in hun artikel dat op de preprint-website Arxiv staat. Het artikel is nog niet wetenschappelijk getoetst (peer reviewed).
De resultaten van de studie zijn verschillend geïnterpreteerd.
Wie zegt wat over de resultaten van het onderzoek?
Bron: CNET, TIME-
‘BREAKING: MIT heeft zojuist de eerste hersenscanstudie afgerond onder ChatGPT-gebruikers en de resultaten zijn angstaanjagend. Blijkt dat AI ons niet productiever maakt — het maakt ons cognitief failliet’, schrijft Alex Vacca op X. Vacca zelf is geen bekend figuur, maar zijn posts over de studie werden in korte tijd ruim 22 miljoen keer gelezen.
- ‘Gebruik alstublieft geen woorden als “stom”, “dom”, “hersenslijtage”, “schade”, “beschadiging”, “passiviteit”, “afkapping” en dergelijke. Dat doet deze studie ernstig tekort, want wij hebben dit soort termen niet gebruikt in ons artikel,’ zegt hoofdonderzoeker Nataliya Kos’myna als toelichting op de studie.
- ‘Mijn mening is dat wanneer studenten generatieve AI gebruiken om hun schrijfwerk te vervangen, ze zich eigenlijk overgeven — ze zijn niet langer actief betrokken bij hun project,’ zegt Robert Cummings, hoogleraar schrijven en retorica aan de Universiteit van Mississippi, tegen CNET.
- ‘Vanuit psychiatrisch oogpunt zie ik dat overmatige afhankelijkheid van deze LLM’s onbedoelde psychologische en cognitieve gevolgen kan hebben, vooral bij jongeren van wie de hersenen nog in ontwikkeling zijn. De neurale verbindingen die je helpen bij het ophalen van informatie, het onthouden van feiten en het vermogen om veerkrachtig te zijn – dat alles zal verzwakken,’ zegt psychiater Zishan Khan tegen TIME.
- ‘Nee, deze studie bewijst niet dat AI ons “dommer” maakt. Hij laat vooral zien dat hoe we AI gebruiken het verschil maakt,’ zegt Boris Konrad, neurowetenschapper aan de Radboud Universiteit, tegen EW.
EW’s visie: Artikel wordt zwaar overdreven geïnterpreteerd
Door: Laurien Onderwater, redacteur VooruitgangsgeloofZoals wel vaker gebeurt bij resultaten van wetenschappelijke studies, zijn ze ook hier zwaar overdreven geïnterpreteerd. Verschillende media zetten sensationele koppen boven hun artikelen.
Kop moet belofte waar kunnen maken
Want zeg nou zelf: ‘Is ChatGPT making us dumb? MIT brain scans reveal alarming truth about AI’s impact on the human mind’ (The Economic Times) of ‘ChatGPT making us stupid: MIT’ (The Australian) klinkt een stuk spectaculairder dan de genuanceerdere kop van TIME: ‘ChatGPT May Be Eroding Critical Thinking Skills, According to a New MIT Study.’
Een kop moet prikkelen en de nieuwsgierigheid wekken en mag soms best een beetje worden aangezet. Maar het artikel moet wel de belofte van de kop kunnen inlossen.
Geen bewijs dat ChatGPT mensen dommer maakt
En daar is bij onder meer The Economic Times en The Australian geen sprake van, want uit deze studie blijkt helemaal niet dat ChatGPT mensen dommer maakt. Sterker nog, daar waarschuwt onderzoeker Nataliya Kos’myna van het MIT ook voor.
‘Deze studie kan niet en heeft niet domheid in het brein, stupiditeit, of hersenen op vakantie aangetoond,’ zegt ze tegen Scientific American.
Sowieso is het aantal proefpersonen dat heeft deelgenomen aan het onderzoek veel te klein om conclusies te kunnen trekken: 54 mensen in totaal deden mee, dus per groep is dat slechts 18 personen.
Logisch dat hersenen minder actief zijn bij minder inspanning
Daarnaast kun je je afvragen hoe verrassend de resultaten van de MIT-wetenschappers zijn. ‘De onderzoekers laten zien dat mensen die schrijven met behulp van ChatGPT op dat moment minder hersenactiviteit en -connectiviteit vertonen dan degenen die alles zelf doen,’ zegt neurowetenschapper Boris Konrad tegen EW.
Met hersenconnectiviteit bedoelt Konrad de manier waarop diverse gebieden in de hersenen met elkaar verbonden zijn en informatie uitwisselen.
Vooral in hersengebieden betrokken bij geheugen, aandacht en controle zagen de onderzoekers dat effect. Konrad: ‘Maar dat is gewoon logisch: die proefpersonen doen minder zelf en denken er minder over na. Dan volgt ook dat ze minder goed kunnen citeren uit hun eigen teksten als die grotendeels door AI zijn geschreven.’
Dat heeft dus niks met intelligentie te maken.
Twee verschillende activiteiten leveren ook andere hersensignalen op
Ben Shindle van The BS Detector, een kritische nieuwsbrief over wetenschap en innovatie, noemt ook terecht dat er eigenlijk twee verschillende activiteiten worden uitgevoerd.
De groep die het opstel zonder hulpmiddelen moet schrijven, is veel meer aan het typen, terwijl de ChatGPT-groep waarschijnlijk drukker bezig is met de muis, meer tekst leest en meer tijd besteedt aan tekst bewerken in plaats van direct schrijven. Het is dus logisch dat je, als je hun hersenactiviteit met een EEG meet, een verschil zult zien.
Interessante eerste stap in onderzoek naar AI en hersenen
Dus. Kunnen we hieruit iets concluderen over hoe Large Language Models zoals ChatGPT de hersenen op de lange termijn beïnvloeden? Maken ze mensen dommer? Op basis van deze studie valt daar niks over te zeggen.
Toch is het een fascinerende studie over de cognitieve impact van generatieve kunstmatige inteliggentie (AI). Daar is Konrad het mee eens. ‘Maar wat sommige media, en mensen op social media, over het onderzoek zeggen schiet tekort. Volgens mij werken onze hersenen net zo goed als van tevoren. Als je alleen passief met iets bezig bent, wordt het niet goed verwerkt. Daar maakt generatieve AI juist geen verschil in.’
Bovendien is het goed dat er onderzoek wordt gedaan naar de effecten van AI-gebruik op de hersenen. Wetenschappers moeten hier dan ook zeker mee doorgaan, maar dan met grotere groepen en langdurige observaties.
Alleen zo kunnen we écht inzicht krijgen in de mogelijke cognitieve gevolgen van het gebruik van Large Language Models op de lange termijn, en voorkomen dat we aannames doen op basis van voorlopige resultaten.
Verdere verdieping: Waarom is het artikel al gepubliceerd?
Als de studie nog moet worden getoetst door andere wetenschappers – ook wel peer review genoemd – waarom kozen de MIT-onderzoekers er dan voor het alvast te publiceren?
Tegen TIME zegt Nataliya Kos’myna erover: ‘Wat me er echt toe heeft gezet om het nu al te publiceren, nog vóór de volledige peer review, is de angst dat er over zes tot acht maanden een beleidsmaker opstaat die besluit: “Laten we GPT op de kleuterschool invoeren”. Dat zou echt slecht en schadelijk zijn. Ontwikkelende hersenen lopen het grootste risico.’
Kos’myna is van mening dat de jonge hersenen zich ‘op een meer analoge manier moeten ontwikkelen’, dus zonder al te veel technologie. ‘We moeten actief beleid ontwikkelen dat hiermee in lijn is en, nog belangrijker, deze tools testen voordat we ze invoeren.’