De feiten: Uitgevers leveren data voor Nederlands AI-model GPT-NL
Nederlandse uitgevers stellen hun nieuwsarchieven beschikbaar om een Nederlandstalig AI-model te trainen. Het model, GPT-NL, is een initiatief van onderzoeksinstituut TNO, het Nederlands Forensisch Instituut en onderwijsvereniging SURF, en wordt gefinancierd met 13,5 miljoen euro belastinggeld.
Uitgevers als DPG (onder meer de Volkskrant en AD), Mediahuis (De Telegraaf en NRC) en Roularta Media Nederland (EW) krijgen op termijn een vergoeding uit de opbrengsten van het model.
GPT-NL richt zich uitsluitend op bedrijven en overheden en wordt voorlopig niet beschikbaar voor consumenten. Het moet eind dit jaar gereed zijn.
De ontwikkelaars benadrukken dat het model legaal en volgens Europese regelgeving wordt ontwikkeld. Critici vragen zich af waarom een met publiek geld gefinancierde tool niet gratis toegankelijk is voor alle Nederlanders.
Wie zegt wat over GPT-NL?
Bron: TNO, Trouw- Selmar Smit, programmamanager TNO in Trouw: ‘De uitgevers zijn er vanaf het begin bij betrokken. Het unieke is dat we met 95 procent van de commerciële nieuwsuitgevers afspraken hebben gemaakt en dat ze uiteindelijk delen in de opbrengsten. Maar om voor hun materiaal een vergoeding te kunnen geven, kunnen we het model niet gratis beschikbaar stellen. Daarom richten we ons in eerste instantie ook op bedrijven en instellingen die ervoor kunnen betalen, en vooralsnog niet op gewone consumenten.’
- Marleen Stikker, directeur van Waag Futurelab in Trouw: ‘Het wordt ontwikkeld met publiek geld; waarom moet er dan toch weer een verdienmodel aan worden gehangen? Taal is een cultuurgoed, taal is van ons allemaal. Waarom komt zo’n tool dan niet gratis beschikbaar voor alle Nederlanders, maar alleen tegen betaling voor overheid en bedrijven?’
EW’s visie: Publiek geld is hieraan goed besteed, zelfs als je nog moet bijbetalen
Door: Sam Verbeek, redacteur TechIs het eerlijk dat een met belastinggeld ontwikkeld AI-model straks alleen tegen betaling is te gebruiken? Het is verleidelijk om daar een moreel vraagstuk van te maken. Maar in werkelijkheid is het een praktische kwestie met een praktisch antwoord.
GPT-NL doet wat Amerikaanse modellen niet doen: fatsoenlijk Nederlands produceren, op basis van bronnen waarvoor toestemming is gegeven, en met juridische zekerheid. Dit is nodig voor sectoren, van rechtspraak tot ambtenarij, waar een correcte, transparante en controleerbare output belangrijk is.
Amerikaanse AI-modellen bevatten fouten en anglicismen
Amerikaanse modellen als ChatGPT zijn getraind op bijna alles wat online is te vinden, in allerlei talen en van wisselende kwaliteit. Ze leren van blogs, Wikipedia en zelfs van ruzies op het sociale medium Reddit. Dat is grondig, maar het heeft ook nadelen. Fouten en tegenstrijdigheden worden ook meegenomen. Hierdoor kan de AI foutieve informatie produceren.
Daarbij is ongeveer 55 procent van het internet Engels. Het model gebruikt die Engelse bronnen ook wanneer het in het Nederlands antwoordt, en dat levert anglicismen en andere taalfouten op.
GPT-NL is schoon, legaal en Nederlands. Dat heeft een prijs.
GPT-NL richt zich eerst op professionals
Die prijs is voorlopig te hoog voor de consumentenmarkt. Daarom kiezen de ontwikkelaars van GPT-NL ervoor om eerst de professionele markt te bedienen. Niet omdat de burger minder belangrijk is, maar omdat bedrijven en overheden de hoogste eisen stellen en bereid zijn daarvoor te betalen. Daar kan het model worden getest en volwassen worden.
Daarna kan het verbreden. Dit is de enige manier waarop zoiets op eigen benen kan staan, zonder meteen weg te zinken in rode cijfers.
Ter vergelijking: ook het consumentenaanbod van OpenAI, het bedrijf achter ChatGPT, is nog altijd niet winstgevend. Het draait op investeerders die inzetten op schaalvergroting: eerst zoveel mogelijk marktaandeel veroveren, pas later winst maken.
‘Twee keer betalen’ is niet onredelijk
Dan de klacht: ‘De belastingbetaler betaalt twee keer.’ Voor het project GPT-NL is immers 13,5 miljoen euro aan belastinggeld uitgetrokken, terwijl het model daarna alleen tegen betaling beschikbaar is.
Dat klopt: de belastingbetaler betaalt inderdaad twee keer.
Maar dat is niet onredelijk — en wie bij het horen van 13,5 miljoen euro wit wegtrekt: in de AI-sector stelt dat bitter weinig voor. Een fooi vergeleken met de sommen die de Amerikanen erin pompen.
De publieke investering is nodig omdat de markt het product anders niet oppakt. Zoals we ook met gemeenschapsgeld een elektriciteitsnet aanleggen. Voor het onderhoud en het gebruik betalen de gebruikers daarna nog hun rekening. Zo worden de kosten eerlijk verdeeld.
Zonder die eerste investering zou er nooit een elektriciteitsnet komen, of GPT-NL.
Uitgevers krijgen eindelijk betaald voor hun werk
Bovendien krijgt de journalistiek eindelijk een deel van de koek. Webartikelen worden dit keer niet clandestien afgeschraapt door een AI-bedrijf, dat achteraf doet alsof zijn neus bloedt.
Uitgevers krijgen betaald voor hun werk. En dat kan alleen omdat het model een verdienmodel heeft. Zonder betalende gebruikers valt er niets uit te keren aan de uitgevers.
Dat is geen zwakte, maar juist fatsoenlijk: een ordentelijk alternatief voor het Wilde Westen van Silicon Valley, dat makers structureel negeert.
Op het gebied van AI en technologie is GPT-NL een Europees lichtpuntje: een stap naar meer zelfstandigheid, duidelijke regels en eerlijk spel.