Samsung Galaxy Z Fold6: Combineer 3 producten en ontvang 10% voordeel

Google Boeken raakt mogelijk vervuild door AI-documenten

Marloes Urff
Marloes Urff
9 april 2024, 12:50
2 min leestijd

Google Boeken staat bekend om het grootschalig indexeren van gepubliceerd materiaal. De app wordt echter getroffen door indexering van AI-werken: iets wat veel impact kan hebben voor academici, lezers en andere gebruikers.

Lees verder na de advertentie.

AI-werken in Google Boeken

Google Boeken indexeert enorm veel gepubliceerde werken: van onderzoeksartikelen tot historische documenten. Het lijkt erop dat het platform ook boeken van mindere kwaliteit is gaan indexeren. De lage kwaliteit kan gevolgen hebben voor de eigen language tracking-tool Ngram.

Ngram is een Big Data-project van Google. Het indexeert alle voorkomende lettercombinaties die door Google zijn gedigitaliseerd. Het zorgt ervoor dat je via Google Boeken zeer gericht kunt zoeken op gepubliceerde onderzoeken, unieke literatuur of wetenschappelijke bronnen. Zo zijn er werken tot uit het jaar 1500 bewaard gebleven. Ook houdt het bij hoe taal door de tijd heen verandert.

Volgens 404Media neemt Google Boeken nu ook boeken mee die AI zou kunnen hebben geschreven. Het doorzocht het platform met zoektermen zoals “as of my last knowledge update”. Dit is een zin die door veel chatbots zoals ChatGPT wordt gebruikt. Omdat de zoekmachine enorm specifiek kan zoeken, krijg je gemakkelijk veel werken terug die dit bevatten.

De meeste boeken die in de zoekresultaten van deze term verschenen waren werken over kunstmatige intelligentie. Tussen de resultaten zaten echter ook verschillende stukken die niet over de technologie gingen. Ook leken ze door een bot geschreven.

AI-boeken

404Media geeft aan dat verschillende boeken de indruk geven dat deze Wikipedia hebben toegepast als bron. Een voorbeeld dat het noemt is Tristin McIver’s ‘Bears, Bulls and Wolves: Stock Trading for the Twenty-Year-Old’. Zo zou er informatie over financiële evenementen van Wikipedia afkomstig zijn. Ook de zin “as of my last knowledge update” is erin gespot.

Andere boeken in de resultaten bevatten onderwerpen zoals Twitter. In dat geval werd informatie gebruikt die tot 2021 van toepassing was: vaak de laatste periode dat AI-modellen actuele data kregen voor training. Google heeft 404Media verteld dat recente werken op het Boeken-platform niet meegenomen worden in de resultaten van Ngram. Toch kan het zo zijn dat deze straks in toekomstige data-updates teruggevonden worden.

Heb jij weleens Google Boeken gebruikt om bronnen te vinden, of lees je er graag boeken op? Laat het ons weten hieronder in de reacties!

Google Play Boeken

Google LLC

9.0
Gratis
Via Google Play

Reacties

0

Inloggen of registreren
om een reactie achter te laten