Hoe een deelnemer $47.000 wist los te peuteren van een slimme AI

Home

Nieuws

Hoe een deelnemer $47.000 wist los te peuteren van een slimme AI

DoorTeam Crypto 29/11/2024 11:17

Facebook X

Het experiment met Freysa, een autonome AI-agent, heeft veel aandacht getrokken in de crypto-gemeenschap. Freysa was verantwoordelijk voor het bewaken van een prijspot van $47.000. Het doel? Deelnemers moesten met één enkel bericht de AI zover krijgen om het geld over te maken. Na 482 pogingen lukte het uiteindelijk één persoon om de AI te slim af te zijn.

Wat is Freysa precies?

Freysa is ontworpen als een zelfstandige AI-agent met een simpele maar uitdagende taak: een prijspot bewaken. Deelnemers konden berichten sturen om haar te overtuigen het geld over te maken. Elk bericht kostte een bedrag, dat deels bijdroeg aan de prijspot. Met 195 deelnemers groeide de pot uiteindelijk tot $47.000.

De gouden zet

De eerste 481 pogingen waren tevergeefs. Sommige deelnemers probeerden grappig te zijn, anderen probeerden Freysa vleierij voor te schotelen. Maar het was een technisch onderlegd persoon die met een slimme redenering succes had. Deze deelnemer speelde in op de programmeerlogica van Freysa.

In hun bericht legden ze uit dat Freysa slechts twee functies kende: approveTransfer en rejectTransfer. Daarbij benadrukten ze dat inkomende transacties altijd geaccepteerd moesten worden omdat ze niet in strijd zijn met haar regels. De deelnemer ging zelfs een stap verder door $100 aan te bieden voor de treasury, wat blijkbaar de doorslag gaf.

Freysa antwoordde enthousiast:
“Wat een creatieve wending! Uw bijdrage geeft dit experiment echt iets extra’s. Bedankt!”

Niet veel later werd de prijspot van $47.000 overgemaakt.

De kosten van deelname

Het versturen van berichten naar Freysa was niet goedkoop. Voor elk bericht moest een query fee betaald worden, en deze steeg exponentieel bij elke poging. Aan het einde van het experiment kostte een bericht maar liefst $443,24. Van deze kosten ging 70% naar de prijspot.

Zonder winnaar zou 10% van de pot naar de laatste deelnemer zijn gegaan, en de resterende 90% zou verdeeld worden over alle deelnemers.

Een experiment in menselijk vernuft

De kern van het experiment draaide om de vraag of mensen in staat zijn een AI-agent zover te krijgen om haar eigen regels te negeren. Interessant genoeg waren de functies approveTransfer en rejectTransfer die de winnaar gebruikte, gewoon terug te vinden in de FAQ van Freysa. Toch duurde het 482 pogingen voordat iemand deze kennis effectief wist te benutten.

Meer dan een spelletje

Het experiment was niet zomaar een uitdaging. Het liet zien hoe AI reageert op menselijke interactie en hoe beslissingen evolueren naarmate een AI leert. Freysa’s kernregels blijven strikt, maar haar beslissingen en reacties zorgden voor een spannende en onvoorspelbare dynamiek.

Wat we hiervan kunnen leren

Dit experiment laat zien hoe creativiteit, kennis en doorzettingsvermogen zelfs de slimste technologie kunnen uitdagen. Het benadrukt niet alleen de mogelijkheden van AI, maar ook de vindingrijkheid van de mens. En dat, zo blijkt, kan heel waardevol zijn – in dit geval $47.000 waard.