GPT-4.5 passeert beroemde Turingtest en doorbreekt menselijke barrière

GPT-4.5 passeert beroemde Turingtest en doorbreekt menselijke barrière

In een baanbrekende studie van de Universiteit van Californië, San Diego, heeft OpenAI's GPT-4.5 met succes de Turingtest doorstaan, een historische mijlpaal in de ontwikkeling van kunstmatige intelligentie. De resultaten tonen aan dat GPT-4.5 in staat is menselijke conversaties zodanig te simuleren dat het in de meerderheid van de gevallen niet te onderscheiden is van een echte menselijke gesprekspartner.

De Turingtest: Een klassieke maatstaf voor AI

De Turingtest, voorgesteld door de Britse wiskundige Alan Turing in 1950, is een methode om te bepalen of een machine intelligent gedrag vertoont dat niet te onderscheiden is van dat van een mens. In deze test voert een menselijke beoordelaar gesprekken met zowel een mens als een machine, zonder te weten wie wie is, en probeert te identificeren welke de machine is.

Opzet van het onderzoek

Het onderzoek van UC San Diego betrof bijna 300 deelnemers die deelnamen aan een reeks van acht ronden van online tests. In elke ronde voerde een beoordelaar tegelijkertijd gesprekken met zowel een menselijke deelnemer als een AI-systeem via een gesplitst scherm. Na elke sessie van vijf minuten werd de beoordelaar gevraagd te bepalen welke gesprekspartner de mens was.

De AI-modellen werden geëvalueerd onder twee verschillende condities:

  • Zonder persona (NO-PERSONA): De AI kreeg slechts minimale instructies om de beoordelaar te overtuigen van zijn menselijkheid.
  • Met persona (PERSONA): De AI werd voorzien van een gedetailleerde menselijke karakterisering, zoals een jongvolwassene met kennis van popcultuur.​

Indrukwekkende resultaten

De resultaten waren opmerkelijk. Wanneer GPT-4.5 werd voorzien van een persona, werd het in 73% van de gevallen geïdentificeerd als de menselijke gesprekspartner, een percentage dat aanzienlijk hoger is dan de willekeurige kans van 50%. Ter vergelijking: menselijke deelnemers werden minder vaak als mens geïdentificeerd dan GPT-4.5 onder dezelfde condities. Andere modellen, zoals Meta's LLaMA 3.1-405B, behaalden een score van ongeveer 56%, terwijl GPT-4o slechts 21% behaalde zonder persona.

De impact van persona's op AI-interactie

Een opvallende bevinding van het onderzoek is het significante effect van het toekennen van een persona aan de AI.Zonder een specifieke persona behaalde GPT-4.5 een bescheiden succespercentage van 36%. Echter, met een duidelijke karakterisering steeg dit percentage naar 73%. Dit suggereert dat het vermogen van AI om menselijke interacties te simuleren sterk afhangt van de context en de rol die het krijgt toegewezen.

Implicaties voor de toekomst

Het succes van GPT-4.5 in de Turingtest heeft verstrekkende gevolgen voor de toekomst van AI in sociale en economische contexten. De onderzoekers wijzen erop dat dergelijke systemen potentieel menselijke arbeid kunnen aanvullen of zelfs vervangen in rollen die afhankelijk zijn van korte conversaties. Bovendien kunnen ze dienen als substituten voor andere sociale interacties, variërend van online gesprekken met vreemden tot communicatie met vrienden, collega's en zelfs romantische partners.

Desalniettemin roept deze ontwikkeling ook ethische en maatschappelijke vragen op. Als AI-systemen steeds beter worden in het nabootsen van menselijke interacties, hoe kunnen we dan onderscheid maken tussen mens en machine? En welke gevolgen heeft dit voor authenticiteit en vertrouwen in digitale communicatie?​

Essentieel om implicaties zorgvuldig te overwegen

De studie van UC San Diego benadrukt de snelle vooruitgang in kunstmatige intelligentie en de toenemende capaciteit van AI om menselijke conversaties te simuleren. Hoewel dit nieuwe mogelijkheden biedt voor toepassingen in diverse sectoren, is het essentieel om de ethische en maatschappelijke implicaties zorgvuldig te overwegen naarmate deze technologieën verder evolueren.​

AI Beat the Turing Test by Being a Better Human

GPT-4.5 fooled most humans in a recent Turing Test, showing we may prefer AI’s fake empathy to real humanity.

ONTDEK MEER

 

Aanbevolen voor jou

In de kijker

AI kan vanaf nu de muis overnemen op je scherm

AI kan vanaf nu de muis overnemen op je scherm

Meta zet de volgende stap in AI met AI-gegenereerde posts

Meta zet de volgende stap in AI met AI-gegenereerde posts

Salesforce presenteert Agentforce – Zoals AI voor Sales bedoeld is

Salesforce presenteert Agentforce – Zoals AI voor Sales bedoeld is

Google Earth laat gebruikers binnenkort ‘tijdreizen’ tot wel 80 jaar terug

Google Earth laat gebruikers binnenkort ‘tijdreizen’ tot wel 80 jaar terug

Updates

Inschrijven Nieuwsbrief

Zo word je altijd als eerste op de hoogte gebracht van ons laatste nieuws, updates, jobs, tips & promoties. Stay UP-TO-DATE!

WEBSITE LATEN MAKEN?​​​​​​​​​​​​​​

Kies voor een UP-TO-DATE AI Website 100% in Google

Een UP-TO-DATE AI Website maakt het gemakkelijk om automatisch up-to-date te blijven met je klanten en overal aanwezig te zijn.

Maak een afspraak