OpenAI heeft zojuist GPT-4o gelanceerd, een nieuw geavanceerd AI-model dat content kan begrijpen en genereren via tekst, afbeeldingen en audio. GPT-4o (waarbij de ‘o’ staat voor ‘omnimodel’) bouwt voort op de mogelijkheden van zijn voorganger, GPT-4, en introduceert krachtige nieuwe multimodale functies voor iedereen, inclusief gratis gebruikers.
Ja, je leest het goed. OpenAI maakt GPT-4o toegankelijk voor alle gebruikers, zelfs degenen die niet betalen. Dit betekent dat iedereen nu toegang heeft tot de meest geavanceerde AI-technologie van OpenAI. Betaalde gebruikers blijven genieten van hogere capaciteitslimieten, met tot vijf keer de capaciteit van gratis gebruikers.
Multimodale AI voor natuurlijke interacties
Volgens OpenAI CTO Muri Murati kan GPT-4o "redeneren over stem, tekst en visuele inhoud" in realtime. Het model kan deelnemen aan stemgesprekken en reageren op audioprompts in slechts 232 milliseconden, wat zorgt voor natuurlijkere menselijke interacties met AI.
Tijdens het lanceringsevenement demonstreerde OpenAI de audiovisuele mogelijkheden van GPT-4o in realtime. ChatGPT hielp bij het oplossen van een wiskundig probleem, interpreteerde code en herkende de emoties van de presentator. De nieuwe versie van ChatGPT kan ook onderbroken worden en geeft onmiddellijke reacties, wat de gesprekken vloeiender en intuïtiever maakt.
Verbeterde prestaties en toegankelijkheid
Op het gebied van prestaties evenaart GPT-4o de capaciteiten van GPT-4 bij Engelse tekst- en coderingstaken, terwijl het de meertalige prestaties aanzienlijk verbetert tegen de helft van de kosten.
Het model behaalde een recordscore van 87,2% op de 5-shot MMLU (algemene kennisvragen) en verbeterde de spraakherkenning over alle talen, met indrukwekkende prestaties op het gebied van spraakvertaling en visuele perceptie.
GPT-4o zal ook beschikbaar zijn via de API. Het model is half zo duur en tweemaal zo snel als GPT-4 Turbo, met vijf keer zo hoge limieten voor het aantal aanvragen. Deze verbeterde prestaties zijn te danken aan efficiëntieverbeteringen in elke laag van de technologie, aldus OpenAI.
Een intuïtieve AI-ervaring
Naast de lancering van GPT-4o kondigde OpenAI ook een nieuwe desktopversie van ChatGPT aan, evenals een vernieuwde gebruikersinterface die is ontworpen om interacties eenvoudiger te maken.
Volgens Murati is het doel om, naarmate de modellen steeds complexer worden, de gebruikerservaring intuïtiever en naadlozer te maken, waarbij de interactie centraal staat in plaats van de interface.
OpenAI neemt een zorgvuldige benadering bij de uitrol van GPT-4o. Vandaag worden de tekst- en beeldfuncties geïntegreerd in ChatGPT en de API, terwijl de audio- en videomogelijkheden in de komende weken volgen na verdere tests. Veiligheid blijft een topprioriteit, en het model wordt uitgebreid getest om mogelijke risico’s te minimaliseren.
Toekomst van krachtige en toegankelijke AI
GPT-4o markeert een belangrijke stap richting intelligenter en gebruiksvriendelijker AI-assistenten. OpenAI zet met deze lancering opnieuw een stap vooruit om AI krachtiger en toegankelijker te maken. De uitrol zal geleidelijk plaatsvinden en in de komende weken beschikbaar zijn in verschillende OpenAI-producten. Deze introductie van GPT-4o belooft een opwindende nieuwe fase in de ontwikkeling van AI, met meer mogelijkheden en eenvoud voor gebruikers wereldwijd.