Grok 4 is er: Elon Musks kunstmatige intelligentie van $ 300 per maand

Op de snel veranderende markt voor kunstmatige intelligentie (AI) heeft Elon Musk besloten de lat hoger te leggen door de nieuwste evolutie van het door xAI ontwikkelde AI-model aan te kondigen, met een verklaring die geen ruimte laat voor discussie: "Wat academische zaken betreft, is Grok 4 in elk vakgebied boven het niveau van een PhD, zonder uitzondering." De Zuid-Afrikaanse miljardair voegde er tijdens de live presentatie aan toe dat, hoewel hij misschien nog steeds geen gezond verstand heeft en nog geen nieuwe natuurwetten heeft ontdekt, "het slechts een kwestie van tijd is."
Het model is verdeeld in twee varianten: de versie

standaard en Grok 4 Heavy, een multi-agentopstelling waarin meerdere instanties parallel aan hetzelfde probleem werken en vervolgens hun resultaten vergelijken om tot een gemeenschappelijke, onderbouwde en robuuste oplossing te komen. Volgens de onderzoekers stelt het collaboratieve gedrag van de "submodellen" Grok 4 Heavy in staat om complexe inzichten te identificeren en deze te verfijnen door middel van continue interne vergelijking, vergelijkbaar met een studiegroep. xAI heeft aangekondigd dat er in de komende maanden ook een gespecialiseerd programmeermodel, een multimodale agent en een videogeneratiesysteem zullen worden uitgebracht.
Tijdens de live presentatie werden de scores van Grok 4 op verschillende academische benchmarks bekendgemaakt. Op de test "Humanity's Last Exam" – een bijzonder uitdagende benchmark die AI test aan de hand van 2500 complexe, multidisciplinaire vragen, die elk kennis en vaardigheden vereisen die gelijk zijn aan of hoger zijn dan die van een gespecialiseerde onderzoeker – behaalde Grok 4 zonder tools een score van 25,4%, waarmee het zowel Google Gemini 2.5 Pro (21,6%) als OpenAI's o3-model (21%) overtrof. Grok 4 Heavy behaalde daarentegen een score van 44,4% (tegenover 26,9% voor Gemini 2.5 Pro). Grok 4 liet ook zijn spierballen zien bij de visuele puzzels van de ARC-AGI-2-test: het model behaalde een nauwkeurigheid van 16,2%, waarmee het de prestaties van zijn grootste concurrent, Claude Opus, verdubbelde. Zoals het xAI-team aangeeft: "het was het enige model in de afgelopen drie maanden dat de 10%-grens doorbrak." Het vermogen van het model om consistente beslissingen te behouden, werd ook op de proef gesteld in de VendingBench-simulator. Daar liet Grok zien dat het een microbedrijf winstgevender en stabieler kan beheren dan andere modellen.
Grok 4 is nog niet beschikbaar in Italië. In sommige regio's is het beschikbaar met een X Premium Plus-abonnement, maar in Europa moet het nog even wachten. Het SuperGrok-abonnement kost € 35 per maand, terwijl toegang tot Grok 4 Heavy en de geavanceerde functies beschikbaar is met het SuperGrok Heavy-abonnement voor € 349 per maand, waarmee xAI tot de duurste aanbieders in de branche behoort. Ter vergelijking: ChatGPT Plus kost $ 20 per maand, terwijl Claude Pro rond de $ 20-25 kost. Vanuit API-perspectief kost Grok 4 $ 3 per miljoen inputtokens en $ 15 per miljoen outputtokens, een prijs die het stevig in het premiumsegment van de B2B-markt plaatst.
ilsole24ore