Hoeveel energie verbruikt AI? Eén Gemini-prompt staat gelijk aan negen seconden tv-tijd.


Er zijn twee vragen waar chatbots nooit een precies, eenduidig antwoord op hebben: "Wie heeft je dat verteld? Weet je het zeker?" en "Hoeveel energie verbruik je?" Aan de eerste twee wordt nog gewerkt, maar over de derde hebben we eindelijk iets concreets.
Een gemiddelde Gemini-tekstzoekopdracht verbruikt 0,24 wattuur en produceert 0,03 gram CO₂. Dit is vergelijkbaar met de energie die nodig is om minder dan 9 seconden tv te kijken. Deze schattingen – veel lager dan ander onderzoek van universiteiten en onderzoekscentra – werden gepresenteerd tijdens een persconferentie ter gelegenheid van een studie naar de milieu-impact van AI-zoekopdrachten, met de focus op het Gemini-model.
Dit is de eerste keer dat Google cijfers publiceert sinds de opkomst van AI in 2022. De reden, die tijdens het evenement werd uitgelegd, is ook om andere AI-leveranciers zoals Microsoft, AWS en OpenAI bloot te leggen, die tot nu toe niets hebben prijsgegeven over hun energieverbruik.

De figuur benadrukt de vermindering van de emissies per prompt voor het Gemini-model van mei 2024 tot mei 2025. De Scope 2-emissies daalden met een factor 47, van 1,07 g CO₂e/prompt naar 0,02 g CO₂e/prompt, voornamelijk dankzij verbeteringen in de modelefficiëntie en machinebenutting. De Scope 1+3-emissies daalden met een factor 36, van 0,36 naar 0,01 g CO₂e/prompt. Samenvattend laat de grafiek zien hoe modeloptimalisatie, verbeterd hardwarebeheer en de inkoop van schone energie de CO₂-voetafdruk per gegenereerde prompt drastisch hebben verminderd, met een bijzonder significante vermindering van de Scope 2-emissies.
Zoals Partha Ranganathan, Engineering Fellow en Vice President bij Google, uitlegde: "Ontwikkel een allesomvattende methodologie en deel de resultaten, met als uiteindelijk doel om sectorbrede consistentie te bevorderen bij het meten van de milieu-impact en de relatieve efficiëntie van AI-inferentie." Het doel is dan ook om een gedeelde standaard voor de hele AI-industrie voor te stellen.

De grafiek vergelijkt de energie-efficiëntie en prestaties van verschillende grote taalmodellen (LLM's), waaronder die van Meta (Llama), OpenAI (GPT) en Google (Gemini). De modellen van Google (Gemini) worden als het meest energiezuinig beschouwd, met een hoog aantal prompts per kWh en een hoge Arena Score. De blauwe balk met het label 'Median Gemini' geeft een breed scala aan efficiënties aan, gemeten met verschillende benaderingen (de 'Comprehensive Measurement Approach' en de 'Existing Measurement Approach').
Veel huidige computationele methodologieën in de industrie negeren verschillende kritische factoren en houden geen rekening met elke laag van de AI-stack, van de onderliggende hardware en datacenters tot het model zelf. Om dit aan te pakken, heeft Google een uitgebreide methodologie ontwikkeld die het stroomverbruik van inactieve machines, CPU's, RAM, koeling en stroomverdeling omvat, en niet alleen het chipvermogen.
Zoals Partha Ranganathan, primair verantwoordelijk voor de computerinfrastructuur en datacenters van het bedrijf, met een specifieke focus op efficiëntie en duurzaamheid, aangaf, richt het onderzoek zich alleen op gemiddelde tekstuele vragen. De analyse beslaat een periode van 12 maanden en omvat daarom een breder scala aan vragen. Meer specifiek werd de "mediane vraag" gemeten, gedefinieerd als de vraag die qua energieverbruik in het 50e percentiel staat. Het proces werkt als volgt: voor elk AI-model wordt het gemiddelde energieverbruik berekend om één vraag (één gebruikersverzoek) te verwerken. Er wordt een rangschikking gemaakt: alle vragen die door gebruikers worden ingediend, worden in een lijst geplaatst en gesorteerd op basis van het energieverbruik dat nodig is om ze te verwerken. Op dit punt wordt het 50e percentiel geïdentificeerd, dat wil zeggen de vraag die precies in het midden van deze rangschikking staat. Dit is de "mediane vraag". De beperking van dit onderzoek is dat het geen informatie biedt over tekst-naar-afbeelding- en tekst-naar-videosystemen, die afbeeldingen en video's genereren en daarom als energie-intensiever worden beschouwd. De onderzoekers legden uit dat er weinig consensus bestaat over hoe de impact van andere vormen van energieopwekking gemeten moet worden. Bovendien zou het wetenschappelijk onjuist zijn om schattingen te maken door de energie-impact van Google-zoekopdrachten te vergelijken met een Gemini-zoekopdracht.
"De interactiepatronen zijn anders", zei Ranganathan. "Het is appels met peren vergelijken."

De grafiek vergelijkt verschillende methodologieën voor het meten van het energieverbruik van AI-modellen en vergelijkt bestaande benaderingen met een voorgestelde methodologie (Voorgestelde benadering). De tabel verdeelt het energieverbruik in verschillende categorieën: "Chipvermogen", "Gebruik", "CPU & RAM", "Inactieve machines" en "Overhead". Deze benadering, de zogenaamde "Comprehensive Approach", streeft naar een uitgebreidere en realistischere meting van het energieverbruik.
Een gemiddelde zoekopdracht, of mediane prompt, in Gemini verbruikt 0,26 ml water (ongeveer 5 druppels). Google-experts wezen erop dat het gebruik van water het energieverbruik met 10% kan verminderen ten opzichte van luchtkoeling. Locaties in gebieden met waterschaarste, zoals Mesa, Arizona, kiezen voor luchtkoeling om de lokale bronnen niet te belasten. Meer dan 25% van de datacenters gebruikt niet-drinkbaar of gerecycled water.
0,24 Wh per query lijkt misschien laag, maar is dit cijfer alleen voor een heel simpele prompt, zoals "hallo"? Het energieverbruik neemt toe naarmate een gesprek vordert, de query's complexer worden en het benodigde geheugen dienovereenkomstig groeit. Veel analisten beweren dat het meten van de milieu-impact van generatieve AI per enkele query cruciale informatie is, maar het helpt niet bij het schatten van de werkelijke impact van AI in termen van het aantal query's dat gebruikers dagelijks stellen. Kijkend naar de kwartaalgegevens van Google voor het tweede kwartaal van 2025, kunnen we het aantal gebruikers tellen, maar niet het verkeersvolume. De Gemini-app heeft meer dan 450 miljoen maandelijks actieve gebruikers, terwijl het aantal dagelijkse verzoeken met meer dan 50% is gestegen ten opzichte van het eerste kwartaal. We weten dus niet hoeveel energie Gemini verbruikt. We moeten genoegen nemen met een maatstaf die, indien ingevoerd, de verdienste zou hebben om LLM's op de markt te vergelijken.
De omvang van AI-modellen, zoals Gemini, is exponentieel gegroeid (verdubbeling elke ongeveer drieënhalve maand). Google, zo legden ze uit, innoveert om de energie-efficiëntie te verbeteren door intelligente besturingen te implementeren en stroomdistributiesystemen opnieuw te ontwerpen. Ze verschuiven ook AI-werklasten om elektriciteit te gebruiken in periodes met minder belasting van het net.
In 12 maanden tijd verminderde Google de voetafdruk van zijn zoekopdrachten met een factor 33 op het gebied van energie en met een factor 44 op het gebied van CO₂-uitstoot.
Nieuws en inzichten over politieke, economische en financiële gebeurtenissen.
Aanmeldenilsole24ore