Llama 4: indrukwekkende AI of vooral veel geblaat van Meta?

Meta heeft een nieuw AI-model gelanceerd: Llama 4. De techreus belooft veel — een model dat het opneemt tegen GPT-4.5 en zelfs beter zou presteren op wetenschappelijke testen. Maar klopt dat wel? Of is het vooral slimme marketing?
We doken erin, testten het model zelf en zochten uit wat Llama 4 nu écht kan.
Wat is Llama 4 precies?
Llama 4 is een open source AI-model. Dat betekent dat iedereen ermee aan de slag mag. Geen betaalmuur zoals bij ChatGPT. Meta heeft twee varianten uitgebracht:
- Scout
- Maverick
Beide draaien op 17 miljard actieve parameters per taak. Het verschil zit in hoe slim ze zijn opgebouwd. Scout gebruikt 16 zogeheten experts, Maverick 128. Daardoor is Maverick krachtiger, zonder dat je daar een datacenter voor nodig hebt. Slim geregeld via een techniek die mixture of experts heet: alleen de juiste onderdelen van het model worden geactiveerd. De rest blijft uit. Zo bespaar je rekenkracht.
Wil je écht zwaar geschut? Meta werkt ook aan een monster genaamd Llama 4 Behemoth, met bijna twee biljoen parameters. Maar die is nog in training.
Wat belooft Meta?
Volgens Meta is Llama 4 goed in alles: van het samenvatten van lange documenten tot het analyseren van code en het schrijven van creatieve verhalen. Scout zou zelfs werken met contextvensters tot 10 miljoen tokens. Ter vergelijking: ChatGPT zit rond de 128.000 à 1 miljoen.
Dat klinkt indrukwekkend — maar er zit een addertje onder het gras. In de praktijk kun je alleen lokaal gebruikmaken van die 10 miljoen tokens. Online tools beperken dit vaak tot zo’n 300.000. En lokaal draaien? Dan heb je een peperdure GPU nodig.
Zo presteert Llama 4 in de praktijk
We hebben het model uitvoerig getest. Hier zijn onze bevindingen, zonder opsmuk.
📚 Informatie ophalen uit lange teksten
Bij korte contexten (tot 85.000 tokens) wist Llama 4 redelijk vaak de juiste informatie te vinden. Maar bij langere teksten ging het mis. Bij een test met de volledige Foundation-trilogie van Asimov vonden we… niks. Het model miste alle geplaatste testzinnen.
Dus ja, 10 miljoen tokens klinkt gaaf, maar als het bij 300.000 al hapert, wat heb je er dan aan?
🧠 Logisch nadenken
We legden Llama 4 een klassieke instinker voor: Kan een man trouwen met de zus van zijn weduwe? Het juiste antwoord is natuurlijk: nee, want hij is dood. Maar Llama 4 ging volledig de juridische kant op. Zelfs in andere talen gaf het model tegenstrijdige antwoorden.
Het toont aan: logisch redeneren is niet de sterkste kant van dit model.
✍️ Creatieve schrijfstijl? Ja!
Op het gebied van verhalen schrijven blinkt Llama 4 wél uit. We vroegen om een verhaal over een tijdreiziger die per ongeluk de geschiedenis verandert. Het resultaat? Een goed opgebouwd, sfeervol verhaal vol culturele details. Van Maya-symboliek tot geurige beschrijvingen — het model wist te boeien.
Vergeleken met GPT-4.5 is Llama 4 misschien wat losser qua structuur, maar het vertelt meeslepend en origineel. Zeker voor fictie is dit een sterk punt.
🛑 Censuur en veiligheid
Meta heeft de veiligheidsfilters flink aangescherpt. Het model weigert vrijwel elk verzoek dat ook maar ruikt naar een ‘gevoelig onderwerp’. Zelfs onschuldige vragen over ethiek of cybersecurity stuiten al op een muur.
Dat kan frustrerend zijn, maar gelukkig is Llama 4 open source. De community zal ongetwijfeld aangepaste versies maken met minder strenge grenzen.
🔍 Complexe problemen oplossen
Bij een langere whodunit-puzzel over een stalker deed Llama 4 het wél goed. Het model wist de juiste persoon aan te wijzen, zonder zich te laten misleiden door afleidende details. Hier bleek zijn analytische aanpak waardevol — rechttoe rechtaan, zonder onnodige twijfels.
Voor wie is Llama 4 interessant?
Voor ontwikkelaars en AI-fans is Llama 4 een prima basis om op voort te bouwen. De open source-structuur biedt veel vrijheid. Vooral bij creatieve toepassingen blinkt het model uit.
Zoek je echter een AI die uitblinkt in logica of betrouwbaar lange teksten kan analyseren? Dan zijn er alternatieven die beter scoren — denk aan DeepSeek R1 of Gemma 3.
Conclusie: prima startpunt, nog geen eindbaas
Llama 4 is een solide stap van Meta, maar niet het wondermodel dat werd beloofd. De 10 miljoen tokens? In theorie indrukwekkend, in de praktijk voorlopig beperkt. De logica? Kan beter. De creativiteit? Een sterk punt.
Voor de crypto-investeerder betekent dit vooral: AI blijft zich razendsnel ontwikkelen. Modellen als Llama 4 laten zien dat open source een serieuze speler wordt. En dat is goed nieuws voor iedereen die zelf wil bouwen, testen of innoveren — zonder vast te zitten aan gesloten platforms.
Zelf Llama 4 proberen? Je vindt de modellen op llama.meta.com en Hugging Face.