Olaf AI
Posts
Het krachtigste taalmodel komt van... Facebook?

Het krachtigste taalmodel komt van... Facebook?

Meta introduceert Llama 3.1

Olaf Lemmens
July 24, 2024

De introductie van Llama 3.1 met 405B parameters

Wil je een open source AI model, de helft goedkoper dan GPT-4o en zelf aanpasbaar?

- één simpele oplossing ⤵️

Llama 3.1 405B van Meta.

Open source.
Gratis beschikbaar.
Klaar voor finetuning.

Ik vertel je er meer over in deze nieuwsbrief

TL;DR

Meta breidt uit naar een model met 128K tokens en lanceert Llama 3.1 405B - het eerste open source AI-model dat beter scoort dan de bekende modellen zoals GPT-4o.
Llama 3.1 405B rivaliseert met gesloten modellen en opent deuren voor nieuwe toepassingen.
Meta bouwt een compleet ecosysteem met tools voor aangepaste AI-agents en veilige implementatie.
Sterke partnerschappen: Meer dan 25 toonaangevende techbedrijven ondersteunen de lancering vanaf dag één.
Ervaar het zelf: Testen van Llama 3.1 405B kan in de VS via WhatsApp of meta.ai. In Nederland moeten we nog even wachten maar er is wel al een manier om het model te gebruiken, daar vertel ik je verderop in deze mail meer over!

Meta heeft een uitgebreide evaluatie uitgevoerd van hun nieuwe Llama 3.1 modellen. Ze hebben de prestaties getest op meer dan 150 benchmark datasets, die een breed scala aan talen omvatten. Daarnaast hebben ze uitgebreide menselijke evaluaties uitgevoerd, waarbij Llama 3.1 werd vergeleken met concurrerende modellen in realistische scenario's.

De experimentele evaluatie suggereert dat Meta's vlaggenschipmodel concurrerend is met toonaangevende foundation models op een reeks taken, waaronder GPT-4, GPT-4o en Claude 3.5 Sonnet. Bovendien blijken de kleinere modellen van Meta competitief te zijn met zowel gesloten als open modellen die een vergelijkbaar aantal parameters hebben.

Deze resultaten tonen aan dat Meta's inspanningen op het gebied van open AI-technologie significante vooruitgang boeken, waarbij zelfs hun kleinere modellen indrukwekkende prestaties leveren in vergelijking met gevestigde alternatieven.

Menselijke test

Ook deed Meta een uitgebreide menselijke test waarin ze Llama vergelijken met GPT-4 en GPT-4o van OpenAI en met Claude 3.5 Sonnet van Anthropic.

Model Architectuur

Meta's Llama 3.1 405B is hun grootste model tot nu toe. Het werd getraind op meer dan 15 biljoen tokens.

Om dit te bereiken, optimaliseerde Meta hun volledige trainingsstack. Ze zetten meer dan 16.000 H100 GPU's in.

Het model gebruikt een standaard decoder-only transformer architectuur. Dit zorgt voor stabiliteit tijdens het trainingsproces.

Meta koos voor een iteratieve post-training procedure. Elke ronde gebruikt supervised fine-tuning en direct preference optimization.

Data Verbeteringen

Meta verbeterde zowel de kwantiteit als kwaliteit van hun trainingsdata. Ze ontwikkelden:

Zorgvuldigere pre-processing
Betere curatieprocessen
Strengere kwaliteitscontroles
Geavanceerde filteringsmethoden

Het 405B parameter model presteert beter dan kleinere modellen. Het werd ook gebruikt om de kwaliteit van kleinere modellen te verbeteren.

Voor efficiënte inferentie kwantiseerde Meta de modellen van 16-bit naar 8-bit. Dit verlaagt de rekenkracht die nodig is.

Instruction en Chat Fine-tuning

Bij Llama 3.1 405B lag de focus op:

Verbeteren van hulpvaardigheid
Verhogen van kwaliteit
Versterken van instructie-opvolging
Waarborgen van veiligheid

Kansen voor Bedrijven

Fine-tuning biedt bedrijven unieke mogelijkheden:

Specialisatie: Pas het model aan voor uw specifieke branche of use-case.
Efficiëntie: Verbeter prestaties op taken die cruciaal zijn voor uw bedrijf.
Innovatie: Ontwikkel nieuwe AI-toepassingen die uw concurrentiepositie versterken.
Kostenbeheersing: Optimaliseer het model voor uw infrastructuur en bespaar op rekenkracht.
Veiligheid: Stem het model af op uw bedrijfsethiek en veiligheidsprotocollen.

Fine-tuning stelt bedrijven in staat om geavanceerde AI-technologie op maat te maken voor hun unieke behoeften en uitdagingen.

Meta erkent dat het werken met het 405B model uitdagend kan zijn. Daarom hebben ze geluisterd naar de gemeenschap en bieden nu uitgebreide ondersteuning.

Nieuwe Mogelijkheden

Met Llama 3.1 405B kunnen ontwikkelaars direct aan de slag met:

Real-time en batch inferentie
Supervised fine-tuning
Modelevaulatie voor specifieke toepassingen
Continual pre-training
Retrieval-Augmented Generation (RAG)
Function calling
Synthetische data generatie

Het Llama Ecosysteem

Meta heeft partnerships gesloten om het gebruik van Llama 3.1 405B te vergemakkelijken:

AWS, NVIDIA en Databricks bieden oplossingen voor geavanceerde workflows.
Groq heeft low-latency inferentie geoptimaliseerd voor cloudimplementaties.
Dell heeft vergelijkbare optimalisaties bereikt voor on-premise systemen.

Communityondersteuning

Meta werkte samen met belangrijke communityprojecten zoals:

vLLM
TensorRT
PyTorch

Deze samenwerking zorgt voor directe ondersteuning bij productie-implementaties.

Toekomstvisie

Meta hoopt dat de release van het 405B model zal leiden tot:

Innovatie in de bredere AI-gemeenschap
Vereenvoudiging van inferentie en fine-tuning voor grootschalige modellen
Stimulering van onderzoek naar model distillation

Door deze verbeteringen en samenwerkingen maakt Meta het voor ontwikkelaars en bedrijven eenvoudiger om de kracht van Llama 3.1 405B te benutten en nieuwe, innovatieve AI-toepassingen te creëren.

Llama 3.1 in Nederland gebruiken

Llama 3.1 is via meta.ai te gebruiken, echter is dat in Nederland (en België) nog niet mogelijk.

Een alternatief is Perplexity. In het betaalde abonnement is het nu mogelijk om Llama 3.1 405B nu als je standaard taalmodel te selecteren. Ik heb dit al gedaan en ben dus al uitvoerig aan het testen op persoonlijke taken.

Bij NinA AI bouwen we ook eigen AI toepassingen voor onze klanten, daarin maken we al gebruik van Llama 3 70B. De verwachting is dat we in de komende dagen ook Llama 3.1 405B kunnen gaan inbouwen in onze systemen. Hiermee kunnen we klanten direct de kracht van dit nieuwste model laten ervaren. En tevens kunnen profiteren van het werken met hun eigen data in combinatie met dit taalmodel. (Overigens geeft dit ook een voorsprong op de concurrenten van onze klanten!)

Ter afsluiting

Op zoek naar een AI Lezing, AI Business Scan of wil je ontdekken hoe wij een taalmodel als Llama 3.1 inbouwen in een eigen AI toepassingen zodat we tot wel 70% tijd te besparen op taken en processen binnen je organisatie? Kijk dan eens op de website:

Tot de volgende!

Olaf Lemmens