Olaf AI
Posts
Nvidia's AI-taalmodel overtreft GPT-4!

Nvidia's AI-taalmodel overtreft GPT-4!

Is dit een klap voor OpenAI?

Olaf Lemmens
October 17, 2024

Vanochtend was ik onderweg want ik was te gast in een hele toffe podcast over ondernemen: VTalks.

En die tijd in de auto wou ik nuttig besteden, want naast dat ik een AI podcast aan het luisteren was leek het me een goed idee om ChatGPT me te helpen met de voorbereiding op de podcast.

Van te voren had ik het voorbereidingsdocument met vragen ingeladen en gevraagd om me richting te geven, geen letterlijke antwoorden natuurlijk, maar wel duiding en waar ik op moest letten.

Eigenlijk alsof ik in de auto nog even met een assistent op kantoor belde om het een en ander door te nemen.

Dit is zo’n voorbeeld hoe ik AI in mijn dagelijkse leven integreer en het me echt helpt.

Oh en ik was het soms ook oneens met ChatGPT.

Het deed me denken aan hoe snel deze technologie zich ontwikkelt en hoe belangrijk het is om bij te blijven.

Laten we eens kijken naar de laatste ontwikkelingen die de AI-wereld op zijn kop zetten. En dat zijn best grote dingen!

TL;DR

Nvidia's Nemotron overtreft toonaangevende AI-modellen
Mistral AI onthult krachtige nieuwe on-device AI-modellen
Boston Dynamics en Toyota bundelen krachten voor AI-humanoïden

Nvidia's Nemotron: De nieuwe kampioen van open-source AI?

Het weet in ieder geval hoeveel R’en er in Strawberry zitten.

Nvidia heeft stilletjes een nieuw open-source, fijnafgestemd LLM gelanceerd genaamd Llama-3.1-Nemotron-70B-Instruct. En laat dit model nu de prestaties van industrieleiders zoals GPT-4o en Claude 3.5 Sonnet overtreffen op belangrijke benchmarks.

Wat maakt Nemotron zo bijzonder?

Het is gebaseerd op Meta's Llama 3.1 70B model, maar verfijnd door NVIDIA met geavanceerde Machine Learning-methoden zoals RLHF.
Het model behaalt topscores op alignement-benchmarks zoals Arena Hard (85.0), AlpacaEval 2 LC (57.6) en GPT-4-Turbo MT-Bench (8.98).
Deze scores overtreffen concurrenten als GPT-4o en Claude 3.5 Sonnet op meerdere metrics - ondanks dat het model significant kleiner is met slechts 70B parameters.

Nvidia heeft het model, het beloningsmodel en de trainingsdataset open-source beschikbaar gesteld op Hugging Face. Je kunt het model ook testen in een preview op de website van het bedrijf.

Wat betekent dit? Terwijl Nvidia's successen in chipproductie alom bekend zijn, blijft het bedrijf verrassen met krachtige modellen. Met open-source fundamenten en geavanceerde fine-tuning laat Nemotron zien dat kleinere, efficiënte modellen kunnen concurreren met de giganten in het veld.

Dit is tevens ideaal voor bedrijven die volledige controle over hun AI modellen willen. Dat kan een zeer goede investering zijn, waarbij we kunnen helpen!

Mistral AI: Krachtige AI in je broekzak

De Franse AI-startup Mistral AI heeft zojuist twee nieuwe compacte taalmodellen gelanceerd, ontworpen om krachtige AI-mogelijkheden naar edge-apparaten zoals telefoons en laptops te brengen.

Wat maakt deze modellen bijzonder?

De nieuwe 'Les Ministraux'-familie omvat de Ministral 3B en Ministral 8B modellen, met respectievelijk slechts 3B en 8B parameters.
Ondanks hun kleine omvang overtreffen de modellen concurrenten als Gemma en Llama op benchmarks, inclusief Mistral's eigen 7B model van vorig jaar.
Minstral 8B gebruikt een nieuw 'interleaved sliding-window attention'-mechanisme om lange sequenties efficiënt te verwerken.

Deze modellen zijn ontworpen voor gebruik op apparaten zelf, denk aan lokale vertalingen, offline assistenten en autonome robotica.

Met de aanstaande uitrol van Apple Intelligence als eerste AI-ervaring op apparaten voor veel gebruikers, zetten kleinere modellen die efficiënt en lokaal op telefoons en computers kunnen draaien, de trend voort.

Een topklasse LLM in de palm van je hand wordt binnenkort de norm, geen luxe.

Boston Dynamics en Toyota: Humanoïde robots

In een verrassende samenwerking hebben Boston Dynamics en het Toyota Research Institute de handen ineengeslagen om de ontwikkeling van geavanceerde humanoïde robots te versnellen. Hun plan? Het integreren van Toyota's Large Behavior Models (LBM's) in de elektrische Atlas-robot van Boston Dynamics.

Wat maakt deze samenwerking zo interessant?

Toyota's LBM's zijn gericht op het aanleren van multi-tasking, behendigheid en taalgestuurde capaciteiten aan robots.
De samenwerking brengt twee roboticalaboratoria samen die eigendom zijn van concurrerende autofabrikanten: Hyundai (eigenaar van Boston Dynamics sinds 2020) en Toyota.
Toyota's 'Diffusion Policy' stelt robots in staat om meer dan 60 complexe vaardigheden te leren van menselijke demonstraties, zonder programmeren.

Boston Dynamics heeft onlangs afscheid genomen van zijn hydraulische Atlas-robot en introduceerde de elektrische update, die momenteel wordt getest in Hyundai's autofabrieken.

Deze samenwerking vertegenwoordigt een grote stap voorwaarts in de race naar commerciële humanoïde robots.

Met concurrenten als Tesla's Optimus en Figure's 01 humanoïden die ook in de running zijn, belooft het een spannende strijd te worden.

Wat denk jij? Zullen we binnenkort allemaal een persoonlijke AI-assistent in onze broekzak hebben? En hoe zie jij de toekomst van humanoïde robots in ons dagelijks leven?

Wat vond je van de nieuwsbrief van vandaag?

⭐

Tot de volgende,

Olaf Lemmens

P.S. Wil je meer weten over hoe je AI effectief kunt inzetten in jouw bedrijf? Kijk eens op: https://www.nina-ai.nl

Of laten we online kennismaken: https://tidycal.com/olaf/kennismaking-30-minuten-olaf