NVIDIA Cosmos 3: het eerste open fysieke AI-omni-model — en de vijf definities van 'open' die de aankondiging overslaat

TL;DR. Op 1 juni 2026 publiceerde NVIDIA Cosmos 3 op Hugging Face — het eerste open omni-model voor fysieke AI, volgens de officiële aankondiging. De Nano-variant draait 8 miljard parameters op een werkstation-GPU RTX PRO 6000. Vijf dimensies bepalen wat "open" hier betekent. Precies daar beginnen de enterprise-vragen.

Het cijfer, zonder omhaal

Op 1 juni 2026 zette NVIDIA twee varianten van Cosmos 3 op Hugging Face: een Nano-versie (een reasoner van 8 miljard parameters + een generator van 8 miljard parameters) en een Super-versie (32 miljard + 32 miljard), volgens het officiële bericht nvidia/cosmos-3-for-physical-ai. De architectuur, Mixture-of-Transformers (MoT) genaamd, combineert wereldgeneratie, fysisch redeneren en actiegeneratie in één enkel model.

Wat de bron precies meet: het vermogen van het model om tekst, afbeeldingen, video en actiesequenties als invoer te verwerken — en uitvoer in dezelfde modaliteiten te produceren. Vijf taken zitten in dezelfde architectuur: tekst-naar-video-generatie, visueel taalmodel (VLM), forward dynamics-modellering, inverse dynamics-modellering en actiebeleidsgeneratie.

De hardwaredrempel staat expliciet in de aankondiging: de Nano-versie richt zich op werkstation-GPU's zoals de RTX PRO 6000; de Super-versie vereist NVIDIA Hopper- of Blackwell-GPU's. Dit is geen randnota in de configuratiedocumentatie — het is de scheidingslijn tussen lokale inzet en afhankelijkheid van een datacenter.

Drie gedocumenteerde voordelen

1. Vijf taken, één model

Volgens de officiële aankondiging voert Cosmos 3 vijf afzonderlijke taken uit binnen één uniforme architectuur — ter vervanging van wat anders meerdere gespecialiseerde modellen zou vereisen. Voor teams die momenteel aparte modellen voor visie, simulatie en actiebeheer orkestreren, verlaagt de consolidatie de operationele complexiteit op een meetbare manier.

2. Zes open synthetische data-domeinen

NVIDIA publiceerde gelijktijdig synthetische datasets over zes domeinen — robotica, fysica, redeneren, menselijke beweging, autonoom rijden en magazijnoperaties — volgens dezelfde bron. Teams zonder geannoteerde real-world data voor fysieke systemen krijgen een concreet startpunt, zonder voorafgaande verzamelingsinfrastructuur.

3. Native Diffusers-integratie

De Cosmos3OmniPipeline is rechtstreeks beschikbaar in de Hugging Face Diffusers-bibliotheek, met open post-training scripts op GitHub, aldus de officiële aankondiging. Een team dat al werkt in het Hugging Face-ecosysteem kan starten zonder een propriëtaire adaptatielaag.

Drie voorwaarden die de kop verzwijgt

1. "Open" omvat vijf lagen, niet één

De officiële aankondiging onderscheidt expliciet vijf dimensies van openheid: aanwezigheid op de Hub, Diffusers-integratie, GitHub post-training scripts, synthetische datasets en het Cosmos Framework. Deze vijf lagen delen niet noodzakelijk dezelfde commerciële licentievoorwaarden. Voor elke enterprise-inzet verdienen de model cards van Cosmos 3 Nano en Super een zorgvuldige juridische lezing — de commerciële gebruiksvoorwaarden staan daar vermeld.

2. De Nano is nog steeds een dubbele architectuur

De Nano-configuratie betekent 8 miljard parameters (reasoner) + 8 miljard (generator): twee modellen die in tandem werken. De gerichte RTX PRO 6000 is een professionele high-end GPU — niet een standaard werkstation uit het middensegment. De formulering "werkstation" is technisch correct, maar suggereert toegankelijkheid die de hardwarekosten aanzienlijk nuanceren.

3. Synthetische datasets dekken slechts zes domeinen

De gepubliceerde datasets beslaan robotica, fysica, redeneren, menselijke beweging, autonoom rijden en magazijnoperaties. Toepassingen buiten deze domeinen — gespecialiseerde industrie, atypische omgevingen, gezondheidszorg of mijnbouw — vereisen dat het team zelf synthetische data genereert. De publicatie verkleint het probleem voor bepaalde gevallen; ze lost het niet op voor alle sectoren.

Wat publieke signalen al tonen

Cosmos 3 verscheen dezelfde week als een volledig lokale inzetgids voor Reachy Mini, een conversatierobot waarvan de spraak-naar-spraak-pipeline volledig op een consumenten-GPU draait zonder enige cloud-oproep, aldus het Hugging Face-bericht van 27 mei 2026. Twee onafhankelijke aankondigingen, dezelfde richting: fysieke AI verlaat het cloud-first-regime.

De onderliggende drijfveren zijn zichtbaar in sectorpublicaties: latentiebeperkingen en privacyvereisten voor industriële data duwen een deel van de robotica-inzetten richting lokale inferentie. Reachy Mini elimineert alle audio-overdrachten buiten het lokale netwerk aldus dezelfde bron; Cosmos 3 Nano biedt een model voor fysieke wereldgeneratie zonder datacenter aldus de officiële NVIDIA-aankondiging. Beide publicaties wijzen in dezelfde richting.

Drie hefbomen voor deze week

Lees de model cards van Cosmos 3 Nano en Super op Hugging Face — de commerciële licentievoorwaarden staan daar gedocumenteerd. Één uur review voorkomt juridische onduidelijkheid zes maanden later bij een productie-inzet.
Start een pilot voor synthetische datageneratie in een van de zes gepubliceerde domeinen (robotica, magazijn, autonoom rijden). De Cosmos3OmniPipeline in Diffusers maakt installatie toegankelijk voor een standaard ML-team — de juiste plek om de kwaliteit van de output te beoordelen vóór een architectuurbeslissing.
Breng de huidige cloud-afhankelijkheden in uw fysieke AI-pipeline in kaart — visie, simulatie, actie. Waar latentie- of privacy-beperkingen van toepassing zijn, biedt Cosmos 3 Nano een lokaal inzetbaar alternatief dat publiek gedocumenteerd en vandaag al evalueerbaar is.

Welke cloud-afhankelijkheid draagt uw fysieke AI-pipeline vandaag nog mee — en welke kunt u deze week vervangen?

Spreekt deze analyse u aan? Ik publiceer elke dag een stuk van dit kaliber over digitale innovatie en enterprise AI. 👉 Ontvang de volgende rechtstreeks in uw mailbox — inschrijven duurt tien seconden, en elke editie wordt vóór 9 uur gelezen door leiders van Belgische kmo's, mid-caps en instellingen.

Bronnen

Welcome NVIDIA Cosmos 3: The First Open Omni-model for Physical AI Reasoning and Action (Hugging Face)
Reachy Mini goes fully local (Hugging Face)