Computer use in Gemini 3.5 Flash: wanneer gespecialiseerde agentmodellen een ingebouwde tool werden

TL;DR. Volgens de aankondiging van Google DeepMind op 24 juni 2026 zit computer use native in Gemini 3.5 Flash — niet langer als apart model — met twee optionele enterprise-beveiligingen. Bestuurders moeten vastleggen welke repetitieve schermworkflows ze delegeren, niet welk gespecialiseerd agentmodel ze kopen.

Wat dit concreet mogelijk maakt

Doorlopende softwaretests automatiseren zonder voor elk scherm een technische koppeling te bouwen.
Knowledgework delegeren in de professionele applicaties die teams al dagelijks gebruiken.
Maatwerkagents bouwen via de Gemini-programmeerinterface (API) of het Gemini Enterprise Agent Platform.
Gevoelige acties afdekken met expliciete gebruikersbevestiging en automatische stop bij indirecte promptinjectie.

Wat de markt enkele maanden geleden verwachtte

Toen Google computer use eerst als aparte capaciteit lanceerde — eerder als zelfstandig Gemini 2.5-computer-usemodel, volgens de aankondiging van 24 juni — was de dominante lezing helder: agents die grafische interfaces bedienen, blijven een gespecialiseerde laag naast het algemene model. Teams zouden twee stacks beheren: één model voor redeneren, een tweede om te klikken, typen en scrollen op live schermen.

Die splitsing leek logisch. Een gebruikersinterface bedienen is ander werk dan een vraag beantwoorden. Veel bestuurders plaatsten computer use onder « apart technisch pilootproject », niet onder « standaard tooling-roadmap 2026 ».

Drie verwachtingen die uitkwamen

Enterprise-vraag naar automatisering op lange termijn

Google DeepMind meldt dat de integratie in Gemini 3.5 Flash de prestaties verbetert bij langdurige automatisering — doorlopende softwaretests en knowledgework in professionele applicaties. De echte behoefte was nooit een demotrick, maar processen over meerdere stappen en schermen.

Browser, mobiel en desktop in één agentstack

De post van 24 juni specificeert dat agents kunnen zien, redeneren en handelen in browser-, mobiele en desktopomgevingen. Organisaties die twijfelden tussen webautomatisering en tooling op het terrein hebben nu één fundament in plaats van drie parallelle projecten.

Veiligheid als commercieel voorwaarde, niet als late bijlage

Google DeepMind benadrukt gerichte adversarial training om injectierisico's in live omgevingen te beperken, plus twee optionele enterprise-beveiligingssystemen: expliciete bevestiging voor gevoelige of onomkeerbare acties, en automatische stop bij indirecte promptinjectie. De boodschap is duidelijk — zonder waarborgen hoort de agent niet in productie.

Drie punten waar de realiteit afwijkte

Fusie in het hoofd-Flashmodel

Het scenario « twee modellen onderhouden » houdt niet meer stand. Volgens de aankondiging was computer use eerder alleen beschikbaar als zelfstandig model; het zit nu native in Gemini 3.5 Flash, naast bestaande ingebouwde tools zoals Search en Maps grounding. Voor productteams verlaagt dat de complexiteit en verkort het de weg van prototype naar piloot.

De sterkste aangekondigde prestaties voor schermgestuurde agenttaken

Google DeepMind stelt dat Gemini 3.5 Flash de beste prestaties tot nu toe levert voor agentische computer-use-taken. De aankondiging publiceert geen benchmarks in tekst, dus de claim blijft kwalitatief — maar het signaleert dat Google schermbesturing niet langer als experimentele bijlage behandelt.

Concrete usecases al gedemonstreerd

Het artikel toont twee scenario's: de Gemini-app analyseren om een gecategoriseerde functielijst te leveren, en documentatie auditen op toegankelijkheidsproblemen. Dat zijn geen abstracte beloftes, maar kwaliteitscontroles en documentreviews die veel organisaties wekelijks handmatig uitvoeren.

Drie implicaties voor de volgende cyclus

In kaart brengen welke schermen repetitief zijn. Maak binnen zeven dagen een lijst van interfacehandelingen die teams herhalen zonder menselijk oordeel — formulieren, QA-checks, afstemming tussen tools.

Testen in een sandbox vóór productietoegang. Google beveelt defense-in-depth aan: beveiligde sandbox, mens-in-de-lus-verificatie en strikte toegangscontroles, bovenop de twee enterprise-waarborgen.

Recruitment en upskilling aligneren. Profielen die agents en hun waarborgen kunnen configureren worden waardevoller — niet alleen promptspecialisten, maar verantwoordelijke automatiseringsarchitecten.

Moeten bestuurders nu een computer-use-piloot starten?

Ja — als u een repetitief schermproces hebt en een geïsoleerde testsandbox. Google maakt de capaciteit beschikbaar via de Gemini API en het Gemini Enterprise Agent Platform, met een door Browserbase gehoste demo en een referentie-implementatie op GitHub.

De aankondiging citeert al klantfeedback van Browserbase, Browser Use en UiPath. Het marktsignaal is duidelijk: dit is geen onderzoekspreview meer. Google richt zich expliciet op doorlopende softwaretests en knowledgework in professionele applicaties — workflows waarbij maatwerkintegratie vaak meer kost dan de verwachte winst. Een piloot zonder stopregels of bevestiging bij onomkeerbare acties blijft echter een operationeel risico — geen productiviteitssnelkoppeling.

Welk proces delegeert u aan een agent die uw schermen ziet?

Spreekt deze analyse u aan? Ik publiceer elke dag een stuk van dit kaliber over digitale innovatie en enterprise AI. 👉 Ontvang de volgende rechtstreeks in uw mailbox — inschrijven duurt tien seconden, en elke editie wordt vóór 9 uur gelezen door leiders van Belgische kmo's, mid-caps en instellingen.

Bronnen

Introducing computer use in Gemini 3.5 Flash (deepmind.google)