Published on:

VLA-architectuur wint terrein in intelligent rijden, terwijl het industriedebat verschuift van 'architectuuroorlogen' naar convergentie van capaciteiten

De snelle ontwikkeling in de Chinese intelligente voertuigindustrie herdefinieert hoe kerntechnologieën worden waargenomen. Een framework dat ooit werd omschreven als een "ster van de volgende generatie" is in minder dan een jaar tijd door sommige critici bestempeld als een "vereenvoudigde architectuur." Dat framework is VLA (Vision-Language-Action), momenteel een van de meest besproken benaderingen in geassisteerd en geautomatiseerd rijden.

VLA Architecture concept visualization

Van robotica naar auto's

Het concept van VLA kwam in juli 2023 in de publieke belangstelling, na de release door DeepMind van het RT-2-model voor robotbesturing. Binnen slechts enkele maanden pasten vroege ontwikkelaars van autonoom rijden het VLA-concept — oorspronkelijk ontworpen voor belichaamde intelligentie — aan voor het automotive domein, aangetrokken door het potentieel om ruwe perceptie direct te koppelen aan rijacties.

Tegen 2025 waren meerdere geassisteerde rijsystemen op basis van VLA-principes in de praktijk in gebruik genomen. VLA is sindsdien een van de mainstream technische routes geworden, hoewel niet de enige.

DeepMind RT-2 robotics to automotive transition

World Models en VLA: Minder verschillend dan ze lijken

Op het eerste gezicht lijken de twee benaderingen — World Models en VLA — fundamenteel tegenovergesteld. Wereldmodellen leggen de nadruk op het reconstrueren van een digitale replica van de fysieke omgeving, terwijl VLA de nadruk legt op end-to-end leren van perceptie naar actie.

Bij nadere inspectie blijkt echter dat beide in de kern technische implementaties zijn van hetzelfde paradigma: neurale netwerken gecombineerd met reinforcement learning.

Het verschil zit hem meer in de nadruk — wereldmodellen richten zich op expliciete omgevingsreconstructie, terwijl VLA de nadruk legt op het genereren van acties — maar de onderliggende mechanica is opmerkelijk vergelijkbaar.

Comparison between World Models and VLA paradigms

Praktische inzet: Li Auto's VLA-chauffeursmodel

Onder autofabrikanten wordt Li Auto algemeen erkend als de eerste die op grote schaal een op VLA gebaseerd chauffeursmodel heeft ingezet. Sinds de eerste volledige uitrol heeft het systeem al meerdere iteraties ondergaan, met recente updates geleverd via OTA 8.1.

Volgens praktijkgegevens vertoont het VLA-chauffeursmodel een soepelere bewegingscontrole en een meer mensachtige rijlogica. Deze verbetering komt voort uit verschillende technische sprongen:

  • Schaalbaarheid: Bijna een verdubbeling van de geactiveerde modelparameters naar ongeveer 4 miljard.
  • Prestaties: Verhoogde frequentie van trajectuitvoer van 10 Hz, wat de latentie aanzienlijk vermindert.
  • Redeneren: Sterker 3D-ruimtelijk redeneren in verkeersscenario's met "onderhandeling".

Li Auto OTA 8.1 driver model interface

Verder dan geassisteerd rijden: Richting AI-agenten

Geavanceerdere toepassingen benadrukken het langetermijnpotentieel van VLA. In semi-gesloten omgevingen zoals industrieparken kan het systeem de intentie van de gebruiker afleiden zonder expliciete navigatie-input, vertrouwend op semantisch redeneren en langetermijngeheugen.

Deze mogelijkheden wijzen erop dat VLA zich ontwikkelt tot een AI-agent in plaats van een nauw gedefinieerde rijfunctie — in staat om te leren, te onthouden en strategieën aan te passen op basis van veranderende omstandigheden.

VLA AI Agent intent inference logic

Convergentie, geen vervanging

Waarnemers in de sector stellen steeds vaker dat de toekomst van geassisteerd rijden mogelijk niet afhangt van het vervangen van de ene architectuur door de andere, maar van een diepgaande optimalisatie van bestaande frameworks.

VLA en wereldmodellen lijken naar elkaar toe te groeien richting een gedeeld doel: schaalbare, generaliseerbare intelligentie voor het rijden. Het debat verschuift geleidelijk van "welke architectuur wint" naar hoe snel de prestaties in de praktijk kunnen verbeteren onder realistische beperkingen.

Capability convergence in intelligent vehicle industry