Published on:

Apple förhandsvisar nästa generations Vision Pro Persona och M5-chiparkitektur i en sällsynt teknisk diskussion

Apple har erbjudit en ovanligt detaljerad inblick i framtiden för Vision Pro, där man avslöjar stora uppdateringar av sitt Personasystem, rollen för det kommande M5-chipet och företagets bredare inriktning inom spatial computing och AI på enheten.

Insikterna kommer från ett sällsynt tekniskt utbyte mellan media och två nyckelpersoner från Vision Pro-teamet, vilket ger en tydligare bild av hur Apple utvecklar Vision Pro till en långsiktig plattform för spatial computing.

Apple Vision Pro technical roadmap overview

Persona tar ett stort kliv med 3D Gaussian Splatting

Efter releasen av visionOS 2.0 har användare märkt en betydande förbättring av realismen i Persona. Kärnan i denna uppgradering är en relativt ny renderingsteknik känd som 3D Gaussian Splatting (3DGS).

Till skillnad från traditionell datorgrafik som förlitar sig på manuellt konstruerade meshar, fungerar 3DGS genom att lära sig geometri direkt från tagna bilder. Systemet spelar in video från flera vinklar och härleder strukturen av ett ansikte som en samling volymetriska Gaussian-element — ellipsoidformade punkter med position, skala och transparens.

Apple bekräftade att Persona nu använder ett rent Gaussian-baserat tillvägagångssätt, utan hybrid mesh-geometri, vilket möjliggör mycket naturliga färgövergångar och ytdetaljer som meshar har svårt att replikera.

3D Gaussian Splatting vs traditional mesh rendering

Från FaceTime-avatarer till digital identitet

Apples långsiktiga vision för Persona sträcker sig bortom enkla videosamtal. Persona utvecklas som en digital representation av identitet, integrerad direkt i tredimensionella miljöer.

Företaget lyfte också fram HUGS (Human Gaussian Splatting), ett open-source-projekt som utökar tekniken till avatarer i helfigur. Dessa representationer kan förses med skelettanimering, vilket möjliggör uppslukande telepresence där deltagare framstår som spatiala avatarer i full skala i varandras verkliga miljöer.

M5-chipet: En ny GPU-arkitektur byggd för AI + grafik

M5-chipet levererar sina mest betydande vinster genom arkitektoniska förändringar snarare än rå skalning. För första gången inkluderar varje GPU-kärna en dedikerad Neural Accelerator.

Dessa acceleratorer på GPU-nivå är utformade specifikt för arbetsbelastningar inom AI-grafikfusion, såsom:

  • AI-brusreducering
  • Video-superupplösning
  • Bildrutsgenerering
  • Avancerade renderingseffekter

Tidigare var data tvungen att flyttas upprepade gånger mellan GPU och NPU. Med M5 kan dessa operationer slutföras helt inom GPU:n, vilket minskar latensen och förbättrar effektiviteten för spatiala uppgifter i realtid.

Apple M5 Chip GPU core with Neural Accelerator

Varför Vision Pro gynnas mest av M5

Medan vinsterna på vanliga bärbara datorer kan vara subtila, är Vision Pro den främsta mottagaren av M5-arkitekturen. Som ett video see-through (VST)-headset kör det kontinuerligt AI-intensiva uppgifter inklusive:

  • SLAM (Simultaneous Localization and Mapping)
  • Miljöförståelse
  • AI-baserad passthrough-brusreducering
  • Persona-rendering

Nästan alla dessa arbetsbelastningar ligger helt i linje med M5:s AI-förstärkta GPU-design, vilket säkerställer en sömlös och naturtrogen spatial upplevelse.

Vision Pro sensor and AI workload integration

Apples bredare AI-filosofi

Apple upprepade att deras strategi fokuserar på intelligens centrerad till enheten — att konstruera persistenta, personliga världsmodeller som kombinerar visuella indata, rörelsedata och spatial förståelse.

Projekt som FastVLM, en open-source vision-language-modell, exemplifierar denna inriktning och erbjuder snabb inferens med låg effekt för kontextmedveten intelligens i realtid. Detta bildar ett slutet kretslopp: den verkliga världen vektoriseras, tolkas av AI och projiceras tillbaka till uppslukande spatiala upplevelser.

Teknik, perception och framtiden

Apples färdplan för Vision Pro tyder på en djupare ambition: att omforma hur människor uppfattar och interagerar med verkligheten genom beräkningar. Genom att kombinera spatial AI, realistisk digital förkroppsligande och specialbyggt kisel, positionerar Apple Vision Pro som mer än ett headset — det är ett experiment i hur digitala system kan förstärka själva den mänskliga perceptionen.

The future of spatial computing and human perception