Published on:

Apple presenta in anteprima la Persona di prossima generazione per Vision Pro e l'architettura del chip M5 in una rara discussione tecnica

Apple ha offerto uno sguardo insolitamente dettagliato sul futuro di Vision Pro, rivelando importanti aggiornamenti al suo sistema Persona, il ruolo dell'imminente chip M5 e la direzione più ampia dell'azienda nel computing spaziale e nell'IA on-device.

Le intuizioni provengono da un raro scambio tecnico tra i media e due leader chiave del team Vision Pro, offrendo un quadro più chiaro di come Apple stia facendo evolvere Vision Pro in una piattaforma di computing spaziale a lungo termine.

Panoramica della roadmap tecnica di Apple Vision Pro

Persona compie un grande salto con il 3D Gaussian Splatting

In seguito al rilascio di visionOS 2.0, gli utenti hanno notato un miglioramento significativo nel realismo di Persona. Al centro di questo aggiornamento c'è una tecnica di rendering relativamente nuova nota come 3D Gaussian Splatting (3DGS).

A differenza della computer grafica tradizionale che si basa su mesh costruite manualmente, il 3DGS funziona apprendendo la geometria direttamente dalle immagini acquisite. Il sistema registra video da più angolazioni e deduce la struttura di un volto come una collezione di elementi Gaussiani volumetrici — punti a forma di ellissoide con posizione, scala e trasparenza.

Apple ha confermato che Persona ora utilizza un approccio puramente basato su Gaussian, senza geometria mesh ibrida, consentendo transizioni di colore altamente naturali e dettagli superficiali che le mesh faticano a replicare.

3D Gaussian Splatting vs rendering mesh tradizionale

Dagli avatar di FaceTime all'identità digitale

La visione a lungo termine di Apple per Persona va oltre le semplici videochiamate. Persona viene sviluppata come una rappresentazione digitale dell'identità, integrata direttamente in ambienti tridimensionali.

L'azienda ha anche evidenziato HUGS (Human Gaussian Splatting), un progetto open source che estende la tecnica ad avatar a corpo intero. Queste rappresentazioni possono essere dotate di animazione scheletrica, consentendo una telepresenza immersiva in cui i partecipanti appaiono come avatar spaziali a grandezza naturale all'interno degli ambienti reali degli uni e degli altri.

Chip M5: Una nuova architettura GPU costruita per IA + Grafica

Il chip M5 offre i suoi guadagni più significativi attraverso cambiamenti architetturali piuttosto che una semplice scalabilità della potenza. Per la prima volta, ogni core GPU include un Acceleratore Neurale dedicato.

Questi acceleratori a livello di GPU sono progettati specificamente per carichi di lavoro di fusione IA-grafica, come:

  • Denoising IA
  • Super-risoluzione video
  • Generazione di frame
  • Effetti di rendering avanzati

In precedenza, i dati dovevano spostarsi ripetutamente tra la GPU e la NPU. Con l'M5, queste operazioni possono essere completate interamente all'interno della GPU, riducendo la latenza e migliorando l'efficienza per i compiti spaziali in tempo reale.

Core GPU del chip Apple M5 con Acceleratore Neurale

Perché Vision Pro trae il massimo beneficio dall'M5

Se i guadagni sui laptop standard possono essere sottili, Vision Pro è il principale beneficiario dell'architettura M5. Come visore video see-through (VST), esegue continuamente attività ad alta intensità di IA, tra cui:

  • SLAM (Simultaneous Localization and Mapping)
  • Comprensione dell'ambiente
  • Denoising del passthrough basato su IA
  • Rendering di Persona

Quasi tutti questi carichi di lavoro si allineano precisamente con il design della GPU potenziata dall'IA di M5, garantendo un'esperienza spaziale fluida e ad alta fedeltà.

Integrazione dei sensori di Vision Pro e dei carichi di lavoro IA

La filosofia IA più ampia di Apple

Apple ha ribadito che la sua strategia si concentra sull'intelligenza device-centric — costruendo modelli di mondo personali e persistenti che combinano input visivi, dati di movimento e comprensione spaziale.

Progetti come FastVLM, un modello di visione-linguaggio open source, esemplificano questa direzione, offrendo un'inferenza rapida e a basso consumo per un'intelligenza in tempo reale e sensibile al contesto. Questo forma un ciclo chiuso: il mondo reale viene vettorializzato, interpretato dall'IA e proiettato nuovamente in esperienze spaziali immersive.

Tecnologia, percezione e futuro

La roadmap di Apple per Vision Pro suggerisce un'ambizione più profonda: rimodellare il modo in cui gli esseri umani percepiscono e interagiscono con la realtà attraverso il calcolo computazionale. Combinando l'IA spaziale, una rappresentazione digitale realistica e un silicio costruito ad hoc, Apple sta posizionando Vision Pro come qualcosa di più di un visore: è un esperimento su come i sistemi digitali possano aumentare la percezione umana stessa.

Il futuro del computing spaziale e della percezione umana