Published on:
Apple zapowiada nową generację Vision Pro Persona i architekturę układu M5 w rzadkiej dyskusji technicznej
Apple zaoferowało niezwykle szczegółowy wgląd w przyszłość Vision Pro, ujawniając istotne aktualizacje systemu Persona, rolę nadchodzącego układu M5 oraz szerszy kierunek firmy w dziedzinie obliczeń przestrzennych i AI na urządzeniu.
Spostrzeżenia te pochodzą z rzadkiej wymiany technicznej między mediami a dwoma kluczowymi liderami zespołu Vision Pro, oferując wyraźniejszy obraz tego, jak Apple rozwija Vision Pro w długoterminową platformę obliczeń przestrzennych.

Persona wykonuje wielki skok dzięki 3D Gaussian Splatting
Po wydaniu visionOS 2.0 użytkownicy zauważyli znaczną poprawę realizmu Persona. U podstaw tej aktualizacji leży stosunkowo nowa technika renderowania znana jako 3D Gaussian Splatting (3DGS).
W przeciwieństwie do tradycyjnej grafiki komputerowej, która opiera się na ręcznie konstruowanych siatkach, 3DGS działa poprzez naukę geometrii bezpośrednio z zarejestrowanych obrazów. System rejestruje wideo pod wieloma kątami i wnioskuje o strukturze twarzy jako zbiorze wolumetrycznych elementów Gaussa — punktów w kształcie elipsoid o określonej pozycji, skali i przezroczystości.
Apple potwierdziło, że Persona używa teraz podejścia opartego wyłącznie na technice Gaussa, bez hybrydowej geometrii siatek, co pozwala na bardzo naturalne przejścia kolorów i szczegóły powierzchni, których odwzorowanie za pomocą siatek jest trudne.

Od awatarów FaceTime do cyfrowej tożsamości
Długoterminowa wizja Apple dla Persona wykracza poza proste połączenia wideo. Persona jest rozwijana jako cyfrowa reprezentacja tożsamości, zintegrowana bezpośrednio ze środowiskami trójwymiarowymi.
Firma podkreśliła również HUGS (Human Gaussian Splatting), otwarty projekt, który rozszerza tę technikę na awatary całego ciała. Reprezentacje te mogą być wyposażone w animację szkieletową, co umożliwia imersyjną teleobecność, w której uczestnicy pojawiają się jako pełnowymiarowe awatary przestrzenne w swoich rzeczywistych środowiskach.
Układ M5: Nowa architektura GPU zbudowana dla AI + grafiki
Układ M5 zapewnia najbardziej znaczące korzyści dzięki zmianom architektonicznym, a nie zwykłemu skalowaniu wydajności. Po raz pierwszy każdy rdzeń GPU zawiera dedykowany akcelerator neuronowy.
Te akceleratory na poziomie GPU są zaprojektowane specjalnie dla obciążeń typu fuzja AI i grafiki, takich jak:
- Odszumianie AI
- Super-rozdzielczość wideo
- Generowanie klatek
- Zaawansowane efekty renderowania
Poprzednio dane musiały być wielokrotnie przesyłane między GPU a NPU. Dzięki M5 operacje te mogą być w całości wykonywane w obrębie GPU, co zmniejsza opóźnienia i poprawia wydajność w zadaniach przestrzennych wykonywanych w czasie rzeczywistym.

Dlaczego Vision Pro zyskuje najwięcej dzięki M5
Podczas gdy zyski w standardowych laptopach mogą być subtelne, Vision Pro jest głównym beneficjentem architektury M5. Jako headset typu video see-through (VST), stale wykonuje on zadania intensywnie wykorzystujące AI, w tym:
- SLAM (Simultaneous Localization and Mapping)
- Zrozumienie otoczenia
- Oparte na AI odszumianie obrazu passthrough
- Renderowanie Persona
Prawie wszystkie te obciążenia precyzyjnie wpisują się w konstrukcję GPU układu M5 wspomaganą przez AI, zapewniając płynne i wysokiej jakości doświadczenia przestrzenne.

Szersza filozofia AI Apple
Apple powtórzyło, że jego strategia koncentruje się na inteligencji skoncentrowanej na urządzeniu — budowaniu trwałych, osobistych modeli świata, które łączą dane wizualne, dane o ruchu i zrozumienie przestrzenne.
Projekty takie jak FastVLM, otwarty model wizyjno-językowy, są przykładem tego kierunku, oferując szybkie wnioskowanie o niskim poborze mocy dla inteligentnych rozwiązań działających w czasie rzeczywistym i uwzględniających kontekst. Tworzy to zamkniętą pętlę: świat rzeczywisty jest wektoryzowany, interpretowany przez AI i rzutowany z powrotem do imersyjnych doświadczeń przestrzennych.
Technologia, percepcja i przyszłość
Mapa drogowa Vision Pro od Apple sugeruje głębsze ambicje: przekształcenie sposobu, w jaki ludzie postrzegają rzeczywistość i wchodzą z nią w interakcję za pomocą obliczeń. Łącząc przestrzenną AI, realistyczne cyfrowe ucieleśnienie i dedykowane procesory, Apple pozycjonuje Vision Pro jako coś więcej niż headset — to eksperyment dotyczący tego, jak systemy cyfrowe mogą rozszerzać samą ludzką percepcję.
