Published on:
Apple v rámci vzácné technické diskuse představuje novou generaci Persona pro Vision Pro a architekturu čipu M5
Apple nabídl neobvykle detailní pohled do budoucnosti Vision Pro a odhalil zásadní aktualizace svého systému Persona, roli nadcházejícího čipu M5 a širší směřování společnosti v oblasti prostorových výpočtů a AI přímo v zařízení.
Tyto poznatky pocházejí ze vzácné technické výměny mezi médii a dvěma klíčovými lídry týmu Vision Pro a nabízejí jasnější představu o tom, jak Apple vyvíjí Vision Pro v dlouhodobou platformu pro prostorové výpočty.

Persona dělá velký skok díky 3D Gaussian Splattingu
Po vydání visionOS 2.0 si uživatelé všimli výrazného zlepšení realismu funkcí Persona. Jádrem této aktualizace je relativně nová technika vykreslování známá jako 3D Gaussian Splatting (3DGS).
Na rozdíl od tradiční počítačové grafiky, která spoléhá na ručně konstruované polygonové sítě (meshe), 3DGS funguje tak, že se učí geometrii přímo ze zachycených snímků. Systém zaznamenává video z více úhlů a odvozuje strukturu obličeje jako soubor volumetrických Gaussovských elementů - bodů ve tvaru elipsoidu s pozicí, měřítkem a průhledností.
Apple potvrdil, že Persona nyní využívá čistě Gaussovský přístup, bez hybridní polygonové geometrie, což umožňuje vysoce přirozené barevné přechody a povrchové detaily, které se pomocí meshů replikují jen stěží.

Od FaceTime avatarů k digitální identitě
Dlouhodobá vize Applu pro systém Persona přesahuje jednoduché videohovory. Persona je vyvíjena jako digitální reprezentace identity, integrovaná přímo do trojrozměrných prostředí.
Společnost také zdůraznila HUGS (Human Gaussian Splatting), open-source projekt, který tuto techniku rozšiřuje na avatary celého těla. Tyto reprezentace mohou být osazeny kosterní animací, což umožňuje pohlcující teleprezenci, kde se účastníci objevují jako prostoroví avataři v životní velikosti v reálném prostředí toho druhého.
Čip M5: Nová GPU architektura vytvořená pro AI + grafiku
Čip M5 přináší své nejvýznamnější zisky spíše prostřednictvím architektonických změn než pouhým škálováním výkonu. Poprvé obsahuje každé jádro GPU vyhrazený neurální akcelerátor.
Tyto akcelerátory na úrovni GPU jsou navrženy specificky pro úlohy propojující AI a grafiku, jako jsou:
- AI odšumování (denoising)
- Super-rozlišení videa
- Generování snímků (frame generation)
- Pokročilé efekty vykreslování
Dříve se data musela opakovaně přesouvat mezi GPU a NPU. S M5 lze tyto operace dokončit zcela v rámci GPU, což snižuje latenci a zvyšuje efektivitu pro prostorové úlohy v reálném čase.

Proč Vision Pro těží z M5 nejvíc
Zatímco u standardních notebooků mohou být zisky nenápadné, Vision Pro je primárním příjemcem výhod architektury M5. Jako headset s technologií video průhledu (VST) nepřetržitě spouští úlohy náročné na AI, včetně:
- SLAM (Simultánní lokalizace a mapování)
- Vnímání okolního prostředí
- AI odšumování průhledu
- Vykreslování Persony
Téměř všechny tyto pracovní zátěže přesně odpovídají designu GPU s AI akcelerací v čipu M5, což zajišťuje plynulý a vysoce věrný prostorový zážitek.

Širší filozofie Applu v oblasti AI
Apple zopakoval, že se jeho strategie zaměřuje na inteligenci orientovanou na zařízení - vytváření perzistentních, osobních modelů světa, které kombinují vizuální vstup, data o pohybu a prostorové vnímání.
Projekty jako FastVLM, open-source vizuálně-jazykový model, jsou příkladem tohoto směru a nabízejí rychlou inferenci s nízkou spotřebou pro real-time inteligenci vnímající kontext. To vytváří uzavřenou smyčku: reálný svět je vektorizován, interpretován umělou inteligencí a promítán zpět do pohlcujících prostorových zážitků.
Technologie, vnímání a budoucnost
Roadmapa Apple Vision Pro naznačuje hlubší ambici: přetvořit způsob, jakým lidé vnímají realitu a interagují s ní prostřednictvím výpočetní techniky. Kombinací prostorové AI, realistického digitálního vtělení a účelově vytvořeného křemíku staví Apple Vision Pro do pozice více než jen headsetu - je to experiment v tom, jak mohou digitální systémy rozšiřovat samotné lidské vnímání.
