Published on:

Apple antaa esimakua uuden sukupolven Vision Pro Personasta ja M5-sirun arkkitehtuurista harvinaisessa teknisessä keskustelussa

Apple on tarjonnut poikkeuksellisen yksityiskohtaisen katsauksen Vision Pron tulevaisuuteen paljastaen suuria päivityksiä Persona-järjestelmäänsä, tulevan M5-sirun roolin sekä yhtiön laajemman suunnan spatiaalisessa tietotekniikassa ja laitteessa tapahtuvassa tekoälyssä.

Nämä havainnot ovat peräisin harvinaisesta teknisestä keskustelusta median ja kahden Vision Pro -tiimin avainhenkilön välillä, tarjoten selkeämmän kuvan siitä, miten Apple kehittää Vision Prota pitkän aikavälin spatiaalisen tietotekniikan alustaksi.

Apple Vision Pro -teknologian etenemissuunnitelman yleiskatsaus

Persona ottaa merkittävän harppauksen 3D Gaussian Splatting -tekniikan myötä

visionOS 2.0 -version julkaisun jälkeen käyttäjät ovat huomanneet huomattavan parannuksen Personan realistisuudessa. Tämän päivityksen ytimessä on suhteellisen uusi renderöintitekniikka, joka tunnetaan nimellä 3D Gaussian Splatting (3DGS).

Toisin kuin perinteinen tietokonegrafiikka, joka tukeutuu manuaalisesti rakennettuihin mesheihin, 3DGS toimii oppimalla geometrian suoraan otetuista kuvista. Järjestelmä tallentaa videota useista kulmista ja päättelee kasvojen rakenteen kokoelmana volumetrisiä Gaussin elementtejä - ellipsin muotoisia pisteitä, joilla on sijainti, mittakaava ja läpinäkyvyys.

Apple vahvisti, että Persona käyttää nyt puhdasta Gauss-pohjaista lähestymistapaa, ilman hybridimesh-geometriaa, mikä mahdollistaa erittäin luonnolliset värisiirtymät ja pintayksityiskohdat, joiden toistamisessa meshit kohtaavat vaikeuksia.

3D Gaussian Splatting vs. perinteinen mesh-renderöinti

FaceTime-avatareista digitaaliseen identiteettiin

Applen pitkän aikavälin visio Personasta ulottuu yksinkertaisia videopuheluita pidemmälle. Personaa kehitetään identiteetin digitaalisena representaationa, joka on integroitu suoraan kolmiulotteisiin ympäristöihin.

Yhtiö korosti myös HUGS (Human Gaussian Splatting) -projektia, joka on avoimen lähdekoodin hanke ja laajentaa tekniikan koko kehon avatareihin. Nämä representaatiot voidaan varustaa luurankoanimaatiolla, mikä mahdollistaa mukaansatempaavan etäläsnäolon, jossa osallistujat näkyvät täysikokoisina spatiaalisina avatareina toistensa todellisissa ympäristöissä.

M5-siru: Uusi GPU-arkkitehtuuri, joka on rakennettu tekoälyä ja grafiikkaa varten

M5-siru tuo merkittävimmät hyötynsä arkkitehtuurimuutosten kautta raa’an suorituskyvyn kasvun sijaan. Ensimmäistä kertaa jokainen GPU-ydin sisältää dedikoidun Neural Accelerator -kiihdyttimen.

Nämä GPU-tason kiihdyttimet on suunniteltu erityisesti tekoälyn ja grafiikan fuusio-työkuormille, kuten:

  • Tekoälypohjainen kohinanvaimennus
  • Videon super-resoluutio
  • Ruutujen generointi
  • Edistyneet renderöintiefektit

Aiemmin dataa piti siirtää toistuvasti GPU:n ja NPU:n välillä. M5-sirun myötä nämä toiminnot voidaan suorittaa kokonaan GPU:n sisällä, mikä vähentää viivettä ja parantaa tehokkuutta reaaliaikaisissa spatiaalisissa tehtävissä.

Apple M5 -sirun GPU-ydin ja Neural Accelerator -kiihdytin

Miksi Vision Pro hyötyy eniten M5-sirusta

Vaikka parannukset tavallisissa kannettavissa tietokoneissa voivat olla hienovaraisia, Vision Pro on M5-arkkitehtuurin ensisijainen hyötyjä. Video see-through (VST) -laseina se suorittaa jatkuvasti tekoälyintensiivisiä tehtäviä, mukaan lukien:

  • SLAM (Simultaneous Localization and Mapping)
  • Ympäristön ymmärtäminen
  • Tekoälypohjainen läpiviennin kohinanvaimennus
  • Persona-renderöinti

Lähes kaikki nämä työkuormat vastaavat tarkasti M5:n tekoälyllä vahvistettua GPU-suunnittelua, varmistaen saumattoman ja korkealaatuisen spatiaalisen kokemuksen.

Vision Pron sensorien ja tekoälyn työkuormien integrointi

Applen laajempi tekoälyfilosofia

Apple toisti, että sen strategia keskittyy laitekeskeiseen älykkyyteen - jatkuvien, henkilökohtaisten maailmanmallien rakentamiseen, jotka yhdistävät visuaalisen syötteen, liiketiedon ja spatiaalisen ymmärryksen.

Projektit kuten FastVLM, avoimen lähdekoodin visio-kielimalli, havainnollistavat tätä suuntaa tarjoamalla nopeaa ja vähävirtaista päättelyä reaaliaikaista, kontekstitietoista älykkyyttä varten. Tämä muodostaa suljetun kehän: todellinen maailma vektoroidaan, tekoäly tulkitsee sen ja se projisoidaan takaisin mukaansatempaaviksi spatiaalisiksi kokemuksiksi.

Teknologia, havainnointi ja tulevaisuus

Applen Vision Pro -tiekartta viittaa syvempään tavoitteeseen: muokata sitä, miten ihmiset havaitsevat todellisuuden ja vuorovaikuttavat sen kanssa laskennan avulla. Yhdistämällä spatiaalisen tekoälyn, realistisen digitaalisen ruumiillistuman ja tarkoitukseen rakennetun piiteknologian, Apple asemoi Vision Pron enemmän kuin vain laseiksi - se on kokeilu siitä, miten digitaaliset järjestelmät voivat laajentaa itse ihmisen havaintokykyä.

Spatiaalisen tietotekniikan ja ihmisen havaintokyvyn tulevaisuus