Published on:
Apple 在罕見的技術討論中預覽下一代 Vision Pro 虛擬人像與 M5 晶片架構
Apple 對 Vision Pro 的未來提供了異常詳詳盡的見解,揭示了其 Persona 系統的重大更新、即將推出的 M5 晶片所扮演的角色,以及該公司在空間運算和裝置端 AI 方面的更廣泛發展方向。
這些見解來自媒體與 Vision Pro 團隊兩位關鍵領導者之間罕見的技術交流,為 Apple 如何將 Vision Pro 演進為長期空間運算平台提供了更清晰的藍圖。

Persona 藉由 3D 高斯潑濺技術實現重大飛躍
在 visionOS 2.0 發布後,使用者注意到 Persona 的逼真度有了顯著提升。這次升級的核心是一種稱為 3D 高斯潑濺 (3DGS) 的相對較新的渲染技術。
與依賴手動構建網格的傳統電腦圖形不同,3DGS 透過直接從捕捉到的影像中學習幾何結構來運作。系統從多個角度記錄影片,並將臉部結構推導為一組體積高斯元素——具有位置、縮放和透明度的橢球狀點。
Apple 證實 Persona 現在使用純高斯基礎方法,無需混合網格幾何,從而實現了高度自然的色彩過渡和表面細節,而這些是網格難以複製的。

從 FaceTime 頭像到數位身分
Apple 對 Persona 的長期願景超出了簡單的視訊通話。Persona 正在被開發為身分的數位代表,直接整合到三維環境中。
該公司還強調了 HUGS (Human Gaussian Splatting),這是一個開源專案,將該技術擴展到全身虛擬人像。這些代表可以綁定骨骼動畫,實現沉浸式的遠端呈現,參與者在彼此的現實環境中以全尺寸空間人像的形式出現。
M5 晶片:專為 AI + 圖形打造的新型 GPU 架構
M5 晶片透過架構變革而非單純的規模擴張,帶來了最有意義的提升。每個 GPU 核心首次包含一個專用的神經加速器。
這些 GPU 等級的加速器專為 AI 圖形融合工作負載而設計,例如:
- AI 降噪
- 影片超解析度
- 影格生成
- 進階渲染效果
以前,數據必須在 GPU 和 NPU 之間反覆移動。有了 M5,這些操作可以完全在 GPU 內完成,從而降低延遲並提高即時空間任務的效率。

為什麼 Vision Pro 從 M5 中獲益最多
雖然標準筆記型電腦的提升可能微乎其微,但 Vision Pro 是 M5 架構的主要受益者。作為一款影像透視 (VST) 裝置,它持續運行 AI 密集型任務,包括:
- SLAM (即時定位與地圖構建)
- 環境理解
- 基於 AI 的透視降噪
- Persona 渲染
幾乎所有這些工作負載都與 M5 的 AI 增強 GPU 設計精確對齊,確保了無縫且高保真的空間體驗。

Apple 更廣泛的 AI 哲學
Apple 重申其策略專注於以裝置為中心的智慧——構建結合視覺輸入、運動數據和空間理解的持久個人世界模型。
FastVLM(一個開源視覺語言模型)等專案體現了這一方向,為即時、情境感知的智慧提供快速、低功耗的推理。這形成了一個閉環:現實世界被向量化,由 AI 解釋,並投影回沉浸式空間體驗中。
技術、感知與未來
Apple 的 Vision Pro 路線圖展現了更深遠的野心:透過運算重新塑造人類感知現實及與之互動的方式。藉由結合空間 AI、逼真的數位實體化和專門構建的晶片,Apple 正在將 Vision Pro 定位為超越耳機的產品——它是數位系統如何增強人類感知本身的一場實驗。
