Published on:
Apple 在罕见的技术讨论中预览下一代 Vision Pro Persona 与 M5 芯片架构
Apple 罕见地详细展示了 Vision Pro 的未来,揭示了其 Persona 系统的重大更新、即将推出的 M5 芯片的作用,以及该公司在空间计算和设备端 AI 方面的更广泛方向。
这些见解源于媒体与 Vision Pro 团队两位关键领导者之间一次罕见的技术交流,为 Apple 如何将 Vision Pro 演进为长期空间计算平台描绘了更清晰的蓝图。

Persona 凭借 3D 高斯泼溅技术实现重大飞跃
随着 visionOS 2.0 的发布,用户注意到 Persona 的逼真度有了显著提高。这一升级的核心是一种被称为 3D 高斯泼溅 (3DGS) 的相对较新的渲染技术。
与依赖于手动构建网格的传统计算机图形学不同,3DGS 通过直接从捕获的图像中学习几何结构来工作。系统从多个角度记录视频,并将面部结构推断为一组体积高斯元素——具有位置、缩放和透明度的椭圆体点。
Apple 确认,Persona 现在使用的是纯高斯方法,不包含混合网格几何结构,从而实现了高度自然的色彩过渡和网格难以复制的表面细节。

从 FaceTime 化身到数字身份
Apple 对 Persona 的长期愿景超出了简单的视频通话。Persona 正在被开发为一种身份的数字代表,直接整合到三维环境中。
该公司还强调了 HUGS (Human Gaussian Splatting),这是一个开源项目,将该技术扩展到了全身化身。这些代表可以进行骨骼动画绑定,从而实现沉浸式的远程呈现,让参与者在彼此的真实环境中以全尺寸空间化身的形式出现。
M5 芯片:专为 AI + 图形打造的新型 GPU 架构
M5 芯片通过架构变革而非原始规模提升带来了最有意义的增益。每一颗 GPU 核心首次包含了一个专用的神经网络加速器 (Neural Accelerator)。
这些 GPU 级加速器专为 AI 与图形融合的工作负载而设计,例如:
- AI 去噪
- 视频超分辨率
- 帧生成
- 高级渲染效果
以前,数据必须在 GPU 和 NPU 之间重复移动。有了 M5,这些操作可以完全在 GPU 内部完成,从而降低了延迟并提高了实时空间任务的效率。

为什么 Vision Pro 从 M5 中受益最大
虽然在标准笔记本电脑上的提升可能并不明显,但 Vision Pro 是 M5 架构的主要受益者。作为一款视频透视 (VST) 头显,它持续运行 AI 密集型任务,包括:
- SLAM (即时定位与地图构建)
- 环境理解
- 基于 AI 的透视去噪
- Persona 渲染
几乎所有这些工作负载都与 M5 增强了 AI 能力的 GPU 设计精确契合,确保了无缝且高保真的空间体验。

Apple 更广泛的 AI 理念
Apple 重申,其战略重点是以设备为中心的智能——构建持久的、个性化的世界模型,结合视觉输入、运动数据和空间理解。
诸如 FastVLM,一个开源视觉语言模型,体现了这一方向,为实时、环境感知智能提供了快速、低功耗的推理。这形成了一个闭环:现实世界被矢量化,由 AI 解释,并投射回沉浸式空间体验中。
技术、感知与未来
Apple 的 Vision Pro 路线图表明了一个更深层次的野心:通过计算重塑人类感知现实和与现实互动的方式。通过结合空间 AI、逼真的数字体现和定制芯片,Apple 将 Vision Pro 定位为不仅仅是一个头显——它是对数字系统如何增强人类感知本身的一次实验。
