Published on:
Apple hé lộ Persona trên Vision Pro thế hệ mới và kiến trúc chip M5 trong buổi thảo luận kỹ thuật hiếm hoi
Apple đã đưa ra một cái nhìn chi tiết khác thường về tương lai của Vision Pro, tiết lộ các bản cập nhật lớn cho hệ thống Persona, vai trò của chip M5 sắp ra mắt và hướng đi rộng hơn của công ty trong lĩnh vực tính toán không gian và AI trên thiết bị.
Những thông tin chi tiết này đến từ một cuộc trao đổi kỹ thuật hiếm hoi giữa giới truyền thông và hai nhà lãnh đạo chủ chốt từ nhóm Vision Pro, mang đến một bức tranh rõ ràng hơn về cách Apple đang phát triển Vision Pro thành một nền tảng tính toán không gian dài hạn.

Persona Có Bước Nhảy Vọt Lớn với 3D Gaussian Splatting
Sau khi phát hành visionOS 2.0, người dùng đã nhận thấy sự cải thiện đáng kể về độ chân thực của Persona. Cốt lõi của bản nâng cấp này là một kỹ thuật kết xuất tương đối mới được gọi là 3D Gaussian Splatting (3DGS).
Khác với đồ họa máy tính truyền thống dựa trên các lưới được xây dựng thủ công, 3DGS hoạt động bằng cách học hình học trực tiếp từ các hình ảnh chụp được. Hệ thống ghi lại video từ nhiều góc độ và suy luận cấu trúc của khuôn mặt dưới dạng một tập hợp các phần tử Gaussian thể tích—các điểm hình elip với vị trí, tỷ lệ và độ trong suốt.
Apple xác nhận rằng Persona hiện sử dụng phương pháp thuần dựa trên Gaussian, không có cấu trúc lưới lai, cho phép chuyển đổi màu sắc tự nhiên cao và chi tiết bề mặt mà các lưới khó có thể tái tạo được.

Từ Ảnh Đại Diện FaceTime Đến Định Danh Kỹ Thuật Số
Tầm nhìn dài hạn của Apple cho Persona vượt xa các cuộc gọi video đơn thuần. Persona đang được phát triển như một đại diện kỹ thuật số của danh tính, được tích hợp trực tiếp vào môi trường ba chiều.
Công ty cũng nhấn mạnh HUGS (Human Gaussian Splatting), một dự án mã nguồn mở mở rộng kỹ thuật này cho các nhân vật đại diện toàn thân. Những biểu hiện này có thể được gắn xương để hoạt hình hóa, cho phép sự hiện diện từ xa nhập vai, nơi những người tham gia xuất hiện dưới dạng các nhân vật đại diện không gian quy mô đầy đủ trong môi trường thực của nhau.
Chip M5: Kiến Trúc GPU Mới Được Xây Dựng Cho AI + Đồ Họa
Chip M5 mang lại những cải tiến có ý nghĩa nhất thông qua các thay đổi về kiến trúc thay vì chỉ mở rộng quy mô thô. Lần đầu tiên, mỗi lõi GPU bao gồm một Neural Accelerator chuyên dụng.
Các bộ tăng tốc cấp GPU này được thiết kế dành riêng cho các khối lượng công việc kết hợp AI-đồ họa, chẳng hạn như:
- Khử nhiễu bằng AI
- Siêu độ phân giải video
- Tạo khung hình
- Hiệu ứng kết xuất nâng cao
Trước đây, dữ liệu phải di chuyển liên tục giữa GPU và NPU. Với M5, các hoạt động này có thể được hoàn thành hoàn toàn trong GPU, giảm độ trễ và cải thiện hiệu quả cho các tác vụ không gian thời gian thực.

Tại Sao Vision Pro Hưởng Lợi Nhiều Nhất Từ M5
Trong khi các lợi ích trên máy tính xách tay tiêu chuẩn có thể không quá rõ rệt, Vision Pro là đối tượng hưởng lợi chính từ kiến trúc M5. Là một thiết bị đeo video xuyên thấu (VST), nó liên tục chạy các tác vụ thâm dụng AI bao gồm:
- SLAM (Simultaneous Localization and Mapping)
- Hiểu biết về môi trường
- Khử nhiễu xuyên thấu dựa trên AI
- Kết xuất Persona
Gần như tất cả các khối lượng công việc này đều phù hợp chính xác với thiết kế GPU tăng cường AI của M5, đảm bảo trải nghiệm không gian mượt mà và có độ trung thực cao.

Triết Lý AI Rộng Lớn Hơn Của Apple
Apple nhắc lại rằng chiến lược của họ tập trung vào trí tuệ tập trung vào thiết bị—xây dựng các mô hình thế giới cá nhân, liên tục kết hợp đầu vào hình ảnh, dữ liệu chuyển động và sự hiểu biết về không gian.
Các dự án như FastVLM, một mô hình ngôn ngữ-thị giác mã nguồn mở, là minh chứng cho hướng đi này, cung cấp khả năng suy luận nhanh, năng lượng thấp cho trí tuệ nhận biết ngữ cảnh trong thời gian thực. Điều này tạo thành một vòng khép kín: thế giới thực được vectơ hóa, được giải thích bởi AI và được chiếu ngược lại vào các trải nghiệm không gian nhập vai.
Công Nghệ, Nhận Thức Và Tương Lai
Lộ trình Vision Pro của Apple gợi ý một tham vọng sâu sắc hơn: định hình lại cách con người nhận thức và tương tác với thực tế thông qua tính toán. Bằng cách kết hợp AI không gian, sự hiện diện kỹ thuật số thực tế và silicon được chế tạo có mục đích, Apple đang định vị Vision Pro không chỉ là một thiết bị đeo—nó là một thử nghiệm về cách các hệ thống kỹ thuật số có thể tăng cường chính nhận thức của con người.
