Published on:

أبل بتعرض نظرة أولية على الجيل الجاي من الـ Vision Pro Persona ومعمارية شريحة M5 في نقاش تقني نادر

آبل قدمت نظرة مفصلة بشكل غير معتاد على مستقبل Vision Pro، وكشفت عن تحديثات كبيرة لنظام Persona، ودور شريحة M5 الجاية، وتوجه الشركة الأوسع في الحوسبة المكانية والذكاء الاصطناعي على الجهاز.

المعلومات دي جاية من تبادل تقني نادر بين الصحافة واتنين من القادة الأساسيين في فريق Vision Pro، وبتقدم صورة أوضح لإزاي آبل بتطور Vision Pro عشان يبقى منصة حوسبة مكانية طويلة المدى.

Apple Vision Pro technical roadmap overview

نظام Persona بياخد نقلة نوعية مع تقنية 3D Gaussian Splatting

بعد إصدار visionOS 2.0، المستخدمين لاحظوا تحسن كبير في واقعية الـ Persona. في قلب التحديث ده تقنية رندر جديدة نسبياً اسمها 3D Gaussian Splatting (3DGS).

على عكس جرافيك الكمبيوتر التقليدي اللي بيعتمد على مش (meshes) مبنية يدويًا، 3DGS بتشتغل عن طريق تعلم الهندسة مباشرة من الصور الملتقطة. النظام بيسجل فيديو من زوايا متعددة وبيستنتج هيكل الوش كمجموعة من عناصر الـ Gaussian الحجمية—نقط على شكل بيضاوي ليها موضع، وحجم، وشفافية.

آبل أكدت إن Persona دلوقتي بتستخدم نهج معتمد بالكامل على Gaussian، من غير هندسة مش هجينة، وده بيسمح بانتقالات ألوان طبيعية جداً وتفاصيل سطح بيصعب على الـ meshes إنها تقلدها.

3D Gaussian Splatting vs traditional mesh rendering

من أفاتار FaceTime لهوية رقمية

رؤية آبل طويلة المدى لـ Persona بتمتد لأبعد من مجرد مكالمات فيديو بسيطة. بيتم تطوير Persona كـ تمثيل رقمي للهوية، مدمج مباشرة في البيئات ثلاثية الأبعاد.

الشركة سلطت الضوء كمان على HUGS (Human Gaussian Splatting)، وهو مشروع مفتوح المصدر بيوسع التقنية دي عشان تشمل أفاتار للجسم بالكامل. التمثيلات دي ممكن تزويدها بهيكل عظمي للتحريك، وده بيسمح بوجود عن بُعد (telepresence) غامر بحيث يظهر المشاركين كأفاتار مكاني بكامل حجمهم جوه بيئات بعض الحقيقية.

شريحة M5: معمارية GPU جديدة مبنية للذكاء الاصطناعي + الجرافيك

شريحة M5 بتقدم أهم مكاسبها من خلال تغييرات في المعمارية مش مجرد زيادة في الحجم. لأول مرة، كل نواة GPU فيها Neural Accelerator مخصص.

المسرعات دي على مستوى الـ GPU متصممة خصيصاً لأحمال عمل دمج الذكاء الاصطناعي والجرافيك، زي:

  • تقليل الضوضاء (denoising) بالذكاء الاصطناعي
  • تحسين دقة الفيديو (super-resolution)
  • توليد الفريمات (Frame generation)
  • تأثيرات الرندر المتقدمة

قبل كده، البيانات كان لازم تتحرك بشكل متكرر بين الـ GPU والـ NPU. مع M5، العمليات دي ممكن تخلص بالكامل جوه الـ GPU، وده بيقلل التأخير (latency) وبيحسن الكفاءة للمهام المكانية في الوقت الفعلي.

Apple M5 Chip GPU core with Neural Accelerator

ليه Vision Pro هي أكتر جهاز هيستفيد من M5

في حين إن التحسن في اللاب توبات العادية ممكن يكون بسيط، Vision Pro هي المستفيد الأساسي من معمارية M5. كونه سماعة واقع مختلط (VST) بتعتمد على الكاميرات، الجهاز بيشغل باستمرار مهام مكثفة للذكاء الاصطناعي بتشمل:

  • SLAM (تحديد الموقع ورسم الخرائط في نفس الوقت)
  • فهم البيئة
  • تقليل ضوضاء الرؤية النافذة المعتمد على الذكاء الاصطناعي
  • رندر Persona

تقريباً كل أحمال العمل دي بتتماشى بالظبط مع تصميم GPU المعزز بالذكاء الاصطناعي في M5، وده بيضمن تجربة مكانية سلسة وعالية الدقة.

Vision Pro sensor and AI workload integration

فلسفة آبل الأوسع في الذكاء الاصطناعي

آبل أكدت تاني إن استراتيجيتها بتتركز على الذكاء المعتمد على الجهاز (device-centric intelligence)—بناء نماذج عالمية شخصية ومستمرة بتجمع بين المدخلات البصرية، وبيانات الحركة، والفهم المكاني.

مشاريع زي FastVLM، وهو نموذج رؤية-لغة مفتوح المصدر، بيجسد التوجه ده، وبيقدم استنتاج سريع ومنخفض الطاقة لذكاء مدرك للسياق في الوقت الفعلي. ده بيعمل حلقة مقفولة: العالم الحقيقي بيتحول لبيانات متجهة (vectorized)، بيتم تفسيرها بالذكاء الاصطناعي، وبتتعرض تاني في تجارب مكانية غامرة.

التكنولوجيا، الإدراك، والمستقبل

خريطة طريق Vision Pro من آبل بتشير لطموح أعمق: إعادة تشكيل إزاي البشر بيدركوا الواقع وبيتعاملوا معاه من خلال الحوسبة. من خلال الجمع بين الذكاء الاصطناعي المكاني، والتجسيد الرقمي الواقعي، والسيليكون المصمم خصيصاً للغرض ده، آبل بتخلي Vision Pro أكتر من مجرد سماعة—دي تجربة في إزاي الأنظمة الرقمية ممكن تعزز الإدراك البشري نفسه.

The future of spatial computing and human perception