Published on:

Apple, Nadir Bir Teknik Tartışmada Yeni Nesil Vision Pro Persona ve M5 Çip Mimarisinin Önizlemesini Sunuyor

Apple, Vision Pro'nun geleceğine dair alışılmadık derecede ayrıntılı bir bakış sundu; Persona sistemine yönelik büyük güncellemeleri, gelecek M5 çipinin rolünü ve şirketin uzamsal bilişim ve cihaz içi yapay zeka alanındaki daha geniş yönelimini açıkladı.

Bu içgörüler, medya ile Vision Pro ekibinden iki kilit lider arasındaki nadir bir teknik görüş alışverişinden geliyor ve Apple'ın Vision Pro'yu nasıl uzun vadeli bir uzamsal bilişim platformuna dönüştürdüğüne dair daha net bir tablo sunuyor.

Apple Vision Pro technical roadmap overview

Persona, 3D Gaussian Splatting ile Büyük Bir Atılım Yapıyor

visionOS 2.0'ın yayınlanmasının ardından kullanıcılar, Persona gerçekçiliğinde önemli bir iyileşme fark ettiler. Bu yükseltmenin temelinde 3D Gaussian Splatting (3DGS) olarak bilinen nispeten yeni bir renderleme tekniği yatıyor.

Elle oluşturulmuş mesh'lere dayanan geleneksel bilgisayar grafiklerinin aksine 3DGS, doğrudan yakalanan görüntülerden geometri öğrenerek çalışır. Sistem, birden fazla açıdan video kaydeder ve bir yüzün yapısını hacimsel Gaussian öğelerinin bir koleksiyonu olarak çıkarır; bunlar konum, ölçek ve şeffaflığa sahip elipsoid şekilli noktalardır.

Apple, Persona'nın artık hibrit mesh geometrisi olmadan tamamen Gaussian tabanlı bir yaklaşım kullandığını doğruladı; bu da mesh'lerin kopyalamakta zorlandığı son derece doğal renk geçişlerine ve yüzey ayrıntılarına olanak tanıyor.

3D Gaussian Splatting vs traditional mesh rendering

FaceTime Avatarlarından Dijital Kimliğe

Apple'ın Persona için uzun vadeli vizyonu, basit video görüşmelerinin ötesine geçiyor. Persona, doğrudan üç boyutlu ortamlara entegre edilmiş bir kimliğin dijital temsili olarak geliştiriliyor.

Şirket ayrıca, bu tekniği tam vücut avatarlarına genişleten açık kaynaklı bir proje olan HUGS (Human Gaussian Splatting) teknolojisini de vurguladı. Bu temsiller, iskelet animasyonu ile donatılarak, katılımcıların birbirlerinin gerçek ortamlarında tam ölçekli uzamsal avatarlar olarak göründüğü sürükleyici bir tele-varlık (telepresence) deneyimi sağlar.

M5 Çipi: Yapay Zeka + Grafikler İçin Oluşturulmuş Yeni Bir GPU Mimarisi

M5 çipi, ham ölçeklemeden ziyade mimari değişiklikler yoluyla en anlamlı kazanımlarını sunuyor. İlk kez, her bir GPU çekirdeği özel bir Neural Accelerator içeriyor.

Bu GPU düzeyindeki hızlandırıcılar, özellikle aşağıdakiler gibi AI-grafik füzyonu iş yükleri için tasarlanmıştır:

  • AI gürültü giderme
  • Video süper çözünürlük
  • Kare oluşturma (frame generation)
  • Gelişmiş renderleme efektleri

Önceden, verilerin GPU ve NPU arasında defalarca gidip gelmesi gerekiyordu. M5 ile bu işlemler tamamen GPU içinde tamamlanabiliyor, bu da gecikmeyi azaltıyor ve gerçek zamanlı uzamsal görevler için verimliliği artırıyor.

Apple M5 Chip GPU core with Neural Accelerator

Vision Pro Neden M5'ten En Çok Yararlanan Cihaz

Standart dizüstü bilgisayarlardaki kazanımlar hafif kalsa da, Vision Pro M5 mimarisinin birincil yararlanıcısıdır. Video aracılığıyla görme (VST) sağlayan bir başlık olarak, aşağıdakiler de dahil olmak üzere sürekli olarak yapay zeka yoğunluklu görevler çalıştırır:

  • SLAM (Eşzamanlı Konum Belirleme ve Haritalama)
  • Çevresel anlama
  • Yapay zeka tabanlı passthrough gürültü giderme
  • Persona renderleme

Neredeyse tüm bu iş yükleri, M5'in yapay zeka ile geliştirilmiş GPU tasarımıyla tam olarak örtüşerek kesintisiz ve yüksek sadakatli bir uzamsal deneyim sağlar.

Vision Pro sensor and AI workload integration

Apple'ın Daha Geniş Yapay Zeka Felsefesi

Apple, stratejisinin cihaz merkezli zeka üzerine odaklandığını yineledi; bu, görsel girdiyi, hareket verilerini ve uzamsal anlamayı birleştiren kalıcı, kişisel dünya modelleri oluşturmak anlamına geliyor.

Açık kaynaklı bir görsel-dil modeli olan FastVLM gibi projeler bu yönelimi örneklendiriyor; gerçek zamanlı, bağlam farkındalığına sahip zeka için hızlı ve düşük güç tüketimli çıkarım sunuyor. Bu bir kapalı döngü oluşturur: gerçek dünya vektörleştirilir, yapay zeka tarafından yorumlanır ve sürükleyici uzamsal deneyimlere geri yansıtılır.

Teknoloji, Algı ve Gelecek

Apple'ın Vision Pro yol haritası daha derin bir tutkuya işaret ediyor: İnsanların gerçekliği hesaplama yoluyla nasıl algıladığını ve onunla nasıl etkileşime girdiğini yeniden şekillendirmek. Uzamsal yapay zekayı, gerçekçi dijital somutlaşmayı ve özel amaçlı silikonu birleştiren Apple, Vision Pro'yu bir başlıktan daha fazlası olarak konumlandırıyor; bu, dijital sistemlerin insan algısının kendisini nasıl artırabileceğine dair bir deneydir.

The future of spatial computing and human perception