Published on:
Η Apple παρουσιάζει την επόμενη γενιά του Vision Pro Persona και την αρχιτεκτονική του τσιπ M5 σε μια σπάνια τεχνική συζήτηση
Η Apple προσέφερε μια ασυνήθιστα λεπτομερή ματιά στο μέλλον του Vision Pro, αποκαλύπτοντας σημαντικές ενημερώσεις στο σύστημα Persona, τον ρόλο του επερχόμενου M5 chip και την ευρύτερη κατεύθυνση της εταιρείας στη χωρική υπολογιστική και την AI στη συσκευή.
Οι πληροφορίες προέρχονται από μια σπάνια τεχνική ανταλλαγή μεταξύ των μέσων ενημέρωσης και δύο βασικών ηγετών από την ομάδα του Vision Pro, προσφέροντας μια σαφέστερη εικόνα για το πώς η Apple εξελίσσει το Vision Pro σε μια μακροπρόθεσμη πλατφόρμα χωρικής υπολογιστικής.

Το Persona κάνει ένα μεγάλο άλμα με το 3D Gaussian Splatting
Μετά την κυκλοφορία του visionOS 2.0, οι χρήστες παρατήρησαν μια σημαντική βελτίωση στον ρεαλισμό του Persona. Στον πυρήνα αυτής της αναβάθμισης βρίσκεται μια σχετικά νέα τεχνική απόδοσης γνωστή ως 3D Gaussian Splatting (3DGS).
Σε αντίθεση με τα παραδοσιακά γραφικά υπολογιστών που βασίζονται σε χειροκίνητα κατασκευασμένα πλέγματα (meshes), το 3DGS λειτουργεί μαθαίνοντας τη γεωμετρία απευθείας από ληφθείσες εικόνες. Το σύστημα καταγράφει βίντεο από πολλαπλές γωνίες και εξάγει τη δομή ενός προσώπου ως μια συλλογή ογκομετρικών στοιχείων Gaussian—σημεία σε σχήμα ελλειψοειδούς με θέση, κλίμακα και διαφάνεια.
Η Apple επιβεβαίωσε ότι το Persona χρησιμοποιεί πλέον μια προσέγγιση βασισμένη αποκλειστικά σε Gaussian, χωρίς υβριδική γεωμετρία πλέγματος, επιτρέποντας εξαιρετικά φυσικές μεταβάσεις χρωμάτων και λεπτομέρειες επιφάνειας που τα πλέγματα δυσκολεύονται να αναπαράγουν.

Από τα Avatars του FaceTime στην Ψηφιακή Ταυτότητα
Το μακροπρόθεσμο όραμα της Apple για το Persona εκτείνεται πέρα από τις απλές βιντεοκλήσεις. Το Persona αναπτύσσεται ως μια ψηφιακή αναπαράσταση της ταυτότητας, ενσωματωμένη απευθείας σε τρισδιάστατα περιβάλλοντα.
Η εταιρεία τόνισε επίσης το HUGS (Human Gaussian Splatting), ένα έργο ανοιχτού κώδικα που επεκτείνει την τεχνική σε avatars ολόκληρου του σώματος. Αυτές οι αναπαραστάσεις μπορούν να εξοπλιστούν με σκελετική κίνηση, επιτρέποντας μια καθηλωτική τηλεπαρουσία όπου οι συμμετέχοντες εμφανίζονται ως χωρικά avatars πλήρους κλίμακας μέσα στα πραγματικά περιβάλλοντα ο ένας του άλλου.
M5 Chip: Μια νέα αρχιτεκτονική GPU κατασκευασμένη για AI + Γραφικά
Το M5 chip προσφέρει τα πιο σημαντικά του κέρδη μέσω αρχιτεκτονικών αλλαγών και όχι μέσω απλής κλιμάκωσης της ισχύος. Για πρώτη φορά, κάθε πυρήνας GPU περιλαμβάνει έναν αποκλειστικό Neural Accelerator.
Αυτοί οι επιταχυντές σε επίπεδο GPU είναι σχεδιασμένοι ειδικά για φόρτους εργασίας σύντηξης AI-γραφικών, όπως:
- AI denoising
- Video super-resolution
- Frame generation
- Προηγμένα εφέ απόδοσης
Προηγουμένως, τα δεδομένα έπρεπε να μετακινούνται επανειλημμένα μεταξύ της GPU και της NPU. Με το M5, αυτές οι λειτουργίες μπορούν να ολοκληρωθούν εξ ολοκλήρου εντός της GPU, μειώνοντας την καθυστέρηση και βελτιώνοντας την αποδοτικότητα για χωρικές εργασίες σε πραγματικό χρόνο.

Γιατί το Vision Pro ωφελείται περισσότερο από το M5
Ενώ τα κέρδη στους τυπικούς φορητούς υπολογιστές μπορεί να είναι διακριτικά, το Vision Pro είναι ο κύριος ωφελούμενος της αρχιτεκτονικής M5. Ως headset τύπου video see-through (VST), εκτελεί συνεχώς εργασίες έντασης AI, όπως:
- SLAM (Simultaneous Localization and Mapping)
- Κατανόηση περιβάλλοντος
- AI-based passthrough denoising
- Απόδοση του Persona
Σχεδόν όλοι αυτοί οι φόρτοι εργασίας ευθυγραμμίζονται ακριβώς με τη σχεδίαση της GPU του M5 που είναι ενισχυμένη με AI, εξασφαλίζοντας μια απρόσκοπτη και υψηλής πιστότητας χωρική εμπειρία.

Η ευρύτερη φιλοσοφία της Apple για την AI
Η Apple επανέλαβε ότι η στρατηγική της επικεντρώνεται στην νοημοσύνη με επίκεντρο τη συσκευή—κατασκευάζοντας επίμονα, προσωπικά μοντέλα κόσμου που συνδυάζουν οπτική είσοδο, δεδομένα κίνησης και χωρική κατανόηση.
Έργα όπως το FastVLM, ένα μοντέλο όρασης-γλώσσας ανοιχτού κώδικα, αποτελούν παράδειγμα αυτής της κατεύθυνσης, προσφέροντας γρήγορη εξαγωγή συμπερασμάτων χαμηλής κατανάλωσης για νοημοσύνη σε πραγματικό χρόνο με επίγνωση του πλαισίου. Αυτό σχηματίζει έναν κλειστό βρόχο: ο πραγματικός κόσμος διανυσματοποιείται, ερμηνεύεται από την AI και προβάλλεται ξανά σε καθηλωτικές χωρικές εμπειρίες.
Τεχνολογία, Αντίληψη και το Μέλλον
Ο οδικός χάρτης του Vision Pro της Apple υποδηλώνει μια βαθύτερη φιλοδοξία: να αναδιαμορφώσει τον τρόπο με τον οποίο οι άνθρωποι αντιλαμβάνονται και αλληλεπιδρούν με την πραγματικότητα μέσω του υπολογισμού. Συνδυάζοντας τη χωρική AI, τη ρεαλιστική ψηφιακή ενσάρκωση και το ειδικά κατασκευασμένο πυρίτιο, η Apple τοποθετεί το Vision Pro ως κάτι περισσότερο από ένα headset—είναι ένα πείραμα για το πώς τα ψηφιακά συστήματα μπορούν να αυξήσουν την ίδια την ανθρώπινη αντίληψη.
