Published on:

追溯人工智慧的興起:從人類的好奇心到認知革命

「身為一名記者,我對世界始終充滿好奇。」透過這些話,中國媒體人楊瀾為紀錄片《探尋人工智能》揭開序幕,開啟了一場由定義我們時代的問題所驅動的旅程:機器是否正變得比人類更聰明?人工智慧是否有一天會取代我們?以及科技能將人類智慧的邊界擴展到多遠?

這些問題在 2016 年變得全球緊迫,這一年被廣泛認為是人工智慧的爆發時刻。從大數據、雲端運算到深度學習與自主系統,人工智慧迅速從實驗室走進大眾視野。

一個標誌性事件是 AlphaGo 擊敗世界冠軍李世乭的歷史性對決,象徵著人類對機器智慧認知的一種轉變。

AlphaGo 對決李世乭

語言、認知與機器思維

人類智慧透過語言演化。大約 70,000 年前,複雜語言系統的發展讓人類能夠描述環境、交換抽象想法並建立社會。這場「認知革命」從根本上重塑了文明。

這部紀錄片提出了一個平行的問題:機器如何理解語言?

早期的嘗試較為簡單。1952 年,貝爾實驗室的科學家教會機器辨識十個英文口說數字,並將該系統命名為「Audrey」。雖然這具有開創性,但離真正的自然語言理解仍有很大距離。進展是漸進的,且常受限於數據和算力的不足。

進展是漸進的,且常受限於數據和算力的不足。

一個重要的轉折點出現在 1980 年代,當時李開復在卡內基梅隆大學開始了語音辨識研究。他的工作引入了能夠理解多人連續語音的系統——這是邁向自然人機互動的關鍵一步。機器第一次能夠以類似真實對話而非孤立指令的方式處理口說語言。

貝爾實驗室 Audrey 辨識系統

從規則導向系統到深度學習

儘管取得了這些進步,語音和語言系統仍掙扎了數十年。突破出現在 2000 年代中期,由一種新的範式驅動:深度學習。

2006 年,傑弗里·辛頓(Geoffrey Hinton)發表了關於深度神經網絡的有影響力的研究,靈感源自人腦結構。他的工作強調了規模——更大的模型、更多的層次以及海量的數據。這種方法引起了像鄧力(Deng Li)這樣的研究人員的共鳴,他證明了當結合大數據集和現代算力時,語音辨識的錯誤率可以大幅下降,在早期實驗中甚至下降了超過 20%。

在 1990 年代阻礙神經網絡發展的並非錯誤的理論,而是數據和計算資源的不足。隨著網路產生海量數據以及處理能力提升,深度學習突然蓬勃發展。曾經看似棘手的問題開始迎刃而解。

神經網絡與深度學習視覺化

機器進入物理世界

紀錄片還探討了人工智慧如何跨越軟體,進入物理環境。在史丹佛大學的人工智慧實驗室,類人機器人 PR2 執行各種任務,例如在走廊穿梭、使用電梯以及為研究人員購買咖啡。

其設計並非為了模仿人類,而是為了在以人類為中心的世界中高效互動——觀測、抓取並施加受控的力量。

史丹佛 PR2 機器人

這反映了機器人技術更廣泛的轉變:機器不再侷限於工廠。它們正學習與人共處,適應複雜且非結構化的環境。

加速人類智慧

在造訪了五個國家的 30 多個人工智慧實驗室並採訪了 80 多位領軍人物後,楊瀾得出結論:人工智慧不僅僅是為了取代人類智慧。相反地,它加速了人類智慧

從語音辨識和語言理解到機器人技術與深度學習,人工智慧已成為擴展人類能力的工具。核心問題不再是人工智慧是否會改變社會,而是人類選擇如何塑造這種改變。

楊瀾紀錄片《探尋人工智能》