計算機戰勝人類圍棋,但AI還有很長的路要走

雷鋒網 於 13/03/2016 發表 收藏文章

編者按:上個月,美國科技企業家Ben Medlock預言稱,李世石對戰Google人工智能程序Alphgo時,會像樊麾一樣輸給計算機,到那時,我們可以説這是人類歷史上第一次在公認為最複雜的遊戲中敗給計算機了。但是,這位企業家的想法,用黃子華的話説就是“那又如何?”!

以下就是他在一個月前發表的觀點:

人工智能在圍棋上擊敗人類,這真正意味着什麼呢?幾十年來,科學家創建計算機系統就只有一個目標——擁有類似人類的大腦推理能力。我們在這條路上走了多遠?這一項成就有多重要?

智力是一個模糊的概念。如今有許多對智力的定義,但還沒有一種定義的描述能夠普遍為人們所接受。或許我們可以這麼解釋——高級智能包含三個主要因素:

引用呈現(representation)——一個人工智能如何感知、模仿周圍環境

決策(planning)——人工智能如何設計行為序列來實現目標

反思(Reflection)——人工智能反應周圍環境和行為的能力

呈現

呈現是指人工智能依照周圍世界創建自己的內在模式。一方面,圍棋的世界很簡單——19*19的格子裏,黑白雙方在361個點上輪流落子。然而,人工智能的呈現力不僅包括外部世界的靜態結構,還有事物隨時間而變化的形式,以及更重要的是,這一切都對人工智能意味着什麼。圍棋勝利而目標是要在棋盤上佔據更多的位置,因此要成功就需要有一種能夠判斷接下來這步棋是否能夠幫助最終勝利的可靠直覺。

任何環境中的有效呈現都需要將特定的意義歸屬到給定目標的特定子元素中。人類記錄了成千上萬被賦予意義的對象之間的聯繫。比如,假若你被困在鐵軌上(而你的目標是要生存),那麼迎面而來的就包含着火車、軌道、人口死亡率等屬性了。

一個成功的圍棋手需要判斷出棋盤上所有形勢、模式隱含的意義,並根據判斷的結果來制定戰略。為了使得對局中的問題容易駕馭,這些模式並需能夠概念化。舉個例子,一個人工智能程序應該要識別出不同棋局上的相似形勢。AlphaGo則依靠卷積神經網絡(CNN),用過去的棋局進行訓練來加強策略學習。儘管圍棋的世界很簡單,但具體到理解形勢上就變得非常具有挑戰性了。這個就連人類也不能有十分大的把握。

同樣的想法也在現實世界中上演。你不需要識別出迎面而來的火車的材質和樣式,但你要知道這是一種危險的形勢:火車不會停下,要生存只能是掙脱軌道。在那一刻你要知道的,都是根據以往對於快速移動的龐然大物的認識經驗而來的。

那麼,對標人類的呈現水平的話,AlphaGo距離還有多遠?

非常長遠的距離。

儘管圍棋的遊戲規則非常複雜,判斷出下一步最優走法的技術很微妙,但和精確地模擬自然世界的挑戰相比,圍棋還是太簡單了。就表現力而言,DeepMind團隊利用深度/強化學習和視頻遊戲完成的任務可以説更有意義。但是,人工智能的呈現水平至少還有幾十年的發展路程。

決策

智力的第二個屬性——決策,可以定義為機器用內部的呈現能力來預測將能達到目的的行為序列的過程。在圍棋中,機器的決策就是計算出一系列能夠贏得盤面的走子方法。在一個每一步都有極高分支系數的遊戲中,機器通常只能在搜索空間變得過大前提前計算幾個回合。因此,機器表現力能否提供可靠的相對值測量指示是決策過程的關鍵。

在我們的日常生活中,我們會發現在自己在不同情況下有着不同的目的。一頓飯過去幾小時後,我們會感到飢餓,然後利用對世界的呈現來策劃一系列的行動,以找到最近的咖啡廳,吃上一塊三文治。這滿足了暫時的目的——飢餓——生物性層級中的一個目標,因求生意志產生的根本動力。

目標、呈現和決策三者之間有着緊密的聯繫。沒有一系列的目標,我們不可能在呈現的基礎上對事物分派意義,而且通常來説,呈現的形式越豐富可靠,所需要的決策步驟就越少。於圍棋而言,如果你的知識呈現不足以判斷每一個子的形勢和力量強弱,你就需要考慮一大堆有可能的走子方法,來計算出哪一種方案最有勝算。歷史上,這個問題一直困擾着圍棋AI。其實同理地,如果你不熟悉身處的路況,你也會要走許多彎路才找到目的地。

所以,我們可以如何對比AlphaGo這類人工智能程序和普通人類的決策能力呢?在現有充分的呈現條件下,計算機更善於決策。數字計算機的速度可以依靠內部的數字結構同時處理多種策略,那麼在有許多不確定的選擇需要探索驗證時,計算機就有優勢了。這意味着,計算機事必擅長許多智力遊戲,只要這些遊戲的呈現條件相對簡單(圍棋的外表沒什麼,就361個點和黑白子)。同樣,計算機也會擅長於解答數學難題,或者在海量數據中尋找有意義的模式。

由於具有高水平的角度,人類決策相對簡單,但這依靠對世界格外豐富的呈現。想象一下,當人類試圖去吸引一名同伴時,他/她或許需要策劃一系列的活動,比如一個晚餐邀請等等。為了達到目的,高級的策劃還需要一些小計劃來支持,比如尋找一家適當的餐廳等等。但是,這其中真正複雜的問題是,見到對方後合理表達想法的“精細模型”——言辭、行動和肢體語言,以及根據現場選擇下一步行動的決策能力。而這些所謂決策的過程,實際上更是針對外部的內部呈現。


人類某些決策行為顯然是高度複雜的。成功的設計和一個龐大、複雜的目標設計(比如汽車),需要大量詳細的設計以及不同的人許多不同的努力和協助。然而,這些操作的複雜性對於構建自然界的內部呈現來説都只是微小的部分。因此,決策並不足以成為開發人類層次的人工智能的障礙。而就算計算機能夠使用工具、能夠勝任許多複雜任務,這也沒什麼了不起的。它們對自然界的呈現與人類相比,依舊渺小。

反思

反思是指人工智能考慮周圍環境和行為及思考過程的能力。這個屬性就是我們所稱的意識或自我意識。因為最難以理解,這是最困難的一部分。為了理解人類大腦的自我意識,前人提出了一系列的解釋。

傳統上,二元論哲學將非物質的“靈魂”稱之為意識,而最新的意見表示,它只是高階類人腦信息系統中的一個自然產生的特徵。

儘管我們沒有一個缺乏一個公認科學的解釋,但是在我們自身的認識基礎上,也能對意識作出一些描述。就像我們能夠反觀一些我們觀察的事件等等。

據研究者提出,意識是伴隨自然語言的演變而在人類大腦中產生的。當大腦獲得改善功能交際和反思自己的話語,以及考慮那些導致了特定行為的過程的能力時,意識就不自覺地產生。人們普遍認為,意識是高等哺乳動物來自大腦皮層的功能——大腦中掌握語言和推理的功能區。

要弄清楚為什麼人類智力擁有非凡的反思能力,我們還有很多研究問題需要解決。然而,我們可以相對確定的是,AlphaGo並不具有這個特性。任何其他現有的人工智能系統都不具有。

反思究竟是高級智能的先決條件,還是隻是一個衍生物,這個問題還有待解決。但無論如何這都提醒我們,我們對高級智能還有多少未解之謎。

總結

總之,熟練的圍棋對弈是人工智能的一大成就,我們在開發能夠識別環境的人工智能系統和高效決策的算法上已經做得越來越好。只是,我們對機器反思能力的探究仍然處於黎明前的黑暗,我們甚至不知道,機器意識對於人類真正意味着什麼。不過,這在哲學和科學領域都是一個有趣的問題。


資料來源:雷鋒網
作者/編輯:曉樺
標籤: AI  

留言


請按此登錄後留言。未成為會員? 立即註冊
    快捷鍵:←
    快捷鍵:→