李世石與人工智能文章
李世石與人工智能文章
李世石月人工智能之戰(zhàn)令人感嘆,下面是學習啦小編為你整理的李世石與人工智能文章,供大家閱覽!
3月間,全世界圍棋愛好者最津津樂道的,莫過于韓國圍棋頂級高手李世石九段與谷歌公司開發(fā)的圍棋人工智能程序阿爾法狗(AlphaGo)之間的人機圍棋五番棋大戰(zhàn),結果,李世石1:4不敵阿爾法狗。
棋戰(zhàn)20年史
人類與人工智能的棋戰(zhàn),始于1996年。那一年,IBM公司開發(fā)的計算機深藍與當時號稱國際象棋有史以來最強的世界冠軍、俄羅斯象棋特級大師卡斯帕羅夫,6盤戰(zhàn)下來,卡斯帕羅夫以4∶2獲勝。1997年,IBM改進后的深藍卷土重來,與卡斯帕羅夫再次對戰(zhàn),結果卡斯帕羅夫一勝兩負三和,總比分敗北。
此后20年間,人工智能不斷挑戰(zhàn)人類游戲的歷程。電腦工程師們開發(fā)的人工智能不斷提高性能,先后在各類腦力游戲中擊敗人類。唯獨圍棋這個領域,一直是人工智能難以逾越的高峰。
為什么圍棋讓人工智能一度無法取得進展?這是因為,圍棋下法的可選擇性太多,比如第一步起手時,理論上一個棋手可以有361種落子選擇,而他的對手的回應則有360種可能性。一盤圍棋下來,按照150回合計算,可能出現(xiàn)的局面即10170種,這樣的計算發(fā)展到中盤以后已經(jīng)超出了電腦的計算能力。而且圍棋的規(guī)則過于簡單(理論上只要圍住一枚棋子的四個點即可),導致人工智能能使用的有效條件過少,人工智能在相當長的時間里,很難對棋局的形勢作出有效評估。
人工智能的這種困境直到人類在這一領域引入了蒙特卡洛搜索樹算法。這個算法基于模糊數(shù)學,不再追求精確的結果,而是通過選取無限接近正確答案的那個最優(yōu)解來開展計算,從而緩解了巨大的運算壓力。用我們通俗的說法來說,這就是用科學的計算方法在下棋的時候“蒙”――每次都選最大勝利可能性的那一招落子。
谷歌開發(fā)的阿爾法狗,正是通過蒙特卡洛樹搜索算法和兩個深度神經(jīng)網(wǎng)絡合作來下棋。在與李世石對陣之前,谷歌的研發(fā)人員首先用人類對弈的近3000萬種走法來訓練阿爾法狗的神經(jīng)網(wǎng)絡,讓它學會預測目前人類的幾乎所有專業(yè)棋手(當然也包括李世石)怎么落子。然后讓阿爾法狗每天自己跟自己下棋,從而又產(chǎn)生規(guī)模龐大的全新的棋譜。通過不斷的積累和分析,實現(xiàn)人工智能自己的經(jīng)驗累積和深度學習。
李世石是怎么輸?shù)?/strong>
如果從這場人機五番棋戰(zhàn)的結果來看,李世石作為世界頂尖棋手,僅僅贏了人工智能阿爾法狗一盤,其余四盤盡墨,可謂不折不扣的大敗。五番棋戰(zhàn)后,各大媒體也都在渲染人工智能對李世石的壓倒性勝利。
然而,事實并非如此,如果我們仔細考察這五盤棋的每一盤對局過程,我們會得出與上述結果差異極大的結論。
這五盤棋中,李世石下出“神之一手”的那盤贏棋之外,只有一盤是被人工智能壓倒性勝利,其余三盤都是局面一直焦灼混亂,最后電腦亂中取勝。而且這三盤中至少有兩盤是李世石在占據(jù)很大優(yōu)勢、甚至可以說是勝算在握的情況下,莫名其妙多次出緩手或昏招,浪費掉多次勝利機會后,輸給了人工智能。
由于李世石在對弈時出的這些明顯的匪夷所思的錯誤,導致曾與他對弈的中國棋手在講棋的時候甚至半開玩笑地說:“李世石如果只是這樣的水平,我當初怎么會輸給他呢?”
當然,這三盤焦灼的交鋒中,阿爾法狗也犯了很多人類棋手眼中的低級錯誤,只不過李世石沒有抓住。
按照觀戰(zhàn)的中國圍棋棋手的預估,阿爾法狗在開局階段表現(xiàn)出的能力大約是人類棋手六段或者七段的水準,而在中盤搏殺時則能表現(xiàn)出超過人類頂級棋手戰(zhàn)力的十一二段水準。
也就是說,阿爾法狗勝的并不輕松,而且也并非跟結果顯示的那樣無懈可擊。也正是因為這樣復雜的比賽過程,一些棋手們大膽推測,如果這次五番棋戰(zhàn),不是邀請李世石這樣的弱于序盤而強于搏殺的“僵尸流”棋手,而是邀請更講究開局的穩(wěn)重型棋手,勝負猶未可知。畢竟,李世石能夠長時間身居世界頂級棋手之列,很大程度是因為他擅長心理戰(zhàn),經(jīng)常通過出其不意的搏殺和“不講理下法”來打亂對手的心理,進而讓對手犯錯,而他的這一優(yōu)勢在面對人工智能時完全沒有用處,因為人工智能根本沒有心理波動。
然而,即便是這樣曲折地贏了比賽,人工智能仍舊表現(xiàn)出了巨大的發(fā)展?jié)摿?。正如中國新銳棋手、多次戰(zhàn)勝李世石的柯杰九段所言:從這場五番棋戰(zhàn)來看,人類終究有一天會被人工智能所超越。
誰是贏家
我們在感嘆人工智能此番戰(zhàn)勝人類棋手的同時,必須要清楚,雙方下棋之前的準備是完全不對稱的,阿爾法狗占有絕對優(yōu)勢。這是因為,阿爾法狗的數(shù)據(jù)庫里幾乎擁有李世石以往的全部比賽棋譜和下法,而李世石在比賽前只是看過此前阿爾法狗與人類棋手下過的幾盤棋。對于職業(yè)棋手來說,沒有長時間與對手的練習賽或者交鋒,是很難準確把握對手棋風的,也就很難采取相應的勝利策略。
因此,在五番棋戰(zhàn)后,不少人類棋手說,如果讓李世石與阿爾法狗連續(xù)下一個月的話,相信李世石能夠在后續(xù)的比賽中明顯提高自己的勝率。
這也正是人類相較人工智能來說最自豪的優(yōu)勢――自主學習能力。從目前來看,雖然阿爾法狗號稱擁有更強的學習能力,但是并沒有在五番棋戰(zhàn)中表現(xiàn)出明顯的進步。而且在五番棋戰(zhàn)中,阿爾法狗也暴露出了一些具體的不足,比如計算出現(xiàn)錯誤后修正能力不足、對劫財?shù)倪\用能力不足等等,這些都是未來阿爾法狗需要繼續(xù)改進的地方。
其實,“人工智能是否能戰(zhàn)勝人類”這個話題本就是個偽命題,作為人工智能的創(chuàng)造者,人類的上限目前決定了人工智能的上限,而在未來,即使人工智能有可能突破這個上限,這個突破何嘗不是人類突破自己上限的又一次勝利呢?
猜你喜歡: