AI的圍棋怎么學(xué)

時間：2016-03-30 16:46:33 雪花750由分享

AI的圍棋怎么學(xué)

　　AI的圍棋深度學(xué)習(xí)能力再強也與人腦相去甚遠。下面學(xué)習(xí)啦小編給你介紹AI的圍棋學(xué)習(xí)，歡迎閱讀。
AI的圍棋怎么學(xué)

　　深度學(xué)習(xí)背后是由數(shù)學(xué)模型支撐，所以人工智能的本質(zhì)仍只是解決問題的算法。

　　近日，人工智能在學(xué)習(xí)能力方面又有了一個較大的提升。斯坦福大學(xué)的一個研究小組發(fā)現(xiàn)，人工智能系統(tǒng)已經(jīng)擁有了通過人類當前所做的動作預(yù)測其下一步舉動的能力，而這一能力主要是通過人工智能對于故事的學(xué)習(xí)形成的。

　　研究人員將該系統(tǒng)與儲存了60多萬個故事的寫作社區(qū)Wattpad相連，這些故事包括主人公在進入房間后需要開燈、被稱贊后會害羞、開會時就不會接電話等。人工智能則通過學(xué)習(xí)這些故事來實現(xiàn)預(yù)測人類舉動的能力。

　　人工智能的主要目標是使機器能夠勝任一些通常需要人類智能才能完成的復(fù)雜工作。因此，深度學(xué)習(xí)的能力在其中顯的尤為重要。隨著技術(shù)的發(fā)展和人工智能的進步，其深度學(xué)習(xí)能力也有了一個飛速的提升。

　　但是，深度學(xué)習(xí)的背后是由數(shù)學(xué)模型在支撐的，所以人工智能的本質(zhì)仍只是解決問題的算法。與真正的人類大腦相比，人工智能仍然相去甚遠。

　　一、與圍棋大師一較高下，人工智能深度學(xué)習(xí)能力提升

　　在對上述人工智能的首次現(xiàn)場測試中，其能夠正確區(qū)分人與物體的概率高達91%，能準確預(yù)測出人們下一步舉動的概率為71%，這一成績與以往相比是很優(yōu)秀的。

　　而人工智能再次受到關(guān)注，則是由于即將到來的圍棋名將與人工智能系統(tǒng)的一場大戰(zhàn)。據(jù)外媒報道，3月9日，韓國圍棋名將李世石將在首爾接受來自谷歌(微博)的人工智能系統(tǒng)AlphaGo的挑戰(zhàn)。

　　而這場即將開始的圍棋比賽是十分重要的，甚至被認為可以與1997年國際象棋大師卡斯帕羅夫與IBM超級計算機“深藍”之間的對決比肩。

　　1997年5月3日至5月11日，時年34歲的卡斯帕羅夫與IBM公司的國際象棋電腦“深藍”舉行了六局對抗賽。在前五局以2.5比2.5打平的情況下，第六局僅走了19步就使卡斯帕羅夫認輸。“深藍”取得勝利，標志著計算機技術(shù)的發(fā)展又上了一個臺階，也成為了科技史中的里程碑事件。

　　而此次人工智能系統(tǒng)AlphaGo與圍棋大師一較高下，則有著更加重要的意義。

　　圍棋是擁有2500多年歷史的、凝聚著中國古老智慧的游戲，從數(shù)學(xué)范疇來看，圍棋的復(fù)雜程度要比象棋高出N個級別，是世界公認的最為困難的棋類游戲。

　　為了使AlphaGo能夠更好地應(yīng)對這種復(fù)雜的游戲，谷歌DeepMind團隊的人工智能專家們做出了許多努力。

　　首先，他們往AlphaGo中輸入了包括3000萬步走法在內(nèi)的棋譜數(shù)據(jù)。盡管3000萬這一數(shù)字看起來很多，但與全部的圍棋走法相比就顯得微不足道了。因此，還要采取一些更先進的辦法。

　　專家們并未像對待“深藍”那樣，為AlphaGo開發(fā)一些固有的程序，而是賦予了AlphaGo自我編程的能力，使之成為“數(shù)字自學(xué)者”。隨后，計算機開始進行自我對弈，也就是深度學(xué)習(xí)，直到其掌握高端的圍棋技巧。

　　對此，谷歌的研究人員Demis Hassabis表示：“傳統(tǒng)人工智能方法為所有可能位置建立搜索樹。對圍棋來說，這種方法行不通。因此，當我們試圖打破圍棋的難題時，我們采取了不同的方法。我們開發(fā)的系統(tǒng)將高級搜索樹與深度神經(jīng)網(wǎng)絡(luò)結(jié)合在一起。這些神經(jīng)網(wǎng)絡(luò)以圍棋棋盤描述作為輸入，并通過包含數(shù)百萬個類神經(jīng)元連接的12個不同網(wǎng)絡(luò)層次進行處理”。

　　由此可見，AlphaGo將比“深藍”更加厲害。而當年“深藍”所掌握的程序中幾乎包含了其對手卡斯帕羅夫的全部對局分析，僅此一項，就足以將任何高段的圍棋大師碾壓。那么，更加先進的AlphaGo的出現(xiàn)，無疑使人類棋手面臨著人工智能提出的更加高難度的挑戰(zhàn)。

　　二、深度學(xué)習(xí)背后是數(shù)學(xué)模型支撐，與人類大腦相去甚遠

　　事實上，AlphaGo以往的成績已經(jīng)證明了其優(yōu)秀程度。AlphaGo曾在與其他圍棋人工智能系統(tǒng)進行的500盤對弈中，贏得了499盤。去年10月，AlphaGo在五番棋的較量中，以5比0的成績擊敗了職業(yè)圍棋手、歐洲圍棋冠軍樊麾，這也是人工智能首次擊敗職業(yè)圍棋手。

　　對于即將到來的“谷李大戰(zhàn)”，圍棋界專業(yè)人士也發(fā)表了自己的看法。臺北“紅面棋王”、九段圍棋手周俊勛表示，之前曾堅定地認為李世石會以5比0完勝AlphaGo，但在看過一些報道以及科技界人士對于AlphaGo的分析之后，他的態(tài)度轉(zhuǎn)變?yōu)橹斏鳌?/p>

　　周俊勛認為，從AlphaGo與樊麾對決的5局棋譜來看，在特定的條件下，尤其是官子階段，計算機的準確度有明顯的提升。“不夸張地說，每個局部的定型收束不見得比全盛時代的‘石佛’李昌鎬差。如果再這么進步下去，中盤戰(zhàn)斗力也會顯著提升”。

　　這一突破具有重大意義。在過去的幾十年時間里，圍棋軟件始終無法突破人類的初級水平，更遑論與人類中的高手相抗衡。如今人工智能圍棋系統(tǒng)突飛猛進的局面，與其深度學(xué)習(xí)的能力是分不開的。

　　盡管人工智能領(lǐng)域的發(fā)展如火如荼，但與真正的人腦相比，仍然存在很大的差距。

　　深度學(xué)習(xí)是人工智能的重要能力，然而深度學(xué)習(xí)的本質(zhì)離不開數(shù)學(xué)模型。說白了就是由人類設(shè)計好一個框架，然后人工智能系統(tǒng)根據(jù)這一框架去進行一系列運作。

　　以“深藍”與卡斯帕羅夫的對決為例?？ㄋ古亮_夫可以計算X個回合中可能產(chǎn)生的Y個變化，而“深藍”則能夠針對Y中的某一部分進行推導(dǎo)，從而演化出M個變化。

　　在這一過程中，可以明顯地看到M大于Y。那么在相同的比賽時間中，人類棋手卡斯帕羅夫必定會在M和Y的差值變化中出現(xiàn)漏洞，這也就是卡斯帕羅夫輸給“深藍”的主要原因。

　　對于即將到來的“谷李大戰(zhàn)”，周俊勛表示，與AlphaGo相比，李世石的最大優(yōu)勢就在于其擁有只屬于人類的想象力以及創(chuàng)造力。在中盤時出現(xiàn)一些“莫名其妙”的招式，可以對谷歌評估AlphaGo提出新的挑戰(zhàn)。

　　由此可見，谷歌對于勝者的100萬美元獎勵也只是小投入。重頭戲則在于通過與全球公認的優(yōu)秀圍棋手李世石的博弈，為AlphaGo提供驗證其價值評估體系的頂尖樣本。

　　對于人類的科學(xué)界來說，這是一個很大的突破。但是對于人工智能本身來說，模仿人類進行學(xué)習(xí)與思考是不太正確的方向。

　　法國思想家帕斯卡爾曾說：“人是一支有思想的蘆葦”。人類能夠在圍棋中迸發(fā)自己的智慧并從中感受到樂趣，所以圍棋對于人類是有意義的。而對于人工智能來說，它只是在執(zhí)行一些數(shù)學(xué)模型的運算而已，并不能從中感受到樂趣。因此，人工智能仍與人類大腦相去甚遠。

　　正所謂“授之以魚，不如授之以漁”。對于機器而言，真正的智能應(yīng)該是擁有自己獨特的思考方式。比如當人工智能看到一堆數(shù)據(jù)時，它能夠以自己的方式去思考，而不是單純地對人類的思維方式進行模仿。

　　在實現(xiàn)上述情形的過程中，最重要的是人工智能的可改進性。一個優(yōu)秀的人工智能，應(yīng)該做到通過自身修改核心代碼，來適應(yīng)周圍變幻不定的生存環(huán)境。甚至是應(yīng)該讓人工智能達到主動創(chuàng)造的地步。當然，要實現(xiàn)這些并非易事，人工智能仍需經(jīng)歷長時間的發(fā)展。

不卡AV在线|网页在线观看无码高清|亚洲国产亚洲国产|国产伦精品一区二区三区免费视频

AI的圍棋怎么學(xué)

相關(guān)文章

熱門文章