不卡AV在线|网页在线观看无码高清|亚洲国产亚洲国产|国产伦精品一区二区三区免费视频

學(xué)習(xí)啦 > 興趣愛好 > 學(xué)下棋 > 圍棋 > AI的圍棋怎么學(xué)

AI的圍棋怎么學(xué)

時間: 雪花750 分享

AI的圍棋怎么學(xué)

  AI的圍棋深度學(xué)習(xí)能力再強(qiáng) 也與人腦相去甚遠(yuǎn)。下面學(xué)習(xí)啦小編給你介紹AI的圍棋學(xué)習(xí),歡迎閱讀。
AI的圍棋怎么學(xué)

  深度學(xué)習(xí)背后是由數(shù)學(xué)模型支撐,所以人工智能的本質(zhì)仍只是解決問題的算法。

  近日,人工智能在學(xué)習(xí)能力方面又有了一個較大的提升。斯坦福大學(xué)的一個研究小組發(fā)現(xiàn),人工智能系統(tǒng)已經(jīng)擁有了通過人類當(dāng)前所做的動作預(yù)測其下一步舉動的能力,而這一能力主要是通過人工智能對于故事的學(xué)習(xí)形成的。

  研究人員將該系統(tǒng)與儲存了60多萬個故事的寫作社區(qū)Wattpad相連,這些故事包括主人公在進(jìn)入房間后需要開燈、被稱贊后會害羞、開會時就不會接電話等。人工智能則通過學(xué)習(xí)這些故事來實現(xiàn)預(yù)測人類舉動的能力。

  人工智能的主要目標(biāo)是使機(jī)器能夠勝任一些通常需要人類智能才能完成的復(fù)雜工作。因此,深度學(xué)習(xí)的能力在其中顯的尤為重要。隨著技術(shù)的發(fā)展和人工智能的進(jìn)步,其深度學(xué)習(xí)能力也有了一個飛速的提升。

  但是,深度學(xué)習(xí)的背后是由數(shù)學(xué)模型在支撐的,所以人工智能的本質(zhì)仍只是解決問題的算法。與真正的人類大腦相比,人工智能仍然相去甚遠(yuǎn)。

  一、與圍棋大師一較高下,人工智能深度學(xué)習(xí)能力提升

  在對上述人工智能的首次現(xiàn)場測試中,其能夠正確區(qū)分人與物體的概率高達(dá)91%,能準(zhǔn)確預(yù)測出人們下一步舉動的概率為71%,這一成績與以往相比是很優(yōu)秀的。

  而人工智能再次受到關(guān)注,則是由于即將到來的圍棋名將與人工智能系統(tǒng)的一場大戰(zhàn)。據(jù)外媒報道,3月9日,韓國圍棋名將李世石將在首爾接受來自谷歌(微博)的人工智能系統(tǒng)AlphaGo的挑戰(zhàn)。

  而這場即將開始的圍棋比賽是十分重要的,甚至被認(rèn)為可以與1997年國際象棋大師卡斯帕羅夫與IBM超級計算機(jī)“深藍(lán)”之間的對決比肩。

  1997年5月3日至5月11日,時年34歲的卡斯帕羅夫與IBM公司的國際象棋電腦“深藍(lán)”舉行了六局對抗賽。在前五局以2.5比2.5打平的情況下,第六局僅走了19步就使卡斯帕羅夫認(rèn)輸。“深藍(lán)”取得勝利,標(biāo)志著計算機(jī)技術(shù)的發(fā)展又上了一個臺階,也成為了科技史中的里程碑事件。

  而此次人工智能系統(tǒng)AlphaGo與圍棋大師一較高下,則有著更加重要的意義。

  圍棋是擁有2500多年歷史的、凝聚著中國古老智慧的游戲,從數(shù)學(xué)范疇來看,圍棋的復(fù)雜程度要比象棋高出N個級別,是世界公認(rèn)的最為困難的棋類游戲。

  為了使AlphaGo能夠更好地應(yīng)對這種復(fù)雜的游戲,谷歌DeepMind團(tuán)隊的人工智能專家們做出了許多努力。

  首先,他們往AlphaGo中輸入了包括3000萬步走法在內(nèi)的棋譜數(shù)據(jù)。盡管3000萬這一數(shù)字看起來很多,但與全部的圍棋走法相比就顯得微不足道了。因此,還要采取一些更先進(jìn)的辦法。

  專家們并未像對待“深藍(lán)”那樣,為AlphaGo開發(fā)一些固有的程序,而是賦予了AlphaGo自我編程的能力,使之成為“數(shù)字自學(xué)者”。隨后,計算機(jī)開始進(jìn)行自我對弈,也就是深度學(xué)習(xí),直到其掌握高端的圍棋技巧。

  對此,谷歌的研究人員Demis Hassabis表示:“傳統(tǒng)人工智能方法為所有可能位置建立搜索樹。對圍棋來說,這種方法行不通。因此,當(dāng)我們試圖打破圍棋的難題時,我們采取了不同的方法。我們開發(fā)的系統(tǒng)將高級搜索樹與深度神經(jīng)網(wǎng)絡(luò)結(jié)合在一起。這些神經(jīng)網(wǎng)絡(luò)以圍棋棋盤描述作為輸入,并通過包含數(shù)百萬個類神經(jīng)元連接的12個不同網(wǎng)絡(luò)層次進(jìn)行處理”。

  由此可見,AlphaGo將比“深藍(lán)”更加厲害。而當(dāng)年“深藍(lán)”所掌握的程序中幾乎包含了其對手卡斯帕羅夫的全部對局分析,僅此一項,就足以將任何高段的圍棋大師碾壓。那么,更加先進(jìn)的AlphaGo的出現(xiàn),無疑使人類棋手面臨著人工智能提出的更加高難度的挑戰(zhàn)。

  二、深度學(xué)習(xí)背后是數(shù)學(xué)模型支撐,與人類大腦相去甚遠(yuǎn)

  事實上,AlphaGo以往的成績已經(jīng)證明了其優(yōu)秀程度。AlphaGo曾在與其他圍棋人工智能系統(tǒng)進(jìn)行的500盤對弈中,贏得了499盤。去年10月,AlphaGo在五番棋的較量中,以5比0的成績擊敗了職業(yè)圍棋手、歐洲圍棋冠軍樊麾,這也是人工智能首次擊敗職業(yè)圍棋手。

  對于即將到來的“谷李大戰(zhàn)”,圍棋界專業(yè)人士也發(fā)表了自己的看法。臺北“紅面棋王”、九段圍棋手周俊勛表示,之前曾堅定地認(rèn)為李世石會以5比0完勝AlphaGo,但在看過一些報道以及科技界人士對于AlphaGo的分析之后,他的態(tài)度轉(zhuǎn)變?yōu)橹?jǐn)慎。

  周俊勛認(rèn)為,從AlphaGo與樊麾對決的5局棋譜來看,在特定的條件下,尤其是官子階段,計算機(jī)的準(zhǔn)確度有明顯的提升。“不夸張地說,每個局部的定型收束不見得比全盛時代的‘石佛’李昌鎬差。如果再這么進(jìn)步下去,中盤戰(zhàn)斗力也會顯著提升”。

  這一突破具有重大意義。在過去的幾十年時間里,圍棋軟件始終無法突破人類的初級水平,更遑論與人類中的高手相抗衡。如今人工智能圍棋系統(tǒng)突飛猛進(jìn)的局面,與其深度學(xué)習(xí)的能力是分不開的。

  盡管人工智能領(lǐng)域的發(fā)展如火如荼,但與真正的人腦相比,仍然存在很大的差距。

  深度學(xué)習(xí)是人工智能的重要能力,然而深度學(xué)習(xí)的本質(zhì)離不開數(shù)學(xué)模型。說白了就是由人類設(shè)計好一個框架,然后人工智能系統(tǒng)根據(jù)這一框架去進(jìn)行一系列運作。

  以“深藍(lán)”與卡斯帕羅夫的對決為例??ㄋ古亮_夫可以計算X個回合中可能產(chǎn)生的Y個變化,而“深藍(lán)”則能夠針對Y中的某一部分進(jìn)行推導(dǎo),從而演化出M個變化。

  在這一過程中,可以明顯地看到M大于Y。那么在相同的比賽時間中,人類棋手卡斯帕羅夫必定會在M和Y的差值變化中出現(xiàn)漏洞,這也就是卡斯帕羅夫輸給“深藍(lán)”的主要原因。

  對于即將到來的“谷李大戰(zhàn)”,周俊勛表示,與AlphaGo相比,李世石的最大優(yōu)勢就在于其擁有只屬于人類的想象力以及創(chuàng)造力。在中盤時出現(xiàn)一些“莫名其妙”的招式,可以對谷歌評估AlphaGo提出新的挑戰(zhàn)。

  由此可見,谷歌對于勝者的100萬美元獎勵也只是小投入。重頭戲則在于通過與全球公認(rèn)的優(yōu)秀圍棋手李世石的博弈,為AlphaGo提供驗證其價值評估體系的頂尖樣本。

  對于人類的科學(xué)界來說,這是一個很大的突破。但是對于人工智能本身來說,模仿人類進(jìn)行學(xué)習(xí)與思考是不太正確的方向。

  法國思想家帕斯卡爾曾說:“人是一支有思想的蘆葦”。人類能夠在圍棋中迸發(fā)自己的智慧并從中感受到樂趣,所以圍棋對于人類是有意義的。而對于人工智能來說,它只是在執(zhí)行一些數(shù)學(xué)模型的運算而已,并不能從中感受到樂趣。因此,人工智能仍與人類大腦相去甚遠(yuǎn)。

  正所謂“授之以魚,不如授之以漁”。對于機(jī)器而言,真正的智能應(yīng)該是擁有自己獨特的思考方式。比如當(dāng)人工智能看到一堆數(shù)據(jù)時,它能夠以自己的方式去思考,而不是單純地對人類的思維方式進(jìn)行模仿。

  在實現(xiàn)上述情形的過程中,最重要的是人工智能的可改進(jìn)性。一個優(yōu)秀的人工智能,應(yīng)該做到通過自身修改核心代碼,來適應(yīng)周圍變幻不定的生存環(huán)境。甚至是應(yīng)該讓人工智能達(dá)到主動創(chuàng)造的地步。當(dāng)然,要實現(xiàn)這些并非易事,人工智能仍需經(jīng)歷長時間的發(fā)展。

590368