AI游戲開(kāi)發(fā)和深度學(xué)習(xí)進(jìn)階
定 價(jià):79 元
叢書(shū)名:輕松上手IT技術(shù)日文譯叢
本書(shū)以各種各樣的實(shí)例剖析游戲AI手法,并以此為目標(biāo),幫助讀者學(xué)習(xí)構(gòu)筑游戲AI的技術(shù)。另外,也闡述了游戲AI中的深層學(xué)習(xí)、機(jī)械學(xué)習(xí)、強(qiáng)化學(xué)習(xí)技術(shù)。
深度學(xué)習(xí)這門(mén)技術(shù)在機(jī)器視覺(jué)領(lǐng)域大規(guī)模應(yīng)用,采用深度學(xué)習(xí)的圖像識(shí)別AI 算法在識(shí)別精度上已經(jīng)超過(guò)人眼精度,如今我們?nèi)粘I钪械膾吣樦Ц兑不谏疃葘W(xué)習(xí)強(qiáng)大的圖像特征提取能力。人們覺(jué)得AlphaGo 才是AI 時(shí)代到來(lái)的標(biāo)志,之所以這樣覺(jué)得或許是因?yàn)槿藗兤毡槌姓J(rèn)下圍棋是一種高級(jí)別的智能過(guò)程,也是一個(gè)絞盡腦汁的過(guò)程可以切身感受到動(dòng)腦。
伊庭教授在本書(shū)中強(qiáng)調(diào)了研究游戲AI 的意義或許是解密人類(lèi)大腦思考方式的方法之一。我個(gè)人十分贊同伊庭教授的這一看法,我們的生活、工作 和學(xué)習(xí)過(guò)程中的糾結(jié)一直都建立在著眼于眼前還是未來(lái)的權(quán)衡當(dāng)中。但正是因?yàn)槲覀兙哂兄腔,所以我們才?huì)具有這種權(quán)衡能力(或者說(shuō)是生活中充滿了糾結(jié))。
相信當(dāng)讀者從章堅(jiān)持讀到后一章時(shí),不僅會(huì)覺(jué)得游戲AI 有趣,還會(huì)覺(jué)得人腦思維本身就有很多有趣的地方;蛟S研究游戲AI 的意義不是為了創(chuàng)作出更加聰明、強(qiáng)大的AI,而是把它當(dāng)作一面鏡子,來(lái)進(jìn)行對(duì)人腦思維研究的自我啟發(fā)和探索。
深度學(xué)習(xí)開(kāi)始被關(guān)注的標(biāo)志性事件,就是一個(gè)采用深度卷積神經(jīng)網(wǎng)絡(luò)的模型AlexNet在2012年ImageNet圖像識(shí)別大賽上獲得冠軍。自此,深度學(xué)習(xí)這門(mén)技術(shù)在機(jī)器視覺(jué)領(lǐng)域開(kāi)始大規(guī)模應(yīng)用。如今,采用深度學(xué)習(xí)的圖像識(shí)別AI算法在識(shí)別精度上已經(jīng)超過(guò)人眼的精度,我們?nèi)粘I钪械膾吣樦Ц兑不谏疃葘W(xué)習(xí)強(qiáng)大的圖像特征提取能力。盡管深度學(xué)習(xí)的應(yīng)用為圖像領(lǐng)域帶來(lái)了飛躍性的發(fā)展,但2012年的那場(chǎng)突破并沒(méi)有引起全社會(huì)的廣泛關(guān)注,當(dāng)時(shí)人們并沒(méi)有普遍意識(shí)到人工智能領(lǐng)域的崛起即將到來(lái)。我覺(jué)得之所以這樣,是因?yàn)樯疃葘W(xué)習(xí)給機(jī)器視覺(jué)帶來(lái)的飛躍只能算是開(kāi)發(fā)出了某種高級(jí)圖像傳感器。當(dāng)這個(gè)傳感器收到汽車(chē)圖像時(shí)會(huì)輸出汽車(chē)這樣的識(shí)別結(jié)果,當(dāng)收到花朵圖像時(shí)則會(huì)輸出花朵這樣的識(shí)別結(jié)果。雖然看起來(lái)很強(qiáng)大,但人們普遍沒(méi)有感受到智能的存在。因?yàn)槲覀兓蛟S覺(jué)得,在對(duì)映入眼簾中的事物進(jìn)行識(shí)別的整個(gè)過(guò)程中,我們感受不到自己在動(dòng)腦。之所以覺(jué)得AlphaGo才是AI時(shí)代到來(lái)的標(biāo)志,或許是因?yàn)槿藗兤毡槌姓J(rèn)下圍棋是一種高級(jí)別的智能過(guò)程,也是一個(gè)絞盡腦汁的過(guò)程我們可以切身感受到動(dòng)腦。下圍棋比拼的就是誰(shuí)預(yù)見(jiàn)的步數(shù)更遠(yuǎn)更深,在這里我們或許會(huì)想到傳統(tǒng)計(jì)算機(jī)算法可以用暴力枚舉方法預(yù)估所有的走棋可能性,但這個(gè)方法在圍棋中行不通,因?yàn)閲宓钠寰执嬖?0171種可能性,人類(lèi)目前或許找不出能夠枚舉出所有可能性的計(jì)算機(jī)。人腦也同樣無(wú)法實(shí)現(xiàn)對(duì)所有走棋可能性的掃描。這個(gè)時(shí)候,人類(lèi)的直覺(jué)發(fā)揮著強(qiáng)大的作用。當(dāng)看到眼前的棋局時(shí),人類(lèi)能夠依靠直覺(jué)快速給出多種落子方案。經(jīng)驗(yàn)越是豐富,直覺(jué)越是準(zhǔn)確。當(dāng)考慮如何用計(jì)算機(jī)復(fù)現(xiàn)這種直覺(jué)時(shí),我們的視野聚焦到了深度學(xué)習(xí)上。深度學(xué)習(xí)擅長(zhǎng)解決圖像問(wèn)題,它的本質(zhì)是處理矩陣數(shù)據(jù),而圍棋棋盤(pán)本身就是一種完美的矩陣。通過(guò)深度學(xué)習(xí),我們對(duì)棋盤(pán)這個(gè)矩陣不斷地進(jìn)行特征提取并對(duì)其進(jìn)行壓縮,通過(guò)多層深度卷積處理后,擁有某種落子的直覺(jué)。用深度學(xué)習(xí)來(lái)學(xué)習(xí)的棋譜數(shù)據(jù)越多,這種落子的直覺(jué)就會(huì)越可靠。AlphaGo通過(guò)蒙特卡羅算法使用不同的落子方案進(jìn)行預(yù)演,不斷刷新不同的落子方案,從而提高終結(jié)果的勝率,完全像是一個(gè)圍棋高手一樣在落子之前已在腦海中完成了多種落子方案后續(xù)結(jié)果的預(yù)演。當(dāng)然,蒙特卡羅算法并非新鮮方法,但正是深度學(xué)習(xí)的出現(xiàn),AlphaGo才能實(shí)現(xiàn)針對(duì)眼前棋局的落子直覺(jué)和終導(dǎo)向勝利的完美權(quán)衡。一個(gè)強(qiáng)大的圍棋AI不僅需要有專(zhuān)家的直覺(jué),也需要像專(zhuān)家那樣深謀遠(yuǎn)慮。伊庭教授在本書(shū)中強(qiáng)調(diào)了研究游戲AI的意義或許是解密人類(lèi)大腦思考方式的方法之一。我個(gè)人十分贊同伊庭教授的這一看法,我們的生活、工作和學(xué)習(xí)過(guò)程中的糾結(jié)一直都建立在著眼于眼前還是未來(lái)的權(quán)衡當(dāng)中。但正是因?yàn)槲覀兙哂兄腔,所以我們才?huì)具有這種權(quán)衡能力(或者說(shuō)是生活中充滿了糾結(jié))。游戲領(lǐng)域里的經(jīng)典算法A*算法在構(gòu)造上相對(duì)近期的算法簡(jiǎn)單很多,但它一邊著眼于眼前的資源消耗量,一邊還要注意是否靠近終點(diǎn),這種簡(jiǎn)單的路線規(guī)劃原理已經(jīng)具有了初步的著眼于眼前與未來(lái)的權(quán)衡能力。本書(shū)的后一章描述如何讓游戲AI表現(xiàn)得像個(gè)人類(lèi)玩家,并量化了一些因素,從而對(duì)類(lèi)人程度進(jìn)行函數(shù)化。我相信當(dāng)讀者堅(jiān)持讀到后一章時(shí),不僅會(huì)覺(jué)得游戲AI有趣,還會(huì)覺(jué)得人腦思維本身就有很多有趣的地方;蛟S研究游戲AI的意義不是為了創(chuàng)作出更加聰明、強(qiáng)大的AI,而是把它當(dāng)作一面鏡子,來(lái)進(jìn)行對(duì)人腦思維研究的自我啟發(fā)和探索。曹旸2021年2月于上海
伊庭齊志 (Hitoshi Iba)
工學(xué)博士,東京大學(xué)大學(xué)院情報(bào)理工學(xué)系研究科電子信息學(xué)專(zhuān)業(yè)教授,也是Genetic Programming and Evolvable Machines(GPEM)的副主編。他從事人工智能和人工生命的研究,主要研究領(lǐng)域包括進(jìn)化系統(tǒng)、基因組信息處理、金融工程和復(fù)雜系統(tǒng)。
曹 旸
2017年獲得日本早稻田大學(xué)綜合機(jī)械工學(xué)博士學(xué)位。博士求學(xué)期間,研究將模式識(shí)別應(yīng)用于手術(shù)機(jī)器人操作的技術(shù)。目前就職于歐姆龍(中國(guó))有限公司,主要在工業(yè)自動(dòng)化和農(nóng)業(yè)自動(dòng)化領(lǐng)域中從事基于深度學(xué)習(xí)和計(jì)算機(jī)視覺(jué)的產(chǎn)品研發(fā)管理工作。
譯者序前言第1章 謎題與游戲AI的過(guò)去和現(xiàn)在 11.1 關(guān)于AI的預(yù)言成真了嗎 11.2 游戲AI的歷史和背景 21.3 游戲AI是否會(huì)剝奪人類(lèi)的樂(lè)趣 71.4 游戲AI的意義 91.5 游戲的深?yuàn)W程度與先下手為強(qiáng)定理 10第2章 解謎的AI 142.1 搜索樹(shù) 142.1.1 樹(shù)的構(gòu)造和圖形表達(dá) 142.1.2 深度優(yōu)先搜索 212.1.3 寬度優(yōu)先搜索 282.1.4 A*搜索 322.2 推箱子 402.3 數(shù)字連線 432.4 日式華容道 462.5 孔明棋 482.6 嘗試用數(shù)學(xué)知識(shí)解決數(shù)獨(dú)問(wèn)題 51第3章 依賴(lài)約束的謎題和非單調(diào)推理 583.1 縱向搜索與回溯 583.2 數(shù)學(xué)家弄錯(cuò)的國(guó)際象棋謎題 583.3 線條圖的解釋與錯(cuò)覺(jué)畫(huà) 633.4 ATMS與四色問(wèn)題 713.5 解開(kāi)國(guó)際象棋謎題 833.5.1 盡可能放置多個(gè)棋子 843.5.2 盡可能攻擊多個(gè)區(qū)域 863.6 Knuth的謎題與位棋盤(pán) 88第4章 會(huì)玩游戲的AI 904.1 井字棋與樹(shù) 904.2 游戲的樹(shù)搜索 914.3 黑白棋與Fools mate 1044.4 A*馬里奧 1104.5 蒙特卡羅樹(shù)搜索 1144.6 立體四子棋 1184.7 黑白棋的蒙特卡羅算法和NegaScout算法 1234.8 如何贏得博弈 1244.9 消滅幽靈:AI吃豆人 132第5章 學(xué)習(xí)、進(jìn)化和游戲AI 1405.1 來(lái)自AlphaGo的震撼 1405.2 DQN和街機(jī)游戲 1515.3 進(jìn)化的馬里奧 1555.4 神經(jīng)進(jìn)化 1585.5 吃豆人的神經(jīng)進(jìn)化 1615.6 充滿好奇心的馬里奧 166第6章 游戲AI與類(lèi)人化 1746.1 為什么需要類(lèi)人化的AI 1746.2 通用游戲是什么 1756.3 圖靈測(cè)試和類(lèi)人化的AI 1786.4 不使用類(lèi)人化函數(shù)的類(lèi)人化游戲AI 1826.5 使用類(lèi)人化函數(shù)的類(lèi)人化游戲AI 190參考文獻(xiàn) 199