- 相關(guān)推薦
電腦是如何下棋的
圍棋起源于中國(guó),是最古老的棋類運(yùn)動(dòng)之一,我們常說的“琴棋書畫”中的“棋”就是指圍棋。喜歡下棋嗎?有沒有和計(jì)算機(jī)下過?現(xiàn)在,弈棋計(jì)算機(jī)的棋藝日益高強(qiáng)。讓我們通過分析以圍棋和國(guó)際象棋為代表的弈棋計(jì)算機(jī),對(duì)人工智能的研究有一個(gè)更為深入的理解。
弈棋計(jì)算機(jī)
弈棋自古被視為一種關(guān)乎智力的高級(jí)挑戰(zhàn)。和其他智力測(cè)試相比,弈棋具有直接對(duì)抗的特點(diǎn),沒有什么比在緊張的對(duì)局中看到對(duì)手一手精妙兇狠的棋招更 能讓人感覺到一種智力上的刺激和挑戰(zhàn)了。弈棋相比于其他牌類游戲而言,隨機(jī)和不可控因素更小,因此對(duì)局雙方的決策能夠更直接地控制整個(gè)局面的走勢(shì),這進(jìn)一步增強(qiáng)了智力的對(duì)抗性。
毫不意外,在國(guó)際象棋更加流行的西方國(guó)家,人工智能領(lǐng)域自創(chuàng)建之初就在考慮如何制造一個(gè)會(huì)下國(guó)際象棋的機(jī)器。幾乎所有人工智能先驅(qū),包括信息論 創(chuàng)始人香農(nóng)、“人工智能”之父約翰·麥卡錫(John McCarthy)、計(jì)算機(jī)科學(xué)創(chuàng)始人圖靈,都曾嚴(yán)肅思考過制造國(guó)際象棋機(jī)器的問題。20世紀(jì)80年代初,貝爾實(shí)驗(yàn)室的工程師們(其中包括著名操作系統(tǒng) Unix的聯(lián)合創(chuàng)作者肯·湯姆森)開發(fā)出歷史上第一個(gè)具有人類大師級(jí)水平的國(guó)際象棋機(jī)器“Belle”。到80年代末,卡內(nèi)基梅隆大學(xué)的許峰雄博士在 “Bella”的思路基礎(chǔ)上(將在后面詳細(xì)介紹)進(jìn)一步改進(jìn),研制出了第一個(gè)特級(jí)大師水平的國(guó)際象棋機(jī)器,取名“深思”(源自《銀河系漫游指南》中的超級(jí) 計(jì)算機(jī))。隨后,許博士加入IBM研究院,在那里和其他幾個(gè)團(tuán)隊(duì)成員一起研制出了實(shí)力更強(qiáng)的弈棋機(jī)器“深藍(lán)”,并最終于1997年的一場(chǎng)歷史性的人機(jī)大戰(zhàn) 中以3.5:2.5的比分戰(zhàn)勝了人類國(guó)際象棋冠軍卡斯帕羅夫(卡斯帕羅夫不但是當(dāng)時(shí)的人類冠軍,同時(shí)也是人類歷史上國(guó)際象棋等級(jí)分最高的職業(yè)選手)。
在圍棋更加流行的東方,圍棋大師的頭銜同樣是智力超群的象征。自從計(jì)算機(jī)在國(guó)際象棋上挑戰(zhàn)人類成功之后,所有人的目光就聚焦在了圍棋這項(xiàng)古老的 東方棋類運(yùn)動(dòng)上。然而對(duì)計(jì)算機(jī)來說,圍棋似乎是個(gè)比國(guó)際象棋更“難”的東西。1985年,企業(yè)家應(yīng)昌期先生懸賞一百萬美金尋找能夠打敗人類職業(yè)棋手的計(jì)算 機(jī),可時(shí)至30年后的今日仍然沒有一臺(tái)計(jì)算機(jī)能夠做到。20世紀(jì)90年代,以我國(guó)陳志行教授開發(fā)的“手談”程序以及著名開源軟件組織GNU開發(fā)的“GNU Go”程序?yàn)榇淼摹坝?jì)算機(jī)圍棋冠軍”們,棋力尚且不及人類的業(yè)余初段。進(jìn)入21世紀(jì)之后,研究者們開始探索一套被稱為“蒙特卡洛樹搜索”的全新思路(將 在后面詳細(xì)介紹),并終于在2006年在9×9的“小棋盤”上率先產(chǎn)生突破。以法國(guó)的MoGo和CrazyStone為代表的新一代圍棋程序在9路圍棋上 基本已經(jīng)達(dá)到人類職業(yè)棋手的水平,甚至曾在公開場(chǎng)合戰(zhàn)勝過職業(yè)棋手周俊勛九段。另一方面,在真正的19路圍棋棋盤上,以日本的ZEN(天頂圍棋)和法國(guó)的 CrazyStone為代表的一流圍棋程序沿著“蒙特卡洛方法”的思路不斷改進(jìn),在和人類頂尖職業(yè)棋手進(jìn)行的一系列讓子棋比賽中屢有佳績(jī),而近些年人類棋 手能“讓”計(jì)算機(jī)的子數(shù)也越來越少。最有趣的是在2013年,計(jì)算機(jī)程序CrazyStone在受讓四子的情況下戰(zhàn)勝被稱為“人腦計(jì)算機(jī)”的日本棋手石田 芳夫九段,并被認(rèn)為已有業(yè)余五~六段的水平。
截至目前,盡管計(jì)算機(jī)在公平的圍棋比賽中還不足以直接抗衡人類職業(yè)棋手,但相關(guān)的研究熱度卻很高,大家普遍對(duì)近期前景持較為樂觀的態(tài)度!吧钏{(lán)之父”許峰雄博士甚至在2007年10月的一期《IEEE Spectrum》雜志上表示,相信10年內(nèi)超級(jí)計(jì)算機(jī)將能挑戰(zhàn)世界冠軍級(jí)別的人類棋手。
計(jì)算機(jī)下棋的思考模式
現(xiàn)在主流弈棋計(jì)算機(jī)的基本“思考模式”很簡(jiǎn)單,就是對(duì)當(dāng)前局面下的每一種合法走法所直接導(dǎo)致的局面進(jìn)行評(píng)估,然后選擇“獲勝概率”最高的局面所 對(duì)應(yīng)的那個(gè)走法。也就是說,“準(zhǔn)確評(píng)估給定局面的勝率”是主流弈棋計(jì)算機(jī)的核心問題,同時(shí)也是主要難點(diǎn)所在。在進(jìn)一步深入討論這一核心技術(shù)問題之前,我們 先在基本思考模式層面簡(jiǎn)單比較一下計(jì)算機(jī)棋手與人類棋手的異同。
可以說,計(jì)算機(jī)的基本策略是所有“人類有可能采用”的策略中最原始最簡(jiǎn)單的一種。毫無疑問,人類的思考模式中必然也包含“局面評(píng)估”的部分,然而人類至少還同時(shí)擁有另一個(gè)重要的思考模式——戰(zhàn)略性思考,也就是把一個(gè)基本目標(biāo)有效分解成一系列“子目標(biāo)”。
以圍棋為例,“獲勝”是圍棋的最終目的,而勝的定義是“結(jié)束比賽時(shí)擁有更多棋子和空”(中國(guó)規(guī)則)。但是人類棋手在對(duì)弈時(shí)顯然并不是每時(shí)每刻都 在基于這個(gè)“勝”的定義進(jìn)行思考的——通常我們只在棋局進(jìn)入中后期時(shí)才經(jīng)常性地“數(shù)目”。在對(duì)弈的大部分時(shí)間里我們是在思考諸如“如何借助右上角黑棋的毛 病擴(kuò)張”、“如何做活”、“如何侵消對(duì)手的模樣”、“如何在劫爭(zhēng)中轉(zhuǎn)換”、“如何分?jǐn)唷钡鹊纫幌盗芯唧w問題。我們注意到,每一個(gè)這樣的“具體問題”實(shí)際上 是改變了思考的目標(biāo),把一個(gè)“求勝”的問題轉(zhuǎn)化成了一系列“分?jǐn)唷被蛘摺白龌睢敝惖淖訂栴}。這樣的一個(gè)“戰(zhàn)略計(jì)劃”,其背后的邏輯當(dāng)然是,我們的大腦相 信在當(dāng)前情況下“分?jǐn)鄬?duì)手大龍”是最有可能導(dǎo)致最終贏棋的子目標(biāo)。一旦確立了子目標(biāo),人類棋手便集中精力考慮具體戰(zhàn)術(shù)走法來完成這個(gè)子目標(biāo),而不是“贏 棋”這個(gè)最終目標(biāo)。與之不同的是,目前主流的弈棋計(jì)算機(jī)從基本思考模式上并不依賴于“生成并確定子目標(biāo)”的戰(zhàn)略能力。在大多數(shù)時(shí)刻,這些弈棋計(jì)算機(jī)只關(guān)心 一個(gè)問題,就是按照“勝”的基本定義來贏得比賽*1。“在當(dāng)前局面下,我走在x點(diǎn)的話最終能贏幾子”,計(jì)算機(jī)就是通過不停地重復(fù)問自己這個(gè)問題來完成對(duì)弈 的。盡管這聽起來很“原始”,但正如前面所說,這樣思考的計(jì)算機(jī)卻已經(jīng)在很多棋類中達(dá)到了相當(dāng)令人驚訝的水平!
【電腦是如何下棋的】相關(guān)文章:
如何測(cè)試電腦功耗08-17
如何自學(xué)電腦維修06-02
電腦硬盤如何保養(yǎng)08-28
如何保養(yǎng)電腦CPU06-09
如何給電腦硬盤降溫10-04
如何電腦打字-電腦打字的技巧06-15
如何提升現(xiàn)有電腦的效率09-03
電腦主板BIOS如何設(shè)置08-26
如何安裝電腦硬件09-21