AI 和人类的较量再一次展开了,谷歌人工智能击败欧洲围棋冠军

在今天国际顶尖期刊《自然》报道了谷歌所开发的这款新围棋AI。这款名为AlphaGo(翻译为阿尔法围棋)的人工智能,在没有任何让子的情况下以5:0完胜欧洲冠军,职业围棋二段樊麾,樊麾出生于中国,目前是法国国家围棋队总教练,已经连续三年赢得欧洲围棋冠军的称号。

【钛媒综合】AI 和人类的较量再一次展开了。

1月28日上午消息,谷歌今日召开全球电话会议,旗下Deep MInd创始人戴密斯·哈萨比斯(Demis Hassabis)宣布了谷歌在人工智能领域的重要进展:开发出一款能够在围棋中击败职业选手的程序——AlphaGo,后者能够通过机器学习的方式掌握比赛技巧。

而同样,在今天国际顶尖期刊《自然》报道了谷歌所开发的这款新围棋AI。这款名为AlphaGo(翻译为阿尔法围棋)的人工智能,在没有任何让子的情况下以5:0完胜欧洲冠军,职业围棋二段樊麾,樊麾出生于中国,目前是法国国家围棋队总教练,已经连续三年赢得欧洲围棋冠军的称号。

AlphaGo与欧洲围棋冠军樊麾的5局较量

除此之外,研究者也让AlphaGo和其他的围棋AI进行了较量,在总计495局中只输了一局,胜率是99.8%。它甚至尝试了让4子对阵Crazy Stone,Zen和Pachi三个先进的AI,胜率分别是77%,86%和99%。

计算机和人类竞赛在棋类比赛中已不罕见,在三子棋、跳棋和国际象棋等棋类上,计算机都先后完成了对人类的挑战。根据资料显示,1997年,国际象棋AI第一次打败顶尖的人类;2006年,人类最后一次打败顶尖的国际象棋AI;但对拥有2500多年历史的围棋而言,计算机在此之前从未战胜过人类。

AI下围棋,是如何通过计算来打败人类的?

围棋看起来棋盘简单、规则不难。棋盘纵横各19条等距离、垂直交叉的平行线,共构成19×19(361)个交叉点。比赛双方交替落子,目的是在棋盘上占据尽可能大的空间。围棋最大有3^361 种局面,大致的体量是10^170,而已经观测到的宇宙中,原子的数量才10^80。国际象棋最大只有2^155种局面,称为香农数,大致是10^47。

那么AI是如何攻破人类的呢?根据果壳网上作者“开明”的文章解释,面对任何棋类,一种直观又偷懒的思路是暴力列举所有能赢的方案,这些方案会形成一个树形地图。AI只要根据这个地图下棋就能永远胜利。

然而,围棋一盘大约要下150步,每一步有250种可选的下法,所以粗略来说,要是AI用暴力列举所有情况的方式,围棋需要计算250^150种情况,大致是10^360。相对的,国际象棋每盘大约80步,每一步有35种可选下法,所以只要算35^80种情况,大概是10^124。无论如何,枚举所有情况的方法不可行,所以研究者们需要用巧妙的方法来解决问题,他们选择了模仿人类大师的下棋方式。

机器学习研究者们祭出了终极杀器——“深度学习”(Deep Learning)。深度学习是目前人工智能领域中最热门的科目,它能完成笔迹识别,面部识别,驾驶自动汽车,自然语言处理,识别声音,分析生物信息数据等非常复杂的任务。

AlphaGo 的核心是两种不同的深度神经网络。“策略网络”(policy network)和 “值网络”(value network)。它们的任务在于合作“挑选”出那些比较有前途的棋步,抛弃明显的差棋,从而将计算量控制在计算机可以完成的范围里,本质上和人类棋手所做的一样。

其中,“值网络”负责减少搜索的深度——AI会一边推算一边判断局面,局面明显劣势的时候,就直接抛弃某些路线,不用一条道算到黑;而“策略网络”负责减少搜索的宽度——面对眼前的一盘棋,有些棋步是明显不该走的,比如不该随便送子给别人吃。将这些信息放入一个概率函数,AI就不用给每一步以同样的重视程度,而可以重点分析那些有戏的棋着。

AlphaGo利用这两个工具来分析局面,判断每种下子策略的优劣,就像人类棋手会判断当前局面以及推断未来的局面一样。这样AlphaGo在分析了比如未来20步的情况下,就能判断在哪里下子赢的概率会高。

研究者们用许多专业棋局训练AI,这种方法称为监督学习(supervised learning),然后让AI和自己对弈,这种方法称为强化学习(reinforcement learning),每次对弈都能让AI棋力精进。然后他就能战胜冠军啦!

人类在下棋时有一个劣势,在长时间比赛后,他们会犯错,但机器不会。而且人类或许一年能玩1000局,但机器一天就能玩100万局。所以AlphaGo只要经过了足够的训练,就能击败所有的人类选手。

被打败的欧洲冠军樊麾是什么样的水平?

值得注意的是,在AlphaGo打败欧洲冠军之后,谷歌同时还宣布将在今年三月挑战韩国围棋选手李世石,李世石是围棋九段高手,也是近10年来获得世界第一头衔最多的棋手,谷歌为此提供了100万美元作为奖金。

根据谷歌自己的评估,目前AlphaGo的实力只在职业二段左右,其打败的欧洲冠军也只有二段,而韩国围棋选手李世石却是九段,无疑二段与九段之间的实力甚为悬殊。李世石对谷歌的这一挑战表示非常期待,并且认为自己一定会赢。

同时,知乎上有匿名用户分析

如上图,欧洲冠军Hui Fan的水平目测是二段左右,而最强的AlphaGo distributed大概是五段,这和“击败人类”的目标还有点距离(其他非随机类游戏,机器都能轻松击败最强的人类大师)。所以还是等三月和李世石的五番棋吧。

尽管AlphaGo尚有一个月时间学习,但是假设围棋的技巧是有限的话,无论是人学习还是机器学习一定是一条渐近线,即使AlphaGo在三月的挑战中输了这场比赛,这仍旧是AI发展史中一件极具标志性的事情。

PS:本文分析部分内容综合自果壳专栏、知乎用户,点击链接可产看原回答,更多观点可见钛媒体文章《人工智能如何一步步走来,直到挑战欧洲围棋冠军》

转载请注明出处、作者和本文链接
声明:文章内容仅供参考、交流、学习、不构成投资建议。
想和千万钛媒体用户分享你的新奇观点和发现,点击这里投稿 。创业或融资寻求报道,点击这里

敬原创,有钛度,得赞赏

赞赏支持
发表评论
0 / 300

根据《网络安全法》实名制要求,请绑定手机号后发表评论

登录后输入评论内容
  • 不要过度解读

    回复 2016.02.11 · via android
  • 我觉得这个不公平,这是一场一个人和一群的比拼,人工智能好比是一群棋手和一个顶尖棋手的对持,就算是赢了也没什么好炫耀的。这是计算机天然的优势大数据分析,有什么好说的嘛!

    回复 2016.01.28 · via pc
  • 人工智能发展更快

    回复 2016.01.28 · via android
  • 你乱下他就完了。

    回复 2016.01.28 · via android

快报

更多

2024-12-25 23:00

大商所、郑商所夜盘收盘,PTA跌超1%

2024-12-25 22:51

国家电投集团年发电量创历史最好水平,超7000亿千瓦时

2024-12-25 22:46

涪陵榨菜谈调价:今年主力产品价格未有调整,榨菜酱产品降价

2024-12-25 22:35

刘建超会见日本外相岩屋毅

2024-12-25 22:29

提示:美股今日休市

2024-12-25 22:27

中房协发起“迎新年购房安家活动”倡议

2024-12-25 22:21

北大医药:公司实际控制人变更为徐晰人

2024-12-25 22:21

农业农村部举办人工智能专题报告会

2024-12-25 22:11

近30家企业参与,储能行业将召开防止内卷式竞争闭门研讨会

2024-12-25 22:10

北京市大兴区挂牌两宗地块,起始价23.2亿元

2024-12-25 21:56

深圳个人养老金定存利率:大型商业银行在2%左右,养老保险产品综合收益可到3.9%

2024-12-25 21:47

全国首个“低空+高铁”跨城联运场景在杭州投运

2024-12-25 21:28

通义千问发布业界首个开源多模态推理模型QVQ-72B-Preview

2024-12-25 21:25

《中华人民共和国增值税法》全文公布:销售不动产税率为百分之九

2024-12-25 21:19

*ST卓朗:收到上交所拟终止公司股票上市事先告知书

2024-12-25 21:18

理想汽车会做人形机器人吗?李想:100%会做,但不是现在

2024-12-25 21:07

万安科技:实控人拟减持不超3%股份

2024-12-25 21:06

专家解读专项债券管理新政:可减少在途时间,避免“资金等项目”

2024-12-25 21:05

岭南股份:可转债偿付方案正加快制定,并尽量调动多方资源推进催收工作

2024-12-25 21:02

韩国加密资产市场迅猛发展,日均交易额逼近股市

4

扫描下载App