2024 T-EDGE文章详情页顶部

AI 和人类的较量再一次展开了,谷歌人工智能击败欧洲围棋冠军

在今天国际顶尖期刊《自然》报道了谷歌所开发的这款新围棋AI。这款名为AlphaGo(翻译为阿尔法围棋)的人工智能,在没有任何让子的情况下以5:0完胜欧洲冠军,职业围棋二段樊麾,樊麾出生于中国,目前是法国国家围棋队总教练,已经连续三年赢得欧洲围棋冠军的称号。

【钛媒综合】AI 和人类的较量再一次展开了。

1月28日上午消息,谷歌今日召开全球电话会议,旗下Deep MInd创始人戴密斯·哈萨比斯(Demis Hassabis)宣布了谷歌在人工智能领域的重要进展:开发出一款能够在围棋中击败职业选手的程序——AlphaGo,后者能够通过机器学习的方式掌握比赛技巧。

而同样,在今天国际顶尖期刊《自然》报道了谷歌所开发的这款新围棋AI。这款名为AlphaGo(翻译为阿尔法围棋)的人工智能,在没有任何让子的情况下以5:0完胜欧洲冠军,职业围棋二段樊麾,樊麾出生于中国,目前是法国国家围棋队总教练,已经连续三年赢得欧洲围棋冠军的称号。

AlphaGo与欧洲围棋冠军樊麾的5局较量

除此之外,研究者也让AlphaGo和其他的围棋AI进行了较量,在总计495局中只输了一局,胜率是99.8%。它甚至尝试了让4子对阵Crazy Stone,Zen和Pachi三个先进的AI,胜率分别是77%,86%和99%。

计算机和人类竞赛在棋类比赛中已不罕见,在三子棋、跳棋和国际象棋等棋类上,计算机都先后完成了对人类的挑战。根据资料显示,1997年,国际象棋AI第一次打败顶尖的人类;2006年,人类最后一次打败顶尖的国际象棋AI;但对拥有2500多年历史的围棋而言,计算机在此之前从未战胜过人类。

AI下围棋,是如何通过计算来打败人类的?

围棋看起来棋盘简单、规则不难。棋盘纵横各19条等距离、垂直交叉的平行线,共构成19×19(361)个交叉点。比赛双方交替落子,目的是在棋盘上占据尽可能大的空间。围棋最大有3^361 种局面,大致的体量是10^170,而已经观测到的宇宙中,原子的数量才10^80。国际象棋最大只有2^155种局面,称为香农数,大致是10^47。

那么AI是如何攻破人类的呢?根据果壳网上作者“开明”的文章解释,面对任何棋类,一种直观又偷懒的思路是暴力列举所有能赢的方案,这些方案会形成一个树形地图。AI只要根据这个地图下棋就能永远胜利。

然而,围棋一盘大约要下150步,每一步有250种可选的下法,所以粗略来说,要是AI用暴力列举所有情况的方式,围棋需要计算250^150种情况,大致是10^360。相对的,国际象棋每盘大约80步,每一步有35种可选下法,所以只要算35^80种情况,大概是10^124。无论如何,枚举所有情况的方法不可行,所以研究者们需要用巧妙的方法来解决问题,他们选择了模仿人类大师的下棋方式。

机器学习研究者们祭出了终极杀器——“深度学习”(Deep Learning)。深度学习是目前人工智能领域中最热门的科目,它能完成笔迹识别,面部识别,驾驶自动汽车,自然语言处理,识别声音,分析生物信息数据等非常复杂的任务。

AlphaGo 的核心是两种不同的深度神经网络。“策略网络”(policy network)和 “值网络”(value network)。它们的任务在于合作“挑选”出那些比较有前途的棋步,抛弃明显的差棋,从而将计算量控制在计算机可以完成的范围里,本质上和人类棋手所做的一样。

其中,“值网络”负责减少搜索的深度——AI会一边推算一边判断局面,局面明显劣势的时候,就直接抛弃某些路线,不用一条道算到黑;而“策略网络”负责减少搜索的宽度——面对眼前的一盘棋,有些棋步是明显不该走的,比如不该随便送子给别人吃。将这些信息放入一个概率函数,AI就不用给每一步以同样的重视程度,而可以重点分析那些有戏的棋着。

AlphaGo利用这两个工具来分析局面,判断每种下子策略的优劣,就像人类棋手会判断当前局面以及推断未来的局面一样。这样AlphaGo在分析了比如未来20步的情况下,就能判断在哪里下子赢的概率会高。

研究者们用许多专业棋局训练AI,这种方法称为监督学习(supervised learning),然后让AI和自己对弈,这种方法称为强化学习(reinforcement learning),每次对弈都能让AI棋力精进。然后他就能战胜冠军啦!

人类在下棋时有一个劣势,在长时间比赛后,他们会犯错,但机器不会。而且人类或许一年能玩1000局,但机器一天就能玩100万局。所以AlphaGo只要经过了足够的训练,就能击败所有的人类选手。

被打败的欧洲冠军樊麾是什么样的水平?

值得注意的是,在AlphaGo打败欧洲冠军之后,谷歌同时还宣布将在今年三月挑战韩国围棋选手李世石,李世石是围棋九段高手,也是近10年来获得世界第一头衔最多的棋手,谷歌为此提供了100万美元作为奖金。

根据谷歌自己的评估,目前AlphaGo的实力只在职业二段左右,其打败的欧洲冠军也只有二段,而韩国围棋选手李世石却是九段,无疑二段与九段之间的实力甚为悬殊。李世石对谷歌的这一挑战表示非常期待,并且认为自己一定会赢。

同时,知乎上有匿名用户分析

如上图,欧洲冠军Hui Fan的水平目测是二段左右,而最强的AlphaGo distributed大概是五段,这和“击败人类”的目标还有点距离(其他非随机类游戏,机器都能轻松击败最强的人类大师)。所以还是等三月和李世石的五番棋吧。

尽管AlphaGo尚有一个月时间学习,但是假设围棋的技巧是有限的话,无论是人学习还是机器学习一定是一条渐近线,即使AlphaGo在三月的挑战中输了这场比赛,这仍旧是AI发展史中一件极具标志性的事情。

PS:本文分析部分内容综合自果壳专栏、知乎用户,点击链接可产看原回答,更多观点可见钛媒体文章《人工智能如何一步步走来,直到挑战欧洲围棋冠军》

转载请注明出处、作者和本文链接
声明:文章内容仅供参考、交流、学习、不构成投资建议。
想和千万钛媒体用户分享你的新奇观点和发现,点击这里投稿 。创业或融资寻求报道,点击这里

敬原创,有钛度,得赞赏

赞赏支持
发表评论
0 / 300

根据《网络安全法》实名制要求,请绑定手机号后发表评论

登录后输入评论内容
  • 不要过度解读

    回复 2016.02.11 · via android
  • 我觉得这个不公平,这是一场一个人和一群的比拼,人工智能好比是一群棋手和一个顶尖棋手的对持,就算是赢了也没什么好炫耀的。这是计算机天然的优势大数据分析,有什么好说的嘛!

    回复 2016.01.28 · via pc
  • 人工智能发展更快

    回复 2016.01.28 · via android
  • 你乱下他就完了。

    回复 2016.01.28 · via android

AWARDS-文章详情右上

快报

更多

14:59

浙大回应“受资助学生晒国内外旅游照”:取消其受资助资格

14:30

今年上半年全国商标质押融资额达797.1亿元

14:12

中国牵头首个冷链物流无接触配送领域国际标准正式发布

14:11

上交所与三大石油石化集团将进一步深化合作

14:05

华为轮值董事长徐直军谈鸿蒙生态未来目标:拥有10万个应用

13:23

上海航交所:本周出口集装箱运输市场略显疲软,远洋航线运价下跌

13:22

上海航交所:市场运力周转不畅,本周沿海综合运价指数继续上行

13:22

鸡蛋恐更贵,日本因禽流感疫情扑杀超120万只禽类

13:09

阿达尼集团CFO:待法律评估后将回应美国指控

13:03

莱迪思半导体据悉考虑收购英特尔旗下Altera

12:46

著名经济史学家周秀鸾逝世,曾与丈夫赵德馨共同向知网维权

12:26

融创在青岛四宗地块被摆上拍卖架,起拍价约5.41亿元

12:24

青海羊曲水电站第二台机组并网发电

12:13

黄仁勋:AI可能是有史以来最重要的技术,整个世界都被重置

12:03

济南市监部门回应“旺仔牛奶被曝喝出异物”:旺旺在多地设有厂,正在调查

12:02

为逃避检查,广东潮州大量商户关门停业、工厂放假?官方:个别商户

11:49

苹果AMOLED屏MacBook最快有望2027年推出,在鼓励供应商加大投资

11:47

第35条指数发布,11月已成今年新增指数数量最多的月份

11:44

国内金价涨势未止,较昨日上涨超10元/克

11:44

11月份沪牌拍卖结果公布

4

扫描下载App