经济日报多媒体数字报刊

第15版：新知

上一版3 4下一版

标题导航

	人工智能为反欺诈睁开一双慧眼
	汽车尾气治理有了新技术
	更厉害的阿尔法狗来了！
	2万米高空！侧颈龟到此一游
	无人驾驶船舶将成现实
	联系邮箱

	返回经济网首页 \| 版面导航 \| 标题导航

2017年11月13日星期一

更厉害的阿尔法狗来了！

本报记者佘惠敏

《自然》日前发表的一篇论文报道，一款新版的AlphaGo计算机程序能够从空白状态起，在不需要任何人类输入的条件下，迅速自学围棋。这款新程序名叫AlphaGo Zero，是无监督学习的产物，它的双胞胎兄弟Master则使用了监督学习的方法。在训练了72小时后，AlphaGo Zero就能打败战胜李世乭的AlphaGo Lee，而AlphaGo Lee为此训练了几个月。并且40天后，AlphaGo Zero就能以89∶11的成绩，将战胜了包括柯洁在内的所有人类高手的Master甩在后面。

人工智能的最大挑战是研发一种能从零开始、以超人类的水平学习复杂概念的算法。为打败人类围棋世界冠军，科学家在训练上一款AlphaGo时，同时用到了监督式学习和基于自我对弈的强化学习，并用到多台机器和48个TPU（神经网络训练所需的专业片）。

据介绍，AlphaGo Zero的学习从零开始，且单纯基于与自身对弈。人类的输入仅限于棋盘和棋子，没有任何人类数据。AlphaGo Zero仅用到一张神经网络，经过训练后，专门预测程序自身的棋步和棋局赢家，在每次自我对弈中进步。此外，新程序只使用一台机器和4个TPU。

通过几天的训练，包括近500万局自我对弈——AlphaGo Zero便能超越人类并打败所有之前的AlphaGo版本。此外，它并没有像之前的兄弟姐妹一样被教人类的围棋知识。它只是和不同版本的自己下棋，然后用胜者的思路来训练新的版本，如此不断重复。通过这一方法，AlphaGo Zero完全自己摸索出了开局、收官、定式等以前人类已知的围棋知识，也摸索出了新的定势。

放大

缩小

默认

	第01版：要闻
	第02版：要闻
	第03版：要闻
	第04版：特别报道
	第05版：时评
	第06版：产经
	第07版：财经
	第08版：综合
	第09版：特别报道
	第10版：企业
	第11版：县域经济
	第12版：区域
	第13版：创周刊
	第14版：创周刊
	第15版：新知
	第16版：中经论坛