首页 / 科技 / 正文

谷歌人工智能新突破 AlphaGo进化AlphaGo Zero 可做到无师自通

阿尔法狗(AlphaGo)在围棋领域的声望早已闻名世界,但是在10月18日发表的一篇新研究论文中,谷歌旗下子公司DeepMind向公众展示了阿尔法狗目前的最新科研成果,两年时间,DeepMind实验室利用人工智能技术对其进行继续研究开发,如今,阿尔法狗较两年前更聪明了,可以在没有人类资源的环境下进行学习、比赛。

阿尔法狗(AlphaGo)在围棋领域的声望早已闻名世界,但是在10月18日发表的一篇新研究论文中,谷歌旗下子公司DeepMind向公众展示了阿尔法狗目前的最新科研成果,两年时间,DeepMind实验室利用人工智能技术对其进行继续研究开发,如今,阿尔法狗较两年前更聪明了,可以在没有人类资源的环境下进行学习、比赛。

这个新朋友名字叫AlphaGo Zero,DeepMind在《Nature》杂志上发表了一篇名为《不借助人类知识精通围棋游戏》的沦文帮它进行了简单的”自我介绍“。AlphaGo Zero是AlphaGo的进化物,它不需要依托于人类,不需要根据真实案例中提取的数据来进行学习。它是自学成才的”天才“,可进行自主学习,自行消化游戏规则,快速进入最佳玩家状态。

举个简单的例子,AlphaGo Zero只需一个人工神经网络,依靠该单一网络来评估棋子位置,评估棋局同时给出下一步的棋术建议。通过计算机视觉使用白色和黑色棋子作为输入,而不依赖于定制设计的输入。它不像AlphaGo需要学习人类棋局中累积的十万次实战经验,只需程序员输入最基本的围棋规则,便可以进行后续的实战比赛,而比赛技巧全部是它自己摸索思考,不需依托于人类的定制设计.

再来看看AlphaGo Zero的战绩如何。自学3天以100:0完胜李世石版AlphaGo,40天后,打败柯洁版本的AlphaGo的胜率,达到90%,成为人类历史上最优秀的围棋大师。

AlphaGo Zero不仅在围棋场上成绩优异,作为一个人工智能机器人,较AlphaGo拥有更强的性能,只需4个TPU,所需计算能力仅为AlphaGo的十二分之一,这意味着在实际应用时,将节省更多的运算容量,在开发算法方面,Zero将不再需要大量的数据支撑。带来更大的便利性。在AI研究领域属于又一突破。在现AI研究水平下,很多科研建立在大量且廉价的计算能力和数据的基础上实现,虽然可得到研究成果,但却缺乏可延续性、可拓展性以及便捷性。

AlphaGo Zero的成功不仅为棋盘游戏带来新的突破,同时也证明了人工智能技术在未来可以在一定场景下脱离大量数据依然可以被训练的可能性,为人工智能在一些数据难以收据或者真实数据确实的领域的研究奠定了一定的基础,相信未来,这项技术也将会重点研究应用于实际生活场景(如执法或医学领域)。