最强起底“阿尔法狗”前世今生后世的创业狗们加油

　　摘要：伦敦国王10字车站后的1座6层大楼里，就是精英会聚的DeepMind总部，人们安静地进行计算，朝着DeepMind的210年发展大计前进。

　　DeepMind伦敦总部。

　　钛媒体注：在周24:1击败李世石以后，韩国棋院给AlphaGo(阿尔法狗)颁发了1张名誉9段证书，并且给出了1个让人瞠目的世界排名——世界第2，仅次于柯洁，积分也仅比柯洁的3621分少了35分而已。

　　20年前，1997年5月11日，IBM的电脑“深蓝”在6轮比赛中以2胜1负3平的成绩打败了当时的国际象棋冠军卡斯帕罗夫，这1新闻席卷了当时的各大报纸头条。许多人工智能专家预言，电脑在围棋比赛中也能够打败人类，但最少得等到几10年以后。

　　而今恍如历史重演，AlphaGo(下文均称阿尔法狗)打败世界围棋冠军李世石的报导又遮天蔽日而来，但这次明显更让人们震惊，由于才过去短短20年，阿尔法狗就在人们公认的最复杂的棋类游戏中以4:1的成绩克服了韩国围棋第1人。(你说还有我朝国粹麻将?亲爱的你真是钛弄了。)

　　不管下1战结果如何，阿尔法狗也都已写入传奇。它究竟是谁，它是如何诞生的，如何长大的，它有缺点吗，它的缔造者又是谁，后阿尔法狗时期，它又将给创业狗们带来多少机会，钛媒体英文团队用时多日，深度发掘，起底这只让人类惶惶不安的“阿尔法狗”。

　　1家人材会聚的公司

　　在伦敦国王10字车站后的1座6层大楼里，几个房间以阿兰·图灵、达芬奇和尼古拉·特斯拉等大师命名，这里就是精英会聚的DeepMind总部，人们安静地进行计算，朝着DeepMind的210年发展大计前进。

　　DeepMind的联合开创人兼CEO德米斯·哈萨比斯(Demis Hassabis)向来把DeepMind视为1项人工智能领域的阿波罗登月计划，乃至是研发原子弹的曼哈顿计划，“100名科学家，来自40个国家，1起尽量快地实现1项具有远见卓识的事业。”

　　“在其他1般的创业公司里，我们的1名高级研究员就可以撑起(他们的)1家公司。”

　　这并不是大放厥词，DeepMind内部人才辈出的程度可能远超你的想象。这家人工智能先驱公司的成绩并不是仅凭哈萨比斯1人之才撑起来的。大卫·希尔文(David Silver)的个人网站上列出了29篇已发表的研究文章;艾利克斯·格雷福斯(Alex Graves)曾跟谷歌的AI专家吉奥夫·辛顿(Geoff Hinton)1起研究神经网络;瓦拉德·尼(Vlad Minh)也在辛顿的指点下完成了机器学习的PhD学位。阿尔法狗的成功乃至DeepMind的发展，离不开这些籍籍无名的幕后元勋。

　　其他年轻创业公司大多雇佣210多岁的年轻人，而DeepMind不同的地方在于，这里的员工平均年龄为310多岁，绝大部份成员都有1个乃至多个博士学位。根据哈萨比斯的说法，DeepMind的伦敦办公室比谷歌“略微更复杂老到1些”。这里没有倒在座垫上睡觉的程序员，只有“严肃的沙发供(大家)严肃地思考。”

　　全能的超人CEO

　　固然，身为CEO的哈萨比斯自有其过人的地方，他在少年时期就是神童。跟他们办公室以之命名的达芬奇1样，哈萨比斯也是这样1位全能型人材。他在13岁的时候就成了国际象棋大师，屡次参与Mind Sports奥林匹克比赛，主办方形容他“也许是史上最优秀的选手”。5次拿到Pentamind国际象棋锦标赛冠军、玩腻了西洋棋以后，他开始自己开发游戏，和游戏开发公司牛蛙公司(Bullfrog)和狮头公司(Lionhead)1同开发了《主题公园》(Theme Park)和《黑与白》(Black&White)等几款具有强烈AI色采的游戏。棋赛经历为往后的职业生涯定下了两个让他始终魂牵梦萦的问题：

　　大脑是如何学会掌握复杂任务的?

　　电脑也能做到一样的程度吗?

　　1994年，他到剑桥攻读计算机科学，但很不满意1些老师所教的狭义人工智能，也就是让程序员给数据“贴标签”，计算机才能理解信息，乃至有1次当面离开老师的讲堂。就在那个时期，哈萨比斯决定创建DeepMind这样的机构，当时将其模糊地定位为研究项目与科技创业的融会体。

　　“事实上我的全部职业生涯，包括我开发游戏的时候，都是为了终究成立AI公司。少年的时候我就决定，AI会是最有趣和最重要的事业。”

　　——2015年1月，《连线》主编Steven Levy专访哈萨比斯

　　哈萨比斯曾说，他当时就知道这会是1项长达210年的计划。首先，他需要得到足够的经验才能成立1个理想团队，因此在1998年先成立了游戏工作室Elixir，开始在商界摸爬滚打。2005年，28岁的他重返校园，在UCL拿到了认知神经科学的PhD学位。2011年，他终究跟谢恩·雷格(Shane Legg)和穆斯塔法·苏雷曼(Mustafa Suleyman)共同创建了DeepMind，并在尔后的2014年1月接受谷歌出价4亿英镑的收购，至今还是谷歌在欧洲最大的1起收购案。

　　“我开始思考DeepMind——那是2004年——但我认识到，我们还没有足够的资源来快速前进。(当时)深度学习还没出现，计算能力还不够强大。所以我就去看我的PhD应当研究甚么，然后觉得研究神经科学比AI好，由于我想学习全新的1套观点，而我已认识世界1流的AI人材了。”

　　——2015年1月，《连线》主编Steven Levy专访哈萨比斯

　　在接受谷歌收购的时候，DeepMind在1点上绝不让步——总部要继续留在伦敦。哈萨比斯认为，“如果你从剑桥拿到PhD毕业，想干点改变世界的科技，(除伦敦)没啥别的选择，而硅谷的机会遍地都是。但是如果你关注的是长时间目标，硅谷可能就是泡沫——人们总是希望下1秒创造出另外一个Snapchat，全部体系里有很多噪音。”

　　哈萨比斯决定接受谷歌邀约的缘由也很简单：为了更好地弄研究。投资了DeepMind的马斯克向谷歌CEO拉里·佩奇(Larry Page)介绍了这家决定专攻AGI的公司，几个月后，当时的谷歌高级副总裁阿兰·尤斯塔斯(Alan Eustace)就给哈萨比斯发了邮件，约请他与佩奇会面。

　　“我们协商了1年。选择谷歌的缘由，1个是文化上双方很投机，另外一方面在于佩奇自己也非常热中于AI。”哈萨比斯说。1开始，他就希望把DeepMind建立成人工智能界的谷歌。但是创业3年，他花了大量时间召募资金，只有10%的时间能够投入研究。他意想到，这样下去即便花费1生的时间也建不成谷歌，别说解决AI问题了。这时候候佩奇告知他：“我花了15年建立谷歌——你为何不直接来利用我们现有的机会呢?”

　　“谁都不会谢绝谷歌的邀约。”

　　他们到底想干甚么?

　　DeepMind网站上挂出的公司的愿景很简单，“解决智能问题(solve intelligence)”。根据哈萨比斯的描写，他们真正要攻破的是通用人工智能(AGI，artificial general intelligence)。他的目标不在于让机器理解语言、辨认人脸或是声音，而是通过机器学习和系统神经科学让网络学会自己决策，就像人类1样。

　　“AI的梦想是让机器变得聪明。今天的大部份AI都是关于给机器编程的。我们的方法是给它程序，让它能够自己学习。这要远为强大;这就是生物学习的机理。”

　　另外一名联合开创人、现利用人工智能主管苏雷曼曾在去年6月的伦敦机器学习大会上就曾公然介绍DeepMind。“我们的系统是自主学习的，没有预先的编程，也没有手动操作。我们给算法提供尽量大量的原始信息，让系统自己学习，学会采取行动、分类或预测。”

　　“我们设计的系统本质上是通用的。也就是说，一样的系统能够用来完成大量不同的任务。”

　　DeepMind联合开创人穆斯塔法·苏雷曼。图片来自Wired UK。

　　DeepMind专攻的是深度学习和强化学习研究，这些技术能让机器自己进行大量学习。被谷歌收购之前，DeepMind团队已搭建了1些会玩经典雅达利视频游戏(比如，Pong，Breakout和Space Invaders)的系统。人工智能之父马文·明斯基曾提出1个假定：人类与机器之间并没有真实的区分。人类实际上也是1种机器，大脑由许多半自治但很笨拙的“代理”(agent)组成，而“不同的任务需要完全不同的机制。”根据苏雷曼的描写，DeepMind的测试机制也是让系统中的“代理”从原始数据中学习并找出最优方法、得到最大产出。

　　强化学习将系统能做的事情向前推动1步。1旦搭建起1个很善于玩游戏的神经网络，你就可以让它和自己对战。随着两个版本的神经网络彼此对阵数以千计次后，系统就可以清查出哪些招数回报最高——也就是说，得分最高——并以这类方式学会以更高的水平玩游戏。再次重申，这类原理一样适用于其他决策。

　　阿尔法狗的开发使用了这1切成果，而且还远不止此。Hassabis和他团队添加了1个2级“深度强化学习”，预测每步的长效成果。他们还采取了过去驱动围棋游戏人工智能系统的传统人工智能技术，包括蒙特卡洛树搜索。鉴戒新旧技术，他们搭建起能够击败顶级职业选手的系统。

　　AI的利用前景有多广?

　　哈萨比斯表示，5年之内，DeepMind能够让我们的平常工具更聪明、适应能力更强，“更好地搜索，更好地理解你的意图——你大可以含糊其辞，它也能够明白你到底想干甚么。”而在210年以内，“科学界固然会获益，不管是药品研发回是蛋白质折叠，任何需要大量探索的领域都可以……可能就有AI科学家在《Nature》上发表文章了。”

　　“气候，疾病……有了AI的协助，科学就可以够加快发现新知的进程。”

　　人工智能潜伏的利用领域非常广泛，包括医疗健康、智能手机助手和机器人技术等。围棋大赛几周前，DeepMind已和英国全民医疗服务(NHS)达成火伴关系，准备开始建立可以应用机器学习的平台。医疗方面的人工智能通常利用于医疗诊断图象、生命特点的长时间纵向追踪、自我量化及帮助人们建立更健康的生活方式，而阿尔法狗的强化学习能力恰好非常合适利用于这些方面。

　　赢了李世石不过是通往下1个里程碑的开始。DeepMind团队已把眼光继续放在游戏上，而星际争霸可能就是他们投入利用的第1个游戏。不过，星际争霸跟围棋是截然不同的两回事，要求玩家基于有限的信息做出决策。一样的道理，智能手机和围棋游戏需要学习的东西完全不同，DeepMind公司在接下来的几个月里要尝试开发阿尔法狗的算法，让程序在无人预定学习出发点的情况下完全进行自主学习，也就是从零学起。这将成为1种“纯学习”模式，完全脱离人类的监控。

　　相比佩奇对DeepMind、对AI的浓厚兴趣，哈萨比斯认为一样在开发AI的Facebook更多地把它作为工具;毕竟，Facebook的目标是连接世界，而DeepMind的目标就是AI本身。话虽如此，哈萨比斯还是预计，在未来2至3年内，人们就可以开始看到在智能手机助手方面的变化，比如可以用来改进语音搜索、定义Youtube的视频推荐、控制谷歌的无人驾驶汽车等。现在，DeepMind已将核心系统利用在谷歌的语音辨认中，“Tool AI”(深度学习网络)利用于讹诈检测、图片搜索、街景辨认、谷歌翻译等。

　　AI是福还是祸?

　　不过，“我认为人工智能就跟其他强大的新科技1样……不负责任地利用便可能带来害处。”哈萨比斯接受BBC采访时表示。他也10分关注其他业内人士对AI的耽忧，比如投资了DeepMind的马斯克，比如认为AI可能“终结人类”的霍金。

　　因此，DeepMind内部成立了道德与咨询委员会，成员均为科学和哲学领域的顶尖人物，他们会对DeepMind的研发成果进行监管，不过跟马斯克不同的观点在于，哈萨比斯要求现阶段保持隐私、不对外公然，由于“不想由于人们在Twitter等社交媒体上的意见而选择让步”、“此前从未有这方面的尝试，因此在被强加上公共监督的桎梏之前，我们还有许多探索性的工作要进行。”

　　苏雷曼的态度则更加乐观。他认为，过分悲观乃至恐惧的态度对AI的发展毫无助益，从前人们担心的是AI研究会不会失败，现在却反而担心AI太成功会给人类带来恶果。

　　“研发AI是用来加能人类能力，而不是毁灭我们自己。”

　　现在，有1点最少可以放心，就是DeepMind坚持所有成果不会用于军事或情报搜集用处。

　　但是，明显研究AI的不只谷歌1家。事实上，相当多的互联网巨头都开始大量投资人工智能领域并争取人材。

　　前文提到的Facebook，其实在谷歌向DeepMind抛出橄榄枝时就对后者产生兴趣。现在，在纽约大学毕生教授、“深度学习”专家Yann LeCun的带领下，Facebook人工智能实验室正蓬勃发展。

　　微软研究院大概是商业公司内少数纯以学术为目的的研究机构了，在旧金山的Build 2015开发者大会上，微软提出1组称为“Project Oxford“的技术，让开发人员通过微软云计算平台Azure开发并实现图象理解、人脸辨认、语音辨认与合成等功能。

　　代表IBM在认知计算领域最核心的技术Watson也是1个强大的AI平台。2011年2月，Watson在美国问答节目《Jeopardy!》上克服两位冠军选手，被认为和“深蓝“克服卡斯帕罗夫1样，是人工智能历史的1个里程碑。随着IBM转型为认知解决方案与云平台公司，Watson的商业化价值日趋显现。

　　除自家的公司，扎克伯格和投了DeepMind的马斯克1样，都跟投了宣称要“复制大脑皮层“的人工智能公司Vicarious。百度也并不是像大家吐槽的那样只做外卖，它的超级计算机Minwa有着全球1流的图象辨认能力。

　　后阿尔法狗时期，创业狗该怎样走?

　　毫无疑问，在这场全球大秀以后，人工智能又将成为下1个创业风口。但是创业向来是“行百里者半910”，大浪淘沙以后，怎样的人材能留在历史舞台?

　　去年2月份，哈萨比斯回到剑桥大学做了1个演讲，分享公司的成立故事和他对深度学习算法的研究、对人工智能的看法、和身为创业者的经验。

　　在剑桥演讲的哈萨比斯。图片来自cutec.org。

　　1. 你不需要比世界领先太多，5年就够了

　　创业需要新颖和智慧，延续学习和改进能够帮助你找到本身的优势所在。另外，在主科以外进行跨界能够打开视野，让你脱颖而出，就像哈萨比斯结合计算机和认知神经科学1样。不过，比1般人领先5年左右就行了，由于你需要让他们理解你的技术与愿景。

　　2. 充满热忱，酷爱你的目标

　　开始创建新事业，特别是1些乍1看遥不可及的目标时，你必须充满热忱、延续前进、保持领先，由于1旦势头停下来，你就很难继续鼓励你的团队乃至你自己，也就更难募资了。

　　3. 要在短时间内多拿1些投资

　　在DeepMind之前的创业项目中，哈萨比斯也跟普通人1样，经历了几轮融资。但是到了DeepMind，他采取了完全不同的策略，就是不断寻觅更多的投资，而不满足于某1轮融到多少钱，因而很短时间内就确保拿到6千万投资。这不但能加快实现目标的进程，也是在给团队打鸡血，保证前进的势头。

　　4. 从懂你的人那里拿钱

　　许多投资人和VC都希望几年内拿到10几倍的回报，但哈萨比斯知道DeepMind不能做出这样的许诺，他们注定是需要长时间投入的研究团队。因此，哈萨比斯找的都是彼得·蒂尔、马斯克、李嘉诚这样的投资人，由于他们晓得DeepMind的使命，深知这场技术革命的巨大影响及其潜伏的财务回报。

　　他们注定要仰望星空，然后脚踏实地。

　　2015年初，哈萨比斯接受了金融时报记者的午饭采访。当时的他形容自己希望留下1些遗产，“当你问我，下棋的时候赢得比赛对我来讲重要吗?非常重要，从实现个人潜力的角度来讲的话。而遗产的重要性在于，终有1天，我希望我的人生能完成1些足够重大的事情，通过技术，我能够给社会带来1些良好、深入的改变。”