人工智能暴力碾压 人类智慧何去何从?
来源:信息时报 日期:2016-03-14
曾经,计算机“深蓝”与卡斯帕罗夫的国际象棋大战令全球媒体关注,最终,以人类在国际象棋领域被计算机攻克告终。如今,谷歌研发的计算机围棋软件“阿尔法围棋”,又继续向围棋这个古老的人类智力游戏发起挑战:在去年击败欧洲冠军之后,这次与韩国棋手李世石之间的较量再次成为全球关注的焦点。
有计算机业内人士说,不管输赢,这次人机大战都将成为人工智能发展史上的一个里程碑。然而更多的人可能会担心,一旦人工智能超过了人类智慧,等待我们的将会是什么?
“我肯定会成为5场比赛的胜者,”作为围棋世界的超一流大师,韩国棋手李世石在与谷歌公司围棋软件“阿尔法围棋”的比赛前,信心十足。他更表示,自己从收到邀请到决定应战只用了不到5分钟。
天不遂人愿,这五分钟也许会成为李世石人生中最后悔的“黑色5分钟”——从本月9日开始的5场较量中,留在李世石脸上的更多是遗憾和无奈。这显然不是比赛时坐在李世石对面那个谷歌公司业余六级棋手的“功劳”,而是藏在软件“阿尔法围棋”背后,也是谷歌公司最引以为豪的人工智能技术。
人机大战
计算机多靠“暴力破解”
对于大多数人来说,上一次给人们留下深刻印象的人机大战,还是1997年 IBM公司的“深蓝”计算机战胜了当时世界排名第一的国际象棋大师卡斯帕罗夫。然而对于行内的计算机专家来说,“深蓝”赢得并不光彩——道理非常简单,局限于规则,国际象棋每一步都是可预见的,因此,“深蓝”战胜卡斯帕罗夫的诀窍就在于,运用强大的运算能力,“暴力破解”所有下一步的可能性。
而在2011年,另外一次著名的人机大战则是“深蓝”的同门师弟“沃森”,在美国老牌智力问答节目《危险边缘》中战胜两位人类冠军选手。据称,《危险边缘》问答以答案的形式给出线索,选手则需要以问题作答。比如问“小时候谁砍了樱桃树”,那么选手可以回答“是乔治·华盛顿吗?”
虽然“沃森”在比赛时没有接入互联网,但仍然取得了比赛的胜利。同样,在不少计算机专家看来,“沃森”只不过展现了计算机在语言处理、信息搜索和储存等多方面的能力,并没有拥有战胜人类的人工智能。
不管是“深蓝”还是“沃森”,他们注定成为人工智能发展史上的绝佳注脚。
那些年的人机大战
深蓝——蛮算的“硬汉”
1997年,美国IBM公司的 “深蓝”超级计算机以2胜1负3平战胜了当时世界排名第一的国际象棋大师卡斯帕罗夫。当时,“深蓝”主要依靠强大的计算能力来选择最佳策略:“深蓝”靠硬算可以预判12步,而卡斯帕罗夫只可以预判10步,两者高下立现。 比赛中,第2局的完败让卡斯帕罗夫深受打击,他的斗志和体力在随后3局被拖垮。此外,IBM拒绝了卡斯帕罗夫的再战请求。
浪潮天梭——以一敌五
2006年,“浪潮杯”首届中国象棋人机大战中,5位中国象棋特级大师最终败在超级计算机浪潮天梭手下。中国人发明的这项充满东方智慧的模拟战争游戏,被中国超级计算机独占鳌头。在2局制的博弈中,浪潮天梭以平均每步棋27秒的速度,每步66万亿次的棋位分析与检索能力,最终以11∶9的总比分险胜。
沃森——全才“学霸”
2011年,“深蓝”的同门师弟“沃森”在美国老牌智力问答节目《危险边缘》中战胜两位长期占据冠军宝座的选手。虽然参赛者需要大量历史、文学、政治、科学及流行文化知识,还需要解析隐晦含义和谜语等,但是在存储了2亿页数据的“沃森”面前,这些都不是问题。
独特架构
“阿尔法围棋”能够自学
虽然计算机在各个方面屡次向人类智慧发起挑战,但在围棋方面,计算机专家却忌讳莫深——这是因为大多数棋类游戏,计算机都可以通过“暴力”方式,推算出所有的取胜方案。而在体现东方智慧的围棋上,一盘棋可以长达150个回合,每回合又有250种下子可能,因此排列组合下来的棋型总数甚至超过宇宙中的原子数,因此,“暴力破解”并不适用。
显然,谷歌公司研发的软件“阿尔法围棋”不会使用“暴力”的方式——据称,该研发团队能让“阿尔法围棋”根据棋盘上的形势选出较有胜算的方案,换句话说就是让软件像人类一样思考。这听起来不可思议,但是“阿尔法围棋”的确与“深蓝”有着显著的区别。
实际上,“阿尔法围棋”背后是谷歌公司开发的“神经网络”系统——它并不是一台超级计算机,而是一个由许多个数据中心作为节点相连,每个节点内有着多台超级计算机组成的网络——就跟人脑的架构一样,由上百亿个神经元相连。“阿尔法围棋”只不过是这个“神经网络”系统专门针对围棋开发的一个程序。
自我博弈
玩视频游戏击败职业玩家
“阿尔法围棋”的强大在于,虽然有了类似于人脑的“神经网络”系统作为网络基础,但是让“阿尔法围棋”拥有人工智能主体的还是被称为“深度强化学习”的算法——它还能通过大量数据分析以及自我博弈,寻找比棋谱更多的技巧来击败人类。
“深度强化学习”算法到底如何运作?美国谷歌公司旗下的人工智能公司“深度思维”并没有公开,不过在一年前的2月,该研发团队在全球顶级科学期刊《自然》杂志上刊登的一篇论文中这样描述,“深度强化学习”的灵感来源于心理学中的行为主义理论,即有机体如何在环境给予的奖励或惩罚的刺激下,逐步形成对刺激的预期,产生能获得最大利益的习惯性行为。
其实,在挑战人类之前,“阿尔法围棋”进行过多次试错——研究人员让该系统教自己玩49种经典的视频游戏,其中包括许多不同的类型,比如横向的射击游戏,还有一对一的格斗游戏,以及赛车游戏等等。让人惊奇的是,该系统仅仅依靠对游戏视频的观察,在两三盘游戏后,操作控制器的能力就突飞猛进——在49种游戏中的23种,击败了人类职业玩家。
去年10月,“阿尔法围棋”就向人类围棋选手发起了挑战,结果以5∶0战胜了欧洲围棋冠军樊麾,这也是人工智能程序首次在不让子的情况下战胜人类围棋选手。而在这场与韩国棋手李世石大战之前,“阿尔法围棋”的研发负责人、同时“深度思维”公司创始人的哈萨比斯,在接受采访时就表达出足够的信心,“人类或许一年能玩1000局,但机器一天就能玩数百万局。虽然不少人认为我们获胜的几率只有5%……但是我们的系统进步很快,就在我们谈话时,它正在进步。”
“阿尔法围棋”背后的“大神”
当神经科学的科学家玩起了计算机……
在2014年1月之前,很少有人了解到“深度思维”这家位于英国伦敦的人工智能公司,也很少有人了解创始人哈萨比斯。直到在谷歌公司和脸谱公司两家科技巨头为“深度思维”展开过激烈竞争,并最终被谷歌公司以5亿英镑的高价收购之后,这家公司才走向大众视线——“深度思维”公司在其官网上写道:“深度思维”致力于用研究深度学习的方式去真正了解人类的智慧。…