电商

起底让人类汗颜的DeepMind:竟是个谷歌大包袱!-东方都市网

字号+ 作者:东方都市网 来源:搜狐号自媒体 2018-07-12 13:17 我要评论( )

起底让人类汗颜的DeepMind:竟是个谷歌大包袱!-科技频道-和讯网

  7月11日报道,自在国际围棋、国际象棋战胜顶尖棋手后,上周DeepMind又在《雷神之锤III竞技场》发威,双人组队击败顶级人类玩家,小组胜率高达到74%。

  对于关注人工智能(AI)领域的人而言,DeepMind绝不是个陌生的名字。自2016年AlphaGo首次击败韩国围棋冠军李世石,DeepMind AI展开了在游戏领域对顶尖玩家的长期挑战。

  然而,在一次次刷新人类纪录的表面风光之后,DeepMind面临的是亏损严重、人员流失和可能被谷歌抛弃的生存危机。换句话讲,DeepMind每一次刷的存在感,背后都是泪。

  又打败人类,对游戏上瘾的AI公司

  自2016年AlphaGo以4:1打败韩国围棋冠军李世石以来,DeepMind在游戏领域越战越勇,不断研发出新的AI系统,挑战人类的极限。2016年6月,DeepMind训练的AI系统在雅达利游戏《 Montezuma"s revenge》达到了大师技巧。半年后, 在中国奕城围棋网和野狐围棋网快棋对决数十位中日韩围棋高手、连续60局无一败绩的Master被曝出是DeepMind的作品,这个新AlphaGo系统在2017年以3:0战胜排名世界第一的职业围棋选手柯洁。

AlphaGo和李世石对战

  如果你在去年12月之前问任何一个专业国际象棋选手,市场上最强大的商用国际象棋软件是什么?你可能听到最多的答案就是Stockfish、Houdini和Komodo,这三个软件可以比任何专业棋手都有更出色的下棋表现。

  不过到了12月6日,一切都改变了。在AlphaGo退役5个月后,DeepMind推出AlphaGo系列的新版本——AlphaGo Zero,只用4个小时的训练时间就从零开始学会了国际象棋的规则,并在100场比赛中取得28胜72平的极佳战绩,其突出表现已然超过Stockfish。国际象棋游戏使用Elo进行评级,专业玩家评分在1800到2000之间,大师级别玩家的评分在2500以上,Stockfish的评分在3300左右,而AlphaGo Zero经评估后可能在4000左右。此外,AlphaGo Zero还有训练3天打败旧版AlphaGo、训练40天打败Master、训练2小时打败最强日本将棋程序Elmo的战绩。

AlphaGo和Stockfish国际象棋大战复盘

  除了名满天下的AlphaGo系列,DeepMind训练智能体通过观看Youtube等视频自主学习超级玛丽等游戏。

  上周,DeepMind的游戏征途有了新的里程碑——在《雷神之锤III竞技场(Quake III Arena)》夺旗游戏中和人类随机组队打团战,击败了人类玩家。

《雷神之锤》游戏画面

  在DeepMind正在推进的研究中,关注度最大的即是《星际争霸 Ⅱ》。2017年8月,DeepMind宣布开始训练AI玩暴雪公司旗下的《星际争霸 II》游戏。当时其顾预言,计划让AI在五年后战胜《星际争霸》世界冠军。

  《星际争霸》是一款极其复杂的战略游戏,需要玩家高度集中的精神力、超强的灵敏度和战略决策智慧。这款游戏可以充分考验AI的即时战略和人机对抗协作能力。它要求AI学习在资源有限的情况下平衡发展,学会如何发展高科技、出兵种对抗以及如何调兵遣将来保证利益最大化。这些涵盖了AI亟待解决的三大问题:一是在有限视野和不完全信息的情况下做决策,二是平衡短期、中期和长期的发展策略,三是处理多智能体间的合作和博弈。

  纽芬兰纪念大学(Memorial University)的计算机科学教授大卫· 丘吉尔(David Churchill)认为,《星际争霸》是如此复杂,能解决《星际争霸》的AI将能解决任何其他问题。

  为什么研究人员爱让AI玩游戏游戏?

  尽管AlphaGo已经占据国际象棋和围棋的霸主地位,但这不意味着AI已经具备解决实际问题的能力。AI学习玩游戏的方法其实和人类理解游戏的方式并不相同。国际象棋和围棋等游戏规则具有规范性,虽然复杂但规则又很稳定,AI在这种“有限性”的前提下可以发挥它超强计算能力的专长。尽管AI研究者们试图增强AI的通用能力、使AI向人类大脑靠拢,但这一愿景目前仍然只取得了初步进展。

  游戏本身可以模拟人类现实生活场景,通过观察人类行为,事半功倍地实现目标任务,帮助人类在电商和广告行业的个性化营销、资源调度、自动驾驶车辆、无人机等领域做做智能决策。让AI玩游戏,可以为AI的发展带来如下优点。

  1、模拟现实+简化过程

  AI研究员热衷于游戏的一个重要原因,是解决现实世界难以去直接学习和处理的难题。大多数的游戏场景都源于现实世界,是对现实世界的虚拟简化。用游戏训练AI时,研究人员无需考虑硬件的维护问题,不需要拆卸设备,还能轻易调整测试环境,这使得训练新AI算法的难度大大降低。如果在现实生活中让机器人去做相关任务,可能要消耗的财力和时间都是难以估量的。

  游戏有时可以代替真实世界的复杂数据源。比如在2016年,普林斯顿大学的Arthur Filippwicz想要教汽车在不需要人类协助的情况下识别交通信号,为了训练这个算法,他需要收集全面的包含交通信号的图片,包括新、旧、干净、脏乱、有遮挡、强光、雨、雾、黑暗等场景。然而,想要获得这样一套完整的数据集非常费时费力,因此Filippwicz选择借助游戏“侠盗猎车手 V(Grand Theft Auto V)”中描绘的交通信号作为训练集来源,他从中拿到数千张交通信号的照片来让他的AI系统进行学习和消化。

  此外,很多游戏需要不同的认知技能。通过在不同游戏上的训练和学习,可以帮助研究者更好的理解和建立更完善AI系统。

----分隔线----东方都市网----分隔线----投稿:975981118@qq.com 欢迎投稿
东方都市网,上海东方都市网,中国都市网,东方都市网财经频道站http://www.dushi.cx

本网站资讯内容,均来源于合作媒体和企业机构,属作者个人观点,仅供读者参考。 本网站对站内所有资讯的内容、观点保持中立,不对内容的准确性、可靠性或完整性提供任何明示或暗示的保证。咨询联系3455677927@qq.com

相关文章
  • 欢矣畔瘸潭扔Ω哂诜ü

    欢矣畔瘸潭扔Ω哂诜ü

    2018-05-26 03:03

网友点评