动物vsAI奥运会你会赌一只鸟还是机

我们不得不面对AI的一个事实:如今的人工智能,其实智能的成分很少。在事先明确环境和问题的前提下,基于算法和大数据的深度学习,人工智能系统的确都能有不错的表现。

这就是为什么谷歌AlphaGo以4:1战胜围棋世界冠军、职业九段棋手李世石;汉森机器人索菲亚能对着你口吐莲花,以“就像活人的AI”招牌狂言想要毁灭人类。

AI研究的真实状态其实远远落后于我们所相信的技术神话。虽然大多数研究成果是真实的,但有很多是借助人工智能话题的炒作。

我们对于AI的最终梦想,是让机器拥有自主思考能力并非“培训考核”。检查机器是否真的拥有智能,让机器通过图灵测试就可以,但直到今天图灵测试依然没有被突破,这或许是件好事也是件坏事。如果我们不以更健康的现实主义和怀疑态度对待人工智能,那么这个领域或许永远停留在车辙中。

近期刚拉开序幕的,由英国帝国理工学院和剑桥大学共同组织的“动物vsAI奥运会”是一项有趣的竞赛实验。更有嚼头的是,就像组织者成员之一MatthewCrosby所说的那样,这场竞赛对于参与者和创办者都是不可控且极具颠覆的。

真正的竞赛,最终赛场布置只能“当天见”

较新的AI“培训课程”正在使用随机生成的环境进行测试和开发,正如这场“动物vsAI奥运会”。

竞赛组织已经公布大约50项关于动物的智能文献研究,参赛队伍即可根据公开的大量培训环境和对象进行AI动物智能体的“大脑”构建。

这是一个泛化的挑战,所以在训练测试中他们必须以不同的方式使用对象,同时也要使对象学会适应环境。挑战者们需要自己进行场景设置和互动,最终提交一个像动物一样进行食物猎取活动的智能体。

“这场比赛的重点是AI没见过的任务,所以最终比赛现场什么样,只有当天才知晓。”赛事组织者之一MatthewCrosby说。虽然不能对最终比赛进行“泄题”,但是在50项关于动物的智能文献研究中潜藏着一些有趣的例子供参赛者构建AI智能体的大脑。

模拟动物获得的智能体示例图例如一个经典的实验,在动物面前倒置一些不透明的杯子,在其中一个杯子下放了一些食物,动物的任务是取回食物。起初每次都把食物放在A杯(相当于训练阶段),然而在最终比赛现场,这个食物会被放在B杯下。对于有些动物,比如黑猩猩,他们会直接选择B杯,但有些动物会选择A杯,因为他们通过记忆学习完成这项任务。

再例如一个从伊索寓言中汲取灵感得到的实验:一只乌鸦能学会叼起岩石投入水中,使水位上升到足够。但在实验中,可以设置既有岩石也有软木块的环境,乌鸦要学会选择岩石而不是软木塞投入水中。

“这些测试捕获了人工智能研究中很多被认为相当困难的元素,比如推广知识、转移学习、综合新信息、甚至可能创造性解决问题。参赛者们要面对大量不同环境的训练集,以应对最终未知的竞赛场景。”MatthewCrosby解释道。

乌鸦在面对水和沙子时能做出正确选择“10项关卡”见分晓,AI想赢不容易

比赛共分为十个等级,测试是否成功取决目标实现程度。对大多数动物来说,能解决的是基础范围,只有少部分动物能解决的是困难且等级高的实验。

“觅食测试”是入门测试。可以考验AI智能体获取食物的能力,短时间能获取食物越多则越强。

“偏好测试”,则进一步考核智能体的则优能力。尽管对于不同动物来说会存在方式差异,但几乎所有动物都会用最简单高效的方法获得食物,其中有些动物对最有益的长期行为作出复杂的决定。

“障碍测试”、“弊害测试”、“空间推理测试”、”内部模型测试“,将从智能体的行动、规避风险、导航规划、视觉输入记忆上考研智能体的多项能力。

AI智能体也要面对和狗一样类似的障碍测试“泛化测试”,这一级包括一些看起来与之前测试有所不同的环境,但解决方式还是一样的,不挑剔的智能体才有希望通关。

“物体存继性测试”,当一个物体从视野中消失,很多动物都能理解它依然存在的,这是人类认知范围能理解但AI不能的,如果不能理解这一特性,很多简单的人机交互就很难实现,开发者如何将这一点编制进AI将是竞赛一大亮点。

“高级偏好设置”,意味着智能体通过更复杂的决定获取更高级别的奖赏。

“因果推理测试”作为最终测试,希望看到智能体提前策划并在未实施之前就能预想到结果的能力。这种测试已经在一些动物身上得到验证。

如今这场虚拟奥运会比赛上线,奖金达到3.2万美金,比赛最终结果会在年12月公布。到那时我们才会清楚地了解现代人工智能否比乌鸦、狗或黑猩猩更聪明。这段等待的时间能发生什么还是令人无比期待的。

竞赛场地模拟图这场虚拟奥运是AI的一次突破机遇

假设我们看到一条新闻,例如“某某AI智能体达到了老鼠的水平”,大多数人可能不为所动甚至嗤之以鼻:达到区区一个老鼠的智能水平算什么。要真算起来,离动物们我还差得很远。

最先进的AI可以超过人类成为最好的围棋选手,最好的医生,甚至智力竞赛冠军,但依旧无法与简单的动物竞争,以适应环境中的意外变化。通常AI基准测试涉及掌握单个任务,没有自由意志,也没有意识,它们仅仅是遵循智能人员定义的流程的产品,不能自己做决定。

网红机器人Sophia是否是人工智能炒作的产物我们最好的机器学习算法通常只是记忆和运行统计模型,几乎任何自动执行某项操作的计算机程序都被称为AI。比如在围棋比赛中击败一个大师,机器被学习规则,从对手的视频里“偷师学艺”再“过河拆桥”。

比如深度学习和神经网络在内的机器学习中,人们通过算法以及标记包含大量训练的数据集,不断训练机器直到它可以自己完成任务。再如面部识别软件,从数千张面部照片或视频送入系统,直到它可以更准确的从未标记的样本中检测到面部。

但将以上相同的AI系统应用于完全不同的任务时,它们就会变成一个“废物”。这些缺陷对AI的研究人员来说并不是秘密,不过这些机器学习系统常常会被吹捧为人工智能最前沿的成果。事实上,他们并没有真的智能。

一只乌鸦会把岩石投入容器中,使水面上升解决口渴问题。狼群必须要在广阔的荒野中学会自食其力。动物们面对的大多数问题并没有明确定义的环境,也没有具体的数据库去跑程序,并有检查纠错总结经验。

这就是动物和AI较量的虚拟奥运会提出的AI要实战的两个问题:如何做到强化学习的泛化能力?当前的强化学习算法和动物学习之间有多大的差异?

这场竞赛的10级测试,均在不同的动物身上得到测试,AI智能体想要战胜动物,不仅要完成而且效率成果还更突出。对于泛化能力还未有突出效果的AI研究领域来说,想要赢得这场比赛真的不容易。

竞赛组织成员MatthewCrosby表示:“虽然我们都希望AI能在这场比赛中表现的优秀一点,但就算都失败这也不是一次性竞赛。我们希望用AI制造一个像动物的智能体,它总是想方法获得最多的食物,当不易获取食物时,它也应该热衷于探索环境,并在面对多种可能性的环境里做出明智的决定。”

在到达人脑之前,AI不得不先经过动物世界的考验。




转载请注明:http://www.aierlanlan.com/rzdk/3883.html

  • 上一篇文章:
  •   
  • 下一篇文章: 没有了