人工智能击败人类,就能说人工智能足够好了么?

栖号:https://www.aliyun.com/#module-yedOfott8
第一手的上资讯,不同行业精选的上云企业案例库,基于众多成功案例萃取而成的最佳实践,助力您上云决策!

1.衡量标准

人工智能击败人类,就能说人工智能足够好了么?

测量AI的智能是计算机科学领域中最棘手但最重要的问题之一。 如果大家不知道自己建造的机器今天比昨天的机器聪明,大家如何知道自己正在取得进步?乍一看,这似乎不是问题。一个答复是:显然,人工智能正在变得越来越智能。只要看看涌入该领域的所有资金和人才。查看里程碑,例如在Go上击败人类,以及十年前无法解决的应用程序,这些应用程序如今很常见,例如图像识别。进展如何。另一个答复是,这些成就并不是衡量智力的好标准。

人工智能界需要重新关注什么是智能,什么不是智能。如果研究人员想要在通用人工智能方面取得进展,就需要超越诸如视频游戏和棋盘游戏之类的流行基准,并开始思考实际上使人类变得聪明的技能,例如我们的概括和适应能力

2.什么是智能

人工智能击败人类,就能说人工智能足够好了么?

AI领域的两种不同的智能概念。一种将智能表示为在各种任务中表现出色的能力,而另一种则将适应性和概括性放在优先地位,这是AI应对新挑战的能力。在该领域的前30年中,最有影响力的观点是前者:将情报作为一组静态程序和明确的知识库。现在,钟摆朝着相反的方向摇摆了很多:在AI社区中,将智力概念化的主要方法是空白,或者用一个更相关的比喻,是新初始化的深度神经网络这个框架在很大程度上没有受到挑战,甚至没有受到审查。这些问题有很长的学术历史实际上是几十年,而我今天在该领域对此知之甚少,这也许是因为当今从事深度学习的大多数人都是在2016年之后加入该领域的。

拥有这样的知识垄断绝对不是一件好事,特别是作为对理解不充分的科学问题的解答。它限制了提出的一系列问题。它限制了人们追求的思想空间。我认为研究人员现在已经开始意识到这一事实。关键是,一旦大家选择了一个度量,就将采取一切捷径可用。例如,如果大家将下棋游戏作为大家的智力衡量标准,大家最终将获得一个下棋系统,仅此而已。没有理由认为这对其他任何事情都有利。大家最终会进行树搜索和最小极大化,但这并不会告诉大家有关人类智能的任何知识。如今,在诸如Dota或StarCraft之类的电子游戏中寻求技能来代替一般情报,就陷入了完全相同的智力陷阱。

3.什么地方的应用才正确

人工智能击败人类,就能说人工智能足够好了么?

这也许并不明显,因为在人类中,技能和智力是密切相关的。人脑可以利用其一般智慧来获取特定于任务的技能。一个真正擅长国际象棋的人可以被认为是非常聪明的,因为我们隐式地知道他们从零开始,必须使用他们的一般智慧来学习下棋。他们不是为了下棋而设计的。因此,我们知道他们可以将通用情报指导其他许多任务,并学会有效地类似地完成这些任务。这就是一般性。

但是机器没有这种限制。绝对可以将机器设计为下棋。因此,我们为人类所做的推论-“可以下棋,因此必须是聪明的”-被推翻了。我们的拟人化假设不再适用。通用情报可以生成特定于任务的技能,但是没有从特定任务到普遍性的反向路径。完全没有因此,在机器中,技能与智力完全正交。只要大家可以采样有关任务的无限数据(或花费无限数量的工程资源),就可以在任意任务上获得任意技能。但这仍无法使大家更接近一般情报。

关键的见解是,没有什么任务可以使高技能成为智力的标志。除非该任务实际上是一个元任务,否则它涉及在以前未知问题的广泛[范围]中获得新技能。这正是我提出的情报基准。如果这些当前基准无法帮助我们开发具有更通用,更灵活的智能的AI,那么为什么它们如此受欢迎?

4.击败人类

人工智能击败人类,就能说人工智能足够好了么?

毫无疑问,在特定的知名视频游戏中击败人类冠军的努力主要是由这些项目可以产生的新闻报道推动的。如果公众对这些浮华的“里程碑”不感兴趣,这些里程碑很容易被误认为是迈向超人通用AI的步骤,那么研究人员将在做其他事情。因为研究应该解决开放的科学问题,而不是产生公关。如果打算使用深度学习以超人的水平“解决”《魔兽争霸III》,那么你可以肯定的是,只要我有足够的工程人才和计算能力大约是数十万美元,我就能到达那里。数百万美元的任务。但是,充其量,会掌握有关扩展深度学习的工程知识。因此,我并不真正将其视为科学研究,因为它没有教给我们任何我们不知道的东西。它没有回答任何未解决的问题。如果问题是我们可以在超人的水平上玩X吗?,答案肯定是:是的,只要大家可以生成足够密集的训练情况样本并将其输入到具有足够表现力的深度学习模型中即可。

这些高技能的游戏系统代表着朝着可以处理现实世界的复杂性和不确定性的AI系统的真正进步的争论正如OpenAI在其Dota的新闻稿中所声称的那样2人玩的机器人OpenAI。如果他们这样做的话,那将是一个非常有价值的研究领域,但事实并非如此。以OpenAI Five为例:它无法处理Dota 2的复杂性,因为它训练有16个字符,并且不能推广到拥有100个字符以上的完整游戏。它在超过45,000年的游戏玩法中接受了培训-再次提醒大家,培训数据需求与任务复杂性如何组合增长-但是,最终的模型证明非常脆弱:非冠军的人类玩家能够找到可靠地击败它的策略在AI对公众开放之后的几天。

5.不公平

人工智能击败人类,就能说人工智能足够好了么?

简而言之,我们需要停止评估事先已知的任务(例如国际象棋,Dota或《星际争霸》)的技能,而应开始评估技能习得能力。这意味着仅使用预先不为系统所知的新任务,测量有关系统开始执行的任务的先验知识,并测量系统的采样效率即学习此过程需要多少数据。为了达到给定的技能水平,所需的信息先验知识和经验越少,大家就越聪明。如今的AI系统实际上根本不是很智能。

另外,我认为我们的智力测度应该使人的相似性更加明确,因为可能存在不同类型的智力,而当我们谈论一般智力时,我们实际上就是在隐含地谈论类人的智力。这涉及试图了解人类天生具有哪些先验知识。人类的学习效率令人难以置信,他们只需要很少的经验就能掌握新技能,但是他们并不会从头开始。除了一生积累的技能和知识,他们还利用先天先验知识。

原文发布时间:2019-12-20
本文作者:Steven博
本文来自阿里云云栖号合作伙伴“Steven博”,了解相关信息可以关注“Steven博”

云栖号:https://www.aliyun.com/#module-yedOfott8
第一手的上云资讯,不同行业精选的上云企业案例库,基于众多成功案例萃取而成的最佳实践,助力您上云决策!