清华团队重磅发现:机器人正迈向“ChatGPT时刻”!

每经记者 蔡鼎 每经编辑 兰素英

如果将人工智能(AI)比作孩子,那么Scaling Law(以下简称规模法则)就是其成长密码;只要“孩子”被给予足够的“营养”,即数据、模型和算力,他就能茁壮成长。2020年,OpenAI发表论文《神经语言模型的规模法则》,为大语言模型的出现奠定了语言基础。因此规模法则也被视为人工智能的基石。

如今,规模法则正在引领机器人领域开启新世界的大门。

清华大学交叉信息研究院(以下简称IIIS)研究团队近日在预印本网站arXiv发布的论文《机器人操作模仿学习中的数据规模法则》显示,在数据规模法则下,机器人实现了真正的零样本泛化,无需进行任何微调就能泛化到全新的场景和物体,成功率高达90%。所谓泛化,指的是一个模型或算法在处理未曾见过的新数据时的表现能力。

该团队的发现表明,只要有足够的数据,机器人就能像ChatGPT理解语言一样,自然地理解和适应物理世界。一时间,外界对人形机器人可能迎来“ChatGPT时刻”议论纷纷。连Google DeepMind的机器人专家Ted Xiao都称,其对机器人大模型时代具有里程碑意义。

针对这项最新研究,《每日经济新闻》记者(以下简称NBD)于11月4日晚间专访了该论文的作者之一、清华大学IIIS四年级博士生胡英东。

胡英东博士重点研究嵌入式AI,这是机器学习、机器人和计算机视觉交叉的前沿领域。他研究了开发通用机器人系统的基本挑战,这些系统可以有效适应和概括他们在不同的、非结构化的现实世界环境中的学习行为。

机器人将更好适应环境

火锅店倒水、公园叠毛巾、电梯内拔插头……在清华大学IIIS研究团队最新进行的研究中,便携式手持夹爪UMI在8种从未见过的环境中展现出了超强的适应能力。

ChatGPT的问世验证了规模法则的“智能涌现”能力——规模越大,效果越优。要提升模型效果,就需要不断扩大参数规模、训练数据量、计算资源的规模。但机器人领域尚未建立全面的规模法则,因而未能取得深度学习领域那么快的发展。

为了探究数据规模法则,清华大学IIIS研究团队设计了物体泛化、环境泛化及环境-物体组合泛化三大维度,通过系统调整训练数据规模,全面评估适当的数据规模能否产生可在任何环境下对几乎任何物体进行操作的机器人策略。

利用真实环境下收集的超过4万条人类演示数据,以及严格评估协议下进行的超15000次实机测试,该团队发现,策略的泛化性能与环境和训练时接触的物体数量呈现显著的幂律关系,即其中一个量的相对变化会导致另一个量的相应幂次比例的变化,且与初值无关。

当环境多样性足够丰富时,在单一环境中过度采集不同操作物体的数据所带来的效用将变得微乎其微。而且,单个物体的演示数据很容易达到饱和,总演示数据达到800次时,性能就开始趋于稳定。该团队认为,每个物体有50次演示效果就基本能达到期望的泛化水平了。

最终的任务测试表明,在8种全新的场景中,机器人的成功率高达90%。这意味着机器人实现了真正的零样本泛化,可以无需进行任何微调就能泛化到全新的场景和物体。

也就是说,团队的发现表明,只要有足够的数据,机器人就能像ChatGPT理解语言一样,自然地理解和适应物理世界!而且,这也简化了数据收集工作,以前可能需要几个月才能完成,现在只需要几天甚至一个下午。

NBD:您能否分享一下,是什么促使团队去探索具身智能领域的数据规模法则?是否受到了大语言模型规模法则的影响?

胡英东:是的,我们对数据规模法则的探索确实部分受到大语言模型的启发。大模型中规模法则已经成为当今最基本的原则之一,它包括三个维度:数据、模型和算力。在探索模型和计算规模法则之前,理解数据规模法则是至关重要的。

NBD:能否用通俗的语言解释一下数据规模法则?

胡英东:我们发现,数据规模法则展示了机器人策略在新环境中的性能与训练中的环境和物体数量之间的幂律关系。简单地说,训练中包含的环境和物体数量越多,泛化性能越好。

NBD:论文中提到,提高数据质量可能比盲目增加数据量更重要。那么,您认为如何才能有效地提高数据质量呢?是否有具体的方法或策略?

胡英东:数据质量有很多方面,但我们主要关注数据的多样性。我们发现,在资源有限的情况下,在更广泛的环境和物体中收集人类演示比在特定环境中使用特定物体收集更多演示带来的效果更好。

尚不足以实现商业化

尽管IIIS团队的研究表明,只需投入相对较少的时间和资源,就有可能学习到一种可在任何环境和对象中零距离部署的单任务策略,但在现实中,要完成洗衣服、叠衣服等一些在人类看来非常简单的任务,AI依然面临不小的难度。

论文也指出,目前的工作还有一些局限性,他们只关注了单任务策略的数据规模,并没有探索多任务的通用性,因为这需要从数千个任务中收集数据。除了数据规模,IIIS团队还在模型规模化方面有三个重要发现:视觉编码器必须经过预训练和完整微调,缺一不可;扩大视觉编码器的规模能显著提升性能;扩大扩散模型的规模没能带来明显的性能提升,这一现象最让人意外。

为了激励更多的研究人员就此进行探索,团队还公布了其代码、数据和模型,希望业界最终开发出能够解决复杂问题的通用机器人。

NBD:你们的研究发现,通过适当的规模法则,单任务策略可以应用于任何新环境和同一类别中的任何新对象。这是否意味着一旦机器人掌握了足够的数据,它们就不需要进一步学习了?

胡英东:这并不意味着机器人不再需要学习。虽然目前有90%的成功率,也让人印象深刻,但对于商业化和家庭使用仍然不够,我们需要达到99.9%以上的成功率,毕竟你不会希望一个机器人在倒水的时候有10%的概率打破你的杯子。

NBD:机器人在学习大量数据后,能够适应各种环境。这是否预示着未来很可能会出现通用机器人?

胡英东:我相信我们将来会看到通用机器人,我不能准确预测是什么时候。我们的研究只探索了数据规模,正如我之前提到的,我们还没有完全研究模型和计算规模,仍有许多重要的研究问题需要解决。

未来值得期待

在学界的努力之外,企业界也在专注于将通用人工智能引入物理世界,旨在开发大规模人工智能模型和算法,为机器人提供动力。

OpenAI就是其中之一。11月4日,Meta增强现实眼镜Orion团队的负责人凯特林·卡林诺夫斯基在社交媒体上宣布,其已经加盟OpenAI,领导机器人和消费者硬件团队。他在帖子中表示,这份新工作最初将关注OpenAI在机器人领域的工作以及相关的合作,帮助AI“进入物理世界”,解锁对人类的好处。

同日,OpenAI被曝还参与了机器人AI初创公司Physical Intelligence的4亿美元融资轮。本轮融资由亚马逊创始人Jeff Bezos、Thrive Capital和Lux Capital领投。

Physical Intelligence在博客文章中提到,过去八个月里,他们一直在为机器人开发一种“通用”的人工智能模型。Physical Intelligence希望这个模型能成为他们实现最终目标——开发人工通用智能(AGI)的第一步。AGI是指在各种任务上达到或超越人类智能的人工智能技术。

NBD:一些文章将你们最新的研究发现称为“人形机器人的ChatGPT时刻”,您对此有何看法?这个时刻是否已经到来,还是需要更多的技术突破?

胡英东:我并不认为我们已经达到了“人形机器人的ChatGPT时刻”,尽管我们正在朝着这个目标快速前进。ChatGPT的一个关键特征是其非凡的泛化能力,它能够在几乎任何用户定义的任务中表现良好。虽然我们强调机器人对新环境和新物体的泛化能力,但主要的区别在于我们的模型还不是真正通用的,不能处理用户可能给出的各种各样的指令。

NBD:研究已经在多个现实场景中得到了验证,那么您认为这些实验结果有一天能转化为实际应用吗?

胡英东:我相信我们研究的这项技术最终会进入日常实际应用,例如,用于餐馆的服务机器人。更有意义的是,这样的机器人可以应用于养老院,以协助老年人护理,这将是特别有价值和影响的。

平台声明:该文观点仅代表作者本人,号外财经仅提供信息存储空间服务。发布者:号外财经,转转请注明出处:https://www.qinjiong.com/2024/11/07/23979.html

(0)
号外财经的头像号外财经
上一篇 2024年11月7日 上午10:21
下一篇 2024年11月7日 上午10:22

相关推荐

  • 渐冻症抗争者蔡磊发布声明:以后再有造谣侮辱诽谤情况,将直接启动法律程序

    新浪科技讯 9月6日消息,渐冻症抗争者、攻克渐冻症慈善信托创立者蔡磊今天通过微博发布《关于近期网络谣言的严正声明》。声明表示,对于无端的侮辱、诽谤、造谣,将采取法律手段维护自身合法权益,并呼吁平台加大监管力度,构建一个基于事实和尊重的网络生态,共同维护网络空间的清朗与秩序。 声明强调,本次为官方唯一公开澄清,今后若再有类似子虚乌有的造谣、侮辱、诽谤情况发生,…

    2024年9月6日
    4300
  • 吴京刺激战场新片上映

    近日,娱乐圈内一则新闻引起了广大网友的关注与热议。久未露面的吴京,在 7 月 20 日于新疆的某活动现场现身。然而,他此次的亮相可谓是让众人瞠目结舌,与以往大家熟悉的“战狼”形象大相径庭,这一变化瞬间在网络上掀起了轩然大波。 活动现场,吴京的身影一出现,就让现场和关注着的网友们惊掉了下巴。只见他身材明显发福,以往那清爽利落的短发不见了,取而代之的是一头长发,…

    2024年7月28日
    4000
  • 数说渔业全产业发展

    4月24日上午,山东省政府新闻办举行“数说山东看发展”经济主题系列新闻发布会,介绍2023年山东省海洋经济发展情况。会上记者获悉,2023年,山东省海洋生产总值17018.3亿元,居全国第二位;全省15个海洋产业实现增加值7620.4亿元,连续四年居全国首位。 海洋经济持续向好,发展质量稳步提升 2023年山东省海洋生产总值17018.3亿元,居全国第二位,…

    2024年8月27日
    4600
  • 王洪喆|重访卢德歌谣:活劳动的未来主义

    卢德运动为今天应对技术变革下的失业问题提供了重要的历史参考,尤其是在关怀弱势群体和提供经济扶助措施方面。   阿尔弗雷德·埃尔摩(Alfred Elmore, 1815-1881)绘《织布机的起源》(The Origin of the Stocking Loom),诺丁汉城市博物馆和美术馆(Nottingham City Museums &am…

    2024年10月16日
    2100
  • 大量阴阳评论刷屏 昭通苹果果农直播间:“不卖拦路果”

    凤凰网科技讯(作者/李信臻) 9月28日,近日网上流传一则视频显示,云南昭通果农把苹果摆成一排堵在路上。司机被逼停后引发冲突。当地官方27日发布通报称情况属实,已对相关人员进行传唤。 凤凰网科技发现,在网络上售卖昭通苹果的直播间,出现大量“阴阳评论”。如“不是拦路果不买”,“一二三上马路”,“去路中间直播”等等。有的直播间甚至贴出“友军”“不卖拦路果”的牌子…

    2024年9月28日
    3800

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信