一年一度的“AI春晚”来了。当地时间3月18日,英伟达在GTC(GPU Technology Conference)2024大会上发布了人形机器人通用基础模型Project GR00T,以及一款基于NVIDIA Thor系统级芯片(SoC)的新型人形机器人计算机Jetson Thor;还对其机器人平台 NVIDIA Isaac™ 进行了升级,包括生成式AI基础模型和仿真工具,以及AI工作流基础设施等。
《每日经济新闻》记者从英伟达处获悉,GR00T驱动的机器人(Generalist Robot 00 Technology)将能够理解自然语言,并通过观察人类行为来模仿动作——快速学习协调、灵活性和其它技能,以便导航、适应现实世界并与之互动。
Project GR00T 是一种多模态人形机器人通用基础模型。 图片来源:企业供图
而Jetson Thor则是一个全新的计算平台,能够执行复杂的任务并安全、自然地与人和机器交互,具有针对性能、功耗和尺寸优化的模块化架构。该SoC包括一个带有transformer engine 的下一代GPU,采用 NVIDIA Blackwell架构(英伟达与此次在GTC推出的用于万亿参数级生成式AI的架构),可提供每秒800万亿次8位浮点运算AI性能,以运行GR00T等多模态生成式AI模型。
在GTC大会的主题演讲中,英伟达创始人兼首席执行官黄仁勋直言:“开发通用人形机器人基础模型是当今AI领域中最令人兴奋的课题之一。”另外,据英伟达方面透露,公司正在为领先的人形机器人公司开发一个综合的AI平台,如1X Technologies、Agility Robotics、Apptronik、波士顿动力公司、Figure AI、傅利叶智能、Sanctuary AI、宇树科技和小鹏鹏行等。
值得关注的是,人形机器人商用难一直是制约行业发展的重要因素之一。谈及未来应用场景,英伟达相关负责人在3月18日的媒体吹风会上回答《每日经济新闻》记者提问时指出,目前关于人形机器人的应用场景还处于非常早期的阶段,焦点主要集中在制造业领域,以应对劳动力短缺等问题。随着时间推移,预期在服务行业中将会出现更多的应用场景。
不过,上述负责人也表示,在过去的十年到二十年中,很多关于人工智能和机器人的研究都集中在解决机械技术方面的问题上,而这些问题已得到了相对妥善的解决,尚未解决的是人工智能方面的挑战:几乎所有机器人的感知,即使使用了人工智能技术,也是基于传统的卷积神经网络和深度学习方法;规划、控制和轨迹的处理一直在采用传统的技术,这需要大量的计算资源。如今,借助大型语言模型就可以解决这些问题。
“为什么人形机器人突然变得如此重要,原因就在于生成式人工智能的应用。”据该负责人介绍,通用基础模型可以用来训练从感知到规划、轨迹等各个方面的功能,无论是来自文本、语音、视频还是演示的输入,都可以用大量的数据来训练。至于开源方面,上述负责人称,英伟达支持(开源),用户可将模型引入其中,在仿真环境或现实世界中进行微调、定制和重新训练基础模型。