7月4日至7日,2024世界人工智能大会暨人工智能全球治理高级别会议(WAIC 2024)在上海举行。4日下午一时许,实时气温高达38℃,但火热的天气并未影响市民的观展热情,世博展览馆外的观众排成长龙。
另一边,展馆内部同样火热。据介绍,本届世界人工智能大会汇聚了9位图灵奖、菲尔兹奖、诺贝尔奖得主和88位国内外院士,涵盖AI伦理治理、大模型、数据、算力、具身智能等十大重点议题。
新技术、新产品琳琅满目,《每日经济新闻》记者在大会现场观察到,除了现实版的“百模大战”,本届WAIC最“吸睛”的部分还要数展馆内的25款人形机器人和四处“巡逻”的机器犬。
值得注意的是,25款人形机器人中,有不少都是首次在WAIC亮相的新面孔。比如本次展会现场发布的全球首个全尺寸开源公版人形机器人青龙、特斯拉首发的Optimus二代、达闼带来的人形双足机器人XR4以及傅利叶、乐聚等知名企业的旗下新品。
图片来源:每经记者 黄海 摄
AI浪潮奔流不息,智能终端接连落地。WAIC走到第七个年头,当人工智能从单一的信息处理走向更加复杂多维的场景领域,一个具身智能的新时代已初具雏形。
“人形机器人”百花齐放
从上海世博展览馆南门踏入会场,首先映入眼帘的是两排“样貌”各异的人形机器人。共计18个展出品中,汇聚了包括人形机器人(上海)有限公司、开普勒、傅利叶、达闼、宇树等多家明星企业的机器人产品。本次展会也别出心裁地给这个“机器人天团”起了一个名字——十八金刚。
其中,人形机器人(上海)有限公司旗下的青龙于WAIC2024期间首发问世,是国内首个全尺寸开源通用人形机器人公版机,具备高机动下肢行走标配与轻量化高精度上肢作业标配,支持快速行走、敏捷避障、稳健上下坡和抗冲击干扰等四大运动功能。
展馆内部更是精彩纷呈,在一号展馆内,数十款智能机器人、25款人形机器人各显神通,吸引着观众们驻足拍照。
随处可见的“具身智能”四个字,成为人形机器人展区的关键词。所谓具身智能,援引英伟达创始人黄仁勋的观点,就是能理解、推理,并与物理世界互动的智能系统,是人工智能的下一个浪潮。
作为具身智能的终极形态,人形机器人被业内认为是继智能手机和互联网之后的下一个风口。在推动人形机器人走向具身智能的过程中,各家企业的思路不同,但大多殊途同归。连续迭代的AI模型,加上日新月异的传感技术,让人们关于具身智能时代的想象不断具象化。
在达闼机器人展区,5台达闼人形智能服务机器人摆动双手和头部,随着音乐舞蹈。后方的显示屏内,除了5个机器人形象外,还有一位“领舞”的数字人。据现场工作人员介绍,这正是达闼为产品搭载的虚拟机器人功能。“我们在机器人的云端大脑驱动了一个虚拟机器人,可以实时映射,模仿虚拟机器人的动作。”
图片来源:每经记者 黄海 摄
不远处的傅利叶展台,进阶升级的人形机器人GR-1及下肢外骨骼机器人ExoMotus M4也吸引了不少观众驻足。
据傅利叶方面介绍,与2023年推出的GR-1相比,升级后的GR-1首次将纯视觉方案应用于人形机器人上,融合BEV(一种以视觉为中心的感知算法)+Transformer技术(利用注意力机制提高训练速度的模型)+OCC(基于深度学习的障碍物检测和分割技术),基于RGB(红绿蓝三色通道)摄像头采集的数据,生成全局环境视图,全面感知和理解周围环境。
除了传感器,发展迅猛的大模型技术正在帮助人形机器人补齐“判断”的短板。
“机器人做三个事儿——感知、决策和控制,感知和控制现在有了,其实很难做的是决策。之前都是专有化编程,大模型出来以后,实际上就是为机器人做任务级的动作规划⋯⋯由命令型的运动变成了自主的运动⋯⋯”今年,乐聚机器人带来了国内首款可以跳跃的人形机器人,在提及大模型对机器人的赋能时,乐聚机器人苏州公司总经理王松如此说。
智能终端集中落地
“主要应用于什么领域?”“售价多少钱?”“什么时候可以量产?”本届WAIC期间,这三个问题,几乎是所有机器人展商都会面临的“灵魂三问”。
《每日经济新闻》记者多方采访后发现,目前,大部分人形机器人都有了量产计划,售价从几十万元到一百余万元不等,应用领域则集中在制造行业、服务行业、医疗行业、教育行业以及建筑工程行业。
比如本次亮相的特斯拉Optimus二代机器人,此前特斯拉首席执行官马斯克曾公开表示,特斯拉打算从2025年开始限量生产其自主研发的Optimus机器人,以供给特斯拉工厂使用,从而进一步提升生产效率和自动化水平。预计到明年,特斯拉工厂中将有超过1000个,甚至可能数千个Optimus机器人投入运营。
图片来源:每经记者 黄海 摄
国内企业方面,达闼推出的最新一代人形机器人XR4,具有模仿学习和基于数字孪生的强化学习能力,可应用于工业制造、家庭养老和商业服务等多个领域,目前已开启预售,价格39.9万元起;乐聚机器人旗下的夸父系列机器人已实现产业化落地,主要应用在科研合作、工业服务、展厅讲解等场景,售价60万元起步。记者还从傅利叶处了解到,升级后的GR-1预计在一到两年后可以实现技术落地。
除了人形机器人,部分搭载AI大模型的智能终端也是本届WAIC的明星展品。作为本届展会上唯一一家聚焦教育领域的科技公司,猿辅导旗下猿力科技的展区,吸引了不少家长带着孩子前来观展。
记者在展会现场了解到,猿力科技大模型技术已覆盖对话辅导、口语陪练、阅读理解等面向家庭教育端的应用场景,以及作业批改、学情分析、答疑辅导等服务于政府和学校端的教育应用场景。
一直以来,智能终端的发展始终面临着端侧算力的桎梏。据猿力科技方面介绍,搭载AI大模型的学练机采用了端侧AI识别与笔记智能分析技术、云端大模型技术相结合的模式。
从整个智能终端的行业侧来看,端侧+云端协作也是大部分智能终端与大模型合作的主流模式,其中,最典型的产品要数AI PC和智能汽车。
记者从智谱AI了解到,目前,AI PC落地的场景还比较简单,例如简单的系统控制,对音量、亮度进行调节,简单的文档交互以及简单的文生图等。“AI PC其实强调的是一个入口的问题,目前局限于端侧大模型的算力,其应用场景会比较简单,但如果未来能力得到进一步发展,能做的事就比较多。”