WAIC机器人告别“拘谨”,腾讯张正友称“iPhone时刻”未至
2025世界人工智能大会暨人工智能全球治理高级别会议(WAIC)刚刚闭幕,会议期间宇树的机器人很忙。
在世博展览馆,机器人忙着拳击。转眼,它出现在腾讯展台,又走上论坛的舞台,迈向腾讯首席科学家、腾讯Robotics X实验室主任张正友。
机器人看看演讲台,告诉张正友,它看到花束、笔记本电脑和两个麦克风。临下台时,机器人还拒绝了张正友“晚上喝一杯”的提议,说它晚上要加班,引起现场观众欢笑。
本届WAIC上,人形机器人明显没有了去年的“拘谨”,纷纷演示新进化出的能力。不仅打拳、讲话,还打鼓、写书法、扮演工厂分拣工人和便利店店员,并且告别遥控器。张正友告诉记者,上台的机器人搭载了腾讯Robotics X刚发布的具身智能平台Tairos,演示时不需遥控,机器人交互也不依赖预先设定好的程序,背后是算法在跑。
WAIC期间,第一财经记者采访了张正友。作为一个7年前就成立的知名机器人前沿研究实验室负责人,回头看看过去7年的发展和当下的行业,张正友的观点具有代表性。虽然机器人技术演进加快了,但他告诉记者,类比手机,具身智能本体形态现在还没有看到“iPhone”出现。对于商业化,他的态度颇为谨慎。
在WAIC开幕的前一日,记者还采访了优必选副总裁、研究院执行院长焦继超。与研究性质的Robotics X相比,优必选是推动人形机器人商业化的代表。焦继超告诉记者,一两年内比较可能率先规模化部署的是工业搬运类工种。
两名从业者的视角各有不同,不同视角的碰撞下,可以看见更真实的具身智能生态。
“只以人形为标本会限制想象力”
2018年年初,张正友从零开始组建了腾讯Robotics X实验室,这个实验室属于国内科技厂商探索前沿机器人技术最早的一批团队。具身智能热潮下,Robotics X实验室至今未进行真正的商业化,但实验室在业界仍有广泛影响力。
去年9月,该实验室推出机器人小五,探索机器人在人居环境的应用,在此之前,Robotics X还做过足轮机器狗Max,这些都是研究原型。今年在WAIC上发布Tairos具身智能平台,是Robotics X最靠近商业业态的一次。
今年年初,腾讯董事会主席兼首席执行官马化腾定调,公司希望成为机器人厂商的合作伙伴,而不是取而代之做硬件。按照Robotics X的说法,实验室在进行产品化了。
张正友告诉记者,Robotics X和福田实验室联合推出Tairos前,团队已走访了深圳、上海、北京、成都等地60多家公司调研,发现很多企业在硬件方面做得很好,但具身智能仍需要巨大投入。实验室选择向机器人行业开放合作,以模块化方式提供规划、多模态感知和感知行动联合大模型,以及开发工具和数据服务,为机器人装上“大脑”。平台不以赚钱为目的,合作伙伴已有越疆科技、乐聚机器人、众擎机器人、宇树科技等。
从只专注实验室前沿探索,到做更贴近业界的产品,Robotics X的变化也映射了具身智能行业的变化。张正友表示,7年前实验室刚成立时,几乎找不到能做相关机器人硬件的厂家,实验室需要从头开始做软硬件。而2023年下半年起,机器人行业发生很大变化,ChatGPT面世后,大模型关注度上升,很多机器人企业出现,这些企业做机器狗、人形机器人、触觉传感器、灵巧手等。
“形势已经变化。某种程度上讲,我们需要和机器人硬件本体厂商一起打磨具身智能技术,否则会停留在实验室阶段。我们不能做空中楼阁。”张正友说。
但对于是否进一步商业化,张正友较为谨慎。他告诉记者,实验室7年前拟定的大方向A2G(人工智能、机器人本体、精准控制、发育学习、情感理解、灵巧操控、守护天使)几乎没有变化,那时他考虑较多的是前沿技术研究,因为在技术未成熟时,研究不能由产品化引导,否则有过多压力影响研究。
“腾讯要不要做一个机器狗(量产)?从我的角度,不值得做,因为还有更大目标。Robotics X成立之初规划十年目标,现在过去七年,三年以后差不多能达到预想效果。比如养老场景能不能把具身智能核心技术触觉传感器、定制皮肤等往前推进?如果一开始停留在Max机器狗上,就没精力做其他东西。”张正友表示。
从行业发展阶段看,张正友认为,类比手机行业,具身智能行业还没有出现iPhone,甚至还没有到“大哥大”出现的时候,“‘大哥大’虽然贵,但用的人数还是很多。而现在人形机器人大部分还是用于数据采集、科研、导览。未来会有某个领域容纳大量机器人,让成本降下来、进入每家每户,这不用怀疑,在我有生之年就会发生。”
从研究者的角度,对于人形机器人这种颇受关注的形态,张正友的看法是,双足直立是人类在几千万年进化中,应对复杂环境保留下来的形态,但人居环境与以往不同,机器人形态仍需探索。如果只以双足人形机器人为标本,会限制人的想象力。
人形机器人到达关键十字路口
站在商业化人形机器人公司的角度,技术研究和机器人量产则需要同时推进。从业者对落地前景较为乐观。
优必选正在建设产能,今年计划拥有一千台左右的产能,其中人形机器人的交付目标是500台。接受记者采访时,焦继超谈到,一两年内比较有可能规模化部署的是工业场景的搬运工种,一大原因是该场景存在人力缺口,且工作场景对人形友好、工作没有强实时性要求。而在巡检,机器人需要面对锅炉高温或冷库低温,产品形态复杂、硬件性能还需进一步提升。
近期优必选推出面向智能制造场景的工业人形机器人Walker S2,机器人可以自主换电、不间断作业。为了让多个机器人同时作业,该公司在探索群脑智能方案,由云端大脑进行任务协同,经过蒸馏的大模型安装在机器人本体上,则用于快速规划和工具调用。
焦继超称,随着机器人在今年下半年和明年大量出货,以上方案的算法复杂度还需要提升。当前人形机器人处于快速发展的早期阶段,在达到进入千家万户的目标的过程中,现在到了关键的十字路口。随着关键技术突破,预计明后两年将有大量工业场景应用。而目前,随着新一代机器人推出,他感受到压力越来越大,因为客户希望尽快落地,大规模落地则需要不断迭代。
对于当前行业的技术痛点,两名从业者则有一些相似看法。今年多家机器人厂商推出VLA(视觉语言动作大模型)。张正友表示,VLA是操作中比较容易看见效果的方法,但只用到视觉,还没有力觉、触觉。此外,VLA还是通过2D图形来感知,对3D世界缺乏理解。当前VLA还处于初级阶段。
焦继超则表示,VLA作为一种技术架构,是目前在具身智能领域非常热门的技术方向,但目前离落地仍有距离。
张正友认为,具身智能行业需补足的能力还包括对3D世界的认知、将触觉和力感知加入感知行动联合大模型。机器人需要理解3D才能操作,这种世界模型与当前的多模态模型有很大差别。实验室对触觉和力觉已研究数年,但触觉和力觉还没有达到语音、文本这般标准化的程度,需要行业一起努力。
焦继超则看到人形机器人供应链也尚未达到标准化。他表示,供应链尚未成熟,目前已经出现了一部分总成,但由于不同工种的机器人所需的产品参数不同,这些标准化产品不一定总能适用。目前各家方案存在差异,基本上还是要自己设计、找供应商生产。预计未来两年左右,硬件将有更多共识,不再成为瓶颈。
1、特斯拉与三星电子达成165亿美元芯片代工协议,合作持续至2033年,三星特斯拉联名手机
2、国家税务总局:2021年以来查处网络主播偷逃税案件360余起
3、中共中央办公厅 国务院办公厅印发《育儿补贴制度实施方案》