时间:2025-07-28 15:53 作者:翡翠大白菜
智平方亮相WAIC 2025:爱宝多场景多任务演示秀出中国具身智能硬实力
(现场图片)
在生活服务体验区,智平方搭建了一个对标特斯拉餐吧的全场景软饮吧,让爱宝秒变“全能店员”。现场观众可以自由选择自己喜欢的口味和配料,无论是香醇的咖啡、清甜的冰淇淋,还是特调饮料,爱宝都能精准制作。其中,一杯咖啡或冰淇淋的制作时间大约在1分半到2分钟,而饮料则更快,1分钟左右就能完成。
以打冰淇淋为例,当爱宝收到类似“爱宝,我想要一杯冰淇淋”的观众需求时,它就会抬起左手手臂,拿起纸杯,放置到冰淇淋出口下方,右手精准地握住冰淇淋机的手柄,缓缓压下,冰淇淋开始顺滑地旋转落进杯子。等杯子装满后,爱宝立即松开手柄,将冰淇淋递给观众。整个过程动作行云流水、毫无顿挫。
这背后更是智平方在GOVLA大模型上的突破。爱宝能够像人类一样在工厂环境中自由移动,而不是局限于固定工位,自主规划最优路径,灵活搬运不同种类、大小、角度、颜色的箱体。它通过多模态感知精准识别箱体状态,像熟练工人一样把垛码放得整整齐齐。当垛形不规范时,它会智能调整抓取策略;遇到突发状况也能自动纠错,确保作业流程持续运行。
最让现场观众兴奋的,莫过于爱宝在娱乐区的架子鼓表演。随着经典曲目《We Will Rock You》节奏的起伏,爱宝的手臂在鼓面上快速而准确地击打,每0.375秒就能完成一次敲击,鼓与鼓之间的切换仅需0.75秒,堪比一个经过专业训练的鼓手。
爱宝之所以能做到这样快而准,靠的是融入“异构输入+异步频率”创新架构设计的GOVLA大模型。模型架构借鉴了人类的“双系统”思维模式,且把“双系统”模块中的“快系统”嵌入“慢系统”:慢系统负责整体乐曲理解和节奏把控,而快系统则专注于快速、精准的动作执行。它们相互协作,让爱宝既能“听懂”鼓谱,又能毫秒级完成复杂的鼓击动作。
此外,GOVLA大模型的高帧率控制能力(可达200-1000Hz)让整个演奏过程如丝般顺滑,没有延迟。对爱宝而言,乐谱只是一串数据,它可以通过搭载的大模型快速学习掌握新曲目,未来甚至能挑战120 BPM以上的快节奏演奏。据介绍,本次曲目的演示,爱宝只学习了大约24小时。
这场“鼓点秀”让人看到,具身智能不仅能做标准化作业,还能学会需要速度与精准度配合的艺术表现。同时,机器人打架子鼓这一艺术演示,也是智平方探索机器人从实用价值向情绪价值延伸的一种尝试。
三场演示的背后,智平方自主研发的端到端具身大模型Alpha Brain是关键。GOVLA作为Alpha Brain的核心技术,不同于传统机器人分模块控制的方式,它通过统一的模型架构,将多模态信息整合处理,实现了从感知到动作的“端到端闭环控制”。
GOVLA大模型让爱宝拥有全域行动和全身协同能力,突破了传统机器人“固定工位”的局限,以及从简单任务到长程复杂任务的推理能力。而且,GOVLA大模型快慢系统融合的创新设计,有效解决了复杂推理与快速行动难以兼得的难题,让爱宝机器人能够实现即想即动零延迟。
从展会舞台走向产业落地
WAIC上的三大演示只是爱宝能力的缩影。作为中国具身智能的“产业派”,智平方从不止步于技术展示,而是将核心技术真正投入到高强度的产业场景中。
生物科技领域同样是智平方的重要突破口。今年4月,智平方与华熙生物携手,正在合作部署爱宝执行无菌车间的物料转运、智能拆包和视觉检验等操作,替代人工在高风险区域的重复性劳动,有效降低交叉污染风险,并通过大模型的快速学习能力适应多变的工艺流程。
在半导体制造中,爱宝已进入吉利科技旗下晶能微电子生产基地,通过超强的跨任务泛化性能,高效执行上下料、产线间物料转运等任务。今年,智平方也将和晶能微电子一起,推动爱宝在半导体制造场景的大规模使用。
除了工业场景,智平方还将业务拓展到公共服务领域。今年第三季度,爱宝将首次进入国内一线城市的机场,展现其在开放复杂环境下的自主行动和多任务处理能力。
智平方创始人兼CEO郭彦东博士曾说:“通用智能机器人会像智能手机和智能汽车一样,成为人们生活中不可或缺的智能终端。”如今,这一愿景正在一步步走进现实。
1、广州开幕,深圳闭幕!十五运会开闭幕式将呈现这四大特点,十五运会举办城市
3、吉林奏响区域协调发展奋进曲(活力中国调研行),吉林区域发展战略的阐述