银河通用突破具身机器人核心技术——
聪明“脑”指挥灵巧“手”
取药、挂衣服、开瓶盖,在日复一日大数据加持的交互学习中,具身大模型机器人训练出决策的“大脑”和执行的“小脑”,指挥日渐灵巧的“手”,能够独立完成越来越多的工作。
北京银河通用机器人有限公司(以下简称“银河通用”)专注具身智能机器人研发,通过亿级仿真数据训练,帮助机器人走进商超和家庭,将科幻小说中的情节变为现实。
提升学习能力
具身智能是人工智能的一个发展领域,指一种拥有物理身体的智能系统或机器能够通过感知和交互形成在环境中实时物理互动的能力。简单说,就是各种不同形态的机器人在真实的物理环境中获取信息、理解问题、作出决策,从而执行各种任务。
银河通用实验室里,一场具身机器人的实操演示正在进行中:工作人员在平板电脑上点选一样物品,双臂轮式机器人接收到指令,通过“视觉”锁定货架上的目标,用右手的吸盘准确抓取,放置到左手两指夹着的篮子里。机器人的整套动作一气呵成,展示了其落地的商业场景——夜间无人值守药店取药补药、无人商超上货拿货。
“机器人可以代替人完成从接单到找药、拿药、装袋等一系列流程,打包好交给快递员。”银河通用创始人、首席技术官王鹤告诉记者,这款机器人只要使用充电桩充足电就可以应用,电量不足时会自动回充,能够胜任药店、超市、工厂配料仓内管理员、理货员等工作。
机器人“能干”,靠的是海量数据赋予的泛化抓取能力,并在持续数据注入中,不断学习应付更复杂的情况。比如,当药店货架上最前面一盒药处于倒放或平放状态时,机器人右手吸盘会直接吸取正常摆放的第二盒药,这个过程可能导致第一盒药掉到地上。能力升级后,机器人可以先用左手将非正常排列的药盒摆放整齐,再用右手抓取。
“作为人工智能领域的前沿热点,具身智能已成为全球科技竞争的新高地、未来产业的新赛道。在多年深耕人工智能领域的基础上,我们研发的大模型在视觉理解和语言沟通能力方面比较成熟,对机器人操作的研究也实现了一定泛化性。”身兼北京智源研究院具身智能研究中心主任的王鹤介绍,具身机器人“小脑”交互控制、灵巧操作等技能学习能力,与“大脑”的认知、理解、规划等能力结合在一起,这就是未来通用机器人的蓝图。
把蓝图变成施工图,银河通用正致力于将智能机器人产品应用到更广泛的商业和家庭场景中。在家庭场景的展示中,银河通用不断完善中的“灵巧手”可以打开冰箱拿出水瓶、捡起地上的衣服。
仿真合成数据
作为一家技术驱动的创新企业,银河通用最引以为傲的是其“泛化”能力。“我们研发的任意材质物体抓取技术是成功率突破95%的通用泛化物体抓取技术,在行业中处于领先地位。”王鹤说,公司面向通用机器人持续开展技术攻关,在具身大模型、3D视觉感知和“灵巧手”深度学习算法等领域不断突破核心技术。
提到机器人,不少人会想到车辆装配流水线上的机械臂。但机械臂提前计算好工作位置,按程序运作即可,并不具备真正的智能。而具身机器人不仅可移动、更灵巧,还能发现问题、“听懂”指令,分担员工在生产线上来回巡查的工作压力,完成许多任务。这样的能力需要多模态大模型和具身智能赋予。
此前,具身机器人智能化训练只能靠人工采集数据。以写字为例,工程师用遥控器操作机器人完成全过程,费时费力采集的数据有限,机器人也只是“看起来很厉害”——只能在采集数据的场景中,并且物体、光照等因素丝毫不变的前提下,才能使用一支笔写字,一旦脱离特定空间,就无法正常工作。
“想让具身机器人不受环境影响,在常规的背景、合理的光照下都能正常工作,就需要让其具备类似人类小脑的反应能力。”王鹤举例,同样抓一杯水,对人而言,是不假思索的下意识动作;对机器人来说,杯子的形态、材质不同,抓杯动作和角度各异,只有学习得足够多,才能知道怎样做,这就需要海量数据训练出泛化抓取能力。
训练所需的海量数据从哪儿来?靠工程师采集只是杯水车薪。银河通用打破陈规、另辟蹊径,以合成仿真技术合成“灵巧手”物体抓取的大量数据,每个物体合成200条视频,再从一个物体到一类物体……通过成规模注入数据,训练机器人的抓取能力。
“我们是国内较早做到泛化物体抓取的企业。用物理仿真器生产的数据训练机器人学习抓取、放置等技能,是我们独到的能力。”王鹤说,对机器人本体优化后,使用对仿真环境、算法优化后的数据进行训练,能够帮助机器人跨越虚拟到现实的鸿沟。
拓展应用场景
“人形机器人集成人工智能、高端制造、新材料等先进技术,有望成为继计算机、智能手机、新能源汽车后的颠覆性产品,将深刻变革人类生产生活方式,重塑全球产业发展格局。”银河通用联合创始人姚腾洲告诉记者,公司预计今年将发布应用于商店超市的轮式人形机器人,计划于2026年开始量产。
除了轮式人形机器人,银河通用还在加快“灵巧手”、人形机械腿和遥操设备的研发进程,以及解决双足人形机器人软硬件相关技术难题,不断突破展示场景的应用。
人形机器人能否顺利商用,不仅取决于它自身的能力水平,成本也是重要的影响因素。“能抓取从地面到1.8米高空之间物品的机器人,量产后一套成本预计有望控制在5万元左右。”王鹤透露,这些有客来时接客取货,没人来时补货盘货,店员可以用语音指派、控制的机器人,价格并不高昂。
“新生事物往往会面对不少挑战。具身智能是典型的多学科技术交叉行业,做具身机器人需要产业和研究双轮驱动,既是前沿探索,也能产出学术成果,是很好的产学研联动。”王鹤告诉记者,当前,银河通用已在北京、深圳和苏州三地设有研发中心,不断发展壮大算法、软件、硬件研发团队。
瞄准行业发展趋势,银河通用将不断提升技术创新能力,持续开发人形机器人“大脑”和“小脑”,增强环境感知、行为控制、人机交互能力,提升人机交互、灵巧抓取、分拣搬运、智能配送等作业能力,加速大模型训练迭代和产品应用。同时,银河通用也将积极拓展应用场景,加快技术迭代速度,降低创新成本。