要说具身智能迎来iPhone时刻为时尚早
松延动力的机器人HObbs仿真脸,可以实时仿真人脸表情,做出张嘴、皱眉、表达出愤怒、微笑、厌恶等多种表情;智元远征A2-W机器人展示出动态任务编排、复杂作业执行及双臂协同作业等作业能力;星尘智能AI 机器人助理Astribot S1二指抓夹能熟练地功夫茶,叠衣服,完成一系列高难度、长序列、可泛化任务;
新松Centaur真空机械手两只手臂不受彼此影响独立进行取放片工作,完成不一样的尺寸规格的晶圆搬运;帕西尼第二代多维触觉人形机器人TORA-ONE,四指灵巧手可以比心、写书法、弹琴、下象棋。智平方Alpha Bot 1S不但可以握拳,还能制作咖啡,学习操作各种日常电器,实现多场景、多任务的灵活切换。
逐际动力CL-1在展会现场接受极限冲击测试,面对持续踢踹,依然能够保持全身动态平衡,展现出强大抗干扰能力和稳定能力;宇树科技的机械狗,四足灵巧的上下爬坡,引得众人连连惊叹。
加速进化更是在现场办起了足球比赛,其人形机器人Booster T1凭借手抛球、踢球、叶问蹲等高难度动作,以及与观众互动的俯卧撑比赛,引人注目;优必选在现场模拟出汽车产线,其人形机器人Walker S系列能自主将零部件箱从仓库地板搬运至传送带,并实时记录数据,实现与智慧工厂仓库系统无缝对接。
单从展会看,人形机器人正在从炫技走向服务,具身智能似乎马上要迎来iPhone时刻。可事实上,进入现实世界,人形机器人还有很多技术和产品问题尚待解决。
当下,发展通用智能型人形机器人,正在慢慢的变成为行业内的共识。人形机器人最大的优点是具备通用的移动操作能力。其中下肢负责稳定移动,上肢负责灵巧操作。而相比下肢“移动”能力,要解决具体场景中的问题,更需要的是上肢的“灵巧操作”能力。
自20世纪50年代自动控制技术的兴起至今,“上肢”机械臂和工业机器人已有较长发展历史,但是能力仅限于进行机械、重复且较为简单的动作,如今人们对机器人上肢的要求已不单单是能自主运动,更重要的是实现精准操作,成功完成指定操作任务。
相比技术难度低、鲁棒性高的电动夹爪,多指灵巧手的开发也在慢慢的变成为共识。多指灵巧手作为高性能、高灵活性末端执行器,可供客户在特殊及复杂场景中使用,同时对提高机器人的柔性和易用性有着更重要的作用。
至于手指数量,并无定论。多数灵巧手是五指的,但也有四指的。对此,帕西尼CEO许晋诚认为“四指或五指,要以目的为导向,四个手指可能在很多情况下已经足够使用,因为人类其实在真实的生活中很少用小指。”
帕西尼的触觉灵巧手就是四指,主动自由度达13个,能轻松实现抓、握、捏、按手指开合等各种人手复杂动作。
北京具身智能机器人创新中心大模型负责人鞠笑竹表示,“当下,灵巧手多是模拟人手关节,一个关节对应一个电机,也对应一个自由度。手指越多,关节越多,电机就越多,自由度就越高。而在一只手的有限尺寸内,电机越多,结构越复杂,对其可靠性和灵敏度的挑战就越大,当然成本也更高。”
可以说当下,如何在有限的空间内集成多个自由度,对于灵巧手硬件来说,是一个巨大的技术挑战。
除开在硬件层面的难题外,要实现灵巧操作,手部也必须与环境进行交互。当关注到物体的形状、大小、位置等几何特性时,就离不开人形机器人核心感知部件-传感器,对操作环境和对象进行实时多维感知。然而当下,除业内视觉传感器应用较为普遍,触觉传感器也有落地外,目前行业仍缺乏视、触、听、力一体多维传感器。
要具备足够的通用性,在几何特性外,还应该关注物体的语义特性,例如物体是什么,用途是怎样的。只有这样,人形机器人才能在未知环境中进行相对有效交互,实现真正灵巧操作。
相比上肢灵巧手灵巧操作能力,下肢移动能力从技术进展上似乎更快。这大概得益于软硬件结合与人工智能技术尤其是强化学习的发展。
在展会现场接受极限冲击测试的逐际动力CL-1,展现出极强的动态平衡能力。而在其早前的演示视频中,CL-1还可以在山野里徒步,下碎石坡、爬草坡、走沟渠。创始人张巍曾表示,“腿部也就是下肢这部分不需要新的物理发现,但是一个要一直尝试的工程迭代的过程。”这大概能解释为什么人形机器人下肢能力的进度更快。
人形机器人下肢分为轮式、四足、双足。其中,四足机器人,侧重于解决“通用移动能力”,也就是实现对各种地形的泛化适应。两足机器人则是为实现直立行走,以便前两肢(即双臂)进行操作。
双足,相比四足的稳定性和平衡性难度都要加倍。这也是怎么回事,我们也可以看到四足灵巧狗,上下爬楼梯超级丝滑,而大多数双足人形机器人走起路来依然颤颤。
不过能确定的是,从轮式到四足到双足,技术难度和成本都是递增的。从成本来看,轮足方案几乎是双足的零头。不同选择代表着不同技术难度及不同成本,也影响着人形机器人公司们的商业化进程。
总体来看,人形机器人本质上是代替人去运动,或移动或操作。有的机器人着重做移动,有的着重做操作。所以,我们会看到大多数着重发展灵巧手的公司,下半身多为轮式,而双足机器人,则上半身末端配抓夹者居多。
聊完产品构型问题,再来聊聊大家更关心的落地场景问题。当下,没有成熟、刚需的场景是人形通用机器人面临的最严重的问题之一。
据虎嗅智库调研,工业制造、科研创新、商业服务、家庭服务是四个目前更有可能落地应用人形机器人的领域。
进一步来看,四个领域中的那些环境相对封闭,能力需求较为单一,人力成本更高,或者危险系数较高的场景会更快落地,比如汽车工业产线中的搬运、质检,超市换、补货等场景。
逐一来看,从付费能力和意愿上分析,工业场景的确是更有可能最先落地。一方面因为工厂的自动化水平更高,并且厂商在部分场景有明确需求,更具付费能力。
比如优必选就在会上首次聚焦汽车、3C等制造业重点领域推出“人形机器人工业场景解决方案”。其Walker S系列人形机器人能面向多任务工业场景,完成智能搬运、智能分拣、智能质检、螺丝拧紧、零件安装、过程材料操作等多种任务。
在谈到为何聚焦工业场景时,优必选人形机器人技术专家秦文龙博士表示,相比于服务场景和家庭场景,工业场景相对结构化,厂区环境和任务内容都是确定的。除开结构化外,工业产线对于自动化、智能化的升级需求也更迫切,亟需新形态的高端智能制造设备来弥补现有工业机器人、协作机器人、复合机器人等智能设备任务执行范围之外的空白区。
在工业之外,这一波具身智能机器人公司在寻找商业化路径的时候,也有不少率先从家庭场景切入。
因为对于新入局的具身智能机器人来说,相比跟传统专用机器人卷精度和速度,更可行的是在通用性上去找一些替代价值高的场景,比如养老、带小孩等家庭看护场景。这些场景,更强调跟人的交互、对人的服务,而不是精度。
鞠笑竹表示,“一开始大家可能都会先考虑家庭场景先落地。但实际上做下来之后,发现每个家庭,每个人的需求都是千奇百怪的,过于随机和非结构化,对人形机器人的泛化性和智能要求很高,落地就不会很快。”
除了家庭非结构的环境特征之外,机器人本身的技术成熟度、安全性、及共同生活的亲属对人形机器人的接受度等都是人形机器人要落地家庭,待解决的问题。
而在一些商业服务场景中,比如营销服务、前台接待等,专用传统机器人已经发力已久。似乎当下,相比于人形不人形,大家比拼更多的则是对该场景下企业需求的理解。这一点上,显然早已入局的商用机器人玩家们更有优势。
此外,对于科研教育场景,目前也有多家人形机器人企业入局,竞争非常激烈,但该场景天花板比较低,量产规模也达不到市场期待,所以更像是大家的短期无奈之举。
关于在各场景的具体落地时间,在虎嗅智库的调研中,大多数厂商的共识是1-3年,人形机器人将迎来在工业场景的落地,3-5年落地于商业服务场景,5-10年在家庭场景落地。
虎嗅智库认为,这一判断可能依然过于乐观。因为新技术在商业化上的进度普遍是偏慢的,要商业化,前提是必须要找到有非常明确的产品需求场景。尽管优必选等企业,在汽车制造等一些场景已确定进入进厂实训阶段,但考虑到解决通用性和成本问题,相关场景的市场需求尚待进一步验证。
或许在尝试保持研发技术高度的同时,逐步把技术拆解出来,降维去找到一些能够落地的场景,探索产品化的方向,解决通用性问题,似乎是商业化的一条可行之路,但这并不容易。
况且如果要成功商业化,产品也至少要做到80分,还可以与竞争对手拉开质的差距。但当下,大家的产品不管是从外观还是到功能,差异化都不太明显。
总体来看,目前,人形机器人虽然热度很高,但技术路线,商业场景等都仍未明确,离量产还有距离,商业化也有很长的路要走。当下谈具身智能迎来iPhone时刻,还为时尚早。
关于具身智能的更多线日,在北京,虎嗅总部,大鲸AI闭门会将围绕具身智能场景需求,与100+标杆企业的CEO/CIO/顶级专家们,一起解读具身智能落地的方方面面,欢迎你一起来聊聊。
上一篇: 构思无限!看看这些学生规划的动漫包装你被冷艳到了吗?
下一篇: “果链”崛起 苹果巨资再押中国智造