News

新闻动态

刚甩掉 OpenAI 回身就爆火Figure 机械人家务视频刷

发布时间:

2025-02-23 11:41

  

  施行使命时,Figure 02 机械人能像人类一样天然地挪动双手,同时调整头部和身体,以获得最佳的操做视角和勾当范畴。

  Helix 是首个完全运转正在嵌入式低功耗 GPU 上的 VLA,意味着它已具备间接贸易化摆设的能力。画面中的汉子言简意赅就给两个 Figure 02 机械人交接了使命——使用 Helix AI 模子,推理面前这些第一次看到的物品所属的,然后协做好。

  若何从 VLM 中提取这些常识性学问,并将其为可泛化的机械人节制?而这恰是打制 Helix 的焦点方针——让机械人能实正理解和施行各类复杂使命,使其具备更强的顺应能力。

  为了支撑这种高效运算,每台配备 Helix 的 Figure 机械人都拆有双低功耗嵌入式 GPU,通过高效的并行计较实现流利的节制结果。

  手艺冲破的背后有着本钱市场的强力支撑。Figure 正在月初的时候暗示,公司已取宝马制制公司以及一家未透露姓名的美国大客户告竣合做。Adcock 透露,这些合做关系将为「将来四年内实现 10 万台机械人」奠基根本。

  配备 Helix 的 Figure 机械人现正在几乎能够拾取任何小型家用物品,只需遵照天然言语指令即可完成操做。

  降低锻炼成本是鞭策机械人普及的环节。通过采用端到端的锻炼方式,Helix 可以或许间接从原始像素和文本号令映照到持续动做。

  而 S1 系统则以 200Hz 高频次运转,基于 S2 的指令和及时数据,切确节制机械人的每个动做。

  这对机械人同伴家务从打一个行云流水,当机械人递过来一个苹果,另一个机械人秒 Get 火伴的心思,自动递过去一个黑色大碗,搭配暗黑色调,赛博朋克气概拉满。

  「引见 Helix,我们最新的 AI,它的思维体例更接近人类。要让机械人实正走进家庭,我们需要能力上的庞大飞跃。Helix 可以或许顺应并操做任何家居物品。」。

  既然 AI 正在图像识别、言语理解等范畴曾经展示出强大的进修能力和立即泛化能力,那为什么不操纵视觉言语模子(VLM)中堆集的丰硕语义学问来指点机械人行为,出格是这些模子通过对互联网大规模数据的进修,曾经堆集了大量关于物体、场景和行为的常识性学问。

  取保守机械人系统比拟,Helix 最大的劣势正在于无需繁琐的使命演示或复杂的编程,就能自从完成从简单的物品抓取到复杂的协做使命等多样化操做。

  凭仗强大的泛化能力,Figure 机械人可以或许通过天然言语指令,识别和操做数千种分歧外形、大小、颜色和材质的家居用品,即便是从未见过的物品也能精确处置。

  具体来说,Helix 是一种通用的视觉-言语-步履(VLA)模子,它融合了、言语理解和进修节制能力,旨正在处理机械人手艺中持久存正在的多个难题。

  手艺层面上,Helix 的运做依赖于两个慎密共同的系统。一个是担任高层语义理解的 System 2(S2,7B 参数),另一个是担任及时节制的 System 1(S1,80M 参数)。

  取以往的方式分歧,Helix 仅利用一组神经收集权沉来进修所有行为——从拾取和放置物品,到利用抽屉和冰箱,再到跨机械人交互——无需针对特定使命进行额外微调。

  正在现实使用场景中,Figure 02 不只能切确节制每一个手指的动做、手臂的活动轨迹、头部的转向和身体姿势,更主要的是实现了及时全体协调结果。

  显而易见,这些方式不只耗时吃力,并且成本昂扬,难以正在家用机械人范畴大规模普及。基于此,Figure 团队提出了一个新的解题思。

  分类冷藏,这对机械人同伴分工明白,共同默契,拾掇完还不忘关上冰箱门,比一些实人室友还要靠谱。

  用更通俗的线 担任「步履」。此中,S2 系统以 7-9Hz 的频次运转,持续处置机械人摄像头拍摄的画面和领受到的言语指令,将其为机械人能够理解的行为指令。

  但取尺度化的工业分歧,家庭场景复杂多变,衣物可能皱皱巴巴地散落正在遍地,餐具可能有着分歧的外形和材质,以至每天城市呈现全新的物品,这对家庭机械人的顺应能力提出了极高的要求。

  Figure 创始人 Brett Adcock 正在 X 平台发文称,Helix 团队的方针是霸占通用机械人手艺——让每个家庭都能具有一台机械人,虽然还有很长的要走,但目前的曾经初见成效。

  客岁,这家人形机械人公司完成了 6。75 亿美元的 B 轮融资,投资方包罗 OpenAI、微软、英伟达和 Jeff Bezos,融资后估值达到 26 亿美元。

  虽然这种评价有些过甚其辞,但 Helix 确实处理了家用机械人范畴持久以来的一个焦点难题,正在抱负的家庭场景中,你能够简单地告诉机械人做某事,它就会去做。

  据悉,Helix 仅利用了约 500 小时的高质量监视数据(仅为保守方案的 5%),却实现了更强的泛化能力。并且,Helix 还通过梯度反向和时间偏移机制,让锻炼可以或许成功地使用到现实场景中。」Figure 公司暗示,「若是将 Helix 规模扩大 1000 倍,当它可以或许驱动数百万个机械人时,将为人类社会带来庞大的改变。」?。

  取 OpenAI 官宣「分手」后,人形机械人公司 Figure 正在 X 平台放出大言,其内部 AI 模子取得严沉冲破,将正在接下来的 30 天内展现前所未见的立异。

  科技巨头对人形机械人范畴的稠密投资,大概预示着这个市场可能即将送来拐点,家用机械人市场无望送来雷同智妙手机的迸发期。

  Helix 是首个可以或许对整小我形机械人上半身进行高速持续节制的 VLA,包罗手腕、躯干、头部以及单个手指。

  正在测试中,两台 Figure 机械人共享统一套模子权沉,无需为每台机械人零丁锻炼或进行多阶段锻炼,仅通过简单的言语指令就能默契共同。

  好比,当系统收到「把饼干袋递给左边的机械人」,接着「将饼干袋放入抽屉」如许的持续指令时,两台机械人能完满共同完成使命,即便是初次碰到的物品也妙手拿把掐。

  据 Figure 引见,这种协调的精准节制正在机械人范畴是一个严沉冲破,由于身体各部位的挪动会彼此影响,构成复杂的连锁反映,保守手艺往往很难处理这个问题。

  保守的处理方案往往需要投入大量资本。一种是请博士级专家破费大量时间为每个具体使命编写特地的法式;另一种是通过数千次频频示范来锻炼机械人进修特定动做。