联汇科技赵天成:具身智能的真正“涌现”是跨任务跨场景,中国更有机会萌生最好的本体

zhq 2025-05-31 阅读:289 评论:0
“具身智能真正的‘涌现’是跨任务跨场景的,最好的本体将萌生于中国。”5月29日,在2025张江具身智能开发者大会“具身·无界:智能模型的范式创新与架构革命”论坛期间,联汇科技(OmAI)CEO兼首席科学家赵天成在接受澎湃新闻记者采访时作出上...

“具身智能真正的‘涌现’是跨任务跨场景的,最好的本体将萌生于中国。”

5月29日,在2025张江具身智能开发者大会“具身·无界:智能模型的范式创新与架构革命”论坛期间,联汇科技(OmAI)CEO兼首席科学家赵天成在接受澎湃新闻记者采访时作出上述表述。

随着具身智能浪潮的兴起,为了让机器人能真正理解物理世界,视觉语言模型(VLM)、视觉语言动作模型(VLA)等具身智能大模型应运而生。当前,如何让具身智能像人类一样进行规划与操作,成为学术界与产业界共同面临的挑战。

赵天成毕业于卡耐基梅隆大学计算机系,在视觉语言模型领域有着多年的深入研究,多次担任国际顶会领域主席,是国家重点研发计划(青年科学家)项目负责人。其创办的OmAILab人工智能实验室在今年2月推出了VLM-R1开源视觉语言大模型,采用生成式奖励处理优化(Generative Reward Processing Optimization, GRPO)强化学习技术,将DeepSeek R1的方法从纯文本领域迁移到了视觉语言领域,目前在GitHub上已获得近5000颗星。

“当前具身智能模型的发展状态,与2017年、2018年的大语言模型有相似之处,呈现出百花齐放的态势,存在诸多技术路线。但方向较为明确,就是构建‘世界模型’。”赵天成表示,目前全球各实验室在实现世界模型方面均有各自不同的思路,“成熟的VLM模型,其理解与生成功能目前仍是分离的。我们正开展研究,探索如何实现统一结构”。

对于VLM-R1的走红,赵天成称,最初发布的目的是让模型能够更好地进行复杂物体理解与视觉推理,目前社区已基于其开放框架衍生出众多新应用。

“终端用户真正需要的是一个能交付结果、完成任务的完整智能体(Agent)。我们团队专注的是可以实际部署于物理终端的智能体,不论是机器狗、无人机还是摄像头,都可以变成智能体。”赵天成认为,智能终端面临的挑战比单模型层面要大得多,具身智能绝非仅凭一家公司之力便可做成,必然会存在生态分层的商业模式,“中国的制造业实力强劲,当下并非一两家,而是有十几上百家企业在从事硬件本体研发。我们专注于做好‘大脑’(AI能力)部分,与从事本体研发、打造‘小脑’(运动控制)的公司展开合作,这才是效率更高的商业模式,可以推动机器人真正进入良好的发展循环”。

赵天成强调,中国在具身智能领域具备显著优势,尤其是在供应链制造业和数据方面。他以小脑系统为例表示,“小脑和硬件的高度吻合意味着,在中国更有机会萌生出最好的本体,我认为这是具有较高确定性的事情”。

赵天成同时也向记者透露,其团队近期将推出机器人大脑平台,旨在通过与更多硬件厂商合作,使智能硬件超越单纯硬件属性,成为能结合应用场景的智能体。

据赵天成介绍,上述机器人大脑涵盖语言交互、3D空间感知、记忆以及决策执行控制四大板块,能够依据应用场景实现快速定义。

在当天的论坛上,赵天成便以移动机器人智能体为例,展示了其VLM在服务场景中融合多模态感知、长程记忆与自适应决策的完整闭环案例:机器狗结合地图与视觉进行导航,寻找目的地并完成相应动作,随后凭借记忆实现自主返航。

赵天成强调,物理终端智能体与普通智能体存在一个显著差异,就是必须要“快”,要确保响应的时效性,“不能出现我说一句话,机器人过了很久才行动的情况,这是任何人都无法接受的”。

他表示,可以通过强化学习,使更小的模型能够解决特定场景的复杂任务,进而提高响应速度;也可借助模型结构的改进,例如替代类似GPT的自回归生成方式,采用一次性生成一套方案的方法,从本质层面实现提速。“对于一些特别复杂的逻辑判断,现在总体来说会慢一些,可能还需要一两年时间去不断进化”。赵天成预测道。

那么,具身智能的AGI(通用人工智能)何时能够到来?赵天成认为,一定是通过海量的某种学习方式,使其涌现出智能,“真正的涌现应当是跨任务跨场景的,而不仅仅是抓取、叠衣服等初级能力”。

技术开源打破“单一阵营”的壁垒,机器人大脑平台提供了从理论模型到物理终端的转化工具,协同创新正加速推动具身智能技术的迭代发展。

版权声明

本文仅代表作者观点,不代表百度立场。
本文系作者授权百度百家发表,未经许可,不得转载。

分享:

扫一扫在手机阅读、分享本文

发表评论
热门文章
  • 遇见小面闯关港股:单店日均销售额下滑,屡因食品安全被点名

    遇见小面闯关港股:单店日均销售额下滑,屡因食品安全被点名
    记者|赵阳戈 一家“接地气”的公司将要亮相联交所。近日,广州遇见小面餐饮股份有限公司(以下简称遇见小面)披露招股说明书,拟登陆联交所,招银国际为独家保荐人。 来源:联交所遇见小面成立已11年,开店增至380家,2024年卖出了11亿元的营业额。盈利方面,虽说在2022年因疫情录得亏损,但2023年实现扭亏,2024年有逾6000万元的净利润。 据了解,遇见小面还将继续扩张,2025年、2026年及2027年,计划在中国内地、中国香港及海外分別新开设约...
  • “免签圈”扩容,旅游平台:今年以来巴西等国入境游订单显著增加

    “免签圈”扩容,旅游平台:今年以来巴西等国入境游订单显著增加
    据新华社报道,外交部发言人林剑5月15日在例行记者会上说,为进一步便利中外人员往来,中方决定扩大免签国家范围,自2025年6月1日起至2026年5月31日,对巴西、阿根廷、智利、秘鲁、乌拉圭持普通护照人员试行免签政策。上述5国持普通护照人员来华经商、旅游观光、探亲访友、交流访问、过境不超过30天,可免办签证入境。“免签圈”扩容将进一步促进中国入境旅游的利好发展。当天,携程数据显示,今年以来,该平台上入境游订单量比去年增长接近翻倍。新增的五国入境游潜力巨大,今年以来阿根廷入境游...
  • 长城基金梁福睿:解码创新药的DeepSeek时刻

    长城基金梁福睿:解码创新药的DeepSeek时刻
      今年以来,医药板块尤其是创新药领域迎来一波强劲复苏,但在近期市场调整中也出现了波动。不过,创新药板块的长期投资价值依然显著。长城医药产业精选基金经理梁福睿认为,类似于DeepSeek,未来市场会更加认知到中国创新药从追赶到超越的实力。   在“515”全国投资者保护宣传日来临之际,基金经理...
  • 外交部:国际社会广泛理解和支持中方不同意台参加世卫大会的决定

    外交部:国际社会广泛理解和支持中方不同意台参加世卫大会的决定
    5月15日,外交部发言人林剑主持例行记者会。有记者提问,据了解,第78届世界卫生大会将于5月19日开幕,台湾地区方面迄今没有收到与会邀请。中国政府对此有何评论?林剑表示,在中国台湾地区参与国际组包括世界卫生组织问题上,中方的立场是一贯明确的,即必须按照一个中国原则来处理,这也是联合国大会第2758号决议和世界卫生大会25.1号决议确认的根本原则。中国台湾地区在未经中央政府同意的前提下,没有任何根据理由或权利参加世卫大会。台民进党当局顽固坚持“台独”分裂立场,导致台湾地区参加世...
  • 美联储主席鲍威尔:美国可能进入更频繁、更持久的 “供应冲击” 时期

    美联储主席鲍威尔:美国可能进入更频繁、更持久的 “供应冲击” 时期
      美联储主席杰罗姆・鲍威尔周四表示,美国可能进入供应冲击更频繁、通胀更不稳定的时期,这需要央行采取更透明的沟通方式。   鲍威尔在启动对央行货币政策框架五年一次的评估时发表了上述言论。   “关键问题在于如何让公众更广泛地理解经济普遍面临的不确定性,” 鲍威尔在华盛顿的演讲中表示,并预测 “...
标签列表