陈建宇:从清华博导到机器人“筑梦师”,破局具身智能的思辨与实践

温故智新AIGC实验室

TL;DR:

陈建宇,一位拥有“大脑”与“本体”稀缺交叉背景的清华博导,正带领“星动纪元”打破外界对公司的误解,致力于构建软硬一体的通用机器人体系。他以“沿途下蛋”的商业策略和前瞻性的技术洞察,为具身智能的未来奠定基石,旨在将机器人从废铁变为能思考、能行动的终端产品,从而重塑社会与产业格局。

在星动纪元北京办公室的明亮光线中,创始人陈建宇语气平和,却字字铿锵地指出一个核心矛盾:“外界对我们的认知,和我们实际的业务状况,确实存在一定差距。”1 这位90后清华大学助理教授、博导,在短短两年内,将星动纪元打造成为具身智能领域的一匹黑马,最新一轮近5亿元的A轮融资,由鼎晖CGV资本和海尔资本联合领投,再次印证了资本市场对其潜力的认可12。然而,陈建宇深知,外界眼中的“灵巧手公司”或“机器人本体公司”的标签,远不能定义他所构建的宏大蓝图。

双栖者的思辨:从“本体”到“大脑”的自然选择

陈建宇的独特之处,在于他拥有在具身智能领域稀缺的“本体”与“大脑”兼顾的交叉研究背景。这并非偶然,而是他学术轨迹的自然延伸与交织。2011年,他被保送至清华大学精密仪器系,那里是中国最早从事双足人形机器人研究的摇篮之一,为他奠定了扎实的机器人硬件与机电系统基础。随后,在美国加州大学伯克利分校攻读博士期间,他将目光转向了更深层的控制与智能——模型预测控制(MPC)和端到端强化学习,这些正是如今具身智能“大脑”的核心技术路径1

当被问及在创业初期是否考虑只专注于本体或大脑时,陈建宇的回答斩钉截铁:“这对我来说从来不是一个问题。”1 他解释道:

“如果只有本体没有大脑,机器人就是废铁。如果只有大脑没有本体,那就不是机器人了。我们最终要商业化闭环,一定是软硬一体交付到客户。”1

这种对软硬一体化的深刻理解,源于他个人近十年来在机器人硬件、机电系统、软硬件结合、控制以及AI领域的全链路探索。从AlphaGo时代起,他就预见了AI在机器人领域变革性的力量。

算法为骨,世界为心:具身大模型的进化论

在长达三个小时的访谈中,陈建宇倾注了近一半的时间,深入探讨机器人算法和“大脑”的前沿进展,展现出他对技术本源的极致追求。他清晰地勾勒出星动纪元在机器人大模型领域的演进路径:

  • 语言模型与机器人结合的先驱: 2023年ChatGPT问世后,陈建宇团队迅速捕捉到机会,尝试通过语言提示让ChatGPT为机器人进行任务规划,并成功发表了全球首篇结合大语言模型和人形机器人的研究,解决了上层规划与下层策略对齐的问题13
  • VLA的实践与突破: 受谷歌RT-2启发,星动纪元成为国内最早复现RT-2的团队之一。但他们很快发现RT-2作为“慢系统”的局限性,提出了快慢系统VLA框架,增加了高频动作处理模块。这一创新在2024年9月提出后,迅速被业内顶级机构如Physical Intelligence、Figure AI、NVIDIA等采纳,发布了类似架构的模型14
  • 世界模型的引入与统一: Sora视频生成模型的出现,为理解物理世界提供了新的思路。陈建宇团队迅速将其引入机器人领域,提出融合生成式世界模型的VLA算法框架,例如PAD和VPP架构,实现了机器人对世界的深度理解和实时预测。他们的UP-VLA模型,更是将理解、预测和策略学习融为一体,能同时预测未来画面和控制底层动作,这一成果同样被ICML收录,并与Meta等国际顶尖团队不谋而合1567

尽管在模型和算法层面已储备充足,陈建宇坦言,机器人领域最大的挑战仍然是“数据”。

“语言模型开始做的时候,网上的人类语言数据已经非常多……但对机器人来说,数据天然就没有这么多。如果按照这样方式去收数据,可能要收几万年才能达到ChatGPT的训练数据量。”1

他提出了创新的数据获取组合方式:先通过海量视频数据进行预训练,形成通识基座,再利用更精细的遥操数据进行微调,从而降低对纯遥操数据的巨大需求。

“沿途下蛋”的商业哲学:务实与远见并存

陈建宇深知,前沿技术的落地需要商业模式的支撑。他提出了“沿途下蛋”的商业策略——不苦等整机成熟,而是将研发出的机器人灵巧手等模块化产品先行出售。

“这样不仅有利于逐步拉低硬件的成本,还可以获取一定的数据,形成数据飞轮,反哺研发。”1

这种务实而富有远见的策略,让星动纪元在成立两年内便取得了显著的商业成就。截至2025年6月,星动纪元已累计交付超200台产品,另有上百个订单在量产交付中1。全球市值TOP 10的科技巨头中,有九家成为他们的客户,名单中不乏海尔智家、联想、北自科技等行业巨头1

通用体系的构建:乐高般的机器人未来

陈建宇所强调的“体系”,是实现通用人形机器人的核心。他将其拆解为软硬两套通用架构:

  • 软件层面: 发布融合理解与生成式的VLA模型ERA-428,这一机器人大脑融合了世界模型,能够对世界深度理解并实时预测,适用于不同任务,并可迅速调整到不同的本体上19
  • 硬件层面: 开发通用化、模块化的机器人产品。就像乐高一样,机器人可以根据不同场景需求灵活变化形态,包括双足、轮式、人形等。星动纪元甚至从机器人本体最小单位开始自研,如关节模组、控制单元、电机、减速器等,实现了从零件到部件的模块化、通用化1

这种模块化理念意味着,即使人形机器人是其重要的研发手段,但它并非终点。陈建宇认为,人形只是通过与人类行为数据结合,更好地利用数据、形成强大基础的一种方式。这个基础可以“降维”到其他形态上,从而实现任意机器人的构建——无论它有多少胳膊、多少腿,多少自由度,都可基于同一套软硬结合的底座1

目前,星动纪元已推出三款面向客户的成熟产品:五指灵巧手XHand 1、轮式服务人形机器人Q5、全尺寸人形机器人STAR 11。他们的商业化场景聚焦在“高价值、可复用”领域,例如在物流和制造领域,机器人能完成找标签、扫码、分拣、打螺钉等任务,成功率已很高,并正在真实场景中落地1

机器人之战前夜:储备与洞察

对于此次近5亿元的融资,陈建宇将其视为“储备粮草”,为即将到来的激烈竞争做准备。他清醒地认识到,虽然目前机器人领域的融资规模不及智能汽车或大模型,但未来其制造规模可能比肩电动汽车,模型规模也将达到大模型的水平1

他预判,未来机器人本身将成为一种终端产品,可能介于手机和汽车之间。

“未来家庭可能会拥有一到两个家用机器人或终端机器人,这些机器人将提供服务和情绪价值,这种形态的产品在未来5年就会开始出现。”1

他相信,机器人将首先替代人类的“苦活、累活、危险活”,将人类从枯燥的重复劳动中解放出来,从事更有价值的工作,从而带来生产效率的极大提升和物品成本的降低。

面对大公司,陈建宇认为竞争与合作并存。星动纪元可以成为互联网大厂的硬件供应商,或传统制造企业的软件供应商。他也强调,与大语言模型领域可能趋于垄断不同,机器人市场足够庞大、细分且多样化,涉及硬件制造的复杂性也使得其迭代速度慢于软件,这为更多玩家提供了生存空间1

陈建宇不仅是技术的信仰者,更是实践者。他将深奥的学术研究转化为可触可感的实体产品和商业价值。他身上融合了科学家的严谨、工程师的务实和企业家的远见。正如他所说,外界的“误解”只是暂时的,因为星动纪元正在用每一次迭代、每一笔订单、每一篇论文,重新定义机器人,构建一个真正通用、智能、且能改变世界的未来。他不仅仅是在做机器人,更是在设计一种全新的生活方式,一个将人类从重复劳动中解放出来的、充满无限可能的未来。

引用