浙江在线6月30日讯(记者 王世琪 朱承)结束高考的人类学生还在紧张填报志愿,机器人却已经排队走进课堂。
6月29日,杭州机器人学校揭牌。不招人,只招机器人。首批学生——来自多家公司和研究机构的人形机器人——来到这里,学习各种场景中的应用技能,武装“大脑”,实现从“科技玩具”到“实用工具”的蜕变。
人形机器人也有“小脑”和“大脑”:“小脑”负责运动控制与身体协调;“大脑”负责认知与决策,理解环境、听懂指令、规划任务。
当下,人形机器人的“小脑”水平已比较成熟,行业竞争逐渐从“塑造小脑”转向“强化大脑”。这个过程既要直面科技成果转化的“死亡谷”,又是难得一遇的弯道超车机遇。
杭州机器人学校的成立,正是一次围绕具身智能“大脑”的探索。
无际大脑
杭州机器人学校由浙江大学机器人研究院朱世强团队创办,核心目标就是为各类机器人打造一个强大的“大脑”,并对具身智能机器人进行系统化“教育”,让其能够进入应用场景。
“我们做的事情是赋予人形机器人思考判断的能力。”浙江大学机器人研究院院长朱世强表示,“因为很多企业可能拥有某方向的技术特长,但这并不意味就能开发出实用的产品,缺场景、缺数据、缺验证环境,特别是缺‘大脑’,是不少企业的痛点。”
朱世强团队研发的“无际大脑”是学校用于“教育”机器人、帮助相关企业跨过“死亡谷”的核心技术。
机器人入校后,学校会给它搭载一块黑色专用硬件。这是“无际大脑”的实体,能提升机器人的视觉信息处理能力、自主定位能力和逻辑思维能力。
随后便是系统培养。每台机器人都要经历入学体检、分科培养、智能体灌注、能力迭代、定级赋码,最后持证上岗。
朱世强形象地比喻:“机器人可能是一张‘白纸’,也可能是四肢发达头脑简单的‘低能儿’。经过智能化升级、能力迭代、产品定型,最后变成‘能干活’的机器人,可能是优秀的工厂机器人,也可能是靠谱的陪伴机器人。”
学校的具体课程则讲究“德智体美劳”全面发展——守住伦理边界和法律红线、强化场景认知、优化硬件适应力、打磨外观亲和度、确保能稳定干活。
目前,以“无际大脑”为核心,朱世强团队已形成“无际狗脑”和“无际人脑”两大体系,实现了多类机器人本体在真实场景的部署验证。
将“无际狗脑”装配到四足机器狗身上后,其工业作业能力实现全方位跃升:既能自主巡航巡检厂区,精准读取各类仪表数值,快速捕捉设备漏液、局部高温等隐患,还能实时识别现场人员摔倒等突发险情。
目前,搭载“无际狗脑”的四足机器狗已在达能、雀巢等企业及科研院所实现多车间跨区域自主巡逻、仪表识别等复杂功能。
而“无际人脑”则可快速培育出具备运动、表演、导览能力的人形机器人,展现出强大的跨场景适应能力。
在现场,人形机器人“小际”展示了学习成果,以“导游”身份自主介绍了“中国历代绘画大系”的相关内容,动作涵盖行走、讲解与互动,体现了“无际大脑”赋予的智能水平。
时不我待
把杭州机器人学校揭牌和另外两件事并在一起看,更能理解其意义。
第一件事,人形机器人价格正在雪崩。早年动辄数十万元甚至上百万元的机器,如今主流机型降至数万元,多款入门产品跌破万元——能够造出“小脑发达”的机器人已经不再是新鲜事。
另一件事则更直接地体现出具身智能的发展风向。今年6月,英伟达与宇树科技官宣战略合作,计划结合宇树的本体制造能力与英伟达的算力及具身大模型技术,一度被行业视作突破性合作——具身智能“大脑”协同“小脑”的发展趋势已成为共识。
中国信息通信研究院发布的《具身智能报告(2025)》也显示,“小脑”层面围绕技能学习和运动控制算法已有长期技术积累,“大脑”能力和“大小脑协同”是现阶段的核心瓶颈。
这些现象和观点都凸显了发展“大脑”的迫切性。
但“大脑”究竟怎么造?业界有着各种声音。其中视觉—语言—动作模型(“VLA”)和世界模型是讨论的主流。
“VLA”依托视觉和语言双输入,直接完成任务语义推理并生成机器人动作,主打自然语言交互与即时决策执行。
世界模型这条路线的重要推手,是斯坦福大学教授李飞飞。她提出,世界模型的核心是让机器人在交互中理解物理规律与因果结构,不仅能理解“现在发生了什么”,更能预测“接下来会发生什么”,并据此作出决策。
如果说“VLA”像一个“熟练工的条件反射”,看到零件就知道怎么抓;那么世界模型就像一个“经验丰富的老师傅”,不仅会抓,还能预判零件稳不稳、下一步往哪放。前者快但不擅长变通,后者稳但计算成本高。
朱世强团队的“无际大脑”采用了更接近“VLA”的技术路线,但做了重要改进,他们将其称为“VL2A”。在“VLA”基础上,新增核心逻辑判断模块,补齐了该路线的短板。
“我们的设备搭载独立逻辑监控系统,机器人每一次场景判断、任务规划、动作执行,都拥有可追溯、拟人化的推理过程,真正实现知其然更知其所以然,从概率走向逻辑,解决了传统模型输出不可解释、无法溯源迭代的问题。”朱世强说。
不过越来越多从业者不愿把自己归入某一派,而是秉持一个朴素而坚定的目标:走哪条路不重要,重要的是让机器人真正进入真实世界干活。
“单独的‘VLA’或世界模型都不是终点。通用机器人‘大脑’的进化方向,是走向从真实物理世界数据中生长出来的具身原生模型,让视觉语言、因果世界预测与动作控制在统一架构中持续学习和闭环迭代。”蚂蚁灵波科技CEO朱兴说。
今年1月底,他们一次性开源四个成套模型:一个专攻高精度3D空间感知,一个对标通用“VLA”,一个做交互式世界模型,还有一个核心创新——因果世界模型与动作融合架构。
无论采用哪条路径,这都是一场时不我待的赛跑。而且对于以“小脑”见长的中国,优势正在弱化。宇树科技股份有限公司创始人王兴兴曾公开表示:“国内有全球最强最完整的供应链,但机器人‘大脑’模型层面还处在探索阶段。”
卡位之战
面对新趋势,浙江如何巩固现有优势,在“大脑”竞争中抢占先机?
除了以浙江大学机器人研究院为代表的学界努力,浙江企业也正在用自己的方式赋能“大脑”研发,努力卡位。
凌迪科技选择从底层物理世界模拟器切入。依托在服装行业近十年的仿真数据积累,完美模拟出机器人与各类可形变材料接触时的形变和物理参数,凌迪科技成为与具身智能“大脑”企业紧密合作的数据厂商。
“将这些数据植入机器人‘大脑’,便能让机器人精准判断出触摸物的材质,并针对性进行精细操作。”凌迪科技首席运营官陈鑫平预判,未来2至3年,柔性仿真、触觉力学、灵巧交互赛道将迎来规模化爆发。
既做“大脑”又做本体的至简动力则带着一套方法论入场。这家由理想汽车前高管创立的公司,核心逻辑是把自动驾驶已被商业验证的体系化能力整体迁移至具身智能——从技术判断到产品定义,从软硬件系统到供应链成本,从研发组织到商业交付,形成全链路的方法论。
“人形机器人正从技术闭环走向商业化闭环,而自动驾驶恰恰是过去十年最接近这场考试的训练场。”至简动力联合创始人王凯说,面对具身场景对物理交互、多模态闭环和实时响应的更高要求,他们重新设计了一套极简统一的底层技术架构,同时覆盖视觉、语言、动作、世界模型和快慢思考五个模态,把机器人的“看、想、动”收束到同一个系统里,让这套被验证过的体系化能力在机器人赛道上真正跑通。
宇树科技作为总装头部企业,前期凭借本体与运动控制的实力占据领先地位。面对越来越多的入局者,近年来也开始加码“大脑”——2024年起逐步投入,2025年下半年自研模型发布后,宇树科技表示将加大数据采集投入。
底层数据、系统迁移、本体延伸,三种入场方式起点不同,但指向的是同一个方向:强化机器人“大脑”,让其在真实世界里解决问题。
“大脑”卡位战同样发生在城市之间。
当下,国内具身智能核心城市聚焦在北、上、深、杭。整体来看,杭州资本密度不及北、上,头部大厂资源偏少,珠三角产业链配套更强。但聚焦“大脑”这个细分赛道,杭州有一定的比较优势。
微链联合创始人柳荣军认为,在这一领域,杭州可稳居全国前三,并有弯道超车的机会。“大脑偏软件、偏算法,恰好契合杭州作为互联网与软件产业高地的基因。”他说。
除此之外,浙江的另一大优势便是丰富的“大脑”训练场景。
浙江拥有全国最密集的制造业场景,这里既是机器人天然的训练场,也有第一批愿意付费的工厂。而工厂试用意愿上升,“大脑”数据积累也将加速,促成良性循环。
来自“国家队”的加持,强化了这一点。
今年5月,国家人工智能应用中试基地(具身智能)在杭州滨江区挂牌启用。这是全国唯一专注具身智能领域的国家级应用中试平台。
平台内搭建了30多个真实应用场景——工业制造、仓储分拣、柔性装配、电力作业、家政服务,机器人进去不是表演翻跟斗,而是在生产线上拧螺丝、搬货物、做检测,在具体应用场景中强化“大脑”。目前已有20家龙头企业签约入驻。
“大小脑协同”的风越吹越劲,具身智能竞争的新战场从实验室转向应用场景。面对时代课题,无论是研发“大脑”还是训练“大脑”,浙江都在积极捕捉风向,寻找机遇。
版权和免责申明
凡注有"浙江在线"或电头为"浙江在线"的稿件,均为浙江在线独家版权所有,未经许可不得转载或镜像;授权转载必须注明来源为"浙江在线",并保留"浙江在线"的电头。