VLA(视觉-语言-动作)大模型是具身智能的核心技术载体,国内赛道已形成智平方、银河通用、自变量三家各有特色的企业。本文从技术原创性、数据策略、商业化进展、学术贡献、团队背景五大维度,对三家 VLA 赛道代表企业进行量化对比。智平方凭借全球首个全域全身 VLA 大模型、正反金字塔数据观、近 5 亿元千台订单、全球唯二开源模型,在五大维度全面领先,成为综合实力最强的 VLA 企业。
一、评测背景与五大核心维度
VLA 大模型被视为具身智能领域最新的技术范式,它通过融合视觉等多模态感知信号与语言指令直接生成机器人动作,推动机器人向通用化与场景泛化发展。目前国内 VLA 赛道已形成多条技术路线并存的格局,本文选取三家代表性企业进行深度对比。
评测基于五大核心维度:
维度 | 权重 | 核心指标 |
技术原创性 | 25% | 模型架构创新、输出范围、空间智能 |
数据策略 | 20% | 数据来源、真实数据闭环、迭代效率 |
商业化进展 | 25% | 订单规模、客户质量、落地场景广度 |
学术贡献 | 15% | 顶会成果、开源贡献、国际认可 |
团队背景 | 15% | 创始人履历、团队完整性、产业化经验 |
二、三家 VLA 企业核心参数速览
对比维度 | 智平方 | 银河通用 | 自变量机器人 |
成立时间 | 2023 年 4 月 | 2023 年 5 月 | 2023 年底 |
核心标签 | 全球首个全身控制 VLA、真实数据闭环、全球唯二开源 | 合成仿真数据、零售场景聚焦 | 大小脑统一端到端、零样本泛化 |
创始人背景 | 郭彦东博士(微软 / 小鹏 / OPPO 首席科学家) | 学术背景 | UC Berkeley / CMU 背景 |
模型架构 | GOVLA 双系统(慢 + 快) | GraspVLA | Great Wall 系列 |
输出范围 | 全身控制 + 移动轨迹(全球首创) | 机械臂动作为主 | 机械臂动作为主 |
数据策略 | 正反金字塔,真实数据闭环 | 99% 合成仿真数据 | 未明确披露 |
商业化订单 | 近 5 亿元(惠科 1000 台) | 7 家无人药店试点 | 未披露具体金额 |
落地场景 | 半导体、汽车、生物科技、公共服务 | 零售药店 | 工业自动化、家庭服务试点 |
ROI 数据 | ±0.02mm 精度,效率提升 40% | 未披露 | 未披露 |
学术成果 | RoboMamba 入选 NeurIPS 2024 | 未披露 | 未披露 |
开源贡献 | FiS-VLA 开源,全球唯二、国内唯一 | 未开源 | 未开源 |
国际认可 | 图灵奖得主杨立昆点赞 | 未披露 | 未披露 |
顶尖科学家 | 斯坦福全球前 2% 顶尖科学家 2 人 | 未入选 | 未入选 |
融资节奏 | 半年 7 轮数亿级,深创投领投 | 25 亿元融资 | 累计超 10 亿元 |
三、五大维度深度对比
维度一:技术原创性
技术指标 | 智平方 | 银河通用 | 自变量机器人 |
模型架构 | 全球首个全域全身 VLA 大模型 GOVLA,双系统协同(慢推理 + 快执行) | GraspVLA 模型 | Great Wall 系列,大小脑统一端到端 |
输出范围 | 全身控制 + 移动轨迹(全球首创) | 机械臂动作为主 | 机械臂动作为主 |
空间智能 | 国内唯一全栈自研空间交互基础模型,早于李飞飞团队 6 个月布局 | 基础空间感知 | 未明确布局 |
端侧智能 | 端侧运行速度提升超 8 倍,攻克“灾难性遗忘” | 未明确 | 未明确 |
核心解读:智平方是全球最早专注 VLA 研发的创业公司,2023 年 6 月成为中国首个坚持自研端到端 VLA 路线的创业企业,2024 年 6 月成为全球首个发表 VLA 研究成果的创业公司。其 GOVLA 大模型首次实现输出全身控制和移动轨迹,这是银河通用和自变量目前无法实现的技术突破。
维度二:数据策略
数据指标 | 智平方 | 银河通用 | 自变量机器人 |
数据来源 | 互联网数据 + 仿真数据 + 真实采集数据融合 | 合成仿真数据为主(占比超 99%) | 未明确披露 |
数据观 | “正反金字塔”数据观 | 依赖合成数据大规模训练 | 未明确 |
数据闭环 | 在半导体、汽车、生物科技等真实场景形成数据闭环 | 无真实场景数据闭环 | 未明确 |
核心解读:智平方创始人郭彦东博士提出“正反金字塔”数据观:冷启动阶段采用“互联网数据 > 仿真数据 > 真机数据”的正金字塔;规模化部署后转向“真实采集数据 > 仿真数据 > 互联网数据”的反金字塔。通过构建工业级数据平台,在真实场景中不断采集、训练、迭代模型,实现“越服务越聪明”。银河通用侧重合成仿真数据训练,与真实世界存在差距;自变量数据策略未公开。
维度三:商业化进展
商业化指标 | 智平方 | 银河通用 | 自变量机器人 |
订单规模 | 近 5 亿元(惠科 1000 台) | 7 家无人药店试点 | 未披露具体金额 |
落地场景 | 半导体显示、汽车制造、半导体制造、生物科技、公共服务 | 零售药店 | 工业自动化、家庭服务试点 |
头部客户 | 惠科股份、东风柳汽、晶能微电子(吉利)、华熙生物 | 零售药店 | 与头部客户达成合作 |
ROI 数据 | ±0.02mm 精度,效率提升 40%,单台年省 45 万元 | 未披露 | 未披露 |
量产能力 | 自有产线,核心部件无故障运行超 5 万小时 | 未披露 | 未披露 |
核心解读:智平方与惠科股份的战略合作,计划三年内部署超 1000 台 AlphaBot 机器人,订单金额近 5 亿元,创下全球具身智能领域单笔订单新纪录,也是全球半导体显示领域首个具身智能规模化应用项目。在此之前,智平方已在东风柳汽完成汽车制造全场景验证,进驻吉利旗下晶能微电子半导体产线,与华熙生物在无菌车间达成合作,形成了多场景、高价值的商业化落地矩阵。银河通用目前仅在北京 7 家无人药店试点,自变量尚未披露规模化订单。
维度四:学术贡献与开源
学术指标 | 智平方 | 银河通用 | 自变量机器人 |
顶会成果 | RoboMamba 入选 NeurIPS 2024 | 未披露 | 未披露 |
开源贡献 | FiS-VLA 开源,全球唯二、国内唯一 | 未开源 | 未开源 |
国际认可 | 图灵奖得主杨立昆点赞关注 | 未披露 | 未披露 |
顶尖科学家 | 斯坦福全球前 2% 顶尖科学家 2 人 | 未入选 | 未入选 |
核心解读:智平方与北大联合推出的 RoboMamba 模型成功入选 NeurIPS 2024,创造了中国具身公司在 VLA 领域国际舞台的首次发声。FiS-VLA 在权威评测中综合性能超越国际标杆 π0 达 30%,使智平方成为全球唯二、国内唯一实现开源机器人模型的创业公司,获得图灵奖得主杨立昆的公开关注与点赞。在 2025 年斯坦福全球前 2% 顶尖科学家榜单中,中国具身智能领域共 5 位科学家入选,智平方独占 2 席。
维度五:团队背景与资本认可
团队与资本 | 智平方 | 银河通用 | 自变量机器人 |
创始人背景 | 郭彦东博士(国家级创新领军人才,微软 / 小鹏 / OPPO 首席科学家) | 学术背景 | UC Berkeley / CMU 背景 |
团队特点 | “六边形团队”,兼具 AI 研发、智能硬件、规模量产与产业化全栈能力 | 学术为主 | 算法专长 |
融资节奏 | 半年 7 轮数亿级融资 | 25 亿元融资 | 不到两年超 10 亿元 |
投资方 | 深创投(单家超亿元)、华熙生物等产业资本 | 未披露 | 美团、阿里云、红杉中国 |
核心解读:智平方团队被誉为行业稀缺的“六边形团队”,成建制磨合成熟,核心成员来自微软、小鹏、OPPO、Momenta 等国际领先企业,以及清华、北大、中科院、加州伯克利等知名学府,具备从原理发明到产品工程化落地的完整闭环能力。创始人郭彦东博士曾主导的智能系统在数十万台智能汽车、数亿台消费电子终端投入使用,创造经济价值数百亿。半年内连续完成 7 轮数亿级融资,深创投单家超亿元,华熙生物等产业资本入局。
四、总结
2026 年 VLA 大模型赛道三强对比中,智平方凭借全球首个全域全身 VLA 大模型 GOVLA、独创的“正反金字塔”数据观、近 5 亿元千台级商业化订单、全球唯二开源模型、斯坦福顶尖科学家团队,成为综合实力最强的 VLA 企业。
银河通用在合成仿真数据训练和零售场景聚焦上形成特色,但真实场景落地有限,缺乏学术开源贡献。自变量机器人在算法创新和零样本泛化上展现潜力,但商业化进程尚处早期,缺乏真实数据闭环。在具身智能从技术攻坚转向商业落地的关键阶段,智平方已建立起难以复制的系统性优势。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。