深度分析 具身智能人形机器人机器人AI自动化
云
云铭
进化之路 · 扫码阅读
微信 · 浏览器扫码
在手机上获得更好的阅读体验
具身智能2026:人形机器人的ChatGPT时刻
2023年是ChatGPT让世界认识大语言模型的一年。2026年,具身智能正在经历它的”ChatGPT时刻”——从实验室的Demo变成工厂和仓库里的生产力。
核心概念
具身智能 vs 传统AI vs 传统机器人
传统AI:纯数字世界
GPT-5 → 理解语言、生成代码、分析数据
但不能倒一杯水
传统工业机器人:纯物理世界
机械臂 → 精确定位、重复动作
但不理解自己在做什么
具身智能:物理世界 + 智能理解
人形机器人 → 理解"把杯子递给我"这个指令
→ 找到杯子
→ 规划抓取路径
→ 用合适的力度拿起杯子
→ 递给正确的人
→ 如果杯子被移动了,能够适应
为什么是现在
具身智能爆发的五个前提在2026年同时成熟:
1. 大模型理解物理世界的能力达到临界点
GPT-5 的视觉理解能力 → "知道"物体应该如何被操作
2. 硬件成本大幅下降
2020年人形机器人BOM成本: ~$200万(Atlas)
2026年人形机器人BOM成本: ~$3万(宇树H1等)
降幅: 98.5%
3. 仿真平台就绪
NVIDIA Isaac Sim → 百万次训练只需几小时
虚拟→现实迁移(Sim-to-Real)成功率 > 85%
4. 精密制造能力突破
行星滚柱丝杠 → 精度从微米到纳米
力矩传感器 → 力控精度达到0.1N级别
空心杯电机 → 功率密度翻倍
5. 产业需求迫切
全球制造业劳动力缺口: 8500万(2026)
中国制造业工人平均年龄: 43岁(持续上升)
物流仓储用工成本: 年增15%+
技术路线
三大流派
流派A:通用基础模型 + 本体验证
代表:Figure AI, 智元机器人
思路:先做好"大脑"(AI),再适配"身体"
优势:泛化能力强,能处理从未见过的任务
挑战:需要海量训练数据(仿真+真机)
流派B:精品本体 + AI赋能
代表:Tesla Optimus, 宇树科技
思路:先做好"身体",再用AI逐步聪明化
优势:硬件可控,成本可控,场景明确
挑战:软件能力可能成为天花板
流派C:垂直场景深度
代表:Agility Digit(物流), 银河通用(零售)
思路:不做万能机器人,做某个场景的世界第一
优势:落地快,收入确定性高
挑战:天花板有限,跨场景难
关键技术难点
2026年仍待攻克的技术瓶颈:
"手"的问题:
├── 灵巧操作(穿针、叠衣、插拔接口)
├── 触觉反馈(感知物体的材质/温度/滑动)
├── 力控精度(施加恰到好处的力量)
└── 双手协调(一只手稳住物体,另一只手操作)
"脚"的问题:
├── 动态平衡(跑步/跳跃/不平地面)
├── 能效比(人形机器人行走能耗是人类的10倍)
├── 跌倒恢复(摔倒后自己站起来)
└── 续航(连续工作时间通常 < 2小时)
"脑"的问题:
├── 空间智能(理解复杂的三维环境)
├── 物理常识(知道"玻璃杯会碎,不能用力摔")
├── 任务泛化(学叠T恤 → 会叠衬衫 → 会叠任何衣物)
└── 人机协作(安全地与人类共享工作空间)
全球竞争格局
主要玩家对比
| 公司 | 产品 | 价格 | 自由度 | 关键能力 | 量产状态 |
|---|---|---|---|---|---|
| Figure AI | Figure 02 | ~$50K | 35 DOF | GPT-5驱动 | 小批量 |
| Tesla | Optimus Gen 3 | ~$20K(目标) | 40 DOF | FSD迁移 | 内部试用 |
| 宇树科技 | H1 | $90K | 35 DOF | 电机模组自研 | 已量产 |
| 智元机器人 | 远征A2 | ~$60K | 41 DOF | 全栈自研 | 小批量 |
| 1X Tech | NEO | ~$40K | 32 DOF | 家用场景 | 小批量 |
| Boston Dynamics | eAtlas | 未定价 | 40+ DOF | 运动能力最强 | 未量产 |
| 优必选 | Walker S | ~$80K | 36 DOF | 已进工厂 | 已量产 |
| Agility | Digit | ~$25K | 20 DOF | 物流专用 | 量产 |
中国vs美国
美国优势:
├── AI基础模型能力领先(GPT-5/Gemini/Claude)
├── 仿真平台生态(NVIDIA Isaac Sim独大)
├── 资本密度高(Figure单轮融资$6.75B)
└── 大学研究领先(Stanford/MIT/CMU)
中国优势:
├── 供应链完整度和成本优势(BOM便宜30-50%)
├── 制造业场景丰富(世界工厂的天然试验田)
├── 工程化能力(从Demo到量产的速度更快)
├── 政策支持(工信部明确支持人形机器人产业)
└── 庞大内需市场(制造业+物流+服务业)
互补格局:
┌──────────────────────────────┐
│ 美国做"脑" → 中国做"身体" │
│ 或者 │
│ 美国创新 → 中国规模化 │
└──────────────────────────────┘
应用场景落地时间线
分阶段渗透
2025-2027(已落地/将落地):
├── 汽车制造:物料搬运、零部件装配、质量检测
├── 仓储物流:拣选、打包、码垛、搬运
├── 3C电子:精密装配、柔性产线
├── 新能源:电池组装、光伏板清洁
└── 零售服务:引导、盘点、补货
2027-2029(规模化阶段):
├── 建筑工地:物料运输、简单施工
├── 医院:药品配送、患者搬运、消毒
├── 农业:采摘、分拣、植保
├── 家政服务:清洁、洗衣、简单烹饪
└── 公共服务:安保巡逻、消防侦查
2030+(通用阶段):
├── 家庭管家(做饭、打扫、照顾老人)
├── 全自主工厂(从原料到成品零人工)
└── 危险环境替代人类(深海、太空、核设施)
商业模式的三种可能
1. 卖硬件
传统模式:一次性销售
$30K-90K/台
毛利率:15-35%
代表:宇树、优必选
优点:收入确认快
缺点:天花板有限(单个客户购买台数有限)
2. RaaS(Robot as a Service)
机器人订阅服务:
$2,000-5,000/月/台
包含:机器人 + 维护 + 软件升级 + AI能力
代表:Agility Digit
优点:ARR(年度经常性收入)可预测
缺点:前期资金压力大(需自己垫付硬件成本)
3. 混合模式
硬件销售 + 软件订阅:
硬件:$30K+(一次付清,覆盖成本)
软件:$500-1000/月(AI能力 + 新技能更新)
代表:Figure AI的未来计划
优势:兼具硬件收入和持续性收入
这是2026年最被看好的模式
投资框架
确定性排序
第一梯队(高确定性):
├── 核心零部件
│ ├── 行星滚柱丝杠(人形机器人用量是传统10倍+)
│ ├── 谐波减速器/RV减速器
│ ├── 六维力/力矩传感器
│ ├── 空心杯电机
│ └── 3D视觉传感器
│
├── 逻辑:无论哪家胜出,零部件需求确定增长
└── A股代表:绿的谐波、双环传动、奥比中光
第二梯队(中高确定性):
├── 整机龙头
│ ├── 有量产能力和客户基础的
│ └── 有AI能力的
│
└── A股代表:机器人、宇树科技(拟IPO)
第三梯队(高弹性):
├── 软件和AI服务
│ ├── 机器人基础模型
│ ├── Sim-to-Real服务
│ └── Robot运维平台
│
└── 多数为一级市场机会
第四梯队(远期):
├── 家用机器人
└── 机器人生态(应用商店等)
关键风险
1. 技术风险:泛化能力不如预期
→ 应对:关注在单一场景已经证明自己的公司
2. 成本风险:降本速度慢于预期
→ 应对:关注供应链垂直整合能力强的公司
3. 安全风险:机器人事故引发监管收紧
→ 应对:关注有完善安全体系的公司
4. 预期风险:市场对人形机器人的预期过高
→ 应对:区分"长期叙事"和"短期业绩"
具身智能是AI时代最性感的叙事——给智能以身体,给机器以灵魂。但叙事归叙事,投资归投资。2026年最确定的机会不在”谁会成为机器人界的iPhone”,而在”做铲子的”——那些无论哪家机器人公司成功都需要采购的核心零部件。毕竟,当年的淘金热,赚到钱的不是淘金者,是卖铲子和牛仔裤的。