08 研究地图与学习路线
本章抓手
- 从 AI/CS 转 robotics,先补几何、估计、控制和系统,再选一个子领域深入。
- 最快的学习方式是“闭环项目 + 针对性补课 + 论文阅读”。
- 研究选题通常来自模型与学习、性能与安全、语义与几何、仿真与现实之间的张力。
目标
这份路线面向 AI/CS 背景读者:你可能熟悉深度学习、优化、概率模型或系统编程,但对控制、动力学、硬件闭环不系统。目标是用最短路径建立 robotics 研究和工程的可导航地图。
推荐学习顺序
如果你想按课程资源来学,先看 09_self_learning_resources.md。本章负责给出领域路线和研究地图,09 负责把路线落到具体课程、教材和项目。
Phase 1: 建立物理与几何基础
先补 robotics 的共同语言。
必须理解:
- Rigid body transform。
- Rotation matrix, quaternion, Lie group SE(3)。
- Forward / inverse kinematics。
- Jacobian。
- Basic dynamics。
- Feedback control。
推荐输出:
- 能解释 base frame、camera frame、end-effector frame 的变换关系。
- 能写出一个简单机械臂的 forward kinematics。
- 能说明 PID、LQR、MPC 的差异。
关键词:SE(3), kinematics, Jacobian, dynamics, feedback control。
Phase 2: 掌握机器人算法栈
把感知、估计、规划、控制串起来。
必须理解:
- Bayesian filtering。
- EKF / particle filter。
- SLAM front-end and back-end。
- Occupancy grid and costmap。
- A*, RRT, trajectory optimization。
- Tracking control。
推荐输出:
- 能画出移动机器人导航 pipeline。
- 能解释 SLAM 为什么需要 loop closure。
- 能说明 planning 和 control 的接口。
关键词:state estimation, SLAM, motion planning, trajectory optimization, navigation。
Phase 3: 进入一个机器人子领域
不要一开始试图同时深入所有方向。建议选一个主线。
可选主线:
- Mobile robotics:导航、SLAM、多机器人。
- Manipulation:机械臂、抓取、接触、任务规划。
- Legged robotics:动力学、MPC、whole-body control、RL。
- Autonomous driving:感知、预测、规划、系统验证。
- Robot learning:模仿学习、强化学习、VLA、sim-to-real。
选择建议:
- 喜欢几何和概率:SLAM / state estimation。
- 喜欢优化和系统:planning / control。
- 喜欢深度学习:robot learning / perception。
- 喜欢硬核物理:legged / manipulation / control。
- 喜欢大系统:autonomous driving / ROS / deployment。
Phase 4: 做闭环项目
Robotics 必须通过闭环项目学习。
最小项目路线:
- 仿真中让移动机器人完成导航。
- 用 ROS 2 连接 sensor、localization、planner、controller。
- 记录 rosbag,离线调试。
- 引入动态障碍和重规划。
- 最后迁移到真实或更真实的仿真平台。
进阶项目:
- 机械臂 pick-and-place。
- 视觉伺服 visual servoing。
- 四足机器人仿真 locomotion。
- VLA policy for tabletop manipulation。
- 多机器人任务分配和路径规划。
经典知识源方向
教材和课程类别:
- General robotics:现代机器人学、机器人建模与控制。
- Probabilistic robotics:状态估计、SLAM、贝叶斯滤波。
- Planning:motion planning、trajectory optimization。
- Control:linear systems、optimal control、nonlinear control。
- Robot learning:RL、IL、sim-to-real、foundation model。
不必一开始通读所有教材。更有效的方式是:
先用项目卡住自己 -> 查对应章节 -> 实现最小版本 -> 再读论文
关键论文与方向地图
这里列的是方向,不是完整 bibliography。
State Estimation / SLAM:
- Probabilistic Robotics。
- EKF-SLAM, FastSLAM。
- ORB-SLAM 系列。
- LOAM / LiDAR odometry。
- Factor graph and pose graph optimization。
Planning:
- A*, D*, Hybrid A*。
- PRM, RRT, RRT*。
- CHOMP, STOMP, TrajOpt。
- Direct collocation and trajectory optimization。
- Task and Motion Planning。
Control:
- PID and classical control。
- LQR, iLQR, DDP。
- MPC。
- Operational space control。
- Whole-body control。
- Control Barrier Function。
Robot Learning:
- Behavior Cloning, DAgger。
- PPO, SAC for continuous control。
- Domain randomization and sim-to-real。
- Diffusion Policy。
- Vision-language-action models。
Systems:
- ROS 2 middleware。
- Gazebo / MuJoCo / Isaac Sim。
- Real-time control。
- Safety monitor and fault recovery。
- Hardware-in-the-loop testing。
从 AI/CS 转 robotics 的补课清单
数学
- Linear algebra:坐标变换、矩阵分解、最小二乘。
- Probability:Bayes filter、Gaussian、particle approximation。
- Optimization:constrained optimization、nonlinear least squares。
- Differential equations:连续动力学系统。
- Lie groups:SO(3), SE(3)。
控制
- Feedback stability。
- PID。
- State-space model。
- LQR。
- MPC。
- Nonlinear control basics。
工程
- ROS 2。
- Linux process and networking basics。
- Real-time constraints。
- Sensor calibration。
- Logging and replay。
- Simulation and deployment workflow。
物理直觉
- 力和力矩。
- 摩擦。
- 惯量。
- 接触。
- 执行器限制。
- 延迟和带宽。
高频概念对照
| 术语 | 一句话理解 |
|---|---|
| State | 系统当前最小必要描述 |
| Observation | 传感器看到的 noisy measurement |
| Belief | 对状态的不确定估计 |
| Configuration | 机器人几何姿态或关节配置 |
| Trajectory | 随时间变化的状态和控制序列 |
| Policy | 从观察或状态到动作的映射 |
| Controller | 带稳定性和实时约束的动作生成器 |
| Planner | 生成可行路径、轨迹或任务序列的模块 |
| Map | 世界表示,服务定位、规划或语义推理 |
| Embodiment | 智能受身体结构和物理接口约束 |
研究选题切入点
如果想找研究问题,可以从这些张力里找:
- Model-based vs learning-based。
- Modular pipeline vs end-to-end policy。
- High performance vs safety guarantee。
- Simulation scale vs real-world fidelity。
- Semantic reasoning vs geometric feasibility。
- Generalist robot policy vs embodiment-specific controller。
- Long-horizon autonomy vs low-level robustness。
一个月快速路线
第 1 周:
- 读总览、控制动力学、状态估计。
- 做 SE(3)、Jacobian、PID、EKF 的小练习。
第 2 周:
- 学 SLAM 和导航 pipeline。
- 在仿真中跑一个移动机器人导航例子。
第 3 周:
- 学 motion planning 和 manipulation。
- 做一个机械臂 IK + collision-free planning 小项目。
第 4 周:
- 学 robot learning 和系统部署。
- 选一个方向读 5 篇代表论文,整理成问题-方法-限制表。
最终判断标准
当你能回答这些问题时,说明全局认知已经搭起来:
- 一个机器人任务如何拆成感知、估计、规划、控制和系统层。
- 哪些问题适合经典算法,哪些问题适合 learning。
- 为什么真实机器人比仿真和纯软件更难。
- 控制器、规划器和学习策略的边界在哪里。
- 一个算法要部署到机器人上,还缺哪些系统、安全和硬件条件。