DocProgress

你在 Research Map / Learning Path

先确认本页回答什么问题,再决定读完后回路线、资源还是项目。

阅读前提
想读论文或规划长期学习,但容易被热点打散。
读完产出
能把论文归到数据、表示、动作、验证、安全或部署问题。
下一步
进入前沿雷达或选择一个复现实验。
失败模式入口
只跟 topic,不问它解决了哪个系统瓶颈。

08 研究地图与学习路线

本章抓手

  • 从 AI/CS 转 robotics,先补几何、估计、控制和系统,再选一个子领域深入。
  • 最快的学习方式是“闭环项目 + 针对性补课 + 论文阅读”。
  • 研究选题通常来自模型与学习、性能与安全、语义与几何、仿真与现实之间的张力。

目标

这份路线面向 AI/CS 背景读者:你可能熟悉深度学习、优化、概率模型或系统编程,但对控制、动力学、硬件闭环不系统。目标是用最短路径建立 robotics 研究和工程的可导航地图。

推荐学习顺序

如果你想按课程资源来学,先看 09_self_learning_resources.md。本章负责给出领域路线和研究地图,09 负责把路线落到具体课程、教材和项目。

Phase 1: 建立物理与几何基础

先补 robotics 的共同语言。

必须理解:

  • Rigid body transform。
  • Rotation matrix, quaternion, Lie group SE(3)。
  • Forward / inverse kinematics。
  • Jacobian。
  • Basic dynamics。
  • Feedback control。

推荐输出:

  • 能解释 base frame、camera frame、end-effector frame 的变换关系。
  • 能写出一个简单机械臂的 forward kinematics。
  • 能说明 PID、LQR、MPC 的差异。

关键词:SE(3), kinematics, Jacobian, dynamics, feedback control。

Phase 2: 掌握机器人算法栈

把感知、估计、规划、控制串起来。

必须理解:

  • Bayesian filtering。
  • EKF / particle filter。
  • SLAM front-end and back-end。
  • Occupancy grid and costmap。
  • A*, RRT, trajectory optimization。
  • Tracking control。

推荐输出:

  • 能画出移动机器人导航 pipeline。
  • 能解释 SLAM 为什么需要 loop closure。
  • 能说明 planning 和 control 的接口。

关键词:state estimation, SLAM, motion planning, trajectory optimization, navigation。

Phase 3: 进入一个机器人子领域

不要一开始试图同时深入所有方向。建议选一个主线。

可选主线:

  • Mobile robotics:导航、SLAM、多机器人。
  • Manipulation:机械臂、抓取、接触、任务规划。
  • Legged robotics:动力学、MPC、whole-body control、RL。
  • Autonomous driving:感知、预测、规划、系统验证。
  • Robot learning:模仿学习、强化学习、VLA、sim-to-real。

选择建议:

  • 喜欢几何和概率:SLAM / state estimation。
  • 喜欢优化和系统:planning / control。
  • 喜欢深度学习:robot learning / perception。
  • 喜欢硬核物理:legged / manipulation / control。
  • 喜欢大系统:autonomous driving / ROS / deployment。

Phase 4: 做闭环项目

Robotics 必须通过闭环项目学习。

最小项目路线:

  • 仿真中让移动机器人完成导航。
  • 用 ROS 2 连接 sensor、localization、planner、controller。
  • 记录 rosbag,离线调试。
  • 引入动态障碍和重规划。
  • 最后迁移到真实或更真实的仿真平台。

进阶项目:

  • 机械臂 pick-and-place。
  • 视觉伺服 visual servoing。
  • 四足机器人仿真 locomotion。
  • VLA policy for tabletop manipulation。
  • 多机器人任务分配和路径规划。

经典知识源方向

教材和课程类别:

  • General robotics:现代机器人学、机器人建模与控制。
  • Probabilistic robotics:状态估计、SLAM、贝叶斯滤波。
  • Planning:motion planning、trajectory optimization。
  • Control:linear systems、optimal control、nonlinear control。
  • Robot learning:RL、IL、sim-to-real、foundation model。

不必一开始通读所有教材。更有效的方式是:

先用项目卡住自己 -> 查对应章节 -> 实现最小版本 -> 再读论文

关键论文与方向地图

这里列的是方向,不是完整 bibliography。

State Estimation / SLAM:

  • Probabilistic Robotics。
  • EKF-SLAM, FastSLAM。
  • ORB-SLAM 系列。
  • LOAM / LiDAR odometry。
  • Factor graph and pose graph optimization。

Planning:

  • A*, D*, Hybrid A*。
  • PRM, RRT, RRT*。
  • CHOMP, STOMP, TrajOpt。
  • Direct collocation and trajectory optimization。
  • Task and Motion Planning。

Control:

  • PID and classical control。
  • LQR, iLQR, DDP。
  • MPC。
  • Operational space control。
  • Whole-body control。
  • Control Barrier Function。

Robot Learning:

  • Behavior Cloning, DAgger。
  • PPO, SAC for continuous control。
  • Domain randomization and sim-to-real。
  • Diffusion Policy。
  • Vision-language-action models。

Systems:

  • ROS 2 middleware。
  • Gazebo / MuJoCo / Isaac Sim。
  • Real-time control。
  • Safety monitor and fault recovery。
  • Hardware-in-the-loop testing。

从 AI/CS 转 robotics 的补课清单

数学

  • Linear algebra:坐标变换、矩阵分解、最小二乘。
  • Probability:Bayes filter、Gaussian、particle approximation。
  • Optimization:constrained optimization、nonlinear least squares。
  • Differential equations:连续动力学系统。
  • Lie groups:SO(3), SE(3)。

控制

  • Feedback stability。
  • PID。
  • State-space model。
  • LQR。
  • MPC。
  • Nonlinear control basics。

工程

  • ROS 2。
  • Linux process and networking basics。
  • Real-time constraints。
  • Sensor calibration。
  • Logging and replay。
  • Simulation and deployment workflow。

物理直觉

  • 力和力矩。
  • 摩擦。
  • 惯量。
  • 接触。
  • 执行器限制。
  • 延迟和带宽。

高频概念对照

术语一句话理解
State系统当前最小必要描述
Observation传感器看到的 noisy measurement
Belief对状态的不确定估计
Configuration机器人几何姿态或关节配置
Trajectory随时间变化的状态和控制序列
Policy从观察或状态到动作的映射
Controller带稳定性和实时约束的动作生成器
Planner生成可行路径、轨迹或任务序列的模块
Map世界表示,服务定位、规划或语义推理
Embodiment智能受身体结构和物理接口约束

研究选题切入点

如果想找研究问题,可以从这些张力里找:

  • Model-based vs learning-based。
  • Modular pipeline vs end-to-end policy。
  • High performance vs safety guarantee。
  • Simulation scale vs real-world fidelity。
  • Semantic reasoning vs geometric feasibility。
  • Generalist robot policy vs embodiment-specific controller。
  • Long-horizon autonomy vs low-level robustness。

一个月快速路线

第 1 周:

  • 读总览、控制动力学、状态估计。
  • 做 SE(3)、Jacobian、PID、EKF 的小练习。

第 2 周:

  • 学 SLAM 和导航 pipeline。
  • 在仿真中跑一个移动机器人导航例子。

第 3 周:

  • 学 motion planning 和 manipulation。
  • 做一个机械臂 IK + collision-free planning 小项目。

第 4 周:

  • 学 robot learning 和系统部署。
  • 选一个方向读 5 篇代表论文,整理成问题-方法-限制表。

最终判断标准

当你能回答这些问题时,说明全局认知已经搭起来:

  • 一个机器人任务如何拆成感知、估计、规划、控制和系统层。
  • 哪些问题适合经典算法,哪些问题适合 learning。
  • 为什么真实机器人比仿真和纯软件更难。
  • 控制器、规划器和学习策略的边界在哪里。
  • 一个算法要部署到机器人上,还缺哪些系统、安全和硬件条件。

Continue