08 研究地图与学习路线

本章抓手

从 AI/CS 转 robotics，先补几何、估计、控制和系统，再选一个子领域深入。
最快的学习方式是“闭环项目 + 针对性补课 + 论文阅读”。
研究选题通常来自模型与学习、性能与安全、语义与几何、仿真与现实之间的张力。

目标

这份路线面向 AI/CS 背景读者：你可能熟悉深度学习、优化、概率模型或系统编程，但对控制、动力学、硬件闭环不系统。目标是用最短路径建立 robotics 研究和工程的可导航地图。

经典知识源方向

教材和课程类别：

General robotics：现代机器人学、机器人建模与控制。
Probabilistic robotics：状态估计、SLAM、贝叶斯滤波。
Planning：motion planning、trajectory optimization。
Control：linear systems、optimal control、nonlinear control。
Robot learning：RL、IL、sim-to-real、foundation model。

不必一开始通读所有教材。更有效的方式是：

先用项目卡住自己 -> 查对应章节 -> 实现最小版本 -> 再读论文

关键论文与方向地图

这里列的是方向，不是完整 bibliography。

State Estimation / SLAM：

Probabilistic Robotics。
EKF-SLAM, FastSLAM。
ORB-SLAM 系列。
LOAM / LiDAR odometry。
Factor graph and pose graph optimization。

Planning：

A*, D*, Hybrid A*。
PRM, RRT, RRT*。
CHOMP, STOMP, TrajOpt。
Direct collocation and trajectory optimization。
Task and Motion Planning。

Control：

PID and classical control。
LQR, iLQR, DDP。
MPC。
Operational space control。
Whole-body control。
Control Barrier Function。

Robot Learning：

Behavior Cloning, DAgger。
PPO, SAC for continuous control。
Domain randomization and sim-to-real。
Diffusion Policy。
Vision-language-action models。

Systems：

ROS 2 middleware。
Gazebo / MuJoCo / Isaac Sim。
Real-time control。
Safety monitor and fault recovery。
Hardware-in-the-loop testing。

从 AI/CS 转 robotics 的补课清单

数学

Linear algebra：坐标变换、矩阵分解、最小二乘。
Probability：Bayes filter、Gaussian、particle approximation。
Optimization：constrained optimization、nonlinear least squares。
Differential equations：连续动力学系统。
Lie groups：SO(3), SE(3)。

控制

Feedback stability。
PID。
State-space model。
LQR。
MPC。
Nonlinear control basics。

工程

ROS 2。
Linux process and networking basics。
Real-time constraints。
Sensor calibration。
Logging and replay。
Simulation and deployment workflow。

物理直觉

力和力矩。
摩擦。
惯量。
接触。
执行器限制。
延迟和带宽。

高频概念对照

术语	一句话理解
State	系统当前最小必要描述
Observation	传感器看到的 noisy measurement
Belief	对状态的不确定估计
Configuration	机器人几何姿态或关节配置
Trajectory	随时间变化的状态和控制序列
Policy	从观察或状态到动作的映射
Controller	带稳定性和实时约束的动作生成器
Planner	生成可行路径、轨迹或任务序列的模块
Map	世界表示，服务定位、规划或语义推理
Embodiment	智能受身体结构和物理接口约束

研究选题切入点

如果想找研究问题，可以从这些张力里找：

Model-based vs learning-based。
Modular pipeline vs end-to-end policy。
High performance vs safety guarantee。
Simulation scale vs real-world fidelity。
Semantic reasoning vs geometric feasibility。
Generalist robot policy vs embodiment-specific controller。
Long-horizon autonomy vs low-level robustness。

一个月快速路线

第 1 周：

读总览、控制动力学、状态估计。
做 SE(3)、Jacobian、PID、EKF 的小练习。

第 2 周：

学 SLAM 和导航 pipeline。
在仿真中跑一个移动机器人导航例子。

第 3 周：

学 motion planning 和 manipulation。
做一个机械臂 IK + collision-free planning 小项目。

第 4 周：

学 robot learning 和系统部署。
选一个方向读 5 篇代表论文，整理成问题-方法-限制表。

最终判断标准

当你能回答这些问题时，说明全局认知已经搭起来：

一个机器人任务如何拆成感知、估计、规划、控制和系统层。
哪些问题适合经典算法，哪些问题适合 learning。
为什么真实机器人比仿真和纯软件更难。
控制器、规划器和学习策略的边界在哪里。
一个算法要部署到机器人上，还缺哪些系统、安全和硬件条件。

你在 Research Map / Learning Path

08 研究地图与学习路线

本章抓手

目标

推荐学习顺序

Phase 1: 建立物理与几何基础

Phase 2: 掌握机器人算法栈

Phase 3: 进入一个机器人子领域

Phase 4: 做闭环项目

经典知识源方向

关键论文与方向地图

从 AI/CS 转 robotics 的补课清单

数学

控制

工程

物理直觉

高频概念对照

研究选题切入点

一个月快速路线

最终判断标准

你在 Research Map / Learning Path

08 研究地图与学习路线

本章抓手

目标

推荐学习顺序

Phase 1: 建立物理与几何基础

Phase 2: 掌握机器人算法栈

Phase 3: 进入一个机器人子领域

Phase 4: 做闭环项目

经典知识源方向

关键论文与方向地图

从 AI/CS 转 robotics 的补课清单

数学

控制

工程

物理直觉

高频概念对照

研究选题切入点

一个月快速路线

最终判断标准

把本页转成下一步行动