03 控制、运动学与动力学
本章抓手
- 运动学回答“几何上能不能到”,动力学回答“需要什么力才能做到”。
- 控制的核心不是产生动作,而是在扰动、延迟和模型误差下稳定完成动作。
- 对 AI/CS 背景来说,MPC 可以理解为在线约束规划,controller 可以理解为高频稳定 policy。
它解决什么问题
控制与动力学是 AI/CS 背景进入 robotics 时最需要补的一层。机器人的动作不是离散 token,而是受质量、惯量、摩擦、接触、延迟和执行器限制影响的连续物理过程。
这一层回答:
- 机器人几何上能不能到达目标。
- 需要什么速度、加速度和力矩。
- 如何在扰动和模型误差下稳定跟踪。
- 接触发生时如何不失稳、不损坏物体。
运动学 Kinematics
运动学只关心几何运动,不直接考虑力和质量。
核心概念:
- Configuration
q:机器人关节角或位姿。 - Forward kinematics:从关节配置求末端位姿。
- Inverse kinematics:从目标末端位姿求关节配置。
- Jacobian
J(q):关节速度到末端速度的线性映射。 - Singularity:雅可比矩阵退化,某些方向不可控或需要无限关节速度。
代表方法:
- Denavit-Hartenberg parameters。
- Product of Exponentials。
- Numerical inverse kinematics。
- Jacobian pseudo-inverse。
- Null-space control。
和其他模块的关系:
- Motion planning 在 configuration space 中搜索。
- Operational space control 依赖 Jacobian。
- Manipulation 中抓取和避障都需要 kinematics。
学习关键词:forward kinematics, inverse kinematics, Jacobian, singularity, SE(3)。
动力学 Dynamics
动力学研究力、力矩和运动之间的关系。
机械臂常见形式:
M(q) q_ddot + C(q, q_dot) q_dot + g(q) = tau + J(q)^T f_ext
其中:
M(q):mass matrix。C(q, q_dot):Coriolis / centrifugal effects。g(q):gravity term。tau:关节力矩。J(q)^T f_ext:外部接触力映射到关节空间。
核心概念:
- Underactuation:控制输入少于自由度。
- Contact dynamics:接触约束、摩擦锥、碰撞。
- Model uncertainty:质量、摩擦、负载、地面属性不准。
- Hybrid dynamics:连续运动加离散接触切换。
代表方法:
- Lagrangian dynamics。
- Newton-Euler algorithms。
- Recursive Newton-Euler Algorithm。
- Articulated Body Algorithm。
- Rigid body simulation。
学习关键词:robot dynamics, rigid body dynamics, mass matrix, contact dynamics, underactuated systems。
PID 控制
PID 是最常见的底层反馈控制方法。它根据误差的比例、积分和微分项输出控制量。
u = Kp * e + Ki * integral(e) + Kd * derivative(e)
适用场景:
- 电机速度控制。
- 关节位置控制。
- 简单轨迹跟踪。
- 已有稳定低层硬件控制器的系统。
局限:
- 对强耦合、多变量、非线性系统不够系统。
- 参数调节依赖经验。
- 高延迟和噪声会让 derivative 项敏感。
学习关键词:PID, feedback control, gain tuning, stability margin。
LQR 与最优控制
LQR 是线性系统上的经典最优控制方法,优化状态误差和控制代价。
系统形式:
x_dot = A x + B u
cost = x^T Q x + u^T R u
直觉:
Q越大,越重视状态误差。R越大,越限制控制输入。- 解出来的是线性反馈律
u = -Kx。
扩展:
- TVLQR:time-varying LQR。
- iLQR:iterative LQR,用于非线性系统轨迹优化。
- DDP:Differential Dynamic Programming。
学习关键词:LQR, Riccati equation, optimal control, iLQR, DDP。
MPC 模型预测控制
MPC 在每个控制周期内向未来滚动优化一段控制序列,只执行第一步,然后重新观测和优化。
核心优势:
- 可以显式处理约束:速度、加速度、力矩、碰撞、安全距离。
- 能利用动力学模型预测未来。
- 适合车辆、无人机、腿足机器人和工业控制。
典型结构:
observe current state
solve finite-horizon constrained optimization
apply first control
repeat
关键权衡:
- 模型越准确,预测越好。
- 优化越复杂,实时性越难。
- horizon 越长,看得越远但计算越贵。
学习关键词:model predictive control, receding horizon control, constrained optimization, real-time optimization。
非线性控制 Nonlinear Control
机器人系统通常非线性很强,尤其是无人机、腿足机器人和高速机械臂。
代表方法:
- Feedback linearization。
- Sliding mode control。
- Lyapunov-based control。
- Geometric control on SO(3) / SE(3)。
- Control Lyapunov Function。
- Control Barrier Function。
核心概念:
- Lyapunov stability:构造能量函数证明系统收敛。
- Region of attraction:控制器能保证稳定的状态范围。
- Barrier function:让系统不进入不安全集合。
学习关键词:nonlinear control, Lyapunov, feedback linearization, geometric control, control barrier function。
阻抗与导纳控制 Impedance / Admittance Control
接触任务中,机器人不能只控制位置,还要控制与环境交互时的力学行为。
Impedance control:
- 输入是运动误差。
- 输出期望力或力矩。
- 让机器人表现得像虚拟弹簧-阻尼-质量系统。
Admittance control:
- 输入是外力。
- 输出期望运动。
- 常用于本体刚、位置控制接口强的机器人。
典型场景:
- 插孔、打磨、装配。
- 人机协作。
- 抓取易碎物体。
- 康复机器人。
学习关键词:impedance control, admittance control, force control, compliant manipulation。
Operational Space Control
Operational space control 直接在末端执行器空间控制任务,而不是只在关节空间控制。
核心思想:
- 任务通常定义在末端空间,例如“夹爪移动到杯子上方”。
- 关节空间只是实现任务的内部坐标。
- 使用 Jacobian 和动力学把末端期望力映射到关节力矩。
常见应用:
- 机械臂末端轨迹跟踪。
- 多任务优先级控制。
- 接触任务中的力位混合控制。
学习关键词:operational space control, task space control, Jacobian transpose, null-space。
Whole-Body Control
Whole-body control 常用于人形和四足机器人,需要同时协调多个接触点、身体姿态和末端任务。
核心问题:
- 哪些脚在接触地面。
- 接触力是否满足摩擦锥。
- 身体质心如何保持稳定。
- 手、脚、躯干和头部任务如何分配优先级。
代表方法:
- Quadratic Programming based whole-body control。
- Centroidal dynamics control。
- Hierarchical task control。
- Contact force optimization。
学习关键词:whole-body control, centroidal dynamics, contact force, QP control, humanoid control。
AI/CS 背景的理解建议
- 把控制器理解成高频、带稳定性约束的 policy。
- 把动力学模型理解成环境 transition model,但它有物理结构。
- 把 MPC 理解成在线反复解的 constrained planning。
- 把 state estimation 理解成对 partially observable system 的 belief tracking。
- 不要把 learning policy 直接等同于可部署控制器,部署还需要稳定性、安全和实时性。