01 Robotics 领域全景
本章抓手
- 先按“平台 + 任务 + 环境 + 自主性”理解一个机器人问题。
- 不同分支共享感知、估计、规划、控制、系统工程这套底层骨架。
- 领域差异主要来自物理平台、接触方式、安全约束和环境复杂度。
它解决什么问题
Robotics 研究如何让机器在物理世界中自主或半自主地完成任务。它同时连接 AI、控制理论、机械工程、电子工程、计算机视觉、优化、概率估计和系统工程。
一个机器人问题通常由四个维度定义:
- 平台是什么:车、机械臂、无人机、腿足机器人、软体机器人、手术机器人。
- 任务是什么:导航、操作、装配、抓取、巡检、搜索救援、人机协作。
- 环境是什么:结构化工厂、道路、仓库、家庭、野外、人体内部、空中水下。
- 自主性多强:遥操作 teleoperation、辅助 autonomy、条件自主、全自主。
五轴全域版图
Robotics 的覆盖面很广,不能只按“感知、规划、控制”几个算法模块理解。更稳的全局地图是五个轴:
| 轴 | 它回答的问题 | 典型范围 |
|---|---|---|
| Platform / Embodiment | 机器人身体是什么 | 轮式、履带、机械臂、移动机械臂、无人机、腿足、人形、软体、连续体、水下、空间、微型机器人 |
| Task / Capability | 机器人要做什么 | 导航、定位建图、抓取、装配、插入、焊接、巡检、清洁、搜索救援、康复、手术、人机协作 |
| Physical Interaction | 它如何和世界发生物理关系 | 非接触移动、刚体接触、柔顺接触、力控、触觉、形变物体、流体、地形接触、人机接触 |
| Environment / Domain | 它在哪里工作 | 工厂、仓库、道路、家庭、医院、农田、矿山、海洋、空中、太空、灾害现场、人体内部 |
| Autonomy / System | 自主程度和系统约束是什么 | teleoperation、shared autonomy、fleet management、real-time safety、certification、long-horizon autonomy |
这五个轴组合起来才是完整 robotics。比如“无人机巡检”和“手术机器人”都用控制和感知,但身体、环境、安全约束、评价指标完全不同。
领域地图的三种读法
按身体读
身体决定动力学、传感器、执行器和控制频率。
| 身体 | 核心能力 | 主要难点 |
|---|---|---|
| Mobile robot | 平面移动、定位、避障 | 地图、动态障碍、长期定位 |
| Manipulator | 高精度末端运动 | IK、碰撞、接触、抓取 |
| Mobile manipulator | 同时移动和操作 | base-arm coordination、任务规划、全身约束 |
| UAV | 三维快速运动 | VIO、姿态控制、能耗、安全降级 |
| Legged / humanoid | 动态平衡和复杂地形 | 接触切换、whole-body control、sim-to-real |
| Soft / continuum robot | 柔顺接触和连续形变 | 状态估计、建模、非线性控制 |
| Underwater / marine robot | 水下导航和操作 | 通信受限、流体扰动、定位困难 |
| Space robot | 极端环境自主操作 | 延迟、可靠性、冗余、远程维护 |
| Micro / medical robot | 小尺度精密操作 | 成像、控制精度、监管和安全 |
按任务读
任务决定系统需要什么表示和评价指标。
| 任务族 | 代表任务 | 关键模块 |
|---|---|---|
| Mobility | 导航、避障、巡检、配送 | localization, mapping, navigation, control |
| Manipulation | 抓取、放置、装配、开门、整理 | perception, IK, motion planning, force control |
| Locomotion | 行走、跑跳、爬坡、越障 | dynamics, MPC, whole-body control, RL |
| Interaction | 共享空间协作、教学、遥操作 | HRI, intent inference, shared autonomy, safety |
| Inspection | 工厂、管道、电力、矿山、农业巡检 | perception, anomaly detection, coverage planning |
| Surgery / Rehab | 手术辅助、康复训练、外骨骼 | precision control, haptics, compliance, certification |
| Fleet / Swarm | 多机器人仓储、无人机集群 | task allocation, MAPF, distributed optimization |
| Long-horizon autonomy | 家庭服务、野外探索、太空任务 | task planning, memory, recovery, monitoring |
按物理交互读
物理交互越复杂,系统越需要控制、估计、接触建模和安全机制。
| 交互类型 | 例子 | 难点 |
|---|---|---|
| Free-space motion | 无人机飞行、底盘导航 | 避障、轨迹跟踪、状态估计 |
| Rigid contact | 抓取、插入、装配 | 摩擦、接触切换、力控 |
| Deformable contact | 布料、线缆、软物体 | 状态难观测、模型难写 |
| Human contact | 康复、外骨骼、协作机器人 | 舒适性、安全、意图不确定 |
| Terrain contact | 四足、人形、野外机器人 | 地形估计、落足、动态稳定 |
| Fluid interaction | 水下机器人、软体气动 | 流体扰动、滞后、低可观测性 |
主要分支
移动机器人 Mobile Robotics
移动机器人关注机器人在环境中的定位、建图、导航和避障。典型平台包括轮式机器人、仓储 AGV/AMR、清洁机器人、配送机器人。
核心问题:
- 我在哪里:localization。
- 周围是什么:mapping / perception。
- 我要怎么走:path planning / navigation。
- 如何安全运动:obstacle avoidance / control。
代表方法:
- SLAM, visual odometry, LiDAR localization。
- A*, D*, RRT, trajectory optimization。
- Dynamic Window Approach, TEB, MPC。
- Occupancy grid, costmap, semantic map。
学习关键词:mobile robotics, SLAM, navigation stack, occupancy grid, costmap, AMR。
机械臂与操作 Manipulation
Manipulation 研究机器人如何移动末端执行器 end-effector,与物体和环境发生接触并完成任务。它比纯导航更难,因为接触、摩擦、形变和物体不确定性会让模型复杂很多。
核心问题:
- 机械臂如何运动到目标位姿:inverse kinematics / motion planning。
- 如何抓住物体:grasp synthesis / grasp planning。
- 如何在接触中稳定操作:force control / impedance control。
- 如何完成长期任务:task and motion planning。
代表方法:
- Forward / inverse kinematics, Jacobian methods。
- RRT-Connect, CHOMP, STOMP, TrajOpt。
- Grasp quality metrics, force closure。
- Operational space control, impedance control。
学习关键词:robot manipulation, grasping, motion planning, impedance control, task and motion planning。
无人机 UAV / Aerial Robotics
无人机强调三维空间中的快速状态估计、轨迹规划和稳定控制。平台常见为 quadrotor、多旋翼、固定翼和混合构型。
核心问题:
- 姿态与位置估计:visual-inertial odometry, IMU fusion。
- 飞行动力学控制:attitude control, position control。
- 高速避障和轨迹生成:minimum snap trajectory, MPC。
- 能耗、载荷、通信和安全降级。
代表方法:
- EKF / factor graph based VIO。
- Differential flatness, geometric control on SE(3)。
- Minimum snap polynomial trajectory。
- Receding horizon planning。
学习关键词:aerial robotics, quadrotor control, VIO, minimum snap, SE(3) control。
自动驾驶 Autonomous Driving
自动驾驶是 robotics 在道路场景中的大规模系统化应用。它包含感知、预测、定位、规划、控制、安全验证、仿真和车规工程。
核心问题:
- 看懂道路参与者:detection, tracking, lane perception。
- 预测其他交通体:trajectory prediction, intent prediction。
- 决策与规划:behavior planning, motion planning。
- 安全控制:trajectory tracking, fail-safe。
代表方法:
- Multi-sensor fusion, BEV perception。
- HD map / mapless driving。
- Rule-based planning, optimization-based planning, learning-based planning。
- MPC, pure pursuit, Stanley controller。
学习关键词:autonomous driving, BEV, prediction, behavior planning, motion planning, vehicle control。
腿足机器人 Legged Robotics
腿足机器人关注有离散接触的动态运动,例如双足、人形、四足。难点在于接触切换、稳定性、全身动力学和高频控制。
核心问题:
- 如何保持平衡:stability, center of mass, zero moment point。
- 如何决定脚落在哪里:foothold planning。
- 如何协调全身:whole-body control。
- 如何在复杂地形中鲁棒运动:locomotion policy。
代表方法:
- ZMP, capture point, centroidal dynamics。
- MPC for legged locomotion。
- Whole-body control with quadratic programming。
- RL-based locomotion and sim-to-real。
学习关键词:legged locomotion, humanoid robotics, ZMP, centroidal dynamics, whole-body control。
软体机器人 Soft Robotics
软体机器人使用柔性材料和连续形变结构,常用于抓取易碎物体、医疗、仿生和安全人机交互。
核心问题:
- 连续体动力学建模困难。
- 传感和状态估计不如刚体机器人直接。
- 控制对象高维、非线性、强滞后。
代表方法:
- Cosserat rod model, finite element methods。
- Model-free control, learning-based control。
- Pneumatic / tendon-driven actuation。
学习关键词:soft robotics, continuum robot, deformable body, pneumatic actuator。
多机器人系统 Multi-Robot Systems
多机器人研究多个机器人如何协作、通信、分配任务和避免冲突。典型场景包括仓储机器人、无人机集群、搜索救援和分布式传感。
核心问题:
- 任务如何分配:task allocation。
- 如何协同定位和建图:multi-robot SLAM。
- 如何避免互相碰撞:multi-agent path finding。
- 通信受限时如何保持鲁棒。
代表方法:
- Consensus algorithms。
- Auction-based task allocation。
- Multi-agent path finding, conflict-based search。
- Distributed optimization。
学习关键词:multi-robot systems, swarm robotics, MAPF, consensus, distributed robotics。
人机交互 Human-Robot Interaction
HRI 研究机器人如何与人安全、自然、可解释地协作。它不仅是 UI 问题,也涉及意图识别、安全控制、社会行为和信任校准。
核心问题:
- 如何理解人的动作、语言和意图。
- 如何让机器人行为可预测、可解释。
- 如何在共享空间里保持安全。
- 如何让人校正机器人策略。
代表方法:
- Shared autonomy。
- Learning from human feedback。
- Intent inference。
- Social navigation。
学习关键词:human-robot interaction, shared autonomy, social navigation, intent inference。
医疗、工业与服务机器人
这些是 robotics 的重要应用域,每个域都有强约束。
- 医疗机器人:强调安全、精度、可追溯和监管认证,例如手术机器人、康复机器人。
- 工业机器人:强调重复精度、节拍、可靠性和工艺集成,例如焊接、装配、喷涂。
- 服务机器人:强调开放环境下的感知、交互和长期自治,例如家用、酒店、养老场景。
学习关键词:surgical robotics, industrial robotics, service robotics, cobot, rehabilitation robot。
农业、矿山、海洋与太空机器人 Field / Marine / Space Robotics
这些方向常被初学者忽略,但它们是 robotics 很重要的落地方向。共同特点是环境恶劣、通信不稳定、维护成本高,系统必须非常鲁棒。
核心问题:
- 野外定位和地形理解:terrain perception, traversability。
- 覆盖式规划:coverage planning, inspection planning。
- 低通信或高延迟下的自主:supervised autonomy。
- 长时间运行:energy management, fault detection。
代表方法:
- Terrain mapping, semantic traversability。
- Coverage path planning。
- Robust state estimation under degraded sensing。
- Fault-tolerant autonomy。
学习关键词:field robotics, agricultural robotics, mining robotics, underwater robotics, space robotics, coverage planning。
触觉、灵巧手与接触丰富操作 Tactile / Dexterous Robotics
这一分支关注机器人如何像人手一样通过触觉和力反馈处理不确定接触。它是 manipulation 的前沿难点之一。
核心问题:
- 触觉如何表示:tactile image, force distribution, contact patch。
- 灵巧手如何协调多个手指:dexterous manipulation。
- 接触状态如何估计:slip detection, in-hand pose estimation。
- 如何学习接触策略:tactile policy, diffusion policy。
学习关键词:tactile sensing, dexterous manipulation, in-hand manipulation, force closure, contact-rich manipulation。
遥操作、共享自主与具身智能 Teleoperation / Shared Autonomy / Embodied AI
这些方向连接 robotics、AI 和人类操作。它们常用于数据采集、远程操作、复杂任务辅助和 foundation model 训练。
核心问题:
- 人类指令如何映射到机器人动作。
- 机器人何时自主,何时请求人接管。
- 如何从 teleoperation 数据中学习技能。
- 语言、视觉、动作如何形成长期任务闭环。
学习关键词:teleoperation, shared autonomy, learning from demonstration, embodied AI, vision-language-action model。
核心概念
- Embodiment:机器人智能受到身体结构、传感器和执行器约束。
- Autonomy:自主性不是单点能力,而是从感知到执行的闭环能力。
- Contact:真实机器人常常通过接触完成任务,接触是许多难点的来源。
- Uncertainty:状态、地图、物体和人类行为都存在不确定性。
- Safety:安全不是最后加的模块,而是贯穿规划、控制和系统设计。
和其他模块的关系
- 平台决定动力学模型、传感器配置和控制频率。
- 任务决定需要什么感知输出、规划表示和安全约束。
- 环境决定地图类型、鲁棒性要求和是否需要学习方法。
- 应用域决定评价指标,例如精度、速度、成功率、能耗、舒适性或法规合规。
学习关键词
robotics, autonomous systems, mobile robotics, manipulation, SLAM, motion planning, control, robot learning, ROS 2, simulation, human-robot interaction。