自主水下机器人探秘深海,精准开辟最优航路

自主水下机器人探秘深海,精准开辟最优航路

机器人大讲堂

机器人大讲堂

2026年01月12日 17:58
本文共计3400个字,预计阅读时长12分钟。
来源/机器人大讲堂 责编/爱力方

从经验寻路到智能演化,AUV如何在看不见的深海里,规划出一条最高效、最安全的航路?

浩瀚的海洋占据了地球表面的大部分,是气候调节、资源宝库和国家安全的关键领域。然而,深海的可见度、通信受限以及复杂多变的洋流环境,使人类的探索步履维艰。

正是在这样的挑战下,自主水下航行器(AUV)凭借其显著的自主性、环境适应性及任务灵活性,逐步成为海底测绘、环境监测、军事侦察及深海资源勘探的核心装备,并逐渐替代传统的载人潜水器(HOV)与遥控潜水器(ROV)。

然而,在“伸手不见五指”的深海里,仅仅拥有强大的躯体还不够。它如何规划出一条从起点到目标、既能避开重重障碍,又能顺应洋流节省能量的最优路径?

近日,香港城市大学康文斌团队与河海大学刘增辉团队在机器人领域权威期刊《Journal of Field Robotics》(JFR)发表了一篇题为《A Review on Path Planning for Autonomous Underwater Vehicles: From Models, Classical Methods, and Learning-Based Intelligence Perspectives》的综述。

 

该综述创新性地提出了一个“环境建模-算法演进-学习决策”三维耦合的系统视角,突破了传统研究分类精确但界面模糊的局限,为理解AUV路径规划提供了整体性视角。文中不仅系统剖析了AUV运动动力学建模、地形和海流场重建、多AUV协同任务分配等关键技术的最新进展,还清晰勾勒出从经典算法到机器学习方法的演进脉络,为下一代AUV实现全自主、强适应的智能导航奠定了理论基础。

 

 

▍高精度的环境感知与任务建模

要让AUV在深海中自主、高效地完成任务,其核心在于构建一个更加完整的路径规划框架。文章指出,这一框架的构建必须同步考量AUV自身运动特性外部环境建模以及任务优化策略这三大要素,这三者是智能决策的基础。

在AUV自身运动特性方面,文章将AUV视为六自由度(6-DoF)刚体系统,不仅要通过运动学描述其位置与姿态,更需利用动力学模型解析水动力对轨迹的复杂影响。为了在保证精度的同时降低计算成本,当前的建模趋势是将计算流体力学(CFD)与半经验模型或数据驱动方法相结合,以实现兼顾效率与准确性的运动约束描述。

高精度的外部环境建模是路径规划的决策依据。

面对复杂多变的水下地形与洋流,传统的声呐测绘往往存在数据离散的问题,而基于深度学习的地形重构技术已能有效填补信息盲区。同时对于非线性的洋流干扰,文章也阐述了如何通过数值模拟构建三维流场模型,甚至结合强化学习预测流场变化,实现从被动适应环境到主动利用洋流降低能耗。

而任务优化策略则是实现自主决策的关键一环。针对单体AUV,策略重点在于如何在环境约束下寻找能耗最低的可行路径;而在多AUV协同场景中,任务规划则侧重于任务分配与通信协调的多目标优化问题。

此外,为了应对多AUV写作的水下通信带宽受限的挑战,文章指出,基于分布式强化学习和博弈论的策略正在取代传统的集中式调度,使集群能够在缺乏全局信息的情况下实现高效的协同作业。

▍传统算法,在深海中“摸石头过河”

人工智能大规模应用之前,传统算法为AUV的路径规划奠定了基础。论文将这些方法大致分为全局规划和局部规划,各有所长,也各有局限。

全局规划(Global Planning),如同在出发前就拿到一张详细的航海图,适用于环境相对已知、静态的场景。

以Dijkstra和A*为代表的图搜索算法最具特点。Dijkstra算法通过遍历所有节点确保获取全局最优解,但在高维状态空间下,其计算复杂度随搜索规模呈指数级增长。

A*算法则通过引入启发式函数提高了搜索效率,但在复杂约束环境下,其生成的路径往往存在不连续性,平滑度较低。

相比之下,面对高维非结构化环境的挑战,基于采样的路径规划方法(如RRT及其变体)表现出更强的空间探索能力,能够有效处理非完整性约束。不过,这种方法随机性强,生成的路径可能曲折,通常需结合二次优化算法进行平滑处。

此外,受自然启发的群体智能算法,如遗传算法(GA)、蚁群算法(ACO)和粒子群算法(PSO),在处理多目标优化时表现出色。但它们也面临“选择困难症”,在全局搜索和收敛速度间难以平衡,易陷入局部最优解。

如果说全局规划是战略布局,那么局部路径规划则是战术上的即时反应,专门应对航行中突然出现的未知障碍。

人工势场法(APF)通过构建由目标引力场和障碍物斥力场叠加的虚拟力场,实现避障逻辑的实时计算。尽管其计算负荷低、响应迅速,但在复杂障碍物下,APF存在局部极小值问题,可能导致AUV在受力平衡点发生停滞。

动态窗口法(DWA)则在速度空间内建立约束模型,通过采样并模拟推演符合动力学特性的轨迹。DWA在处理动态障碍物时具有较好的鲁棒性,但由于其搜索窗口受限于局部感知范围,搜索范围受限。

在复杂的三维地形中,DWA难以独立保证路径的全局连贯性,因此在实际应用中,通常采用“全局引导、局部避障”的混合规划架构。

▍机器学习,海洋中的自进化导航

随着机器学习技术(ML)的成熟,AUV路径规划正由传统的“规则驱动”向“数据驱动”范式演进。ML通过挖掘高维数据的特征关联,显著提高AUV在复杂、动态及非结构化海洋环境中的自主决策能力与环境适应性。

在数据驱动架构中,监督学习主要用于环境特征提取与非线性映射。生物启发神经网络(BINN)通过模拟神经元的兴奋与抑制机制,在动态避障过程中生成平滑的运动轨迹。卷积神经网络(CNN)则发挥其在空间特征提取方面的优势,针对水下光学/声学图像模糊及特征稀疏的问题,实现了从环境原始输入到最优决策路径的端到端精准映射。

针对多AUV协作系统中的任务分配难题,无监督学习提供了高效的聚类方案。自组织映射(SOM)网络与K-Means算法可在缺乏标签数据的前提下,自动提取环境特征,并对任务空间进行合理划分。此类算法在实现多智能体系统的负载均衡与资源优化配置方面具有显著的计算效率优势。

强化学习(RL)通过构建智能体与环境的交互闭环,使AUV具备了在复杂工况下的自主演化能力。基于“状态-动作-奖励”的反馈机制,经典的Q-learning及其深度演进版本(如DQN、DDPG、PPO等)允许AUV在无先验环境知识的条件下,通过连续试验自主习得最优策略。

深度强化学习(DRL)在处理非线性干扰方面具有显著优势,例如深度确定性策略梯度算法(DDPG)已被应用于时变流场环境中的水下滑翔机轨迹控制,有效增强了系统在扰动条件下的鲁棒性。

针对集群作业,多智能体强化学习(MARL)解决了非平稳环境下的协作难题,支持AUV集群在受限通信条件下通过分布式学习实现最优任务分配与协同。

 

▍未来航线,驶向真正的“海洋智能”

尽管AUV路径规划技术已取得显著进展,但在实际工程应用中,仍面临环境不确定性、水声通信带宽受限以及机载计算资源瓶颈等核心挑战。

针对上述问题,未来的研究,正聚焦于三个关键方向,旨在赋予AUV更深邃的“海洋智能”。

首先,引入元学习(Meta-Learning)终身学习(Lifelong Learning)机制。通过构建具有快速适应能力的模型架构,使系统能够利用极少量的环境样本实现跨海域任务的快速迁移与知识积累,从而显著提升路径规划算法的泛化性能。

其次,强化多模态感知融合(Multimodal Fusion)技术。通过集成前视声呐、视觉SLAM、磁力计及惯性导航系统(INS)等多源传感器数据,利用多模态信息互补增强环境建模的可靠性,为复杂环境下的实时路径规划提供稳健的数据基础。

最后,推动轻量化模型与边缘计算(Edge Computing)的协同优化。针对AUV嵌入式处理器算力限制的问题,研究方向可以侧重于神经网络剪枝、量化等模型压缩技术,并结合边缘计算架构将部分非实时计算任务卸载至协同平台。

这种协同架构能够在降低机载功耗的同时,提升系统执行实时自主规划任务的效率。这篇综述不仅厘清了技术脉络,更为新一代AUV的路径规划系统建立了一个统一、科学的理论框架,指引着海洋机器人向着更智能、更高效、更自主的深蓝未来迈进。

论文链接:https://onlinelibrary.wiley.com/doi/10.1002/rob.70143

来源:自主水下机器人:在“深海盲盒”中开辟最优航路 | 机器人大讲堂

声明:本文来自机器人大讲堂,版权归作者所有。文章内容仅代表作者独立观点,不代表A³·爱力方立场,转载目的在于传递更多信息。如有侵权,请联系 copyright#agent.ren。

相关图文

热门资讯