1、中文 6856 字 ,5300 单词, 23000 英文字符 出处: Zhang B, Mao Z, Liu W, et al. Cooperative and geometric learning for path planning of UAVsC/Unmanned Aircraft Systems (ICUAS), 2013 International Conference on. IEEE, 2013: 69-78. 无人机路径规划的几何学习与协作 摘要: 为了解决无人机路径规划问题的可操作性、避免碰撞和信 息共享问题,我们提出了一个新的学习算法,命名为几何学习与协作( CGL)。 C
2、GL 有三点好处: 1) CGL 利用一个特定的矩阵 G,生成一种针对多无人机路径规划的简单而有效的算法; 2) 能计算出从给定点到目标点在路径长度和风险度量方面的最佳路径; 3) 在 CGL 中,矩阵 G 是根据其它无人机的几何距离和风险信息实时计算和自适应更新的。 大量的实验结果验证了CGL 在无人机导航方面的有效性和可行性。 1 引言 在过去的十年中,无人机在军事领域的需要已有显著增长。 不断增加的需求将与多无人机操作相关的一些挑战纳入了重点。 减少无人机依 赖的专业飞行员的有限数量是一个主要问题。 目前,无人机(如: Predators)需要两个操作者的全部注意力。 为了成功的执行复杂
3、的任务,这些无人机需要共享信息以及与另一个协作来提高团队整体性能。 在战场上,无人机飞在一个高度动态和充满挑战的环境里。 面对地面和空中的突然变化,它们必须要迅速作出反应。 无人机通常在一个复杂的环境中飞行。有许多威胁,如 山丘,树木,敌方无人机,和敌人的飞机都是致命的导致无人机坠毁。 这些威胁只能从一个单一的无人机的限制范围内检测到。然而,通过与其它无人机共享信息,这些威胁可以在较远的距离 外被检测到。此外,导航的一个有效路径应当平整,并提供一条逃离路线,而且必须是计算高效的。这些都是热点问题,并在近年来引起了足够的重视。 在之前关于单个无人机路径规划的工作中, 维诺 图搜索和可视性图搜索是
4、其中最早的算法,已被证明只在一个简单的环境中有效。 他们不是实时的,当地图信息不能完全获取,如一些障碍没有检测到时,也导致致命的失败。 A2D是一个有效实时的算法,它通常能找到无人机的一个有效路径。 然而,在局部复杂区域中它不能找一个有效的路径,并且不得不设计一条路径来逃离危险区域,特别是当危险区域中的转弯角太大时 。 进化算法被用来作为一个候选者,以有效地解决路径规划问题,并在短时间内提供可行的解决方案。 一个径向基人工神经网络( RBF-ANN)辅助差分进化( DE)算法用来设计无人机的一个离线路径规划协调已知静态海洋环境中的导航。 行为协调和虚拟( BCV)目标方法提供一个基于全局和局部
5、行为协调的实时路径规划方法。 这种方法通过控制局部行为和整体行为的实现路径规划。 用于控制本地行为的模糊逻辑控制器( FLC)旨在实现威胁回避。 不同于单个无人机,多无人机的路径规划集中在协作框架、合作战略和一致性等。 维诺图搜索算法和 A*算法( Dijkstra 算法)规划一个多无人机同时到大目标的详尽过程的全局路径。 研究者们用 Dubins 路径规划多无人机的全球协作路径来避免碰撞, 当遭受局部路区域突然变化时。 在文献 11 中,作者提出了一种基于威胁可能性地图的路径规划算法,它可以从先前的监测数据中构造。 在文献 12 和 13 中,研究人员开发了一种新的混合模型并对信息管理设计了
6、一致性协议。 他们还通过分布式的、可扩展的和不理想的神经元动态规划(算法)合成局部预测控制器。 一个明确的反馈机制,所谓基于显色指数的反馈( FBCRI), 嵌入进最优模糊推理方法来解决多无人机的路径 规划。 通过嵌入虚拟子目标到 FBCRI 基础的方法,提出了一种基于虚拟子目标( CPVS)的新的协作路径规划方法来进一步解决路径规划问题。 然而,据我们所知,关于多无人机的实时路径规划和信息共享并不太好研究。 在本文中,我们从强化学习的角度来处理多无人机的路径规划问题。 一种经典的强化学习算法 -Q-Learning,是解决路径规划问题的一种传统方式。 Q-Learning 的基本思想是根据学习地图里所观察的环境状态,从延迟回馈中获得最优控制策略,并提出控制策略来选择达到目的的操作。 但该方法实际上是专为已知整个环境地图的计 划者而设计的。当只能获得部分地图信息时, Q-Learning 使用不了对路径规划非常有价值无素的几何距离信息。 此外,对无人机而言, Q-Learning 中当从一个点传播到其它点有许多不必要的计算,从其它无人机得到的共享信息不能