基于A*引导的强化学习规划算法分析

2025.07.09点击:

摘要:阐述一种基于A*引导的强化学习规划算法。该算法通过引入A*路径信息项,能够有效引导机器人的行为,使其在避障的同时快速到达目标点。仿真实验表明,该算法在到达率等指标上与传统算法和不加入引导信息的强化学习算法相比,均有不同程度的提升。同时,考虑到强化学习规划算法在模拟和现实中表现差距较大的情况,设计了通用的奖励函数和状态空间来提升机器人在实体环境中的表现。

关键词: 强化学习规划算法;机器人避障;奖励函数;状态空间;

专辑: 信息科技

专题: 自动化技术

分类号: TP18;TP242