基于Decision Transformer的室内导航系统设计
2025.07.01点击:
摘要:阐述一种基于Decision Transformer的离线强化学习导航算法,该方法将局部激光雷达数据转化为二维占据栅格地图进行观察,结合目标位置、离散动作和Return-to-go值组成状态-动作序列,通过自回归的Transformer网络进行端到端的序列建模学习。仿真实验表明,该方法在成功率、碰撞率、阻塞率和平均到达时间等指标上均优于高斯混合模型和隐式行为克隆等其他离线强化学习算法。
关键词: 机器人导航;离线强化学习;Decision Transformer;序列建模;
专辑: 信息科技
专题: 电信技术;自动化技术
分类号: TP242;TN96;TP18
在线公开时间: 2025-06-20 16:43(知网平台在线公开时间,不代表文献的发表时间)
- 上一篇:通信调度中的主网通信缺陷处置策略优化分析 2025/7/1
- 下一篇:超宽带压控振荡器设计及其相位噪声分析 2025/6/30