Skip to content

LANYIXING/Simulation-teaching-platform-for-Q-learning-algorithm

Repository files navigation

Q-Learning 无人机路径规划仿真教学平台

平台封面

项目简介

本平台是一款面向教育的 Q-Learning 强化学习算法教学工具,通过交互式无人机路径规划仿真,帮助学生直观理解 Q-Learning 算法的核心概念与实际应用。

当前版本: V23
适用对象: 计算机科学、人工智能相关专业师生


核心特色

功能模块 说明
原理学习 详细讲解 Q-Learning 算法机制,包含 Q 值迭代、动作选择策略等
交互仿真 可视化展示训练过程,实时观察 Q 表更新
多场景 军事侦察、物流配送、探索任务等多种场景
答题闯关 知识点巩固测验
实操演练 超参数调节,亲手训练无人机规划策略

主界面


教学目标

  1. 掌握 Q-Learning 强化学习算法基本原理
  2. 理解 Q 值迭代与最优策略选择
  3. 学会路径规划问题的环境建模方法
  4. 分析探索与利用的权衡取舍
  5. 应用 Q-Learning 解决实际问题

仿真界面


快速开始

系统要求

项目 最低配置
操作系统 Windows 7/10/11 (64位)
内存 4GB 以上
存储空间 500MB 可用空间
分辨率 1920x1080 推荐

使用流程

  1. 首页: 选择学习入口
  2. 场景选择: 挑选任务场景(如军事侦察)
  3. 环境建模: 设置网格地图和障碍物
  4. 原理学习: 观看算法讲解
  5. 答题闯关: 完成知识点测试
  6. 实操演练: 训练并观察结果

答题界面


典型案例:军事侦察场景

军事侦察

案例目标

  • 让无人机从起点出发,找到避开障碍物的最优路径到达目标点
  • 学习如何在未知环境中进行路径规划

操作步骤

  1. 选择「军事侦察」场景
  2. 设置网格大小和障碍物分布
  3. 设置起始点和目标点
  4. 开始训练,观察 Q 值变化
  5. 查看最优策略路径

参数调优建议

  • 探索率 (epsilon): 初始设为 0.1,慢慢减小
  • 学习率 (alpha): 建议 0.1
  • 折扣因子 (gamma): 建议 0.9
  • 训练轮次: 建议 500-1000 轮

参数设置


常见问题 FAQ

问题 解决方案
点击「实操演练」按钮没反应? 需要先完成前面四个模块的学习
训练时无人机总是撞到障碍物? 适当增大探索率 epsilon 参数值
为什么 Q 表所有值都是 0? 增加训练轮次(Episodes)
如何保存训练结果? 以管理员身份运行程序
「最优策略」按钮是灰色? 需要先完成训练

项目结构

Q-Learning无人机路径规划仿真教学平台V23/ . ├── 源代码/ # 项目源码 ├── 演示视频/ # 操作演示视频 ├── Q-Learning无人机路径规划仿真教学平台V23_使用手册.files/ │ └── *.png # 平台截图 ├── 提交材料/ │ ├── README.md # 本说明文档 │ └── 使用手册.html # 详细使用手册 └── 演示PPT.pptx # 汇报演示文稿


详细文档

更多使用说明请参考:[使用手册]请下载 Q-Learning无人机路径规划仿真教学平台V23_使用手册.html查看


许可证

仅供教学使用。

欢迎提交问题与改进建议!

About

开发了基于Q学习的无人机路径规划仿真教学平台,将 Q 学习理论与无人机路径规划任务相结合,用可视化、沉浸式交互替代单纯公式推导,推动学生从“被动听讲”转向“主动探索”。

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages