Notes on Minecraft 发表于 2022-01-26 更新于 2022-11-22 分类于 Notes , Game 阅读次数: 1.12.2 ➡ 1.15.2 ➡ 1.16.5 , 记录我的世界开服至今的坑. 阅读全文 »
Dynamic Programming in Routing Problems 发表于 2021-11-01 更新于 2022-04-08 分类于 TSP , DP 阅读次数: 介绍动态规划在路径问题如旅行商问题及车辆路径问题中的应用. 阅读全文 »
Understanding Kool2021DeepPD 发表于 2021-08-31 更新于 2022-06-18 分类于 Paper 阅读次数: Kool, W., Hoof, H.V., Gromicho, J., & Welling, M. (2021). Deep Policy Dynamic Programming for Vehicle Routing Problems. ArXiv, abs/2102.11756.阅读笔记. 阅读全文 »
Policy Gradient Methods 0 Gradient Bandit Algorithms 发表于 2021-08-28 更新于 2022-06-18 分类于 RL , Policy Gradient 阅读次数: 策略梯度方法的前置算法: 梯度老虎机算法, 以及系列博客的参考资料. 阅读全文 »