月度归档:2016年11月

深度强化学习

博士做的是生产调度方向,归根到底最后都是落到组合优化方面,无非就是算法的改进或者系统模型的搭建,但是总觉得没什么意思。受到“Reinforcement learning for job-shop scheduling”这篇文章的启发,感觉有可能会有一定的用处。再加上最近这几年机器学习的风气云涌,可以说是凑热闹也好,赶时髦也好,总想着别处心裁拿别的领域的研究成果应用到自己领域中来。

继续阅读