深度强化学习

博士做的是生产调度方向,归根到底最后都是落到组合优化方面,无非就是算法的改进或者系统模型的搭建,但是总觉得没什么意思。受到“Reinforcement learning for job-shop scheduling”这篇文章的启发,感觉有可能会有一定的用处。再加上最近这几年机器学习的风气云涌,可以说是凑热闹也好,赶时髦也好,总想着别处心裁拿别的领域的研究成果应用到自己领域中来。

但是目前困难重重,首先组合优化问题的特征难以提取,其次目前的组合优化领域机器学习应用文献参考较少,主要集中在图像识别、游戏、无人驾驶、自然语言处理等方面。组合优化领域貌似是一潭死水,近年来动静较少。

如果有同道中人,还望多多交流,多多探讨。

 

参考文献:

1)Zhang W. Reinforcement learning for job-shop scheduling[D]. Oregon State University, 1996.

2)Silver, D., et al., Mastering the game of Go with deep neural networks and tree search. Nature, 2016. 529(7587): p. 484-489.

3)Mnih, V., et al., Human-level control through deep reinforcement learning. Nature, 2015. 518(7540): p. 529-533.

 

3 thoughts on “深度强化学习

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注