发论文的过程 研究生课题是强化学习,看了好几个月论文,现在感觉是学了一大堆概念和原理
题主,与我的经历可以说非常像了,我也是研究生的时候接触强化学习这个课题。强化学习这个坑要学习的东西很多。主要但不全面的包括:基础以及相关模块,机器学习统计学等算法知识,深度学习神经网络知识,强化学习理论知识等,以及后面确定强化学习的方向以及看相关方向的论文,由于我是机器人方向,还需要多学一个ROS。可以说这一路是非常艰辛的,我也曾经差不多看了一个学期的论文,总觉得没有啥收获,成就感不高。
结合自身经历,说一些自己的想法:
1.最最基础的知识还是要搭建起来。没有基础后面不会知识点再一个个查看的话,会越来越没有自信,会对知识点没有一个系统的理解。而且这些坑你终究是需要补上。绕不去的坎。另外对于知识点太多,学习周期长的话,我建议先学重要内容,比如 numpy、等重要库,机器学习与强化学习相关内容、深度学习CNN以及一些重要的网络模型和训练技巧等、最后就是强化学习主要的基础和算法了。
2.确定强化学习方向,强化学习的方向很广。主要可以做游戏、控制、广告推荐、医疗服务、金融等不同领域,要确定一个你需要做的领域,然后狂看论文,看了论文可能还会有点云里雾里的,这个很正常。看论文的时候要注意一些重要信息,提取对自己将来工作有用的点比如主要工作,整体框架,创新点等。
3.看论文不实践就是耍流氓。看完论文一闭合发现自己啥也没记下。这需要找他们的源码来跑,我觉得没必要跑太多游戏领域的源码,当然如果你是游戏领域的话当我没说。强化学习的算法有很强的范式,针对领域又会有很大的变种。你需要找相关领域的源码来跑,并且读懂。这或许可以给你看论文时完全不一样的感受,我当时是豁然开朗。真的很需要看源码。
4.看论文改源码,自己找创新点。很多时候,你在复现或者自己看论文的时候会不自主地跳出一些想法都记下来,万一有用呢。某些想法会对你在后面的创新点有很大帮助。
5.实验实验实验。对你的想法进行验证。这是需要你的导师你的师兄一起帮助分析后进行的。然后不断实验不断改进,这不会一蹴而就。过程可能也会很恼人,很无助,对未知的恐惧。希望坚持下去。如果实验效果OK的话,老师应该会让你发论文啦。
以上。