進入到2021年,AI領域的你最應該學的是什么?我覺得是強化學習。
為什么這么說?首先要知道什么是強化學習。 強化學習是機器學習的一種,是一種行為學習模型。由算法提供數據分析反饋,引導用戶逐步獲取最佳結果。主要解決在 Markov Decision Process(MDP) 中優化長期reward的期望的問題。 強化學習也是現在非常熱門的方向,在近幾年的所有頂級計算機會議中,強化學習都有明顯的增長趨勢。 比如在ICML 2020 熱門話題引用量最高的論文就是強化學習!
同時在12月30剛結束的首屆谷歌足球Kaggle競賽中,使用了深度強化學習的騰訊AI足球隊—絕悟(WeKick),也以顯著優勢奪得冠軍!
不僅如此,工業界中,已經有很多將強化學習應用于推薦系統的研究,也有一些自動駕駛公司在嘗試使用強化學習的技術。 在學術界中,除了強化學習本身關注的問題以外,也有一些NLP的問題可以利用強化學習來解決。 學習強化學習,想要發表論文和落地應用,就一定要理解并掌強化學習領域的經典Paper,才能梳理出主要的知識框架。
責任編輯:xj
原文標題:10 篇論文攻克深度強化學習底層原理,推薦一個論文復現的好方向!
文章出處:【微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。
-
AI
+關注
關注
87文章
31536瀏覽量
270356 -
深度學習
+關注
關注
73文章
5516瀏覽量
121558 -
強化學習
+關注
關注
4文章
268瀏覽量
11305
原文標題:10 篇論文攻克深度強化學習底層原理,推薦一個論文復現的好方向!
文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
AI主導下科技領域的蓬勃發展與變革
富士通預測2025年AI領域的發展趨勢
RISC-V在AI領域的發展前景怎么樣?
不同領域中AI大模型的應用實例
AI for Science:人工智能驅動科學創新》第4章-AI與生命科學讀后感
《AI for Science:人工智能驅動科學創新》第一章人工智能驅動的科學創新學習心得
國產AI出海加速,IT領域投資激增
在被摩根士丹利列為AI領域首選股后,你現在應該買入ARM股票嗎?

名單公布!【書籍評測活動NO.44】AI for Science:人工智能驅動科學創新
玩轉大模型 企業AI著陸新正解 神州問學AI原生賦能平臺正式發布

評論