欧美深夜视频_国产精品99视频_国产精品网站一区_亚洲最大av网

B 站教學,全中文課程:港中文周博磊強化學習課程完結(jié)

2024-8-22 21:43| 發(fā)布者: 遠在咫尺| 查看: 454| 評論: 0

歷時兩個多月,本周一,香港中文大學信息工程系助理教授周博磊的中文強化學習課程終于完結(jié)了。




作為全國知名的學習網(wǎng)站,我們經(jīng)常可以在 B 站上看到國內(nèi)外名師的講課視頻。但這些視頻一般都是「搬運工」們從油管等渠道搬上來的。

那有沒有哪位大佬親自下場當 up 主呢?香港中文大學的周博磊老師就是其中一位。

周博磊老師博士畢業(yè)于麻省理工學院,現(xiàn)任香港中文大學信息工程系助理教授,研究方向主要為機器感知和決策,重點是通過學習可解釋、結(jié)構(gòu)化的表征,使機器能夠在復雜的環(huán)境中感知、推理和行動。

今年 3 月份,受疫情影響,宅在家上課的周老師做出了一個決定:把自己每周的《強化學習綱要》課程用中文講一遍,并上傳到 B 站。這一消息吸引了上萬人圍觀。這可能也是全網(wǎng)第一個中文強化學習課程。

在過去的兩個多月里,周老師基本保持著每周一更的頻率,為大家錄制了 10 節(jié)課程,共 16 個視頻。主題包括:

    概括與基礎馬爾科夫決策過程無模型的價值函數(shù)估計和控制價值函數(shù)的近似策略優(yōu)化基礎策略優(yōu)化進階基于環(huán)境模型的 RL 方法模仿學習RL 分布式系統(tǒng)完結(jié)篇





該課程使用的編程語言是 Python,深度學習框架則是 TensorFlow 和 PyTorch(PyTorch 為主)。

在開課之初,周老師曾提醒大家,該課程主要面向大三、大四或研一的學生。參加課程的學生需要具備相關(guān)背景知識,包括線性代數(shù)、概率論、機器學習(數(shù)據(jù)挖掘、模式識別、深度學習)等。此外,由于該課程有不少實踐內(nèi)容,所以參加課程的同學最好有一些編程經(jīng)驗,會用 Python、PyTorch。

課是有一定難度的,從播放量的變化趨勢也可略知一二。




但即便如此,還是有同學堅持到了最后,并表示受益匪淺:




還有同學表示,上完課感覺自己變聰明了:




除了課程視頻之外,周老師還在 GitHub 上更新了課程的全部代碼,而且每節(jié)課后都留有作業(yè)。

    課程地址:https://space.bilibili.com/511221970GitHub 鏈接:https://github.com/zhoubolei/introRL


下面讓我們來看一下每節(jié)課的具體內(nèi)容。

9 小時 10 堂課,周老師帶你走近強化學習

第一節(jié)課分上下兩節(jié),總共 44 分鐘,主要介紹了課程綱要、強化學習基本概念、序列決策入門、強化學習編程實踐等內(nèi)容。




在第二節(jié)課上,周老師用 1 個小時的時間介紹了馬爾科夫決策過程(MDP),包括 1)馬爾科夫鏈(馬爾科夫決策過程的簡化版本)、馬爾科夫獎勵過程;2)馬爾科夫決策過程的策略估計,即當給定一個決策過程之后,如何計算它的價值函數(shù);3)馬爾科夫決策過程的控制,包括策略迭代和價值迭代兩種算法。




然而,在現(xiàn)實生活中,很多情況下無法獲取準確的 MDP 模型,因此只能借助無模型的方法解決問題,這也是周老師在第三課中講解的主要內(nèi)容,包括無模型的價值函數(shù)估計和控制。




第四課的主題是價值函數(shù)的近似,包括價值函數(shù)近似的基本原理、利用價值函數(shù)近似進行預測和控制、DQN 在雅達利游戲中的應用等。




第五課是關(guān)于策略優(yōu)化的基礎知識,包括基于策略的強化學習、蒙特卡羅策略梯度算法、如何減小策略梯度中的方差、Actor-Critic 算法等。




前五堂課的內(nèi)容都非常豐富,全部消化已非常不易,但其實這還沒到最難的部分。最難的一課是第六課。

第六課依然是講策略優(yōu)化,不過難度上了一個臺階。在這堂課中,周老師主要介紹了策略梯度算法的不同變種以及近五年來最新的策略優(yōu)化過程。其中,后者可以分為兩條主線,涵蓋強化學習中最有名的六種算法:




由于課程只有 1 個半小時的時間,因此每個部分不可能講得非常詳細,學到這課的同學還需要自己去啃其中涉及的一些論文。

第七課的內(nèi)容是基于模型的強化學習算法,包括概要、基于模型的價值函數(shù)優(yōu)化、基于模型的策略函數(shù)優(yōu)化、基于模型的算法在機器人中的應用等內(nèi)容。




第八課的內(nèi)容是模仿學習,包括 1)概要;2)模仿學習的兩種常見算法——行為克隆和 DAGGER;3)逆強化學習和基于生成對抗訓練的模仿學習;4)如何改進模型學習的模型;5)如何結(jié)合模型學習與強化學習以及 6)模仿學習在計算機視覺等任務中的應用。




第九課是強化學習系統(tǒng)的分布式設計,具體內(nèi)容包括分布式機器學習的特點、分布式系統(tǒng)到強化學習系統(tǒng)的演變以及 AlphaGo、OpenAI Five、AlphaStar 等知名強化學習 AI 背后的系統(tǒng)設計。




最后一節(jié)課是復習課,把前面九節(jié)課的內(nèi)容進行了梳理。

除此之外,周老師還推薦了一些強化學習方面的閱讀材料,包括 OpenAI 的深度強化學習教程 Spinning-Up 和 John Schulman 的《Nuts and Bolts of Deep RL experimentation》課程。前者總結(jié)了現(xiàn)有的主流強化學習算法,既有代碼也有講解;后者是 John Schulman 的強化學習研究歷程與經(jīng)驗。這些可以和本課程的推薦教材——Sutton 和 Barton 合作撰寫的《強化學習》一起閱讀。




至此,《強化學習綱要》課程告一段落。不過,周老師表示,他可能會在暑假錄一些「番外」,聊一聊自己感興趣的生成建模、無監(jiān)督表征學習等內(nèi)容。此外,關(guān)于機器感知與決策的內(nèi)容也在籌劃,有望在暑假與大家見面。




當然,由于課程比較難,大家難免有疑問。如果你在本課程學習期間遇到了問題,可以到 B 站視頻的評論區(qū)留言,周老師會盡量作答,也會有熱心的同學幫忙回答
分享到:
您需要登錄后才可以回帖 登錄 | 立即注冊

本版積分規(guī)則

交流熱線
17501437970 周一至周日:09:00 - 21:00

創(chuàng)贏網(wǎng)-致力于幫助普通人在創(chuàng)業(yè)之路上披荊斬棘、走向成功的專業(yè)網(wǎng)站,匯聚創(chuàng)新智慧與成功機遇的網(wǎng)絡天地,是創(chuàng)業(yè)者開啟贏之征程的首選之地。

Powered by Discuz! X3.5 © 2023-2050 CHUANYING Team.

QQ|Archiver|手機版|小黑屋|創(chuàng)贏網(wǎng) ( 湘ICP備17022177號-3 )

GMT+8, 2025-9-19 08:46 , Processed in 0.227249 second(s), 30 queries .

快速回復 返回頂部 返回列表
欧美深夜视频_国产精品99视频_国产精品网站一区_亚洲最大av网
樱桃视频在线观看一区| 欧美资源在线观看| 欧美制服丝袜| 国产在线视频欧美一区二区三区| 欧美国产精品v| 亚洲少妇自拍| 一区二区三区四区国产| 亚洲国产精品成人精品| 在线观看亚洲精品| 亚洲美女毛片| 免费观看成人鲁鲁鲁鲁鲁视频| 亚洲香蕉网站| 亚洲女爱视频在线| 久久久精品性| 香蕉成人伊视频在线观看| 在线一区日本视频| 在线一区二区日韩| 亚洲一区美女视频在线观看免费| 亚洲女女女同性video| 久久狠狠婷婷| 欧美激情欧美激情在线五月| 久久午夜精品一区二区| 欧美人交a欧美精品| 欧美精品乱码久久久久久按摩| 欧美电影在线播放| 毛片一区二区三区| 欧美国产成人精品| 国产精品入口尤物| 影音先锋亚洲一区| 亚洲性线免费观看视频成熟| 久久99在线观看| 亚洲欧美日韩一区| 欧美激情在线免费观看| 国产欧美欧美| 亚洲国产精品成人综合色在线婷婷| 国产亚洲人成a一在线v站| 国产欧美日韩一区| 欧美激情一区在线| 欧美金8天国| 99精品久久久| 国产精品毛片| avtt综合网| 欧美精品久久久久a| 欧美理论电影在线观看| 亚洲激情成人网| 欧美v日韩v国产v| av成人国产| 国产有码一区二区| 久久久精品国产免费观看同学| 国产美女一区| 香蕉国产精品偷在线观看不卡| 久久亚洲捆绑美女| 亚洲欧洲日产国产综合网| 欧美经典一区二区三区| 久久精品夜色噜噜亚洲a∨| 欧美日韩一区在线观看视频| 国产精品极品美女粉嫩高清在线| 午夜亚洲福利| 夜夜爽夜夜爽精品视频| 国产亚洲免费的视频看| 欧美理论片在线观看| 久久成人免费| 午夜精品在线观看| 亚洲欧洲日韩综合二区| 国产偷国产偷亚洲高清97cao| 免费成人在线视频网站| 午夜视频一区二区| 亚洲一本大道在线| 欧美日韩精品高清| 在线观看欧美激情| 国产主播精品| 国产精品入口夜色视频大尺度| 国产精品xxxxx| 欧美日本二区| 国产欧美亚洲视频| 国产欧美日本| 激情综合在线| 伊伊综合在线| 久久伊人精品天天| 国产一二精品视频| 久久综合激情| 一区二区av| 欧美日韩裸体免费视频| 亚洲人成7777| 在线免费观看欧美| 卡通动漫国产精品| 日韩网站在线| 亚洲人www| 亚洲第一天堂无码专区| 男人插女人欧美| 亚洲成色www8888| 欧美中文字幕在线| 欧美精品免费视频| 午夜精品在线看| 久久精品国产亚洲精品| 欧美黄色精品| 亚洲人成7777| 一区二区自拍| 99国产精品国产精品毛片| 女女同性精品视频| 欧美在线观看一区二区| 久久亚洲免费| 欧美日韩视频第一区| 亚洲男人的天堂在线| 一区二区成人精品| ●精品国产综合乱码久久久久| 欧美日韩中文字幕| 欧美乱大交xxxxx| 欧美激情精品久久久久| 蘑菇福利视频一区播放| 欧美第一黄色网| 欧美美女福利视频| 欧美—级a级欧美特级ar全黄| 亚洲国产日韩在线一区模特| 极品少妇一区二区三区| 在线观看日韩av电影| 最新国产成人在线观看| 亚洲人被黑人高潮完整版| 日韩午夜高潮| 亚洲欧美另类中文字幕| 欧美一区观看| 久久久久网站| 蜜桃av一区二区| 欧美精品精品一区| 国产精品va在线播放| 欧美日韩中文字幕在线| 国产精品美女久久久浪潮软件 | 久久精品日韩欧美| 亚洲欧美在线aaa| 久久精品99久久香蕉国产色戒| 久久精品亚洲乱码伦伦中文 | 欧美日韩一区综合| 国产精品久久| 激情成人亚洲| 日韩性生活视频| 欧美在线精品免播放器视频| 久久婷婷成人综合色| 欧美黄色视屏| 国产亚洲精品久久飘花| 亚洲区一区二| 欧美一区二区在线免费观看| 免费久久精品视频| 美女国产一区| 国产精品女人毛片| 亚洲日本理论电影| 欧美在线视频全部完| 欧美日韩不卡合集视频| 韩国一区二区三区在线观看| 一区二区三区国产盗摄| 久久影视三级福利片| 国产麻豆9l精品三级站| 亚洲日本中文字幕| 蜜桃久久av| 国产毛片久久| 日韩西西人体444www| 亚洲精品久久久久久久久久久久 | 蜜臀久久久99精品久久久久久 | 亚洲精品社区| 亚洲免费视频在线观看| 久久麻豆一区二区| 欧美日韩不卡视频| 亚洲国产精品传媒在线观看| 性色av一区二区三区| 欧美日韩人人澡狠狠躁视频| 亚洲第一区在线| 久久成人18免费观看| 国产精品国产自产拍高清av王其| 亚洲国产综合在线| 免费观看在线综合| 在线电影院国产精品| 久久精品国产综合精品| 国产深夜精品福利| 欧美一区二区视频在线观看2020| 国产精品日韩在线一区| 亚洲欧美国产日韩天堂区| 国产精品久久一卡二卡| 亚洲男人第一网站| 国产欧美日韩视频在线观看| 午夜精品视频| 国产一区二区日韩| 久久免费黄色| 亚洲国产经典视频| 女主播福利一区| 在线日韩精品视频| 久久综合图片| 91久久精品国产91久久| 欧美精品一区二区视频| 一区二区三区精品国产| 国产精品久久久久三级| 亚洲欧美日韩一区二区在线| 国产精品久久久久aaaa樱花| 亚洲欧美日韩综合aⅴ视频| 亚洲精品黄色| 久久久久国产一区二区| 一区二区三区在线免费观看| 久久亚洲电影| aa日韩免费精品视频一| 国产精品腿扒开做爽爽爽挤奶网站| 亚洲午夜久久久久久久久电影网| 欧美性做爰毛片|