往googler的路上day133
Jun 18, 2021
完成了16promodo, 8小時
- 電腦網路概論報告(剩1.5hr可以解決)
- 離散數學報告(之後弄)
- 去申請表達力課程吧https://gentlemanx.life/app/(沒弄)
ML2021 RL 作業學到的事情
- TQDM means “Progress”
- 要善用CKPT (CHECK POINTS)來 TRAIN MODEL ,這樣也可以沿用好的訓練結果
今天搞懂了2行code
在對model進行操作之前,要先做以下兩行code其中一行
(因為network裡面的某些參數)
- model.network.train() # 將model 處在training的模式,及訓練
- model.network.eval() # 將model 處在evaluating的模式,及測試
今天最可喜可賀的事情,大概就是
通過了ML2021 RL 作業的Medium Baseline
得到了118分,滿分是250,希望可以把actor-critic做出來,但今天後面2小時一直做錯.....但有進展拉
明天開始準備微積分段考,加油囉