Qiita Trends – Telegram

Qiita Trends

3 subscribers

4.44K links

Unofficial qiita trend channel

source code: https://github.com/vbalien/qiita-trend-channel

Download Telegram

About

Blog

Apps

Platform

第4回今更だけど基礎から強化学習を勉強する連続行動空間編
LGTM: 6
#Python #機械学習 #強化学習 #Keras

Link: https://qiita.com/pocokhc/items/0872539ad9d981847595

第4回今更だけど基礎から強化学習を勉強する連続行動空間編 - Qiita

今までは行動空間(アクション)は離散値を扱っていましたが、今回は連続値を扱いと思います。

第3回　価値推定編(TD法、モンテカルロ法、GAE)

※ネット上の情報をかき集めて自分なりに実装しているので正確ではない可能性がある点はご注...

5 viewsedited 04:53

この記事を読む

ゼロから始めてオフライン強化学習とConservative Q-Learningを理解する
LGTM: 41
#強化学習 #Q学習 #オフライン強化学習

Link: https://qiita.com/aiueola/items/90f635200d808f904daf

ゼロから始めてオフライン強化学習とConservative Q-Learningを理解する - Qiita

過去に集めたデータのみを用いて強化学習を行うオフライン強化学習に注目が集まっています．ではオフライン強化学習は，オンラインで環境と作用し学習する一般的な強化学習と比べてどのようなメリットや，技術的な違いがあるのでしょうか？

本記事で...

2 viewsedited 21:00

この記事を読む

Prioritized Experience Replay ～強化学習において効率よくサンプリングする方法～
LGTM: 5
#強化学習 #土木工学

Link: https://qiita.com/fujitagodai4/items/62100d63b43cd518c127

Prioritized Experience Replay ～強化学習において効率よくサンプリングする方法～ - Qiita

概要

　土木の分野では、機械の制御（ダムの制御）や都市開発（交通×AI）などで、強化学習が使われ始めています。初めてニューラルネットワークを用いて強化学習を構築する場合、最初に構築するアルゴリズムは、やはり深層Q学習(DQN)だ...

3 views09:00

この記事を読む

OpenSpielで始める強化学習その① ~OpenAI Gymとの比較~
LGTM: 7
#Python #強化学習 #AI #OSS #OpenAIGym

Link: https://qiita.com/asgasw1127/items/9b487d69e12e7bc8537c

OpenSpielで始める強化学習その① ~OpenAI Gymとの比較~ - Qiita

初めに

OpenSpielとは

DEEPMINDが作成した研究者向けの強化学習フレームワークのOSSです。マルチエージェントRLの研究の促進や研究の再現性の向上を目的としています。
主にPythonとC++で書かれていますが、G...

1 viewedited 09:00

この記事を読む

PFRLでスーパーマリオ1-1をクリアするまで
LGTM: 16
#Python #強化学習 #PyTorch #PFRL

Link: https://qiita.com/hrs1985/items/d249bf5d41078ded60c2

PFRLでスーパーマリオ1-1をクリアするまで - Qiita

以前はStableBaselinesを使っていましたが、ニューラルネットワークの構造をいじりにくいことやアルゴリズムに手を加えにくいと思っていました。ネットワークにAttentionを加えるだけでも一苦労でした。

そもそもTenso...

1 viewedited 09:00

この記事を読む

強化学習環境ライブラリ一覧
LGTM: 24
#Python #機械学習 #MachineLearning #強化学習 #OpenAIGym

Link: https://qiita.com/tokudo/items/4235c3f41cf2f94ffeae

強化学習環境ライブラリ一覧 - Qiita

これまで色々見聞きしてきてて忘れそう（というか忘れているのもいくつかありそう）なので、メモとして残しておきます。
今後もここに記録していこうかと思います。みなさんも他にご存知の環境があれば教えていただきたいです。

OpenAIgy...

1 viewedited 09:00

この記事を読む