donkey car シミュレーションだけど、やっと１周走れるようになった

以下の続き。

memorandums.hatenablog.com

何も調べずにとりあえず学習用データは１周分でいいやと思って学習した結果、コースは全く無視して走りだす様子でした。強化学習とか勉強しないと始まらないな。。。と思って、いくつか本を読み始めているところでした。

これは本当に超初心者向けの本で、キーワードの意味がまずわかるというところです。これって意外と大事だと思うんです。ワードに慣れる。１０分もあれば読めます。

人類の歴史を大きく変えるChatGPTの立役者強化学習超入門！: AIを大きく進歩させる機械学習の一種初心者向け解説書 (超入門！シリーズ)

作者:トレンド解説部

もともと強化学習は興味があったのでかなり前ですがKindle本を買っていたものがありました。研究室ではVRコンテンツやゲームを制作するときにUnityを使うのでこれいつか使えないかなと積読していました。どういう風に学習するのか？学習するポイントとか歴史とか、専門書ではないので気楽に読めます。以下は新しい版が出ています。

Unityではじめる機械学習・強化学習 Unity ML-Agents実践ゲームプログラミング

作者:布留川英一
ボーンデジタル

Amazon

これはチラッとしか読んでいません。C言語で実装となると理解が捗るのだと思います。いずれ読みたいところですが、いまからやるのはコスパが悪そうです。。。そこまでやりたいというわけではないので。

強化学習と深層学習 C言語によるシミュレーション

作者:小高知宏
オーム社

Amazon

あと大学の図書館で電子ブック（maruzen）が読めるのがいくつかありました。以下も良さそうです。AWSを使う行もありました（AWS Academyを使っているので行けるのかな？という打算です）ただ、2018年の本なので６年も経てば世の中ずいぶんと変わっているのかもです。とりあえずざーっと目を通して流れを理解したいと思います。

つくりながら学ぶ! 深層強化学習 ~PyTorchによる実践プログラミング~

作者:株式会社電通国際情報サービス小川雄太郎
マイナビ出版

Amazon

あと、お馴染みの以下のシリーズにも強化学習がありました。昨年、（今さらですが）１をゼミでやったのですが中盤以降がなかなか難しく、うーん。。。微妙です。でも、どうせやるなら仕組みも理解したいところです。こちらはACM会員で契約しているので読めるオライリー本にありましたので、こちらも読んでいこうと思います。

ゼロから作るDeep Learning ❹ ―強化学習編

作者:斎藤康毅
オライリージャパン

Amazon

他にも５，６冊見つけましたが、省略します。周辺をうろついているうちに何となくわかっていくものだという感じです。

さて、本を読みながら「なぜコースアウトするのかな？」と思い、ネットを調べているとそもそも学習データは１周どころではなく１０周以上（コースをはみ出さずに）走る必要があるようでした。そして得られた画像データは10,000枚程度であること、らしいです。

とりあえず１０周走って学習させたのですがこれもコースアウト。画像枚数をみると6,000枚でした。

では、ということでまた走りデータを集めた結果、9,200枚くらいになりました。これで学習した結果が以下になります👍　ああ、こういうことなのか。。。と体感しました。

youtu.be

学習アルゴリズムや各種パラメタの調整もあるけど、やはり、データが命ですね。。。異常データもクリーニングする必要があるでしょうし。とりあえずそれもなしにデータ数を増やしただけで成功したのは嬉しかったですねぇ。。。やっていることは何も変わっていません。量だけ変化したんですね。。。劇的に変化しました。

シミュレータの画像はキレイな画像ですし、同じ場所は同じ絵として取得できます。これが実車であれば映像も変化するでしょうし、当然、実機の制御や車体の状況も変化するので制御内容が同じではうまく走らないと想像します。

とはいえ、勉強だけしててもモチベあがりませんし。やっぱり手を動かして何か課題にぶつかって初めてやる気がでるんだろうなと思うわけです。そうして得られた知識やスキルは（どんなに忘れっぽい私でも）確実に身につきますしね。いい年してそんなこと言っていることが恥ずかしい限りですが。単純に面白いです。