Dev

[도서 리뷰] 강화학습 첫걸음

Ryan Woo 2018. 3. 11. 18:49

[나는 리뷰어다] 1월 이벤트에 당첨되어 한빛 미디어 첫걸음 시리즈중 신간인 강화학습 첫걸음을 접하게 되었다.

강화학습 첫걸음 - 텐서플로로 살펴보는 Q 러닝, MDP, DQN, A3C 강화학습 알고리즘

지은이 - 아서 줄리아나, 옮긴이 송교석


작년에 나온 신경망 첫걸음이 개인적으로 유익했던 터라 강화학습 첫걸음도 꽤 기대를 했고, 결론부터 말하자면 상당히 만족스러웠다.

신경망 첫걸음, 강화학습 첫걸음

책의 흐름은 간단한 밴딧 문제를 시작으로 부제에 나온대로 마르코프 결정과정(MDP), Q 러닝, 딥 Q 네트워크(DQN), 어싱크 어드밴티지 액터-크리틱(A3C), 그리고 파트2에서 심화 주제로 넘어 간다.

책의 구성은 챕터별 설명과 예제 코드가 포함되어 있다. 예제 코드를 이해해기 위해 텐서플로우와 파이썬의 기본적인 지식은 있어야 수워하게 실습을 진행할 수 있다. 예제 코드는 깃헙(https://github.com/awjuliani/DeepRL-Agents)에 모두 올라가있지만, 통채로 클론받아서 돌리는것 보다는 직접 코드를 쳐보고, 값을 변경해 가며 결과가 어떻게 달라지는지 확인하며 진행 한다면 책의 내용을 이해하는데 더욱 효과적일 것이다.

끝으로 이 책은 신경망과 경사하강법 등 머신러닝 기술에 어느 정도 익숙한 독자를 대상으로 쓰여졌다. 그러나 학습기법에 대한 설명이 심플하게 잘 되어있어 딥러닝이나 신경망에 대한 지식이 없어도 크게 거북하지 않을것이라 개인적으로 생각한다.

관련도서 소개 - 밑바닥부터 시작하는 딥러닝, 텐서플로 첫걸음, 딥러닝 첫걸음

혹시 딥러닝에 대해서 처음 접근한다면 위에 나와있는 관련도서나 앞에 언급한 신경망 첫걸음도 도움이 될 것이다.