Recent Posts

Study Log (2021.09)

less than 1 minute read

2021-09-04 단단한 강화학습 Chapter #2. 다중선택 2.1 다중 선택 문제 2.2 행동 가치 방법 2.3 10중 선택 테스트 2.4 점증적 구현 ...

Study Log (2021.08)

1 minute read

2021-08-22 바닥부터 배우는 강화학습 Deep RL 첫 걸음 7.1 함수를 이용한 근사 7.2 인공 신경망의 도입 ...

Study Log (2021.07)

less than 1 minute read

2021-07-01 S-K RL train_FT10_ppo_node_only.py do_simulate_on_aggregated_state() value_loss, action_loss, dist_entr...

Study Log (2021.06)

less than 1 minute read

2021-06-01 S-K RL train_FT10_ppo_node_only.py do_simulate_on_aggregated_state() value_loss, action_loss, dist_entr...