Recent Posts

Study Log (2022.01)

1 minute read

2022-01-27 모델 성능 개선으로 익히는 강화학습 A-Z Part 4. 정책 최적화 Ch 01. 정책 경사 소개 01. 정책 경사 정책 경사! - 1 ...

Study Log (2021.12)

2 minute read

2021-12-29 모델 성능 개선으로 익히는 강화학습 A-Z Part 2. 가치기반 강화학습의 풀이법 Ch 03. 모델없이 세상 알아가기 05. TD 를 활용한 정책추정 실...

Study Log (2021.11)

less than 1 minute read

2021-11-01 S-K RL train_FT10_ppo_node_only.py do_simulate_on_aggregated_state() value_loss, action_loss, dist_entr...

Study Log (2021.10)

less than 1 minute read

2021-10-01 S-K RL train_FT10_ppo_node_only.py do_simulate_on_aggregated_state() value_loss, action_loss, dist_entr...