Posts by Year

2022

Study Log (2022.09)

1 minute read

2022-09-20 모델 성능 개선으로 익히는 강화학습 A-Z Part06. 모델 기반 강화학습 Ch 03. 최적제어와 모델기반 강화학습 07. pytorch 모델 MPC 구...

Study Log (2022.08)

less than 1 minute read

2022-08-31 모델 성능 개선으로 익히는 강화학습 A-Z Part 5. 심층강화학습 Ch 01. 심층강화학습 논문 읽기 ...

Study Log (2022.07)

less than 1 minute read

2022-07-05 모델 성능 개선으로 익히는 강화학습 A-Z Part 5. 심층강화학습 Ch 01. 심층강화학습 논문 읽기 11. Asynchrnous Advantage A...

Study Log (2022.06)

less than 1 minute read

2022-06-17 모델 성능 개선으로 익히는 강화학습 A-Z Part 5. 심층강화학습 Ch 01. 심층강화학습 논문 읽기 09. Maximization bias이 싫어요 ...

Study Log (2022.05)

1 minute read

2022-05-31 프로그래머를 위한 베이지안 with 파이썬 Ch 07. 베이지안 A/B 테스트 7.1 서론 7.2 전환율 테스트 개요 7.3 선형손실함수 추가하기 7...

Study Log (2022.02)

1 minute read

2022-02-28 모델 성능 개선으로 익히는 강화학습 A-Z Part 5. 심층강화학습 Ch 01. 심층강화학습 논문 읽기 08. 심층강화학습을 여행하는 히치하이커를 위한 ...

Study Log (2022.01)

1 minute read

2022-01-27 모델 성능 개선으로 익히는 강화학습 A-Z Part 4. 정책 최적화 Ch 01. 정책 경사 소개 01. 정책 경사 정책 경사! - 1 ...

Back to Top ↑

2021

Study Log (2021.12)

2 minute read

2021-12-29 모델 성능 개선으로 익히는 강화학습 A-Z Part 2. 가치기반 강화학습의 풀이법 Ch 03. 모델없이 세상 알아가기 05. TD 를 활용한 정책추정 실...

Study Log (2021.11)

less than 1 minute read

2021-11-01 S-K RL train_FT10_ppo_node_only.py do_simulate_on_aggregated_state() value_loss, action_loss, dist_entr...

Study Log (2021.10)

less than 1 minute read

2021-10-01 S-K RL train_FT10_ppo_node_only.py do_simulate_on_aggregated_state() value_loss, action_loss, dist_entr...

Study Log (2021.09)

less than 1 minute read

2021-09-04 단단한 강화학습 Chapter #2. 다중선택 2.1 다중 선택 문제 2.2 행동 가치 방법 2.3 10중 선택 테스트 2.4 점증적 구현 ...

Study Log (2021.08)

1 minute read

2021-08-22 바닥부터 배우는 강화학습 Deep RL 첫 걸음 7.1 함수를 이용한 근사 7.2 인공 신경망의 도입 ...

Study Log (2021.07)

less than 1 minute read

2021-07-01 S-K RL train_FT10_ppo_node_only.py do_simulate_on_aggregated_state() value_loss, action_loss, dist_entr...

Study Log (2021.06)

less than 1 minute read

2021-06-01 S-K RL train_FT10_ppo_node_only.py do_simulate_on_aggregated_state() value_loss, action_loss, dist_entr...

Study Log (2021.05)

less than 1 minute read

2021-05-01 S-K RL train_FT10_ppo_node_only.py do_simulate_on_aggregated_state() value_loss, action_loss, dist_entr...

Study Log (2021.04)

less than 1 minute read

2021-04-12 S-K RL train_FT10_ppo_node_only.py do_simulate_on_aggregated_state() value_loss, action_loss, dist_entr...

Study Log (2021.03)

8 minute read

2021-03-23 S-K RL train_FT10_ppo_node_only.py do_simulate_on_aggregated_state() value_loss, action_loss, dist_entr...

Study Log (2021.02)

5 minute read

2021-02-28 바닥부터 배우는 강화학습 알파고와 MCTS 10.1 알파고 10.2 알파고 제로 ...

Study Log (2021.01)

1 minute read

2021-01-31 S-K RL train_FT10_ppo_node_only.py do_simulate_on_aggregated_state() value_loss, action_loss, dist_entr...

Back to Top ↑

2020

Study Log (2020.12)

less than 1 minute read

2020-12-01 S-K RL train_FT10_ppo_node_only.py pyjssp > benchmarks.py pyjssp > simulators.py pyjssp...

Study Log (2020.11)

less than 1 minute read

2020-11-01 S-K RL train_FT10_ppo_node_only.py pyjssp > benchmarks.py pyjssp > simulators.py pyjssp...

Study Log (2020.10)

less than 1 minute read

2020-10-01 S-K RL train_FT10_ppo_node_only.py pyjssp > benchmarks.py pyjssp > simulators.py pyjssp...

Study Log (2020.09)

less than 1 minute read

2020-09-01 S-K RL train_FT10_ppo_node_only.py pyjssp > benchmarks.py pyjssp > simulators.py pyjssp...

Study Log (2020.08)

less than 1 minute read

2020-08-27 S-K RL train_FT10_ppo_node_only.py pyjssp > benchmarks.py pyjssp > simulators.py pyjssp...

Study Log (2020.07)

1 minute read

2020-07-23 S-K RL train_FT10_ppo_node_only.py pyjssp > benchmarks.py pyjssp > simulators.py pyjssp...

Study Log (2020.06)

less than 1 minute read

2020-06-29 팡요랩 강화학습 7강 - Policy Gradient 강화학습 8강 - Integrating Learning and Planning

Study Log (2020.05)

2 minute read

2020-05-31 S-K RL train_FT10_ppo_node_only.py pyjssp > benchmarks.py pyjssp > simulators.py pyjssp...

Study Log (2020.04)

4 minute read

2020-04-30 S-K RL train_FT10_ppo_node_only.py pyjssp > benchmarks.py pyjssp > simulators.py pyjssp...

Study Log (2020.03)

2 minute read

2020-03-31 S-K RL sequential_simulation_test.py src/utils.py src/training_utils.py pyjssp > simulator...

Python Setup on Mac

1 minute read

Python 3.7.6 버전 설치 /usr/local/bin 폴더 /Library/Frameworks/Python.framework/Versions/3.7/bin 폴더 /Users/kimsanghun/opt/anaconda3...

Study Log (2020.02)

1 minute read

2020-02-21 multi_step_actor simple_actor_test.py rl/simple_action_actor.py rl/brain.py rl/QAgent.py ...

Palo Alto Log

72 minute read

이 글은… 2020-01-30 ~ 2021-01-29동안 Stanford에서 진행하는 Visiting Scholar 기록 학교(연구), 미국 생활 및 기타 에피소드 등을 일자별로 간략하게 정리할 예정 혹시 기회가 되면 온/오프라인 출판 등도 고려해볼 계획 ^^

Study Log (2020.01)

3 minute read

2020-01-30 Reinforcement Learning Chapter 12. Eligibility Traces 12.5 True Online TD($\lambda$) 12.6 Dutch Trace...

Back to Top ↑

2019

Study Log (2019.12)

4 minute read

2019-12-31 Reinforcement Learning Chapter 8. Planning and Learning with Tabular Methods 8.1 Models and Planning 8....

Study Log

less than 1 minute read

이 글은… 강화학습에 대해 좀 더 심도있게 공부하고자 시작 책, 블로그, 동영상, 소스코드 등 다양한 소스 활용 중간에 이해 안되는 부분이 있으면, 관련 상세자료 재검색 3개월 정도 쌓이면 생각한걸 만들어 볼 수 있지 않을까 기대! 나름의 방식으로 정리&...

Back to Top ↑