์ ๋ํฐ ML-Agents ํดํท
(latest release) (all releases)
์ ๋ํฐ ๊ธฐ๊ณํ์ต ์์ด์ ํธ ํดํท (ML-Agents) ์ ๊ฒ์ ์ปจํ ์ธ ๋ฐ ๊ฒ์์ ํฌํจํ ๋ค์ํ ์๋ฎฌ๋ ์ด์ ์์ ํ์ฉํ๊ธฐ ์ํ ์ง๋ฅํ ์์ด์ ํธ๋ฅผ ํ๋ จ์ํค๋ ํ๊ฒฝ์ ์ ๊ณตํ๋ ์คํ ์์ค ํ๋ก์ ํธ์ ๋๋ค. ML-Agents๋ ๊ฒ์ ๊ฐ๋ฐ์ ๋ค์ด 2D, 3D ๋ฐ ๊ฐ์ํ์ค/์ฆ๊ฐํ์ค ๊ฒ์์์ ์ง๋ฅํ ์์ด์ ํธ๋ฅผ ์ฝ๊ฒ ๊ต์กํ ์ ์๋๋ก ์ต์ ์๊ณ ๋ฆฌ์ฆ์ ๊ตฌํ(PyTorch ๊ธฐ๋ฐ)์ ์ ๊ณตํฉ๋๋ค. ๊ฐ๋จํ ํ์ด์ฌ API๋ฅผ ์ฌ์ฉํ์ฌ ๊ฐํ ํ์ต, ๋ชจ๋ฐฉ ํ์ต, ์ ๊ฒฝ ์งํ ๋ฑ ๋ค๋ฅธ ๋ฐฉ๋ฒ์ ํ์ฉํ์ฌ ์์ด์ ํธ๋ฅผ ๊ต์กํ ์ ์์ต๋๋ค. ํ์ต๋ ์์ด์ ํธ๋ NPC ํ๋ ์ ์ด(๋ค์ค ์์ด์ ํธ ๋ฐ ์ ๋์ ์์ด์ ํธ์ ๊ฐ์ ๋ค์ํ ์ค์ ), ๊ฒ์ ๋น๋ ํ ์คํธ ์๋ํ, ๊ทธ๋ฆฌ๊ณ ์ถ์ ์ ๊ฒ์ ์ค๊ณ(๋ฐธ๋ฐ์ค) ๊ฒ์ฆ ๋ฑ์ ํฌํจํ ๋ค์ํ ์ฉ๋๋ก ํ์ฉํ ์ ์์ต๋๋ค. ML-Agents ํดํท์ ์ ๋ํฐ์ ์์ ๋ก์ด ํ๊ฒฝ์์ ์ธ๊ณต์ง๋ฅ ์์ด์ ํธ๋ฅผ ๊ฐ๋ฐํ๊ธฐ ์ํ ๊ธฐ๋ฐ์ ์ ๊ณตํ๋ฉฐ, ์ดํ ํตํด ์ฐ๊ตฌ์ ๋ฐ ๊ฒ์ ๊ฐ๋ฐ์ ๋ฑ ๊ด๋ฒ์ํ ์ปค๋ฎค๋ํฐ์ ์ ๊ทผํ ์ ์๊ธฐ ๋๋ฌธ์ ๊ฒ์ ๊ฐ๋ฐ์์ ์ธ๊ณต์ง๋ฅ ์ฐ๊ตฌ์ ๋ชจ๋์๊ฒ ์ํธ ์ด์ต์ด ๋ฉ๋๋ค.
ํน์ง
- 15+ ์ ๋ํฐ ํ๊ฒฝ ์์
- ๋ค์ํ ํ๊ฒฝ ๊ตฌ์ฑ ๋ฐ ๊ต์ก ์๋๋ฆฌ์ค ์ง์
- ๊ฒ์์ด๋ ์ปค์คํ ์ ๋ํฐ ์ฌ์ ํตํฉ๋ ์ ์๋ ์ ์ฐํ ์ ๋ํฐ SDK
- Proximal Policy Optimization (PPO) ์ Soft Actor-Critic (SAC) ์ ๋ ๊ฐ์ง ์ฌ์ธต ๊ฐํ ํ์ต ์๊ณ ๋ฆฌ์ฆ์ ์ด์ฉํ ํ๋ จ
- Behavioral Cloning ์ด๋ Generative Adversarial Imitation Learning ์ ํตํ ๋ชจ๋ฐฉ ํ์ต์ ๋ํ ๋ด์ฅ ์ง์
- ์ ๋์ (Adversarial) ์๋๋ฆฌ์ค์์ ์์ด์ ํธ๋ฅผ ๊ต์กํ๊ธฐ ์ํ Self-play ๋ฉ์ปค๋์ฆ
- ๋ณต์กํ ์์ ์ ๋ํด ์ฝ๊ฒ ์ ์ํ ์ ์๋ ์ปค๋ฆฌํ๋ผ ํ์ต ์๋๋ฆฌ์ค
- ํ๊ฒฝ ๋๋คํ๋ฅผ ์ฌ์ฉํ์ฌ ๊ฐ๋ ฅํ ์์ด์ ํธ ํ์ต
- ์จ ๋๋งจ๋ ์์ฌ ๊ฒฐ์ ์ ํตํ ์ ์ฐํ ์์ด์ ํธ ์ ์ด
- ์ฌ๋ฌ ๊ฐ์ ์ ๋ํฐ ํ๊ฒฝ ์ธ์คํด์ค๋ฅผ ๋์์ ์ฌ์ฉํ๋ ํ์ต
- ๋ค์ดํฐ๋ธ ํฌ๋ก์ค ํ๋ซํผ์ ์ง์ํ๊ธฐ ์ํด ์ ๋ํฐ ์ถ๋ก (Inference) ์์ง ์ด์ฉ
- ์ ๋ํฐ ํ๊ฒฝ ํ์ด์ฌ์์ ์ ์ด
- gym ๊ณผ ๊ฐ์ ์ ๋ํฐ ํ์ต ํ๊ฒฝ ์ ๊ณต
์ด ๋ชจ๋ ๊ธฐ๋ฅ์ ๋ํ ์์ธํ ์ค๋ช ์ ML-Agents ๊ฐ์ ํ์ด์ง๋ฅผ ์ฐธ์กฐํ์ญ์์ค.
๋ฆด๋ฆฌ์ฆ & ์ค๋ช ์
์ต์ ์ ์์ ์ ๋ฆด๋ฆฌ์ฆ๋ Release 12
์
๋๋ค. ํด๋ฆญํด์ ML-Agents์ ์ต์ ๋ฆด๋ฆฌ์ค๋ฅผ ์์ํ์ธ์. ์ฌ๊ธฐ
์๋ ํ์๋ ํ์ฌ ๊ฐ๋ฐ์ด ์งํ ์ค์ด๋ฉฐ ๋ถ์์ ํ ์ ์๋ master
๋ธ๋์น๋ฅผ ํฌํจํ ๋ชจ๋ ๋ฆด๋ฆฌ์ค๊ฐ ๋์ ์์ต๋๋ค. ๋ช ๊ฐ์ง ์ ์ฉํ ์ง์นจ:
- ๋ฒ์ ๊ด๋ฆฌ ํ์ด์ง ๋ GitHub ๋ฆด๋ฆฌ์ฆ๋ฅผ ๊ด๋ฆฌํ๋ ๋ฐฉ๋ฒ๊ณผ ๊ฐ ML-Agents ๊ตฌ์ฑ ์์์ ๋ํ ๋ฒ์ ๊ด๋ฆฌ ํ๋ก์ธ์ค๋ฅผ ๊ฐ๋ตํ ์ค๋ช ํฉ๋๋ค.
- ๋ฆด๋ฆฌ์ฆ ํ์ด์ง ๋ ๋ฆด๋ฆฌ์ค ๊ฐ์ ๋ณ๊ฒฝ ์ฌํญ์ ๋ํ ์ธ๋ถ ์ ๋ณด๊ฐ ํฌํจ๋์ด ์์ต๋๋ค.
- ๋ง์ด๊ทธ๋ ์ด์ (Migration) ํ์ด์ง ๋ ์ด์ ๋ฆด๋ฆฌ์ค์ ML-Agents ํดํท์์ ์ ๊ทธ๋ ์ด๋ํ๋ ๋ฐฉ๋ฒ์ ๋ํ ์ธ๋ถ ์ ๋ณด๊ฐ ํฌํจ๋์ด ์์ต๋๋ค.
- ์๋ ํ์ ์ค๋ช ์ ๋งํฌ์๋ ๊ฐ ๋ฆด๋ฆฌ์ค์ ๋ํ ์ค์น ๋ฐ ์ฌ์ฉ ์ง์นจ์ด ํฌํจ๋์ด ์์ต๋๋ค. ์ฌ์ฉ ์ค์ธ ๋ฆด๋ฆฌ์ค ๋ฒ์ ์ ํด๋นํ๋ ์ค๋ช ์๋ฅผ ํญ์ ์ฌ์ฉํด์ผ ํฉ๋๋ค.
๋ฒ์ | ๋ฆด๋ฆฌ์ฆ ๋ ์ง | ์์ค | ์ค๋ช ์ | ๋ค์ด๋ก๋ |
---|---|---|---|---|
master (unstable) | -- | source | docs | download |
Release 12 | December 22, 2020 | source | docs | download |
Release 11 | December 21, 2020 | source | docs | download |
Release 10 | November 18, 2020 | source | docs | download |
Release 9 | November 4, 2020 | source | docs | download |
Release 8 | October 14, 2020 | source | docs | download |
Release 7 | September 16, 2020 | source | docs | download |
Release 6 | August 12, 2020 | source | docs | download |
Release 5 | July 31, 2020 | source | docs | download |
์ธ์ฉ
์ธ๊ณต์ง๋ฅ ํ๋ซํผ์ผ๋ก์์ ์ ๋ํฐ์ ๋ํ ๋ ผ์์ ๊ด์ฌ์ด ์๋ ์ฐ๊ตฌ์๋ผ๋ฉด, ํ๋ฆฌํ๋ฆฐํธ๋ฅผ ์ฐธ์กฐํ์์ค. ๋ฐ ML-Agents ํดํท์ ๋ํ ์ฐธ์กฐ ๋ฌธ์.
์ ๋ํฐ ๋๋ ML-Agents ํดํท์ ์ฌ์ฉํ์ฌ ์ฐ๊ตฌ๋ฅผ ์ํํ๋ ๊ฒฝ์ฐ, ๋ค์ ๋ ผ๋ฌธ์ ์ฐธ์กฐ ์๋ฃ๋ก ์ธ์ฉํ ๊ฒ์ ์์ฒญํฉ๋๋ค. Juliani, A., Berges, V., Teng, E., Cohen, A., Harper, J., Elion, C., Goy, C., Gao, Y., Henry, H., Mattar, M., Lange, D. (2020). Unity: A General Platform for Intelligent Agents. arXiv preprint arXiv:1809.02627. https://github.com/Unity-Technologies/ml-agents.
์ถ๊ฐ ๋ฆฌ์์ค
์ ๋ํฐ ๋ฐ ML-Agents ํดํท์ ๋ํด ์์ธํ ์๊ฐํ๋ ์ ๋ํฐ ํ์ต ๊ณผ์ ์ด ์์ต๋๋ค. ML-Agents: ๋ฒ์
๋ํ CodeMonkeyUnity์ ์ ํดํ์ฌ ML-Agents ํดํท์ ๊ตฌํ ๋ฐ ์ฌ์ฉ ๋ฐฉ๋ฒ์ ๋ํ ํํ ๋ฆฌ์ผ ๋น๋์ค๋ ์ ์ํ์ต๋๋ค.
๋ํ ML-Agents ๊ด๋ จ ๋ธ๋ก๊ทธ ๊ฒ์๋ฌผ๋ ๊ฒ์ํ์ต๋๋ค.
- (December 28, 2020) Happy holidays from the Unity ML-Agents team!
- (November 20, 2020) How Eidos-Montrรฉal created Grid Sensors to improve observations for training agents
- (November 11, 2020) 2020 AI@Unity interns shoutout
- (May 12, 2020) Announcing ML-Agents Unity Package v1.0!
- (February 28, 2020) Training intelligent adversaries using self-play with ML-Agents
- (November 11, 2019) Training your agents 7 times faster with ML-Agents
- (October 21, 2019) The AI@Unity interns help shape the world
- (April 15, 2019) Unity ML-Agents Toolkit v0.8: Faster training on real games
- (March 1, 2019) Unity ML-Agents Toolkit v0.7: A leap towards cross-platform inference
- (December 17, 2018) ML-Agents Toolkit v0.6: Improved usability of Brains and Imitation Learning
- (October 2, 2018) Puppo, The Corgi: Cuteness Overload with the Unity ML-Agents Toolkit
- (September 11, 2018) ML-Agents Toolkit v0.5, new resources for AI researchers available now
- (June 26, 2018) Solving sparse-reward tasks with Curiosity
- (June 19, 2018) Unity ML-Agents Toolkit v0.4 and Udacity Deep Reinforcement Learning Nanodegree
- (May 24, 2018) Imitation Learning in Unity: The Workflow
- (March 15, 2018) ML-Agents Toolkit v0.3 Beta released: Imitation Learning, feedback-driven features, and more
- (December 11, 2017) Using Machine Learning Agents in a real game: a beginnerโs guide
- (December 8, 2017) Introducing ML-Agents Toolkit v0.2: Curriculum Learning, new environments, and more
- (September 19, 2017) Introducing: Unity Machine Learning Agents Toolkit
- Overviewing reinforcement learning concepts (multi-armed bandit and Q-learning)
์ปค๋ฎค๋ํฐ ๊ทธ๋ฆฌ๊ณ ํผ๋๋ฐฑ
ML-Agents ํดํท์ ์คํ์์ค ํ๋ก์ ํธ์ด๋ฉฐ ์ปจํธ๋ฆฌ๋ทฐ์ ์ ํ์ํฉ๋๋ค. ๋ง์ฝ ์ปจํธ๋ฆฌ๋ทฐ์ ์ ์ํ์๋ ๊ฒฝ์ฐ ์ปจํธ๋ฆฌ๋ทฐ์ ๊ฐ์ด๋๋ผ์ธ ๊ณผ ํ๋ ๊ท์น ์ ๊ฒํ ํด์ฃผ์ญ์์ค.
ML-Agents ํดํท ์ค์น ๋ฐ ์ค์ ๊ณผ ๊ด๋ จ๋ ๋ฌธ์ ๋๋ ์์ด์ ํธ๋ฅผ ๊ฐ์ฅ ์ ์ค์ ํ๊ฑฐ๋ ๊ต์กํ๋ ๋ฐฉ๋ฒ์ ๋ํ ๋ ผ์๋ ์ ๋ํฐ ML-Agents ํฌ๋ผ ์ ์ ์ค๋ ๋๋ฅผ ์์ฑํ์ญ์์ค. ๊ฐ๋ฅํ ๋ง์ ์ธ๋ถ ์ ๋ณด๋ฅผ ํฌํจํด์ผ ํฉ๋๋ค. ML-Agents ํดํท์ ์ฌ์ฉํ์ฌ ๋ค๋ฅธ ๋ฌธ์ ๊ฐ ๋ฐ์ํ๊ฑฐ๋ ํน์ ๊ธฐ๋ฅ ์์ฒญ์ด ์๋ ๊ฒฝ์ฐ ์ด์ ์ ์ถ ๋ถํํฉ๋๋ค.
์ฌ๋ฌ๋ถ์ ์๊ฒฌ์ ์ ํฌ์๊ฒ ๋งค์ฐ ์ค์ํฉ๋๋ค. ์ ๋ํฐ ML-Agents ํดํท์ ๊ด๋ จ๋ ์ฌ๋ฌ๋ถ์ ์๊ฒฌ์ ํตํด์ ์ ํฌ๋ ๊ณ์ํด์ ๋ฐ์ ํ๊ณ ์ฑ์ฅํ ์ ์์ต๋๋ค. ๋จ ๋ช ๋ถ๋ง ์ฌ์ฉํ์ฌ ์ ํฌ์๊ฒ ์๋ ค์ฃผ์ธ์.
๋ค๋ฅธ ์๊ฒฌ๊ณผ ํผ๋๋ฐฑ์ ML-Agents ํ๊ณผ ์ง์ ์ฐ๋ฝ๋ถํ๋๋ฆฝ๋๋ค. (ml-agents@unity3d.com)
๊ฐ์ธ์ ๋ณด
Unity ML-Agents ํดํท์ ๋ํ ๊ฐ๋ฐ์ ๊ฒฝํ์ ๊ฐ์ ํ๊ธฐ ์ํด, ์ฐ๋ฆฌ๋ ์๋ํฐ ๋ด๋ถ ๋ถ์์ ์ถ๊ฐํ์ต๋๋ค. ์ ๋ํฐ ๊ฐ์ธ ์ ๋ณด ๋ณดํธ ์ ์ฑ ์ "Unity๊ฐ ๊ธฐ๋ณธ์ ์ผ๋ก ์์งํ๋ ์ ๋ณด"๋ฅผ ์ฐธ์กฐํ์๊ธฐ ๋ฐ๋๋๋ค.
๋ผ์ด์ผ์ค
ํ๊ธ ๋ฒ์ญ
์ ๋ํฐ ML-Agents ๊ด๋ จ ๋ฌธ์์ ํ๊ธ ๋ฒ์ญ์ [์ฅํ์ค(Hyeonjun Jang)][https://github.com/JangHyeonJun], ๋ฏผ๊ท์ (Kyushik Min)์ ์ํด ์งํ๋์์ต๋๋ค. ๋ด์ฉ์ ์ค๋ฅ๋ ์คํ์๊ฐ ์๋ ๊ฒฝ์ฐ ๊ฐ ๋ฌธ์์ ๋ฒ์ญ์ ์งํํ ์ฌ๋์ ์ด๋ฉ์ผ์ ํตํด ์ฐ๋ฝ์ฃผ์๋ฉด ๊ฐ์ฌ๋๋ฆฌ๊ฒ ์ต๋๋ค.
์ฅํ์ค: totok682@naver.com
๋ฏผ๊ท์: kyushikmin@gmail.com
์ตํํ: chlxogur_@naver.com