ο»Ώ# μ€μΉ
ML-Agentsλ₯Ό μ€μΉνκ³ μ¬μ©νκΈ° μν΄ μ λν°λ₯Ό μ€μΉν΄μΌ νκ³ μ΄ Repository(μ μ₯μ)λ₯Ό Clone(볡μ )νκ³ μΆκ°μ’ μμ±μ κ°μ§λ Python(νμ΄μ¬)μ μ€μΉν΄μΌν©λλ€. μλ Subsection(νμμΉμ )μμλ Docker(λ컀) μ€μ μΈμλ κ° λ¨κ³λ₯Ό κ°κ΄μ μΌλ‘ μ€λͺ ν©λλ€.
Unity 2018.4 λλ μ΄νμ λ²μ μ μ€μΉνμμμ€.
λ€μ΄λ‘λνκ³ μ€μΉνμμμ€. λ§μ½ μ ν¬μ λ컀 μ€μ (μ°¨νμ μκ°ν )μ μ¬μ©νκ³ μΆλ€λ©΄, μ λν°λ₯Ό μ€μΉν λ, Linux Build Supportλ₯Ό μ€μ νμμμ€.
Windows μ¬μ©μ
Windowsμμ νκ²½μ μ€μ νκΈ° μν΄, μΈλΆ μ¬νμ μ€μ λ°©λ²μ λν΄ μμ±νμμ΅λλ€. Macκ³Ό Linuxλ λ€μ κ°μ΄λλ₯Ό νμΈν΄μ£Όμμμ€.
Mac λλ Unix μ¬μ©μ
ML-Agents Toolkit μ μ₯μ 볡μ
μ λν° μ€μΉ νμ ML-Agents Toolkit κΉνλΈ μ μ₯μλ₯Ό μ€μΉνκ³ μΆμ κ²μ λλ€.
git clone https://github.com/Unity-Technologies/ml-agents.git
UnitySDK
νμ λλ ν 리μλ νλ‘μ νΈμ μΆκ°ν μ λν° μ μ
μ΄ ν¬ν¨λμ΄ μμ΅λλ€.
λν μμνλλ° λμμ΄ λλ λ§μ μμ νκ²½λ€μ΄ μμ΅λλ€.
ml-agents
νμ λλ ν 리μλ μ λν° νκ²½κ³Ό ν¨κ² μ¬μ©νλ μ¬μΈ΅ κ°ννμ΅ νΈλ μ΄λ νμ΄μ¬ ν¨ν€μ§κ° ν¬ν¨λμ΄ μμ΅λλ€.
ml-agents-envs
νμ λλ ν 리μλ ml-agents
ν¨ν€μ§μ μ’
μλλ μ λν°μ μΈν°νμ΄μ€λ₯Ό μν νμ΄μ¬ APIκ° ν¬ν¨λμ΄ μμ΅λλ€.
gym-unity
νμ λλ ν 리μλ OpenAI Gymμ μΈν°νμ΄μ€λ₯Ό μν ν¨ν€μ§κ° ν¬ν¨λμ΄ μμ΅λλ€.
νμ΄μ¬κ³Ό mlagents ν¨ν€μ§ μ€μΉ
ML-Agents toolkitμ μ¬μ©νκΈ° μν΄ setup.py fileμ λμ΄λ μ’ μμ±κ³Ό ν¨κ» νμ΄μ¬ 3.8μ΄ νμν©λλ€. μ£Όμ μ’ μμ±μ μΌλΆλ λ€μμ ν¬ν¨ν©λλ€:
- TensorFlow (Requires a CPU w/ AVX support)
- Jupyter
Python 3.8μ΄ λ§μ½ μ€μΉλμ΄ μμ§ μλ€λ©΄, λ€μ΄λ‘λνκ³ μ€μΉνμμμ€.
λ§μ½ λΉμ μ νμ΄μ¬ νκ²½μ΄ pip3
μ ν¬ν¨νμ§ μλλ€λ©΄, λ€μ
μ§μμ¬ν
μ λ°λΌμ μ€μΉνμμμ€.
μ’
μμ±κ³Ό mlagents
νμ΄μ¬ ν¨ν€μ§λ₯Ό μ€μΉνκΈ° μν΄ λ€μ λͺ
λ Ήμ΄λ₯Ό μ€ννμμμ€:
pip3 install mlagents
μ΄ λͺ
λ Ήμ΄λ₯Ό ν΅ν΄ PyPiλ‘ λΆν°(볡μ λ μ μ₯μκ° μλ) ml-agents
κ° μ€μΉλ κ²μ
λλ€.
λ§μ½ μ±κ³΅μ μΌλ‘ μ€μΉλ₯Ό μλ£ νλ€λ©΄, mlagents-learn --help
λͺ
λ Ήμ΄λ₯Ό μ€νν μ μμ κ²μ
λλ€.
λͺ
λ Ήμ΄λ₯Ό μ€ννλ©΄ μ λν° λ‘κ³ μ mlagents-learn
μμ μ¬μ©ν μ μλ λͺ
λ Ήμ΄ λΌμΈ 맀κ°λ³μλ€μ λ³Ό μ μμ΅λλ€.
μ£Όμ:
- νμ¬ Python 3.8 λλ Python 3.5μ μ§μνμ§ μμ΅λλ€.
- λ§μ½ Anacondaλ₯Ό μ¬μ©νκ³ TensorFlowμ λ¬Έμ κ° μλ€λ©΄, λ€μ λ§ν¬μμ Anaconda νκ²½μμ μ΄λ»κ² TensorFlowλ₯Ό μ€μΉνλμ§ νμΈνμμμ€.
κ°λ°μ μν μ€μΉλ°©λ²
λ§μ½ ml-agents
λλ ml-agents-envs
λ₯Ό μμ νκ³ μΆλ€λ©΄, PyPiκ° μλ 볡μ λ μ μ₯μλ‘ λΆν° ν¨ν€μ§λ₯Ό μ€μΉν΄μΌ ν©λλ€.
μ΄λ₯Ό μν΄, ml-agents
μ ml-agents-envs
λ₯Ό κ°κ° μ€μΉν΄μΌ ν©λλ€. μ μ₯μμ λ£¨νΈ λλ ν 리μμ λ€μ λͺ
λ Ήμ΄λ₯Ό μ€ννμμμ€:
cd ml-agents-envs
pip3 install -e ./
cd ..
cd ml-agents
pip3 install -e ./
-e
νλκ·Έλ₯Ό μ¬μ©νμ¬ pipλ₯Ό μ€ν νλ©΄ νμ΄μ¬ νμΌμ μ§μ λ³κ²½ν μ μκ³ mlagents-learn
λ₯Ό μ€νν λ λ°μλ©λλ€.
mlagents
ν¨ν€μ§κ° mlagents_envs
μ μμ‘΄μ μ΄κ³ , λ€λ₯Έ μμλ‘ μ€μΉνλ©΄ PyPiλ‘ λΆν° mlagents_envs
λ₯Ό
μ€μΉν μ μκΈ° λλ¬Έμ μ΄ μμλλ‘ ν¨ν€μ§λ₯Ό μ€μΉνλ κ²μ μ€μν©λλ€.
λ컀 κΈ°λ° μ€μΉ
λ§μ½ ML-Agentsλ₯Ό μν΄ λ컀λ₯Ό μ¬μ©νκ³ μΆλ€λ©΄, μ΄ κ°μ΄λλ₯Ό λ°λΌνμμμ€.
λ€μ λ¨κ³
κΈ°μ΄ κ°μ΄λ νμ΄μ§μλ μ λν° λ΄μμ ML-Agents toolkitμ μ€μ λ° νμ΅λ λͺ¨λΈ μ€ν, νκ²½ ꡬμΆ, νμ΅ λ°©λ²μ λν μ¬λ¬ 짧μ νν 리μΌμ ν¬ν¨νκ³ μμ΅λλ€.
λμλ§
ML-Agentsμ κ΄λ ¨λ λ¬Έμ κ° λ°μνλ©΄ μ ν¬μ FAQμ μ μ½ μ¬ν νμ΄μ§λ₯Ό μ°Έκ³ ν΄ μ£Όμμμ€. λ§μ½ λ¬Έμ μ λν μ무κ²λ μ°Ύμ μ μλ€λ©΄ OS, Pythons λ²μ λ° μ νν μ€λ₯ λ©μΈμ§μ ν¨κ» μ΄μ μ μΆμ ν΄μ£Όμμμ€.
νκΈ λ²μ
ν΄λΉ λ¬Έμμ νκΈ λ²μμ μ₯νμ€ (Hyeonjun Jang)μ μν΄ μ§νλμμ΅λλ€. λ΄μ©μ μ€λ₯λ μ€νμκ° μλ κ²½μ° totok682@naver.com μΌλ‘ μ°λ½μ£Όμλ©΄ κ°μ¬λλ¦¬κ² μ΅λλ€.