Upload with huggingface_hub
Browse files- agent.py +31 -0
- model_20x10.zip +3 -0
- model_bob.zip +3 -0
agent.py
ADDED
@@ -0,0 +1,31 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
from stable_baselines3 import PPO
|
2 |
+
from tetris_gym.wrappers.observation import ExtendedObservationWrapper
|
3 |
+
class Agent:
|
4 |
+
"""
|
5 |
+
A kötelező programként beadandó ágens leírása.
|
6 |
+
"""
|
7 |
+
|
8 |
+
def __init__(self, env) -> None:
|
9 |
+
"""
|
10 |
+
A konsztruktorban van lehetőség például a modell betöltésére
|
11 |
+
vagy a környezet wrapper-ekkel való kiterjesztésére.
|
12 |
+
"""
|
13 |
+
|
14 |
+
self.model = PPO.load("agent/model_bob")
|
15 |
+
|
16 |
+
# A környezetet kiterjeszthetjük wrapper-ek segítségével.
|
17 |
+
# Ha tanításkor modosítottuk a megfigyeléseket,
|
18 |
+
# akkor azt a módosítást kiértékeléskor is meg kell adnunk.
|
19 |
+
self.observation_wrapper = ExtendedObservationWrapper(env)
|
20 |
+
|
21 |
+
def act(self, observation):
|
22 |
+
"""
|
23 |
+
A megfigyelés alapján visszaadja a következő lépést.
|
24 |
+
Ez a függvény fogja megadni az ágens működését.
|
25 |
+
"""
|
26 |
+
|
27 |
+
# Ha tanításkor modosítottuk a megfigyeléseket,
|
28 |
+
# akkor azt a módosítást kiértékeléskor is meg kell adnunk.
|
29 |
+
extended_obsetvation = self.observation_wrapper.observation(observation)
|
30 |
+
|
31 |
+
return self.model.predict(extended_obsetvation, deterministic=True)
|
model_20x10.zip
ADDED
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
1 |
+
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:199e56bd1592b71d3a044075401ac358634aec25952d621578082c99857ff646
|
3 |
+
size 493686
|
model_bob.zip
ADDED
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
1 |
+
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:439a5dfbe45c7861c96fa60b1dbcbed784a5d67453049b06dcbd2aea3e1b7686
|
3 |
+
size 493701
|