AnnaMats
/

ppo-Pyramids-Training

Reinforcement Learning

deep-reinforcement-learning

ML-Agents-Pyramids

Model card Files Files and versions Metrics Training metrics Community

ppo-Pyramids-Training / ml-agents /mlagents /trainers /torch_entities /decoders.py

AnnaMats's picture

Second Push

05c9ac2 over 1 year ago

history blame contribute delete

793 Bytes

	from typing import List, Dict

	from mlagents.torch_utils import torch, nn
	from mlagents.trainers.torch_entities.layers import linear_layer


	class ValueHeads(nn.Module):
	def __init__(self, stream_names: List[str], input_size: int, output_size: int = 1):
	super().__init__()
	self.stream_names = stream_names
	_value_heads = {}

	for name in stream_names:
	value = linear_layer(input_size, output_size)
	_value_heads[name] = value
	self.value_heads = nn.ModuleDict(_value_heads)

	def forward(self, hidden: torch.Tensor) -> Dict[str, torch.Tensor]:
	value_outputs = {}
	for stream_name, head in self.value_heads.items():
	value_outputs[stream_name] = head(hidden).squeeze(-1)
	return value_outputs