davidgaofc
/

PPO_base

Reinforcement Learning

text2text-generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

PPO_base / model.safetensors

Commit History

Push model using huggingface_hub.

e979c76

davidgaofc commited on Nov 24, 2023