davidgaofc
/

PPO_base

Reinforcement Learning

text2text-generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

PPO_base / README.md

davidgaofc's picture

initial commit

61189c8 about 1 year ago

|

21 Bytes

metadata

license: mit