pt-sk
/

GPT2-IMDB-Sentiment-FineTuned-with-PPO

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

GPT2-IMDB-Sentiment-FineTuned-with-PPO / reference materials

1 contributor

History: 2 commits

pt-sk's picture

Upload 5 files

5e189fd verified 7 months ago

Direct Preference Optimization (DPO).pdf

2.21 MB
LFS

Upload 5 files 7 months ago
HIGH-DIMENSIONAL CONTINUOUS CONTROL USING GENERALIZED ADVANTAGE ESTIMATION.pdf

1.8 MB
LFS

Upload 5 files 7 months ago
Proximal Policy Optimization Algorithms.pdf

2.92 MB
LFS

Upload 5 files 7 months ago
Slides.pdf

903 kB

Upload 5 files 7 months ago
Training language models to follow instructions.pdf

1.8 MB
LFS

Upload 5 files 7 months ago
sample.py

0 Bytes

Create reference materials/sample.py 7 months ago