yakazimir
/

qwen_cpo_entropy_0_3

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

qwen_cpo_entropy_0_3

1 contributor

History: 2 commits

yakazimir's picture

Training in progress, step 5604

5a5a9af verified 21 days ago

.gitattributes

1.52 kB

initial commit 22 days ago
added_tokens.json

80 Bytes

Training in progress, step 5604 21 days ago
config.json

708 Bytes

Training in progress, step 5604 21 days ago
merges.txt

1.67 MB

Training in progress, step 5604 21 days ago
model.safetensors

927 MB
LFS

Training in progress, step 5604 21 days ago
special_tokens_map.json

509 Bytes

Training in progress, step 5604 21 days ago
tokenizer.json

7.03 MB

Training in progress, step 5604 21 days ago
tokenizer_config.json

1.17 kB

Training in progress, step 5604 21 days ago
training_args.bin
Detected Pickle imports (13)
- "torch.device",
- "simpo_config.SimPOConfig",
- "transformers.trainer_utils.IntervalStrategy",
- "transformers.trainer_utils.HubStrategy",
- "accelerate.utils.dataclasses.DeepSpeedPlugin",
- "transformers.integrations.deepspeed.HfDeepSpeedConfig",
- "transformers.trainer_pt_utils.AcceleratorConfig",
- "accelerate.state.PartialState",
- "accelerate.utils.dataclasses.DistributedType",
- "transformers.training_args.OptimizerNames",
- "transformers.integrations.deepspeed.HfTrainerDeepSpeedConfig",
- "torch.bfloat16",
- "transformers.trainer_utils.SchedulerType"
How to fix it?
7.1 kB
LFS

Training in progress, step 5604 21 days ago
vocab.json

2.78 MB

Training in progress, step 5604 21 days ago