Spaces:

Dovakiins
/

qwerrwe

Build error

App Files Files Community

Commit History

8bit and deepspeed changes

9190ada

winglian commited on Apr 30, 2023

update ds_config

4dbef09

winglian commited on Apr 30, 2023

don't load models in 8bit unless they are using an adapter, also fix tokenizer load in exceptional case

6dfdd2d

winglian commited on Apr 30, 2023

fix fsdp training args

29936bb

winglian commited on Apr 30, 2023

fix for zero value warmup steps

7882181

winglian commited on Apr 30, 2023

fix sharegpt tokenization, refactor tokenization debugging

5159d00

winglian commited on Apr 30, 2023

wire up gradient checkpointing for 4bit

c0f50d9

winglian commited on Apr 29, 2023

Merge pull request #9 from winglian/dev

4e705ed
unverified

winglian commited on Apr 25, 2023

fix dataset handling, support galactica

4a17a4c

winglian commited on Apr 24, 2023

tweaks to data loading, 8 bit adam, accelerate and deepspeed

097d367

winglian commited on Apr 22, 2023

shuffle and split dataset after save/load

4f2584f

winglian commited on Apr 20, 2023

fix sharegpt handling from hf, don't worry about loading llama if using earlier transformers release

8d43785

winglian commited on Apr 20, 2023

stablelm support

8e2a560

winglian commited on Apr 19, 2023

various bugfixes

94f5e41

winglian commited on Apr 19, 2023

ignore config, add python 3.9 (#8)

2624bc2
unverified

ehartford commited on Apr 24, 2023

fix bug when model_type not explicitly passed

bb991fd

winglian commited on Apr 19, 2023

improve inference

d653859

winglian commited on Apr 19, 2023

fix runpod script

5749eb0

winglian commited on Apr 19, 2023

cleanup empty lines, tweak env for runpod setup

7753cde

winglian commited on Apr 19, 2023

handle empty lines

f50de1b

winglian commited on Apr 19, 2023

quickstart instructions for starting from runpod (#5)

0a472e1
unverified

winglian commited on Apr 18, 2023

update readme w compat matrix

5cb7ea4

winglian commited on Apr 18, 2023

attempt xformers hijack attention

8746b70

winglian commited on Apr 18, 2023

WIP large refactor to make finetune script a little more manageable (#3)

6045345
unverified

winglian commited on Apr 18, 2023

add support for alpaca reflect training (#2)

81de0ef
unverified

winglian commited on Apr 18, 2023

update readme

34af1b4

winglian commited on Apr 18, 2023

Tokenization open assistant (#1)

87d7825
unverified

winglian commited on Apr 18, 2023

fix llama check

eb80890

winglian commited on Apr 18, 2023

update readme

3f3f561

winglian commited on Apr 18, 2023

fix conditional check to prevent always using 4bit

8f36f3c

winglian commited on Apr 18, 2023

imrpove llama check and fix safetensors file check

69164da

winglian commited on Apr 18, 2023

suppport for alpaca-like instruction datasets without inputs

e107643

winglian commited on Apr 18, 2023

casts the prepared data to int16 (doesn't help with training memory)

2db9436

winglian commited on Apr 18, 2023

bugfixes

120e7df

winglian commited on Apr 17, 2023

fix lora target module, require explicit flash attention, fix min logging steps, don't use adam8bit for int4, hash prepared datasets, support hf hub datasets

87e073d

winglian commited on Apr 17, 2023

fix install to work with latest alpaca lora 4bit

4131183

winglian commited on Apr 17, 2023

4bit quantized support (wip)

77fca25

winglian commited on Apr 17, 2023

cleanup, prep for 4bit quant support

12de7b7

winglian commited on Apr 16, 2023

deepspeed doesn't work with flash-attn, and the gpu savings w flash attn are better than the deepspeed headaches

d1aed4c

winglian commited on Apr 16, 2023

fix logging

a459383

winglian commited on Apr 16, 2023

prepare datasets only flag

2393801

winglian commited on Apr 15, 2023

add llama 7b config and fiz lora_fan_in_fan_out for llama (copy pasta bug)

d060c80

winglian commited on Apr 15, 2023

configure log level, add llama 7b config

d33a975

winglian commited on Apr 15, 2023

more logging, wandb fixes

05fffb5

winglian commited on Apr 15, 2023

refactor trainer setup to account for deepspeed integration

2df63ef

winglian commited on Apr 15, 2023

improve prepared dataset loading, fix inference

b164725

winglian commited on Apr 15, 2023

helpful info output

937f44f

winglian commited on Apr 15, 2023

fix issue with completed model being empty

902dd0a

winglian commited on Apr 15, 2023

various bugfixes

80b2ed2

winglian commited on Apr 15, 2023

bettter handling of llama model import

45f77dd

winglian commited on Apr 14, 2023