Spaces:

Dovakiins
/

qwerrwe

Build error

App Files Files Community

qwerrwe / README.md

Commit History

Update README.md (#1169) [skip ci]

9135b9e
unverified

Ayush Singh commited on Jan 23

set fp16 to false if bf16, update bf16: auto in example YAMLs (#1122) [skip ci]

782b6a4
unverified

Nanobit commited on Jan 22

Deprecate max packed sequence len (#1141)

2ce5c0d
unverified

winglian commited on Jan 20

feat(dataset): add config to keep processed dataset in memory (#1152)

3db5f2f
unverified

Nanobit commited on Jan 20

Fix link for Minotaur model (#1146) [skip-ci]

08b8ba0
unverified

jrc commited on Jan 18

Add shifted sparse attention (#973) [skip-ci]

1d70f24
unverified

jrc joecummings

winglian commited on Jan 18

Agnostic cloud gpu docker image and Jupyter lab (#1097)

ece0211
unverified

winglian commited on Jan 16

Add `layers_to_transform` for `lora_config` (#1118)

8487b97
unverified

xzuyn commited on Jan 16

fix(readme): clarify custom user prompt [no-ci] (#1124)

9cd27b2
unverified

Nanobit commited on Jan 16

Add link on README to Docker Debugging (#1107)

2dc4310
unverified

winglian commited on Jan 12

Update README.md (#1103)

b502392
unverified

hamel commited on Jan 12

Add Debugging Guide (#1089)

7512c3a
unverified

winglian commited on Jan 11

paired kto support (#1069)

d7057cc
unverified

winglian commited on Jan 9

Add: mlflow for experiment tracking (#1059) [skip ci]

090c24d
unverified

Johan Hansson

winglian commited on Jan 9

Cosine learning rate schedule - minimum learning rate (#1062)

04b978b
unverified

winglian commited on Jan 9

Sponsors (#1065)

1496441
unverified

winglian commited on Jan 8

feature: better device mapping for large models (#918)

bdfefaf
unverified

dg-kalle Karl-Johan Alm

winglian commited on Jan 5

set default for merge (#1044)

63fb3eb
unverified

hamel commited on Jan 5

[Docs] delete unused cfg value `lora_out_dir` (#1029)

a3e8783
unverified

Nanobit commited on Jan 3

chore(readme): update instruction to set config to load from cache (#1030)

b31038a
unverified

Nanobit commited on Jan 3

use recommended setting for use_reentrant w gradient checkpointing (#1021)

4d2e842
unverified

winglian commited on Jan 2

Adds chat templates (#1022)

f8ae59b
unverified

mhenrichsen commited on Dec 29, 2023

feat: expose bnb kwargs (#1018)

41353d2
unverified

hamel commited on Dec 29, 2023

feat: remove need to add load_in* during merge (#1017)

f6ecf14
unverified

Nanobit commited on Dec 29, 2023

[Docs] Nit: Remind people to auth to wandb if they are going to use it (#1013)

dec66d7
unverified

hamel commited on Dec 29, 2023

Update README.md (#1012)

76357dc
unverified

hamel commited on Dec 29, 2023

remove landmark attn and xpos rope implementations (#1010)

70b46ca
unverified

winglian commited on Dec 28, 2023

Update README.md (#966)

d25c34c
unverified

eltociear commited on Dec 17, 2023

Add docs (#947)

712fd27
unverified

winglian commited on Dec 13, 2023

fix: switch to using the HuggingFace Transformers NEFT implementation (#941)

ef24342
unverified

dg-kalle commited on Dec 13, 2023

More hints on what to do with CUDA Out of memory errors (#925)

b0cf397
unverified

Juraj Bednar commited on Dec 13, 2023

new evals_per_epoch and saves_per_epoch to make things cleaner (#944)

5f79b82
unverified

winglian commited on Dec 12, 2023

Mixtral multipack (#928)

68b227a
unverified

winglian commited on Dec 10, 2023

chore: clarify Readme on sharegpt system role

d339beb
unverified

Nanobit commited on Dec 8, 2023

Support device_map=sequential & max_memory config parameters (#903)

992e742
unverified

Bryan Thornbury

winglian commited on Dec 4, 2023

Feat(wandb): Refactor to be more flexible (#767)

a1da39c
unverified

Nanobit commited on Dec 4, 2023

feature: loss watchdog for terminating training runs that are failing (#899)

58ec8b1
unverified

user735 Karl-Johan Alm commited on Dec 4, 2023

Feat: Add Qwen (#894)

1115c50
unverified

Nanobit commited on Nov 25, 2023

Feat: Add warmup_ratio (#893)

fb12895
unverified

Nanobit commited on Nov 25, 2023

chore(doc): Add info on changing role in sharegpt (#886)

9fc29e0
unverified

Nanobit commited on Nov 22, 2023

Install from git url (#874)

ddf8150
unverified

marksaroufim commited on Nov 17, 2023

try #2: pin hf transformers and accelerate to latest release, don't reinstall pytorch (#867)

0de1457
unverified

winglian commited on Nov 16, 2023

Feat: Add dataset loading from S3, GCS (#765)

3cc67d2
unverified

Nanobit commited on Nov 16, 2023

allow overriding of model_config parameters from the YML (#853)

1bc1186
unverified

winglian commited on Nov 16, 2023

make docker command more robust (#861)

8a8d1c4
unverified

winglian commited on Nov 16, 2023

lint fix that didn't get caught by linter (#866)

332984d
unverified

winglian commited on Nov 15, 2023

Docs: add instructions to 1-click launching on public clouds (#862)

b33c1d5
unverified

zongheng commited on Nov 15, 2023

chore(doc): Separate section on runpod (#860)

501b4d1
unverified

Nanobit commited on Nov 15, 2023

feat(doc): add more info on train_on_split (#855)

306fe19
unverified

Nanobit commited on Nov 15, 2023

Feat: Added Gradio support (#812)

738a057
unverified

stillerman commited on Nov 5, 2023