Commits · Dovakiins/qwerrwe

Add desc to map/filter (#1162)

6840381
unverified

casperhansen

winglian commited on Jan 23, 2024

support for explicit test_dataset definition for evals (#786)

cda52dc
unverified

winglian commited on Jan 23, 2024

Falcon embeddings (#1149) [skip docker]

e799e08
unverified

winglian commited on Jan 23, 2024

Vram fix attempt (#1164) [skip ci]

32580c1
unverified

winglian commited on Jan 23, 2024

improve vram use w gradient checkpointing (#1167) [skip ci]

802f966
unverified

winglian commited on Jan 23, 2024

Add mlflow callback for pushing config to mlflow artifacts (#1125)

b8e5603
unverified

JohanWork commited on Jan 22, 2024

set fp16 to false if bf16, update bf16: auto in example YAMLs (#1122) [skip ci]

782b6a4
unverified

winglian

Nanobit commited on Jan 22, 2024

jupyter lab fixes (#1139) [skip ci]

eaaeefc
unverified

winglian commited on Jan 22, 2024

Qwen2 (#1166)

f5a828a
unverified

winglian commited on Jan 22, 2024

make sure the model config loader respects the model_revision too (#1160) [skip-ci]

fccb542
unverified

winglian commited on Jan 22, 2024

Deprecate max packed sequence len (#1141)

2ce5c0d
unverified

winglian commited on Jan 20, 2024

feat(dataset): add config to keep processed dataset in memory (#1152)

3db5f2f
unverified

Nanobit commited on Jan 20, 2024

Multipack simplify for Mixtral (#1142)

6910e6a
unverified

winglian commited on Jan 18, 2024

Add shifted sparse attention (#973) [skip-ci]

1d70f24
unverified

jrc joecummings

winglian commited on Jan 18, 2024

fix bf16 check when preprocessing data (#1140)

317fa25
unverified

winglian commited on Jan 18, 2024

fix(preprocess): Make sure dataset not loaded from cache when using preprocess cli (#1136)

1e56b88
unverified

Nanobit commited on Jan 17, 2024

Preprocess dataset size fix (#1131)

7570446
unverified

winglian commited on Jan 17, 2024

Add `layers_to_transform` for `lora_config` (#1118)

8487b97
unverified

xzuyn commited on Jan 16, 2024

Enable or disable bf16 support based on availability (#1116)

0865613
unverified

Simon Hällqvist commited on Jan 14, 2024

Reverse caching PR (#1115)

2202a20
unverified

casperhansen commited on Jan 13, 2024

Disable caching on `--disable_caching` in CLI (#1110)

d66b101
unverified

casperhansen

winglian commited on Jan 13, 2024

keep gate in fp32 for 16 bit loras (#1105)

da97285
unverified

winglian commited on Jan 12, 2024

feat: enable trl's autounwrap (#1060)

b432889
unverified

Nanobit commited on Jan 11, 2024

add gptneox embeddings, fix phi2 inputs, also fix the casting (#1083)

78c5b19
unverified

winglian commited on Jan 11, 2024