Spaces:

Dovakiins
/

qwerrwe

Build error

App Files Files Community

qwerrwe / examples /mpt-7b

100 contributors

History: 4 commits

winglian's picture

swap batch size for gradient accumulation steps to decouple from num gpu

c2a0792 over 1 year ago

README.md

89 Bytes

add support for trust_remote_code for mpt models over 1 year ago
config.yml

1.21 kB

swap batch size for gradient accumulation steps to decouple from num gpu over 1 year ago