Commits · Dovakiins/qwerrwe

more gpt-neox long ctx fixes

ab5cd28

winglian commited on Jun 1, 2023

fix bettertransformers save, force it to skip after saving correctly in callback

1a82082

winglian commited on Jun 1, 2023

more tweaks to do pre-training with bettertransformers

1210dc8

winglian commited on Jun 1, 2023

experimental expansion of ctx len

488a67d

winglian commited on May 31, 2023

add validation/warning for bettertransformers and torch version

71a43f8

winglian commited on May 28, 2023

use pythia-12b, neox-20b is flaky

3961902

winglian commited on May 27, 2023

add flash attn context for efficient training and attempt setting model to train mode:

8792199

winglian commited on May 27, 2023

add support for opimum bettertransformers

1edc30c

winglian commited on May 27, 2023

Merge pull request #181 from OpenAccess-AI-Collective/xpos-rope

41e4f6c
unverified

winglian commited on Jun 10, 2023

Merge pull request #180 from Glavin001/feat/stream-inference

215d775
unverified

winglian commited on Jun 10, 2023

formatting for linter

f36e227
unverified

winglian commited on Jun 10, 2023

add option to readme

5878bb1

winglian commited on Jun 10, 2023

add support to extend context with xpos rope

a03a7d7

winglian commited on Jun 10, 2023

Add streaming inference & fix stopping at EOS

fec6bcc

Glavin001 commited on Jun 10, 2023

Merge pull request #179 from OpenAccess-AI-Collective/fix-max_seq_len

931e606
unverified

winglian commited on Jun 10, 2023

fix for max sequence len across different model types

7f09106

winglian commited on Jun 10, 2023

Merge pull request #178 from PocketDocLabs/main

6b50200
unverified

Nanobit commited on Jun 9, 2023

Update README.md to reflect current gradient checkpointing support

16f9e28
unverified

PocketDoc commited on Jun 9, 2023

Merge pull request #176 from NanoCode012/fix/peft-import

b9083a7
unverified

Nanobit commited on Jun 9, 2023

Fix backward compat for peft

aefb2fc

Nanobit commited on Jun 9, 2023

Merge pull request #169 from NanoCode012/feat/landmark

b5aa8d8
unverified

Nanobit commited on Jun 9, 2023

Merge pull request #171 from OpenAccess-AI-Collective/NanoCode012-falcon-lora-matrix

4d6490b
unverified

Nanobit commited on Jun 9, 2023

Fix falcon support lora

b242b69
unverified

Nanobit commited on Jun 9, 2023

Merge pull request #170 from OpenAccess-AI-Collective/NanoCode012-lambdalabs-fix

320beb2
unverified

Nanobit commited on Jun 9, 2023

Improve lambda labs instruction

2e13cef
unverified

Nanobit commited on Jun 9, 2023

Fix grad checkpoint and outputs param

2a801b0

Nanobit commited on Jun 9, 2023

Fix patching via import instead of hijacking

e44c9e0

Nanobit commited on Jun 9, 2023

Feat: Add landmark attention

55b8542

Nanobit commited on Jun 9, 2023

Merge pull request #168 from bratao/main

febe902
unverified

winglian commited on Jun 9, 2023