Spaces:

szukevin
/

VISOR-GPT

Runtime error

App Files Files Community

VISOR-GPT / train /models /megatron /gpt2_8.3B_config.json

szukevin's picture

upload

7900c16 over 1 year ago

424 Bytes

	{
	"emb_size": 3072,
	"feedforward_size": 12288,
	"hidden_size": 3072,
	"hidden_act": "gelu_fast",
	"heads_num": 24,
	"layers_num": 72,
	"max_seq_length": 1024,
	"dropout": 0.1,
	"data_processor": "lm",
	"embedding": ["word", "pos"],
	"remove_embedding_layernorm": true,
	"encoder": "transformer",
	"mask": "causal",
	"layernorm_positioning": "pre",
	"target": ["lm"],
	"tie_weights": true
	}