Upload folder using huggingface_hub

Browse files

Files changed (4) hide show

config.json +13 -3
pytorch_model-00001-of-00002.bin +1 -1
pytorch_model-00002-of-00002.bin +1 -1
pytorch_model.bin.index.json +0 -0

config.json CHANGED Viewed

@@ -1,17 +1,20 @@
 {
-  "_name_or_path": "trained_checkpoints/exp1_pretrain_v1.5_spi_module_gs_4488",
   "architectures": [
-    "LISAForCausalLM"
   ],
   "bbox_token_idx": 32002,
   "bos_token_id": 1,
   "eos_token_id": 2,
-  "freeze_mm_mlp_adapter": true,
   "freeze_mm_vision_resampler": false,
   "hidden_act": "silu",
   "hidden_size": 4096,
   "image_aspect_ratio": "square",
   "image_grid_pinpoints": null,
   "initializer_range": 0.02,
   "intermediate_size": 11008,
   "max_length": 4096,
@@ -21,6 +24,8 @@
   "mm_resampler_type": null,
   "mm_use_im_patch_token": false,
   "mm_use_im_start_end": true,
   "mm_vision_select_feature": "patch",
   "mm_vision_select_layer": -2,
   "mm_vision_tower": "openai/clip-vit-large-patch14-336",
@@ -29,21 +34,26 @@
   "num_hidden_layers": 32,
   "num_key_value_heads": 32,
   "num_level_reg_features": 4,
   "out_dim": 256,
   "pad_token_id": 0,
   "pretrain_mm_mlp_adapter": null,
   "pretraining_tp": 1,
   "rms_norm_eps": 1e-05,
   "rope_scaling": null,
   "tie_word_embeddings": false,
   "torch_dtype": "bfloat16",
   "train_mask_decoder": true,
   "transformers_version": "4.28.0.dev0",
   "tune_mm_mlp_adapter": false,
   "tune_mm_vision_resampler": false,
   "unfreeze_mm_vision_tower": false,
   "use_cache": false,
   "use_mm_proj": true,
   "vision_tower": "openai/clip-vit-large-patch14-336",
   "vocab_size": 32007,
   "with_region": true

 {
+  "_name_or_path": "./trained_checkpoints/exp1_grand_pretrain_v15_gs4488_ckpt_25000_hf",
   "architectures": [
+    "GLaMMForCausalLM"
   ],
   "bbox_token_idx": 32002,
   "bos_token_id": 1,
   "eos_token_id": 2,
+  "freeze_mlp_adapter": true,
+  "freeze_mm_mlp_adapter": false,
   "freeze_mm_vision_resampler": false,
   "hidden_act": "silu",
   "hidden_size": 4096,
+  "image_aspect": "square",
   "image_aspect_ratio": "square",
   "image_grid_pinpoints": null,
+  "image_grid_points": null,
   "initializer_range": 0.02,
   "intermediate_size": 11008,
   "max_length": 4096,
   "mm_resampler_type": null,
   "mm_use_im_patch_token": false,
   "mm_use_im_start_end": true,
+  "mm_use_image_start_end": true,
+  "mm_vision_module": "openai/clip-vit-large-patch14-336",
   "mm_vision_select_feature": "patch",
   "mm_vision_select_layer": -2,
   "mm_vision_tower": "openai/clip-vit-large-patch14-336",
   "num_hidden_layers": 32,
   "num_key_value_heads": 32,
   "num_level_reg_features": 4,
+  "num_reg_features": 4,
   "out_dim": 256,
   "pad_token_id": 0,
   "pretrain_mm_mlp_adapter": null,
   "pretraining_tp": 1,
   "rms_norm_eps": 1e-05,
   "rope_scaling": null,
+  "select_feature_type": "patch",
   "tie_word_embeddings": false,
   "torch_dtype": "bfloat16",
   "train_mask_decoder": true,
   "transformers_version": "4.28.0.dev0",
+  "tune_mlp_adapter": false,
   "tune_mm_mlp_adapter": false,
   "tune_mm_vision_resampler": false,
   "unfreeze_mm_vision_tower": false,
   "use_cache": false,
+  "use_image_patch_token": false,
   "use_mm_proj": true,
+  "vision_module": "openai/clip-vit-large-patch14-336",
   "vision_tower": "openai/clip-vit-large-patch14-336",
   "vocab_size": 32007,
   "with_region": true

pytorch_model-00001-of-00002.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:fe240bcaf9c8c963994aef3dcbc09bc64a10a9bfff2fadd4a1a10bcc886c1114
 size 9976691902

 version https://git-lfs.github.com/spec/v1
+oid sha256:7e018bd797ccbc4c3d02f72943f6f7846d9a36fb54fca39ce45350c2bd658441
 size 9976691902

pytorch_model-00002-of-00002.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:db78aa0032e00de880c8afc78b6de32ec86b30af774ba3e3f26a046d199a62e1
 size 6776538784

 version https://git-lfs.github.com/spec/v1
+oid sha256:ee4a215d5a884964ca2e26a8feb5150d614d944947daf59626521f710aab67d5
 size 6776538784

pytorch_model.bin.index.json CHANGED Viewed

The diff for this file is too large to render. See raw diff