Camil Ziane commited on Dec 17, 2024

Commit

d54fd5c

1 Parent(s): 72280ad

init model

Files changed (24) hide show

README.md +202 -3
adapter_config.json +91 -0
adapter_model.safetensors +3 -0
config.json +137 -0
connector/pytorch_model.bin +3 -0
language_model/config.json +89 -0
language_model/pytorch_model.bin +3 -0
log.txt +65 -0
runs/Dec16_10-26-23_PC-Yanel/events.out.tfevents.1734341203.PC-Yanel +3 -0
runs/Dec16_16-06-06_PC-Yanel/events.out.tfevents.1734361588.PC-Yanel +3 -0
runs/Dec16_16-07-38_PC-Yanel/events.out.tfevents.1734361678.PC-Yanel +3 -0
runs/Dec16_16-23-04_PC-Yanel/events.out.tfevents.1734362603.PC-Yanel +3 -0
runs/Dec16_16-24-51_PC-Yanel/events.out.tfevents.1734362711.PC-Yanel +3 -0
runs/Dec16_16-28-01_PC-Yanel/events.out.tfevents.1734362900.PC-Yanel +3 -0
runs/Dec16_16-32-17_PC-Yanel/events.out.tfevents.1734363157.PC-Yanel +3 -0
runs/Dec16_16-34-04_PC-Yanel/events.out.tfevents.1734363266.PC-Yanel +3 -0
runs/Dec17_08-52-46_PC-Yanel/events.out.tfevents.1734421988.PC-Yanel +3 -0
runs/Dec17_15-13-10_PC-Yanel/events.out.tfevents.1734444812.PC-Yanel +3 -0
special_tokens_map.json +24 -0
tokenizer.model +3 -0
tokenizer_config.json +43 -0
trainer_state.json +0 -0
vision_tower/config.json +28 -0
vision_tower/pytorch_model.bin +3 -0

README.md CHANGED Viewed

@@ -1,3 +1,202 @@
----
-license: mit
----

+---
+base_model: ''
+library_name: peft
+---
+# Model Card for Model ID
+<!-- Provide a quick summary of what the model is/does. -->
+## Model Details
+### Model Description
+<!-- Provide a longer summary of what this model is. -->
+- **Developed by:** [More Information Needed]
+- **Funded by [optional]:** [More Information Needed]
+- **Shared by [optional]:** [More Information Needed]
+- **Model type:** [More Information Needed]
+- **Language(s) (NLP):** [More Information Needed]
+- **License:** [More Information Needed]
+- **Finetuned from model [optional]:** [More Information Needed]
+### Model Sources [optional]
+<!-- Provide the basic links for the model. -->
+- **Repository:** [More Information Needed]
+- **Paper [optional]:** [More Information Needed]
+- **Demo [optional]:** [More Information Needed]
+## Uses
+<!-- Address questions around how the model is intended to be used, including the foreseeable users of the model and those affected by the model. -->
+### Direct Use
+<!-- This section is for the model use without fine-tuning or plugging into a larger ecosystem/app. -->
+[More Information Needed]
+### Downstream Use [optional]
+<!-- This section is for the model use when fine-tuned for a task, or when plugged into a larger ecosystem/app -->
+[More Information Needed]
+### Out-of-Scope Use
+<!-- This section addresses misuse, malicious use, and uses that the model will not work well for. -->
+[More Information Needed]
+## Bias, Risks, and Limitations
+<!-- This section is meant to convey both technical and sociotechnical limitations. -->
+[More Information Needed]
+### Recommendations
+<!-- This section is meant to convey recommendations with respect to the bias, risk, and technical limitations. -->
+Users (both direct and downstream) should be made aware of the risks, biases and limitations of the model. More information needed for further recommendations.
+## How to Get Started with the Model
+Use the code below to get started with the model.
+[More Information Needed]
+## Training Details
+### Training Data
+<!-- This should link to a Dataset Card, perhaps with a short stub of information on what the training data is all about as well as documentation related to data pre-processing or additional filtering. -->
+[More Information Needed]
+### Training Procedure
+<!-- This relates heavily to the Technical Specifications. Content here should link to that section when it is relevant to the training procedure. -->
+#### Preprocessing [optional]
+[More Information Needed]
+#### Training Hyperparameters
+- **Training regime:** [More Information Needed] <!--fp32, fp16 mixed precision, bf16 mixed precision, bf16 non-mixed precision, fp16 non-mixed precision, fp8 mixed precision -->
+#### Speeds, Sizes, Times [optional]
+<!-- This section provides information about throughput, start/end time, checkpoint size if relevant, etc. -->
+[More Information Needed]
+## Evaluation
+<!-- This section describes the evaluation protocols and provides the results. -->
+### Testing Data, Factors & Metrics
+#### Testing Data
+<!-- This should link to a Dataset Card if possible. -->
+[More Information Needed]
+#### Factors
+<!-- These are the things the evaluation is disaggregating by, e.g., subpopulations or domains. -->
+[More Information Needed]
+#### Metrics
+<!-- These are the evaluation metrics being used, ideally with a description of why. -->
+[More Information Needed]
+### Results
+[More Information Needed]
+#### Summary
+## Model Examination [optional]
+<!-- Relevant interpretability work for the model goes here -->
+[More Information Needed]
+## Environmental Impact
+<!-- Total emissions (in grams of CO2eq) and additional considerations, such as electricity usage, go here. Edit the suggested text below accordingly -->
+Carbon emissions can be estimated using the [Machine Learning Impact calculator](https://mlco2.github.io/impact#compute) presented in [Lacoste et al. (2019)](https://arxiv.org/abs/1910.09700).
+- **Hardware Type:** [More Information Needed]
+- **Hours used:** [More Information Needed]
+- **Cloud Provider:** [More Information Needed]
+- **Compute Region:** [More Information Needed]
+- **Carbon Emitted:** [More Information Needed]
+## Technical Specifications [optional]
+### Model Architecture and Objective
+[More Information Needed]
+### Compute Infrastructure
+[More Information Needed]
+#### Hardware
+[More Information Needed]
+#### Software
+[More Information Needed]
+## Citation [optional]
+<!-- If there is a paper or blog post introducing the model, the APA and Bibtex information for that should go in this section. -->
+**BibTeX:**
+[More Information Needed]
+**APA:**
+[More Information Needed]
+## Glossary [optional]
+<!-- If relevant, include terms and calculations in this section that can help readers understand the model or model card. -->
+[More Information Needed]
+## More Information [optional]
+[More Information Needed]
+## Model Card Authors [optional]
+[More Information Needed]
+## Model Card Contact
+[More Information Needed]
+### Framework versions
+- PEFT 0.10.0

adapter_config.json ADDED Viewed

	@@ -0,0 +1,91 @@

+{
+  "alpha_pattern": {},
+  "auto_mapping": null,
+  "base_model_name_or_path": "",
+  "bias": "none",
+  "fan_in_fan_out": false,
+  "inference_mode": true,
+  "init_lora_weights": true,
+  "layer_replication": null,
+  "layers_pattern": null,
+  "layers_to_transform": null,
+  "loftq_config": {},
+  "lora_alpha": 256,
+  "lora_dropout": 0.05,
+  "megatron_config": null,
+  "megatron_core": "megatron.core",
+  "modules_to_save": null,
+  "peft_type": "LORA",
+  "r": 128,
+  "rank_pattern": {},
+  "revision": null,
+  "target_modules": [
+    "language_model.transformer.layers.4.ffn.proj_2",
+    "language_model.transformer.layers.9.ffn.proj_2",
+    "language_model.transformer.layers.3.attn.qkv_proj",
+    "language_model.transformer.layers.5.ffn.proj_2",
+    "language_model.transformer.layers.15.ffn.proj_2",
+    "language_model.transformer.layers.7.ffn.proj_2",
+    "language_model.transformer.layers.10.attn.qkv_proj",
+    "language_model.transformer.layers.0.attn.out_proj",
+    "language_model.transformer.layers.12.ffn.proj_2",
+    "language_model.transformer.layers.14.ffn.proj_2",
+    "language_model.transformer.layers.13.ffn.proj_1",
+    "language_model.transformer.layers.7.attn.out_proj",
+    "language_model.transformer.layers.0.ffn.proj_2",
+    "language_model.transformer.layers.13.attn.out_proj",
+    "language_model.transformer.layers.0.ffn.proj_1",
+    "language_model.transformer.layers.6.attn.qkv_proj",
+    "language_model.transformer.layers.12.attn.out_proj",
+    "language_model.transformer.layers.4.attn.out_proj",
+    "language_model.transformer.layers.2.ffn.proj_1",
+    "language_model.transformer.layers.3.ffn.proj_2",
+    "language_model.transformer.layers.12.ffn.proj_1",
+    "language_model.transformer.layers.6.ffn.proj_1",
+    "language_model.transformer.layers.15.attn.qkv_proj",
+    "language_model.transformer.layers.2.ffn.proj_2",
+    "language_model.transformer.layers.15.ffn.proj_1",
+    "language_model.transformer.layers.8.attn.qkv_proj",
+    "language_model.transformer.layers.5.ffn.proj_1",
+    "language_model.transformer.layers.14.attn.out_proj",
+    "language_model.transformer.layers.8.attn.out_proj",
+    "language_model.transformer.layers.10.ffn.proj_2",
+    "language_model.transformer.layers.11.ffn.proj_1",
+    "language_model.transformer.layers.8.ffn.proj_2",
+    "language_model.transformer.layers.12.attn.qkv_proj",
+    "language_model.transformer.layers.3.ffn.proj_1",
+    "language_model.transformer.layers.11.attn.out_proj",
+    "language_model.transformer.layers.13.ffn.proj_2",
+    "language_model.transformer.layers.3.attn.out_proj",
+    "language_model.transformer.layers.7.attn.qkv_proj",
+    "language_model.transformer.layers.11.attn.qkv_proj",
+    "language_model.transformer.layers.2.attn.qkv_proj",
+    "language_model.transformer.layers.1.attn.qkv_proj",
+    "language_model.transformer.layers.13.attn.qkv_proj",
+    "language_model.transformer.layers.4.attn.qkv_proj",
+    "language_model.transformer.layers.15.attn.out_proj",
+    "language_model.transformer.layers.14.ffn.proj_1",
+    "language_model.transformer.layers.7.ffn.proj_1",
+    "language_model.transformer.layers.0.attn.qkv_proj",
+    "language_model.transformer.layers.1.ffn.proj_1",
+    "language_model.transformer.layers.5.attn.out_proj",
+    "language_model.transformer.layers.2.attn.out_proj",
+    "language_model.transformer.layers.1.attn.out_proj",
+    "language_model.transformer.layers.6.ffn.proj_2",
+    "language_model.transformer.layers.9.attn.qkv_proj",
+    "language_model.transformer.layers.10.ffn.proj_1",
+    "language_model.transformer.layers.14.attn.qkv_proj",
+    "language_model.transformer.layers.10.attn.out_proj",
+    "language_model.transformer.layers.11.ffn.proj_2",
+    "language_model.transformer.layers.1.ffn.proj_2",
+    "language_model.transformer.layers.5.attn.qkv_proj",
+    "language_model.transformer.layers.9.ffn.proj_1",
+    "language_model.transformer.layers.6.attn.out_proj",
+    "language_model.transformer.layers.8.ffn.proj_1",
+    "language_model.transformer.layers.4.ffn.proj_1",
+    "language_model.transformer.layers.9.attn.out_proj"
+  ],
+  "task_type": "CAUSAL_LM",
+  "use_dora": false,
+  "use_rslora": false
+}

adapter_model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c75dd836da3e87cc9f08e5a46509524ccd81d44ea24727a4dae83e0c4c53274e
+size 67095512

config.json ADDED Viewed

	@@ -0,0 +1,137 @@

+{
+  "cache_dir": null,
+  "connector_type": "mlp2x_gelu",
+  "hidden_size": 1280,
+  "ignore_index": -100,
+  "image_aspect_ratio": "square",
+  "image_token_index": -200,
+  "llm_model_name_or_path": "apple/OpenELM-270M-Instruct",
+  "model_type": "tinyllava",
+  "num_queries": 128,
+  "num_resampler_layers": 3,
+  "pad_token": "<unk>",
+  "pad_token_id": 0,
+  "resampler_hidden_size": 768,
+  "text_config": {
+    "_name_or_path": "apple/OpenELM-270M-Instruct",
+    "activation_fn_name": "swish",
+    "architectures": [
+      "OpenELMForCausalLM"
+    ],
+    "auto_map": {
+      "AutoConfig": "apple/OpenELM-270M-Instruct--configuration_openelm.OpenELMConfig",
+      "AutoModelForCausalLM": "apple/OpenELM-270M-Instruct--modeling_openelm.OpenELMForCausalLM"
+    },
+    "ffn_dim_divisor": 256,
+    "ffn_multipliers": [
+      0.5,
+      0.73,
+      0.97,
+      1.2,
+      1.43,
+      1.67,
+      1.9,
+      2.13,
+      2.37,
+      2.6,
+      2.83,
+      3.07,
+      3.3,
+      3.53,
+      3.77,
+      4.0
+    ],
+    "ffn_with_glu": true,
+    "head_dim": 64,
+    "max_context_length": 2048,
+    "model_dim": 1280,
+    "model_type": "openelm",
+    "normalization_layer_name": "rms_norm",
+    "normalize_qk_projections": true,
+    "num_gqa_groups": 4,
+    "num_kv_heads": [
+      3,
+      3,
+      3,
+      3,
+      3,
+      4,
+      4,
+      4,
+      4,
+      4,
+      4,
+      4,
+      5,
+      5,
+      5,
+      5
+    ],
+    "num_query_heads": [
+      12,
+      12,
+      12,
+      12,
+      12,
+      16,
+      16,
+      16,
+      16,
+      16,
+      16,
+      16,
+      20,
+      20,
+      20,
+      20
+    ],
+    "num_transformer_layers": 16,
+    "qkv_multipliers": [
+      0.5,
+      1.0
+    ],
+    "rope_freq_constant": 10000,
+    "rope_max_length": 4096,
+    "share_input_output_layers": true,
+    "tie_word_embeddings": true,
+    "torch_dtype": "float16"
+  },
+  "tokenizer_model_max_length": 2048,
+  "tokenizer_name_or_path": "meta-llama/Llama-2-7b-hf",
+  "tokenizer_padding_side": "right",
+  "tokenizer_use_fast": false,
+  "transformers_version": "4.40.1",
+  "tune_type_connector": "full",
+  "tune_type_llm": "lora",
+  "tune_type_vision_tower": "frozen",
+  "tune_vision_tower_from_layer": 0,
+  "use_cache": true,
+  "vision_config": {
+    "_name_or_path": "apple/aimv2-large-patch14-224-distilled",
+    "architectures": [
+      "AIMv2Model"
+    ],
+    "auto_map": {
+      "AutoConfig": "apple/aimv2-large-patch14-224-distilled--configuration_aimv2.AIMv2Config",
+      "AutoModel": "apple/aimv2-large-patch14-224-distilled--modeling_aimv2.AIMv2Model",
+      "FlaxAutoModel": "apple/aimv2-large-patch14-224-distilled--modeling_flax_aimv2.FlaxAIMv2Model"
+    },
+    "image_size": 224,
+    "intermediate_size": 2816,
+    "model_name_or_path": "apple/aimv2-large-patch14-224-distilled",
+    "model_name_or_path2": "",
+    "model_type": "aimv2",
+    "num_attention_heads": 8,
+    "projection_dropout": 0.0,
+    "qkv_bias": false,
+    "rms_norm_eps": 1e-05,
+    "torch_dtype": "float32",
+    "use_bias": false
+  },
+  "vision_feature_layer": -2,
+  "vision_feature_select_strategy": "patch",
+  "vision_hidden_size": 1024,
+  "vision_model_name_or_path": "apple/aimv2-large-patch14-224-distilled",
+  "vision_model_name_or_path2": "",
+  "vocab_size": 32000
+}

connector/pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ebb5a16c3ce08a9200b0f5fccadcec55e68b1afc5595b3a3603b73fb0f501fe4
+size 5904963

language_model/config.json ADDED Viewed

	@@ -0,0 +1,89 @@

+{
+  "_name_or_path": "apple/OpenELM-270M-Instruct",
+  "activation_fn_name": "swish",
+  "architectures": [
+    "OpenELMForCausalLM"
+  ],
+  "auto_map": {
+    "AutoConfig": "apple/OpenELM-270M-Instruct--configuration_openelm.OpenELMConfig",
+    "AutoModelForCausalLM": "apple/OpenELM-270M-Instruct--modeling_openelm.OpenELMForCausalLM"
+  },
+  "bos_token_id": 1,
+  "eos_token_id": 2,
+  "ffn_dim_divisor": 256,
+  "ffn_multipliers": [
+    0.5,
+    0.73,
+    0.97,
+    1.2,
+    1.43,
+    1.67,
+    1.9,
+    2.13,
+    2.37,
+    2.6,
+    2.83,
+    3.07,
+    3.3,
+    3.53,
+    3.77,
+    4.0
+  ],
+  "ffn_with_glu": true,
+  "head_dim": 64,
+  "initializer_range": 0.02,
+  "max_context_length": 2048,
+  "model_dim": 1280,
+  "model_type": "openelm",
+  "normalization_layer_name": "rms_norm",
+  "normalize_qk_projections": true,
+  "num_gqa_groups": 4,
+  "num_kv_heads": [
+    3,
+    3,
+    3,
+    3,
+    3,
+    4,
+    4,
+    4,
+    4,
+    4,
+    4,
+    4,
+    5,
+    5,
+    5,
+    5
+  ],
+  "num_query_heads": [
+    12,
+    12,
+    12,
+    12,
+    12,
+    16,
+    16,
+    16,
+    16,
+    16,
+    16,
+    16,
+    20,
+    20,
+    20,
+    20
+  ],
+  "num_transformer_layers": 16,
+  "qkv_multipliers": [
+    0.5,
+    1.0
+  ],
+  "rope_freq_constant": 10000,
+  "rope_max_length": 4096,
+  "share_input_output_layers": true,
+  "torch_dtype": "float16",
+  "transformers_version": "4.40.1",
+  "use_cache": true,
+  "vocab_size": 32000
+}

language_model/pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:bada184edf066a65e0948c7f5af7b4f7529a3c6e356907304736a2f7a6b7be10
+size 543096469

log.txt ADDED Viewed

	@@ -0,0 +1,65 @@

+2024-12-16 10:26:29,433 | INFO: Adding LoRA adapters...
+2024-12-16 10:26:34,631 | INFO: Total Parameters: 36489728, Total Trainable Parameters: 36489728
+2024-12-16 10:26:34,631 | INFO: Trainable Parameters:
+2024-12-16 10:26:37,377 | INFO: Added key: store_based_barrier_key:2 to store for rank: 0
+2024-12-16 10:26:37,377 | INFO: Rank 0: Completed store-based barrier for key:store_based_barrier_key:2 with 1 nodes.
+2024-12-16 16:06:14,615 | INFO: Adding LoRA adapters...
+2024-12-16 16:06:20,196 | INFO: Total Parameters: 36489728, Total Trainable Parameters: 36489728
+2024-12-16 16:06:20,196 | INFO: Trainable Parameters:
+2024-12-16 16:06:22,855 | INFO: Added key: store_based_barrier_key:2 to store for rank: 0
+2024-12-16 16:06:22,855 | INFO: Rank 0: Completed store-based barrier for key:store_based_barrier_key:2 with 1 nodes.
+2024-12-16 16:07:45,215 | INFO: Adding LoRA adapters...
+2024-12-16 16:07:49,959 | INFO: Total Parameters: 36489728, Total Trainable Parameters: 36489728
+2024-12-16 16:07:49,959 | INFO: Trainable Parameters:
+2024-12-16 16:07:52,630 | INFO: Added key: store_based_barrier_key:2 to store for rank: 0
+2024-12-16 16:07:52,631 | INFO: Rank 0: Completed store-based barrier for key:store_based_barrier_key:2 with 1 nodes.
+2024-12-16 16:13:01,397 | INFO: Adding LoRA adapters...
+2024-12-16 16:16:40,370 | INFO: Adding LoRA adapters...
+2024-12-16 16:16:45,186 | INFO: Total Parameters: 36489728, Total Trainable Parameters: 36489728
+2024-12-16 16:16:45,186 | INFO: Trainable Parameters:
+2024-12-16 16:20:57,679 | INFO: Adding LoRA adapters...
+2024-12-16 16:21:02,547 | INFO: Total Parameters: 36489728, Total Trainable Parameters: 36489728
+2024-12-16 16:21:02,547 | INFO: Trainable Parameters:
+2024-12-16 16:21:50,195 | INFO: Adding LoRA adapters...
+2024-12-16 16:21:54,979 | INFO: Total Parameters: 36489728, Total Trainable Parameters: 36489728
+2024-12-16 16:21:54,980 | INFO: Trainable Parameters:
+2024-12-16 16:23:09,586 | INFO: Adding LoRA adapters...
+2024-12-16 16:23:14,369 | INFO: Total Parameters: 36489728, Total Trainable Parameters: 36489728
+2024-12-16 16:23:14,369 | INFO: Trainable Parameters:
+2024-12-16 16:23:17,155 | INFO: Added key: store_based_barrier_key:2 to store for rank: 0
+2024-12-16 16:23:17,155 | INFO: Rank 0: Completed store-based barrier for key:store_based_barrier_key:2 with 1 nodes.
+2024-12-16 16:24:57,671 | INFO: Adding LoRA adapters...
+2024-12-16 16:25:02,544 | INFO: Total Parameters: 36489728, Total Trainable Parameters: 36489728
+2024-12-16 16:25:02,544 | INFO: Trainable Parameters:
+2024-12-16 16:25:05,191 | INFO: Added key: store_based_barrier_key:2 to store for rank: 0
+2024-12-16 16:25:05,192 | INFO: Rank 0: Completed store-based barrier for key:store_based_barrier_key:2 with 1 nodes.
+2024-12-16 16:28:06,665 | INFO: Adding LoRA adapters...
+2024-12-16 16:28:11,792 | INFO: Total Parameters: 36489728, Total Trainable Parameters: 36489728
+2024-12-16 16:28:11,792 | INFO: Trainable Parameters:
+2024-12-16 16:28:14,482 | INFO: Added key: store_based_barrier_key:2 to store for rank: 0
+2024-12-16 16:28:14,482 | INFO: Rank 0: Completed store-based barrier for key:store_based_barrier_key:2 with 1 nodes.
+2024-12-16 16:31:31,838 | INFO: Adding LoRA adapters...
+2024-12-16 16:31:36,660 | INFO: Total Parameters: 36489728, Total Trainable Parameters: 36489728
+2024-12-16 16:31:36,661 | INFO: Trainable Parameters:
+2024-12-16 16:31:39,286 | INFO: Added key: store_based_barrier_key:2 to store for rank: 0
+2024-12-16 16:31:39,286 | INFO: Rank 0: Completed store-based barrier for key:store_based_barrier_key:2 with 1 nodes.
+2024-12-16 16:32:23,260 | INFO: Adding LoRA adapters...
+2024-12-16 16:32:28,069 | INFO: Total Parameters: 36489728, Total Trainable Parameters: 36489728
+2024-12-16 16:32:28,069 | INFO: Trainable Parameters:
+2024-12-16 16:32:30,788 | INFO: Added key: store_based_barrier_key:2 to store for rank: 0
+2024-12-16 16:32:30,788 | INFO: Rank 0: Completed store-based barrier for key:store_based_barrier_key:2 with 1 nodes.
+2024-12-16 16:34:11,084 | INFO: Adding LoRA adapters...
+2024-12-16 16:34:16,549 | INFO: Total Parameters: 36489728, Total Trainable Parameters: 36489728
+2024-12-16 16:34:16,549 | INFO: Trainable Parameters:
+2024-12-16 16:34:19,253 | INFO: Added key: store_based_barrier_key:2 to store for rank: 0
+2024-12-16 16:34:19,253 | INFO: Rank 0: Completed store-based barrier for key:store_based_barrier_key:2 with 1 nodes.
+2024-12-17 08:52:53,612 | INFO: Adding LoRA adapters...
+2024-12-17 08:52:58,860 | INFO: Total Parameters: 36489728, Total Trainable Parameters: 36489728
+2024-12-17 08:52:58,860 | INFO: Trainable Parameters:
+2024-12-17 08:53:01,574 | INFO: Added key: store_based_barrier_key:2 to store for rank: 0
+2024-12-17 08:53:01,574 | INFO: Rank 0: Completed store-based barrier for key:store_based_barrier_key:2 with 1 nodes.
+2024-12-17 15:13:17,855 | INFO: Adding LoRA adapters...
+2024-12-17 15:13:22,694 | INFO: Total Parameters: 36489728, Total Trainable Parameters: 36489728
+2024-12-17 15:13:22,694 | INFO: Trainable Parameters:
+2024-12-17 15:13:25,471 | INFO: Added key: store_based_barrier_key:2 to store for rank: 0
+2024-12-17 15:13:25,472 | INFO: Rank 0: Completed store-based barrier for key:store_based_barrier_key:2 with 1 nodes.

runs/Dec16_10-26-23_PC-Yanel/events.out.tfevents.1734341203.PC-Yanel ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2d544dbf31cf2bfed5eadc947aa14430b4e1490dc3a8a0a91ea8076f937e8469
+size 268864

runs/Dec16_16-06-06_PC-Yanel/events.out.tfevents.1734361588.PC-Yanel ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:17e04e5acc0a94200a8139cd2358350843742a6cb0c00160b49406b98a1cef80
+size 8284

runs/Dec16_16-07-38_PC-Yanel/events.out.tfevents.1734361678.PC-Yanel ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e591dbe84a458cc67fc175e48cab407abe75ace8d3998e36808a7b9fb0dc5019
+size 10147

runs/Dec16_16-23-04_PC-Yanel/events.out.tfevents.1734362603.PC-Yanel ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:94b7c30abac8eb7d73291270c5fae7511b85aca533296e68a8c9296802f6bd62
+size 8363

runs/Dec16_16-24-51_PC-Yanel/events.out.tfevents.1734362711.PC-Yanel ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e68eb7a3066fe032f65cb9b1a9d6d41386bbba6ffdfd0a6bce63d9b3de76a65b
+size 8300

runs/Dec16_16-28-01_PC-Yanel/events.out.tfevents.1734362900.PC-Yanel ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:521be2d8e32b9ce58c2fc3dc38a110b5858074818f2cc7cac6a10104270656b5
+size 8507

runs/Dec16_16-32-17_PC-Yanel/events.out.tfevents.1734363157.PC-Yanel ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9028cde2f3595184bf1780e616609720dc40efdaffb35b6bb5a72aebc13a7a30
+size 8722

runs/Dec16_16-34-04_PC-Yanel/events.out.tfevents.1734363266.PC-Yanel ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5d78288c5349984b89a0ad4e8101e84eff3a3e33f396c864aad0b8ad68b516bf
+size 510902

runs/Dec17_08-52-46_PC-Yanel/events.out.tfevents.1734421988.PC-Yanel ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3a470a5709a2587bcfc061c875de06fe0dc71b70f477dc505c230ab91116d4cd
+size 345056

runs/Dec17_15-13-10_PC-Yanel/events.out.tfevents.1734444812.PC-Yanel ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f75995b4c1853119f63e217c52315fdf3ba5b507ab8095b758e61564cf5f1381
+size 102971

special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,24 @@

+{
+  "bos_token": {
+    "content": "<s>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "eos_token": {
+    "content": "</s>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": "<unk>",
+  "unk_token": {
+    "content": "<unk>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  }
+}

tokenizer.model ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9e556afd44213b6bd1be2b850ebbbd98f5481437a8021afaf58ee7fb1818d347
+size 499723

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,43 @@

+{
+  "add_bos_token": true,
+  "add_eos_token": false,
+  "add_prefix_space": true,
+  "added_tokens_decoder": {
+    "0": {
+      "content": "<unk>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "1": {
+      "content": "<s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "2": {
+      "content": "</s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "bos_token": "<s>",
+  "clean_up_tokenization_spaces": false,
+  "eos_token": "</s>",
+  "legacy": false,
+  "model_max_length": 2048,
+  "pad_token": "<unk>",
+  "padding_side": "right",
+  "sp_model_kwargs": {},
+  "spaces_between_special_tokens": false,
+  "tokenizer_class": "LlamaTokenizer",
+  "unk_token": "<unk>",
+  "use_default_system_prompt": false
+}

trainer_state.json ADDED Viewed

The diff for this file is too large to render. See raw diff

vision_tower/config.json ADDED Viewed

	@@ -0,0 +1,28 @@

+{
+  "_name_or_path": "apple/aimv2-large-patch14-224-distilled",
+  "architectures": [
+    "AIMv2Model"
+  ],
+  "attention_dropout": 0.0,
+  "auto_map": {
+    "AutoConfig": "apple/aimv2-large-patch14-224-distilled--configuration_aimv2.AIMv2Config",
+    "AutoModel": "apple/aimv2-large-patch14-224-distilled--modeling_aimv2.AIMv2Model",
+    "FlaxAutoModel": "apple/aimv2-large-patch14-224-distilled--modeling_flax_aimv2.FlaxAIMv2Model"
+  },
+  "hidden_size": 1024,
+  "image_size": 224,
+  "intermediate_size": 2816,
+  "model_name_or_path": "apple/aimv2-large-patch14-224-distilled",
+  "model_name_or_path2": "",
+  "model_type": "aimv2",
+  "num_attention_heads": 8,
+  "num_channels": 3,
+  "num_hidden_layers": 24,
+  "patch_size": 14,
+  "projection_dropout": 0.0,
+  "qkv_bias": false,
+  "rms_norm_eps": 1e-05,
+  "torch_dtype": "float32",
+  "transformers_version": "4.40.1",
+  "use_bias": false
+}

vision_tower/pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8fa9b66c51e30ecc8514991a5e4be9cd2920bef3e50c186390167a49cbd40dc3
+size 618449793