mllm-dev
/

gpt2_m_experiment_dare_linear_1000

@@ -1,9 +1,9 @@
 ---
 base_model:
-- mllm-dev/gpt2_f_experiment_0_1000
-- mllm-dev/gpt2_f_experiment_4_1000
-- mllm-dev/gpt2_f_experiment_1_1000
 - mllm-dev/gpt2_f_experiment_2_1000
 - mllm-dev/gpt2_f_experiment_3_1000
 library_name: transformers
 tags:
@@ -23,9 +23,9 @@ This model was merged using the [DARE](https://arxiv.org/abs/2311.03099) [TIES](
 ### Models Merged
 The following models were included in the merge:
-* [mllm-dev/gpt2_f_experiment_4_1000](https://huggingface.co/mllm-dev/gpt2_f_experiment_4_1000)
-* [mllm-dev/gpt2_f_experiment_1_1000](https://huggingface.co/mllm-dev/gpt2_f_experiment_1_1000)
 * [mllm-dev/gpt2_f_experiment_2_1000](https://huggingface.co/mllm-dev/gpt2_f_experiment_2_1000)
 * [mllm-dev/gpt2_f_experiment_3_1000](https://huggingface.co/mllm-dev/gpt2_f_experiment_3_1000)
 ### Configuration
@@ -52,26 +52,26 @@ slices:
         path: mllm-dev/gpt2_f_experiment_1_1000
     parameters:
       density: 0.8
-      weight: 0.2
   - layer_range: [0, 12]
     model:
       model:
         path: mllm-dev/gpt2_f_experiment_2_1000
     parameters:
-      density: 0.8
-      weight: 0.2
   - layer_range: [0, 12]
     model:
       model:
         path: mllm-dev/gpt2_f_experiment_3_1000
     parameters:
-      density: 0.8
-      weight: 0.2
   - layer_range: [0, 12]
     model:
       model:
         path: mllm-dev/gpt2_f_experiment_4_1000
     parameters:
       density: 0.8
-      weight: 0.2
 ```

 ---
 base_model:
 - mllm-dev/gpt2_f_experiment_2_1000
+- mllm-dev/gpt2_f_experiment_1_1000
+- mllm-dev/gpt2_f_experiment_4_1000
+- mllm-dev/gpt2_f_experiment_0_1000
 - mllm-dev/gpt2_f_experiment_3_1000
 library_name: transformers
 tags:
 ### Models Merged
 The following models were included in the merge:
 * [mllm-dev/gpt2_f_experiment_2_1000](https://huggingface.co/mllm-dev/gpt2_f_experiment_2_1000)
+* [mllm-dev/gpt2_f_experiment_1_1000](https://huggingface.co/mllm-dev/gpt2_f_experiment_1_1000)
+* [mllm-dev/gpt2_f_experiment_4_1000](https://huggingface.co/mllm-dev/gpt2_f_experiment_4_1000)
 * [mllm-dev/gpt2_f_experiment_3_1000](https://huggingface.co/mllm-dev/gpt2_f_experiment_3_1000)
 ### Configuration
         path: mllm-dev/gpt2_f_experiment_1_1000
     parameters:
       density: 0.8
+      weight: 0.3
   - layer_range: [0, 12]
     model:
       model:
         path: mllm-dev/gpt2_f_experiment_2_1000
     parameters:
+      density: 0.6
+      weight: 0.1
   - layer_range: [0, 12]
     model:
       model:
         path: mllm-dev/gpt2_f_experiment_3_1000
     parameters:
+      density: 0.6
+      weight: 0.1
   - layer_range: [0, 12]
     model:
       model:
         path: mllm-dev/gpt2_f_experiment_4_1000
     parameters:
       density: 0.8
+      weight: 0.3
 ```

mergekit_config.yml CHANGED Viewed

@@ -17,25 +17,25 @@ slices:
         path: mllm-dev/gpt2_f_experiment_1_1000
     parameters:
       density: 0.8
-      weight: 0.2
   - layer_range: [0, 12]
     model:
       model:
         path: mllm-dev/gpt2_f_experiment_2_1000
     parameters:
-      density: 0.8
-      weight: 0.2
   - layer_range: [0, 12]
     model:
       model:
         path: mllm-dev/gpt2_f_experiment_3_1000
     parameters:
-      density: 0.8
-      weight: 0.2
   - layer_range: [0, 12]
     model:
       model:
         path: mllm-dev/gpt2_f_experiment_4_1000
     parameters:
       density: 0.8
-      weight: 0.2

         path: mllm-dev/gpt2_f_experiment_1_1000
     parameters:
       density: 0.8
+      weight: 0.3
   - layer_range: [0, 12]
     model:
       model:
         path: mllm-dev/gpt2_f_experiment_2_1000
     parameters:
+      density: 0.6
+      weight: 0.1
   - layer_range: [0, 12]
     model:
       model:
         path: mllm-dev/gpt2_f_experiment_3_1000
     parameters:
+      density: 0.6
+      weight: 0.1
   - layer_range: [0, 12]
     model:
       model:
         path: mllm-dev/gpt2_f_experiment_4_1000
     parameters:
       density: 0.8
+      weight: 0.3

model-00001-of-00001.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3d420ef69a28358b3734eac69f3840aa3558517eec8921307dad490d29ddf218
 size 248902264

 version https://git-lfs.github.com/spec/v1
+oid sha256:ffa5be5a108f5d58195275264465e23384d2041a0f7d691bee44b49c60585fa1
 size 248902264