poohRui
/

step3_opt-6.7b_actor_lr_9.65e-7_critic_lr_5e-6

Model card Files Files and versions Community

poohRui commited on May 17, 2023

Commit

17076f3

•

1 Parent(s): 44bb17f

init model step3_opt-6.7b_actor_lr_9.65e-6_critic_lr_5e-6

Files changed (9) hide show

actor/config.json +32 -0
actor/merges.txt +0 -0
actor/pytorch_model.bin +3 -0
actor/vocab.json +0 -0
critic/config.json +32 -0
critic/merges.txt +0 -0
critic/pytorch_model.bin +3 -0
critic/vocab.json +0 -0
training.log +0 -0

actor/config.json ADDED Viewed

	@@ -0,0 +1,32 @@

+{
+  "_name_or_path": "training/step1_supervised_finetuning/output/",
+  "_remove_final_layer_norm": false,
+  "activation_dropout": 0.0,
+  "activation_function": "relu",
+  "architectures": [
+    "OPTForCausalLM"
+  ],
+  "attention_dropout": 0.0,
+  "bos_token_id": 2,
+  "do_layer_norm_before": true,
+  "dropout": 0.0,
+  "enable_bias": true,
+  "end_token_id": 2,
+  "eos_token_id": 2,
+  "ffn_dim": 16384,
+  "hidden_size": 4096,
+  "init_std": 0.02,
+  "layer_norm_elementwise_affine": true,
+  "layerdrop": 0.0,
+  "max_position_embeddings": 2048,
+  "model_type": "opt",
+  "num_attention_heads": 32,
+  "num_hidden_layers": 32,
+  "pad_token_id": 2,
+  "prefix": "</s>",
+  "torch_dtype": "float16",
+  "transformers_version": "4.29.0.dev0",
+  "use_cache": true,
+  "vocab_size": 50272,
+  "word_embed_proj_dim": 4096
+}

actor/merges.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

actor/pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c3963619194adb878736a9cd993ee2ad0014053556a8c41c2a1d0db3f4f44bfe
+size 13317120121

actor/vocab.json ADDED Viewed

The diff for this file is too large to render. See raw diff

critic/config.json ADDED Viewed

	@@ -0,0 +1,32 @@

+{
+  "_name_or_path": "../step2_reward_model_finetuning/output/",
+  "_remove_final_layer_norm": false,
+  "activation_dropout": 0.0,
+  "activation_function": "relu",
+  "architectures": [
+    "OPTForCausalLM"
+  ],
+  "attention_dropout": 0.0,
+  "bos_token_id": 2,
+  "do_layer_norm_before": false,
+  "dropout": 0.0,
+  "enable_bias": true,
+  "end_token_id": 2,
+  "eos_token_id": 2,
+  "ffn_dim": 4096,
+  "hidden_size": 1024,
+  "init_std": 0.02,
+  "layer_norm_elementwise_affine": true,
+  "layerdrop": 0.0,
+  "max_position_embeddings": 2048,
+  "model_type": "opt",
+  "num_attention_heads": 16,
+  "num_hidden_layers": 24,
+  "pad_token_id": 2,
+  "prefix": "</s>",
+  "torch_dtype": "float16",
+  "transformers_version": "4.29.0.dev0",
+  "use_cache": true,
+  "vocab_size": 50272,
+  "word_embed_proj_dim": 512
+}

critic/merges.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

critic/pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:de3344115e79cdb104a161a9cbaac5c4ea880dc1428ab534e338624cf31032a7
+size 662523681

critic/vocab.json ADDED Viewed

The diff for this file is too large to render. See raw diff

training.log ADDED Viewed

The diff for this file is too large to render. See raw diff