Upload 11 files

Files changed (11) hide show

actor/merges.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

actor/pytorch_model.bin ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:fec4509b96e334db705e478b5f9a81fe73c5e05d91a6f22e9bef9e623c00d1a2
+size 3235870087

actor/vocab.json ADDED Viewed

The diff for this file is too large to render. See raw diff

actor_ema/config.json ADDED Viewed

+{
+  "_name_or_path": "/home/zhaiyuanzhao/code/DeepSpeedExamples/applications/DeepSpeed-Chat/training/step1_supervised_finetuning/output-1.3b",
+  "_remove_final_layer_norm": false,
+  "activation_dropout": 0.0,
+  "activation_function": "relu",
+  "architectures": [
+    "OPTForCausalLM"
+  ],
+  "attention_dropout": 0.0,
+  "bos_token_id": 2,
+  "do_layer_norm_before": true,
+  "dropout": 0.1,
+  "enable_bias": true,
+  "end_token_id": 2,
+  "eos_token_id": 2,
+  "ffn_dim": 8192,
+  "hidden_size": 2048,
+  "init_std": 0.02,
+  "layer_norm_elementwise_affine": true,
+  "layerdrop": 0.0,
+  "max_position_embeddings": 2048,
+  "model_type": "opt",
+  "num_attention_heads": 32,
+  "num_hidden_layers": 24,
+  "pad_token_id": 2,
+  "prefix": "</s>",
+  "torch_dtype": "float16",
+  "transformers_version": "4.30.0.dev0",
+  "use_cache": true,
+  "vocab_size": 50272,
+  "word_embed_proj_dim": 2048
+}

actor_ema/merges.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

actor_ema/vocab.json ADDED Viewed

The diff for this file is too large to render. See raw diff

critic/config.json ADDED Viewed

+{
+  "_name_or_path": "/home/zhaiyuanzhao/code/DeepSpeedExamples/applications/DeepSpeed-Chat/training/step2_reward_model_finetuning/output",
+  "_remove_final_layer_norm": false,
+  "activation_dropout": 0.0,
+  "activation_function": "relu",
+  "architectures": [
+    "OPTForCausalLM"
+  ],
+  "attention_dropout": 0.0,
+  "bos_token_id": 2,
+  "do_layer_norm_before": false,
+  "dropout": 0.0,
+  "enable_bias": true,
+  "end_token_id": 2,
+  "eos_token_id": 2,
+  "ffn_dim": 4096,
+  "hidden_size": 1024,
+  "init_std": 0.02,
+  "layer_norm_elementwise_affine": true,
+  "layerdrop": 0.0,
+  "max_position_embeddings": 2048,
+  "model_type": "opt",
+  "num_attention_heads": 16,
+  "num_hidden_layers": 24,
+  "pad_token_id": 2,
+  "prefix": "</s>",
+  "torch_dtype": "float16",
+  "transformers_version": "4.30.0.dev0",
+  "use_cache": true,
+  "vocab_size": 50272,
+  "word_embed_proj_dim": 512
+}

critic/merges.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

critic/pytorch_model.bin ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:5a0f87ef3ae6d339fe4ecf1f4c38db085b87ea252cdfd60f7952e89702e1fffe
+size 662469311

critic/vocab.json ADDED Viewed

The diff for this file is too large to render. See raw diff

training.log ADDED Viewed

The diff for this file is too large to render. See raw diff