OpenNMT
/

mixtral-onmt-awq-gemv

Model card Files Files and versions Community

vince62s commited on Dec 19, 2023

Commit

39e20f2

·

1 Parent(s): 4d8c105

Upload 2 files

Files changed (2) hide show

input-vicuna.txt +1 -0
mixtral-inference-awq.yaml +29 -0

input-vicuna.txt ADDED Viewed

	@@ -0,0 +1 @@


1	+ USER:｟newline｠Show me some attractions in Boston.｟newline｠｟newline｠ASSISTANT:｟newline｠

mixtral-inference-awq.yaml ADDED Viewed

	@@ -0,0 +1,29 @@

+transforms: [sentencepiece]
+#### Subword
+src_subword_model: "/mnt/InternalCrucial4/dataAI/mixtral/tokenizer.model"
+tgt_subword_model: "/mnt/InternalCrucial4/dataAI/mixtral/tokenizer.model"
+# Model info
+model: "/mnt/InternalCrucial4/dataAI/mixtral/mixtral-onmt-awq.pt"
+# Inference
+seed: 42
+max_length: 256
+gpu: 0
+batch_type: sents
+batch_size: 1
+world_size: 2
+gpu_ranks: [0, 1]
+parallel_mode: "tensor_parallel"
+precision: fp16
+#random_sampling_topk: 1
+#random_sampling_topp: 0.6
+#random_sampling_temp: 0.9
+beam_size: 1
+n_best: 1
+profile: false
+report_time: true
+src: None
+#tgt: None