|
|
|
|
|
|
|
|
|
|
|
CUDA_VISIBLE_DEVICES=0 python examples/glen_phase2/train_glen.py \ |
|
--output_dir logs/model_glen_nq/GLEN_P2_base \ |
|
--load_pretrained_st5_checkpoint "checkpoint/glen_p1_nq/pytorch_model.bin" \ |
|
--model_name_or_path t5-base \ |
|
--save_steps 100 \ |
|
--per_device_train_batch_size 128 \ |
|
--positive_passage_no_shuffle \ |
|
--learning_rate 5e-5 \ |
|
--q_max_len 32 \ |
|
--p_max_len 156 \ |
|
--num_train_epochs 30 \ |
|
--logging_steps 10 \ |
|
--overwrite_output_dir \ |
|
--softmax_temperature 1.0 \ |
|
--query_type gtq \ |
|
--train_n_passages 9 \ |
|
--dataset_name nq320k \ |
|
--num_multi_vectors 3 \ |
|
--infonce_loss 1.0 \ |
|
--q_to_docid_loss 0.5 \ |
|
--cosine_point_loss 0.25 \ |
|
--warmup_ratio 0.0 \ |
|
--mask_special_tokens_for_decoding True \ |
|
--do_docid_temperature_annealing True \ |
|
--docid_temperature 1.0 \ |
|
--docid_temperature_min 1e-5 \ |
|
--negative_passage_type self \ |
|
--grad_cache \ |
|
--gc_q_chunk_size 128 \ |
|
--gc_p_chunk_size 128 |