Spaces:

nubifere
/

vis-llm-ft

No application file

Upload folder using huggingface_hub

b7edc7f verified 5 months ago

No virus

1.07 kB

	#!/bin/bash

	python -m torch.distributed.run \
	--nproc_per_node $NPROC_PER_NODE \
	--nnodes $NNODES \
	--node_rank $RANK \
	--master_addr $MASTER_ADDR \
	--master_port $MASTER_PORT \
	../../src/train_bash.py \
	--deepspeed ds_z3_config.json \
	--stage sft \
	--do_train \
	--model_name_or_path meta-llama/Llama-2-7b-hf \
	--dataset alpaca_gpt4_en \
	--dataset_dir ../../data \
	--template default \
	--finetuning_type full \
	--output_dir ../../saves/LLaMA2-7B/full/sft \
	--overwrite_cache \
	--overwrite_output_dir \
	--cutoff_len 1024 \
	--preprocessing_num_workers 16 \
	--per_device_train_batch_size 1 \
	--per_device_eval_batch_size 1 \
	--gradient_accumulation_steps 2 \
	--lr_scheduler_type cosine \
	--logging_steps 10 \
	--warmup_steps 20 \
	--save_steps 100 \
	--eval_steps 100 \
	--evaluation_strategy steps \
	--learning_rate 5e-5 \
	--num_train_epochs 3.0 \
	--max_samples 3000 \
	--val_size 0.1 \
	--ddp_timeout 1800000 \
	--plot_loss \
	--fp16