python hf_prune.py --pruning_ratio 0.20 --block_wise --block_mlp_layer_start 4 --block_mlp_layer_end 30 --block_attention_layer_start 4 --block_attention_layer_end 30 --pruner_type taylor --test_after_train --device cpu --eval_device cuda --save_ckpt_log_name vicuna_prune20 --save_model --base_model lmsys/vicuna-7b-v1.3