wangrongsheng
/

CareLlama2-7b-chat-sft-med

Model card Files Files and versions Community

CareLlama2-7b-chat-sft-med / finetuning_args.json

wangrongsheng's picture

commit from root

2329af4 10 months ago

raw history blame contribute delete

No virus

313 Bytes

	{
	"dpo_beta": 0.1,
	"finetuning_type": "lora",
	"lora_alpha": 32.0,
	"lora_dropout": 0.1,
	"lora_rank": 8,
	"lora_target": [
	"q_proj",
	"v_proj"
	],
	"name_module_trainable": "mlp",
	"num_hidden_layers": 32,
	"num_layer_trainable": 3,
	"ppo_score_norm": false,
	"resume_lora_training": true
	}