andysalerno
/

openchat-nectar-0.19

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

openchat-nectar-0.19 / README.md

andysalerno's picture

Update README.md

d11816a verified 10 months ago

|

history blame contribute delete

466 Bytes

	---
	library_name: transformers
	base_model: openchat/openchat-3.5-0106
	datasets:
	- berkeley-nest/Nectar
	license: apache-2.0
	---

	max_steps = 1000
	learning_rate = 5e-7
	label_smoothing = 0.2 # somewhere between 0 and 0.5
	warmup_ratio = 0.1
	dpo_beta = 0.01
	use_rslora = False
	use_loftq = False
	lora_rank = 16
	lora_alpha = 16
	lora_dropout = 0.05
	load_separate_reference_model = False
	max_seq_length = 2048
	eval_steps = 200
	train_split = 0.008