dvilasuero
/

NeuralHermes-2.5-Mistral-7B-distilabel

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

NeuralHermes-2.5-Mistral-7B-distilabel / README.md

dvilasuero's picture

dvilasuero HF staff

Create README.md

a932ff3 7 months ago

|

history blame contribute delete

No virus

1.34 kB

	---
	license: mit
	---

	Experiment with distilabel:

	```python

	dataset = load_dataset("argilla/distilabel-intel-orca-dpo-pairs", split="train", token=hf_token)
	dataset = dataset.filter(lambda r: r["status"]!="tie" and r["chosen_score"]>5)

	def chatml_format(example):
	# Format system
	if len(example['system']) > 0:
	message = {"role": "system", "content": example['system']}
	system = tokenizer.apply_chat_template([message], tokenize=False)
	else:
	system = ""

	# Format instruction
	message = {"role": "user", "content": example['input']}
	prompt = tokenizer.apply_chat_template([message], tokenize=False, add_generation_prompt=True)

	# Format chosen answer
	chosen = example['chosen'] + "<\|im_end\|>\n"

	# Format rejected answer
	rejected = example['rejected'] + "<\|im_end\|>\n"

	return {
	"prompt": system + prompt,
	"chosen": chosen,
	"rejected": rejected,
	}

	# Load dataset
	#dataset = load_dataset("Intel/orca_dpo_pairs")['train']

	# Save columns
	original_columns = dataset.column_names

	# Tokenizer
	tokenizer = AutoTokenizer.from_pretrained(model_name)
	tokenizer.pad_token = tokenizer.eos_token
	tokenizer.padding_side = "left"

	# Format dataset
	dataset = dataset.map(
	chatml_format,
	remove_columns=original_columns
	)

	# Print sample
	dataset[1]
	```