tannedbum
/

Ellaria-9B

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Ellaria-9B / mergekit_config.yml

tannedbum's picture

Upload folder using huggingface_hub

3015886 verified 4 months ago

425 Bytes

	slices:
	- sources:
	- model: TheDrummer/Gemmasutra-9B-v1
	layer_range: [0, 42]
	- model: princeton-nlp/gemma-2-9b-it-SimPO
	layer_range: [0, 42]
	merge_method: slerp
	base_model: TheDrummer/Gemmasutra-9B-v1
	parameters:
	t:
	- filter: self_attn
	value: [0.2, 0.4, 0.6, 0.2, 0.4]
	- filter: mlp
	value: [0.8, 0.6, 0.4, 0.8, 0.6]
	- value: 0.4
	dtype: bfloat16