Llama-2-70b-AQLM-4Bit-2x16-hf / configuration_llama_aqlm.py

Andrei Panferov

everything

0df24db 5 months ago

No virus

421 Bytes

	from transformers import LlamaConfig as OrigLlamaConfig


	class LlamaConfig(OrigLlamaConfig):
	model_type = "llama_aqlm"

	def __init__(
	self,
	aqlm: dict[str, int] = {
	"nbits_per_codebook": 16,
	"num_codebooks": 1,
	"out_group_size": 8,
	"in_group_size": 1,
	},
	**kwargs,
	):
	super().__init__(**kwargs)
	self.aqlm = aqlm