tatsu-lab
/

alpaca-farm-reward-model-sim-wdiff

Inference Endpoints

Model card Files Files and versions Community

alpaca-farm-reward-model-sim-wdiff / config.json

rtaori's picture

Upload model

1037209 over 1 year ago

history blame contribute delete

407 Bytes

	{
	"_name_or_path": "/juice5/scr5/nlp/crfm/human-feedback/models/selfinstruct/reward_model_noised_multi_v1/reward_model_noised_multi_v1_p0.5",
	"architectures": [
	"RewardModel"
	],
	"backbone_model_name_or_path": "/juice5/scr5/nlp/crfm/human-feedback/models/selfinstruct/sft_v6_llama_7b_regen_v7_3ep",
	"model_type": "reward_model",
	"torch_dtype": "float32",
	"transformers_version": "4.29.2"
	}