amirabdullah19852020
/

interpreting_reward_models

Model card Files Files and versions Community

interpreting_reward_models / data /merged_contrastive_gpt_neo_125m_from_model_rlhf_on_task_hh_rlhf_activations_dataset.hf /chosen

1 contributor

History: 3 commits

amirabdullah19852020's picture

amirabdullah19852020

Upload folder using huggingface_hub

322d944 verified about 1 month ago