amirabdullah19852020
/

interpreting_reward_models

Model card Files Files and versions Community

interpreting_reward_models / data /merged_contrastive_gpt_neo_125m_from_model_rlhf_on_task_hh_rlhf_activations_dataset.hf /new_rejected /data-00002-of-00003.arrow

Commit History

Upload folder using huggingface_hub

322d944
verified

amirabdullah19852020 commited on Aug 6

Upload folder using huggingface_hub

fc1854f
verified

amirabdullah19852020 commited on Jun 13

Upload folder using huggingface_hub

f9199af
verified

amirabdullah19852020 commited on Jun 13