amirabdullah19852020
/

interpreting_reward_models

Model card Files Files and versions Community

interpreting_reward_models / data /merged_contrastive_gemma_2b_it_hh_rlhf_activations_and_features.hf /dataset_dict.json

amirabdullah19852020's picture

amirabdullah19852020

Upload folder using huggingface_hub

23e7aed verified 4 months ago

history blame contribute delete

No virus

38 Bytes

{"splits": ["chosen", "new_rejected"]}