huiang
/

reward-imdb

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

reward-imdb / vocab.txt

Commit History

reward_rlhf

3c0caf1
verified

huiang commited on Apr 26, 2024