RLHF-And-Friends
/

TLDR-Mistral-7B-SFT-PPO

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Community

TLDR-Mistral-7B-SFT-PPO

Commit History

Update tokenizer_config.json

0b4de89
verified

evgurov commited on about 1 month ago

Update config.json

a2b9ba7
verified

evgurov commited on about 1 month ago

Update tokenizer_config.json

e56d332
verified

evgurov commited on Feb 23

Upload folder using huggingface_hub

7ea071c
verified

arqa39 commited on Feb 23

initial commit

0d95454
verified

arqa39 commited on Feb 23