pkbiswas
/

Llama-2-7b-Detoxified-PPO-QLoRa

Reinforcement Learning

Inference Endpoints

Model card Files Files and versions Community

Llama-2-7b-Detoxified-PPO-QLoRa / special_tokens_map.json

Commit History

Push model using huggingface_hub.

9b5294d
verified

pkbiswas commited on May 27