pkbiswas
/

Phi-3-Detoxified-PPO-LoRa

Reinforcement Learning

Inference Endpoints

Model card Files Files and versions Community

Phi-3-Detoxified-PPO-LoRa

Commit History

Push model using huggingface_hub.

66a811a
verified

pkbiswas commited on May 18

Upload tokenizer

d569e95
verified

pkbiswas commited on May 2

Upload Phi3ForCausalLM

03b471c
verified

pkbiswas commited on May 2

Upload tokenizer

f1fcb3e
verified

pkbiswas commited on May 2

Upload Phi3ForCausalLM

421110d
verified

pkbiswas commited on May 2

Push model using huggingface_hub.

bfb7444
verified

pkbiswas commited on May 2

initial commit

4a22299
verified

pkbiswas commited on May 2