IrwinD
/

log_sage_ppo_model

text2text-generation

reinforcement-learning

Inference Endpoints

text-generation-inference

Model card Files Files and versions Community

IrwinD commited on Apr 26

Commit

cdcb318

•

1 Parent(s): d337c1e

Update README.md

Files changed (1) hide show

README.md +2 -1

README.md CHANGED Viewed

@@ -5,6 +5,7 @@ tags:
 - ppo
 - transformers
 - reinforcement-learning
 ---
 # TRL Model
@@ -40,4 +41,4 @@ model = AutoModelForCausalLMWithValueHead.from_pretrained("IrwinD//tmp/tmpoz9k3o
 inputs = tokenizer("Hello, my llama is cute", return_tensors="pt")
 outputs = model(**inputs, labels=inputs["input_ids"])
-```

 - ppo
 - transformers
 - reinforcement-learning
+pipeline_tag: summarization
 ---
 # TRL Model
 inputs = tokenizer("Hello, my llama is cute", return_tensors="pt")
 outputs = model(**inputs, labels=inputs["input_ids"])
+```