openbmb
/

Eurus-RM-7b

Text Classification

feature-extraction

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

lievan commited on Apr 2, 2024

Commit

4110700

·

verified ·

1 Parent(s): c857edd

Update README.md

Files changed (1) hide show

README.md +2 -41

README.md CHANGED Viewed

@@ -28,47 +28,8 @@ Eurus-RM-7B is trained on a mixture of [UltraInteract](https://huggingface.co/da
 ## Usage
 ```python
-from transformers import PreTrainedModel, MistralConfig, MistralModel
-import torch.nn as nn
-import torch
-from typing import Optional, List
-class EurusRewardModel(PreTrainedModel):
-    config_class = MistralConfig
-    def __init__(self, config):
-        super().__init__(config)
-        self.model = MistralModel(config)
-        self.regression_head = nn.Linear(self.config.hidden_size, 1, bias=False)
-    def forward( # args are the same as LlamaForCausalLM
-        self,
-        input_ids: torch.LongTensor = None,
-        attention_mask: Optional[torch.Tensor] = None,
-        position_ids: Optional[torch.LongTensor] = None,
-        past_key_values: Optional[List[torch.FloatTensor]] = None,
-        inputs_embeds: Optional[torch.FloatTensor] = None,
-        labels: Optional[torch.LongTensor] = None,
-        use_cache: Optional[bool] = None,
-        output_attentions: Optional[bool] = None,
-        output_hidden_states: Optional[bool] = None,
-        return_dict: Optional[bool] = None,
-    ):
-        transformer_outputs = self.model(
-                                input_ids,
-                                attention_mask=attention_mask,
-                                position_ids=position_ids,
-                                past_key_values=past_key_values,
-                                inputs_embeds=inputs_embeds,
-                            )
-        hidden_states = transformer_outputs[0]
-        rewards = self.regression_head(hidden_states).squeeze(-1)
-        ends = attention_mask.cumsum(dim=1).argmax(dim=1).view(-1,1)
-        rewards = torch.gather(rewards, 1, ends)
-        return rewards
 def test(model_path):
     dataset = [ # cases in webgpt; we use the same template as Mistral-Instruct-v0.2
@@ -78,7 +39,7 @@ def test(model_path):
     tokenizer = AutoTokenizer.from_pretrained(model_path)
-    model = EurusRewardModel.from_pretrained(model_path)
     for example in dataset:
         inputs = tokenizer(example["chosen"], return_tensors="pt")

 ## Usage
 ```python
+from transformers import AutoTokenizer, AutoModel
 def test(model_path):
     dataset = [ # cases in webgpt; we use the same template as Mistral-Instruct-v0.2
     tokenizer = AutoTokenizer.from_pretrained(model_path)
+    model = AutoModel.from_pretrained(model_path, trust_remote_code=True)
     for example in dataset:
         inputs = tokenizer(example["chosen"], return_tensors="pt")