LossFunctionLover
/

pairwise-orm-model

Text Classification

preference-learning

agentic-reasoning

outcome-reward-model

pairwise-preference

Eval Results (legacy)

Model card Files Files and versions

LossFunctionLover commited on 6 days ago

Commit

44d5eef

·

verified ·

1 Parent(s): e3a4d71

Update README.md

Files changed (1) hide show

README.md +4 -3

README.md CHANGED Viewed

@@ -68,7 +68,7 @@ Input Text (Reasoning Trace)
     ↓
 [Frozen Base LM Encoder]  ← Pre-trained, frozen during training
     ↓
-[Final Token (EOS) Pooling]
     ↓
 [Lightweight Linear Head]    ← Only these parameters are trained
     ↓
@@ -219,12 +219,13 @@ base_model = AutoModel.from_pretrained("facebook/opt-1.3b")
 tokenizer = AutoTokenizer.from_pretrained("facebook/opt-1.3b")
 # Load the trained scoring head weights
-scoring_head_weights = torch.load(model_path, map_location="cpu")
 # Initialize scoring head (single linear layer)
 hidden_size = base_model.config.hidden_size
 scoring_head = torch.nn.Linear(hidden_size, 1)
-scoring_head.load_state_dict(scoring_head_weights)
 # Move to device
 device = "cuda" if torch.cuda.is_available() else "cpu"

     ↓
 [Frozen Base LM Encoder]  ← Pre-trained, frozen during training
     ↓
+[Final Non-Padding Token Pooling (attention-mask aware)]
     ↓
 [Lightweight Linear Head]    ← Only these parameters are trained
     ↓
 tokenizer = AutoTokenizer.from_pretrained("facebook/opt-1.3b")
 # Load the trained scoring head weights
+ckpt = torch.load(model_path, map_location="cpu")
+state = ckpt["model_state"] if "model_state" in ckpt else ckpt
 # Initialize scoring head (single linear layer)
 hidden_size = base_model.config.hidden_size
 scoring_head = torch.nn.Linear(hidden_size, 1)
+scoring_head.load_state_dict(state)
 # Move to device
 device = "cuda" if torch.cuda.is_available() else "cpu"