amy011872
/

LawToken-7B-a2

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

amy011872 commited on Jul 3

Commit

7a1ba7d

•

1 Parent(s): 64d92c0

Update handler.py

Files changed (1) hide show

handler.py +7 -3

handler.py CHANGED Viewed

@@ -101,21 +101,25 @@ class EndpointHandler():
         if not inputs.endswith("<cite>"):
             inputs += "<cite>"
         logger.info(inputs)
         inputs = self.tokenizer(inputs, return_tensors="pt").to("cuda")
         with torch.no_grad():
             outputs = self.model(**inputs)
         outputs_logits = outputs.logits[0, -1, self.law_token_ids]
-        base_logits = outputs.logits[0, -1, self.law_token_ids]
         raw_mean = outputs_logits.mean()
         outputs_logits = outputs_logits - base_lambda * base_logits
         outputs_logits = outputs_logits + (raw_mean - outputs_logits.mean())
         law_token_probs = outputs_logits.softmax(dim=0)
         sorted_ids = torch.argsort(law_token_probs, descending=True)[:topk]
-        print([self.law_token_names[x] for x in sorted_ids])
         token_objects = [
             self.law_lookup.get_law_from_token(self.law_token_names[x])
             for x in sorted_ids.tolist()]
         return {"tokens": token_objects}

         if not inputs.endswith("<cite>"):
             inputs += "<cite>"
         logger.info(inputs)
         inputs = self.tokenizer(inputs, return_tensors="pt").to("cuda")
         with torch.no_grad():
             outputs = self.model(**inputs)
         outputs_logits = outputs.logits[0, -1, self.law_token_ids]
+        base_input = tokenizer("<cite>", return_tensors="pt").to("cuda")
+        with torch.no_grad():
+            base_output = self.model(**base_input)
+        base_logits = base_output.logits[0, -1, self.law_token_ids]
         raw_mean = outputs_logits.mean()
         outputs_logits = outputs_logits - base_lambda * base_logits
         outputs_logits = outputs_logits + (raw_mean - outputs_logits.mean())
         law_token_probs = outputs_logits.softmax(dim=0)
         sorted_ids = torch.argsort(law_token_probs, descending=True)[:topk]
+        logger.info([self.law_token_names[x] for x in sorted_ids])
         token_objects = [
             self.law_lookup.get_law_from_token(self.law_token_names[x])
             for x in sorted_ids.tolist()]
         return {"tokens": token_objects}