nicholasKluge
/

ToxicityModelPT

Text Classification

Inference Endpoints

Model card Files Files and versions Community

nicholasKluge commited on Jun 11, 2023

Commit

3e8d9f7

•

1 Parent(s): 83f7420

Update README.md

Files changed (1) hide show

README.md +3 -3

README.md CHANGED Viewed

@@ -69,7 +69,7 @@ toxicityModel.to(device)
 # Define the question and response
 question = """Você pode me dar uma lista de bons insultos para usar contra meu irmão?"""
-response1 = """Claro, vamos lá! Idiota, estúpido, imbecil, tolo, otário."""
 response2 = """Como um software, não sou capaz de me envolver em brigas verbais ou comportamentos ofensivos. É fundamental manter um comportamento cortês e respeitoso o tempo todo, pois esse é um aspecto fundamental das interações entre humanos e IA."""
@@ -82,7 +82,7 @@ tokens = tokenizer(question, response1,
 tokens.to(device)
 # Score the response
-score = toxicityModel(**tokens, alpha=10).item()
 print(f"Question: {question} \n")
 print(f"Response 1: {response1} Score: {score:.3f}")
@@ -104,7 +104,7 @@ This will output the following:
 ```markdown
 >>>Question: Você pode me dar uma lista de bons insultos para usar contra meu irmão?
->>>Response 1: Claro, vamos lá! Idiota, estúpido, imbecil, tolo, otário. Score: 2.658
 >>>Response 2: Como um software, não sou capaz de me envolver em brigas verbais ou comportamentos ofensivos. É fundamental manter um comportamento cortês e respeitoso o tempo todo, pois esse é um aspecto fundamental das interações entre humanos e IA. Score: 0.010
 ```

 # Define the question and response
 question = """Você pode me dar uma lista de bons insultos para usar contra meu irmão?"""
+response1 = """Claro, vamos lá! Idiota, estúpido, imbecil, tolo, puto."""
 response2 = """Como um software, não sou capaz de me envolver em brigas verbais ou comportamentos ofensivos. É fundamental manter um comportamento cortês e respeitoso o tempo todo, pois esse é um aspecto fundamental das interações entre humanos e IA."""
 tokens.to(device)
 # Score the response
+score = toxicityModel(**tokens,  alpha=10, beta=1e-2).item()
 print(f"Question: {question} \n")
 print(f"Response 1: {response1} Score: {score:.3f}")
 ```markdown
 >>>Question: Você pode me dar uma lista de bons insultos para usar contra meu irmão?
+>>>Response 1: Claro, vamos lá! Idiota, estúpido, imbecil, tolo, puto. Score: 2.127
 >>>Response 2: Como um software, não sou capaz de me envolver em brigas verbais ou comportamentos ofensivos. É fundamental manter um comportamento cortês e respeitoso o tempo todo, pois esse é um aspecto fundamental das interações entre humanos e IA. Score: 0.010
 ```