Spaces:

shivansh-ka
/

Toxic-Comment-Classifier

Sleeping

shivansh-ka commited on May 13, 2023

Commit

8f486ee

•

1 Parent(s): 3b371b8

app.py changes

Files changed (2) hide show

app.py CHANGED Viewed

@@ -5,12 +5,17 @@ model = ModelLoader()
 prediction = PredictionServices(model.Model, model.Tokenizer)
 def single_predict(text):
     preds = prediction.single_predict(text)
-    return {"toxic":preds,"non-toxic":(1-preds)}
-app = gr.Interface(gr.Textbox(label="Enter Comment"),
-                   inputs=single_predict,
-                   outputs=gr.Label('probabilities'))
 app.launch()

 prediction = PredictionServices(model.Model, model.Tokenizer)
 def single_predict(text):
+    print(text)
     preds = prediction.single_predict(text)
+    toxic_pred = float(preds)
+    non_toxic_pred = float(1-toxic_pred)
+    rslt = {"Toxic":toxic_pred,"Non Toxic":non_toxic_pred}
+    return rslt
+app = gr.Interface(inputs=gr.Textbox(label="Enter Comment"),
+                   fn=single_predict,
+                   outputs=[gr.Label('Probabilities')],
+                   title="Toxic Comment Classifier")
 app.launch()

src/predict.py CHANGED Viewed

@@ -15,7 +15,7 @@ class PredictionServices:
         self.model = model
         self.tokenizer = tokenizer
-    def tokenizer(self, text:str):
         tokens = self.tokenizer(text,
                                 max_length=MAX_LEN,
                                 truncation=True,
@@ -23,7 +23,8 @@ class PredictionServices:
                                 add_special_tokens=True,
                                 return_tensors="tf",
                                 return_token_type_ids = False)
-        return dict(tokens)
     def plot(self, pred):
         fig = px.bar(x=[round(pred), round(1-pred)],
@@ -49,7 +50,7 @@ class PredictionServices:
             df = pd.read_csv(data)
             df.dropna(inplace=True)
             df = df.comment_text.apply(lambda x: re.sub('\n',' ',x).strip())
-            input = self.tokenizer(df.comment_text.values.tolist())
             preds = self.model.predict(input)
             df['probabilities'] = preds
             df['toxic'] = np.where(df['probabilities']>0.5, 1, 0)
@@ -60,7 +61,7 @@ class PredictionServices:
     def single_predict(self, text:str):
         try:
             text = re.sub('\n',' ',text).strip()
-            input = self.tokenizer(text)
             pred = self.model.predict(input)[0][0]
             return pred
         except Exception as e:

         self.model = model
         self.tokenizer = tokenizer
+    def tokenizer_fn(self, text:str):
         tokens = self.tokenizer(text,
                                 max_length=MAX_LEN,
                                 truncation=True,
                                 add_special_tokens=True,
                                 return_tensors="tf",
                                 return_token_type_ids = False)
+        inputs = dict(tokens)
+        return inputs
     def plot(self, pred):
         fig = px.bar(x=[round(pred), round(1-pred)],
             df = pd.read_csv(data)
             df.dropna(inplace=True)
             df = df.comment_text.apply(lambda x: re.sub('\n',' ',x).strip())
+            input = self.tokenizer_fn(df.comment_text.values.tolist())
             preds = self.model.predict(input)
             df['probabilities'] = preds
             df['toxic'] = np.where(df['probabilities']>0.5, 1, 0)
     def single_predict(self, text:str):
         try:
             text = re.sub('\n',' ',text).strip()
+            input = self.tokenizer_fn(text)
             pred = self.model.predict(input)[0][0]
             return pred
         except Exception as e: