Spaces:

Pavankalyan
/

S2I

Runtime error

App Files Files Community

Pavankalyan commited on Sep 4, 2023

Commit

d6dd1d2

•

1 Parent(s): 592e443

Update app.py

Browse files

Files changed (1) hide show

app.py +27 -133

app.py CHANGED Viewed

@@ -1,146 +1,40 @@
-from model import Wav2VecModel
-from dataset import S2IDataset, collate_fn
-import requests
-requests.packages.urllib3.disable_warnings()
 import gradio as gr
-import torch
-import torch.nn as nn
-import torchaudio
-import torch.nn.functional as F
-import pytorch_lightning as pl
-from pytorch_lightning import Trainer
-from pytorch_lightning.callbacks import ModelCheckpoint
-from pytorch_lightning.loggers import WandbLogger
-# SEED
-SEED=100
-pl.seed_everything(SEED)
-torch.manual_seed(SEED)
 import os
-os.environ['WANDB_MODE'] = 'online'
-os.environ["CUDA_DEVICE_ORDER"]="PCI_BUS_ID"
-os.environ["CUDA_VISIBLE_DEVICES"]="1"
-class LightningModel(pl.LightningModule):
-    def __init__(self,):
-        super().__init__()
-        self.model = Wav2VecModel()
-    def forward(self, x):
-        return self.model(x)
-    def configure_optimizers(self):
-        optimizer = torch.optim.Adam(self.parameters(), lr=1e-5)
-        return [optimizer]
-    def loss_fn(self, prediction, targets):
-        return nn.CrossEntropyLoss()(prediction, targets)
-    def training_step(self, batch, batch_idx):
-        x, y = batch
-        y = y.view(-1)
-        logits = self(x)
-        probs = F.softmax(logits, dim=1)
-        loss = self.loss_fn(logits, y)
-        winners = logits.argmax(dim=1)
-        corrects = (winners == y)
-        acc = corrects.sum().float()/float(logits.size(0))
-        self.log('train/loss', loss, on_step=False, on_epoch=True, prog_bar=True)
-        self.log('train/acc', acc, on_step=False, on_epoch=True, prog_bar=True)
-        torch.cuda.empty_cache()
-        return {
-            'loss':loss,
-            'acc':acc
-            }
-    def validation_step(self, batch, batch_idx):
-        x, y = batch
-        y = y.view(-1)
-        logits = self(x)
-        loss = self.loss_fn(logits, y)
-        winners = logits.argmax(dim=1)
-        corrects = (winners == y)
-        acc = corrects.sum().float() / float( logits.size(0))
-        self.log('val/loss' , loss, on_step=False, on_epoch=True, prog_bar=True)
-        self.log('val/acc',acc, on_step=False, on_epoch=True, prog_bar=True)
-        return {'val_loss':loss,
-                'val_acc':acc,
-                }
-    def test_step(self, batch, batch_idx):
-        x, y = batch
-        y = y.view(-1)
-        logits = self(x)
-        loss = self.loss_fn(logits, y)
-        winners = logits.argmax(dim=1)
-        corrects = (winners == y)
-        acc = corrects.sum().float() / float( logits.size(0))
-        self.log('val/loss' , loss, on_step=False, on_epoch=True, prog_bar=True)
-        self.log('val/acc',acc, on_step=False, on_epoch=True, prog_bar=True)
-        return {'val_loss':loss,
-                'val_acc':acc,
-                }
-    def predict(self, wav):
-        self.eval()
-        with torch.no_grad():
-            output = self.forward(wav)
-            predicted_class = torch.argmax(output, dim=1)
-        return predicted_class
-model = LightningModel()
-run_name = "wav2vec"
-checkpoint_path = "./wav2vec-epoch=epoch=4.ckpt.ckpt"
-checkpoint = torch.load(checkpoint_path,map_location=torch.device('cpu'))
-model.load_state_dict(checkpoint['state_dict'])
-trainer = Trainer()
-#trainer.fit(model, train_dataloader=trainloader, val_dataloaders=valloader)
-#trainer.test(model,dataloaders=testloader,verbose=True)
-#with torch.no_grad():
- #   y_hat = model(wav_tensor)
 def transcribe(audio):
-    resmaple = torchaudio.transforms.Resample(8000, 16000)
-    wav_tensor,_ = torchaudio.load(audio)
-    #sr, wav_tensor = audio
-    wav_tensor = resmaple(wav_tensor)
-    #model = model.to('cuda')
-    y_hat = model.predict(wav_tensor)
-    labels = {0:"branch_address : enquiry about bank branch location",
-    1:"activate_card : enquiry about activating card products",
-    2:"past_transactions : enquiry about past transactions in a specific time period",
-    3:"dispatch_status : enquiry about the dispatch status of card products",
-    4:"outstanding_balance : enquiry about outstanding balance on card products",
-    5:"card_issue : report about an issue with using card products",
-    6:"ifsc_code : enquiry about IFSC code of bank branch",
-    7:"generate_pin : enquiry about changing or generating a new pin for their card product",
-    8:"unauthorised_transaction : report about an unauthorised or fraudulent transaction",
-    9:"loan_query : enquiry about different kinds of loans",
-    10:"balance_enquiry : enquiry about bank account balance",
-    11:"change_limit : enquiry about changing the limit for card products",
-    12:"block : enquiry about blocking card or banking product",
-    13:"lost : report about losing a card product"}
-    return labels[y_hat[0].item()]
 get_intent = gr.Interface(fn = transcribe,

 import gradio as gr
+from transformers import pipeline
+import json
 import os
+data_dict = {}
+with open('./results_classification/file.json', 'r') as file:
+    data = json.load(file)
+intents_dict = data
+tokenizer = AutoTokenizer.from_pretrained("roberta-base")
+model = AutoModelForSequenceClassification.from_pretrained("./results_classification/checkpoint-1890/")
+def preprocess(text):
+    inputs = tokenizer(text, padding=True, truncation=True, return_tensors="pt")
+    return inputs
+def postprocess(outputs):
+    logits = outputs.logits
+    predicted_labels = logits.argmax(dim=1).tolist()
+    return predicted_labels
+def predict(text):
+    inputs = preprocess(text)
+    with torch.no_grad():
+        outputs = model(**inputs)
+    predicted_labels = postprocess(outputs)
+    ans = intents_dict[predicted_labels[0]]
+    return ans
+from transformers import pipeline
+p = pipeline(model="openai/whisper-medium")
 def transcribe(audio):
+    t = p(audio)['text']
+    ans = predict(t)
+    return ans
 get_intent = gr.Interface(fn = transcribe,