Spaces:

wasmdashai
/

wasm-dataset

Sleeping

App Files Files Community

ASG Models commited on Aug 5

Commit

6cddb08

•

1 Parent(s): afef005

Update app.py

Browse files

Files changed (1) hide show

app.py +47 -45

app.py CHANGED Viewed

@@ -99,21 +99,22 @@ class DataViewerApp:
             text = re.sub(r"\d", " ", text)
             return text
     def save_row(self, text,data_oudio):
-        row = self.data.iloc[self.current_selected]
-        row['text'] = text
-        row['flag']=1
-        self.data.iloc[self.current_selected] = row
-        sr,audio=data_oudio
-        if sr!=16000:
-            audio=audio.astype(np.float32)
-            audio/=np.max(np.abs(audio))
-            audio=librosa.resample(audio,orig_sr=sr,target_sr=16000)
-        self.sdata[self.current_selected] = audio
         return self.get_page_data(self.current_page),None,""
     def GetDataset_2(self,filename,ds=1.5):
         audios_data = []
@@ -142,27 +143,28 @@ class DataViewerApp:
         return self.get_page_data(self.current_page)
     def trim_audio(self, text,data_oudio):
-        audios_data = []
-        audios_samplerate = []
-        sr,audio=data_oudio
-        audio=audio.astype(np.float32)
-        audio/=np.max(np.abs(audio))
-        audio=librosa.resample(audio,orig_sr=sr,target_sr=16000)
-        audios_data.append(audio)
-        secs=round(len(audios_data)/16000,2)
-        audios_samplerate.append(16000)
-        df = pd.DataFrame()
-        df['secs'] = secs
-        df['audio'] =[ audio]
-        df['samplerate'] = 16000
-        df['text'] =text
-        df['speaker_id'] =self.speaker_id
-        df['_speaker_id'] =self.speaker_id
-        df['flag']=1
-        df = df[['text','audio','samplerate','secs','speaker_id','_speaker_id','flag']]
-        self.df = pd.concat([self.df, df], axis=0, ignore_index=True)
-        self.data =self.df[['text','speaker_id','secs','flag']]
-        self.sdata =self.df['audio'].to_list()
         return self.get_page_data(self.current_page),None,""
     def order_data(self):
         self.df[['text','speaker_id','secs','flag']]=self.data
@@ -260,15 +262,15 @@ class DataViewerApp:
            return namedata
     def delete_row(self):
-        self.data.drop(self.current_selected, inplace=True)
-        self.data.reset_index(drop=True, inplace=True)
-        self.df.drop(self.current_selected, inplace=True)
-        self.df.reset_index(drop=True, inplace=True)
-        self.sdata.pop(self.current_selected)
-        self.current_selected = -1
-        # self.audio_player.update(None)  # Clear audio player
-        # self.txt_audio.update("")  # Clear text input
         return self.get_page_data(self.current_page),None,""
     def login(self, token):

             text = re.sub(r"\d", " ", text)
             return text
     def save_row(self, text,data_oudio):
+        if text!="" :
+                row = self.data.iloc[self.current_selected]
+                row['text'] = text
+                row['flag']=1
+                self.data.iloc[self.current_selected] = row
+                sr,audio=data_oudio
+                if sr!=16000:
+                    audio=audio.astype(np.float32)
+                    audio/=np.max(np.abs(audio))
+                    audio=librosa.resample(audio,orig_sr=sr,target_sr=16000)
+                self.sdata[self.current_selected] = audio
         return self.get_page_data(self.current_page),None,""
     def GetDataset_2(self,filename,ds=1.5):
         audios_data = []
         return self.get_page_data(self.current_page)
     def trim_audio(self, text,data_oudio):
+        if text!="" :
+                audios_data = []
+                audios_samplerate = []
+                sr,audio=data_oudio
+                audio=audio.astype(np.float32)
+                audio/=np.max(np.abs(audio))
+                audio=librosa.resample(audio,orig_sr=sr,target_sr=16000)
+                audios_data.append(audio)
+                secs=round(len(audios_data)/16000,2)
+                audios_samplerate.append(16000)
+                df = pd.DataFrame()
+                df['secs'] = secs
+                df['audio'] =[ audio]
+                df['samplerate'] = 16000
+                df['text'] =text
+                df['speaker_id'] =self.speaker_id
+                df['_speaker_id'] =self.speaker_id
+                df['flag']=1
+                df = df[['text','audio','samplerate','secs','speaker_id','_speaker_id','flag']]
+                self.df = pd.concat([self.df, df], axis=0, ignore_index=True)
+                self.data =self.df[['text','speaker_id','secs','flag']]
+                self.sdata =self.df['audio'].to_list()
         return self.get_page_data(self.current_page),None,""
     def order_data(self):
         self.df[['text','speaker_id','secs','flag']]=self.data
            return namedata
     def delete_row(self):
+        if len(self.data)!=0  or  self.current_selected != -1 :
+                self.data.drop(self.current_selected, inplace=True)
+                self.data.reset_index(drop=True, inplace=True)
+                self.df.drop(self.current_selected, inplace=True)
+                self.df.reset_index(drop=True, inplace=True)
+                self.sdata.pop(self.current_selected)
+                self.current_selected = -1
+                # self.audio_player.update(None)  # Clear audio player
+                # self.txt_audio.update("")  # Clear text input
         return self.get_page_data(self.current_page),None,""
     def login(self, token):