Spaces:

eldavid
/

sound_music

Runtime error

App Files Files Community

eldavid commited on May 27

Commit

4875d3e

•

1 Parent(s): 7fb6824

Update app.py

Browse files

Files changed (1) hide show

app.py +29 -26

app.py CHANGED Viewed

@@ -1,36 +1,39 @@
-from datasets import load_dataset, concatenate_datasets
-import pandas as pd
 import gradio as gr
-def load_and_concatenate_datasets(music_csv_path, notes_csv_path):
-    # Carregar os datasets
-    music_dataset = load_dataset('csv', data_files={'train': music_csv_path})
-    notes_dataset = load_dataset('csv', data_files={'train': notes_csv_path})
-    # Concatenar os datasets
-    combined_dataset = concatenate_datasets([music_dataset['train'], notes_dataset['train']])
-    # Convertê-los para DataFrame pandas para facilitar a manipulação
-    combined_df = pd.DataFrame(combined_dataset)
-    return combined_df
-def display_combined_dataset(music_csv_path, notes_csv_path):
-    df = load_and_concatenate_datasets(music_csv_path, notes_csv_path)
-    # Selecionar colunas relevantes para exibição
-    display_columns = ['title', 'artist', 'year', 'lyrics', 'chords'] if 'lyrics' in df.columns and 'chords' in df.columns else df.columns
-    display_df = df[display_columns].head()  # Mostra as primeiras linhas do dataset combinado
-    return display_df
 # Configurar a interface Gradio
 iface = gr.Interface(
-    fn=display_combined_dataset,
-    inputs=[gr.inputs.Textbox(lines=1, placeholder="Caminho para o CSV de Música"), gr.inputs.Textbox(lines=1, placeholder="Caminho para o CSV de Notas")],
-    outputs="dataframe",
-    title="Combinação de Datasets de Música e Notas Musicais",
-    description="Insira os caminhos para os arquivos CSV dos datasets de músicas e notas musicais para visualizar os dados combinados."
 )
 iface.launch(share=True)  # share=True para gerar um link público

 import gradio as gr
+import librosa
+from transformers import Wav2Vec2ForCTC, Wav2Vec2Tokenizer
+import torch
+# Carregar o modelo e o tokenizer pré-treinados para reconhecimento de fala
+tokenizer = Wav2Vec2Tokenizer.from_pretrained("facebook/wav2vec2-large-960h")
+model = Wav2Vec2ForCTC.from_pretrained("facebook/wav2vec2-large-960h")
+def transcribe_audio(audio_file):
+    # Carregar o arquivo de áudio
+    y, sr = librosa.load(audio_file, sr=16000)  # Wav2Vec2 espera áudio com taxa de amostragem de 16kHz
+    input_values = tokenizer(y, return_tensors="pt", padding="longest").input_values
+    logits = model(input_values).logits
+    predicted_ids = torch.argmax(logits, dim=-1)
+    transcription = tokenizer.batch_decode(predicted_ids)[0]
+    return transcription
+def identify_song_and_lyrics(audio_file):
+    transcription = transcribe_audio(audio_file)
+    # Placeholder para lógica de identificação da música e obtenção das letras e cifras
+    song_info = {
+        "title": "Título da Música (Placeholder)",
+        "artist": "Artista (Placeholder)",
+        "lyrics": transcription,  # Usar a transcrição como placeholder
+        "chords": "Cifra (Placeholder)"
+    }
+    return song_info
 # Configurar a interface Gradio
 iface = gr.Interface(
+    fn=identify_song_and_lyrics,
+    inputs=gr.inputs.Audio(source="upload", type="file"),
+    outputs="json",
+    title="Identificação de Música e Exibição de Letras e Cifras",
+    description="Carregue um arquivo de áudio para identificar a música e visualizar a cifra e a letra."
 )
 iface.launch(share=True)  # share=True para gerar um link público