Spaces:

kavlab
/

urfu-pe

Sleeping

Kuznetsov AV commited on Nov 10, 2023

Commit

092b169

•

1 Parent(s): 2e83bf4

added project kuznetsov_av, main program run.py, modified readme.md

Files changed (5) hide show

README.md CHANGED Viewed

	@@ -1 +1 @@
1	- # ~~urfu_iml_2023_1_3_hw2~~


1	+ # Программная инженерия. Практическое задание №2

kuznetsov_av/kuznetsov_av.py ADDED Viewed

+from transformers import pipeline
+from datasets import load_dataset
+import torch
+import streamlit as st
+@st.cache_resource
+def load_model():
+    synthesiser = pipeline("text-to-speech", "microsoft/speecht5_tts")
+    embeddings_dataset = load_dataset("Matthijs/cmu-arctic-xvectors", split="validation")
+    speaker_embedding = torch.tensor(embeddings_dataset[7306]["xvector"]).unsqueeze(0)
+    return synthesiser, speaker_embedding
+synthesiser, speaker_embedding = load_model()
+text = st.text_area('Enter English text here')
+st.write(f'You wrote {len(text)} characters.')
+if st.button('Speech'):
+    speech = synthesiser(text, forward_params={"speaker_embeddings": speaker_embedding})
+    st.audio(speech['audio'], sample_rate=speech['sampling_rate'])

kuznetsov_av/requirements.txt ADDED Viewed

+datasets==2.14.6
+streamlit==1.28.1
+torch==2.1.0
+transformers==4.35.0

requirements.txt ADDED Viewed

+datasets==2.14.6
+streamlit==1.28.1
+torch==2.1.0
+transformers==4.35.0

run.py ADDED Viewed

+from transformers import pipeline
+from datasets import load_dataset
+import torch
+import streamlit as st
+@st.cache_resource
+def load_speech_model():
+    synthesiser = pipeline("text-to-speech", "microsoft/speecht5_tts")
+    embeddings_dataset = load_dataset("Matthijs/cmu-arctic-xvectors", split="validation")
+    speaker_embedding = torch.tensor(embeddings_dataset[7306]["xvector"]).unsqueeze(0)
+    return synthesiser, speaker_embedding
+def speech_elements():
+    synthesiser, speaker_embedding = load_speech_model()
+    text = st.text_area('Enter English text here')
+    st.write(f'You wrote {len(text)} characters.')
+    if st.button('Speech'):
+        speech = synthesiser(text, forward_params={"speaker_embeddings": speaker_embedding})
+        st.audio(speech['audio'], sample_rate=speech['sampling_rate'])
+speech_elements()