Spaces:
Running
Running
Hưng
commited on
Commit
·
2401617
1
Parent(s):
efe0cff
update app
Browse files
app.py
CHANGED
@@ -14,6 +14,11 @@ from f5_tts.infer.utils_infer import (
|
|
14 |
|
15 |
|
16 |
vocoder = load_vocoder()
|
|
|
|
|
|
|
|
|
|
|
17 |
model = load_model(
|
18 |
DiT,
|
19 |
dict(dim=1024, depth=22, heads=16, ff_mult=2, text_dim=512, conv_layers=4),
|
@@ -37,6 +42,7 @@ def infer(ref_audio_orig: str, ref_text: str, gen_text: str, speed: float = 1.0)
|
|
37 |
|
38 |
try:
|
39 |
ref_audio, ref_text = preprocess_ref_audio_text(ref_audio_orig, ref_text)
|
|
|
40 |
final_wave, final_sample_rate, combined_spectrogram = infer_process(
|
41 |
ref_audio,
|
42 |
ref_text,
|
@@ -86,13 +92,13 @@ iface = gr.Interface(
|
|
86 |
examples=[
|
87 |
[
|
88 |
"examples/pc-01.wav",
|
89 |
-
"
|
90 |
"Bà Lê Lan Chi, Tổng giám đốc Zalopay cho biết ứng dụng đã có một năm nhiều dấu ấn khi đồng hành với hàng triệu người dùng",
|
91 |
1.0,
|
92 |
],
|
93 |
[
|
94 |
"examples/pc-02.wav",
|
95 |
-
"
|
96 |
"Bạn đã nhận được thanh toán thành công số tiền ba mươi ngàn đồng",
|
97 |
1.0,
|
98 |
],
|
|
|
14 |
|
15 |
|
16 |
vocoder = load_vocoder()
|
17 |
+
# dim: 1024
|
18 |
+
# depth: 22
|
19 |
+
# heads: 16
|
20 |
+
# ff_mult: 2
|
21 |
+
# text_dim: 512
|
22 |
model = load_model(
|
23 |
DiT,
|
24 |
dict(dim=1024, depth=22, heads=16, ff_mult=2, text_dim=512, conv_layers=4),
|
|
|
42 |
|
43 |
try:
|
44 |
ref_audio, ref_text = preprocess_ref_audio_text(ref_audio_orig, ref_text)
|
45 |
+
gr.Info("Generated audio text: {} with audio file {} ".format(ref_text, ref_audio_orig))
|
46 |
final_wave, final_sample_rate, combined_spectrogram = infer_process(
|
47 |
ref_audio,
|
48 |
ref_text,
|
|
|
92 |
examples=[
|
93 |
[
|
94 |
"examples/pc-01.wav",
|
95 |
+
"có nghĩa là cảm xúc là vốn có, là tức thời, là bản năng, đối với một sự việc con người có những phản ứng hay cảm xúc khác nhau",
|
96 |
"Bà Lê Lan Chi, Tổng giám đốc Zalopay cho biết ứng dụng đã có một năm nhiều dấu ấn khi đồng hành với hàng triệu người dùng",
|
97 |
1.0,
|
98 |
],
|
99 |
[
|
100 |
"examples/pc-02.wav",
|
101 |
+
"sông Đồng Nai là con sông nội địa dài nhất Việt Nam, lớn thứ nhì nam bộ về lưu vực chỉ sau sông Cửu long",
|
102 |
"Bạn đã nhận được thanh toán thành công số tiền ba mươi ngàn đồng",
|
103 |
1.0,
|
104 |
],
|