ELEVENLAB / app.py
mr-don88's picture
Update app.py
52df24f verified
# secure_tts_app_huggingface.py
# -*- coding: utf-8 -*-
import sys, os, re, time, random, json, base64, hashlib
import requests
import warnings
from typing import List, Dict, Optional, Tuple
import concurrent.futures
import urllib3
import gradio as gr
import tempfile
import shutil
from pathlib import Path
import asyncio
import aiohttp
from dataclasses import dataclass
import threading
import queue
import logging
warnings.filterwarnings("ignore")
urllib3.disable_warnings(urllib3.exceptions.InsecureRequestWarning)
# ==================== CẤU HÌNH LOGGING ====================
logging.basicConfig(level=logging.INFO)
logger = logging.getLogger(__name__)
# ==================== HÀM ẨN THÔNG TIN MÁY TÍNH ====================
class PrivacyProtector:
"""Lớp bảo vệ quyền riêng tư và ẩn thông tin máy tính"""
@staticmethod
def get_random_user_agent() -> str:
"""Tạo User-Agent ngẫu nhiên"""
browsers = [
"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36",
"Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:121.0) Gecko/20100101 Firefox/121.0",
"Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/17.0 Safari/605.1.15",
"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/119.0.0.0 Safari/537.36 Edg/119.0.0.0",
"Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36"
]
return random.choice(browsers)
@staticmethod
def get_obfuscated_headers(api_key: str) -> Dict:
"""Tạo headers với thông tin bị ẩn"""
return {
"xi-api-key": api_key,
"Content-Type": "application/json",
"User-Agent": PrivacyProtector.get_random_user_agent(),
"Accept": "application/json",
"Accept-Language": "en-US,en;q=0.9",
"Accept-Encoding": "gzip, deflate, br",
"Connection": "keep-alive",
"Cache-Control": "no-cache",
"Pragma": "no-cache",
"Sec-Fetch-Dest": "empty",
"Sec-Fetch-Mode": "cors",
"Sec-Fetch-Site": "cross-site",
"DNT": "1",
"Sec-GPC": "1"
}
# ==================== HÀM KIỂM TRA API KEY NÂNG CAO ====================
def check_api_key_advanced(api_key: str, timeout=15) -> Dict:
"""Kiểm tra API key với retry mechanism và xử lý lỗi chi tiết"""
max_retries = 2
for attempt in range(max_retries + 1):
try:
# Tạo session
session = requests.Session()
session.timeout = timeout
# Headers
headers = {
"xi-api-key": api_key,
"Content-Type": "application/json",
"User-Agent": PrivacyProtector.get_random_user_agent(),
"Accept": "application/json"
}
# Độ trễ ngẫu nhiên
time.sleep(random.uniform(1, 3))
# Gửi request
response = session.get(
"https://api.elevenlabs.io/v1/user",
headers=headers,
timeout=timeout,
verify=False
)
# Xử lý response
if response.status_code == 200:
data = response.json()
subscription = data.get("subscription", {})
character_limit = subscription.get("character_limit", 0)
character_count = subscription.get("character_count", 0)
remaining = max(0, character_limit - character_count)
return {
"valid": True,
"remaining": remaining,
"total": character_limit,
"used": character_count,
"tier": subscription.get("tier", "free"),
"is_fresh": remaining >= 1000,
"attempt": attempt + 1
}
elif response.status_code == 401:
return {
"valid": False,
"error": "Invalid API key (Unauthorized)",
"status_code": 401
}
elif response.status_code == 429:
if attempt < max_retries:
wait_time = 5 * (attempt + 1)
time.sleep(wait_time)
continue
return {
"valid": False,
"error": "Rate limited",
"status_code": 429
}
else:
return {
"valid": False,
"error": f"HTTP Error {response.status_code}",
"status_code": response.status_code
}
except requests.exceptions.Timeout:
if attempt < max_retries:
time.sleep(3)
continue
return {
"valid": False,
"error": "Connection timeout",
"status": "timeout"
}
except requests.exceptions.ConnectionError:
if attempt < max_retries:
time.sleep(3)
continue
return {
"valid": False,
"error": "Connection failed",
"status": "connection_error"
}
except Exception as e:
if attempt < max_retries:
time.sleep(3)
continue
return {
"valid": False,
"error": f"Unexpected error: {str(e)}",
"status": "error"
}
return {
"valid": False,
"error": "Max retries exceeded",
"status": "max_retries"
}
# ==================== HÀM TẠO VOICE NÂNG CAO ====================
def generate_voice_advanced(text: str, api_key: str, voice_id: str, model_id: str,
stability=0.7, similarity=0.8, style=0.0, speed=0.75,
speaker_boost=True) -> Optional[bytes]:
"""Tạo giọng nói với retry mechanism nâng cao"""
max_retries = 3
url = f"https://api.elevenlabs.io/v1/text-to-speech/{voice_id}"
payload = {
"text": text,
"model_id": model_id,
"voice_settings": {
"stability": stability,
"similarity_boost": similarity,
"style": style,
"speed": speed,
"use_speaker_boost": speaker_boost
}
}
for attempt in range(max_retries + 1):
try:
# Tạo session mới mỗi lần retry
session = requests.Session()
session.timeout = 45
# Headers
headers = {
"xi-api-key": api_key,
"Content-Type": "application/json",
"User-Agent": PrivacyProtector.get_random_user_agent(),
"Accept": "audio/mpeg"
}
# Độ trễ trước khi request
delay = random.uniform(2, 5) if attempt == 0 else random.uniform(10, 20)
time.sleep(delay)
# Gửi request
response = session.post(
url,
headers=headers,
json=payload,
timeout=45,
verify=False
)
# Xử lý response
if response.status_code == 200:
audio_content = response.content
# Kiểm tra kích thước file
if len(audio_content) > 2048: # File hợp lệ phải > 2KB
return audio_content
else:
# File quá nhỏ, có thể bị chặn
logger.warning(f"Audio too small: {len(audio_content)} bytes")
if attempt < max_retries:
time.sleep(10)
continue
elif response.status_code == 429:
# Rate limit
wait_time = 30 + (attempt * 10)
logger.warning(f"Rate limited, waiting {wait_time}s...")
time.sleep(wait_time)
continue
elif response.status_code == 403:
# Bị chặn
logger.warning(f"Blocked (403)")
if attempt < max_retries:
time.sleep(15)
continue
else:
logger.warning(f"Error {response.status_code}: {response.text[:100]}")
if attempt < max_retries:
time.sleep(10)
continue
except requests.exceptions.Timeout:
logger.warning(f"Timeout on attempt {attempt + 1}")
if attempt < max_retries:
time.sleep(10)
continue
except requests.exceptions.ConnectionError:
logger.warning(f"Connection error")
if attempt < max_retries:
time.sleep(10)
continue
except Exception as e:
logger.error(f"Error: {str(e)}")
if attempt < max_retries:
time.sleep(10)
continue
logger.error(f"All attempts failed for text: {text[:50]}...")
return None
# ==================== XỬ LÝ VĂN BẢN ====================
def parse_text_blocks(raw_text, max_length=250):
"""Phân chia văn bản thành các block"""
blocks = []
sentences = re.split(r'(?<=[.!?])\s+', raw_text)
current_block = ""
for sentence in sentences:
if len(current_block) + len(sentence) <= max_length:
current_block += " " + sentence if current_block else sentence
else:
if current_block:
blocks.append(current_block.strip())
current_block = sentence
if current_block:
blocks.append(current_block.strip())
return blocks
def estimate_credit(text):
"""Ước tính credit cần thiết"""
return len(text) + 50
# ==================== QUẢN LÝ TÁC VỤ BẤT ĐỒNG BỘ ====================
@dataclass
class TTSRequest:
text: str
api_key: str
voice_id: str
model_id: str
settings: dict
file_index: int
output_dir: str
format: str
class TTSWorker:
def __init__(self):
self.task_queue = queue.Queue()
self.results = {}
self.is_running = False
self.worker_thread = None
def start(self):
self.is_running = True
self.worker_thread = threading.Thread(target=self._process_queue)
self.worker_thread.daemon = True
self.worker_thread.start()
def stop(self):
self.is_running = False
if self.worker_thread:
self.worker_thread.join(timeout=5)
def add_task(self, request: TTSRequest):
self.task_queue.put(request)
def _process_queue(self):
while self.is_running:
try:
request = self.task_queue.get(timeout=1)
try:
audio = generate_voice_advanced(
request.text,
request.api_key,
request.voice_id,
request.model_id,
**request.settings
)
if audio:
filename = os.path.join(request.output_dir, f"voice_{request.file_index:03d}.{request.format}")
with open(filename, "wb") as f:
f.write(audio)
self.results[request.file_index] = filename
else:
self.results[request.file_index] = None
except Exception as e:
logger.error(f"Error processing task {request.file_index}: {str(e)}")
self.results[request.file_index] = None
finally:
self.task_queue.task_done()
except queue.Empty:
continue
def wait_completion(self, timeout=None):
self.task_queue.join()
return self.results
# ==================== GIAO DIỆN GRADIO ====================
class SecureTTSApp:
def __init__(self):
self.output_dir = tempfile.mkdtemp(prefix="tts_output_")
self.tts_worker = TTSWorker()
self.tts_worker.start()
def cleanup(self):
"""Dọn dẹp thư mục tạm"""
self.tts_worker.stop()
try:
shutil.rmtree(self.output_dir)
except:
pass
def create_interface(self):
with gr.Blocks(title="🎤 ElevenLabs TTS Pro - Secure Edition", theme=gr.themes.Soft()) as demo:
gr.Markdown("# 🎤 ElevenLabs TTS Pro - Secure Edition")
gr.Markdown("Chuyển văn bản thành giọng nói với bảo mật nâng cao")
with gr.Tabs():
# Tab 1: Cấu hình chính
with gr.Tab("⚙️ Cấu hình"):
with gr.Row():
with gr.Column(scale=2):
api_keys = gr.Textbox(
label="🔑 API Keys",
placeholder="Nhập API keys (mỗi key một dòng)\nsk_xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx",
lines=4,
info="Có thể nhập nhiều API keys để tự động chuyển đổi"
)
voice_id = gr.Textbox(
label="🎤 Voice ID",
placeholder="21m00Tcm4TlvDq8ikWAM",
value="21m00Tcm4TlvDq8ikWAM"
)
with gr.Row():
model_id = gr.Dropdown(
label="🤖 Model",
choices=["eleven_multilingual_v2", "eleven_turbo_v2", "eleven_monolingual_v1"],
value="eleven_multilingual_v2"
)
output_format = gr.Dropdown(
label="📁 Format",
choices=["mp3", "wav"],
value="mp3"
)
with gr.Column(scale=1):
gr.Markdown("### Voice Parameters")
stability = gr.Slider(
label="Stability",
minimum=0.0,
maximum=1.0,
value=0.7,
step=0.01
)
similarity = gr.Slider(
label="Similarity Boost",
minimum=0.0,
maximum=1.0,
value=0.8,
step=0.01
)
speed = gr.Slider(
label="Speed",
minimum=0.5,
maximum=1.5,
value=1.0,
step=0.05
)
speaker_boost = gr.Checkbox(
label="Speaker Boost",
value=True
)
# Tab 2: Nhập văn bản
with gr.Tab("📝 Văn bản"):
text_input = gr.Textbox(
label="Văn bản cần chuyển thành giọng nói",
placeholder="Nhập văn bản tại đây...",
lines=10
)
with gr.Row():
text_stats = gr.Markdown("**Thống kê:** 0 ký tự | 0 đoạn | Ước tính: 0 credits")
with gr.Row():
gr.Examples(
examples=[
["Xin chào! Đây là ví dụ về giọng nói được tạo bởi ElevenLabs."],
["Tôi yêu công nghệ và đang tạo ra những sản phẩm tuyệt vời với trí tuệ nhân tạo."],
["Đây là một đoạn văn bản dài hơn để kiểm tra khả năng xử lý của hệ thống."]
],
inputs=text_input,
label="Ví dụ"
)
# Tab 3: Kiểm tra API
with gr.Tab("🔍 Kiểm tra API"):
check_api_btn = gr.Button("Kiểm tra API Keys", variant="primary")
api_status = gr.JSON(label="Kết quả kiểm tra")
@check_api_btn.click(inputs=[api_keys], outputs=[api_status])
def check_api(keys):
if not keys.strip():
return {"error": "Vui lòng nhập API keys"}
keys_list = [k.strip() for k in keys.splitlines() if k.strip()]
results = []
for i, key in enumerate(keys_list[:5]): # Giới hạn 5 keys
info = check_api_key_advanced(key)
results.append({
"key": f"Key {i+1}",
"valid": info.get("valid", False),
"remaining": info.get("remaining", 0),
"error": info.get("error", ""),
"tier": info.get("tier", "unknown")
})
return {"total_keys": len(keys_list), "checked": len(results), "results": results}
# Tab 4: Output
with gr.Tab("📊 Output"):
with gr.Row():
with gr.Column():
progress_bar = gr.Progress(label="Tiến trình")
status_output = gr.Textbox(label="Trạng thái", lines=3)
start_btn = gr.Button(
"🚀 Bắt đầu tạo giọng nói",
variant="primary",
scale=1
)
stop_btn = gr.Button("⏹️ Dừng", variant="stop", scale=1)
with gr.Column():
audio_output = gr.Audio(label="Âm thanh đã tạo")
download_btn = gr.File(label="Tải file")
with gr.Row():
gr.Markdown("### Logs")
log_output = gr.Textbox(label="Logs", lines=10, interactive=False)
# Xử lý sự kiện nhập văn bản
def update_text_stats(text):
if not text.strip():
return "**Thống kê:** 0 ký tự | 0 đoạn | Ước tính: 0 credits"
char_count = len(text)
blocks = parse_text_blocks(text)
block_count = len(blocks)
credit_estimate = char_count + (block_count * 50)
return f"**Thống kê:** {char_count:,} ký tự | {block_count} đoạn | Ước tính: {credit_estimate:,} credits"
text_input.change(
fn=update_text_stats,
inputs=[text_input],
outputs=[text_stats]
)
# Xử lý nút bắt đầu
def start_tts_generation(api_keys_text, voice_id_text, model, format,
stability_val, similarity_val, speed_val,
speaker_boost_val, text):
# Kiểm tra đầu vào
if not api_keys_text.strip():
yield "❌ Vui lòng nhập API keys", None, None, ""
return
if not voice_id_text.strip():
yield "❌ Vui lòng nhập Voice ID", None, None, ""
return
if not text.strip():
yield "❌ Vui lòng nhập văn bản", None, None, ""
return
# Parse API keys
api_keys_list = [k.strip() for k in api_keys_text.splitlines() if k.strip()]
# Parse văn bản
text_blocks = parse_text_blocks(text)
# Cấu hình
settings = {
"stability": stability_val,
"similarity": similarity_val,
"style": 0.0,
"speed": speed_val,
"speaker_boost": speaker_boost_val
}
# Tạo thư mục output
output_dir = tempfile.mkdtemp(dir=self.output_dir)
logs = []
logs.append("="*60)
logs.append("🚀 BẮT ĐẦU TẠO GIỌNG NÓI")
logs.append(f"🔑 API keys: {len(api_keys_list)}")
logs.append(f"🎤 Voice ID: {voice_id_text}")
logs.append(f"🤖 Model: {model}")
logs.append(f"📁 Format: {format}")
logs.append(f"📝 Số đoạn văn bản: {len(text_blocks)}")
logs.append("="*60)
yield "\n".join(logs), 0, None, ""
# Kiểm tra API keys
valid_keys = []
for i, key in enumerate(api_keys_list[:3], 1): # Giới hạn 3 keys
info = check_api_key_advanced(key)
if info.get("valid") and info.get("remaining", 0) > 100:
valid_keys.append({
"key": key,
"remaining": info.get("remaining", 0)
})
logs.append(f"✅ Key {i}: {info['remaining']:,} ký tự còn lại")
else:
logs.append(f"❌ Key {i}: {info.get('error', 'Invalid')}")
yield "\n".join(logs), 0, None, ""
time.sleep(1)
if not valid_keys:
logs.append("❌ Không có API key hợp lệ")
yield "\n".join(logs), 0, None, ""
return
logs.append(f"✅ Đã tìm thấy {len(valid_keys)} API keys hợp lệ")
yield "\n".join(logs), 0, None, ""
# Tạo âm thanh cho từng block
created_files = []
for i, text_block in enumerate(text_blocks, 1):
# Chọn API key theo round-robin
key_idx = (i - 1) % len(valid_keys)
key_info = valid_keys[key_idx]
logs.append(f"🎤 Đang tạo block {i}/{len(text_blocks)}...")
yield "\n".join(logs), i/len(text_blocks), None, ""
# Tạo request
request = TTSRequest(
text=text_block,
api_key=key_info["key"],
voice_id=voice_id_text,
model_id=model,
settings=settings,
file_index=i,
output_dir=output_dir,
format=format
)
self.tts_worker.add_task(request)
# Đợi hoàn thành
results = self.tts_worker.wait_completion(timeout=300)
# Lấy danh sách file đã tạo
created_files = [results[i] for i in range(1, len(text_blocks) + 1) if results.get(i)]
if len(created_files) == len(text_blocks):
logs.append("✅ Đã tạo tất cả các block")
# Nếu chỉ có 1 file, trả về luôn
if len(created_files) == 1:
audio_file = created_files[0]
logs.append(f"🎉 Hoàn thành! File: {os.path.basename(audio_file)}")
yield "\n".join(logs), 1.0, audio_file, audio_file
else:
# Merge các file nếu có nhiều block
logs.append("🔗 Đang merge các file...")
yield "\n".join(logs), 0.9, None, ""
# Tạo file tổng hợp (đơn giản: chỉ trả về file đầu tiên cho demo)
audio_file = created_files[0] if created_files else None
logs.append(f"🎉 Hoàn thành! Đã tạo {len(created_files)} files")
yield "\n".join(logs), 1.0, audio_file, audio_file
else:
created_count = len([f for f in created_files if f])
logs.append(f"⚠️ Đã tạo {created_count}/{len(text_blocks)} blocks")
if created_files:
audio_file = created_files[0]
yield "\n".join(logs), created_count/len(text_blocks), audio_file, audio_file
else:
logs.append("❌ Không thể tạo bất kỳ file nào")
yield "\n".join(logs), 0, None, ""
# Kết nối các nút
start_btn.click(
fn=start_tts_generation,
inputs=[
api_keys, voice_id, model_id, output_format,
stability, similarity, speed, speaker_boost, text_input
],
outputs=[status_output, progress_bar, audio_output, download_btn]
)
# Xử lý nút dừng
def stop_generation():
self.tts_worker.stop()
self.tts_worker = TTSWorker()
self.tts_worker.start()
return "⏹️ Đã dừng quá trình xử lý"
stop_btn.click(
fn=stop_generation,
outputs=[status_output]
)
# Xử lý khi đóng
demo.load(
fn=lambda: f"Ứng dụng đã sẵn sàng. Thư mục output: {self.output_dir}",
outputs=[status_output]
)
return demo
# ==================== MAIN ====================
def main():
app = SecureTTSApp()
try:
demo = app.create_interface()
demo.launch(
server_name="0.0.0.0",
server_port=7860,
share=False,
debug=False,
show_error=True
)
except KeyboardInterrupt:
print("\nĐang dọn dẹp...")
finally:
app.cleanup()
if __name__ == "__main__":
main()