vits-simple-api5

Sleeping

App Files Files Community

vits-simple-api5 / templates /index.html

Artrajz

Upload 44 files

d94ccbe 12 months ago

raw

history blame

No virus

19.6 kB

	<!DOCTYPE html>
	<html lang="en">
	<head>
	<meta charset="UTF-8"/>
	<meta name="viewport" content="width=device-width, initial-scale=1.0"/>
	<title>vits-simple-api</title>
	<link rel="stylesheet" href="/static/css/style.css">
	<link rel="stylesheet" href="/static/css/bootstrap.min.css"/>
	</head>
	<body>
	<main class="main-container">
	<div class="container flex flex-wrap mx-auto">
	<div class="text-center d-flex align-items-center w-100" style="height: 100px;" id="component-1">
	<h1 class="w-100">
	<a href="https://github.com/Artrajz/vits-simple-api" target="_blank"
	style="text-decoration: none; color: black"> vits-simple-api </a>
	</h1>
	</div>


	<div class="tabs w-100 border-b-2" id="component-2">
	<button class="tab-button px-4 pb-2 pt-2 active " onclick="showContent(0)">VITS</button>
	<button class="tab-button px-4 pb-2 pt-2" onclick="showContent(1)">W2V2-VITS</button>
	</div>

	<div class="content w-100 border-lr-2 border-b-2" id="component-3">
	<div class="content-pane active w-100 flex-wrap">
	<form class="w-100">
	<div class="form-group">
	<label>text</label>
	<textarea class="form-control" id="inputText1" rows="3"
	oninput="updateLink()">你好,こんにちは</textarea>
	</div>
	<div class="form-group">
	<label>id</label>
	<select class="form-control" id="inputId1" oninput="updateLink()">
	{% for speaker in speakers["VITS"] %}
	{% if speaker["name"] == "雷电将军（雷神）" %}
	<option value="{{ speaker["id"] }}" selected>{{ speaker["id"] }} \| {{ speaker["name"] }}
	\| {{ speaker["lang"] }}</option>
	{% else %}
	<option value="{{ speaker["id"] }}">{{ speaker["id"] }} \| {{ speaker["name"] }}
	\| {{ speaker["lang"] }}</option>
	{% endif %}
	{% endfor %}
	</select>
	</div>
	</form>
	<form class="w-100">
	<div class="row">
	<div class="col-md-4 form-group">
	<label data-toggle="tooltip" data-placement="top"
	title="默认为wav">format</label>
	<select class="form-control" id="inputFormat1" oninput="updateLink()">
	<option></option>
	<option>wav</option>
	<option>mp3</option>
	<option>ogg</option>
	<option>silk</option>
	</select>
	</div>
	<div class="col-md-4 form-group">
	<label data-toggle="tooltip" data-placement="top"
	title="自动识别语言auto：可识别的语言根据不同speaker而不同，方言无法自动识别。方言模型需要手动指定语言，比如粤语Cantonese要指定参数lang=gd">lang</label>
	<input type="text" class="form-control" id="inputLang1" oninput="updateLink()" value=""
	placeholder="auto"/>
	</div>
	<div class="col-md-4 form-group">
	<label data-toggle="tooltip" data-placement="top"
	title="调节语音长度，相当于调节语速，该数值越大语速越慢。">length</label>
	<input type="number" class="form-control" id="inputLength1" oninput="updateLink()" value=""
	placeholder="1" min="0" step="0.001"/>
	</div>
	</div>
	<div class="row">
	<div class="col-md-4 form-group">
	<label data-toggle="tooltip" data-placement="top"
	title="样本噪声，控制合成的随机性。">noise</label>
	<input type="number" class="form-control" id="inputNoise1" oninput="updateLink()" value=""
	placeholder="0.33" min="0" step="0.001"/>
	</div>
	<div class="col-md-4 form-group">
	<label data-toggle="tooltip" data-placement="top"
	title="随机时长预测器噪声，控制音素发音长度。">noisew</label>
	<input type="number" class="form-control" id="inputNoisew1" oninput="updateLink()" value=""
	placeholder="0.4" min="0" step="0.001"/>
	</div>
	<div class="col-md-4 form-group">
	<label data-toggle="tooltip" data-placement="top"
	title="按标点符号分段，加起来大于max时为一段文本。max<=0表示不分段。">max</label>
	<input type="number" class="form-control" id="inputMax1" oninput="updateLink()" value=""
	placeholder="50" step="1"/>
	</div>
	</div>
	</form>


	<div class="flex flex-wrap w-100"
	style="justify-content: center; align-items: center; height: 80px; margin-top: 20px; margin-bottom: 20px; border: 1px solid rgba(0,0,0,.125); border-radius: 0.25rem;">
	<button type="button" class="btn btn-outline-secondary" onclick="setAudioSource()"
	style="margin-right: 10px">
	播放器生成
	</button>
	<audio id="audioPlayer1" controls>
	<source src="" type="audio/mp3"/>
	Your browser does not support the audio element.
	</audio>
	<div class="form-group form-check">
	<input type="checkbox" id="streaming1" onchange="updateLink()">
	<label class="form-check-label" data-toggle="tooltip" data-placement="top"
	title="按照max分段推理文本，推理好一段即输出，无需等待所有文本都推理完毕">流式响应</label>
	</div>
	</div>
	</div>
	<div class="content-pane">
	<form class="w-100">
	<div class="form-group">
	<label>text</label>
	<textarea class="form-control" id="inputText2" rows="3"
	oninput="updateLink()">你好,こんにちは</textarea>
	</div>
	<div class="form-group">
	<label>id</label>
	<select class="form-control" id="inputId2" oninput="updateLink()">
	{% for speaker in speakers["W2V2-VITS"] %}
	<option value="{{ speaker["id"] }}">{{ speaker["id"] }} \| {{ speaker["name"] }}
	\| {{ speaker["lang"] }}</option>
	{% endfor %}
	</select>
	</div>
	<div class="form-group mb-3">
	<label data-toggle="tooltip" data-placement="top"
	title="情感嵌入，{% if w2v2_emotion_count > 0 %}
	可输入范围是0-{{ w2v2_emotion_count-1 }}
	{% else %}
	未加载emotion
	{% endif %}">emotion</label>
	<input type="number" class="form-control" min="0" max="{{ w2v2_emotion_count-1 }}" step="1"
	id="emotion" value="0" oninput="updateLink()">
	</div>
	</form>


	<form class="w-100">
	<div class="row">
	<div class="col-md-4 form-group">
	<label data-toggle="tooltip" data-placement="top"
	title="默认为wav">format</label>
	<select class="form-control" id="inputFormat2" oninput="updateLink()">
	<option></option>
	<option>wav</option>
	<option>mp3</option>
	<option>ogg</option>
	<option>silk</option>
	</select>
	</div>
	<div class="col-md-4 form-group">
	<label data-toggle="tooltip" data-placement="top"
	title="自动识别语言auto：可识别的语言根据不同speaker而不同，方言无法自动识别。方言模型需要手动指定语言，比如粤语Cantonese要指定参数lang=gd">lang</label>
	<input type="text" class="form-control" id="inputLang2" oninput="updateLink()" value=""
	placeholder="auto"/>
	</div>
	<div class="col-md-4 form-group">
	<label data-toggle="tooltip" data-placement="top"
	title="调节语音长度，相当于调节语速，该数值越大语速越慢。">length</label>
	<input type="number" class="form-control" id="inputLength2" oninput="updateLink()" value=""
	placeholder="1" min="0" step="0.001"/>
	</div>
	</div>
	<div class="row">
	<div class="col-md-4 form-group">
	<label data-toggle="tooltip" data-placement="top"
	title="样本噪声，控制合成的随机性。">noise</label>
	<input type="number" class="form-control" id="inputNoise2" oninput="updateLink()" value=""
	placeholder="0.33" min="0" step="0.001"/>
	</div>
	<div class="col-md-4 form-group">
	<label data-toggle="tooltip" data-placement="top"
	title="随机时长预测器噪声，控制音素发音长度。">noisew</label>
	<input type="number" class="form-control" id="inputNoisew2" oninput="updateLink()" value=""
	placeholder="0.4" min="0" step="0.001"/>
	</div>
	<div class="col-md-4 form-group">
	<label data-toggle="tooltip" data-placement="top"
	title="按标点符号分段，加起来大于max时为一段文本。max<=0表示不分段。">max</label>
	<input type="number" class="form-control" id="inputMax2" oninput="updateLink()" value=""
	placeholder="50" step="1"/>
	</div>
	</div>
	</form>

	<div class="flex flex-wrap w-100"
	style="justify-content: center; align-items: center; height: 80px; margin-top: 20px; margin-bottom: 20px; border: 1px solid rgba(0,0,0,.125); border-radius: 0.25rem;">
	<button type="button" class="btn btn-outline-secondary" onclick="setAudioSource()"
	style="margin-right: 10px">
	播放器生成
	</button>
	<audio id="audioPlayer2" controls>
	<source src="" type="audio/mp3"/>
	Your browser does not support the audio element.
	</audio>
	<div class="form-group form-check">
	<input type="checkbox" id="streaming2" onchange="updateLink()">
	<label class="form-check-label">流式响应</label>
	</div>
	</div>
	</div>
	</div>

	<div class="mt-2">
	{% if speakers_count == 0 %}
	<div style="color: red;">未加载任何模型</div>
	{% endif %}
	<div>
	<label>返回speakers(json)：</label>
	<a id="speakersLink" href="https://artrajz-vits-simple-api.hf.space/voice/speakers" target="_blank"
	style="text-decoration: none; color: black">
	https://artrajz-vits-simple-api.hf.space/voice/speakers
	</a>
	</div>
	<div>
	<label>API调用：</label>
	<a id="vitsLink" href="https://artrajz-vits-simple-api.hf.space/voice/vits?text=你好,こんにちは&id=164"
	style="text-decoration: none; color: black">
	https://artrajz-vits-simple-api.hf.space/voice/vits?text=你好,こんにちは&id=164
	</a>
	</div>
	</div>
	<h2>所有模型均为网络搜集，感谢模型原作者的付出！</h2>
	<h2>请严格遵循模型原作者使用协议！</h2>
	<p>
	Nene_Nanami_Rong_Tang:
	<a href="https://github.com/CjangCjengh/TTSModels" rel="noreferrer" target="_blank">CjangCjengh/TTSModels</a>
	</p>
	<p>
	louise:
	<a href="https://github.com/CjangCjengh/TTSModels" rel="noreferrer" target="_blank">CjangCjengh/TTSModels</a>
	</p>
	<p>
	Cantonese:
	<a href="https://github.com/CjangCjengh/TTSModels" rel="noreferrer" target="_blank">CjangCjengh/TTSModels</a>
	</p>
	<p>
	shanghainese:
	<a href="https://github.com/CjangCjengh/TTSModels" rel="noreferrer" target="_blank">CjangCjengh/TTSModels</a>
	</p>
	<p>
	w2v2-vits:
	<a href="https://github.com/CjangCjengh/TTSModels" rel="noreferrer" target="_blank">CjangCjengh/TTSModels</a>
	</p>
	<p>
	vctk:
	<a href="https://github.com/jaywalnut310/vits" rel="noreferrer" target="_blank">jaywalnut310/vits</a>
	</p>
	<p>
	Bishojo Mangekyo:
	<a href="https://github.com/Francis-Komizu/VITS" rel="noreferrer" target="_blank">Francis-Komizu/VITS</a>
	</p>
	<p>
	genshin:
	<a href="https://huggingface.co/spaces/zomehwh/vits-uma-genshin-honkai" rel="noreferrer" target="_blank">zomehwh/vits-uma-genshin-honkai</a>
	</p>
	<p>
	paimon:
	<a href="https://github.com/zixiiu/Digital_Life_Server" rel="noreferrer" target="_blank">zixiiu/Digital_Life_Server</a>
	</p>
	<p>
	vits_chinese:
	<a href="https://github.com/PlayVoice/vits_chinese" rel="noreferrer" target="_blank">PlayVoice/vits_chinese</a>
	</p>
	</div>
	<br/>

	</main>

	<script src="/static/js/jquery.slim.min.js"></script>
	<script src="/static/js/bootstrap.bundle.min.js"></script>

	<script>
	$(function () {
	$('[data-toggle="tooltip"]').tooltip()
	})

	function getProtocol() {
	return 'https:' == location.protocol ? "https://" : "http://";
	}

	function getUrl() {
	var url = window.location.host;
	return url;
	}

	var baseUrl = getProtocol() + getUrl();
	var modelType = 1;
	var vitsStatus = false;
	var w2v2Status = false;
	{% if vits_speakers_count > 0 %}
	vitsStatus = true;
	{% endif %}
	{% if w2v2_speakers_count > 0 %}
	w2v2Status = true;
	{% endif %}

	setBaseUrl();

	function setBaseUrl() {
	var text = document.getElementById("inputText" + modelType).value;
	var id = document.getElementById("inputId" + modelType).value;

	var vitsLink = document.getElementById("vitsLink");
	var speakersLink = document.getElementById("speakersLink");

	var vitsUrl = baseUrl + "/voice/vits?text=" + text + "&id=" + id;
	var speakersUrl = baseUrl + "/voice/speakers";

	vitsLink.href = vitsUrl;
	vitsLink.textContent = vitsUrl;

	speakersLink.href = speakersUrl;
	speakersLink.textContent = speakersUrl;
	}

	function getLink() {
	var text = document.getElementById("inputText" + modelType).value;
	var id = document.getElementById("inputId" + modelType).value;
	var format = document.getElementById("inputFormat" + modelType).value;
	var lang = document.getElementById("inputLang" + modelType).value;
	var length = document.getElementById("inputLength" + modelType).value;
	var noise = document.getElementById("inputNoise" + modelType).value;
	var noisew = document.getElementById("inputNoisew" + modelType).value;
	var max = document.getElementById("inputMax" + modelType).value;
	var streaming = document.getElementById('streaming' + modelType);

	if (modelType == 1) {
	var url = baseUrl + "/voice/vits?text=" + text + "&id=" + id;
	} else if (modelType == 2) {
	var emotion = document.getElementById('emotion').value;
	var url = baseUrl + "/voice/w2v2-vits?text=" + text + "&id=" + id + "&emotion=" + emotion;
	}
	if (format != "") {
	url += "&format=" + format;
	}
	if (lang != "") {
	url += "&lang=" + lang;
	}
	if (length != "") {
	url += "&length=" + length;
	}
	if (noise != "") {
	url += "&noise=" + noise;
	}
	if (noisew != "") {
	url += "&noisew=" + noisew;
	}
	if (max != "") {
	url += "&max=" + max;
	}

	if (streaming.checked) {
	url += '&streaming=true';
	}
	return url;
	}

	function updateLink() {
	var url = getLink();
	var link = document.getElementById("vitsLink");
	link.href = url;
	link.textContent = url;
	}

	function setAudioSource() {
	if (modelType==1 && !vitsStatus){
	alert("未加载VITS模型");
	return;
	}
	if (modelType==2 && !w2v2Status){
	alert("未加载W2V2-VITS模型");
	return;
	}
	var url = getLink();
	var audioPlayer = document.getElementById("audioPlayer" + modelType);
	audioPlayer.src = url;
	audioPlayer.play();
	}

	function showContent(index) {
	const panes = document.querySelectorAll(".content-pane");
	const buttons = document.querySelectorAll(".tab-button");
	modelType = index + 1;

	for (let i = 0; i < panes.length; i++) {
	if (i === index) {
	panes[i].classList.add("active");
	buttons[i].classList.add("active");

	} else {
	panes[i].classList.remove("active");
	buttons[i].classList.remove("active");
	}
	}
	updateLink();
	}
	</script>
	</body>
	</html>