File size: 2,771 Bytes
e0a3506
 
 
a7a244e
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
e0a3506
a7a244e
 
 
e0ad04f
e0a3506
13aac28
 
 
 
d2ca438
 
 
13aac28
 
 
 
 
e0a3506
ecc051b
e0a3506
 
 
ecc051b
e0a3506
fce8789
 
d2ca438
a7a244e
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
4b03cbe
 
 
 
 
 
 
 
 
 
 
a7a244e
 
fce8789
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
from flask import Flask, render_template, request
from io import BytesIO
from client import client
import telebot
import logging
import os
import warnings
from client import client
from io import BytesIO
import pydub

warnings.simplefilter('ignore')
TOKEN = os.environ['TOKEN']

if not TOKEN:
    print('You must set the TOKEN environment variable')
    exit(1)

START_MSG = '''Вітання!
Цей бот створений для тестування перекладу українських аудіозаписів в текст.
Група для обговорення: https://t.me/speech_recognition_uk'''

FIRST_STEP = '''Використовувати бота просто: надішліть аудіоповідомлення і чекайте відповіді'''


bot = telebot.TeleBot(TOKEN, parse_mode=None, threaded=False)
app = Flask(__name__,)


@app.route('/')
def index():
    bot.remove_webhook()
    bot.set_webhook(
        url='https://voice-recognition-ua.herokuapp.com/' + TOKEN)
    return render_template('hello.html')


@app.route('/recognize', methods=["POST"])
def recognize():
    file = request.files['file']
    lang = request.form["lang"]
    audio = BytesIO()
    file.save(audio)
    audio.seek(0)
    result = client(audio, lang)
    return result


@app.route('/' + TOKEN, methods=['POST'])
def getMessage():
    bot.process_new_updates(
        [telebot.types.Update.de_json(request.stream.read().decode("utf-8"))])
    return "!", 200


@bot.message_handler(commands=['start', 'help'])
def send_welcome(message):
    bot.reply_to(message, START_MSG)
    bot.reply_to(message, FIRST_STEP)


@bot.message_handler(content_types=['voice'])
def process_voice_message(message):
    # download the recording
    file_info = bot.get_file(message.voice.file_id)
    downloaded_file = bot.download_file(file_info.file_path)
    # create in-memory representation of files
    source_audio = BytesIO()
    source_audio.write(downloaded_file)
    source_audio.seek(0)
    output_audio = BytesIO()
    ogg_file = pydub.AudioSegment.from_ogg(
        source_audio)

    # convert ogg to wav
    ogg_file.set_frame_rate(16000).set_channels(
        1).export(output_audio, "wav", codec="pcm_s16le")
    output_audio.seek(0)

    # do the recognition
    # get the recognized text
    try:
        text = client(output_audio)
        # no results
        if not text:
            bot.reply_to(message, 'Я не зміг розпізнати 😢')
        else:
            # send the recognized text
            bot.reply_to(message, text)
    except Exception as e:
        logging.log(logging.ERROR, str(e))
        bot.reply_to(message, 'Трапилась помилка 😢')


if __name__ == '__main__':
    app.run(host='0.0.0.0')