'
return f'{keyword_mapeo[keyword]} {nombre_var} {condicional_mapeo[palabra_condicional]} {valor}:'+'
' +' '* indentacion+'|'
def crear_cadena(transcript):
"""
Toma el transcript de un enunciado que contiene una cadena y regresa el código en Python.
Para usarse cuando ya se sabe que transcript sólo es los límites de la cadena
Parametros
----------
transcript: str
La intruccion de voz en texto ya en minúsculas.
Regresa
---------
output: list(str)
antes_palabra:parte del transcript que va antes de las comillas
palabra: Cadena con el código en python de las comillas y lo que está adentro
despues_palabra:parte del transcript que va antes de las comillas
Ejemplo
--------
crear_cadena('ejecuta print con argumentos variable India producto cadena guion cadena')[1]
>> ['ejecuta print con argumentos variable India producto','"guion"','']
"""
try:
inicio,final=list(re.finditer(r"cadena (.+) cadena",transcript))[0].span()
except:
return ''
antes_palabra=transcript[:inicio].strip()
despues_palabra=transcript[final:].strip()
palabra=list(re.finditer(r"cadena (.+) cadena",transcript))[0].group(1)
return antes_palabra,f'"{palabra}"',despues_palabra
def crear_var_existente(transcript):
"""
Toma el transcript de un enunciado que contiene la mención de una variable
y devuelve dicha variable
Parametros
----------
transcript: str
La intruccion de voz en texto ya en minúsculas.
Regresa
---------
output: str
palabra: Cadena con el código en python del nombre de la variable
Ejemplo
--------
crear_var_existente('ejecuta print con argumentos variable india producto cadena guión cadena')
>> i
"""
try:
antes_var,var,desp_var=encontrar_palabras(transcript,['variable'])
except:
return ''
nombre_var=desp_var.split(' ')[0]
if diccionario_fonetico.get(nombre_var,False):
nombre_var=diccionario_fonetico[nombre_var]
return nombre_var
# TODO: Hay que ver:
# Si es otra operación hay que llamar la función recursivamente en cada pedazo
# 1. si es cadena
# 2. si es otra operación. Para esto, hay que regresar error o algo así cuando no se encuentre
def crear_operacion(transcript):
'''
Toma el transcript de una operación binaria y la traduce a código de Python.
Para traducir las variables que se usan en la operación binaria busca
si son cadenas o sólo menciones de variables usando las funciones
crear_cadena y crear_var_existente
Parametros
----------
transcript: str
La intruccion de voz en texto ya en minúsculas.
Regresa
---------
output: str
Cadena con el código en python
Ejemplo
--------
crear_operacion('variable India producto cadena guión cadena')
>> i*'-'
'''
global dict_operaciones
try:
antes_op,op,desp_op=encontrar_palabras(transcript,dict_operaciones.keys())
except:
return ''
# Buscamos la información en la cadena detrás del operador
cadena_izq=crear_var_existente(antes_op)
try:
cadena_izq+=f'{crear_cadena(antes_op)[1]}'
except:
cadena_izq+=''
if len(cadena_izq)==0:
nombre_var=antes_op.split(' ')[-1]
if dict_numeros.get(nombre_var,False):
nombre_var=dict_numeros[nombre_var]
cadena_izq+=str(nombre_var)
# Buscamos la información en la cadena después del operador
cadena_der=crear_var_existente(desp_op)
try:
cadena_der+=f'{crear_cadena(desp_op)[1]}'
except:
cadena_der+=''
if len(cadena_der)==0:
nombre_var=desp_op.split(' ')[0]
if dict_numeros.get(nombre_var,False):
nombre_var=dict_numeros[nombre_var]
if diccionario_fonetico.get(nombre_var,False):
nombre_var=diccionario_fonetico[nombre_var]
cadena_der+=str(nombre_var)
return f'{cadena_izq} {dict_operaciones[op]} {cadena_der}'
def crear_llamada(transcript):
"""
Toma el transcript de la llamada de una función y la convierte en código de Python
Hace uso de las funciones que detectan operaciones, variables y comillas
,para cada argumento de la función
Parametros
----------
transcript: str
La intruccion de voz en texto ya en minúsculas.
Regresa
---------
output: str
Cadena con el código en python
Ejemplo
--------
crear_llamada(ejecuta print con argumentos variable India producto cadena guión cadena
coma cadena hola cadena')
>> print(i*'-','hola')
"""
global bloque
global indentacion
bloque='llamada'
try:
antes_ej,ej,desp_ej=encontrar_palabras(transcript,['ejecuta'])
except:
return ''
funcion_nombre=desp_ej.split(' ')[0]
# Aquí tal vez valdría la pena tener un registro de las funciones previamente definidas para
# poder buscar en un directorio con Jaccard y no aproximar
antes_arg,keyword,desp_arg=encontrar_palabras(desp_ej,['argumentos','parametros'])
argumentos=desp_arg.split('coma')
lista_cadenas=[]
for arg in argumentos:
arg=arg.strip()
cadena_arg=''
# print('arg',arg)
# Caso cuando es operacion
cadena_op=crear_operacion(arg)
cadena_var=crear_var_existente(arg)
cadena_cadena=crear_cadena(arg)
if len(cadena_op)!=0:
lista_cadenas.append(cadena_op)
elif len(cadena_var)!=0:
lista_cadenas.append(cadena_var)
elif len(cadena_cadena)!=0:
lista_cadenas.append(cadena_cadena[1])
else:
nombre_var=arg
if dict_numeros.get(nombre_var,False):
nombre_var=str(dict_numeros[nombre_var])
lista_cadenas.append(nombre_var)
# Caso cuando es variable
cadena_final=','.join(lista_cadenas)
cadena=f'{funcion_nombre}({cadena_final})
'+' '*indentacion+'|'
return cadena
def crear_regresa(transcript):
antes_reg,reg,desp_reg=encontrar_palabras(transcript,['regresa'])
arg=desp_reg.strip()
cadena_arg=''
# Si es llamada
cadena_llamada=crear_llamada(arg)
# Caso cuando es operacion
cadena_op=crear_operacion(arg)
cadena_var=crear_var_existente(arg)
cadena_cadena=crear_cadena(arg)
cadena_final=''
if len(cadena_llamada)!=0:
cadena_final+=cadena_llamada[:-2]
elif len(cadena_op)!=0:
cadena_final+=cadena_op
elif len(cadena_var)!=0:
cadena_final+=cadena_var
elif len(cadena_cadena)!=0:
cadena_final+=cadena_cadena[1]
else:
nombre_var=arg
if dict_numeros.get(nombre_var,False):
nombre_var=str(dict_numeros[nombre_var])
cadena_final+=nombre_var
global indentacion
indentacion-=1
return f'return {cadena_final}
'+' '*indentacion+'|'
def crear_variable(instruccion):
"""
Estructura:
definir variable con nombre [nombre_variable] igual a /*objeto_basico* valor/
Parametros
----------
instrucion: str
La intruccion de voz en texto.
Regresa
---------
output: str
Codigo generado
recomendacion: str
Una sugerencia o fallo
Testing
-------
>>> definir variable con nombre india igual a numero uno
>>> definir variable con nombre i igual a numero 1 (int)
>>> definir variable con nombre i igual a flotante tres punto cinco (float)
>>> definir variable con nombre i igual a cadena hola (string)
>>> definir variable con nombre i igual a lista/dic (string)
"""
global indentacion
global bloque
bloque='variable'
# pivote que ayuda a definir el nombre de la variable
before_keyword, keyword, after_keyword = instruccion.partition('nombre')
after_keyword_list = after_keyword.strip().split(' ')
# [india igual a numero uno]
name_variable = after_keyword_list[0]
# Como sabemos que despues del nombre va seguido de "igual a"
tipo_dato = after_keyword_list[3]
#print(after_keyword_list[4:]) -> lista
valor = tipos_datos[tipo_dato](after_keyword_list[4:])
# Verificamos si es una palabra fonetica
if diccionario_fonetico.get(name_variable,False):
name_variable=diccionario_fonetico[name_variable]
codigo_generado = f'{name_variable} = {valor}
'+ ' ' * indentacion + '|'
return codigo_generado
def asignar_variable(instruccion):
"""
Asigna una variable (eg. indio = indio + 1)
Parametros
----------
instrucion: str
La intruccion de voz en texto.
Regresa
---------
output: str
Codigo generado (indio = indio + 1)
Testing
--------
>>>'asignar variable india con india suma uno',
>>>'asignar variable contador con contador menos uno',
>>>'asignar variable contador con alfa',
>>>'asignar variable india con india',
"""
global bloque
bloque = "asignar"
before_keyword, keyword, after_keyword = instruccion.partition('variable')
after_keyword_list = after_keyword.strip().split(' ')
name_variable = after_keyword_list[0]
start = after_keyword_list.index('con') + 1
operacion = after_keyword_list[start:]
if len(operacion) != 1:
operacion_str = crear_operacion(keyword + ' ' + ' '.join(operacion))
else:
operacion_str = operacion[0]
# Verificamos si es una palabra fonetica para lado derecho de la
# asignacion
if diccionario_fonetico.get(operacion_str,False):
operacion_str=diccionario_fonetico[operacion_str]
# Verificamos si es una palabra fonetica
if diccionario_fonetico.get(name_variable,False):
name_variable=diccionario_fonetico[name_variable]
codigo_generado = f'{name_variable} = {operacion_str}
'+ ' ' * indentacion + '|'
return codigo_generado
def crear_for(instruccion):
"""
Crea el template de la estructura de un ciclo for.
Parámetros
----------
instrucción: str
La intrucción de voz en texto.
Regresa
---------
output: str
Estructura del ciclo for
recomendacion: str
Una sugerencia o error
"""
global bloque
global indentacion
global recomendacion
bloque='for'
vocabulario_basico = ['iteracion', 'rango']
# verificamos si la frase cumple los requisitos
instruccion_tokens = instruccion.strip().split(' ')
for i in vocabulario_basico:
try:
instruccion_tokens.index(i)
except:
recomendacion = 'Parece que quieres una iteración pero no reconozco tus comandos, inténtalo de nuevo'
return f'', recomendacion
# guarda los avisos o recomendaciones que el programa te hace
recomendacion = ''
# guarda la línea de código
output = ''
# pivote que ayuda a definir el rango e iterador
before_keyword, keyword, after_keyword = instruccion.partition('iteracion')
if after_keyword.strip().split(' ')[1] in diccionario_fonetico:
iterador = diccionario_fonetico[after_keyword.strip().split(' ')[1]]
else:
iterador = after_keyword.strip().split(' ')[1]
before_keyword, keyword, after_keyword = instruccion.partition('rango')
limites = []
for i, item in enumerate(after_keyword.strip().split(' ')):
try:
limites.append(dict_numeros[item])
except:
continue
if len(limites) == 0:
for i, item in enumerate(after_keyword.strip().split(' ')):
try:
limites.append(diccionario_fonetico[item])
except:
continue
indentacion += 1
if len(limites) == 0:
return f''
elif len(limites) == 1:
return f'for {iterador} in range({limites[-1]}):
' + ' ' * indentacion + '|'
elif len(limites) == 2:
return f'for {iterador} in range({limites[0]}, {limites[1]}):
' + ' ' * indentacion + '|'
elif len(limites) >= 2:
recomendacion = 'Me dictaste más de un número en el rango pero tomé los dos primeros'
return f'for {iterador} in range({limites[0]}, {limites[1]}):
' + ' ' * indentacion + '|'
def crear_comentario(instruccion):
"""
Agrega el comentario de la intrucción en una línea de código
Parámetros
----------
instrucción: str
La intrucción de voz en texto.
Regresa
---------
output: str
Comentario
"""
global bloque
global indentacion
# guarda los avisos o recomendaciones que el programa te hace
recomendacion = ''
bloque = 'comentario'
# guarda la línea de código
output = ''
before_keyword, keyword, after_keyword = instruccion.partition('comentario')
return '' + '# ' + after_keyword + '' + '
' + ' ' * indentacion + '|'
def fin_de_bloque(transcripcion):
global indentacion
global bloque
bloque='fin'
indentacion=indentacion-1
return '|'
#------------------------------------
#from models.variables_globales import *
def numero(text):
"""Convierte un texto de numero en numero entero (int)
Parametros
----------
text: list
Serie de valores
Regresa
---------
dict_numeros: int
El número correspondiente
"""
global dict_numeros
# Como sabemos que siempre sera el primer elemento el valor despues
# de número (eg. cuatro or veintecinco)
numero_str = text[0]
return dict_numeros[numero_str]
def flotante(text):
"""Convierte un texto de numero en numero floatante (float)
Parametros
----------
text: list
Serie de valores
Regresa
---------
dict_numeros: float
El número correspondiente en floatante (eg 3.4)
"""
global dict_numeros
text = " ".join(text)
before_keyword, keyword, after_keyword = text.partition('punto')
print(before_keyword)
print(after_keyword)
# Obtenemos los dos numeros antes y despues del punto
before_num = before_keyword.strip().split(' ')[0]
after_num = after_keyword.strip().split(' ')[0]
# Hacemos el mapeo uno -> 1
num1_int = dict_numeros[before_num]
num2_int = dict_numeros[after_num]
return float(str(num1_int) + '.' + str(num2_int))
def cadena(text):
"""Convierte un texto de numero en string (str)
Parametros
----------
text: list
Serie de valores
Regresa
---------
string: str
Una cadena con el contenido del texto
"""
numero_str = text[:]
return ' '.join(text)
def lista(text):
"""Convierte un texto de numero en string (str)
Parametros
----------
text: list
Serie de valores
Regresa
---------
lista: list
Una lista vacia
"""
return []
diccionario_fonetico={'andrea':'a',
'bravo':'b',
'carlos':'c',
'delta':'d',
'eduardo':'e',
'fernando':'f',
'garcia':'g',
'hotel':'h',
'india':'i',
'julieta':'j',
'kilo':'k',
'lima':'l',
'miguel':'m',
'noviembre':'n',
'oscar':'o',
'papa':'p',
'queretaro':'q',
'romero':'',
'sierra':'s',
'tango':'t',
'uniforme':'u',
'victor':'v',
'wafle':'w',
'equis':'x',
'yarda':'y',
'llarda':'y',
'espacio':' '}
# Separa en operadores comunes
# si esto se lematiza puedes agarrar todas las frases de la forma suma, sumar, etc.
dict_operaciones={
'producto':'*','mas':'+','menos':'-','concatena':'+','entre':'/','modulo':'%'
}
dict_numeros = {
'cero':0,
'uno': 1,
'dos': 2,
'tres': 3,
'cuatro':4,
'cinco': 5,
'seis': 6,
'siete': 7,
'ocho': 8,
'nueve': 9,
'diez': 10,
'once': 11,
'doce': 12,
'trece': 13,
'catorce': 14,
'quince': 15,
'dieciseis': 16,
'diecisiete': 17,
'dieciocho': 18,
'diecinueve': 19,
'veinte': 20,
'treinta': 30,
'cuarenta': 40,
'cicuenta': 50,
}
# Diccionario de funciones
tipos_datos ={
'natural': numero,
'flotante': flotante,
'cadena': cadena,
'lista': lista,
}
#--------------------------
from transformers import pipeline
import gradio as gr
# creación del modelo
# model = SpeechRecognitionModel("patrickvonplaten/wav2vec2-large-xlsr-53-spanish-with-lm")
p = pipeline("automatic-speech-recognition", "patrickvonplaten/wav2vec2-large-xlsr-53-spanish-with-lm")
tabla='''
Fonético |
andrea |
bravo |
carlos |
delta |
eduardo |
fernando |
garcia |
hotel |
india |
julieta |
kilo |
lima |
miguel |
noviembre |
Letra |
a |
b |
c |
d |
e |
f |
g |
h |
i |
j |
k |
l |
m |
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Fonético |
oscar |
papa |
queretaro |
romero |
sierra |
tango |
uniforme |
victor |
waffle |
equis |
yarda |
zapato |
|
|
Letra |
o |
p |
q |
r |
s |
t |
u |
v |
w |
x |
y |
z |
|
|
'''
# Variables globales
bloque = '' # Define el contexto (si es función, condicional, ciclo, etc.)
codigo = None # Guarda el código hasta el momento
indentacion = 0 # Nivel de indentación
linea_codigo = 0 # Esto para dar seguimiento al eliminado de una linea
recomendacion = ""
# fin_de_bloque=False
import gradio as gr
def transcribe(audio, Español, Codigo_Python):
global bloque
global codigo
global indentacion
#transcriptions_es = model.transcribe([audio])[0]
transcriptions_es = p([audio])['text']
# quitamos el acento de la transcripcion
frase = unidecode.unidecode(transcriptions_es).lower()
# print(frase)
if not bloque:
# Significa que es la primera vez
codigo = main(frase)
else:
codigo = agregar_adentro(codigo, frase)
return codigo, frase
inputs = gr.inputs.Audio(label="Dar click para grabar tu voz", type="filepath", source="microphone")
output1 = gr.outputs.Textbox(label="Asi se ve tu código")
output2 = gr.outputs.Textbox(label="Lo que entendió la caracola fue:")
title = "Caracola App"
description = 'Aplicación que ayuda a programar a traves de tu voz.\nSe usa el siguiente diccionario fonético para capturar las variables de una letra.
'+tabla+'
Instrucciones
Selecciona uno de los ejemplos y da click en enviar para convertir comandos de voz en código!
'
# ,'mientras variable alpha es menor igual a numero dos'
# ,'Definir variable con nombre india igual a numero uno'
input2 = gr.inputs.Textbox(lines=0, placeholder="Aqui aparece el texto en español de los ejemplos")
input3 = gr.inputs.Textbox(lines=0, placeholder="Aqui aparece el codigo en python de los ejemplos")
output_html = gr.outputs.HTML(label='Asi se ve tu código:')
examples = [
['./wav/comentario.wav','agregar comentario mi primer función', '# mi primer funcion'],
['./wav/funcion.wav','definir función con nombre mágica y parámetros noviembre', 'def magica(n):'],
['./wav/definira.wav','definir variable con nombre andrea igual a natural cero', 'a=0'],
['./wav/definirb.wav','definir variable con nombre bravo igual a natural uno', 'b = 1'],
['./wav/iteracion.wav','ejecuta iteracion para india en un rango noviembre', 'for i in range(n)'],
['./wav/asignar_c_b.wav','asignar variable carlos con bravo', 'c=b'],
['./wav/andreabravo.wav','asignar variable bravo con andrea mas bravo', 'b = a + b'],
['./wav/asignar_a_c.wav','asignar variable andrea con carlos', 'a=c'],
['./wav/terminar_bloque.wav','terminar bloque',''],
['./wav/comentario2.wav','agregar comentario fin de ciclo', '# fin de ciclo'],
['./wav/regresa.wav','regresa variable andrea', 'return a'],
['./wav/llamada.wav', 'ejecuta mágica con argumentos diez', 'magica(10)']
]
article = " Repositorio de la app"
demo = gr.Interface(fn=transcribe, inputs=[inputs, input2, input3], outputs=[output_html,output2],
examples=examples,
title=title, description=description, article=article,
allow_flagging="never", theme="darkpeach",
)
demo.launch()