rad / obtenCampo.py
Moibe's picture
Commit Inicial para Reconocimiento Avanzado de Documentos
fda1a93
import herramientas
#Campos para DNI.
def Nombre(textos_extraidos, textos_extraidos_simplificados):
indice = herramientas.buscaIndexPalabra(textos_extraidos_simplificados, 'usual')
nombre = textos_extraidos[indice-2]
apellido = textos_extraidos[indice-1]
return nombre, apellido
def Identificacion(textos_extraidos, textos_extraidos_simplificados):
indice = herramientas.buscarPatronCedula(textos_extraidos_simplificados)
identificacion = textos_extraidos[indice]
return identificacion
def Fecha_Nacimiento(textos_extraidos, textos_extraidos_limpios):
conceptos_busqueda = [
{'preferida': 'fecha', 'alternativas': []},
{'preferida': 'nacimiento', 'alternativas': ['nacimento']} ]
indice, textos_extraidos_corregidos = herramientas.buscaIndexMultiplesPalabras_Corregida(textos_extraidos_limpios, conceptos_busqueda)
#Future: Agregar validación aquí, porque si regresa None es que no encontró nada.
print("Ésto es textos extraídos corregidos: ", textos_extraidos_corregidos)
textos_extraidos_limpios = textos_extraidos_corregidos
print("El índice de la fecha de nacimiento es: ", indice)
texto_fecha_nacimiento = textos_extraidos_limpios[indice] #En ésta ocasión estoy usando el texto limpio para que el patrón lo identifique más fácilmente.
print("Y su correspondiente texto es: " , texto_fecha_nacimiento)
fecha_nacimiento = herramientas.obtener_fecha(texto_fecha_nacimiento)
return fecha_nacimiento
def Sexo(textos_extraidos, textos_extraidos_limpios):
conceptos_busqueda = [
{'preferida': 'sexo', 'alternativas': ['sex', 'seno', 'sen']},
#{'preferida': 'sangre', 'alternativas': []}
]
indice, textos_extraidos_corregidos = herramientas.buscaIndexMultiplesPalabras_Corregida(textos_extraidos_limpios, conceptos_busqueda)
textos_extraidos_limpios = textos_extraidos_corregidos
print("El índice de genero es: ", indice)
texto_genero = textos_extraidos_limpios[indice]
print("Y su correspondiente texto es: " , texto_genero)
sexo = herramientas.obtener_sexo(texto_genero)
return sexo