File size: 1,133 Bytes
b514fe8
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
#!/usr/bin/env python3

"""
Data Scientist.: Dr.Eddy Giusepe Chirinos Isidro
"""
import spacy
import logging

# Configuração do logging:
#logging.basicConfig(filename='app.log', level=logging.DEBUG, format='%(asctime)s - %(levelname)s - %(message)s') # com DEBUG gerará uma pasta 🤗
logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(levelname)s - %(message)s')

def extract_entities(text):
    logging.info("Iniciando a extração de entidades")
    
    # Carregar o modelo do SpaCy:
    nlp = spacy.load("pt_core_news_sm")
    
    # Processar o texto com o modelo pré-treinado;
    doc = nlp(text)
    
    # Extrair e logar as entidades encontradas
    entities = []
    for ent in doc.ents:
        entities.append((ent.text, ent.label_))
        logging.debug(f"Entidade encontrada: {ent.text} - Tipo: {ent.label_}")
    
    logging.info("Extração de entidades concluída")
    return entities


if __name__ == "__main__":
    text = "A Apple Inc. foi fundada por Steve Jobs e Steve Wozniak em 1976."
    extracted_entities = extract_entities(text)
    print("Entidades extraídas:", extracted_entities)