File size: 1,519 Bytes
f4c50c8
 
 
0e04b12
f4c50c8
0e04b12
 
 
 
f4c50c8
 
 
 
 
 
 
 
 
 
 
 
0e04b12
f4c50c8
 
 
0e04b12
f4c50c8
0e04b12
f4c50c8
 
 
 
 
0e04b12
f4c50c8
 
0e04b12
 
9bf0efa
 
 
 
0e04b12
9bf0efa
0e04b12
 
f4c50c8
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
import streamlit as st
from io import StringIO
from chdg_inference import infer
from infer_concat import vit5_infer

st.set_page_config(layout="wide")
st.title("Tóm tắt Đa văn bản Tiếng Việt")

col1, col2 = st.columns([1, 1])

# Initialize session state
if 'num_docs' not in st.session_state:
    st.session_state.num_docs = 0
if 'docs' not in st.session_state:
    st.session_state.docs = []

# Function to add a new text area
def add_text_area():
    st.session_state.num_docs += 1

# Button to add a new text area
col1.button("Thêm văn bản", on_click=add_text_area)

# Display text areas for document input
for i in range(st.session_state.num_docs):
    doc = col1.text_area(f"Văn bản {i+1}", key=f"doc_{i}", height=150)
    doc.replace('\r', '\n')
    doc.replace('\"', "'")
    if len(st.session_state.docs) <= i:
        st.session_state.docs.append(doc)
    else:
        st.session_state.docs[i] = doc

category = col1.selectbox("Chọn chủ để của văn bản: ", ['Giáo dục', 'Giải trí - Thể thao', 'Khoa học - Công nghệ', 'Kinh tế', 'Pháp luật', 'Thế giới', 'Văn hóa - Xã hội', 'Đời sống'])

def summarize():
    summ, _ = infer(st.session_state.docs, category)
    with col2.container():
        col2.subheader("Kết quả: ")
        col2.write("\n")
        col2.write("Sử dụng CHDG:")
        col2.write(summ)
        summ_vit5 = vit5_infer(st.session_state.docs)
        col2.write(summ_vit5)
    
if col1.button("Tóm tắt"):
    summarize()