visualisation-ttso

Sleeping

File size: 2,047 Bytes

1b0a5d8
 
 
 
 
5bfd360
1b0a5d8
 
5bfd360
1b0a5d8
 
 
5bfd360
1b0a5d8
 
5bfd360
3f7c271
5bfd360
3f7c271
b231f85
1b0a5d8
b231f85
5bfd360
 
 
1b0a5d8
 
3f7c271
5bfd360
3f7c271
 
1b0a5d8
5bfd360
1b0a5d8
aec8968
1b0a5d8
 
aec8968
1b0a5d8
 
 
6c298b3
1b0a5d8

import streamlit as st
import pandas as pd
import streamlit.components.v1 as components

st.sidebar.image("images/logo.png", use_column_width=True)
st.sidebar.write("Bunka Visualise & Explore l'nformation via des cartes utilisant des LLMs.")
st.sidebar.title("Github Page")
st.sidebar.write(
    "N'hésitez pas à découvrir notre package Github: https://github.com/charlesdedampierre/BunkaTopics"
)
st.sidebar.title("Dataset")
st.sidebar.write(
    "Nous avons scrappé tous les publications TTSO publiées en 2023, puis nous avons découpé chaque publication en articles. "
)

st.title("Un an de TTSO, par où commencer ?")
st.info(
    "Nous avons commencé par extraire tout le contenu des publications de TTSO en 2023. Voici un extrait:"
)
df = pd.read_csv("data/ttso_cleaned_data.csv", names=["Date", "Contenu"])
df = df.head(300)
st.dataframe(df, use_container_width=True, hide_index=True)
st.title("A l'intérieur de TTSO")
element = open("images/ttso_carte.html", "r", encoding="utf-8")
st.info("Cette carte permet d'explorer les différents sujets abordés par TTSO en 2023, regroupés automatiquement par thème via la technologie de Bunka.")

components.html(element.read(), height=900, width=900)
st.info(
    "En un clin d'oeil, il est possible d'explorer les différents sujets abordés par TTSO. On constate le mélange d'actualité internationales, avec en haut de la carte les conflits israelo-palestiniens et la guerre en Ukraine, avec des actualités de plus en plus française lorsque l'on avance vers le bas de la carte."
)


st.title("Des insights par sujet")
df_info = pd.read_csv("data/topics_info.csv", index_col=[0])
df_info = df_info[["topic_name", "size", "percent"]]
df_info["percent"] = df_info["percent"].apply(lambda x: str(int(x)) + "%")
df_info = df_info.reset_index(drop=True)
df_info.columns = ['Sujet', 'taille', 'Pourcentage d\'articles dans ce sujet' ]

st.dataframe(df_info, use_container_width=True)

st.title("L'architecture de Bunka")
st.image(
    "images/pipeline.png",
    use_column_width=True,
)