Spaces:

naufalnashif
/

sentiment-analysis-ensemble-model

Sleeping

App Files Files Community

naufalnashif commited on Nov 18, 2023

Commit

2e68b49

1 Parent(s): 36a2c5c

Update app.py

Browse files

Files changed (1) hide show

app.py +128 -114

app.py CHANGED Viewed

@@ -287,101 +287,123 @@ def get_table_download_link(df, download_format):
 st.title("Sentiment Analysis : Based on Tweets Biskita Transpakuan Bogor 2022-2023")
 preference_barchart_date = False
 #-----------------------------------------------------General Settings---------------------------------------------------------------
-with st.expander("General Settings :"):
-    # Tambahkan widget untuk memilih model
-    selected_model = st.selectbox("Pilih Model Sentimen:", ("Ensemble", "Naive Bayes", "Logistic Regression", "Transformer"))
-    # Memilih model sentimen berdasarkan pilihan pengguna
-    sentiment_model = select_sentiment_model(selected_model)
-    # Pilihan input teks manual atau berkas XLSX
-    input_option = st.radio("Pilih metode input:", ("Teks Manual", "Unggah Berkas XLSX"))
-    if input_option == "Teks Manual":
-        # Input teks dari pengguna
-        user_input = st.text_area("Masukkan teks:", "")
-    else:
-        # Input berkas XLSX
-        uploaded_file = st.file_uploader("Unggah berkas XLSX", type=["xlsx"])
-        st.caption("Pastikan berkas XLSX Anda memiliki kolom yang bernama :blue[Text] _(Maks.500 data)_.")
-        st.caption("Jika terdapat kolom type :blue[datetime], ganti nama kolom menjadi :blue[Date]")
-        if uploaded_file is not None:
-            df = pd.read_excel(uploaded_file)
-            df = df[:500]
-            if 'Text' not in df.columns:
-                st.warning("Berkas XLSX harus memiliki kolom bernama 'Text' untuk analisis sentimen.")
-                if not df['Text'].empty:
-                    st.warning("Kolom 'Text' harus mempunyai value.")
-            else:
-                texts = df['Text']  # Sesuaikan dengan nama kolom di berkas XLSX Anda
-            if "Date" in df.columns :
-                if not df['Date'].empty:
-                    dates = df['Date']
-                    preference_barchart_date = True
-#-----------------------------------------------------Preference Settings--------------------------------------------------
-with st.expander ("Preference Settings :"):
-    colormap = st.selectbox("Pilih Warna Wordclouds :", ["Greys", "Purples", "Blues", "Greens", "Oranges", "Reds", "YlOrBr", "YlOrRd", "OrRd", "PuRd", "RdPu", "BuPu", "GnBu", "PuBu", "YlGnBu", "PuBuGn", "BuGn", "YlGn"])
-    if preference_barchart_date == True:
-        bar = st.selectbox("Pilih Tampilan Bar Chart :", ("Distribusi Kelas", "Distribusi Kelas Berdasarkan Waktu"), index = 0)
-        target_year = st.selectbox("Pilih Tahun Bar Chart :", df['Date'].str[:4].unique())
-# Analisis sentimen
-results = []
-analisis = False
-if input_option == "Teks Manual" and user_input:
-    if st.button("Analysis"):
-        # Pisahkan teks yang dimasukkan pengguna menjadi baris-baris terpisah
-        user_texts = user_input.split('\n')
-        for text in user_texts:
-            sentiment_label = predict_sentiment(text, sentiment_model, tfidf_vectorizer, lookp_dict)
-            emoticon = get_emoticon(sentiment_label)
-            cleaned_text = clean_text(text)
-            norm_slang_text = normalize_slang(cleaned_text, lookp_dict)
-            tanpa_stopwords = remove_stopwords(norm_slang_text, stop_words)
-            results.append({
-                'Text': text,
-                'cleaned-text' : cleaned_text,
-                'normalisasi-text' : norm_slang_text,
-                'stopwords-remove' : tanpa_stopwords,
-                'label' : sentiment_label,
-                'emotikon' : emoticon,
-            })
-            analisis = True
-elif input_option == "Unggah Berkas XLSX" and uploaded_file is not None:
-    if st.button("Analysis"):
-        results, analisis = all_data_process(texts, df, sentiment_model, tfidf_vectorizer, lookp_dict, stop_words)
-st.info('Tekan "Analysis" kembali jika tampilan menghilang', icon = 'ℹ️')
-if results and analisis == True:
-    df_results = pd.DataFrame(results)
-    # Membagi tampilan menjadi dua kolom
-    columns = st.columns(2)
-    # Kolom pertama untuk Word Cloud
-    with columns[0]:
-        st.write("Wordclouds :")
-        all_texts = [result['stopwords-remove'] for result in results if result['stopwords-remove'] is not None and not pd.isna(result['stopwords-remove'])]
-        all_texts = " ".join(all_texts)
-        if all_texts:
-            wordcloud = WordCloud(width=800, height=660, background_color='white',
-                                  colormap=colormap,   # Warna huruf
-                                  contour_color='black',  # Warna kontur
-                                  contour_width=2,       # Lebar kontur
-                                  mask=None,             # Gunakan mask untuk bentuk kustom
-                                  ).generate(all_texts)
-            st.image(wordcloud.to_array())
-        else:
-            st.write("Tidak ada data untuk ditampilkan dalam Word Cloud.")
-    if 'Date' in df_results.columns:
-        if bar == "Distribusi Kelas Berdasarkan Waktu":
-            if not df_results['Date'].empty:
                 with columns[1]:
-                    buat_chart(df_results, target_year)
         else :
             # Kolom kedua untuk Bar Chart
             with columns[1]:
@@ -390,36 +412,28 @@ if results and analisis == True:
                 st.bar_chart(
                     df_results["label"].value_counts()
                 )
-    else :
-        # Kolom kedua untuk Bar Chart
-        with columns[1]:
-            st.write("Bar Chart :")
-            # Membuat bar chart
-            st.bar_chart(
-                df_results["label"].value_counts()
-            )
-    # Menampilkan hasil analisis sentimen dalam kotak yang dapat diperluas
-    with st.expander("Hasil Analisis Sentimen"):
-        # Tampilkan tabel hasil analisis sentimen
-        st.write(pd.DataFrame(results))
-    if results:
-        # Simpan DataFrame ke dalam file CSV
-        df = pd.DataFrame(results)
-        csv = df.to_csv(index=False)
-        # Tampilkan tombol unduh CSV
-        st.download_button(label="Unduh CSV", data=csv, key="csv_download", file_name="hasil_sentimen.csv")
-    else:
-        st.write("Tidak ada data untuk diunduh.")
 # Garis pemisah
 st.divider()
-left, right = st.columns(2)
 with left :
-    st.image(https://naufalnashif.github.io/assets/images/WhatsApp%20Image%202023-01-26%20at%2020.37.17.jpeg, caption='Naufal Nashif')
 with right :
     # Tautan ke GitHub

 st.title("Sentiment Analysis : Based on Tweets Biskita Transpakuan Bogor 2022-2023")
 preference_barchart_date = False
 #-----------------------------------------------------General Settings---------------------------------------------------------------
+with s.sidebar :
+    with st.expander("General Settings :"):
+        # Tambahkan widget untuk memilih model
+        selected_model = st.selectbox("Pilih Model Sentimen:", ("Ensemble", "Naive Bayes", "Logistic Regression", "Transformer"))
+        # Memilih model sentimen berdasarkan pilihan pengguna
+        sentiment_model = select_sentiment_model(selected_model)
+        # Pilihan input teks manual atau berkas XLSX
+        input_option = st.radio("Pilih metode input:", ("Teks Manual", "Unggah Berkas XLSX"))
+        if input_option == "Teks Manual":
+            # Input teks dari pengguna
+            user_input = st.text_area("Masukkan teks:", "")
+        else:
+            # Input berkas XLSX
+            uploaded_file = st.file_uploader("Unggah berkas XLSX", type=["xlsx"])
+            st.caption("Pastikan berkas XLSX Anda memiliki kolom yang bernama :blue[Text] _(Maks.500 data)_.")
+            st.caption("Jika terdapat kolom type :blue[datetime], ganti nama kolom menjadi :blue[Date]")
+            if uploaded_file is not None:
+                df = pd.read_excel(uploaded_file)
+                df = df[:500]
+                if 'Text' not in df.columns:
+                    st.warning("Berkas XLSX harus memiliki kolom bernama 'Text' untuk analisis sentimen.")
+                    if not df['Text'].empty:
+                        st.warning("Kolom 'Text' harus mempunyai value.")
+                else:
+                    texts = df['Text']  # Sesuaikan dengan nama kolom di berkas XLSX Anda
+                if "Date" in df.columns :
+                    if not df['Date'].empty:
+                        dates = df['Date']
+                        preference_barchart_date = True
+    #-----------------------------------------------------Preference Settings--------------------------------------------------
+    with st.expander ("Preference Settings :"):
+        colormap = st.selectbox("Pilih Warna Wordclouds :", ["Greys", "Purples", "Blues", "Greens", "Oranges", "Reds", "YlOrBr", "YlOrRd", "OrRd", "PuRd", "RdPu", "BuPu", "GnBu", "PuBu", "YlGnBu", "PuBuGn", "BuGn", "YlGn"])
+        if preference_barchart_date == True:
+            bar = st.selectbox("Pilih Tampilan Bar Chart :", ("Distribusi Kelas", "Distribusi Kelas Berdasarkan Waktu"), index = 0)
+            target_year = st.selectbox("Pilih Tahun Bar Chart :", df['Date'].str[:4].unique())
+tab1, tab2, tab3 = st.tabs(["Profile", "Documentation", "Results"])
+with tab1:
+    st.header("Profile :")
+    st.image('https://naufalnashif.github.io/assets/images/WhatsApp%20Image%202023-01-26%20at%2020.37.17.jpeg', caption='Naufal Nashif')
+with tab2:
+    st.header("Documentation :")
+with tab3:
+    st.header("Results :")
+    # Analisis sentimen
+    results = []
+    analisis = False
+    if input_option == "Teks Manual" and user_input:
+        if st.button("Analysis"):
+            # Pisahkan teks yang dimasukkan pengguna menjadi baris-baris terpisah
+            user_texts = user_input.split('\n')
+            for text in user_texts:
+                sentiment_label = predict_sentiment(text, sentiment_model, tfidf_vectorizer, lookp_dict)
+                emoticon = get_emoticon(sentiment_label)
+                cleaned_text = clean_text(text)
+                norm_slang_text = normalize_slang(cleaned_text, lookp_dict)
+                tanpa_stopwords = remove_stopwords(norm_slang_text, stop_words)
+                results.append({
+                    'Text': text,
+                    'cleaned-text' : cleaned_text,
+                    'normalisasi-text' : norm_slang_text,
+                    'stopwords-remove' : tanpa_stopwords,
+                    'label' : sentiment_label,
+                    'emotikon' : emoticon,
+                })
+                analisis = True
+    elif input_option == "Unggah Berkas XLSX" and uploaded_file is not None:
+        if st.button("Analysis"):
+            results, analisis = all_data_process(texts, df, sentiment_model, tfidf_vectorizer, lookp_dict, stop_words)
+    st.info('Tekan "Analysis" kembali jika tampilan menghilang', icon = 'ℹ️')
+    if results and analisis == True:
+        df_results = pd.DataFrame(results)
+        # Membagi tampilan menjadi dua kolom
+        columns = st.columns(2)
+        # Kolom pertama untuk Word Cloud
+        with columns[0]:
+            st.write("Wordclouds :")
+            all_texts = [result['stopwords-remove'] for result in results if result['stopwords-remove'] is not None and not pd.isna(result['stopwords-remove'])]
+            all_texts = " ".join(all_texts)
+            if all_texts:
+                wordcloud = WordCloud(width=800, height=660, background_color='white',
+                                      colormap=colormap,   # Warna huruf
+                                      contour_color='black',  # Warna kontur
+                                      contour_width=2,       # Lebar kontur
+                                      mask=None,             # Gunakan mask untuk bentuk kustom
+                                      ).generate(all_texts)
+                st.image(wordcloud.to_array())
+            else:
+                st.write("Tidak ada data untuk ditampilkan dalam Word Cloud.")
+        if 'Date' in df_results.columns:
+            if bar == "Distribusi Kelas Berdasarkan Waktu":
+                if not df_results['Date'].empty:
+                    with columns[1]:
+                        buat_chart(df_results, target_year)
+            else :
+                # Kolom kedua untuk Bar Chart
                 with columns[1]:
+                    st.write("Bar Chart :")
+                    # Membuat bar chart
+                    st.bar_chart(
+                        df_results["label"].value_counts()
+                    )
         else :
             # Kolom kedua untuk Bar Chart
             with columns[1]:
                 st.bar_chart(
                     df_results["label"].value_counts()
                 )
+        # Menampilkan hasil analisis sentimen dalam kotak yang dapat diperluas
+        with st.expander("Hasil Analisis Sentimen"):
+            # Tampilkan tabel hasil analisis sentimen
+            st.write(pd.DataFrame(results))
+        if results:
+            # Simpan DataFrame ke dalam file CSV
+            df = pd.DataFrame(results)
+            csv = df.to_csv(index=False)
+            # Tampilkan tombol unduh CSV
+            st.download_button(label="Unduh CSV", data=csv, key="csv_download", file_name="hasil_sentimen.csv")
+        else:
+            st.write("Tidak ada data untuk diunduh.")
 # Garis pemisah
 st.divider()
+left, right = st.columns([1,3])
 with left :
+    st.image('https://naufalnashif.github.io/assets/images/WhatsApp%20Image%202023-01-26%20at%2020.37.17.jpeg', caption='Naufal Nashif')
 with right :
     # Tautan ke GitHub