Spaces:

naufalnashif
/

scraping-news-headline

Sleeping

App Files Files Community

naufalnashif commited on Nov 11, 2023

Commit

1a8d286

•

1 Parent(s): c644de6

Update app.py

Browse files

Files changed (1) hide show

app.py +31 -27

app.py CHANGED Viewed

@@ -253,7 +253,11 @@ with st.expander("Settings :"):
     query = st.text_input("Masukkan Query :")
     jumlah = st.number_input("Masukkan Estimasi Banyak Data :", min_value = 1, step = 1, placeholder="Type a number...")
     colormap = st.selectbox("Pilih Warna Wordclouds :", ["Greys", "Purples", "Blues", "Greens", "Oranges", "Reds", "YlOrBr", "YlOrRd", "OrRd", "PuRd", "RdPu", "BuPu", "GnBu", "PuBu", "YlGnBu", "PuBuGn", "BuGn", "YlGn"])
     words = st.number_input("Masukkan Jumlah Most Common Words :", min_value = 1, max_value = 15, step = 1, placeholder="Type a number...")
@@ -300,7 +304,7 @@ if selected_site == "CNBC Indonesia":
             all_texts = ""
             # Kolom pertama untuk Word Cloud
-            with st.expander("Hasil Explorasi Data : "):
                 with columns[0]:
                     if results:
                         all_texts = [result[3] for result in results if result[3] is not None and not pd.isna(result[3])]
@@ -317,7 +321,8 @@ if selected_site == "CNBC Indonesia":
                             st.image(wordcloud.to_array())
-                # Kolom kedua untuk Most Comon Words
                 with columns[1]:
                     st.subheader("Most Common Words")
@@ -336,8 +341,6 @@ if selected_site == "CNBC Indonesia":
                         st.pyplot(fig)
-            if not hidden_data:
-                st.warning(f"Tidak ada data pada query '{query}'", icon="⚠️")
 #---------------------------------------------------Detik.com----------------------------------------------------------------------
@@ -373,55 +376,55 @@ elif selected_site == "Detik.com":
             all_texts = ""
             # Kolom pertama untuk Word Cloud
-            with st.expander("Hasil Explorasi Data : ") :
                 with columns[0]:
                     if results:
                         all_texts = [result[3] for result in results if result[3] is not None and not pd.isna(result[3])]
                         all_texts = " ".join(all_texts)
                         st.subheader("Word Cloud")
                         if all_texts:
                             wordcloud = WordCloud(width=800, height=610, background_color='white',
-                                                  colormap=colormap,
-                                                  contour_color='black',
-                                                  contour_width=2,
-                                                  mask=None).generate(all_texts)
                             st.image(wordcloud.to_array())
-                # Kolom kedua untuk Most Comon Words
                 with columns[1]:
                     st.subheader("Most Common Words")
                     if all_texts:
                         word_counts = Counter(all_texts.split())
                         most_common_words = word_counts.most_common(words)
                         words, counts = zip(*most_common_words)
                         fig, ax = plt.subplots(figsize=(10, 6))
                         ax.bar(words, counts)
                         ax.set_xlabel("Kata-kata")
                         ax.set_ylabel("Jumlah")
                         ax.set_title("Kata-kata Paling Umum")
                         ax.tick_params(axis='x', rotation=45)
                         st.pyplot(fig)
-            if not hidden_data:
-                st.warning(f"Tidak ada data pada query '{query}'", icon="⚠️")
 #---------------------------------------------------Download File & Hasil Scraping----------------------------------------------------------------------
 # Tampilkan hasil scraping
 if scraping_done:
     if hidden_data:
         # Menampilkan hasil sentimen dalam kotak yang dapat diperluas
-        with st.expander(f"Hasil Scraping {selected_site} :"):
-            st.write(pd.DataFrame(hidden_data, columns=["date", "judul-berita", "link-berita"]))
-        with st.expander(f"Hasil Cleaning Data :"):
-            st.write(pd.DataFrame(results, columns=["Teks", "Cleaned Text", "Norm Text", "Tanpa Stopwords"]))
         if download_format == "XLSX":
             df = pd.DataFrame(hidden_data, columns=["date", "judul-berita", "link-berita"])
             df_prep = pd.DataFrame(results, columns=["Teks", "Cleaned Text", "Norm Text", "Tanpa Stopwords"])
@@ -446,7 +449,8 @@ if scraping_done:
             st.download_button(label=f"Unduh Hasil Scraping TXT ({len(hidden_data)} data)", data=text_data, key="txt_download", file_name=f"hasil_scraping_{query}.txt")
 if not scraping_done:
     st.write("Tidak ada data untuk diunduh.")

     query = st.text_input("Masukkan Query :")
     jumlah = st.number_input("Masukkan Estimasi Banyak Data :", min_value = 1, step = 1, placeholder="Type a number...")
+    # Membuat multiselect box
+    selected_options = st.multiselect(
+        'Pilih tampilan:',
+        ['Hasil Scraping', 'Hasil Preprocessing', 'Word Clouds', 'Most Common Words']
+    )
     colormap = st.selectbox("Pilih Warna Wordclouds :", ["Greys", "Purples", "Blues", "Greens", "Oranges", "Reds", "YlOrBr", "YlOrRd", "OrRd", "PuRd", "RdPu", "BuPu", "GnBu", "PuBu", "YlGnBu", "PuBuGn", "BuGn", "YlGn"])
     words = st.number_input("Masukkan Jumlah Most Common Words :", min_value = 1, max_value = 15, step = 1, placeholder="Type a number...")
             all_texts = ""
             # Kolom pertama untuk Word Cloud
+            if 'Word Clouds' in selected_options:
                 with columns[0]:
                     if results:
                         all_texts = [result[3] for result in results if result[3] is not None and not pd.isna(result[3])]
                             st.image(wordcloud.to_array())
+            # Kolom kedua untuk Most Comon Words
+            if 'Most Common Words' in selected_options:
                 with columns[1]:
                     st.subheader("Most Common Words")
                         st.pyplot(fig)
 #---------------------------------------------------Detik.com----------------------------------------------------------------------
             all_texts = ""
             # Kolom pertama untuk Word Cloud
+            if 'Word Clouds' in selected_options:
                 with columns[0]:
                     if results:
                         all_texts = [result[3] for result in results if result[3] is not None and not pd.isna(result[3])]
                         all_texts = " ".join(all_texts)
                         st.subheader("Word Cloud")
                         if all_texts:
                             wordcloud = WordCloud(width=800, height=610, background_color='white',
+                                                    colormap=colormap,
+                                                    contour_color='black',
+                                                    contour_width=2,
+                                                    mask=None).generate(all_texts)
                             st.image(wordcloud.to_array())
+            # Kolom kedua untuk Most Comon Words
+            if 'Most Common Words' in selected_options:
                 with columns[1]:
                     st.subheader("Most Common Words")
                     if all_texts:
                         word_counts = Counter(all_texts.split())
                         most_common_words = word_counts.most_common(words)
                         words, counts = zip(*most_common_words)
                         fig, ax = plt.subplots(figsize=(10, 6))
                         ax.bar(words, counts)
                         ax.set_xlabel("Kata-kata")
                         ax.set_ylabel("Jumlah")
                         ax.set_title("Kata-kata Paling Umum")
                         ax.tick_params(axis='x', rotation=45)
                         st.pyplot(fig)
 #---------------------------------------------------Download File & Hasil Scraping----------------------------------------------------------------------
 # Tampilkan hasil scraping
 if scraping_done:
     if hidden_data:
         # Menampilkan hasil sentimen dalam kotak yang dapat diperluas
+        if 'Hasil Preprocessing' in selected_options:
+            with st.expander(f"Hasil Scraping {selected_site} :"):
+                st.write(pd.DataFrame(hidden_data, columns=["date", "judul-berita", "link-berita"]))
+        if 'Hasil Preprocessing' in selected_options:
+            with st.expander(f"Hasil Cleaning Data :"):
+                st.write(pd.DataFrame(results, columns=["Teks", "Cleaned Text", "Norm Text", "Tanpa Stopwords"]))
         if download_format == "XLSX":
             df = pd.DataFrame(hidden_data, columns=["date", "judul-berita", "link-berita"])
             df_prep = pd.DataFrame(results, columns=["Teks", "Cleaned Text", "Norm Text", "Tanpa Stopwords"])
             st.download_button(label=f"Unduh Hasil Scraping TXT ({len(hidden_data)} data)", data=text_data, key="txt_download", file_name=f"hasil_scraping_{query}.txt")
+    if not hidden_data:
+        st.warning(f"Tidak ada data pada query '{query}'", icon="⚠️")
 if not scraping_done:
     st.write("Tidak ada data untuk diunduh.")