Spaces:

ardian407
/

Spam_detection

Sleeping

ardian407 commited on Nov 18, 2023

Commit

70ce67b

•

1 Parent(s): 581b7b7

Upload eda.py

Files changed (1) hide show

eda.py CHANGED Viewed

@@ -13,35 +13,38 @@ nltk.download('wordnet')
 def count_occurence(text):
-        '''
-        fungsi ini menerima text dalam bentuk kalimat atau paragraf
-        '''
-        # menghapus spasi dan memisahkan setiap kata yang terpisah dengan spasi
-        text_list = text.str.strip().str.split()
-        # container list
-        total_texts=[]
-        try:
-        # nested loop yang akhirnya masukan setiap kata pada total_texts
-            for content in text_list:
-                for kata in content:
-                    total_texts.append(kata)
-        except:
-            pass
-        # stopwords
-        stopwords_en = list(set(stopwords.words('english')))
-        # list comprehension untuk setiap kata yang tidak ada pada stopwords
-        rem_stopwords = [word for word in total_texts if word not in stopwords_en]
-        # mengembalikan hasil dengan Counter dari collections
-        return Counter(rem_stopwords)
 def run():
-    st.title("EDA SPAM Classification")
     df = pd.read_csv('data_eda.csv')

 def count_occurence(text):
+    '''
+    fungsi ini menerima text dalam bentuk kalimat atau paragraf
+    '''
+    # menghapus spasi dan memisahkan setiap kata yang terpisah dengan spasi
+    text_list = text.str.strip().str.split()
+    # container list
+    total_texts=[]
+    try:
+    # nested loop yang akhirnya masukan setiap kata pada total_texts
+        for content in text_list:
+            for kata in content:
+                total_texts.append(kata)
+    except:
+        pass
+    # stopwords
+    stopwords_en = list(set(stopwords.words('english')))
+    # list comprehension untuk setiap kata yang tidak ada pada stopwords
+    rem_stopwords = [word for word in total_texts if word not in stopwords_en]
+    # mengembalikan hasil dengan Counter dari collections
+    return Counter(rem_stopwords)
 def run():
+    st.title("EDA SPAM Text Classification")
+    st.write('''
+            Untuk lebih memahami model yang telah dibuat, di halaman ini disediakan beberapa eksplorasi sederhana terkait dataset yang digunakan
+            ''')
     df = pd.read_csv('data_eda.csv')