Spaces:
Sleeping
Sleeping
Upload 4 files
Browse files
eda.py
CHANGED
@@ -7,29 +7,37 @@ from PIL import Image
|
|
7 |
|
8 |
#membuat function untuk nantinya dipanggil di app.py
|
9 |
def run():
|
10 |
-
st.title('
|
11 |
-
st.subheader ('
|
12 |
|
13 |
#Memanggil data csv
|
14 |
df= pd.read_csv(r'hasil_predik.csv')
|
15 |
|
16 |
#menampilakn 5 data teratas
|
17 |
-
st.table(df.head())
|
18 |
st.write('Menampilkan Head dataframe hasil prediksi')
|
19 |
-
st.table(df.
|
|
|
20 |
st.write('Menampilkan Tail dataframe hasil prediksi')
|
|
|
|
|
21 |
|
22 |
|
23 |
#menampilakn phik matrix
|
24 |
-
st.
|
25 |
image = Image.open('model.jpg')
|
26 |
st.write('')
|
27 |
-
st.image(image, caption='
|
28 |
-
st.write(''
|
|
|
|
|
|
|
|
|
|
|
|
|
29 |
#menampilakn phik matrix
|
30 |
-
st.
|
31 |
image = Image.open('fitur.jpg')
|
32 |
-
st.image(image, caption='
|
33 |
st.write('''Korelasi antara berbagai parameter kesehatan dengan DEATH_EVENT (kematian akibat penyakit jantung) dapat memberikan wawasan tentang faktor-faktor yang mempengaruhi prognosis pasien dengan penyakit jantung.
|
34 |
|
35 |
Berikut adalah kemungkinan korelasi yang kuat antara parameter yang Anda sebutkan dengan DEATH_EVENT:
|
@@ -41,12 +49,12 @@ Penting untuk diingat bahwa hasil korelasi tidak selalu menunjukkan hubungan seb
|
|
41 |
|
42 |
Selain itu, faktor-faktor lain juga bisa berpengaruh terhadap DEATH_EVENT, dan analisis lebih lanjut mungkin diperlukan untuk memahami sepenuhnya hubungan antara variabel-variabel ini.''')
|
43 |
#menampilkan penjelasan
|
44 |
-
with st.expander('Explanation'):
|
45 |
-
st.caption("""
|
46 |
-
|
47 |
-
|
48 |
-
|
49 |
-
|
50 |
|
51 |
|
52 |
|
|
|
7 |
|
8 |
#membuat function untuk nantinya dipanggil di app.py
|
9 |
def run():
|
10 |
+
st.title('Explaration Data Analysis')
|
11 |
+
st.subheader ('Data Frame Hasil Model Prediksi')
|
12 |
|
13 |
#Memanggil data csv
|
14 |
df= pd.read_csv(r'hasil_predik.csv')
|
15 |
|
16 |
#menampilakn 5 data teratas
|
|
|
17 |
st.write('Menampilkan Head dataframe hasil prediksi')
|
18 |
+
st.table(df.head())
|
19 |
+
|
20 |
st.write('Menampilkan Tail dataframe hasil prediksi')
|
21 |
+
st.table(df.tail())
|
22 |
+
|
23 |
|
24 |
|
25 |
#menampilakn phik matrix
|
26 |
+
st.subheader ('phik correlation matrix')
|
27 |
image = Image.open('model.jpg')
|
28 |
st.write('')
|
29 |
+
st.image(image, caption='Heatmap Correlation')
|
30 |
+
st.write('''Berdasarkan correlation matrix diatas, dipilih beberapa kolom yang memiliki korelasi cukup tinggi dengan target DEATH_EVENT yang kemudian nantinya digunakan untuk variabel X dan Y pada modelling. Kolom tersebut diantaranya adalah sebagai berikut:
|
31 |
+
|
32 |
+
Serum Creatinine berkorelasi dengan target DEATH_EVENT sebesar : 0.294278
|
33 |
+
Age berkorelasi dengan target DEATH_EVENT sebesar : 0.253581
|
34 |
+
High Blood Pressure berkorelasi dengan target DEATH_EVENT sebesar : 0.079351
|
35 |
+
Anaemia berkorelasi dengan target DEATH_EVENT sebesar : 0.066270
|
36 |
+
Creatinine Phosphokinase berkorelasi dengan target DEATH_EVENT sebesar : 0.062728''')
|
37 |
#menampilakn phik matrix
|
38 |
+
st.subheader ('Hasil seleksi fitur menggunakan Random Forest')
|
39 |
image = Image.open('fitur.jpg')
|
40 |
+
st.image(image, caption='Hasil Seleksi Pemilihan FItur Mengunakan Random Forest')
|
41 |
st.write('''Korelasi antara berbagai parameter kesehatan dengan DEATH_EVENT (kematian akibat penyakit jantung) dapat memberikan wawasan tentang faktor-faktor yang mempengaruhi prognosis pasien dengan penyakit jantung.
|
42 |
|
43 |
Berikut adalah kemungkinan korelasi yang kuat antara parameter yang Anda sebutkan dengan DEATH_EVENT:
|
|
|
49 |
|
50 |
Selain itu, faktor-faktor lain juga bisa berpengaruh terhadap DEATH_EVENT, dan analisis lebih lanjut mungkin diperlukan untuk memahami sepenuhnya hubungan antara variabel-variabel ini.''')
|
51 |
#menampilkan penjelasan
|
52 |
+
with st.expander(' ### Explanation'):
|
53 |
+
st.caption(""" Pemilihan fitur menggunakan Random Forest umum dilakukan karena beberapa alasan:
|
54 |
+
- Kepentingan Fitur (Feature Importance): Random Forest memberikan skor kepentingan untuk setiap fitur. Skor ini membantu memahami fitur mana yang memiliki pengaruh lebih besar dalam membuat prediksi. Fitur dengan skor kepentingan yang tinggi cenderung memiliki pengaruh yang lebih besar pada kinerja model.
|
55 |
+
- Menangani Non-linieritas dan Interaksi: Random Forest dapat menangkap hubungan non-linier dan interaksi antar fitur, yang penting karena data dunia nyata sering menunjukkan hubungan yang kompleks yang mungkin tidak linear.
|
56 |
+
- Tahan Terhadap Overfitting: Random Forest cenderung lebih tahan terhadap overfitting dibandingkan dengan model yang lebih kompleks. Ini membuatnya lebih dapat diandalkan untuk pemilihan fitur dalam situasi di mana overfitting bisa menjadi masalah.
|
57 |
+
""" )
|
58 |
|
59 |
|
60 |
|