mardiek commited on
Commit
1c928d9
·
1 Parent(s): e782ebb

Upload 4 files

Browse files
Files changed (1) hide show
  1. eda.py +23 -15
eda.py CHANGED
@@ -7,29 +7,37 @@ from PIL import Image
7
 
8
  #membuat function untuk nantinya dipanggil di app.py
9
  def run():
10
- st.title('Welcome to Explaration Data Analysis')
11
- st.subheader ('EDA Mardi ML 2')
12
 
13
  #Memanggil data csv
14
  df= pd.read_csv(r'hasil_predik.csv')
15
 
16
  #menampilakn 5 data teratas
17
- st.table(df.head())
18
  st.write('Menampilkan Head dataframe hasil prediksi')
19
- st.table(df.tail())
 
20
  st.write('Menampilkan Tail dataframe hasil prediksi')
 
 
21
 
22
 
23
  #menampilakn phik matrix
24
- st.title('phik correlation matrix')
25
  image = Image.open('model.jpg')
26
  st.write('')
27
- st.image(image, caption='correlation')
28
- st.write('')
 
 
 
 
 
 
29
  #menampilakn phik matrix
30
- st.title('Hasil seleksi fitur menggunakan Random Forest')
31
  image = Image.open('fitur.jpg')
32
- st.image(image, caption='seleksi_fitur')
33
  st.write('''Korelasi antara berbagai parameter kesehatan dengan DEATH_EVENT (kematian akibat penyakit jantung) dapat memberikan wawasan tentang faktor-faktor yang mempengaruhi prognosis pasien dengan penyakit jantung.
34
 
35
  Berikut adalah kemungkinan korelasi yang kuat antara parameter yang Anda sebutkan dengan DEATH_EVENT:
@@ -41,12 +49,12 @@ Penting untuk diingat bahwa hasil korelasi tidak selalu menunjukkan hubungan seb
41
 
42
  Selain itu, faktor-faktor lain juga bisa berpengaruh terhadap DEATH_EVENT, dan analisis lebih lanjut mungkin diperlukan untuk memahami sepenuhnya hubungan antara variabel-variabel ini.''')
43
  #menampilkan penjelasan
44
- with st.expander('Explanation'):
45
- st.caption("""Berdasarkan correlation matrix diatas, dipilih beberapa kolom yang memiliki korelasi cukup tinggi dengan target DEATH_EVENT yang kemudian nantinya digunakan untuk variabel X dan Y pada modelling. Kolom tersebut diantaranya adalah sebagai berikut: Serum Creatinine berkorelasi dengan target DEATH_EVENT sebesar : 0.294278
46
- Age berkorelasi dengan target DEATH_EVENT sebesar : 0.253581,
47
- High Blood Pressure berkorelasi dengan target DEATH_EVENT sebesar : 0.079351,
48
- Anaemia berkorelasi dengan target DEATH_EVENT sebesar : 0.066270,
49
- Creatinine Phosphokinase berkorelasi dengan target DEATH_EVENT sebesar : 0.062728 """ )
50
 
51
 
52
 
 
7
 
8
  #membuat function untuk nantinya dipanggil di app.py
9
  def run():
10
+ st.title('Explaration Data Analysis')
11
+ st.subheader ('Data Frame Hasil Model Prediksi')
12
 
13
  #Memanggil data csv
14
  df= pd.read_csv(r'hasil_predik.csv')
15
 
16
  #menampilakn 5 data teratas
 
17
  st.write('Menampilkan Head dataframe hasil prediksi')
18
+ st.table(df.head())
19
+
20
  st.write('Menampilkan Tail dataframe hasil prediksi')
21
+ st.table(df.tail())
22
+
23
 
24
 
25
  #menampilakn phik matrix
26
+ st.subheader ('phik correlation matrix')
27
  image = Image.open('model.jpg')
28
  st.write('')
29
+ st.image(image, caption='Heatmap Correlation')
30
+ st.write('''Berdasarkan correlation matrix diatas, dipilih beberapa kolom yang memiliki korelasi cukup tinggi dengan target DEATH_EVENT yang kemudian nantinya digunakan untuk variabel X dan Y pada modelling. Kolom tersebut diantaranya adalah sebagai berikut:
31
+
32
+ Serum Creatinine berkorelasi dengan target DEATH_EVENT sebesar : 0.294278
33
+ Age berkorelasi dengan target DEATH_EVENT sebesar : 0.253581
34
+ High Blood Pressure berkorelasi dengan target DEATH_EVENT sebesar : 0.079351
35
+ Anaemia berkorelasi dengan target DEATH_EVENT sebesar : 0.066270
36
+ Creatinine Phosphokinase berkorelasi dengan target DEATH_EVENT sebesar : 0.062728''')
37
  #menampilakn phik matrix
38
+ st.subheader ('Hasil seleksi fitur menggunakan Random Forest')
39
  image = Image.open('fitur.jpg')
40
+ st.image(image, caption='Hasil Seleksi Pemilihan FItur Mengunakan Random Forest')
41
  st.write('''Korelasi antara berbagai parameter kesehatan dengan DEATH_EVENT (kematian akibat penyakit jantung) dapat memberikan wawasan tentang faktor-faktor yang mempengaruhi prognosis pasien dengan penyakit jantung.
42
 
43
  Berikut adalah kemungkinan korelasi yang kuat antara parameter yang Anda sebutkan dengan DEATH_EVENT:
 
49
 
50
  Selain itu, faktor-faktor lain juga bisa berpengaruh terhadap DEATH_EVENT, dan analisis lebih lanjut mungkin diperlukan untuk memahami sepenuhnya hubungan antara variabel-variabel ini.''')
51
  #menampilkan penjelasan
52
+ with st.expander(' ### Explanation'):
53
+ st.caption(""" Pemilihan fitur menggunakan Random Forest umum dilakukan karena beberapa alasan:
54
+ - Kepentingan Fitur (Feature Importance): Random Forest memberikan skor kepentingan untuk setiap fitur. Skor ini membantu memahami fitur mana yang memiliki pengaruh lebih besar dalam membuat prediksi. Fitur dengan skor kepentingan yang tinggi cenderung memiliki pengaruh yang lebih besar pada kinerja model.
55
+ - Menangani Non-linieritas dan Interaksi: Random Forest dapat menangkap hubungan non-linier dan interaksi antar fitur, yang penting karena data dunia nyata sering menunjukkan hubungan yang kompleks yang mungkin tidak linear.
56
+ - Tahan Terhadap Overfitting: Random Forest cenderung lebih tahan terhadap overfitting dibandingkan dengan model yang lebih kompleks. Ini membuatnya lebih dapat diandalkan untuk pemilihan fitur dalam situasi di mana overfitting bisa menjadi masalah.
57
+ """ )
58
 
59
 
60