Spaces:

BiswajitPadhi99
/

data_viz_project

Sleeping

App Files Files Community

BiswajitPadhi99 commited on Nov 26, 2024

Commit

dc05443

1 Parent(s): fcebbb6

Modify app.py

Browse files

Files changed (1) hide show

app.py +6 -16

app.py CHANGED Viewed

@@ -292,9 +292,9 @@ st.sidebar.header("Filter Data")
 @st.cache_data
 def load_data():
-    # Load the dataframes (update the paths as necessary)
     admissions_df = pd.read_feather('data/admissions.feather')
-    patients_df = pd.read_featehr('data/patients.feather')
     # diagnoses_icd_df = pd.read_csv('data/diagnoses_icd.csv')
     pharmacy_df = pd.read_feather('data/pharmacy.feather')
     # prescriptions_df = pd.read_csv('data/prescriptions.csv')
@@ -346,7 +346,7 @@ def load_data():
     # Convert datetime columns
     merged_df['admittime'] = pd.to_datetime(merged_df['admittime'])
     merged_df['dischtime'] = pd.to_datetime(merged_df['dischtime'])
-    merged_df['deathtime'] = pd.to_datetime(merged_df['deathtime'], errors='coerce')  # Some may not have deathtime
     # Create derived features
     merged_df['los'] = (merged_df['dischtime'] - merged_df['admittime']).dt.days
@@ -419,7 +419,6 @@ filtered_df = add_sidebar_filters(merged_df)
 # Display Summary Statistics for Q1
 st.header("Summary Statistics")
-# Create four columns for metrics
 col1, col2, col3, col4 = st.columns(4)
 with col1:
@@ -446,16 +445,12 @@ st.markdown("---")
 # Create Tabs for Q1 and Q2
 tabs = st.tabs(["General Overview", "Potential Biases"])
-# ---------------------------
 # Q1: General Overview
-# ---------------------------
 with tabs[0]:
     st.subheader("General Feature Distribution and Outcome Metrics")
-    # Define the number of columns per row
     num_cols = 2
-    # Define all Q1 plots in a list with titles and plot-generating functions
     q1_plots = [
         {
             "title": "Age Distribution of ICU Patients",
@@ -482,8 +477,7 @@ with tabs[0]:
             "plot": lambda: create_time_series_heatmap(filtered_df)
         }
     ]
-    # Arrange Q1 plots in a grid layout
     for i in range(0, len(q1_plots), num_cols):
         cols = st.columns(num_cols)
         for j in range(num_cols):
@@ -492,16 +486,13 @@ with tabs[0]:
                     st.subheader(q1_plots[i + j]["title"])
                     q1_plots[i + j]["plot"]()
-# ---------------------------
-# Q2: Potential Biases
-# ---------------------------
 with tabs[1]:
     st.subheader("Analyzing Potential Biases Across Demographics")
-    # Define the number of columns per row
     num_cols = 2
-    # Define all Q2 plots in a list with titles and plot-generating functions
     q2_plots = [
         {
             "title": "Mortality Rate by Race",
@@ -537,7 +528,6 @@ with tabs[1]:
         }
     ]
-    # Arrange Q2 plots in a grid layout
     for i in range(0, len(q2_plots), num_cols):
         cols = st.columns(num_cols)
         for j in range(num_cols):

 @st.cache_data
 def load_data():
     admissions_df = pd.read_feather('data/admissions.feather')
+    patients_df = pd.read_feather('data/patients.feather')
     # diagnoses_icd_df = pd.read_csv('data/diagnoses_icd.csv')
     pharmacy_df = pd.read_feather('data/pharmacy.feather')
     # prescriptions_df = pd.read_csv('data/prescriptions.csv')
     # Convert datetime columns
     merged_df['admittime'] = pd.to_datetime(merged_df['admittime'])
     merged_df['dischtime'] = pd.to_datetime(merged_df['dischtime'])
+    merged_df['deathtime'] = pd.to_datetime(merged_df['deathtime'], errors='coerce')
     # Create derived features
     merged_df['los'] = (merged_df['dischtime'] - merged_df['admittime']).dt.days
 # Display Summary Statistics for Q1
 st.header("Summary Statistics")
 col1, col2, col3, col4 = st.columns(4)
 with col1:
 # Create Tabs for Q1 and Q2
 tabs = st.tabs(["General Overview", "Potential Biases"])
 # Q1: General Overview
 with tabs[0]:
     st.subheader("General Feature Distribution and Outcome Metrics")
     num_cols = 2
     q1_plots = [
         {
             "title": "Age Distribution of ICU Patients",
             "plot": lambda: create_time_series_heatmap(filtered_df)
         }
     ]
     for i in range(0, len(q1_plots), num_cols):
         cols = st.columns(num_cols)
         for j in range(num_cols):
                     st.subheader(q1_plots[i + j]["title"])
                     q1_plots[i + j]["plot"]()
+# Q2: Potential Biases from patient side
 with tabs[1]:
     st.subheader("Analyzing Potential Biases Across Demographics")
     num_cols = 2
     q2_plots = [
         {
             "title": "Mortality Rate by Race",
         }
     ]
     for i in range(0, len(q2_plots), num_cols):
         cols = st.columns(num_cols)
         for j in range(num_cols):