Spaces:

2nzi
/

GetAround

Sleeping

App Files Files Community

2nzi commited on Jul 11

Commit

4b1c8a4

•

1 Parent(s): c698239

update files

Browse files

Files changed (2) hide show

app.py +185 -67
get_around_pricing_project.csv +0 -0

app.py CHANGED Viewed

@@ -9,12 +9,26 @@ import streamlit as st
 import pandas as pd
 import plotly.express as px
 import plotly.graph_objects as go
-import numpy as np
 DATA_URL = 'https://full-stack-assets.s3.eu-west-3.amazonaws.com/Deployment/get_around_delay_analysis.xlsx'
 @st.cache_data
 def load_data():
     data = pd.read_excel(DATA_URL)
@@ -24,23 +38,58 @@ data = load_data()
 print('state: ',data['state'].value_counts())
 st.markdown("""
-    Bienvenue sur ce tableau de bord streamlit du `Projet Get Around`. Nos <a href=DATA_URL style="text-decoration: none;">données</a>
     illustrent quelques statistiques et visualisations de données. A l'aide de cet un outil permet de suivre et comprendre les données des locations de voitures réalisé par
     <a href="https://github.com/2nzi" style="text-decoration: none;">@2nzi</a> sur github.
 """, unsafe_allow_html=True)
-if st.checkbox('Show raw data'):
     st.subheader('Raw data')
-    st.write(data)
-data = data.drop(['time_delta_with_previous_rental_in_minutes','previous_ended_rental_id'],axis=1)
-st.subheader("Part des différents types de location")
 st.markdown("""
-    Deux types de locations existe. Connect & Mobile.
 """, unsafe_allow_html=True)
 fig = px.pie(data, values='car_id',names='checkin_type')
@@ -49,7 +98,7 @@ st.plotly_chart(fig)
-st.subheader("Repartition des locations annulées dans chaque type de commande")
 fig = px.histogram(data,x='checkin_type',color='state')
 st.plotly_chart(fig)
@@ -62,24 +111,33 @@ upper_bound = col_med + 2 * col_std
 print(col_med,lower_bound,upper_bound)
 data = data[(data[col] >= lower_bound) & (data[col] <= upper_bound)]
 print('state: ',data['state'].value_counts())
-#utiliser Q1-1.5IQR et Q3+1.5IQR
-if st.checkbox('Show on Late',value=True):
     mini = 0
     df = data[data['delay_at_checkout_in_minutes']>mini]
-    title_late = 'Late cars'
 else:
     df = data
-    title_late = 'All cars'
     mini = int(df['delay_at_checkout_in_minutes'].min())
-st.subheader(title_late)
-trsh = int(df['delay_at_checkout_in_minutes'].max()) #make the max chossable !
-seuil = st.slider("Choose the minute threshold!", mini, int(df['delay_at_checkout_in_minutes'].max()), int(trsh*0.1))
 # seuil = st.slider("Choose the minute threshold!", 0, trsh, int(trsh*0.1))
 fig_px = px.histogram(df, color='checkin_type', x='delay_at_checkout_in_minutes')
 fig = go.Figure(fig_px)
@@ -106,76 +164,136 @@ fig.update_layout(
     yaxis_title="Count"
 )
-st.plotly_chart(fig)
-col1, col2 = st.columns(2)
-move_upper_mask = df['delay_at_checkout_in_minutes']<seuil
-lower_mask = df['delay_at_checkout_in_minutes']>mini
-global_mask = move_upper_mask & lower_mask
-col1.metric("Number of rent", len(df[global_mask]))
-part_of_rent = 100*len(df[move_upper_mask]) / len(df)
-col2.metric("Part of rent", f'{part_of_rent:.2f}%')
-# col2.metric("Part of rent", f'{100*len(df[df['delay_at_checkout_in_minutes']<seuil])/len(df['delay_at_checkout_in_minutes']):.2f}%')
-#IDEE:
-# pouvoir choisir l'id d'une voiture spécifiquement
-# day_data = data[data['dateRep']== start_time]
-# st.subheader("Analyse par pays")
-# country = st.selectbox("Select a country you want to see sales", data["countriesAndTerritories"].sort_values().unique())
-# st.write("Current growth rate")
-# country_data = data[data["countriesAndTerritories"]==country]
-# from random import randrange
-# current_day = randrange(len(country_data))
-# # current_day = int(len(country_data)/2) #take random value
-# # st.write(country_data.iloc[current_day]['dateRep'])
-# # st.write(country_data.iloc[current_day]['cases'])
-# # st.write(country_data.iloc[current_day-1]['cases'])
-# ratio = np.round((country_data.iloc[current_day]['cases'] - country_data.iloc[current_day-1]['cases'])/country_data.iloc[current_day]['cases'],2)
-# ratio2 = np.round((country_data.iloc[current_day]['cases'] - country_data.iloc[current_day-2]['cases'])/country_data.iloc[current_day-1]['cases'],2)
-# diff_ratio = np.round(ratio-ratio2,2)
-# st.metric(label="",value = ratio, delta = diff_ratio)
-# # st.write(f'{ratio:.2f}')
-# #### Create two columns
-# col1, col2 = st.columns(2)
-# with col1:
-#     st.subheader('Cas positifs cases')
-#     fig = go.Figure()
-#     fig.add_trace(go.Scatter(x=data_date["dateRep"], y=data_date["cases"], mode='lines',name='new cases', line=dict(color='blue')))
-#     fig.add_trace(go.Scatter(x=data_date["dateRep"], y=data_date["Rolcases"], mode='lines',name='Rolling 7-day Mean',line=dict(color='red')))
-#     st.plotly_chart(fig)
-# with col2:
-#     st.subheader('Cas de décès')
-#     fig2 = go.Figure()
-#     fig2.add_trace(go.Scatter(x=data_date["dateRep"], y=data_date["deaths"], mode='lines',name='new cases', line=dict(color='blue')))
-#     fig2.add_trace(go.Scatter(x=data_date["dateRep"], y=data_date["Roldeaths"], mode='lines',name='Rolling 7-day Mean',line=dict(color='red')))
-#     st.plotly_chart(fig2)

 import pandas as pd
 import plotly.express as px
 import plotly.graph_objects as go
+import requests
 DATA_URL = 'https://full-stack-assets.s3.eu-west-3.amazonaws.com/Deployment/get_around_delay_analysis.xlsx'
+st.set_page_config(layout="wide")
+st.markdown(
+    """
+    <style>
+    .main {
+        margin: 0 auto; /* Centers the content */
+        max-width: 1000px;
+    }
+    </style>
+    """,
+    unsafe_allow_html=True
+)
 @st.cache_data
 def load_data():
     data = pd.read_excel(DATA_URL)
 print('state: ',data['state'].value_counts())
 st.markdown("""
+    <div style="text-align: center;">
+        <img src="https://lever-client-logos.s3.amazonaws.com/2bd4cdf9-37f2-497f-9096-c2793296a75f-1568844229943.png" alt="GetAround logo" style="width: 80%;">
+    </div>
+    <br>
+    Bienvenue sur ce dashboard streamlit du `Projet Get Around`. Nos <a href="https://full-stack-assets.s3.eu-west-3.amazonaws.com/Deployment/get_around_delay_analysis.xlsx" style="text-decoration: none;">données</a>
     illustrent quelques statistiques et visualisations de données. A l'aide de cet un outil permet de suivre et comprendre les données des locations de voitures réalisé par
     <a href="https://github.com/2nzi" style="text-decoration: none;">@2nzi</a> sur github.
+    <br><br><br>
 """, unsafe_allow_html=True)
+st.markdown("""---""")
+st.markdown("""<br>""", unsafe_allow_html=True)
+st.subheader("1] Part des différents types de location")
+if st.checkbox('Montrer les données brutes'):
     st.subheader('Raw data')
+    st.write(data)
+    st.markdown("""
+    <div style="background-color: #F5EAF4; padding: 10px;">
+    | Nom du champ                                  | Commentaire                                                                                                                  |
+    |-----------------------------------------------|------------------------------------------------------------------------------------------------------------------------------|
+    | **rental_id**                                 | Identifiant unique de la location                                                                                            |
+    | **car_id**                                    | Identifiant unique de la voiture                                                                                             |
+    | **checkin_type**                              | Flux utilisé pour l'enregistrement et le retour. (c'est-à-dire accès et retour de la voiture)                                |
+    |                                               | - **mobile** : contrat de location signé sur le smartphone du propriétaire                                                   |
+    |                                               | - **connect** : voiture équipée de la technologie Connect, ouverte par le conducteur avec son smartphone                     |
+    |                                               | *Note : les contrats papier ont été exclus des données car nous n'avons pas de données sur leur retard lors du retour et c'est un cas d'utilisation négligeable* |
+    | **state**                                     | annulé signifie que la location n'a pas eu lieu (a été annulée par le conducteur ou le propriétaire).                        |
+    | **delay_at_checkout_in_minutes**              | Différence en minutes entre l'heure de fin de location demandée par le conducteur lors de la réservation de la voiture et l'heure réelle à laquelle le conducteur a terminé le retour. Les valeurs négatives signifient que le conducteur a rendu la voiture en avance. |
+    | **previous_ended_rental_id**                  | Identifiant de la location précédente terminée de la voiture (NULL lorsqu'il n'y a pas de location précédente ou que le délai avec la location précédente est supérieur à 12 heures). |
+    | **time_delta_with_previous_rental_in_minutes**| Différence en minutes entre l'heure de début prévue de cette location et l'heure de fin prévue de la location précédente (lorsque inférieure à 12 heures, NULL si supérieure). |
+    </div>
+    """, unsafe_allow_html=True)
+# data = data.drop(['time_delta_with_previous_rental_in_minutes','previous_ended_rental_id'],axis=1)
 st.markdown("""
+    <br>
+    Deux types de locations existent : Connect & Mobile.
+    **Mobile** : le conducteur et le propriétaire se rencontrent et signent tous deux le contrat de location sur le smartphone du propriétaire.
+    **Connect** : le conducteur ne rencontre pas le propriétaire et ouvre la voiture avec son smartphone.
 """, unsafe_allow_html=True)
 fig = px.pie(data, values='car_id',names='checkin_type')
+st.subheader("2] Repartition des locations annulées dans chaque type de commande")
 fig = px.histogram(data,x='checkin_type',color='state')
 st.plotly_chart(fig)
 print(col_med,lower_bound,upper_bound)
 data = data[(data[col] >= lower_bound) & (data[col] <= upper_bound)]
 print('state: ',data['state'].value_counts())
+st.subheader("3] Retard des locations")
+if st.checkbox('Montrer uniquement les voitures en retard',value=True):
     mini = 0
     df = data[data['delay_at_checkout_in_minutes']>mini]
 else:
     df = data
     mini = int(df['delay_at_checkout_in_minutes'].min())
+trsh = int(df['delay_at_checkout_in_minutes'].max())
+seuil = st.slider("Choisir le temps de retard en minute", mini, int(df['delay_at_checkout_in_minutes'].max()), int(trsh*0.2))
+maxi = int(df['delay_at_checkout_in_minutes'].max())
 # seuil = st.slider("Choose the minute threshold!", 0, trsh, int(trsh*0.1))
+move_upper_mask = df['delay_at_checkout_in_minutes']<seuil
+lower_mask = df['delay_at_checkout_in_minutes']>mini
+global_mask = move_upper_mask & lower_mask
+number_of_rent = len(df[global_mask])
+part_of_rent = 100 * len(df[move_upper_mask]) / len(df)
 fig_px = px.histogram(df, color='checkin_type', x='delay_at_checkout_in_minutes')
 fig = go.Figure(fig_px)
     yaxis_title="Count"
 )
+fig.add_annotation(
+    x=(x+mini)/2,
+    y=0.8,
+    xref='x',
+    yref='paper',
+    text=f"{number_of_rent}",
+    showarrow=False,
+    font=dict(size=12, color="Green"),
+)
+fig.add_annotation(
+    x=(x+mini)/2,
+    y=0.9,
+    xref='x',
+    yref='paper',
+    text=f"{part_of_rent:.2f}%",
+    # text=f"Number of rent: {number_of_rent}",
+    showarrow=False,
+    font=dict(size=16, color="Green"),
+)
+fig.add_shape(
+    type="rect",
+    x0=x, x1=maxi, y0=0, y1=1,
+    fillcolor="Red",
+    opacity=0.2,
+    line_width=0,
+    xref='x', yref='paper'
+)
+fig.add_annotation(
+    x=(maxi+x)/2,
+    y=0.8,
+    xref='x',
+    yref='paper',
+    text=f"{len(df)-number_of_rent}",
+    showarrow=False,
+    font=dict(size=12, color="Red"),
+)
+fig.add_annotation(
+    x=(maxi+x)/2,
+    y=0.9,
+    xref='x',
+    yref='paper',
+    text=f"{100-part_of_rent:.2f}%",
+    # text=f"Number of rent: {number_of_rent}",
+    showarrow=False,
+    font=dict(size=16, color="Red"),
+)
+st.plotly_chart(fig)
+#IDEE:
+# pouvoir choisir l'id d'une voiture spécifiquement
+st.subheader("4] Impact du retard sur les conducteurs suivant")
+df_late_impact = df[df['previous_ended_rental_id'].notna()]
+if st.checkbox('données brutes'):
+    # st.subheader('Raw data')
+    st.write(df_late_impact)
+fig_px = px.histogram(df_late_impact, color='checkin_type', x='time_delta_with_previous_rental_in_minutes',nbins=35)
+fig = go.Figure(fig_px)
+fig.update_layout(
+    title="",
+    xaxis_title="Delay with the previous rental in Minutes",
+    yaxis_title="Count"
+)
+st.plotly_chart(fig)
+car_brands = ["Citroën", "Peugeot", "PGO", "Renault", "Audi", "BMW", "other", "Mercedes", "Opel", "Volkswagen", "Ferrari", "Maserati", "Mitsubishi", "Nissan", "SEAT", "Subaru", "Toyota"]
+fuel_types = ["diesel", "petrol", "hybrid_petrol", "electro"]
+paint_colors = ["black", "grey", "white", "red", "silver", "blue", "orange", "beige", "brown", "green"]
+car_types = ["convertible", "coupe", "estate", "hatchback", "sedan", "subcompact", "suv", "van"]
+st.subheader("5] API de Prédiction de la Valeur des Voitures GetAround")
+col1, col2 = st.columns(2)
+with col1:
+    marque = st.selectbox("Marque", car_brands, index=3)  # Par défaut "Renault"
+    kilometrage = st.number_input("Kilométrage", min_value=0, step=1000, value=10000)
+    puissance_moteur = st.number_input("Puissance du Moteur (HP)", min_value=0, step=10, value=100)
+    carburant = st.selectbox("Type de Carburant", fuel_types, index=0)  # Par défaut "diesel"
+    couleur_peinture = st.selectbox("Couleur de la Peinture", paint_colors, index=0)  # Par défaut "black"
+    type_voiture = st.selectbox("Type de Voiture", car_types, index=4)  # Par défaut "sedan"
+with col2:
+    parking_prive_disponible = st.checkbox("Parking Privé", value=True)
+    gps_disponible = st.checkbox("GPS Disponible", value=True)
+    climatisation_disponible = st.checkbox("Climatisation", value=True)
+    voiture_automatique = st.checkbox("Voiture Automatique", value=False)
+    getaround_connect_disponible = st.checkbox("GetAround Connect", value=True)
+    regulateur_vitesse_disponible = st.checkbox("Régulateur de Vitesse", value=True)
+    pneus_hiver = st.checkbox("Pneus Hiver", value=False)
+url = "https://2nzi-getaroundapi.hf.space/predict"
+if st.button("Prédire la Valeur de la Voiture"):
+    input_data = {
+        "brand": marque,
+        "mileage": kilometrage,
+        "engine_power": puissance_moteur,
+        "fuel": carburant,
+        "paint_color": couleur_peinture,
+        "car_type": type_voiture,
+        "private_parking_available": parking_prive_disponible,
+        "has_gps": gps_disponible,
+        "has_air_conditioning": climatisation_disponible,
+        "automatic_car": voiture_automatique,
+        "has_getaround_connect": getaround_connect_disponible,
+        "has_speed_regulator": regulateur_vitesse_disponible,
+        "winter_tires": pneus_hiver
+    }
+    response = requests.post(url, params=input_data)
+    # Afficher la réponse du serveur
+    if response.status_code == 200:
+        result = response.json()
+        st.write("Résultat de la Prédiction:", result)
+    else:
+        st.write("Erreur:", response.status_code, response.text)

get_around_pricing_project.csv ADDED Viewed

The diff for this file is too large to render. See raw diff