Spaces:
Sleeping
Sleeping
#!/usr/bin/env python | |
# coding: utf-8 | |
# ## Car Prediction | |
# İkinci el araç fiyatlarını (özelliklerine göre) tahmin eden modeller oluşturma ve MLOPs ile Hugging Fcae üzerinden yayımlayacağız | |
# In[42]: | |
import pandas as pd | |
from sklearn.model_selection import train_test_split #veri setini bölme işlemleri | |
from sklearn.linear_model import LinearRegression #Doğrusal regresyon | |
from sklearn.metrics import mean_squared_error # modelimizin performansını ölçmek için | |
from sklearn.compose import ColumnTransformer # sütun dönüşüm işlemleri | |
from sklearn.preprocessing import OneHotEncoder, StandardScaler # kategori- sayısal dönüşüm ve ölçekleme işlemleri | |
from sklearn.pipeline import Pipeline # veri işleme hattı | |
from sklearn.metrics import mean_squared_error, r2_score | |
# In[2]: | |
#excel dosyalarını okumak için | |
# In[28]: | |
get_ipython().system('pip install xldr') | |
# # Veri dosyasını yükle | |
# In[7]: | |
ls | |
# In[29]: | |
df=pd.read_excel("cars.xls") | |
df | |
# In[30]: | |
df.info() | |
# In[10]: | |
#veri ön işleme | |
# In[31]: | |
x=df.drop('Price',axis=1) #fiyat sütununu çıkar fiyata etki edenler kalsın | |
y=df['Price'] #tahmin | |
# In[32]: | |
x_train,x_test,y_train,y_test=train_test_split(x,y,test_size=0.2,random_state=42) | |
# # Veri ön işleme, standartlaştırma ve OHE işlemlerini otomatikleştiriyoruz (standartlaştırıyoruz). Artık preprocess kullanarak kullanıcında arayüz aracılığıyla gelen veriyi modelimize uygun hale çevirebiliriz | |
# In[33]: | |
preprocess=ColumnTransformer( | |
transformers=[ | |
('num',StandardScaler(),['Mileage', 'Cylinder','Liter','Doors']), | |
('cat',OneHotEncoder(),['Make','Model','Trim','Type']) | |
] | |
) | |
# In[34]: | |
my_model=LinearRegression() | |
# In[35]: | |
#pipeline ı tanımla | |
pipe=Pipeline(steps=[('preprocessor',preprocess),('model',my_model)]) | |
# In[38]: | |
#pipeline fit | |
pipe.fit(x_train,y_train) | |
# In[43]: | |
y_pred=pipe.predict(x_test) | |
print('RMSE',mean_squared_error(y_test,y_pred)**0.5) | |
print('R2',r2_score(y_test,y_pred)) | |
# In[44]: | |
#isterseniz veri setinin tammamıyla tekrar eğitim yapabilirsiniz. | |
#pipe.fit(X,y) | |
# ## Streamlit ile modeli yayma/deploy/kullanıma sunma | |
# In[41]: | |
get_ipython().system('pip install streamlit') | |
# Python ile yapılan çalışmnalrın hızlı bir şekilde deploy edilmesi için HTML render arayüzler tasarlamanızı sağlar | |
# In[47]: | |
import streamlit as st | |
#price tahmin fonksiyonu tanımla | |
def price(make,model,trim,mileage,car_type,cylinder,liter,doors,cruise,sound,leather): | |
input_data=pd.DataFrame({'Make':[make], | |
'Model':[model], | |
'Trim':[trim], | |
'Mileage':[mileage], | |
'Type':[car_type], | |
'Cylinder':[cylinder], | |
'Liter':[liter], | |
'Doors':[doors], | |
'Cruise':[cruise], | |
'Sound':[sound], | |
'Leather':[leather]}) | |
prediction=pipe.predict(input_data)[0] | |
return prediction | |
st.title("II. El Araba Fiyatı Tahmin:red_car: @aysel_olcer") | |
st.write('Arabanın özelliklerini seçiniz') | |
make=st.selectbox('Marka',df['Make'].unique()) | |
model=st.selectbox('Model',df[df['Make']==make]['Model'].unique()) | |
trim=st.selectbox('Trim',df[(df['Make']==make) &(df['Model']==model)]['Trim'].unique()) | |
mileage=st.number_input('Kilometre',100,200000) | |
car_type=st.selectbox('Araç Tipi',df['Type'].unique()) | |
cylinder=st.selectbox('Cylinder',df['Cylinder'].unique()) | |
liter=st.number_input('Yakıt Hacmi',1,10) | |
doors=st.selectbox('Kapı sayısı',df['Doors'].unique()) | |
cruise=st.radio('Hız Sbt.',[True,False]) | |
sound=st.radio('Ses Sis.',[True,False]) | |
leather=st.radio('Deri döşemes.',[True,False]) | |
if st.button('Tahmin Et'): | |
pred=price(make,model,trim,mileage,car_type,cylinder,liter,doors,cruise,sound,leather) | |
st.write('Fiyat:$',round(pred[0],2)) | |
# In[ ]: | |