{ "cells": [ { "cell_type": "code", "execution_count": 195, "id": "5be042ac-489f-47cc-af42-74bf06634e82", "metadata": {}, "outputs": [], "source": [ "import numpy as np\n", "import pandas as pd\n", "import matplotlib.pyplot as plt\n", "import seaborn as sns\n", "%matplotlib inline\n", "import warnings\n", "warnings.filterwarnings(\"ignore\")" ] }, { "cell_type": "code", "execution_count": 196, "id": "187059e1-c38e-4a89-8545-4a18501f0896", "metadata": {}, "outputs": [], "source": [ "train_data = pd.read_csv('train.csv')\n", "feature_data = pd.read_csv('features.csv')\n", "store_data = pd.read_csv('stores.csv')\n", "test_data = pd.read_csv('test.csv')" ] }, { "cell_type": "code", "execution_count": 197, "id": "9ad5a308-174d-4eff-9e50-b5d16c02eb85", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", " | Store | \n", "Dept | \n", "Date | \n", "Weekly_Sales | \n", "IsHoliday | \n", "
---|---|---|---|---|---|
0 | \n", "1 | \n", "1 | \n", "2010-02-05 | \n", "24924.50 | \n", "False | \n", "
1 | \n", "1 | \n", "1 | \n", "2010-02-12 | \n", "46039.49 | \n", "True | \n", "
2 | \n", "1 | \n", "1 | \n", "2010-02-19 | \n", "41595.55 | \n", "False | \n", "
3 | \n", "1 | \n", "1 | \n", "2010-02-26 | \n", "19403.54 | \n", "False | \n", "
4 | \n", "1 | \n", "1 | \n", "2010-03-05 | \n", "21827.90 | \n", "False | \n", "
\n", " | Store | \n", "Date | \n", "Temperature | \n", "Fuel_Price | \n", "MarkDown1 | \n", "MarkDown2 | \n", "MarkDown3 | \n", "MarkDown4 | \n", "MarkDown5 | \n", "CPI | \n", "Unemployment | \n", "IsHoliday | \n", "
---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | \n", "1 | \n", "2010-02-05 | \n", "42.31 | \n", "2.572 | \n", "NaN | \n", "NaN | \n", "NaN | \n", "NaN | \n", "NaN | \n", "211.096358 | \n", "8.106 | \n", "False | \n", "
1 | \n", "1 | \n", "2010-02-12 | \n", "38.51 | \n", "2.548 | \n", "NaN | \n", "NaN | \n", "NaN | \n", "NaN | \n", "NaN | \n", "211.242170 | \n", "8.106 | \n", "True | \n", "
2 | \n", "1 | \n", "2010-02-19 | \n", "39.93 | \n", "2.514 | \n", "NaN | \n", "NaN | \n", "NaN | \n", "NaN | \n", "NaN | \n", "211.289143 | \n", "8.106 | \n", "False | \n", "
3 | \n", "1 | \n", "2010-02-26 | \n", "46.63 | \n", "2.561 | \n", "NaN | \n", "NaN | \n", "NaN | \n", "NaN | \n", "NaN | \n", "211.319643 | \n", "8.106 | \n", "False | \n", "
4 | \n", "1 | \n", "2010-03-05 | \n", "46.50 | \n", "2.625 | \n", "NaN | \n", "NaN | \n", "NaN | \n", "NaN | \n", "NaN | \n", "211.350143 | \n", "8.106 | \n", "False | \n", "
\n", " | Store | \n", "Type | \n", "Size | \n", "
---|---|---|---|
0 | \n", "1 | \n", "A | \n", "151315 | \n", "
1 | \n", "2 | \n", "A | \n", "202307 | \n", "
2 | \n", "3 | \n", "B | \n", "37392 | \n", "
3 | \n", "4 | \n", "A | \n", "205863 | \n", "
4 | \n", "5 | \n", "B | \n", "34875 | \n", "
\n", " | Store | \n", "Type | \n", "Size | \n", "
---|---|---|---|
0 | \n", "1 | \n", "A | \n", "151315 | \n", "
1 | \n", "2 | \n", "A | \n", "202307 | \n", "
2 | \n", "3 | \n", "B | \n", "37392 | \n", "
3 | \n", "4 | \n", "A | \n", "205863 | \n", "
4 | \n", "5 | \n", "B | \n", "34875 | \n", "
\n", " | Store | \n", "Dept | \n", "Date | \n", "Weekly_Sales | \n", "IsHoliday | \n", "
---|---|---|---|---|---|
0 | \n", "1 | \n", "1 | \n", "2010-02-05 | \n", "24924.50 | \n", "False | \n", "
1 | \n", "1 | \n", "1 | \n", "2010-02-12 | \n", "46039.49 | \n", "True | \n", "
2 | \n", "1 | \n", "1 | \n", "2010-02-19 | \n", "41595.55 | \n", "False | \n", "
3 | \n", "1 | \n", "1 | \n", "2010-02-26 | \n", "19403.54 | \n", "False | \n", "
4 | \n", "1 | \n", "1 | \n", "2010-03-05 | \n", "21827.90 | \n", "False | \n", "
\n", " | Store | \n", "Dept | \n", "Date | \n", "Weekly_Sales | \n", "IsHoliday | \n", "Type | \n", "Size | \n", "Temperature | \n", "Fuel_Price | \n", "MarkDown1 | \n", "MarkDown2 | \n", "MarkDown3 | \n", "MarkDown4 | \n", "MarkDown5 | \n", "CPI | \n", "Unemployment | \n", "
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | \n", "1 | \n", "1 | \n", "2010-02-05 | \n", "24924.50 | \n", "False | \n", "A | \n", "151315 | \n", "42.31 | \n", "2.572 | \n", "NaN | \n", "NaN | \n", "NaN | \n", "NaN | \n", "NaN | \n", "211.096358 | \n", "8.106 | \n", "
1 | \n", "1 | \n", "1 | \n", "2010-02-12 | \n", "46039.49 | \n", "True | \n", "A | \n", "151315 | \n", "38.51 | \n", "2.548 | \n", "NaN | \n", "NaN | \n", "NaN | \n", "NaN | \n", "NaN | \n", "211.242170 | \n", "8.106 | \n", "
2 | \n", "1 | \n", "1 | \n", "2010-02-19 | \n", "41595.55 | \n", "False | \n", "A | \n", "151315 | \n", "39.93 | \n", "2.514 | \n", "NaN | \n", "NaN | \n", "NaN | \n", "NaN | \n", "NaN | \n", "211.289143 | \n", "8.106 | \n", "
3 | \n", "1 | \n", "1 | \n", "2010-02-26 | \n", "19403.54 | \n", "False | \n", "A | \n", "151315 | \n", "46.63 | \n", "2.561 | \n", "NaN | \n", "NaN | \n", "NaN | \n", "NaN | \n", "NaN | \n", "211.319643 | \n", "8.106 | \n", "
4 | \n", "1 | \n", "1 | \n", "2010-03-05 | \n", "21827.90 | \n", "False | \n", "A | \n", "151315 | \n", "46.50 | \n", "2.625 | \n", "NaN | \n", "NaN | \n", "NaN | \n", "NaN | \n", "NaN | \n", "211.350143 | \n", "8.106 | \n", "
\n", " | Store | \n", "Dept | \n", "Date | \n", "Weekly_Sales | \n", "IsHoliday | \n", "Type | \n", "Size | \n", "Temperature | \n", "Fuel_Price | \n", "CPI | \n", "Unemployment | \n", "
---|---|---|---|---|---|---|---|---|---|---|---|
0 | \n", "1 | \n", "1 | \n", "2010-02-05 | \n", "24924.50 | \n", "False | \n", "A | \n", "151315 | \n", "42.31 | \n", "2.572 | \n", "211.096358 | \n", "8.106 | \n", "
1 | \n", "1 | \n", "1 | \n", "2010-02-12 | \n", "46039.49 | \n", "True | \n", "A | \n", "151315 | \n", "38.51 | \n", "2.548 | \n", "211.242170 | \n", "8.106 | \n", "
2 | \n", "1 | \n", "1 | \n", "2010-02-19 | \n", "41595.55 | \n", "False | \n", "A | \n", "151315 | \n", "39.93 | \n", "2.514 | \n", "211.289143 | \n", "8.106 | \n", "
3 | \n", "1 | \n", "1 | \n", "2010-02-26 | \n", "19403.54 | \n", "False | \n", "A | \n", "151315 | \n", "46.63 | \n", "2.561 | \n", "211.319643 | \n", "8.106 | \n", "
4 | \n", "1 | \n", "1 | \n", "2010-03-05 | \n", "21827.90 | \n", "False | \n", "A | \n", "151315 | \n", "46.50 | \n", "2.625 | \n", "211.350143 | \n", "8.106 | \n", "
\n", " | Store | \n", "Dept | \n", "Date | \n", "Weekly_Sales | \n", "IsHoliday | \n", "Type | \n", "Size | \n", "Temperature | \n", "Fuel_Price | \n", "CPI | \n", "Unemployment | \n", "
---|---|---|---|---|---|---|---|---|---|---|---|
0 | \n", "1 | \n", "1 | \n", "2010-02-05 | \n", "24924.50 | \n", "False | \n", "A | \n", "151315 | \n", "42.31 | \n", "2.572 | \n", "211.096358 | \n", "8.106 | \n", "
1 | \n", "1 | \n", "1 | \n", "2010-02-12 | \n", "46039.49 | \n", "True | \n", "A | \n", "151315 | \n", "38.51 | \n", "2.548 | \n", "211.242170 | \n", "8.106 | \n", "
2 | \n", "1 | \n", "1 | \n", "2010-02-19 | \n", "41595.55 | \n", "False | \n", "A | \n", "151315 | \n", "39.93 | \n", "2.514 | \n", "211.289143 | \n", "8.106 | \n", "
3 | \n", "1 | \n", "1 | \n", "2010-02-26 | \n", "19403.54 | \n", "False | \n", "A | \n", "151315 | \n", "46.63 | \n", "2.561 | \n", "211.319643 | \n", "8.106 | \n", "
4 | \n", "1 | \n", "1 | \n", "2010-03-05 | \n", "21827.90 | \n", "False | \n", "A | \n", "151315 | \n", "46.50 | \n", "2.625 | \n", "211.350143 | \n", "8.106 | \n", "
... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
10239 | \n", "1 | \n", "99 | \n", "2012-08-31 | \n", "20.06 | \n", "False | \n", "A | \n", "151315 | \n", "80.49 | \n", "3.638 | \n", "222.305480 | \n", "6.908 | \n", "
10240 | \n", "1 | \n", "99 | \n", "2012-09-07 | \n", "0.05 | \n", "True | \n", "A | \n", "151315 | \n", "83.96 | \n", "3.730 | \n", "222.439015 | \n", "6.908 | \n", "
10241 | \n", "1 | \n", "99 | \n", "2012-09-14 | \n", "0.03 | \n", "False | \n", "A | \n", "151315 | \n", "74.97 | \n", "3.717 | \n", "222.582019 | \n", "6.908 | \n", "
10242 | \n", "1 | \n", "99 | \n", "2012-10-05 | \n", "635.00 | \n", "False | \n", "A | \n", "151315 | \n", "68.55 | \n", "3.617 | \n", "223.181477 | \n", "6.573 | \n", "
10243 | \n", "1 | \n", "99 | \n", "2012-10-12 | \n", "80.00 | \n", "False | \n", "A | \n", "151315 | \n", "62.99 | \n", "3.601 | \n", "223.381296 | \n", "6.573 | \n", "
10244 rows × 11 columns
\n", "\n", " | Store | \n", "Dept | \n", "Date | \n", "Weekly_Sales | \n", "IsHoliday | \n", "Type | \n", "Size | \n", "Temperature | \n", "Fuel_Price | \n", "CPI | \n", "Unemployment | \n", "
---|---|---|---|---|---|---|---|---|---|---|---|
846 | \n", "1 | \n", "6 | \n", "2012-08-10 | \n", "-139.65 | \n", "False | \n", "A | \n", "151315 | \n", "85.05 | \n", "3.494 | \n", "221.958433 | \n", "6.908 | \n", "
2384 | \n", "1 | \n", "18 | \n", "2012-05-04 | \n", "-1.27 | \n", "False | \n", "A | \n", "151315 | \n", "75.55 | \n", "3.749 | \n", "221.671800 | \n", "7.143 | \n", "
6048 | \n", "1 | \n", "47 | \n", "2010-02-19 | \n", "-863.00 | \n", "False | \n", "A | \n", "151315 | \n", "39.93 | \n", "2.514 | \n", "211.289143 | \n", "8.106 | \n", "
6049 | \n", "1 | \n", "47 | \n", "2010-03-12 | \n", "-698.00 | \n", "False | \n", "A | \n", "151315 | \n", "57.79 | \n", "2.667 | \n", "211.380643 | \n", "8.106 | \n", "
6051 | \n", "1 | \n", "47 | \n", "2010-10-08 | \n", "-58.00 | \n", "False | \n", "A | \n", "151315 | \n", "63.93 | \n", "2.633 | \n", "211.746754 | \n", "7.838 | \n", "
... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
419597 | \n", "45 | \n", "80 | \n", "2010-02-12 | \n", "-0.43 | \n", "True | \n", "B | \n", "118221 | \n", "27.73 | \n", "2.773 | \n", "181.982317 | \n", "8.992 | \n", "
419598 | \n", "45 | \n", "80 | \n", "2010-02-19 | \n", "-0.27 | \n", "False | \n", "B | \n", "118221 | \n", "31.27 | \n", "2.745 | \n", "182.034782 | \n", "8.992 | \n", "
419603 | \n", "45 | \n", "80 | \n", "2010-04-16 | \n", "-1.61 | \n", "False | \n", "B | \n", "118221 | \n", "54.28 | \n", "2.899 | \n", "181.692477 | \n", "8.899 | \n", "
419614 | \n", "45 | \n", "80 | \n", "2010-07-02 | \n", "-0.27 | \n", "False | \n", "B | \n", "118221 | \n", "76.61 | \n", "2.815 | \n", "182.318780 | \n", "8.743 | \n", "
419640 | \n", "45 | \n", "80 | \n", "2011-02-11 | \n", "-0.24 | \n", "True | \n", "B | \n", "118221 | \n", "30.30 | \n", "3.239 | \n", "183.701613 | \n", "8.549 | \n", "
1358 rows × 11 columns
\n", "\n", " | Store | \n", "Dept | \n", "Date | \n", "Weekly_Sales | \n", "IsHoliday | \n", "Type | \n", "Size | \n", "Temperature | \n", "Fuel_Price | \n", "CPI | \n", "Unemployment | \n", "
---|---|---|---|---|---|---|---|---|---|---|---|
0 | \n", "1 | \n", "1 | \n", "2010-02-05 | \n", "24924.50 | \n", "False | \n", "A | \n", "151315 | \n", "42.31 | \n", "2.572 | \n", "211.096358 | \n", "8.106 | \n", "
1 | \n", "1 | \n", "1 | \n", "2010-02-12 | \n", "46039.49 | \n", "True | \n", "A | \n", "151315 | \n", "38.51 | \n", "2.548 | \n", "211.242170 | \n", "8.106 | \n", "
2 | \n", "1 | \n", "1 | \n", "2010-02-19 | \n", "41595.55 | \n", "False | \n", "A | \n", "151315 | \n", "39.93 | \n", "2.514 | \n", "211.289143 | \n", "8.106 | \n", "
3 | \n", "1 | \n", "1 | \n", "2010-02-26 | \n", "19403.54 | \n", "False | \n", "A | \n", "151315 | \n", "46.63 | \n", "2.561 | \n", "211.319643 | \n", "8.106 | \n", "
4 | \n", "1 | \n", "1 | \n", "2010-03-05 | \n", "21827.90 | \n", "False | \n", "A | \n", "151315 | \n", "46.50 | \n", "2.625 | \n", "211.350143 | \n", "8.106 | \n", "
... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
421565 | \n", "45 | \n", "98 | \n", "2012-09-28 | \n", "508.37 | \n", "False | \n", "B | \n", "118221 | \n", "64.88 | \n", "3.997 | \n", "192.013558 | \n", "8.684 | \n", "
421566 | \n", "45 | \n", "98 | \n", "2012-10-05 | \n", "628.10 | \n", "False | \n", "B | \n", "118221 | \n", "64.89 | \n", "3.985 | \n", "192.170412 | \n", "8.667 | \n", "
421567 | \n", "45 | \n", "98 | \n", "2012-10-12 | \n", "1061.02 | \n", "False | \n", "B | \n", "118221 | \n", "54.47 | \n", "4.000 | \n", "192.327265 | \n", "8.667 | \n", "
421568 | \n", "45 | \n", "98 | \n", "2012-10-19 | \n", "760.01 | \n", "False | \n", "B | \n", "118221 | \n", "56.47 | \n", "3.969 | \n", "192.330854 | \n", "8.667 | \n", "
421569 | \n", "45 | \n", "98 | \n", "2012-10-26 | \n", "1076.80 | \n", "False | \n", "B | \n", "118221 | \n", "58.85 | \n", "3.882 | \n", "192.308899 | \n", "8.667 | \n", "
420212 rows × 11 columns
\n", "\n", " | Store | \n", "Dept | \n", "Date | \n", "Weekly_Sales | \n", "IsHoliday | \n", "Type | \n", "Size | \n", "Temperature | \n", "Fuel_Price | \n", "CPI | \n", "Unemployment | \n", "Week | \n", "Year | \n", "Month | \n", "
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | \n", "1 | \n", "1 | \n", "2010-02-05 | \n", "24924.50 | \n", "False | \n", "A | \n", "151315 | \n", "42.31 | \n", "2.572 | \n", "211.096358 | \n", "8.106 | \n", "5 | \n", "2010 | \n", "2 | \n", "
1 | \n", "1 | \n", "1 | \n", "2010-02-12 | \n", "46039.49 | \n", "True | \n", "A | \n", "151315 | \n", "38.51 | \n", "2.548 | \n", "211.242170 | \n", "8.106 | \n", "6 | \n", "2010 | \n", "2 | \n", "
2 | \n", "1 | \n", "1 | \n", "2010-02-19 | \n", "41595.55 | \n", "False | \n", "A | \n", "151315 | \n", "39.93 | \n", "2.514 | \n", "211.289143 | \n", "8.106 | \n", "7 | \n", "2010 | \n", "2 | \n", "
3 | \n", "1 | \n", "1 | \n", "2010-02-26 | \n", "19403.54 | \n", "False | \n", "A | \n", "151315 | \n", "46.63 | \n", "2.561 | \n", "211.319643 | \n", "8.106 | \n", "8 | \n", "2010 | \n", "2 | \n", "
4 | \n", "1 | \n", "1 | \n", "2010-03-05 | \n", "21827.90 | \n", "False | \n", "A | \n", "151315 | \n", "46.50 | \n", "2.625 | \n", "211.350143 | \n", "8.106 | \n", "9 | \n", "2010 | \n", "3 | \n", "
\n", " | Store | \n", "Dept | \n", "Date | \n", "Weekly_Sales | \n", "IsHoliday | \n", "Type | \n", "Size | \n", "Temperature | \n", "Fuel_Price | \n", "CPI | \n", "Unemployment | \n", "Week | \n", "Year | \n", "Month | \n", "Fuel_Price_Cat | \n", "
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | \n", "1 | \n", "1 | \n", "2010-02-05 | \n", "24924.50 | \n", "False | \n", "1 | \n", "151315 | \n", "42.31 | \n", "2.572 | \n", "211.096358 | \n", "8.106 | \n", "5 | \n", "2010 | \n", "2 | \n", "2.50 | \n", "
1 | \n", "1 | \n", "1 | \n", "2010-02-12 | \n", "46039.49 | \n", "True | \n", "1 | \n", "151315 | \n", "38.51 | \n", "2.548 | \n", "211.242170 | \n", "8.106 | \n", "6 | \n", "2010 | \n", "2 | \n", "2.50 | \n", "
2 | \n", "1 | \n", "1 | \n", "2010-02-19 | \n", "41595.55 | \n", "False | \n", "1 | \n", "151315 | \n", "39.93 | \n", "2.514 | \n", "211.289143 | \n", "8.106 | \n", "7 | \n", "2010 | \n", "2 | \n", "2.50 | \n", "
3 | \n", "1 | \n", "1 | \n", "2010-02-26 | \n", "19403.54 | \n", "False | \n", "1 | \n", "151315 | \n", "46.63 | \n", "2.561 | \n", "211.319643 | \n", "8.106 | \n", "8 | \n", "2010 | \n", "2 | \n", "2.50 | \n", "
4 | \n", "1 | \n", "1 | \n", "2010-03-05 | \n", "21827.90 | \n", "False | \n", "1 | \n", "151315 | \n", "46.50 | \n", "2.625 | \n", "211.350143 | \n", "8.106 | \n", "9 | \n", "2010 | \n", "3 | \n", "2.50 | \n", "
... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
421565 | \n", "45 | \n", "98 | \n", "2012-09-28 | \n", "508.37 | \n", "False | \n", "2 | \n", "118221 | \n", "64.88 | \n", "3.997 | \n", "192.013558 | \n", "8.684 | \n", "39 | \n", "2012 | \n", "9 | \n", "3.75 | \n", "
421566 | \n", "45 | \n", "98 | \n", "2012-10-05 | \n", "628.10 | \n", "False | \n", "2 | \n", "118221 | \n", "64.89 | \n", "3.985 | \n", "192.170412 | \n", "8.667 | \n", "40 | \n", "2012 | \n", "10 | \n", "3.75 | \n", "
421567 | \n", "45 | \n", "98 | \n", "2012-10-12 | \n", "1061.02 | \n", "False | \n", "2 | \n", "118221 | \n", "54.47 | \n", "4.000 | \n", "192.327265 | \n", "8.667 | \n", "41 | \n", "2012 | \n", "10 | \n", "4.25 | \n", "
421568 | \n", "45 | \n", "98 | \n", "2012-10-19 | \n", "760.01 | \n", "False | \n", "2 | \n", "118221 | \n", "56.47 | \n", "3.969 | \n", "192.330854 | \n", "8.667 | \n", "42 | \n", "2012 | \n", "10 | \n", "3.75 | \n", "
421569 | \n", "45 | \n", "98 | \n", "2012-10-26 | \n", "1076.80 | \n", "False | \n", "2 | \n", "118221 | \n", "58.85 | \n", "3.882 | \n", "192.308899 | \n", "8.667 | \n", "43 | \n", "2012 | \n", "10 | \n", "3.75 | \n", "
420212 rows × 15 columns
\n", "\n", " | Store | \n", "Dept | \n", "Date | \n", "Weekly_Sales | \n", "IsHoliday | \n", "Type | \n", "Size | \n", "Temperature | \n", "Fuel_Price | \n", "CPI | \n", "Unemployment | \n", "Week | \n", "Year | \n", "Month | \n", "Fuel_Price_Cat | \n", "
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | \n", "1 | \n", "1 | \n", "2010-02-05 | \n", "24924.50 | \n", "0 | \n", "1 | \n", "151315 | \n", "42.31 | \n", "2.572 | \n", "211.096358 | \n", "8.106 | \n", "5 | \n", "2010 | \n", "2 | \n", "2.50 | \n", "
1 | \n", "1 | \n", "1 | \n", "2010-02-12 | \n", "46039.49 | \n", "1 | \n", "1 | \n", "151315 | \n", "38.51 | \n", "2.548 | \n", "211.242170 | \n", "8.106 | \n", "6 | \n", "2010 | \n", "2 | \n", "2.50 | \n", "
2 | \n", "1 | \n", "1 | \n", "2010-02-19 | \n", "41595.55 | \n", "0 | \n", "1 | \n", "151315 | \n", "39.93 | \n", "2.514 | \n", "211.289143 | \n", "8.106 | \n", "7 | \n", "2010 | \n", "2 | \n", "2.50 | \n", "
3 | \n", "1 | \n", "1 | \n", "2010-02-26 | \n", "19403.54 | \n", "0 | \n", "1 | \n", "151315 | \n", "46.63 | \n", "2.561 | \n", "211.319643 | \n", "8.106 | \n", "8 | \n", "2010 | \n", "2 | \n", "2.50 | \n", "
4 | \n", "1 | \n", "1 | \n", "2010-03-05 | \n", "21827.90 | \n", "0 | \n", "1 | \n", "151315 | \n", "46.50 | \n", "2.625 | \n", "211.350143 | \n", "8.106 | \n", "9 | \n", "2010 | \n", "3 | \n", "2.50 | \n", "
... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
421565 | \n", "45 | \n", "98 | \n", "2012-09-28 | \n", "508.37 | \n", "0 | \n", "2 | \n", "118221 | \n", "64.88 | \n", "3.997 | \n", "192.013558 | \n", "8.684 | \n", "39 | \n", "2012 | \n", "9 | \n", "3.75 | \n", "
421566 | \n", "45 | \n", "98 | \n", "2012-10-05 | \n", "628.10 | \n", "0 | \n", "2 | \n", "118221 | \n", "64.89 | \n", "3.985 | \n", "192.170412 | \n", "8.667 | \n", "40 | \n", "2012 | \n", "10 | \n", "3.75 | \n", "
421567 | \n", "45 | \n", "98 | \n", "2012-10-12 | \n", "1061.02 | \n", "0 | \n", "2 | \n", "118221 | \n", "54.47 | \n", "4.000 | \n", "192.327265 | \n", "8.667 | \n", "41 | \n", "2012 | \n", "10 | \n", "4.25 | \n", "
421568 | \n", "45 | \n", "98 | \n", "2012-10-19 | \n", "760.01 | \n", "0 | \n", "2 | \n", "118221 | \n", "56.47 | \n", "3.969 | \n", "192.330854 | \n", "8.667 | \n", "42 | \n", "2012 | \n", "10 | \n", "3.75 | \n", "
421569 | \n", "45 | \n", "98 | \n", "2012-10-26 | \n", "1076.80 | \n", "0 | \n", "2 | \n", "118221 | \n", "58.85 | \n", "3.882 | \n", "192.308899 | \n", "8.667 | \n", "43 | \n", "2012 | \n", "10 | \n", "3.75 | \n", "
420212 rows × 15 columns
\n", "\n", " | Store | \n", "Dept | \n", "IsHoliday | \n", "Type | \n", "Size | \n", "Temperature | \n", "Fuel_Price | \n", "CPI | \n", "Unemployment | \n", "Week | \n", "Year | \n", "Month | \n", "Fuel_Price_Cat | \n", "
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
389344 | \n", "41 | \n", "83 | \n", "0 | \n", "1 | \n", "196321 | \n", "33.00 | \n", "2.712 | \n", "190.993144 | \n", "7.508 | \n", "48 | \n", "2010 | \n", "12 | \n", "2.50 | \n", "
75831 | \n", "8 | \n", "60 | \n", "0 | \n", "1 | \n", "155078 | \n", "68.72 | \n", "3.467 | \n", "219.788581 | \n", "6.425 | \n", "38 | \n", "2011 | \n", "9 | \n", "3.25 | \n", "
162655 | \n", "17 | \n", "40 | \n", "1 | \n", "2 | \n", "93188 | \n", "32.81 | \n", "3.445 | \n", "129.836400 | \n", "6.617 | \n", "47 | \n", "2011 | \n", "11 | \n", "3.25 | \n", "
187357 | \n", "20 | \n", "1 | \n", "0 | \n", "1 | \n", "203742 | \n", "78.09 | \n", "2.793 | \n", "204.362566 | \n", "7.527 | \n", "27 | \n", "2010 | \n", "7 | \n", "2.75 | \n", "
24134 | \n", "3 | \n", "27 | \n", "1 | \n", "2 | \n", "37392 | \n", "51.65 | \n", "3.409 | \n", "223.753643 | \n", "6.833 | \n", "6 | \n", "2012 | \n", "2 | \n", "3.25 | \n", "
RandomForestRegressor()In a Jupyter environment, please rerun this cell to show the HTML representation or trust the notebook.
RandomForestRegressor()
\n", " | imp_features | \n", "feature_names | \n", "
---|---|---|
1 | \n", "0.624393 | \n", "Dept | \n", "
4 | \n", "0.190064 | \n", "Size | \n", "
0 | \n", "0.059055 | \n", "Store | \n", "
9 | \n", "0.043448 | \n", "Week | \n", "
7 | \n", "0.027751 | \n", "CPI | \n", "
\n", " | Actual | \n", "Predicted | \n", "
---|---|---|
198556 | \n", "18526.46 | \n", "18610.1016 | \n", "
342491 | \n", "84.00 | \n", "130.2605 | \n", "
267645 | \n", "27025.56 | \n", "30615.5619 | \n", "
169044 | \n", "48324.54 | \n", "45113.7760 | \n", "
45102 | \n", "2968.68 | \n", "3262.3205 | \n", "
... | \n", "... | \n", "... | \n", "
276446 | \n", "46104.16 | \n", "36210.2767 | \n", "
144808 | \n", "1109.83 | \n", "885.0905 | \n", "
405575 | \n", "19.76 | \n", "78.2843 | \n", "
66690 | \n", "307.84 | \n", "344.8282 | \n", "
145994 | \n", "7.96 | \n", "38.5749 | \n", "
126064 rows × 2 columns
\n", "XGBRegressor(base_score=None, booster=None, callbacks=None,\n", " colsample_bylevel=None, colsample_bynode=None,\n", " colsample_bytree=None, device=None, early_stopping_rounds=None,\n", " enable_categorical=False, eval_metric=None, feature_types=None,\n", " gamma=None, grow_policy=None, importance_type=None,\n", " interaction_constraints=None, learning_rate=None, max_bin=None,\n", " max_cat_threshold=None, max_cat_to_onehot=None,\n", " max_delta_step=None, max_depth=None, max_leaves=None,\n", " min_child_weight=None, missing=nan, monotone_constraints=None,\n", " multi_strategy=None, n_estimators=None, n_jobs=None,\n", " num_parallel_tree=None, random_state=None, ...)In a Jupyter environment, please rerun this cell to show the HTML representation or trust the notebook.
XGBRegressor(base_score=None, booster=None, callbacks=None,\n", " colsample_bylevel=None, colsample_bynode=None,\n", " colsample_bytree=None, device=None, early_stopping_rounds=None,\n", " enable_categorical=False, eval_metric=None, feature_types=None,\n", " gamma=None, grow_policy=None, importance_type=None,\n", " interaction_constraints=None, learning_rate=None, max_bin=None,\n", " max_cat_threshold=None, max_cat_to_onehot=None,\n", " max_delta_step=None, max_depth=None, max_leaves=None,\n", " min_child_weight=None, missing=nan, monotone_constraints=None,\n", " multi_strategy=None, n_estimators=None, n_jobs=None,\n", " num_parallel_tree=None, random_state=None, ...)
DecisionTreeRegressor()In a Jupyter environment, please rerun this cell to show the HTML representation or trust the notebook.
DecisionTreeRegressor()
\n", " | Store | \n", "Dept | \n", "IsHoliday | \n", "Type | \n", "Size | \n", "Temperature | \n", "Fuel_Price | \n", "CPI | \n", "Unemployment | \n", "Week | \n", "Year | \n", "Month | \n", "Fuel_Price_Cat | \n", "
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
198556 | \n", "21 | \n", "8 | \n", "0 | \n", "2 | \n", "140167 | \n", "54.68 | \n", "2.720 | \n", "210.873332 | \n", "8.324 | \n", "11 | \n", "2010 | \n", "3 | \n", "2.50 | \n", "
342491 | \n", "36 | \n", "20 | \n", "0 | \n", "1 | \n", "39910 | \n", "42.87 | \n", "2.971 | \n", "210.237973 | \n", "8.395 | \n", "2 | \n", "2011 | \n", "1 | \n", "2.75 | \n", "
267645 | \n", "28 | \n", "5 | \n", "0 | \n", "1 | \n", "206302 | \n", "54.20 | \n", "3.813 | \n", "129.826833 | \n", "12.890 | \n", "46 | \n", "2011 | \n", "11 | \n", "3.75 | \n", "
169044 | \n", "18 | \n", "13 | \n", "0 | \n", "2 | \n", "120653 | \n", "21.33 | \n", "2.788 | \n", "131.527903 | \n", "9.202 | \n", "5 | \n", "2010 | \n", "2 | \n", "2.75 | \n", "
45102 | \n", "5 | \n", "42 | \n", "0 | \n", "2 | \n", "34875 | \n", "52.47 | \n", "2.732 | \n", "211.571892 | \n", "6.566 | \n", "12 | \n", "2010 | \n", "3 | \n", "2.50 | \n", "