diff --git "a/GA_KKPM.ipynb" "b/GA_KKPM.ipynb" --- "a/GA_KKPM.ipynb" +++ "b/GA_KKPM.ipynb" @@ -1094,10 +1094,10 @@ "text": [ "(690, 22) (230, 22) (690,) (230,)\n", "Best score in generation 1 : [0.7913043478260869]\n", - "Best score in generation 2 : [0.8173913043478261]\n", - "Best score in generation 3 : [0.7913043478260869]\n", - "Best score in generation 4 : [0.8217391304347826]\n", - "Best score in generation 5 : [0.8173913043478261]\n" + "Best score in generation 2 : [0.7913043478260869]\n", + "Best score in generation 3 : [0.8173913043478261]\n", + "Best score in generation 4 : [0.8130434782608695]\n", + "Best score in generation 5 : [0.8260869565217391]\n" ] } ], @@ -1131,7 +1131,7 @@ "outputs": [ { "data": { - "image/png": "", + "image/png": "", "text/plain": [ "
" ] @@ -1152,13 +1152,13 @@ }, "outputs": [], "source": [ - "for index, clf in enumerate(best_models):\n", - " dump(clf, 'model-{}.joblib'.format(index))" + "# for index, clf in enumerate(best_models):\n", + "# dump(clf, 'model-{}.joblib'.format(index))" ] }, { "cell_type": "code", - "execution_count": 12, + "execution_count": 11, "metadata": { "id": "fGbUe1WJYbxp" }, @@ -1169,7 +1169,7 @@ }, { "cell_type": "code", - "execution_count": 13, + "execution_count": 12, "metadata": { "colab": { "base_uri": "https://localhost:8080/", @@ -1366,7 +1366,7 @@ "[230 rows x 9 columns]" ] }, - "execution_count": 13, + "execution_count": 12, "metadata": {}, "output_type": "execute_result" } @@ -1377,7 +1377,7 @@ }, { "cell_type": "code", - "execution_count": 36, + "execution_count": 13, "metadata": { "colab": { "base_uri": "https://localhost:8080/" @@ -1401,7 +1401,7 @@ }, { "cell_type": "code", - "execution_count": 34, + "execution_count": 14, "metadata": {}, "outputs": [ { @@ -1591,7 +1591,7 @@ "[230 rows x 9 columns]" ] }, - "execution_count": 34, + "execution_count": 14, "metadata": {}, "output_type": "execute_result" } @@ -1602,7 +1602,7 @@ }, { "cell_type": "code", - "execution_count": 37, + "execution_count": 15, "metadata": {}, "outputs": [ { @@ -1621,7 +1621,7 @@ " 0, 0, 1, 0, 1, 0, 1, 1, 1, 0], dtype=int64)" ] }, - "execution_count": 37, + "execution_count": 15, "metadata": {}, "output_type": "execute_result" } @@ -1630,6 +1630,1970 @@ "predictions" ] }, + { + "cell_type": "code", + "execution_count": 19, + "metadata": {}, + "outputs": [ + { + "data": { + "image/svg+xml": [ + "\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "Tree\n", + "\n", + "\n", + "\n", + "0\n", + "\n", + "cp_4.0 <= 0.5\n", + "gini = 0.494\n", + "samples = 690\n", + "value = [308.0, 382.0]\n", + "\n", + "\n", + "\n", + "1\n", + "\n", + "sex <= 0.5\n", + "gini = 0.415\n", + "samples = 320\n", + "value = [226, 94]\n", + "\n", + "\n", + "\n", + "0->1\n", + "\n", + "\n", + "True\n", + "\n", + "\n", + "\n", + "86\n", + "\n", + "exang <= 0.5\n", + "gini = 0.345\n", + "samples = 370\n", + "value = [82, 288]\n", + "\n", + "\n", + "\n", + "0->86\n", + "\n", + "\n", + "False\n", + "\n", + "\n", + "\n", + "2\n", + "\n", + "thal_7.0 <= 0.5\n", + "gini = 0.172\n", + "samples = 95\n", + "value = [86, 9]\n", + "\n", + "\n", + "\n", + "1->2\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "29\n", + "\n", + "cp_2.0 <= 0.5\n", + "gini = 0.47\n", + "samples = 225\n", + "value = [140, 85]\n", + "\n", + "\n", + "\n", + "1->29\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "3\n", + "\n", + "cp_2.0 <= 0.5\n", + "gini = 0.126\n", + "samples = 89\n", + "value = [83, 6]\n", + "\n", + "\n", + "\n", + "2->3\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "22\n", + "\n", + "slope_1 <= 0.5\n", + "gini = 0.5\n", + "samples = 6\n", + "value = [3, 3]\n", + "\n", + "\n", + "\n", + "2->22\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "4\n", + "\n", + "slope_2 <= 0.5\n", + "gini = 0.162\n", + "samples = 45\n", + "value = [41, 4]\n", + "\n", + "\n", + "\n", + "3->4\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "15\n", + "\n", + "slope_2 <= 0.5\n", + "gini = 0.087\n", + "samples = 44\n", + "value = [42, 2]\n", + "\n", + "\n", + "\n", + "3->15\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "5\n", + "\n", + "exang <= 0.5\n", + "gini = 0.087\n", + "samples = 22\n", + "value = [21, 1]\n", + "\n", + "\n", + "\n", + "4->5\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "10\n", + "\n", + "thal_3.0 <= 0.5\n", + "gini = 0.227\n", + "samples = 23\n", + "value = [20, 3]\n", + "\n", + "\n", + "\n", + "4->10\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "6\n", + "\n", + "cp_1.0 <= 0.5\n", + "gini = 0.1\n", + "samples = 19\n", + "value = [18, 1]\n", + "\n", + "\n", + "\n", + "5->6\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "9\n", + "\n", + "gini = 0.0\n", + "samples = 3\n", + "value = [3, 0]\n", + "\n", + "\n", + "\n", + "5->9\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "7\n", + "\n", + "gini = 0.117\n", + "samples = 16\n", + "value = [15, 1]\n", + "\n", + "\n", + "\n", + "6->7\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "8\n", + "\n", + "gini = 0.0\n", + "samples = 3\n", + "value = [3, 0]\n", + "\n", + "\n", + "\n", + "6->8\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "11\n", + "\n", + "gini = 0.0\n", + "samples = 1\n", + "value = [1, 0]\n", + "\n", + "\n", + "\n", + "10->11\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "12\n", + "\n", + "cp_1.0 <= 0.5\n", + "gini = 0.236\n", + "samples = 22\n", + "value = [19, 3]\n", + "\n", + "\n", + "\n", + "10->12\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "13\n", + "\n", + "gini = 0.208\n", + "samples = 17\n", + "value = [15, 2]\n", + "\n", + "\n", + "\n", + "12->13\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "14\n", + "\n", + "gini = 0.32\n", + "samples = 5\n", + "value = [4, 1]\n", + "\n", + "\n", + "\n", + "12->14\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "16\n", + "\n", + "exang <= 0.5\n", + "gini = 0.153\n", + "samples = 12\n", + "value = [11, 1]\n", + "\n", + "\n", + "\n", + "15->16\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "19\n", + "\n", + "exang <= 0.5\n", + "gini = 0.061\n", + "samples = 32\n", + "value = [31, 1]\n", + "\n", + "\n", + "\n", + "15->19\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "17\n", + "\n", + "gini = 0.18\n", + "samples = 10\n", + "value = [9, 1]\n", + "\n", + "\n", + "\n", + "16->17\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "18\n", + "\n", + "gini = 0.0\n", + "samples = 2\n", + "value = [2, 0]\n", + "\n", + "\n", + "\n", + "16->18\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "20\n", + "\n", + "gini = 0.062\n", + "samples = 31\n", + "value = [30, 1]\n", + "\n", + "\n", + "\n", + "19->20\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "21\n", + "\n", + "gini = 0.0\n", + "samples = 1\n", + "value = [1, 0]\n", + "\n", + "\n", + "\n", + "19->21\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "23\n", + "\n", + "cp_2.0 <= 0.5\n", + "gini = 0.48\n", + "samples = 5\n", + "value = [2, 3]\n", + "\n", + "\n", + "\n", + "22->23\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "28\n", + "\n", + "gini = 0.0\n", + "samples = 1\n", + "value = [1, 0]\n", + "\n", + "\n", + "\n", + "22->28\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "24\n", + "\n", + "exang <= 0.5\n", + "gini = 0.444\n", + "samples = 3\n", + "value = [1, 2]\n", + "\n", + "\n", + "\n", + "23->24\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "27\n", + "\n", + "gini = 0.5\n", + "samples = 2\n", + "value = [1, 1]\n", + "\n", + "\n", + "\n", + "23->27\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "25\n", + "\n", + "gini = 0.5\n", + "samples = 2\n", + "value = [1, 1]\n", + "\n", + "\n", + "\n", + "24->25\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "26\n", + "\n", + "gini = 0.0\n", + "samples = 1\n", + "value = [0, 1]\n", + "\n", + "\n", + "\n", + "24->26\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "30\n", + "\n", + "slope_1 <= 0.5\n", + "gini = 0.5\n", + "samples = 137\n", + "value = [70, 67]\n", + "\n", + "\n", + "\n", + "29->30\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "69\n", + "\n", + "exang <= 0.5\n", + "gini = 0.325\n", + "samples = 88\n", + "value = [70, 18]\n", + "\n", + "\n", + "\n", + "29->69\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "31\n", + "\n", + "exang <= 0.5\n", + "gini = 0.496\n", + "samples = 105\n", + "value = [48.0, 57.0]\n", + "\n", + "\n", + "\n", + "30->31\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "58\n", + "\n", + "cp_1.0 <= 0.5\n", + "gini = 0.43\n", + "samples = 32\n", + "value = [22, 10]\n", + "\n", + "\n", + "\n", + "30->58\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "32\n", + "\n", + "cp_1.0 <= 0.5\n", + "gini = 0.5\n", + "samples = 82\n", + "value = [41, 41]\n", + "\n", + "\n", + "\n", + "31->32\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "49\n", + "\n", + "slope_2 <= 0.5\n", + "gini = 0.423\n", + "samples = 23\n", + "value = [7, 16]\n", + "\n", + "\n", + "\n", + "31->49\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "33\n", + "\n", + "thal_3.0 <= 0.5\n", + "gini = 0.498\n", + "samples = 64\n", + "value = [34, 30]\n", + "\n", + "\n", + "\n", + "32->33\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "42\n", + "\n", + "thal_3.0 <= 0.5\n", + "gini = 0.475\n", + "samples = 18\n", + "value = [7, 11]\n", + "\n", + "\n", + "\n", + "32->42\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "34\n", + "\n", + "slope_2 <= 0.5\n", + "gini = 0.444\n", + "samples = 12\n", + "value = [4, 8]\n", + "\n", + "\n", + "\n", + "33->34\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "39\n", + "\n", + "slope_2 <= 0.5\n", + "gini = 0.488\n", + "samples = 52\n", + "value = [30.0, 22.0]\n", + "\n", + "\n", + "\n", + "33->39\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "35\n", + "\n", + "gini = 0.0\n", + "samples = 1\n", + "value = [1, 0]\n", + "\n", + "\n", + "\n", + "34->35\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "36\n", + "\n", + "thal_7.0 <= 0.5\n", + "gini = 0.397\n", + "samples = 11\n", + "value = [3, 8]\n", + "\n", + "\n", + "\n", + "34->36\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "37\n", + "\n", + "gini = 0.375\n", + "samples = 4\n", + "value = [1, 3]\n", + "\n", + "\n", + "\n", + "36->37\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "38\n", + "\n", + "gini = 0.408\n", + "samples = 7\n", + "value = [2, 5]\n", + "\n", + "\n", + "\n", + "36->38\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "40\n", + "\n", + "gini = 0.5\n", + "samples = 4\n", + "value = [2, 2]\n", + "\n", + "\n", + "\n", + "39->40\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "41\n", + "\n", + "gini = 0.486\n", + "samples = 48\n", + "value = [28, 20]\n", + "\n", + "\n", + "\n", + "39->41\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "43\n", + "\n", + "slope_2 <= 0.5\n", + "gini = 0.408\n", + "samples = 7\n", + "value = [5, 2]\n", + "\n", + "\n", + "\n", + "42->43\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "46\n", + "\n", + "slope_2 <= 0.5\n", + "gini = 0.298\n", + "samples = 11\n", + "value = [2, 9]\n", + "\n", + "\n", + "\n", + "42->46\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "44\n", + "\n", + "gini = 0.0\n", + "samples = 2\n", + "value = [2, 0]\n", + "\n", + "\n", + "\n", + "43->44\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "45\n", + "\n", + "gini = 0.48\n", + "samples = 5\n", + "value = [3, 2]\n", + "\n", + "\n", + "\n", + "43->45\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "47\n", + "\n", + "gini = 0.0\n", + "samples = 1\n", + "value = [0, 1]\n", + "\n", + "\n", + "\n", + "46->47\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "48\n", + "\n", + "gini = 0.32\n", + "samples = 10\n", + "value = [2, 8]\n", + "\n", + "\n", + "\n", + "46->48\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "50\n", + "\n", + "gini = 0.0\n", + "samples = 1\n", + "value = [0, 1]\n", + "\n", + "\n", + "\n", + "49->50\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "51\n", + "\n", + "cp_1.0 <= 0.5\n", + "gini = 0.434\n", + "samples = 22\n", + "value = [7.0, 15.0]\n", + "\n", + "\n", + "\n", + "49->51\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "52\n", + "\n", + "thal_3.0 <= 0.5\n", + "gini = 0.444\n", + "samples = 21\n", + "value = [7, 14]\n", + "\n", + "\n", + "\n", + "51->52\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "57\n", + "\n", + "gini = 0.0\n", + "samples = 1\n", + "value = [0, 1]\n", + "\n", + "\n", + "\n", + "51->57\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "53\n", + "\n", + "thal_7.0 <= 0.5\n", + "gini = 0.408\n", + "samples = 7\n", + "value = [2, 5]\n", + "\n", + "\n", + "\n", + "52->53\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "56\n", + "\n", + "gini = 0.459\n", + "samples = 14\n", + "value = [5, 9]\n", + "\n", + "\n", + "\n", + "52->56\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "54\n", + "\n", + "gini = 0.0\n", + "samples = 1\n", + "value = [0, 1]\n", + "\n", + "\n", + "\n", + "53->54\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "55\n", + "\n", + "gini = 0.444\n", + "samples = 6\n", + "value = [2, 4]\n", + "\n", + "\n", + "\n", + "53->55\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "59\n", + "\n", + "exang <= 0.5\n", + "gini = 0.393\n", + "samples = 26\n", + "value = [19, 7]\n", + "\n", + "\n", + "\n", + "58->59\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "66\n", + "\n", + "thal_3.0 <= 0.5\n", + "gini = 0.5\n", + "samples = 6\n", + "value = [3, 3]\n", + "\n", + "\n", + "\n", + "58->66\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "60\n", + "\n", + "thal_7.0 <= 0.5\n", + "gini = 0.375\n", + "samples = 24\n", + "value = [18, 6]\n", + "\n", + "\n", + "\n", + "59->60\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "63\n", + "\n", + "thal_3.0 <= 0.5\n", + "gini = 0.5\n", + "samples = 2\n", + "value = [1, 1]\n", + "\n", + "\n", + "\n", + "59->63\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "61\n", + "\n", + "gini = 0.375\n", + "samples = 20\n", + "value = [15, 5]\n", + "\n", + "\n", + "\n", + "60->61\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "62\n", + "\n", + "gini = 0.375\n", + "samples = 4\n", + "value = [3, 1]\n", + "\n", + "\n", + "\n", + "60->62\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "64\n", + "\n", + "gini = 0.0\n", + "samples = 1\n", + "value = [1, 0]\n", + "\n", + "\n", + "\n", + "63->64\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "65\n", + "\n", + "gini = 0.0\n", + "samples = 1\n", + "value = [0, 1]\n", + "\n", + "\n", + "\n", + "63->65\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "67\n", + "\n", + "gini = 0.0\n", + "samples = 1\n", + "value = [1, 0]\n", + "\n", + "\n", + "\n", + "66->67\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "68\n", + "\n", + "gini = 0.48\n", + "samples = 5\n", + "value = [2, 3]\n", + "\n", + "\n", + "\n", + "66->68\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "70\n", + "\n", + "thal_7.0 <= 0.5\n", + "gini = 0.242\n", + "samples = 78\n", + "value = [67, 11]\n", + "\n", + "\n", + "\n", + "69->70\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "81\n", + "\n", + "slope_1 <= 0.5\n", + "gini = 0.42\n", + "samples = 10\n", + "value = [3, 7]\n", + "\n", + "\n", + "\n", + "69->81\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "71\n", + "\n", + "slope_1 <= 0.5\n", + "gini = 0.185\n", + "samples = 68\n", + "value = [61, 7]\n", + "\n", + "\n", + "\n", + "70->71\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "76\n", + "\n", + "slope_2 <= 0.5\n", + "gini = 0.48\n", + "samples = 10\n", + "value = [6, 4]\n", + "\n", + "\n", + "\n", + "70->76\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "72\n", + "\n", + "thal_3.0 <= 0.5\n", + "gini = 0.215\n", + "samples = 49\n", + "value = [43, 6]\n", + "\n", + "\n", + "\n", + "71->72\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "75\n", + "\n", + "gini = 0.1\n", + "samples = 19\n", + "value = [18, 1]\n", + "\n", + "\n", + "\n", + "71->75\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "73\n", + "\n", + "gini = 0.0\n", + "samples = 2\n", + "value = [2, 0]\n", + "\n", + "\n", + "\n", + "72->73\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "74\n", + "\n", + "gini = 0.223\n", + "samples = 47\n", + "value = [41.0, 6.0]\n", + "\n", + "\n", + "\n", + "72->74\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "77\n", + "\n", + "slope_1 <= 0.5\n", + "gini = 0.5\n", + "samples = 6\n", + "value = [3, 3]\n", + "\n", + "\n", + "\n", + "76->77\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "80\n", + "\n", + "gini = 0.375\n", + "samples = 4\n", + "value = [3, 1]\n", + "\n", + "\n", + "\n", + "76->80\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "78\n", + "\n", + "gini = 0.0\n", + "samples = 1\n", + "value = [0, 1]\n", + "\n", + "\n", + "\n", + "77->78\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "79\n", + "\n", + "gini = 0.48\n", + "samples = 5\n", + "value = [3, 2]\n", + "\n", + "\n", + "\n", + "77->79\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "82\n", + "\n", + "thal_3.0 <= 0.5\n", + "gini = 0.346\n", + "samples = 9\n", + "value = [2, 7]\n", + "\n", + "\n", + "\n", + "81->82\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "85\n", + "\n", + "gini = 0.0\n", + "samples = 1\n", + "value = [1, 0]\n", + "\n", + "\n", + "\n", + "81->85\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "83\n", + "\n", + "gini = 0.0\n", + "samples = 1\n", + "value = [0, 1]\n", + "\n", + "\n", + "\n", + "82->83\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "84\n", + "\n", + "gini = 0.375\n", + "samples = 8\n", + "value = [2, 6]\n", + "\n", + "\n", + "\n", + "82->84\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "87\n", + "\n", + "thal_3.0 <= 0.5\n", + "gini = 0.462\n", + "samples = 160\n", + "value = [58, 102]\n", + "\n", + "\n", + "\n", + "86->87\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "110\n", + "\n", + "sex <= 0.5\n", + "gini = 0.202\n", + "samples = 210\n", + "value = [24, 186]\n", + "\n", + "\n", + "\n", + "86->110\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "88\n", + "\n", + "slope_1 <= 0.5\n", + "gini = 0.236\n", + "samples = 44\n", + "value = [6, 38]\n", + "\n", + "\n", + "\n", + "87->88\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "99\n", + "\n", + "sex <= 0.5\n", + "gini = 0.495\n", + "samples = 116\n", + "value = [52, 64]\n", + "\n", + "\n", + "\n", + "87->99\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "89\n", + "\n", + "thal_7.0 <= 0.5\n", + "gini = 0.111\n", + "samples = 34\n", + "value = [2, 32]\n", + "\n", + "\n", + "\n", + "88->89\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "96\n", + "\n", + "thal_7.0 <= 0.5\n", + "gini = 0.48\n", + "samples = 10\n", + "value = [4, 6]\n", + "\n", + "\n", + "\n", + "88->96\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "90\n", + "\n", + "slope_2 <= 0.5\n", + "gini = 0.198\n", + "samples = 9\n", + "value = [1, 8]\n", + "\n", + "\n", + "\n", + "89->90\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "93\n", + "\n", + "sex <= 0.5\n", + "gini = 0.077\n", + "samples = 25\n", + "value = [1, 24]\n", + "\n", + "\n", + "\n", + "89->93\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "91\n", + "\n", + "gini = 0.0\n", + "samples = 1\n", + "value = [0, 1]\n", + "\n", + "\n", + "\n", + "90->91\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "92\n", + "\n", + "gini = 0.219\n", + "samples = 8\n", + "value = [1, 7]\n", + "\n", + "\n", + "\n", + "90->92\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "94\n", + "\n", + "gini = 0.0\n", + "samples = 4\n", + "value = [0, 4]\n", + "\n", + "\n", + "\n", + "93->94\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "95\n", + "\n", + "gini = 0.091\n", + "samples = 21\n", + "value = [1, 20]\n", + "\n", + "\n", + "\n", + "93->95\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "97\n", + "\n", + "gini = 0.0\n", + "samples = 1\n", + "value = [1, 0]\n", + "\n", + "\n", + "\n", + "96->97\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "98\n", + "\n", + "gini = 0.444\n", + "samples = 9\n", + "value = [3, 6]\n", + "\n", + "\n", + "\n", + "96->98\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "100\n", + "\n", + "slope_2 <= 0.5\n", + "gini = 0.397\n", + "samples = 22\n", + "value = [16, 6]\n", + "\n", + "\n", + "\n", + "99->100\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "105\n", + "\n", + "slope_1 <= 0.5\n", + "gini = 0.473\n", + "samples = 94\n", + "value = [36, 58]\n", + "\n", + "\n", + "\n", + "99->105\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "101\n", + "\n", + "slope_1 <= 0.5\n", + "gini = 0.48\n", + "samples = 10\n", + "value = [6, 4]\n", + "\n", + "\n", + "\n", + "100->101\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "104\n", + "\n", + "gini = 0.278\n", + "samples = 12\n", + "value = [10, 2]\n", + "\n", + "\n", + "\n", + "100->104\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "102\n", + "\n", + "gini = 0.0\n", + "samples = 2\n", + "value = [0, 2]\n", + "\n", + "\n", + "\n", + "101->102\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "103\n", + "\n", + "gini = 0.375\n", + "samples = 8\n", + "value = [6, 2]\n", + "\n", + "\n", + "\n", + "101->103\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "106\n", + "\n", + "slope_2 <= 0.5\n", + "gini = 0.477\n", + "samples = 74\n", + "value = [29, 45]\n", + "\n", + "\n", + "\n", + "105->106\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "109\n", + "\n", + "gini = 0.455\n", + "samples = 20\n", + "value = [7, 13]\n", + "\n", + "\n", + "\n", + "105->109\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "107\n", + "\n", + "gini = 0.5\n", + "samples = 4\n", + "value = [2, 2]\n", + "\n", + "\n", + "\n", + "106->107\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "108\n", + "\n", + "gini = 0.474\n", + "samples = 70\n", + "value = [27, 43]\n", + "\n", + "\n", + "\n", + "106->108\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "111\n", + "\n", + "thal_3.0 <= 0.5\n", + "gini = 0.384\n", + "samples = 27\n", + "value = [7, 20]\n", + "\n", + "\n", + "\n", + "110->111\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "118\n", + "\n", + "thal_3.0 <= 0.5\n", + "gini = 0.169\n", + "samples = 183\n", + "value = [17, 166]\n", + "\n", + "\n", + "\n", + "110->118\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "112\n", + "\n", + "gini = 0.0\n", + "samples = 9\n", + "value = [0, 9]\n", + "\n", + "\n", + "\n", + "111->112\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "113\n", + "\n", + "slope_1 <= 0.5\n", + "gini = 0.475\n", + "samples = 18\n", + "value = [7, 11]\n", + "\n", + "\n", + "\n", + "111->113\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "114\n", + "\n", + "slope_2 <= 0.5\n", + "gini = 0.444\n", + "samples = 15\n", + "value = [5, 10]\n", + "\n", + "\n", + "\n", + "113->114\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "117\n", + "\n", + "gini = 0.444\n", + "samples = 3\n", + "value = [2, 1]\n", + "\n", + "\n", + "\n", + "113->117\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "115\n", + "\n", + "gini = 0.0\n", + "samples = 1\n", + "value = [0, 1]\n", + "\n", + "\n", + "\n", + "114->115\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "116\n", + "\n", + "gini = 0.459\n", + "samples = 14\n", + "value = [5, 9]\n", + "\n", + "\n", + "\n", + "114->116\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "119\n", + "\n", + "slope_2 <= 0.5\n", + "gini = 0.123\n", + "samples = 76\n", + "value = [5, 71]\n", + "\n", + "\n", + "\n", + "118->119\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "128\n", + "\n", + "slope_2 <= 0.5\n", + "gini = 0.199\n", + "samples = 107\n", + "value = [12, 95]\n", + "\n", + "\n", + "\n", + "118->128\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "120\n", + "\n", + "thal_7.0 <= 0.5\n", + "gini = 0.185\n", + "samples = 29\n", + "value = [3, 26]\n", + "\n", + "\n", + "\n", + "119->120\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "125\n", + "\n", + "thal_7.0 <= 0.5\n", + "gini = 0.081\n", + "samples = 47\n", + "value = [2, 45]\n", + "\n", + "\n", + "\n", + "119->125\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "121\n", + "\n", + "gini = 0.0\n", + "samples = 2\n", + "value = [0, 2]\n", + "\n", + "\n", + "\n", + "120->121\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "122\n", + "\n", + "slope_1 <= 0.5\n", + "gini = 0.198\n", + "samples = 27\n", + "value = [3, 24]\n", + "\n", + "\n", + "\n", + "120->122\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "123\n", + "\n", + "gini = 0.198\n", + "samples = 9\n", + "value = [1, 8]\n", + "\n", + "\n", + "\n", + "122->123\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "124\n", + "\n", + "gini = 0.198\n", + "samples = 18\n", + "value = [2, 16]\n", + "\n", + "\n", + "\n", + "122->124\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "126\n", + "\n", + "gini = 0.0\n", + "samples = 9\n", + "value = [0, 9]\n", + "\n", + "\n", + "\n", + "125->126\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "127\n", + "\n", + "gini = 0.1\n", + "samples = 38\n", + "value = [2, 36]\n", + "\n", + "\n", + "\n", + "125->127\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "129\n", + "\n", + "slope_1 <= 0.5\n", + "gini = 0.142\n", + "samples = 26\n", + "value = [2, 24]\n", + "\n", + "\n", + "\n", + "128->129\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "132\n", + "\n", + "gini = 0.216\n", + "samples = 81\n", + "value = [10, 71]\n", + "\n", + "\n", + "\n", + "128->132\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "130\n", + "\n", + "gini = 0.124\n", + "samples = 15\n", + "value = [1, 14]\n", + "\n", + "\n", + "\n", + "129->130\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "131\n", + "\n", + "gini = 0.165\n", + "samples = 11\n", + "value = [1, 10]\n", + "\n", + "\n", + "\n", + "129->131\n", + "\n", + "\n", + "\n", + "\n", + "\n" + ], + "text/plain": [ + "" + ] + }, + "execution_count": 19, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "import graphviz\n", + "from sklearn import tree\n", + "\n", + "tree.export_graphviz(clf, feature_names=clf.feature_names_in_, rounded=True, out_file='decision.dot')\n", + "\n", + "graphviz.Source(open('./decision.dot').read())" + ] + }, { "cell_type": "code", "execution_count": null,