mstfldmr
diff --git a/‎2_MachineLearning.pdf
-169 KB b/‎2_MachineLearning.pdf
-169 KB
diff --git a/‎CNN.ipynb
Lines changed: 0 additions & 601 deletions b/‎CNN.ipynb
Lines changed: 0 additions & 601 deletions
diff --git a/‎CompareRegressionMethods.ipynb
Lines changed: 97 additions & 72 deletions b/‎CompareRegressionMethods.ipynb
Lines changed: 97 additions & 72 deletions
@@ -4,16 +4,15 @@
    "cell_type": "markdown",
    "metadata": {},
    "source": [
-    "Example of Regression Analysis Using the Boston Housing Data Set\n",
-    "http://facweb.cs.depaul.edu/mobasher/classes/CSC478/Data/housing-dscr.txt"
+    "Example of Regression Analysis Using the Boston Housing Data Set: http://facweb.cs.depaul.edu/mobasher/classes/CSC478/Data/housing-dscr.txt\n",
+    "\n",
+    "Source: http://facweb.cs.depaul.edu/mobasher/classes/CSC478/Notes/IPython%20Notebook%20-%20Regression.html"
    ]
   },
   {
    "cell_type": "code",
    "execution_count": 1,
-   "metadata": {
-    "collapsed": false
-   },
+   "metadata": {},
    "outputs": [
     {
      "name": "stderr",
@@ -47,9 +46,7 @@
   {
    "cell_type": "code",
    "execution_count": 3,
-   "metadata": {
-    "collapsed": false
-   },
+   "metadata": {},
    "outputs": [
     {
      "data": {
@@ -142,9 +139,7 @@
   {
    "cell_type": "code",
    "execution_count": 4,
-   "metadata": {
-    "collapsed": false
-   },
+   "metadata": {},
    "outputs": [
     {
      "data": {
@@ -164,9 +159,7 @@
   {
    "cell_type": "code",
    "execution_count": 5,
-   "metadata": {
-    "collapsed": false
-   },
+   "metadata": {},
    "outputs": [
     {
      "data": {
@@ -186,9 +179,7 @@
   {
    "cell_type": "code",
    "execution_count": 6,
-   "metadata": {
-    "collapsed": false
-   },
+   "metadata": {},
    "outputs": [
     {
      "data": {
@@ -241,9 +232,7 @@
   {
    "cell_type": "code",
    "execution_count": 10,
-   "metadata": {
-    "collapsed": false
-   },
+   "metadata": {},
    "outputs": [
     {
      "data": {
@@ -284,9 +273,7 @@
   {
    "cell_type": "code",
    "execution_count": 15,
-   "metadata": {
-    "collapsed": false
-   },
+   "metadata": {},
    "outputs": [
     {
      "data": {
@@ -326,9 +313,7 @@
   {
    "cell_type": "code",
    "execution_count": 17,
-   "metadata": {
-    "collapsed": false
-   },
+   "metadata": {},
    "outputs": [
     {
      "data": {
@@ -356,9 +341,7 @@
   {
    "cell_type": "code",
    "execution_count": 18,
-   "metadata": {
-    "collapsed": false
-   },
+   "metadata": {},
    "outputs": [
     {
      "data": {
@@ -379,9 +362,7 @@
   {
    "cell_type": "code",
    "execution_count": 19,
-   "metadata": {
-    "collapsed": false
-   },
+   "metadata": {},
    "outputs": [
     {
      "data": {
@@ -402,9 +383,7 @@
   {
    "cell_type": "code",
    "execution_count": 21,
-   "metadata": {
-    "collapsed": false
-   },
+   "metadata": {},
    "outputs": [
     {
      "data": {
@@ -425,9 +404,7 @@
   {
    "cell_type": "code",
    "execution_count": 23,
-   "metadata": {
-    "collapsed": false
-   },
+   "metadata": {},
    "outputs": [
     {
      "data": {
@@ -454,9 +431,7 @@
   {
    "cell_type": "code",
    "execution_count": 24,
-   "metadata": {
-    "collapsed": false
-   },
+   "metadata": {},
    "outputs": [
     {
      "data": {
@@ -480,9 +455,7 @@
   {
    "cell_type": "code",
    "execution_count": 26,
-   "metadata": {
-    "collapsed": false
-   },
+   "metadata": {},
    "outputs": [
     {
      "name": "stdout",
@@ -501,9 +474,7 @@
   {
    "cell_type": "code",
    "execution_count": 27,
-   "metadata": {
-    "collapsed": false
-   },
+   "metadata": {},
    "outputs": [
     {
      "data": {
@@ -529,9 +500,7 @@
   {
    "cell_type": "code",
    "execution_count": 34,
-   "metadata": {
-    "collapsed": false
-   },
+   "metadata": {},
    "outputs": [
     {
      "data": {
@@ -562,9 +531,7 @@
   {
    "cell_type": "code",
    "execution_count": 35,
-   "metadata": {
-    "collapsed": false
-   },
+   "metadata": {},
    "outputs": [
     {
      "name": "stdout",
@@ -605,9 +572,7 @@
   {
    "cell_type": "code",
    "execution_count": 32,
-   "metadata": {
-    "collapsed": false
-   },
+   "metadata": {},
    "outputs": [
     {
      "data": {
@@ -629,9 +594,7 @@
   {
    "cell_type": "code",
    "execution_count": 33,
-   "metadata": {
-    "collapsed": false
-   },
+   "metadata": {},
    "outputs": [
     {
      "data": {
@@ -657,9 +620,7 @@
   {
    "cell_type": "code",
    "execution_count": 37,
-   "metadata": {
-    "collapsed": false
-   },
+   "metadata": {},
    "outputs": [
     {
      "data": {
@@ -688,9 +649,7 @@
   {
    "cell_type": "code",
    "execution_count": 38,
-   "metadata": {
-    "collapsed": false
-   },
+   "metadata": {},
    "outputs": [
     {
      "name": "stdout",
@@ -719,9 +678,7 @@
   {
    "cell_type": "code",
    "execution_count": 39,
-   "metadata": {
-    "collapsed": false
-   },
+   "metadata": {},
    "outputs": [
     {
      "name": "stdout",
@@ -818,9 +775,7 @@
   {
    "cell_type": "code",
    "execution_count": 40,
-   "metadata": {
-    "collapsed": false
-   },
+   "metadata": {},
    "outputs": [
     {
      "data": {
@@ -842,6 +797,76 @@
     "pl.show()"
    ]
   },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "## Comparisons regression methods\n",
+    "#### let's parametrize the regression methods\n"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 44,
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "Method: linear regression\n",
+      "RMSE on training: 4.6795\n",
+      "RMSE on 10-fold CV: 5.8819\n",
+      "\n",
+      "\n",
+      "Method: lasso\n",
+      "RMSE on training: 4.8570\n",
+      "RMSE on 10-fold CV: 5.7675\n",
+      "\n",
+      "\n",
+      "Method: ridge\n",
+      "RMSE on training: 4.6822\n",
+      "RMSE on 10-fold CV: 5.8535\n",
+      "\n",
+      "\n",
+      "Method: elastic-net\n",
+      "RMSE on training: 4.9072\n",
+      "RMSE on 10-fold CV: 5.4936\n",
+      "\n",
+      "\n"
+     ]
+    }
+   ],
+   "source": [
+    "a = 0.3\n",
+    "for name,met in [\n",
+    "        ('linear regression', LinearRegression()),\n",
+    "        ('lasso', Lasso(fit_intercept=True, alpha=a)),\n",
+    "        ('ridge', Ridge(fit_intercept=True, alpha=a)),\n",
+    "        ('elastic-net', ElasticNet(fit_intercept=True, alpha=a))\n",
+    "        ]:\n",
+    "    met.fit(x,y)\n",
+    "    # p = np.array([met.predict(xi) for xi in x])\n",
+    "    p = met.predict(x)\n",
+    "    e = p-y\n",
+    "    total_error = np.dot(e,e)\n",
+    "    rmse_train = np.sqrt(total_error/len(p))\n",
+    "\n",
+    "    kf = KFold(len(x), n_folds=10)\n",
+    "    err = 0\n",
+    "    for train,test in kf:\n",
+    "        met.fit(x[train],y[train])\n",
+    "        p = met.predict(x[test])\n",
+    "        e = p-y[test]\n",
+    "        err += np.dot(e,e)\n",
+    "\n",
+    "    rmse_10cv = np.sqrt(err/len(x))\n",
+    "    print('Method: %s' %name)\n",
+    "    print('RMSE on training: %.4f' %rmse_train)\n",
+    "    print('RMSE on 10-fold CV: %.4f' %rmse_10cv)\n",
+    "    print('\\n')"
+   ]
+  },
   {
    "cell_type": "code",
    "execution_count": null,
@@ -868,7 +893,7 @@
    "name": "python",
    "nbconvert_exporter": "python",
    "pygments_lexer": "ipython3",
-   "version": "3.6.0"
+   "version": "3.5.3"
   }
  },
  "nbformat": 4,