100% found this document useful (1 vote)

355 views

Experiment 5

This document describes performing various statistical analyses on diabetes datasets: 1) Univariate analysis including frequency, mean, median, mode, variance, standard deviation, skewness and kurtosis. 2) Bivariate analysis using linear and logistic regression modeling. 3) Multiple regression analysis. 4) A comparison of the results from the above analyses between two diabetes datasets.

Uploaded by

Nesamanikandan S

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

100% found this document useful (1 vote)

355 views

Experiment 5

Uploaded by

Nesamanikandan S

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

You are on page 1/ 6

EXPERIMENT-5

Use the diabetes data set from UCI and Pima Indians Diabetes data set for performing the
following:
a. Univariate analysis: Frequency, Mean, Median, Mode, Variance, Standard Deviation,
Skewness and Kurtosis.
b. Bivariate analysis: Linear and logistic regression modeling.
c. Multiple Regression analysis.
d. Also compare the results of the above analysis for the two data sets

Code:
a) import pandas as pd
import scipy.stats as sp
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score, confusion_matrix,
classification_report
import pandas as pd
import matplotlib.pyplot as plt
import statsmodels.api as sm
import seaborn as sns
import warnings as warn
warn.filterwarnings("ignore")
df=pd.read_csv('diabetes.csv')
print("Frequency:\n", df.value_counts())
print("Mean:\n", df.mean)
print("Median:\n", df.median)
print("Mode:\n", df.mode)
print("Variance:\n", df.var)
print("Standard deviation:\n", df.std)
print("Skewness:\n", sp.skew(df))
print("Kurtosis:\n", sp.kurtosis(df))

Output:
b) Code:
#Linear regression
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error
# Load your dataset
data = pd.read_csv('diabetes.csv')
# Select independent (X) and dependent (y) variables
X = data[['Age']]
y = data['BloodPressure']
# Split the data into training and testing sets
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.2,
random_state = 42)
# Create a linear regression model
model = LinearRegression()
# Fit the model to the training data
model.fit(X_train, y_train)
# Make predictions on the test data
predictions = model.predict(X_test)
# Evaluate the model
mse = mean_squared_error(y_test, predictions)
print(f'Mean Squared Error:\n',mse)
# Plot the regression line
plt.scatter(X_test, y_test, color = 'black')
plt.plot(X_test, predictions, color = 'blue', linewidth = 3)
plt.xlabel('Independent Variable')
plt.ylabel('Dependent Variable')
plt.title('Linear Regression')
plt.show()
#logistic regression
# Load your dataset
data = pd.read_csv('diabetes.csv')
# Select independent (X) and dependent (y) variables
X = data[['Age']]
y = data['BloodPressure']
# Split the data into training and testing sets
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.2,
random_state = 42)
# Create a logistic regression model
model = LogisticRegression()
# Fit the model to the training data
model.fit(X_train, y_train)
# Make predictions on the test data
predictions = model.predict(X_test)
# Evaluate the model
accuracy = accuracy_score(y_test, predictions)
print('Accuracy: ', accuracy)
# Create a confusion matrix
conf_matrix = confusion_matrix(y_test, predictions)
sns.heatmap(conf_matrix, annot = True, fmt = 'd', cmap = 'grey', cbar =
False)
plt.xlabel('Pre4dicted')
plt.ylabel('Actual')
plt.title('Confusion Matrix - Logistic Regression')
plt.show()
Output:

c) Code:
X_multi = sm.add_constant(X_test)
multi_model = sm.OLS(y_test, X_multi).fit()
print("\n3. )Multiple Regression: ")
# Display multiple regression results
print("\nMultiple Regression Results:")
print(multi_model.summary())

Output:

d) Code:
data2=pd.read_csv('d2.csv')
result = data.compare(data2)
print("comparision of two datasets ")
print(result)

Output:

Machine Learning Lab Manual 06
100% (1)
Machine Learning Lab Manual 06
8 pages
Gap Analysis Template
100% (2)
Gap Analysis Template
6 pages
Ad3301 Dev Full Notes
No ratings yet
Ad3301 Dev Full Notes
53 pages
Fdsa UNIT V
No ratings yet
Fdsa UNIT V
18 pages
FDS Lab Manual
No ratings yet
FDS Lab Manual
48 pages
EDA - With Python Question Bank
No ratings yet
EDA - With Python Question Bank
3 pages
Ad3491 Fdsa Unit 4 Notes Eduengg-2
No ratings yet
Ad3491 Fdsa Unit 4 Notes Eduengg-2
16 pages
Machine Learning Lab Manual
No ratings yet
Machine Learning Lab Manual
23 pages
Ad3411 - Student
No ratings yet
Ad3411 - Student
27 pages
Untitled
No ratings yet
Untitled
4 pages
Unit 5 Fod (1) (Repaired)
No ratings yet
Unit 5 Fod (1) (Repaired)
28 pages
FDS Lesson Plan
No ratings yet
FDS Lesson Plan
8 pages
Ad3491 Fdsa Unit 3 Notes Eduengg
No ratings yet
Ad3491 Fdsa Unit 3 Notes Eduengg
37 pages
Security Trends, Legal, Ethical and Professional Aspects of Security
No ratings yet
Security Trends, Legal, Ethical and Professional Aspects of Security
3 pages
CP4252 Machine Learning Lab Manual
No ratings yet
CP4252 Machine Learning Lab Manual
33 pages
Machine Learning Unit 5
No ratings yet
Machine Learning Unit 5
43 pages
AD3351 DAA Lab Manual
No ratings yet
AD3351 DAA Lab Manual
47 pages
CS3361 - Data Science Laboratory
No ratings yet
CS3361 - Data Science Laboratory
31 pages
Dbms
No ratings yet
Dbms
99 pages
Introduction To Data Science Lab Manual
100% (1)
Introduction To Data Science Lab Manual
76 pages
Ad3311 - Artificial Intelligence Lab Manual
100% (1)
Ad3311 - Artificial Intelligence Lab Manual
30 pages
18CSO106T Data Analysis Using Open Source Tool: Question Bank
No ratings yet
18CSO106T Data Analysis Using Open Source Tool: Question Bank
26 pages
Question Paper - AI (Feb 1)
No ratings yet
Question Paper - AI (Feb 1)
2 pages
12-Exploratory Data Analysis, Anomaly Detection-28!03!2023
No ratings yet
12-Exploratory Data Analysis, Anomaly Detection-28!03!2023
79 pages
Fundamentals of Data Science: Nehru Institute of Engineering and Technology
100% (1)
Fundamentals of Data Science: Nehru Institute of Engineering and Technology
17 pages
Ccs341 Question Bank
No ratings yet
Ccs341 Question Bank
10 pages
CS-605 Data - Analytics - Lab Complete Manual (2) - 1672730238
No ratings yet
CS-605 Data - Analytics - Lab Complete Manual (2) - 1672730238
56 pages
DAA UNIT 4 - Final
No ratings yet
DAA UNIT 4 - Final
12 pages
Numpy - Tutorial - Ipynb - Colaboratory
No ratings yet
Numpy - Tutorial - Ipynb - Colaboratory
9 pages
Classification and Prediction
No ratings yet
Classification and Prediction
126 pages
Python Record Final With Viva Question
No ratings yet
Python Record Final With Viva Question
100 pages
CCS341 Set3
100% (1)
CCS341 Set3
3 pages
FDSA Unit-2
No ratings yet
FDSA Unit-2
41 pages
Deep Learning for Vision Lab Manual 2024
100% (1)
Deep Learning for Vision Lab Manual 2024
25 pages
Ad3311 Set4
No ratings yet
Ad3311 Set4
2 pages
Cs3353 Foundations of Data Science L T P C 3 0 0 3
No ratings yet
Cs3353 Foundations of Data Science L T P C 3 0 0 3
2 pages
DL Lab Manual
100% (1)
DL Lab Manual
35 pages
Study On Intel 80386 Microprocessor
No ratings yet
Study On Intel 80386 Microprocessor
3 pages
Dimensionality Reduction
No ratings yet
Dimensionality Reduction
4 pages
Unit 4 Fod
100% (1)
Unit 4 Fod
21 pages
BDA Unit 1-1
No ratings yet
BDA Unit 1-1
21 pages
CCW331 BA IAT 1 Set 1 & Set 2 Questions
No ratings yet
CCW331 BA IAT 1 Set 1 & Set 2 Questions
19 pages
CS3361 Data Science Lab Manual (II CYS)
100% (1)
CS3361 Data Science Lab Manual (II CYS)
40 pages
Unit V Graphical Models
No ratings yet
Unit V Graphical Models
23 pages
EDA Unit IV
No ratings yet
EDA Unit IV
17 pages
CS3362 - Data Science Laboratory - Manual - Final-1
No ratings yet
CS3362 - Data Science Laboratory - Manual - Final-1
76 pages
DS&BD Lab Manul
No ratings yet
DS&BD Lab Manul
98 pages
Unit 5
No ratings yet
Unit 5
27 pages
File Handling in R Programming: Eg: File - Create ("GFG - TXT")
No ratings yet
File Handling in R Programming: Eg: File - Create ("GFG - TXT")
2 pages
Python Record
No ratings yet
Python Record
35 pages
Q&A Univ 3unit
No ratings yet
Q&A Univ 3unit
18 pages
Ccs334 Big Data Analytics
0% (1)
Ccs334 Big Data Analytics
2 pages
CS3492 Database Management Systems Question Bank 1
No ratings yet
CS3492 Database Management Systems Question Bank 1
11 pages
Ad3301 Data Exploration and Visualization
No ratings yet
Ad3301 Data Exploration and Visualization
24 pages
Syllabus GE3151 PROBLEM SOLVING AND PYTHON PROGRAMMING 3 0 0 3
No ratings yet
Syllabus GE3151 PROBLEM SOLVING AND PYTHON PROGRAMMING 3 0 0 3
2 pages
CP4252 Machine Learning lab manual
No ratings yet
CP4252 Machine Learning lab manual
37 pages
DAP Lab Manual
No ratings yet
DAP Lab Manual
20 pages
CCS355 Neural Networks and Deep Learning
No ratings yet
CCS355 Neural Networks and Deep Learning
142 pages
IF4071 - Deep Learning Laboratory
No ratings yet
IF4071 - Deep Learning Laboratory
1 page
Ex 6
No ratings yet
Ex 6
7 pages
Lab 1
No ratings yet
Lab 1
8 pages
Lecture Notes on Multicollinearity
No ratings yet
Lecture Notes on Multicollinearity
16 pages
Thesis Actuarial Science
100% (3)
Thesis Actuarial Science
5 pages
An Empirical Survey on Social Media Usage Affect Academic Performance
No ratings yet
An Empirical Survey on Social Media Usage Affect Academic Performance
12 pages
Week 7 - Linear and Multiple Regression.docx
No ratings yet
Week 7 - Linear and Multiple Regression.docx
2 pages
Regression Analysis in Excel (In Easy Steps)
No ratings yet
Regression Analysis in Excel (In Easy Steps)
4 pages
Logistic Regression Via Excel Spreadsheets Mechani
No ratings yet
Logistic Regression Via Excel Spreadsheets Mechani
12 pages
from data tl11
No ratings yet
from data tl11
2 pages
Example 04.02 Butler With Deliveries-JayDomingoFinal
No ratings yet
Example 04.02 Butler With Deliveries-JayDomingoFinal
75 pages
04 Chap04 ClassificationMethods-LogisticRegression 2024
No ratings yet
04 Chap04 ClassificationMethods-LogisticRegression 2024
23 pages
Nursyariah Ilman
No ratings yet
Nursyariah Ilman
3 pages
FUNDAMENTALS_OF_DATA SCIENCE_MANUAL_SCIT
No ratings yet
FUNDAMENTALS_OF_DATA SCIENCE_MANUAL_SCIT
88 pages
Ejercicio Hetero
No ratings yet
Ejercicio Hetero
6 pages
Global AM 2020 Survey Industry Deck - Public
No ratings yet
Global AM 2020 Survey Industry Deck - Public
15 pages
Subject A213 Contingencies
No ratings yet
Subject A213 Contingencies
6 pages
CPH PPT #4
No ratings yet
CPH PPT #4
107 pages
Walpole_Ch-12_KZ
No ratings yet
Walpole_Ch-12_KZ
33 pages
Eviews VAR Stata
No ratings yet
Eviews VAR Stata
17 pages
Tut 5
No ratings yet
Tut 5
4 pages
Chapter 3_Logit and Probit Models
No ratings yet
Chapter 3_Logit and Probit Models
34 pages
Analisis Regresi Linier Sederhana Dan Koefisien Determinasi(1)
No ratings yet
Analisis Regresi Linier Sederhana Dan Koefisien Determinasi(1)
6 pages
Personal Statement Writing Guide
100% (1)
Personal Statement Writing Guide
40 pages
Population of Saint Lucia 2015
No ratings yet
Population of Saint Lucia 2015
3 pages
Econometrics Final Paper Question
No ratings yet
Econometrics Final Paper Question
3 pages
FRAM Time Series
No ratings yet
FRAM Time Series
30 pages
Importance of Calculus To Actuaries
No ratings yet
Importance of Calculus To Actuaries
10 pages
R Markdown File Mid
No ratings yet
R Markdown File Mid
13 pages
Machine Learning in Python
No ratings yet
Machine Learning in Python
36 pages
Robuxio-Live-Performance-Metrics
No ratings yet
Robuxio-Live-Performance-Metrics
1 page
Appendix A PV/FV Tables: Present Value of Ordinary Annuity
No ratings yet
Appendix A PV/FV Tables: Present Value of Ordinary Annuity
3 pages

Experiment 5

Uploaded by

Experiment 5

Uploaded by

EXPERIMENT-5

You might also like