Open navigation menu

Scribd

0% found this document useful (0 votes)

18 views8 pages

Da 012307

The document consists of two assignments involving data analysis using Python libraries such as pandas, scikit-learn, and mlxtend. It covers tasks including linear regression, logistic regression, and association rule mining with datasets related to sales, purchases, and transactions. The assignments demonstrate model training, evaluation, and visualization techniques for predictive analytics.

Uploaded by

Copyright

© © All Rights Reserved

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

18 views8 pages

Da 012307

The document consists of two assignments involving data analysis using Python libraries such as pandas, scikit-learn, and mlxtend. It covers tasks including linear regression, logistic regression, and association rule mining with datasets related to sales, purchases, and transactions. The assignments demonstrate model training, evaluation, and visualization techniques for predictive analytics.

Uploaded by

Copyright

© © All Rights Reserved

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 8

ASSIGNMENT 1

SET A

Import pandas as pd

import numpy as np

from sklearn.model_selection import train_test_split

from sklearn.linear_model import LinearRegression

from sklearn.metrics import mean_squared_error

import matplotlib.pyplot as plt

#create Dataset

np.random.seed(42)

data_size = 500

df = pd.DataFrame({'ID': np.arange(1,data_size+1),

'TV':np.random.uniform(0, 300, data_size),

'Radio':np.random.uniform(0,100,data_size),

'Newspaper':np.random.uniform(0,50,data_size),

'Sales':np.random.uniform(5,25,data_size)})

df

#split into training and testing data

x = df[['TV']]

y = df['Sales']

X_train, X_test, Y_train, Y_test = train_test_split(x, y, test_size = 0.3, random_state = 42)

#Train Linear regression Model

model = LinearRegression()

model.fit(X_train,Y_train)

#Make Predictions

Y_pred = model.predict(X_test)

#Evaluate Model Performance

mse = mean_squared_error(Y_test, Y_pred)

r2_score = model.score(X_test, Y_test)

print("Model Coefficient:", model.coef_)

print("Intercept:", model.intercept_)

print("Mean Squared error:", mse)

print("R2 score:", r2_score)

plt.scatter(X_train, Y_train)

plt.plot(X_train, model.predict(X_train), color = "red")

#2

import pandas as pd

import numpy as np

from sklearn.model_selection import train_test_split

from sklearn.linear_model import LinearRegression

from sklearn.metrics import mean_squared_error

import matplotlib.pyplot as plt

#create Dataset

np.random.seed(42)

data_size = 500

df = pd.DataFrame({'ID': np.arange(1,data_size+1),

'Flat':np.random.uniform(500, 5000, data_size),

'Houses':np.random.uniform(1000,10000,data_size),

'Purchases':np.random.uniform(1,100,data_size),})

df

#split into training and testing data

x = df[['Houses']]

y = df['Purchases']

X_train, X_test, Y_train, Y_test = train_test_split(x, y, test_size = 0.3, random_state = 42)

#Train Linear regression Model

model = LinearRegression()

model.fit(X_train,Y_train)

#Make Predictions

Y_pred = model.predict(X_test)

#Evaluate Model Performance

mse = mean_squared_error(Y_test, Y_pred)

r2_score = model.score(X_test, Y_test)

print("Model Coefficient:", model.coef_)

print("Intercept:", model.intercept_)

print("Mean Squared error:", mse)

print("R2 score:", r2_score)

plt.scatter(X_train, Y_train, color = 'red')

plt.plot(X_train,model.predict(X_train))

#3

import pandas as pd

import numpy as np

from sklearn.model_selection import train_test_split

from sklearn.preprocessing import LabelEncoder

from sklearn.linear_model import LogisticRegression

from sklearn.metrics import accuracy_score, confusion_matrix, classification_report

#create Dataset

np.random.seed(42)

data_size = 500

df = pd.DataFrame({'UserID': np.arange(1,data_size+1),

'Gender':np.random.choice(['Male','Female'],data_size),
'Age':np.random.randint(18,70,data_size),

'EstimatedSalary':np.random.randint(20000,150000,data_size),

'Purchased':np.random.choice([0,1],data_size)})

Df

#convert Categorical Data into numeric form

encoder = LabelEncoder()

df['Gender'] = encoder.fit_transform(df['Gender'])

#split into training and testing datasets

x = df[['Gender']]

y = df[['Purchased']]

X_train, X_test, Y_train, Y_test = train_test_split(x, y, test_size = 0.3, random_state = 42)

#Train a Logistic Regression Model

df

model = LogisticRegression()

model.fit(X_train, Y_train)

#make Predictions

Y_pred = model.predict(X_test)

#Evaluate Model Performance

accuracy = accuracy_score(Y_test, Y_pred)

conf_matrix = confusion_matrix(Y_test, Y_pred)

class_report = classification_report(Y_test, Y_pred)

print("Accuracy:", accuracy)

print("Confusion Matrix:\n", conf_matrix)

print("Class Report:", class_report)

plt.scatter(X_train, Y_train)

plt.plot(X_train, model.predict(X_train), color = "red")

SET B

#1

import pandas as pd

import numpy as np

from sklearn.model_selection import train_test_split

from sklearn.linear_model import LinearRegression

from sklearn.metrics import mean_squared_error

from sklearn.preprocessing import LabelEncoder

import matplotlib.pyplot as plt

%matplotlib inline

data = pd.read_csv('Fish.csv')

data

x = data[['Species','Length1', 'Length2', 'Length3', 'Height', 'Width']]

y = data[['Weight']]

encoder = LabelEncoder()

x['Species'] = encoder.fit_transform(df['Species'])

X_train, X_test, Y_train, Y_test = train_test_split(y, x, test_size = 0.3, random_state = 42)

model = LinearRegression()

model.fit(X_train,Y_train)

Y_pred = model.predict(X_test)

mse = mean_squared_error(Y_test, Y_pred)

r2_score = model.score(X_test, Y_test)

print("Model Coefficient:", model.coef_)

print("Intercept:", model.intercept_)

print("Mean Squared error:", mse)

print("R2 score:", r2_score)

plt.scatter(Y_test, Y_pred)

plt.xlabel("actual Weight")
plt.ylabel("Predicted Weight")

plt.title('Actual vs Predicted Fish Weight')

plt.show()

#2

from sklearn import datasets

iris = datasets.load_iris()

d = pd.DataFrame(data = iris.data, columns = iris.feature_names)

d['species'] = iris.target

d['species'] = d['species'].map({0:'Iris-setosa', 1:'Iris-Versicolor', 2:'Iris-virginica'})

d.head(5)

stats = d.groupby('species').describe()

print(stats)

x = d.iloc[:,:-1]

y = d['species']

X_train, X_test, Y_train, Y_test = train_test_split(x, y, test_size = 0.3, random_state = 42)

from sklearn.linear_model import LogisticRegression

model = LogisticRegression()

model.fit(X_train, Y_train)

Y_pred = model.predict(X_test)

from sklearn import metrics

import seaborn as sns

confusion_matrix = pd.crosstab(Y_test, Y_pred, rownames = ['Actual'], colnames = ['Predicted'])

sns.heatmap(confusion_matrix, annot = True)

ASSIGNMENT 2

#1

#Read the data, Enocode the data

import pandas as pd

from mlxtend.frequent_patterns import apriori, association_rules

transactions = [['1', 'Bread, Milk'],

['2', 'Bread, Diaper, Beer, Eggs'],

['3', 'Milk, Diaper, Beer, Coke'],

['4', 'Bread, Milk, Diaper, Beer'],

['5', 'Bread, Milk, Diaper, Coke']];

from mlxtend.preprocessing import TransactionEncoder

te = TransactionEncoder()

te_array = te.fit(transactions).transform(transactions)

df = pd.DataFrame(te_array, columns = te.columns_)

df

freq_items = apriori(df, min_support = 0.2, use_colnames = True)

print(freq_items)

rules = association_rules(freq_items, metric = 'support', min_threshold = 0.05)

rules = rules.sort_values(['support', 'confidence'], ascending = [False, False])

print(rules)

#2

import pandas as pd

from mlxtend.frequent_patterns import apriori, association_rules

transactions = [['eggs', 'milk', 'bread'],

['eggs', 'apple'],

['milk', 'bread'],

['apple', 'milk'],

['milk', 'apple', 'bread']];

from mlxtend.preprocessing import TransactionEncoder

te = TransactionEncoder()

te_array = te.fit(transactions).transform(transactions)

df = pd.DataFrame(te_array, columns = te.columns_)

df

freq_items = apriori(df, min_support = 0.5, use_colnames = True)

print(freq_items)

rules = association_rules(freq_items, metric = 'support', min_threshold = 0.05)

rules = rules.sort_values(['support', 'confidence'], ascending = [False, False])

print(rules)

You might also like

Optimal Control Textbook Download
No ratings yet
Optimal Control Textbook Download
63 pages
Bi-Setion Method Lab Report..
No ratings yet
Bi-Setion Method Lab Report..
5 pages
Nmce Unit 01
No ratings yet
Nmce Unit 01
142 pages
Lecture 3
No ratings yet
Lecture 3
25 pages
Ecc321 Chapter 3
No ratings yet
Ecc321 Chapter 3
8 pages
Q2W1 Polynomial Function
No ratings yet
Q2W1 Polynomial Function
21 pages
ML Minimized Programs
No ratings yet
ML Minimized Programs
9 pages
Range Kota
No ratings yet
Range Kota
2 pages
Kolmogorov Uji Normalitas
No ratings yet
Kolmogorov Uji Normalitas
19 pages
SOPel
No ratings yet
SOPel
2 pages
Open Ended Lab
No ratings yet
Open Ended Lab
4 pages
PDF File - MTH603 - Assignment 1 - Spring 2024 - Attique Ur-Rehman
No ratings yet
PDF File - MTH603 - Assignment 1 - Spring 2024 - Attique Ur-Rehman
6 pages
Aiml Programs
No ratings yet
Aiml Programs
12 pages
Legendre Polynomials - Orthogonality
No ratings yet
Legendre Polynomials - Orthogonality
4 pages
ML Lab Record
No ratings yet
ML Lab Record
17 pages
Da Lab Mannual
No ratings yet
Da Lab Mannual
25 pages
Iii Aid - ML
No ratings yet
Iii Aid - ML
30 pages
Practicalpgm ML
No ratings yet
Practicalpgm ML
33 pages
Machine Learning Lab Assignment 1
No ratings yet
Machine Learning Lab Assignment 1
23 pages
ML Journal External
No ratings yet
ML Journal External
14 pages
Chapter Wise Work Sheet - Polynomials
No ratings yet
Chapter Wise Work Sheet - Polynomials
4 pages
Aiml Practical
No ratings yet
Aiml Practical
17 pages
Assignment3 123EI0050
No ratings yet
Assignment3 123EI0050
3 pages
Quantile Regression
No ratings yet
Quantile Regression
3 pages
CP4252 Lab Manual
No ratings yet
CP4252 Lab Manual
13 pages
ML Yogesh
No ratings yet
ML Yogesh
23 pages
1
No ratings yet
1
13 pages
Matrix - Xla - Excel Addin
No ratings yet
Matrix - Xla - Excel Addin
112 pages
ML All Projectpdf Removed
No ratings yet
ML All Projectpdf Removed
41 pages
DA Assignment
No ratings yet
DA Assignment
18 pages
Dsbda 5
No ratings yet
Dsbda 5
4 pages
Print Out ML - Finallllllllllllllll
No ratings yet
Print Out ML - Finallllllllllllllll
11 pages
21CSC305P ML - Lab Programs 1 - 9
No ratings yet
21CSC305P ML - Lab Programs 1 - 9
36 pages
Data Analytics Program
No ratings yet
Data Analytics Program
11 pages
3rd Quarter Exam Math 7
No ratings yet
3rd Quarter Exam Math 7
20 pages
23BCE7199 ML Lab Assignment
No ratings yet
23BCE7199 ML Lab Assignment
15 pages
Shobit Sharma (2124399) ML Lab File PDF
No ratings yet
Shobit Sharma (2124399) ML Lab File PDF
19 pages
ML Internal Answers
No ratings yet
ML Internal Answers
9 pages
Regression Prac 9
No ratings yet
Regression Prac 9
8 pages
Null 10
No ratings yet
Null 10
109 pages
Or (Bba-405)
No ratings yet
Or (Bba-405)
4 pages
Numerical Methods: Jeffrey R. Chasnov
No ratings yet
Numerical Methods: Jeffrey R. Chasnov
60 pages
ML Journal
No ratings yet
ML Journal
45 pages
ML External Xerox
No ratings yet
ML External Xerox
1 page
ML Internal Questions
No ratings yet
ML Internal Questions
15 pages
23BCE7092 ML Lab Assignment
No ratings yet
23BCE7092 ML Lab Assignment
14 pages
Lec15 PDF
No ratings yet
Lec15 PDF
83 pages
ML PDF
No ratings yet
ML PDF
30 pages
Ann Experiential Learning
No ratings yet
Ann Experiential Learning
43 pages
ML
No ratings yet
ML
17 pages
ML Lab Prgms Split
No ratings yet
ML Lab Prgms Split
3 pages
Btech1007022 Lab5
No ratings yet
Btech1007022 Lab5
14 pages
05 E RandomForest LoanData
No ratings yet
05 E RandomForest LoanData
8 pages
SiddharthShah 1032221195 DivC 50 DL LabAssignment2
No ratings yet
SiddharthShah 1032221195 DivC 50 DL LabAssignment2
7 pages
Btech1007022 Lab5.1
No ratings yet
Btech1007022 Lab5.1
9 pages
ML Lab Programs
No ratings yet
ML Lab Programs
9 pages
DA Practicle Answers Easyw
No ratings yet
DA Practicle Answers Easyw
30 pages
Machine Learning
No ratings yet
Machine Learning
10 pages
ML Codes
No ratings yet
ML Codes
9 pages
Hemraj Python Ass1
No ratings yet
Hemraj Python Ass1
7 pages
1st PGM
No ratings yet
1st PGM
10 pages
Train
No ratings yet
Train
17 pages
TMA4180 Solutions To Recommended Exercises in Chapter 12 of N&W
No ratings yet
TMA4180 Solutions To Recommended Exercises in Chapter 12 of N&W
4 pages
ML File
No ratings yet
ML File
10 pages
Data Analytics
No ratings yet
Data Analytics
10 pages
Chapter 6 Resource Masters: PDF Pass
No ratings yet
Chapter 6 Resource Masters: PDF Pass
88 pages
Lab Exam ... Roll No 24cs4103
No ratings yet
Lab Exam ... Roll No 24cs4103
4 pages
Numerical Modelling Workshop
No ratings yet
Numerical Modelling Workshop
17 pages
ML Lab Manual
No ratings yet
ML Lab Manual
36 pages
Aiml Practicals
No ratings yet
Aiml Practicals
22 pages
Semester-IV EC401 Analog Communication 3L:0T:0P 3 Credits
No ratings yet
Semester-IV EC401 Analog Communication 3L:0T:0P 3 Credits
15 pages
MATRIX CHAIN Multiplication
No ratings yet
MATRIX CHAIN Multiplication
41 pages
Zerox Ready
No ratings yet
Zerox Ready
21 pages
Math11ae Ptc-Acbet Ver
No ratings yet
Math11ae Ptc-Acbet Ver
5 pages
PARATIE EN - Advanced-Modelling-2014 PDF
No ratings yet
PARATIE EN - Advanced-Modelling-2014 PDF
50 pages
FYMCA IDSLab A6 Submission
No ratings yet
FYMCA IDSLab A6 Submission
9 pages
Data Mining Practicals
No ratings yet
Data Mining Practicals
22 pages
Unit2 ML Programs
No ratings yet
Unit2 ML Programs
7 pages
Lesson Plan in Mathematics 10: School Grade Level Teacher Learning Area Teaching Dates and Time Quarter
100% (1)
Lesson Plan in Mathematics 10: School Grade Level Teacher Learning Area Teaching Dates and Time Quarter
4 pages
Machine Learnin
100% (2)
Machine Learnin
23 pages
Import Pandas As PD DF PD - Read - CSV ("Titanic - Train - CSV") DF - Head
No ratings yet
Import Pandas As PD DF PD - Read - CSV ("Titanic - Train - CSV") DF - Head
20 pages
Supervised Learning For Data Science...
No ratings yet
Supervised Learning For Data Science...
14 pages
Machine
100% (1)
Machine
45 pages
Exam Paper RGPV MMPD First Sem
No ratings yet
Exam Paper RGPV MMPD First Sem
45 pages
Aiml Ex 4-7
No ratings yet
Aiml Ex 4-7
8 pages
Final ML File
No ratings yet
Final ML File
34 pages
Wa0002.
No ratings yet
Wa0002.
5 pages
Python For Beginners
From Everand
Python For Beginners
Célio Azevedo
No ratings yet
16BCB0126 VL2018195002535 Pe003
No ratings yet
16BCB0126 VL2018195002535 Pe003
40 pages