0% found this document useful (0 votes)

6 views2 pages

Ai Code

The document outlines a data analysis workflow using Python, including data loading, exploration, visualization, handling missing values, and encoding categorical variables. It utilizes logistic regression to train a model on the processed data and evaluates its performance through accuracy, confusion matrix, and classification report. Key libraries used include pandas, numpy, matplotlib, seaborn, and scikit-learn.

Uploaded by

thetit4ns

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

6 views2 pages

Ai Code

Uploaded by

thetit4ns

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 2

# Import necessary libraries

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from google.colab import files
from sklearn.impute import SimpleImputer
from sklearn.preprocessing import LabelEncoder
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score, confusion_matrix,
classification_report

# Step 1: Upload and load the CSV file

# Load the data into a DataFrame

df = pd.read_csv(“Data”)

# Step 2: Explore the data

print("Exploring data info")
print(df.info())

print("\nFirst 8 rows")
print(df.head(8))

print("\nGetting statistical summary")

print(df.describe())

print("\nChecking for missing values")

print(df.isnull().sum())

print("\nGetting shape of the DataFrame")

print(df.shape)

# Step 3: Visualize the 'Purchased' column

plt.figure(figsize=(6, 4))
sns.countplot(x='Purchased', data=df)
plt.title('Distribution of Purchased (Target Variable)')
plt.show()

# Step 4: Handle missing values

# Handling missing values with mean imputation for numerical columns
imputer = SimpleImputer(strategy='mean')
df['Age'] = imputer.fit_transform(df[['Age']])
df['Income'] = imputer.fit_transform(df[['Income']])
# Step 5: Encode categorical variables
# Apply label encoding to the 'Purchased' column
label_encoder = LabelEncoder()
df['Purchased'] = label_encoder.fit_transform(df['Purchased'])

# Apply one-hot encoding to the 'Gender' column

df = pd.get_dummies(df, columns=['Gender'], drop_first=True)

# Display the first few rows to verify the encoding

print("\nData after encoding:")
print(df.head())

# Step 6: Prepare features and target variable

# Assuming 'Gender_Male' is the new column after one-hot encoding
X = df[['Age', 'Income', 'Gender_Male']] # Features
y = df['Purchased'] # Target variable

# Step 7: Split the data into training and testing sets

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.25,
random_state=42)

# Step 8: Train the logistic regression model

model = LogisticRegression()
model.fit(X_train, y_train)

# Step 9: Make predictions on the test set

y_pred = model.predict(X_test)

# Step 10: Evaluate the model

accuracy = accuracy_score(y_test, y_pred)
conf_matrix = confusion_matrix(y_test, y_pred)
class_report = classification_report(y_test, y_pred)

print(f"\nModel Accuracy: {accuracy:.2f}")

print("\nConfusion Matrix:")
print(conf_matrix)
print("\nClassification Report:")
print(class_report)

Supervised Learning
100% (1)
Supervised Learning
15 pages
Capstone Project Final Submission
No ratings yet
Capstone Project Final Submission
13 pages
Machine Learning Lab Manual 06
100% (1)
Machine Learning Lab Manual 06
8 pages
ML Complete Notes Hridoy
No ratings yet
ML Complete Notes Hridoy
5 pages
Data Analysis in Python-3
No ratings yet
Data Analysis in Python-3
4 pages
DS Food
No ratings yet
DS Food
23 pages
Da 012307
No ratings yet
Da 012307
8 pages
DSBDA Practicals
No ratings yet
DSBDA Practicals
16 pages
DA Programs
No ratings yet
DA Programs
44 pages
Train
No ratings yet
Train
17 pages
Da Lab Mannual
No ratings yet
Da Lab Mannual
25 pages
ML External Xerox
No ratings yet
ML External Xerox
1 page
Iii Aid - ML
No ratings yet
Iii Aid - ML
30 pages
DA Practicle Answers Easyw
No ratings yet
DA Practicle Answers Easyw
30 pages
ML 6 7 8
No ratings yet
ML 6 7 8
10 pages
Assignment 9
No ratings yet
Assignment 9
2 pages
Aiml Ex 4-7
No ratings yet
Aiml Ex 4-7
8 pages
Project Paarth
No ratings yet
Project Paarth
21 pages
Data Analytics Program
No ratings yet
Data Analytics Program
11 pages
Credit - Defaulters - Prediction Using Logostic Regression
No ratings yet
Credit - Defaulters - Prediction Using Logostic Regression
17 pages
Machine Learning Hands-On
100% (1)
Machine Learning Hands-On
18 pages
ML PDF
No ratings yet
ML PDF
30 pages
Dsbda 5
No ratings yet
Dsbda 5
4 pages
Web II & DA Slip Solution
No ratings yet
Web II & DA Slip Solution
40 pages
ML Lab Programs
No ratings yet
ML Lab Programs
9 pages
StarterNotebook - Jupyter Notebook
No ratings yet
StarterNotebook - Jupyter Notebook
12 pages
Logistic Regression
No ratings yet
Logistic Regression
3 pages
Logistic Regression
No ratings yet
Logistic Regression
18 pages
Data Preprocessing Example Programs1
No ratings yet
Data Preprocessing Example Programs1
9 pages
Logistic Regression
No ratings yet
Logistic Regression
21 pages
Btech1007022 Lab5
No ratings yet
Btech1007022 Lab5
14 pages
FYMCA IDSLab A6 Submission
No ratings yet
FYMCA IDSLab A6 Submission
9 pages
Btech1007022 Lab5.1
No ratings yet
Btech1007022 Lab5.1
9 pages
Python 1
No ratings yet
Python 1
3 pages
Module-2 - Logistic Regression in Machine Learning
No ratings yet
Module-2 - Logistic Regression in Machine Learning
28 pages
Articles Xgboost Classification With Smote-Enn Algorithm
No ratings yet
Articles Xgboost Classification With Smote-Enn Algorithm
11 pages
Data Science Record - 05
No ratings yet
Data Science Record - 05
20 pages
Data Analytics
No ratings yet
Data Analytics
10 pages
Komal ML Assg1
No ratings yet
Komal ML Assg1
9 pages
Hemraj Python Ass1
No ratings yet
Hemraj Python Ass1
7 pages
SiddharthShah 1032221195 DivC 50 DL LabAssignment2
No ratings yet
SiddharthShah 1032221195 DivC 50 DL LabAssignment2
7 pages
ML Batch
No ratings yet
ML Batch
36 pages
Machine Learning Strategies
No ratings yet
Machine Learning Strategies
59 pages
Python Code For Loan Default Prediction
No ratings yet
Python Code For Loan Default Prediction
4 pages
DA Assignment
No ratings yet
DA Assignment
18 pages
ML 1-10
No ratings yet
ML 1-10
53 pages
Week-7 DS Practical
No ratings yet
Week-7 DS Practical
8 pages
Easy Pract ML
No ratings yet
Easy Pract ML
7 pages
Data Mining Lab Manual CSE VII Sem
No ratings yet
Data Mining Lab Manual CSE VII Sem
63 pages
23BCE7199 ML Lab Assignment
No ratings yet
23BCE7199 ML Lab Assignment
15 pages
Datascience PR 6 Veda
No ratings yet
Datascience PR 6 Veda
6 pages
5 Logistic Regression Social NW
No ratings yet
5 Logistic Regression Social NW
5 pages
ML
No ratings yet
ML
17 pages
ML Internal Answers
No ratings yet
ML Internal Answers
9 pages
Sanket ML Assign1
No ratings yet
Sanket ML Assign1
9 pages
Logistic Regression
100% (1)
Logistic Regression
10 pages
Machine File
No ratings yet
Machine File
27 pages
Model Learning Steps
No ratings yet
Model Learning Steps
12 pages
Machine Learning Record VR19
No ratings yet
Machine Learning Record VR19
46 pages
Srushti ML Assign1
No ratings yet
Srushti ML Assign1
9 pages
Scala Data Analysis Cookbook (new): Navigate the world of data analysis, visualization, and machine learning with over 100 hands-on Scala recipes
From Everand
Scala Data Analysis Cookbook (new): Navigate the world of data analysis, visualization, and machine learning with over 100 hands-on Scala recipes
Arun Manivannan
No ratings yet
F Distribution and F-Statistic
No ratings yet
F Distribution and F-Statistic
7 pages
Swot Assignment
No ratings yet
Swot Assignment
1 page
Artificial Intelligence For Data Driven Disruption White Paper 3328en
No ratings yet
Artificial Intelligence For Data Driven Disruption White Paper 3328en
29 pages
Assignment - 3 - Alt - Lab 5.6 SS
No ratings yet
Assignment - 3 - Alt - Lab 5.6 SS
5 pages
Research Proposal Iitm
No ratings yet
Research Proposal Iitm
24 pages
Data Analytics Fundementals
No ratings yet
Data Analytics Fundementals
40 pages
Contents
100% (3)
Contents
8 pages
Chapter Eighteen Forecasting
No ratings yet
Chapter Eighteen Forecasting
15 pages
Data Analysis
No ratings yet
Data Analysis
12 pages
RURAL Banking in India Project - 218154828
No ratings yet
RURAL Banking in India Project - 218154828
57 pages
4.4 Descriptive Stat - Part 4 - Grouped Data - New PDF
No ratings yet
4.4 Descriptive Stat - Part 4 - Grouped Data - New PDF
17 pages
Enphase Energy Associate Manager Data Analyst
No ratings yet
Enphase Energy Associate Manager Data Analyst
2 pages
ANOVA Cotton
No ratings yet
ANOVA Cotton
13 pages
Research Process - DR Imran Hashmi 02 Feb 2016
No ratings yet
Research Process - DR Imran Hashmi 02 Feb 2016
113 pages
48 Wan Nooraini Wan Kamaruddin
No ratings yet
48 Wan Nooraini Wan Kamaruddin
8 pages
The Influence of E-Commitment and E-Trust Towards E-Loyalty Among Internet Banking Users: A PLS Modelling Approach
No ratings yet
The Influence of E-Commitment and E-Trust Towards E-Loyalty Among Internet Banking Users: A PLS Modelling Approach
9 pages
Business Intelligence Assignment
No ratings yet
Business Intelligence Assignment
4 pages
Assignment 01 Front Sheet: Unit Number and Title Unit 31: Statistics For Management
No ratings yet
Assignment 01 Front Sheet: Unit Number and Title Unit 31: Statistics For Management
11 pages
Analysis and Findings Dissertation Example
100% (2)
Analysis and Findings Dissertation Example
8 pages
Blogger Reference 6
No ratings yet
Blogger Reference 6
25 pages
Div Class Title Explaining Fixed Effects Random Effects Modeling of Time Series Cross Sectional and Panel Data A Href fn2606 Ref Type FN A Div
No ratings yet
Div Class Title Explaining Fixed Effects Random Effects Modeling of Time Series Cross Sectional and Panel Data A Href fn2606 Ref Type FN A Div
21 pages
Correlation Lecture
No ratings yet
Correlation Lecture
20 pages
Practice Questions
No ratings yet
Practice Questions
14 pages
Summer Training Project Report Format
No ratings yet
Summer Training Project Report Format
94 pages
Minitab TRG - DR Aravindan
No ratings yet
Minitab TRG - DR Aravindan
66 pages
Shubham Nov 2022
No ratings yet
Shubham Nov 2022
2 pages
Algoritma K-Means Clustering Dan Contoh Soal - KETUTRARE
No ratings yet
Algoritma K-Means Clustering Dan Contoh Soal - KETUTRARE
17 pages
Mengistu Researchb - Dsrwerdfsd
No ratings yet
Mengistu Researchb - Dsrwerdfsd
40 pages
Random State
No ratings yet
Random State
4 pages

Ai Code

Uploaded by

Ai Code

Uploaded by

# Import necessary libraries

# Step 1: Upload and load the CSV file

# Load the data into a DataFrame

# Step 2: Explore the data

print("\nGetting statistical summary")

print("\nChecking for missing values")

print("\nGetting shape of the DataFrame")

# Step 3: Visualize the 'Purchased' column

# Step 4: Handle missing values

# Apply one-hot encoding to the 'Gender' column

# Display the first few rows to verify the encoding

# Step 6: Prepare features and target variable

# Step 7: Split the data into training and testing sets

# Step 8: Train the logistic regression model

# Step 9: Make predictions on the test set

# Step 10: Evaluate the model

print(f"\nModel Accuracy: {accuracy:.2f}")

You might also like