0% found this document useful (0 votes)

18 views5 pages

ML Complete Notes Hridoy

The document outlines a comprehensive data analysis workflow using Python, including data preprocessing, visualization, and model preparation. It details steps such as handling missing values, normalizing features, and creating various visualizations like heatmaps and scatter plots. Additionally, it describes the implementation of multiple machine learning models, including Linear Regression, Logistic Regression, Decision Trees, and more, along with their evaluation metrics.

Uploaded by

Istiak Utsab

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

18 views5 pages

ML Complete Notes Hridoy

Uploaded by

Istiak Utsab

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 5

from google.

colab import drive

drive.mount('/content/drive/')

import pandas as pd

import numpy as np

# Assuming the file is in the 'My Drive' folder of your Google Drive

file_path = '/content/drive/My Drive/healthcare-dataset/train.csv'

df = pd.read_csv(file_pa)

Part 1: Data Preprocessing

import pandas as pd # Import pandas for data manipulation

data = pd.read_csv("Data.csv") # Load the dataset

data.head() # View first few rows of the dataset

data.isnull().sum() # Check for missing values

data.fillna(data.mean(), inplace=True) # Replace missing values with column mean

data.fillna(data.mean(), inplace=True) # Replaces NaN with column mean

data.fillna(data.median(), inplace=True) # Replaces NaN with column median

for column in data.columns:

data[column].fillna(data[column].mode()[0], inplace=True) # Fill NaN with the most frequent

value (mode)

data.fillna(0, inplace=True) # Replaces all NaN with 0 (or any chosen constant)

data.dropna(inplace=True) # Removes any rows with NaN values

data.dropna(axis=1, inplace=True) # Removes columns that have missing values

from sklearn.preprocessing import LabelEncoder # For converting categorical to numerical

le = LabelEncoder()

data["Gender"] = le.fit_transform(data["Gender"]) # Encode 'Gender' column

from sklearn.preprocessing import StandardScaler # For scaling numerical features

scaler = StandardScaler()

data[["Age", "Salary"]] = scaler.fit_transform(data[["Age", "Salary"]]) # Normalize 'Age' and 'Salary'

df2['age'].fillna(df2['age'].mean(),inplace = True)
df2['age'] #for age change in filna to cover null value to replace null
Part 2: Data Visualization
✅

1. Correlation Heatmap

import seaborn as sns

import matplotlib.pyplot as plt

sns.heatmap(data.corr(), annot=True, cmap="coolwarm") # Shows relationships between numerical

features

plt.title("Correlation Heatmap")

plt.show()

✅ 2. Pairplot
sns.pairplot(data, hue="Purchased") # Visualize pairwise relationships between features

✅ 3. Boxplot
sns.boxplot(data=data[["Age", "Salary"]]) # Detect outliers and understand value distributions

✅ 4. Histogram
data["Age"].hist(bins=20)

plt.title("Distribution of Age")

plt.xlabel("Age")

plt.ylabel("Frequency")

plt.show()

✅ 5. Scatter Plot
sns.scatterplot(x="Age", y="Salary", hue="Purchased", data=data)

plt.title("Age vs Salary")

plt.show()

✅ 6. Count Plot
sns.countplot(x="Purchased", data=data) # Count of each class/category

✅ 7. Pie Chart (for categorical distribution)

data['Gender'].value_counts().plot.pie(autopct="%1.1f%%", shadow=True)

plt.title("Gender Distribution")

plt.show()

✅ 8. Bar Plot
sns.barplot(x="Gender", y="Salary", data=data) # Compare average Salary by Gender

import seaborn as sns

import matplotlib.pyplot as plt

sns.heatmap(data.corr(), annot=True) # Correlation heatmap

plt.title("Correlation Heatmap")

plt.show()

sns.pairplot(data) # Pairwise scatter plots for all numerical features

sns.scatterplot(x="Age", y="Salary", hue="Purchased", data=data) # Scatter plot for Age vs Salary

sns.boxplot(data=data[["Age", "Salary"]]) # Box plot to detect outliers and distributions

Part 3: Model Preparation

from sklearn.model_selection import train_test_split

X = data[["Age", "Salary"]] # Features

y = data["Purchased"] # Target

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42) # Split dataset

Model 1: Linear Regression

from sklearn.linear_model import LinearRegression

model = LinearRegression()

model.fit(X_train, y_train)

y_pred = model.predict(X_test)

from sklearn.metrics import mean_squared_error, r2_score

print("MSE:", mean_squared_error(y_test, y_pred))

print("R2 Score:", r2_score(y_test, y_pred))

Model 2: Logistic Regression

from sklearn.linear_model import LogisticRegression

model = LogisticRegression()

model.fit(X_train, y_train)

y_pred = model.predict(X_test)

from sklearn.metrics import accuracy_score, confusion_matrix

print("Accuracy:", accuracy_score(y_test, y_pred))

print("Confusion Matrix:\n", confusion_matrix(y_test, y_pred))

Supervised Learning
100% (1)
Supervised Learning
15 pages
ML Book Notes
No ratings yet
ML Book Notes
9 pages
RAADS-R Test: Ritvo Autism Asperger Diagnostic Scale-Revised
100% (3)
RAADS-R Test: Ritvo Autism Asperger Diagnostic Scale-Revised
10 pages
ML 1-10
No ratings yet
ML 1-10
53 pages
Import Pandas As PD
No ratings yet
Import Pandas As PD
21 pages
Regression Analysis - Cheatsheet
No ratings yet
Regression Analysis - Cheatsheet
9 pages
API 6d 24ed. & 25ed. Comparision
100% (5)
API 6d 24ed. & 25ed. Comparision
23 pages
Articles Xgboost Classification With Smote-Enn Algorithm
No ratings yet
Articles Xgboost Classification With Smote-Enn Algorithm
11 pages
MACHINE LEARNING Manual
No ratings yet
MACHINE LEARNING Manual
36 pages
2022ucd2164 1 2
No ratings yet
2022ucd2164 1 2
35 pages
TYCS Practical
No ratings yet
TYCS Practical
26 pages
Project Paarth
No ratings yet
Project Paarth
21 pages
EDS - Python Cheat Sheet
0% (1)
EDS - Python Cheat Sheet
3 pages
Komal ML Assg1
No ratings yet
Komal ML Assg1
9 pages
Data Visualization EDA-print
No ratings yet
Data Visualization EDA-print
18 pages
AML Code For m2
No ratings yet
AML Code For m2
7 pages
MlLabManualdocx 2024 09 04 22 02 58
No ratings yet
MlLabManualdocx 2024 09 04 22 02 58
19 pages
Advance Python
No ratings yet
Advance Python
5 pages
5) Randomforest - Ipynb - Colaboratory
No ratings yet
5) Randomforest - Ipynb - Colaboratory
12 pages
DA Programs
No ratings yet
DA Programs
44 pages
ML Recordjp
No ratings yet
ML Recordjp
35 pages
Data Mining Lab Manual CSE VII Sem
No ratings yet
Data Mining Lab Manual CSE VII Sem
63 pages
Data Warehousing and Data Mining
No ratings yet
Data Warehousing and Data Mining
24 pages
ML 1-11
No ratings yet
ML 1-11
27 pages
Code Shabab Error 7
No ratings yet
Code Shabab Error 7
5 pages
Data Preprocessing Example Programs1
No ratings yet
Data Preprocessing Example Programs1
9 pages
Da Lab Mannual
No ratings yet
Da Lab Mannual
25 pages
Kartik MLP 4-9prg
No ratings yet
Kartik MLP 4-9prg
10 pages
Cheat Sheet Modeldeploy
No ratings yet
Cheat Sheet Modeldeploy
2 pages
1data Cleansing Cheklist
No ratings yet
1data Cleansing Cheklist
2 pages
Hint Sheet
No ratings yet
Hint Sheet
13 pages
Logistic Regression
No ratings yet
Logistic Regression
2 pages
ML Manual
No ratings yet
ML Manual
18 pages
S6 - Data Mining Lab Experiments (Except 1)
No ratings yet
S6 - Data Mining Lab Experiments (Except 1)
6 pages
Enda Practical 3 Explanation One
No ratings yet
Enda Practical 3 Explanation One
7 pages
Task 1
No ratings yet
Task 1
5 pages
Python Cheat Sheet For Data Analysis
No ratings yet
Python Cheat Sheet For Data Analysis
2 pages
Pattern Recognition
No ratings yet
Pattern Recognition
26 pages
Assignment 1 - LP1
No ratings yet
Assignment 1 - LP1
14 pages
1
No ratings yet
1
13 pages
Python 1
No ratings yet
Python 1
3 pages
Ai Code
No ratings yet
Ai Code
2 pages
DataAnalytics Lab Manual
No ratings yet
DataAnalytics Lab Manual
35 pages
Machine File
No ratings yet
Machine File
27 pages
Class Xii PDF For Practical
No ratings yet
Class Xii PDF For Practical
24 pages
Roll NO 2020
No ratings yet
Roll NO 2020
8 pages
Step-by-Step Explanation of Python Data Preprocessing Script
No ratings yet
Step-by-Step Explanation of Python Data Preprocessing Script
9 pages
ML Lab Codes
No ratings yet
ML Lab Codes
14 pages
Asset-V1 VIT+MBA109+2020+type@asset+block@Introductio To ML Using Python
No ratings yet
Asset-V1 VIT+MBA109+2020+type@asset+block@Introductio To ML Using Python
7 pages
Data Pre Processing
No ratings yet
Data Pre Processing
2 pages
DSBDA Practicals
No ratings yet
DSBDA Practicals
16 pages
Iii Aid - ML
No ratings yet
Iii Aid - ML
30 pages
PROJECTS
No ratings yet
PROJECTS
6 pages
Data Preprocessing 2
No ratings yet
Data Preprocessing 2
5 pages
Easy Pract ML
No ratings yet
Easy Pract ML
7 pages
FYMCA IDSLab A6 Submission
No ratings yet
FYMCA IDSLab A6 Submission
9 pages
Exploratory Data Analysis Main Concepts
No ratings yet
Exploratory Data Analysis Main Concepts
1 page
Some Exercises
No ratings yet
Some Exercises
9 pages
Data Analysis in Python-3
No ratings yet
Data Analysis in Python-3
4 pages
Thyroid Disease Classification Using Machine Learning Project
No ratings yet
Thyroid Disease Classification Using Machine Learning Project
34 pages
Final Research Paper
No ratings yet
Final Research Paper
3 pages
Blockchain Assignment
0% (1)
Blockchain Assignment
13 pages
As 1418.4-2004 Cranes Hoists and Winches Tower Cranes
No ratings yet
As 1418.4-2004 Cranes Hoists and Winches Tower Cranes
8 pages
Unit 2
No ratings yet
Unit 2
71 pages
Newsl 2.3: Swans and Owans
No ratings yet
Newsl 2.3: Swans and Owans
3 pages
Difference Between Power and Small Signal Diode
No ratings yet
Difference Between Power and Small Signal Diode
4 pages
Catalogue Centrifugal Pumps 2
No ratings yet
Catalogue Centrifugal Pumps 2
54 pages
Resilience Through Education Equipping Schools and Students To Face Climate Change Challenges in Punjab
No ratings yet
Resilience Through Education Equipping Schools and Students To Face Climate Change Challenges in Punjab
6 pages
Module 5
No ratings yet
Module 5
27 pages
DLL - English 4 - Q1 - W5
No ratings yet
DLL - English 4 - Q1 - W5
5 pages
Bab3 Matrikulasi
No ratings yet
Bab3 Matrikulasi
31 pages
18 Spring Mid
No ratings yet
18 Spring Mid
16 pages
Edi 104 - Chapter 3
No ratings yet
Edi 104 - Chapter 3
47 pages
Introduction To Environmental Science
No ratings yet
Introduction To Environmental Science
40 pages
Mini Project Assessment Brief Oct 24 - RH Signed
No ratings yet
Mini Project Assessment Brief Oct 24 - RH Signed
8 pages
Footnote 12 To The Youth PDF Free
No ratings yet
Footnote 12 To The Youth PDF Free
5 pages
Schools Division of Parañaque City Technology and Livelihood Education Electrical Installation & Maintenance 9 Quarter 4 Week 7 & 8 Wiring Diagrams
No ratings yet
Schools Division of Parañaque City Technology and Livelihood Education Electrical Installation & Maintenance 9 Quarter 4 Week 7 & 8 Wiring Diagrams
4 pages
2023 2024 SPGBHS Main Teaching Load
No ratings yet
2023 2024 SPGBHS Main Teaching Load
2 pages
Validation of Sitewind Version 4
No ratings yet
Validation of Sitewind Version 4
25 pages
Synopsis PPT 4
No ratings yet
Synopsis PPT 4
7 pages
Rizal Course - Instructions For The Required Terminal Paper
No ratings yet
Rizal Course - Instructions For The Required Terminal Paper
2 pages
Resource Utilization & Optimization in Quran: Synopsis For PHD Usulddin
No ratings yet
Resource Utilization & Optimization in Quran: Synopsis For PHD Usulddin
8 pages
HTML Cheat Sheet
No ratings yet
HTML Cheat Sheet
5 pages
Sample Diagnostic
No ratings yet
Sample Diagnostic
29 pages
Proportional Relief Valves, High Pressure: SS-4R3A
No ratings yet
Proportional Relief Valves, High Pressure: SS-4R3A
2 pages
Lab Report Writing Guidelines: AP Chemistry ASK
No ratings yet
Lab Report Writing Guidelines: AP Chemistry ASK
13 pages
BN Islander: Wingspan
No ratings yet
BN Islander: Wingspan
9 pages
Halter
No ratings yet
Halter
2 pages
Crane Telescopic
No ratings yet
Crane Telescopic
1 page
Python For Beginners
From Everand
Python For Beginners
Célio Azevedo
No ratings yet