0% found this document useful (0 votes)

19 views4 pages

K Means On IRIS Dataset

Uploaded by

bucky17d

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

19 views4 pages

K Means On IRIS Dataset

Uploaded by

bucky17d

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 4

K Means on IRIS dataset

#Suppress warnings
import warnings
warnings.filterwarnings('ignore')

#Importing Libraries
import numpy as np
import pandas as pd

#Creating a dataframe
data=pd.read_csv("IRIS.csv")

data.head()

sepal_length sepal_width petal_length petal_width species

0 5.1 3.5 1.4 0.2 Iris-setosa

1 4.9 3.0 1.4 0.2 Iris-setosa

2 4.7 3.2 1.3 0.2 Iris-setosa

3 4.6 3.1 1.5 0.2 Iris-setosa

4 5.0 3.6 1.4 0.2 Iris-setosa

data.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 150 entries, 0 to 149
Data columns (total 5 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 sepal_length 150 non-null float64
1 sepal_width 150 non-null float64
2 petal_length 150 non-null float64
3 petal_width 150 non-null float64
4 species 150 non-null object
dtypes: float64(4), object(1)
memory usage: 6.0+ KB

data.describe

<bound method NDFrame.describe of sepal_length sepal_width petal_length petal_width species

0 5.1 3.5 1.4 0.2 Iris-setosa
1 4.9 3.0 1.4 0.2 Iris-setosa
2 4.7 3.2 1.3 0.2 Iris-setosa
3 4.6 3.1 1.5 0.2 Iris-setosa
4 5.0 3.6 1.4 0.2 Iris-setosa
.. ... ... ... ... ...
145 6.7 3.0 5.2 2.3 Iris-virginica
146 6.3 2.5 5.0 1.9 Iris-virginica
147 6.5 3.0 5.2 2.0 Iris-virginica
148 6.2 3.4 5.4 2.3 Iris-virginica
149 5.9 3.0 5.1 1.8 Iris-virginica

[150 rows x 5 columns]>

Data Visualization
import matplotlib.pyplot as plt
import seaborn as sns
%matplotlib inline

#Histogram
plt.hist(data["sepal_length"],bins=10,color="green")
plt.xlabel("sepla_length")
plt.ylabel("petal_length")
plt.show()
#Scatter Plot
sns.pairplot(data, hue="species")
plt.show()

#Histogrm with Line Graph

sns.histplot(data,x="petal_length",bins=25,kde=True,hue="species")
plt.xlabel("petal_length")
plt.ylabel("count")
plt.title("Petal Length distribution")
plt.show()
df1=data.drop(['species'],axis=1)

sns.heatmap(df1.corr(),annot=True)
plt.show()

Mapping the Species into number from 0 to 2

flower_mapping = {'Iris-setosa': 0,'Iris-versicolor': 1,'Iris-virginica':2}

data["species"] = data["species"].map(flower_mapping)

KMeans
from sklearn.cluster import KMeans

kmeans = KMeans(n_clusters=3)

kmeans.fit(data[['petal_length','petal_width']])

▾ KMeans
KMeans(n_clusters=3)

kmeans.cluster_centers_
array([[5.59583333, 2.0375 ],
[1.464 , 0.244 ],
[4.26923077, 1.34230769]])

plt.scatter(data['petal_length'],data['petal_width'],c=data['species'], cmap='rainbow')
plt.scatter(1.464, 0.244, s=200, c='b', marker='s')
plt.scatter(5.59583333, 2.0375, s=200, c='r', marker='s')
plt.scatter(4.26923077, 1.34230769, s=200, c='g', marker='s')
plt.show()

# Compute cluster centers and predict cluster index for each sample.
pred = kmeans.predict(data[['petal_length','petal_width']])

pred

array([1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2,
2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 0, 2, 2, 2, 2, 2, 0, 2, 2, 2, 2,
2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 0, 0, 0, 0, 0, 0, 2, 0, 0, 0,
0, 0, 0, 0, 0, 0, 0, 0, 0, 2, 0, 0, 0, 0, 0, 0, 2, 0, 0, 0, 0, 0,
0, 0, 0, 0, 0, 0, 2, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0])

sample_test=np.array([6,2])
second_test=sample_test.reshape(1, -1)
kmeans.predict(second_test)

array([0])

Loading [MathJax]/jax/output/CommonHTML/fonts/TeX/fontdata.js

Python Cheat Sheet: Pandas - Numpy - Sklearn Matplotlib - Seaborn BS4 - Selenium - Scrapy
100% (4)
Python Cheat Sheet: Pandas - Numpy - Sklearn Matplotlib - Seaborn BS4 - Selenium - Scrapy
11 pages
Trần Mạnh Hùng 20192643.Ipynb - Colab
No ratings yet
Trần Mạnh Hùng 20192643.Ipynb - Colab
6 pages
Dsbda 3B
No ratings yet
Dsbda 3B
5 pages
6 in 1 PRGM
No ratings yet
6 in 1 PRGM
1 page
Experiment 3
No ratings yet
Experiment 3
4 pages
Iris Pca
No ratings yet
Iris Pca
13 pages
Dsbda 3B
No ratings yet
Dsbda 3B
5 pages
Ass - 10.ipynb - Colab
No ratings yet
Ass - 10.ipynb - Colab
8 pages
Vsec PW 7
No ratings yet
Vsec PW 7
3 pages
Aula Big Data
No ratings yet
Aula Big Data
5 pages
Practical 10 Code
No ratings yet
Practical 10 Code
5 pages
Homework 0 - Report
No ratings yet
Homework 0 - Report
7 pages
Assignment 10
No ratings yet
Assignment 10
9 pages
Kmeansrcode
No ratings yet
Kmeansrcode
2 pages
Assignment 3 Iris
No ratings yet
Assignment 3 Iris
2 pages
Iris - Ipynb - Colaboratory
No ratings yet
Iris - Ipynb - Colaboratory
8 pages
# Common Datatype: Print Type Print Type Print Type Print Type Print Type
No ratings yet
# Common Datatype: Print Type Print Type Print Type Print Type Print Type
4 pages
HW0 Script
No ratings yet
HW0 Script
6 pages
Summary (Iris) #View Statistical Summary of Dataset
No ratings yet
Summary (Iris) #View Statistical Summary of Dataset
1 page
DSBDA3
No ratings yet
DSBDA3
3 pages
SVM and KNN
No ratings yet
SVM and KNN
3 pages
DML About Put
No ratings yet
DML About Put
2 pages
Notes DV
No ratings yet
Notes DV
19 pages
Name:-Nisha Ambike: Roll No: - 02
No ratings yet
Name:-Nisha Ambike: Roll No: - 02
2 pages
b21 DSBDA Assignment No 10
No ratings yet
b21 DSBDA Assignment No 10
1 page
Assignment 5'
No ratings yet
Assignment 5'
4 pages
25 - Assignment10.ipynb - Colaboratory
No ratings yet
25 - Assignment10.ipynb - Colaboratory
13 pages
Data Visualization With Maplotlib
No ratings yet
Data Visualization With Maplotlib
8 pages
Cota12 6
No ratings yet
Cota12 6
4 pages
Pra 10
No ratings yet
Pra 10
3 pages
Data Visualization 3
No ratings yet
Data Visualization 3
3 pages
Support Vector Machine (SVM Classifier) Implemenation in Python With Scikit-Learn
No ratings yet
Support Vector Machine (SVM Classifier) Implemenation in Python With Scikit-Learn
21 pages
Experiment 11 PML
No ratings yet
Experiment 11 PML
3 pages
Anuj Khandelwal 3029 BCP A Business Analytics Continuous Assessment 2
No ratings yet
Anuj Khandelwal 3029 BCP A Business Analytics Continuous Assessment 2
20 pages
Program1 MLA Lab 2025 250109 144615
No ratings yet
Program1 MLA Lab 2025 250109 144615
17 pages
ML Lab Record
No ratings yet
ML Lab Record
64 pages
Import As Import As Import As From Import Import As Import
No ratings yet
Import As Import As Import As From Import Import As Import
7 pages
Dsbdalab 10
No ratings yet
Dsbdalab 10
12 pages
Unsupervised ML
No ratings yet
Unsupervised ML
17 pages
Dsbda 10
No ratings yet
Dsbda 10
8 pages
137 Vsec 6
No ratings yet
137 Vsec 6
2 pages
Exno 4
No ratings yet
Exno 4
13 pages
Clustering - With - Elbow - Plot - ML - 4 - Jupyter Notebook
No ratings yet
Clustering - With - Elbow - Plot - ML - 4 - Jupyter Notebook
6 pages
Vansh 3089 CA2
No ratings yet
Vansh 3089 CA2
13 pages
Data Visualization and Matplot
No ratings yet
Data Visualization and Matplot
11 pages
A2 60 Rohit Jakkam EDA of Iris - Ipynb - Colaboratory
No ratings yet
A2 60 Rohit Jakkam EDA of Iris - Ipynb - Colaboratory
5 pages
Lab Manual
No ratings yet
Lab Manual
32 pages
DSBDA Assignment 3 Jupyter Notebook
No ratings yet
DSBDA Assignment 3 Jupyter Notebook
3 pages
Iris Species IB
No ratings yet
Iris Species IB
7 pages
Dsbda Ouput 1-10
No ratings yet
Dsbda Ouput 1-10
89 pages
Nandini Matplotlib Ws
No ratings yet
Nandini Matplotlib Ws
10 pages
10 (3146)
No ratings yet
10 (3146)
2 pages
K Means Algorithm
No ratings yet
K Means Algorithm
1 page
Iris - Ipynb - Colab
No ratings yet
Iris - Ipynb - Colab
1 page
Base de Datos IRIS Codigos R Utilizados para El Analisis
No ratings yet
Base de Datos IRIS Codigos R Utilizados para El Analisis
4 pages
b21 DSBDA Assignment No 3
No ratings yet
b21 DSBDA Assignment No 3
3 pages
NUMPY-case Study
100% (1)
NUMPY-case Study
4 pages
Dsbda La 10
No ratings yet
Dsbda La 10
4 pages
Improving Regularized Singular Value Decomposition For Collaborative Filtering
No ratings yet
Improving Regularized Singular Value Decomposition For Collaborative Filtering
4 pages
MSC Group Project Demo
No ratings yet
MSC Group Project Demo
31 pages
CS-601 Machine Learning Unit-1 New
No ratings yet
CS-601 Machine Learning Unit-1 New
70 pages
Machine Learning With Kernel Methods
No ratings yet
Machine Learning With Kernel Methods
760 pages
Video Summarization Techniques and Applications
No ratings yet
Video Summarization Techniques and Applications
6 pages
ASystematicReview DrMohamedAlloghani
No ratings yet
ASystematicReview DrMohamedAlloghani
30 pages
A Dynamic K-Means Clustering For Data Mining
No ratings yet
A Dynamic K-Means Clustering For Data Mining
6 pages
Celebal Summer t-1
No ratings yet
Celebal Summer t-1
34 pages
Email Clustering
No ratings yet
Email Clustering
15 pages
IMVFX 1 HistGMM F23 S
No ratings yet
IMVFX 1 HistGMM F23 S
41 pages
Data Modification and Predictive Analytics - MCQ - 1 - 2
No ratings yet
Data Modification and Predictive Analytics - MCQ - 1 - 2
24 pages
Data Science Foundations Syllabus
No ratings yet
Data Science Foundations Syllabus
5 pages
Improving Imbalanced Learning Through A Heuristic Oversampling Method Based On K-Means and SMOTE
No ratings yet
Improving Imbalanced Learning Through A Heuristic Oversampling Method Based On K-Means and SMOTE
20 pages
Data Mining Lab Manual
No ratings yet
Data Mining Lab Manual
40 pages
Python Syllabus
100% (1)
Python Syllabus
4 pages
Data Mining Lab Manual
No ratings yet
Data Mining Lab Manual
85 pages
Final Report - Smart and Fast Email Sorting: 1 Project's Description
No ratings yet
Final Report - Smart and Fast Email Sorting: 1 Project's Description
5 pages
An Efficient Distance Estimation and Centroid Selection Based On K-Means Clustering For Small and Large Dataset
No ratings yet
An Efficient Distance Estimation and Centroid Selection Based On K-Means Clustering For Small and Large Dataset
8 pages
Credit Card Customer Analysis
No ratings yet
Credit Card Customer Analysis
18 pages
Ultimate Beginner's Path For 2017: 3.1: Getting Started and Testing The Waters
No ratings yet
Ultimate Beginner's Path For 2017: 3.1: Getting Started and Testing The Waters
14 pages
2022 - Clustering and Heuristics Algorithm For The Vehicle Routing Problem With Time Windows
No ratings yet
2022 - Clustering and Heuristics Algorithm For The Vehicle Routing Problem With Time Windows
20 pages
Unsupervised Learning For Robust Bitcoin Fraud Detection
No ratings yet
Unsupervised Learning For Robust Bitcoin Fraud Detection
6 pages
Data Analytics
No ratings yet
Data Analytics
30 pages
Semester II: Discipline: Information Technology Stream: IT1
No ratings yet
Semester II: Discipline: Information Technology Stream: IT1
188 pages
Prrethy-Dr. Huma Lone - AL
No ratings yet
Prrethy-Dr. Huma Lone - AL
7 pages
Data Science For Business: Business Analytics and Organizational Change
No ratings yet
Data Science For Business: Business Analytics and Organizational Change
36 pages
Iris Dataset Clustering and Spam Email Separation
No ratings yet
Iris Dataset Clustering and Spam Email Separation
20 pages
Shrinivas BalasahebÂ Sanglikar
No ratings yet
Shrinivas BalasahebÂ Sanglikar
7 pages
Subzero Signals Neutrinos Under The Ice
No ratings yet
Subzero Signals Neutrinos Under The Ice
16 pages

K Means On IRIS Dataset

Uploaded by

K Means On IRIS Dataset

Uploaded by

K Means on IRIS dataset

sepal_length sepal_width petal_length petal_width species

0 5.1 3.5 1.4 0.2 Iris-setosa

1 4.9 3.0 1.4 0.2 Iris-setosa

2 4.7 3.2 1.3 0.2 Iris-setosa

3 4.6 3.1 1.5 0.2 Iris-setosa

4 5.0 3.6 1.4 0.2 Iris-setosa

<bound method NDFrame.describe of sepal_length sepal_width petal_length petal_width species

[150 rows x 5 columns]>

#Histogrm with Line Graph

Mapping the Species into number from 0 to 2

flower_mapping = {'Iris-setosa': 0,'Iris-versicolor': 1,'Iris-virginica':2}

You might also like