Código K-Means en Spyder

This document imports several Python libraries for data analysis and visualization. It loads and analyzes a CSV dataset, performs k-means clustering on numeric columns to group the data into clusters, and visualizes the clustered data and cluster centroids in various plots. It also analyzes properties of the clusters like diversity and determines the closest data point to a new data sample.

Uploaded by

Manuel Calva Z

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

124 views3 pages

Código K-Means en Spyder

Uploaded by

Manuel Calva Z

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 3

import pandas as pd

import numpy as np
import matplotlib.pyplot as plt
import seaborn as sb
from sklearn.cluster import KMeans
from sklearn.metrics import pairwise_distances_argmin_min
from mpl_toolkits.mplot3d import Axes3D
plt.rcParams['figure.figsize'] = (16, 9)
plt.style.use('ggplot')
Dataframe = pd.read_csv(r"C:\xampp\htdocs\sistemasugerencias_itsz\BASE
PERSONAL.csv")
Dataframe.head()
print(Dataframe)
Dataframe.describe()
print (Dataframe.describe())
print(Dataframe.groupby('correo').size())
Dataframe.drop(['correo'],1).hist()
plt.show()
sb.pairplot(Dataframe.dropna(),
hue='correo',height=3,vars=["nombre","ap_paterno","ap_materno"],kind='scatter')
X = np.array(Dataframe[["nombre","ap_paterno","ap_materno"]])
y = np.array(Dataframe['correo'])
X.shape
print (X.shape)
fig = plt.figure()
ax = Axes3D(fig)
colores=['blue','red','green','blue','cyan',
'yellow','orange','black','pink','brown',
'purple']
asignar=[]
for row in y:
asignar.append(colores[row])
ax.scatter(X[:, 0], X[:, 1], X[:, 2], c=asignar,s=70)

Nc = range(1, 20)
kmeans = [KMeans(n_clusters=i) for i in Nc]
kmeans
score = [kmeans[i].fit(X).score(X) for i in
range(len(kmeans))]
score
plt.plot(Nc,score)
plt.xlabel('Numero de clusters')
plt.ylabel('Núcleo')
plt.title('Gráfica de dispersión')
plt.show()
kmeans = KMeans(n_clusters=5).fit(X)
centroids = kmeans.cluster_centers_
print(centroids)

labels = kmeans.predict(X)

C = kmeans.cluster_centers_
colores=['red','green','blue','purple','gray']
asignar=[]
for row in labels:
asignar.append(colores[row])

ax = Axes3D(fig)
ax.scatter(X[:, 0], X[:, 1], X[:, 2], c=asignar,s=60)
ax.scatter(C[:, 0], C[:, 1], C[:, 2], marker='*', c=colores, s=1000)

f1 = Dataframe['op'].values
f2 = Dataframe['ex'].values

plt.scatter(f1, f2, c=asignar, s=70)

plt.scatter(C[:, 0], C[:, 1], marker='*', c=colores, s=1000)
plt.show()

f1 = Dataframe['op'].values
f2 = Dataframe['ag'].values

plt.scatter(f1, f2, c=asignar, s=70)

plt.scatter(C[:, 0], C[:, 2], marker='*', c=colores, s=1000)
plt.show()

f1 = Dataframe['ex'].values
f2 = Dataframe['ag'].values

plt.scatter(f1, f2, c=asignar, s=70)

plt.scatter(C[:, 1], C[:, 2], marker='*', c=colores, s=1000)
plt.show()

copy = pd.DataFrame()
copy['usuario']=Dataframe['usuario'].values
copy['categoria']=Dataframe['categoria'].values
copy['label'] = labels;
cantidadGrupo = pd.DataFrame()
cantidadGrupo['color']=colores
cantidadGrupo['cantidad']=copy.groupby('label').size()
print(cantidadGrupo)

group_referrer_index = copy['label'] ==0

group_referrals = copy[group_referrer_index]

diversidadGrupo = pd.DataFrame()
diversidadGrupo['categoria']=[0,1,2,3,4,5,6,7,8,9]
diversidadGrupo['cantidad']=group_referrals.groupby('categoria').size()
print(diversidadGrupo)

closest, _ = pairwise_distances_argmin_min(kmeans.cluster_centers_, X)
print(closest)

users=Dataframe['usuario'].values
for row in closest:
print(users[row])

X_new = np.array([[50,57.74,15.66]])

new_labels = kmeans.predict(X_new)
print(new_labels)

BDA Lab Manual R22
0% (1)
BDA Lab Manual R22
70 pages
Sample Justification For Travel For Teachers
100% (5)
Sample Justification For Travel For Teachers
2 pages
Ion Exchange Chromatography
No ratings yet
Ion Exchange Chromatography
41 pages
Kinematic Diagrams
No ratings yet
Kinematic Diagrams
16 pages
Conti USA IFS Hydraulic Hoses Fittings Catalog 2016
No ratings yet
Conti USA IFS Hydraulic Hoses Fittings Catalog 2016
444 pages
Seaborn Final
No ratings yet
Seaborn Final
67 pages
Delhivery Mani
No ratings yet
Delhivery Mani
79 pages
Cardiologie MANUAL
50% (12)
Cardiologie MANUAL
15 pages
Data Visualization
No ratings yet
Data Visualization
70 pages
C
100% (1)
C
75 pages
Python Course Cheat Sheet
No ratings yet
Python Course Cheat Sheet
30 pages
Oracle DB Basic Commands
75% (4)
Oracle DB Basic Commands
1 page
Mastering Data Visualization Techniques
No ratings yet
Mastering Data Visualization Techniques
159 pages
Merged
No ratings yet
Merged
35 pages
Analysis of Legal Case Document Automated Summarizer
No ratings yet
Analysis of Legal Case Document Automated Summarizer
6 pages
Plot Per Columns Features Kde or Normal Distribution Seaborn in Details
No ratings yet
Plot Per Columns Features Kde or Normal Distribution Seaborn in Details
272 pages
DV LAb Staff
No ratings yet
DV LAb Staff
73 pages
GVI Seychelles Marine Report Jan 2017 - Dec 2017 (Cap Ternay)
No ratings yet
GVI Seychelles Marine Report Jan 2017 - Dec 2017 (Cap Ternay)
82 pages
Source Follower: (Common-Drain Amplifier)
No ratings yet
Source Follower: (Common-Drain Amplifier)
40 pages
Mastering Data Visualization Techniques (Part 1)
No ratings yet
Mastering Data Visualization Techniques (Part 1)
20 pages
Objection Deadline: March 20, 2012 at 4:00 P.M. (ET) Hearing Date: April 5, 2012 at 10:00 A.M. (ET)
No ratings yet
Objection Deadline: March 20, 2012 at 4:00 P.M. (ET) Hearing Date: April 5, 2012 at 10:00 A.M. (ET)
32 pages
Al Furjan 1515 Villas&Terrace Homes
No ratings yet
Al Furjan 1515 Villas&Terrace Homes
21 pages
Mastering Data Visualization Techniques 1728896857
No ratings yet
Mastering Data Visualization Techniques 1728896857
85 pages
PR Final File
No ratings yet
PR Final File
70 pages
Clustering
No ratings yet
Clustering
1 page
35.232-2016.30 Balsam Tawfiq Swaidan
No ratings yet
35.232-2016.30 Balsam Tawfiq Swaidan
70 pages
Simple Carburetor Operation
100% (2)
Simple Carburetor Operation
6 pages
Week 6 (PCA, SVD, LDA)
No ratings yet
Week 6 (PCA, SVD, LDA)
14 pages
ModuleAr Merged
No ratings yet
ModuleAr Merged
42 pages
Program
No ratings yet
Program
10 pages
Acitivity Sheet Economics
100% (1)
Acitivity Sheet Economics
10 pages
Iso 3960 2007 en FR PDF
No ratings yet
Iso 3960 2007 en FR PDF
6 pages
Graphs Using Matplotlib
No ratings yet
Graphs Using Matplotlib
23 pages
MLLab Manual
No ratings yet
MLLab Manual
24 pages
04 Boxplot
No ratings yet
04 Boxplot
22 pages
Case Study Synopsis Lpu Ums
No ratings yet
Case Study Synopsis Lpu Ums
5 pages
DevOps Part I
No ratings yet
DevOps Part I
16 pages
Matplotlib Python
No ratings yet
Matplotlib Python
8 pages
KP Technical Seminal Final Report FINAL
No ratings yet
KP Technical Seminal Final Report FINAL
30 pages
Lab Extern L
No ratings yet
Lab Extern L
8 pages
Final ML File
No ratings yet
Final ML File
34 pages
Food Safety, Sanitation and Hygience
No ratings yet
Food Safety, Sanitation and Hygience
21 pages
Machine Learning (ML)
No ratings yet
Machine Learning (ML)
35 pages
Experiment 1
No ratings yet
Experiment 1
19 pages
Strategic Moves: Amrutanjan Rebranding: It's Gone
No ratings yet
Strategic Moves: Amrutanjan Rebranding: It's Gone
19 pages
Shiva Teja
No ratings yet
Shiva Teja
19 pages
Visualization
No ratings yet
Visualization
14 pages
Py 2
No ratings yet
Py 2
7 pages
Air Brake Rake Testing Procedure (LHB Coaches (2) - 0
No ratings yet
Air Brake Rake Testing Procedure (LHB Coaches (2) - 0
22 pages
DataScience All 1to8
No ratings yet
DataScience All 1to8
6 pages
Mini Project With Output
No ratings yet
Mini Project With Output
8 pages
Casos de ML Unsupervised Daniel Ames Camayo
No ratings yet
Casos de ML Unsupervised Daniel Ames Camayo
20 pages
ML Labs
No ratings yet
ML Labs
14 pages
David Wall VP Hse & Im EPT - HSE, Operations & Engineering: Confidential BP-HZN - BLYOO196756
No ratings yet
David Wall VP Hse & Im EPT - HSE, Operations & Engineering: Confidential BP-HZN - BLYOO196756
3 pages
Melbourne Ia
No ratings yet
Melbourne Ia
16 pages
Mini Project
No ratings yet
Mini Project
8 pages
Maxbox - Starter68 Machine Learning
No ratings yet
Maxbox - Starter68 Machine Learning
5 pages
DAVL PR1.2 Mit
No ratings yet
DAVL PR1.2 Mit
10 pages
Python Code Library
No ratings yet
Python Code Library
8 pages
Customer Segmentation PDF
No ratings yet
Customer Segmentation PDF
18 pages
Data Mining Ex1
No ratings yet
Data Mining Ex1
10 pages
ML Practical 4D
No ratings yet
ML Practical 4D
11 pages
Data Analyzer
No ratings yet
Data Analyzer
10 pages
Ex - 08 DS
No ratings yet
Ex - 08 DS
11 pages
Untitled Document-2-1-13-7-11.4
No ratings yet
Untitled Document-2-1-13-7-11.4
5 pages
SPPUML6
No ratings yet
SPPUML6
9 pages
Main - Py Text File
No ratings yet
Main - Py Text File
5 pages
Central Limit Theorem
No ratings yet
Central Limit Theorem
6 pages
S6 - Data Mining Lab Experiments (Except 1)
No ratings yet
S6 - Data Mining Lab Experiments (Except 1)
6 pages
Spectral Clustering
No ratings yet
Spectral Clustering
5 pages
EDA Plots Code
No ratings yet
EDA Plots Code
13 pages
PT Akasha Wira International TBK Swot Analysis Bac
No ratings yet
PT Akasha Wira International TBK Swot Analysis Bac
13 pages
FDS All Practicals
No ratings yet
FDS All Practicals
10 pages
ML Short Code - Under Updating
No ratings yet
ML Short Code - Under Updating
4 pages
NOTES CH 9 Living Organisms G6 2
No ratings yet
NOTES CH 9 Living Organisms G6 2
5 pages
Practical 5
No ratings yet
Practical 5
6 pages
Arbol Deudas
No ratings yet
Arbol Deudas
5 pages
Fds Slips
No ratings yet
Fds Slips
6 pages
ML 7
No ratings yet
ML 7
6 pages
1 Abril PDF
No ratings yet
1 Abril PDF
10 pages
Cheat Sheet-Building Unsupervised Learning Models
No ratings yet
Cheat Sheet-Building Unsupervised Learning Models
3 pages
7 Output
No ratings yet
7 Output
4 pages
Python-Pandas Notes
No ratings yet
Python-Pandas Notes
5 pages
Introduction of Matplotlib1
No ratings yet
Introduction of Matplotlib1
1 page
Iphone Laptop Computer Information
No ratings yet
Iphone Laptop Computer Information
1 page
Code Bener
No ratings yet
Code Bener
3 pages
Subdivision Warranty Bond
No ratings yet
Subdivision Warranty Bond
2 pages
English 11-Grade 2022-2023
No ratings yet
English 11-Grade 2022-2023
1 page
Masafi
No ratings yet
Masafi
2 pages
C Language Programming Codes
From Everand
C Language Programming Codes
Durgesh
No ratings yet