0% found this document useful (0 votes)

16 views17 pages

Laboratoare SBC

The document discusses various machine learning algorithms including KNN, SVM, Naive Bayes, decision trees, random forests, XGBoost and clustering algorithms like KMeans and DBSCAN. It provides code examples for implementing these algorithms on the iris dataset and evaluating their performance.

Uploaded by

Denisa Alina

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

16 views17 pages

Laboratoare SBC

Uploaded by

Denisa Alina

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 17

Curs 05.

03
KNN
from sklearn.datasets import load_iris
import numpy as np
from sklearn.model_selection import train_test_split
# flori = load_iris()
X = flori.data
y = flori.target #etichetele
#formam un tuplu cu setul de antrenament
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.2,
random_state = 42)
len(X_train) #nr de etichete
from sklearn.neighbors import KNeighborsClassifier
from sklearn import metrics
# tunning pentru k

k_range = range(1, 26) # 25 de valori de la 1 la 25

scoruri = {} #dictionar de tuple cu key =
scoruri_lista = []

for k in k_range:
knn = KNeighborsClassifier(n_neighbors = k) #kNeighboursClassifier e un
constructor
knn.fit(X_train, y_train)
y_pred = knn.predict(X_test)
scoruri[k] = (y_test, y_pred)
scoruri_lista.append(metrics.accuracy_source(y_test, y_pred)) #append
pune in capatul listei ultima valoare

#aleg k = 5
knn = KNeighborsClassifier(n_neighbors = 5)
knn.fit(X, y)

# o floare noua
X_nou = [[3,4,5,2], [5,4,2,2]]
y_predict = knn.predict(X_nou)
y_predict
X_train

Lab 11.03
SVM
import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt

# seaborn si matplotlib pt prezentare grafica

from sklearn.model_selection import train_test_split

from sklearn.svm import SVC
from sklearn.metrics import classification_report, confusion_matrix
from sklearn.preprocessing import LabelEncoder

#incarcam datele
floricele = pd.read_csv('iris.csv')
print(floricele.head())
print(floricele.info())

#EDA
sns.countplot(x = 'variety', data = floricele)

sns.pairplot(floricele, hue = 'variety')

floricele.describe()
# 50% reprezinta mediana, cea care imparte setul de date in 2 jumatati egale
# 25% cuartilla

X = floricele.drop('variety', axis = 1)
X.head()

y = floricele['variety']
y.tail()

# aplic LabelEncoder
label_encoder = LabelEncoder()
type(label_encoder)
y_encoded = label_encoder.fit_transform(y)
y_encoded

X_train, X_test, y_train, y_test = train_test_split(X, y_encoded, test_size = 0.3,

random_state = 42)
X_train

# svm liniar
model = SVC(kernel = 'linear')
# model e o instanta/ un obiect al clasei SVC

model.fit(X_train, y_train)

predictii = model.predict(X_test)

#matricea de confuzie
mat_conf = confusion_matrix(y_test, predictii)
print(mat_conf)

print(classification_report(y_test, predictii))

Lab 25.03 – continuare lab 11.03

#model SVM RBF
model_rbf = SVC(kernel = 'rbf', C = 1.0, gamma = 'scale')
model_rbf.fit(X_train, y_train)

# apoi de face predictia, matricea de confuzii ca la modelul de dinainte

~~~~ se termina continuarea cursului 11.03 si incepe lab 25.03

import pandas as pd
flori = pd.read_csv('iris.csv')
flori.head()

#encoding la campul de etichetare ('variety')

from sklearn.preprocessing import LabelEncoder

label_encoder = LabelEncoder()
flori['variety'] = label_encoder.fit_transform(flori['variety'])
flori.head()

from sklearn.model_selection import train_test_split

X = flori.drop('variety', axis = 1) #adica pe linii

y = flori['variety'] # y e compus doar din campul cu etichete
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.2,
random_state = 42)
#model gausian bayse are caracteristic probilitatile
#POATE CADEA LA EXAMEN + formula - probabilitate destul de mare
from sklearn.naive_bayes import GaussianNB

model = GaussianNB()
model.fit(X_train, y_train)

from sklearn.metrics import accuracy_score

y_pred = model.predict(X_test)
acuratete = accuracy_score(y_test, y_pred)
print(f"Acuratetea este {acuratete}")

#normalizare - de ex cand sunt unitati de masura diferita

from sklearn.preprocessing import MinMaxScaler, StandardScaler
scaler = MinMaxScaler()
X_train_scalat = scaler.fit_transform(X_train)
X_test_scalat = scaler.transform(X_test)
model.fit(X_train_scalat,X_test_scalat)

Curs 26.03

DECISION TREE
import numpy as np
import pandas as pd
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import cross_val_score

floricele = pd.read_csv('iris.csv')
X = floricele.drop('variety', axis = 1)
y = floricele['variety']

# sarim peste LabelEncoding - il face sklearn automat

model_entropy = DecisionTreeClassifier(criterion = 'entropy', random_state =
42)
scoruri_entropie = cross_val_score(model_entropy, X, y, cv = 5) # 5 repr. nr. de
"cutiute" in care se aseaza datele
print(f'Scorurile pentru IG(Entropy): {scoruri_entropie}')

print(f'media scorurilor prntru IG: {sum(scoruri_entropie) /

len(scoruri_entropie)}')

print(f'media scorurilor prntru IG: {np.mean(scoruri_entropie)}')

model_gini = DecisionTreeClassifier(criterion = 'gini', random_state = 42)

scoruri_gini = cross_val_score(model_gini, X, y, cv = 4) # 5 repr. nr. de "cutiute"
in care se aseaza datele
print(f'Scorurile pentru IG(gini): {scoruri_gini}')

print(f'media scorurilor prntru IG: {np.mean(scoruri_gini)}')

Lab 04.03
import pandas as pd
from sklearn.datasets import load_iris

irisi = load_iris()
irisi.feature_names

df = pd.DataFrame(irisi.data, columns = irisi.feature_names)

df.head()

df['target'] = irisi.target
irisi.target_names

df[df.target == 1].head() #o-setosa, 1-versicolor, 2-virginica

df['nume_floare'] = df.target.apply(lambda x: irisi.target_names[x])

df.head()

df.tail()

from matplotlib import pyplot as plt

df0 = df[df.target == 0]
df0.head()
Curs 02.04
LDA
#LDA ca algoritm de reducere dimensionala
from sklearn.discriminant_analysis import LinearDiscriminantAnalysis
from sklearn.datasets import load_iris

flori = load_iris()
type(flori)

X = flori.data
y = flori.target

lda = LinearDiscriminantAnalysis(n_components = 2)

X_lda = lda.fit_transform(X, y)

import matplotlib.pyplot as plt

plt.figure(figsize = (8, 6))
plt.scatter(X_lda[:, 0], X_lda[:, 1], c = y, cmap = 'viridis', edgecolor = 'k')
plt.xlabel('Componenta LDA 1')
plt.ylabel('Componenta LDA 2')
plt.title('Reprezentarea datelor cu irisi in LDA cu 2 componente')
plt.colorbar(label = 'Clase')
print('multumim doamna profesoara')

# tema : folosind datele reduse dimensional faceti un sot - base, fara sot -
arbore de decizie
~~ nuj ce am facut aici :
from sklearn.naive_bayes import GaussianNB
from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split(X_lda[:,0], X_lda[:,1], test_size

= 0.2, random_state = 42)

model = GaussianNB()
model.fit(X_train, y_train)

from sklearn.metrics import accuracy_score

y_pred = model.predict(X_test)
acuratete = accuracy_score(y_test, y_pred)
print(f"Acuratetea este {acuratete}")

Lab 08.04
RANDOMFOREST
from sklearn.model_selection import train_test_split
import pandas as pd
from sklearn.metrics import accuracy_score
from sklearn.ensemble import RandomForestClassifier

floricele = pd.read_csv('iris.csv')
# floricele v a deveni un pandas data frame
X = floricele.drop('variety', axis = 1)
y = floricele['variety']
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.2,
random_state = 42)

rf_clasificator = RandomForestClassifier(n_estimators = 100, random_state =

42)
# n_estimators - nr de arbori de decizie

rf_clasificator.fit(X_train, y_train)

predictii = rf_clasificator.predict(X_test)

print('Acuratetea : ', accuracy_score(y_test, predictii))

#RF cu GridSearchView
from sklearn.model_selection import GridSearchCV #face cross validation
automat
parametrii_grid = {
'n_estimators' : [50, 100, 150],
'max_depth' : [None, 5, 10],
'min_samples_split' : [2, 5, 10],
'min_samples_leaf' : [1, 2, 4],
'max_features' : [None, 'sqrt'],
}

rf_clas_grid = RandomForestClassifier(random_state = 42)

grid_search = GridSearchCV(rf_clas_grid , parametrii_grid, cv = 5)

grid_search.fit(X, y)

print("Cei mai buni hiperparametri: ", grid_search.best_params_)

Lab 22.04
XGBoost
# un exemplu cu XGBoost Classifier
from xgboost import XGBClassifier

import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.svm import SVC
from sklearn.neighbors import KNeighborsClassifier
from sklearn.tree import DecisionTreeClassifier
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score
import joblib #pentru salvarea (serializarea) modelului
from sklearn import preprocessing

floricele = pd.read_csv('iris.csv')
X = floricele.drop('variety', axis = 1)
y = floricele['variety']
label_encoder = preprocessing.LabelEncoder()
y = label_encoder.fit_transform(y)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.2,
random_state = 42)

clasificatori = {
'Logistic Regression': LogisticRegression(),
'SVM' : SVC(),
'KNN' : KNeighborsClassifier(),
'Decision Tree' : DecisionTreeClassifier(),
'RandomForest' : RandomForestClassifier(),
}

#dictionar pt memorarea modelelor antrenate

modele_antrenate = {}
for nume_clasif, clasif in clasificatori.items():
model = XGClassifier(base_estimators = clasif)
model.fit(X_train, y_train)
#salvare model in dictionar
modele_antrenate[nume.clasif] = model
y_pred = model.predict(X_test)
acuratetea = accuracy_score(y_test, y_pred)
print(f'{nume_clasif} acuratetea: {accuracy_score}')

# nu functioneaza decat cu decision tree deoarece XGB nu mai are

base_estimators

Curs 23.04
KMeans
import pandas as pd
from sklearn.cluster import KMeans, DBSCAN
from sklearn.preprocessing import LabelEncoder, StandardScaler
import matplotlib.pyplot as plt

floricele = pd.read_csv('iris.csv')
# X = floricele.drop('variety', axis = 1) sau asa :
X = floricele[['sepal.length', 'sepal.width', 'petal.length', 'petal.width']]
y_umane = floricele['variety']

#standardizare
scaler = StandardScaler()
X_scalat = scaler.fit_transform(X)
floricele_scalat = pd.DataFrame(X_scalat, columns = X.columns)

inertia = []
for nr_c in range(1,11):
kmeans = KMeans(n_clusters = nr_c, random_state = 42)
kmeans.fit(X_scalat)
inertia.append(kmeans.inertia_)

plt.figure(figsize = (10,6))
plt.plot(range(1,11), inertia, marker = 'o')
plt.title('Metoda cotului pt KMeans')
plt.xlabel('nr. de clustere')
plt.ylabel('inertia')
plt.xticks(range(1,11))
plt.show()

kmeans = KMeans(n_clusters = 3, random_state = 42)

kmeans_labels = kmeans.fit_predict(X_scalat)

# ...
Curs 29.04
DBScan
import pandas as pd
from sklearn.cluster import DBSCAN
from sklearn.preprocessing import StandardScaler, LabelEncoder
import matplotlib.pyplot as plt

floricele = pd.read_csv('iris.csv')
X = floricele[['sepal.length', 'sepal.width', 'petal.length', 'petal.width']]
y_adev = floricele['variety']

label_encoder = LabelEncoder()
y_adev_num = label_encoder.fit_transform(y_adev)

# standardizare = le fortam sa semene cu o gausiana

scaler = StandardScaler()
X_scalat = scaler.fit_transform(X)
floricele_scalat = pd.DataFrame(X_scalat, columns = X.columns)

floricele_scalat.head()

dbscan = DBSCAN(eps = 0.5, min_samples = 5)

# raza de 0.5, nr min de vecini pt a fi centroid = 5
dbscan_etichete = dbscan.fit_predict(X_scalat)

dbscan_etichete
# -1 reprezinta noise

plt.figure(figsize = (10,6))
plt.scatter(X_scalat[:,0], X_scalat[:,1], c = dbscan_etichete, cmap = 'viridis')
plt.title('Clustering cu DBSCAN')
plt.xlabel('Sepal Length (scalat)')
plt.ylabel('Sepal width (scalat)')

# evaluare
from sklearn.metrics import silhouette_score, calinski_harabasz_score,
adjusted_rand_score
dbscan_non_noise = (dbscan_etichete != 1)

dbscan_silhouette = silhouette_score(X_scalat[dbscan_non_noise],
dbscan_etichete[dbscan_non_noise])

dbscan_silhouette

Cod SBC
No ratings yet
Cod SBC
16 pages
Bagging, Random Forest, Gradient Boost, AdaBoost & PCA
No ratings yet
Bagging, Random Forest, Gradient Boost, AdaBoost & PCA
8 pages
Code Examples in Space
No ratings yet
Code Examples in Space
13 pages
IRIS BPNN - Ipynb - Colaboratory
100% (1)
IRIS BPNN - Ipynb - Colaboratory
4 pages
Lab - 5 (CB - En.u4ece22115)
No ratings yet
Lab - 5 (CB - En.u4ece22115)
5 pages
Ai/Ml Lab-4: Name: Pratik Jadhav PRN: 20190802050
No ratings yet
Ai/Ml Lab-4: Name: Pratik Jadhav PRN: 20190802050
5 pages
Program 4
No ratings yet
Program 4
3 pages
Scikit-Learn Cheat Sheet
No ratings yet
Scikit-Learn Cheat Sheet
1 page
Scikit-Learn Cheat Sheet
No ratings yet
Scikit-Learn Cheat Sheet
1 page
Iris - Regression - Jupyter Notebook
No ratings yet
Iris - Regression - Jupyter Notebook
5 pages
DS 6
No ratings yet
DS 6
2 pages
ML Lab Manual
No ratings yet
ML Lab Manual
6 pages
Python For Data Science Cheat Sheet: Scikit-Learn Create Your Model Evaluate Your Model's Performance
100% (1)
Python For Data Science Cheat Sheet: Scikit-Learn Create Your Model Evaluate Your Model's Performance
1 page
Scikit Learn Cheat Sheet Python
No ratings yet
Scikit Learn Cheat Sheet Python
1 page
SVM and Kmeans - Iris Dataset - Ipynb - Colab
No ratings yet
SVM and Kmeans - Iris Dataset - Ipynb - Colab
5 pages
ML 1
No ratings yet
ML 1
4 pages
Scikit-Learn: Scikit-Learn Is An Open Source Python Library That
100% (1)
Scikit-Learn: Scikit-Learn Is An Open Source Python Library That
1 page
Tidaim 2
No ratings yet
Tidaim 2
2 pages
Model - Ipynb - Colaboratory
No ratings yet
Model - Ipynb - Colaboratory
3 pages
Decision Tree
No ratings yet
Decision Tree
6 pages
Assignment 5
No ratings yet
Assignment 5
5 pages
Dsbda Assig 6 Data Analytcs 3
No ratings yet
Dsbda Assig 6 Data Analytcs 3
6 pages
NaiveBayesClassifier - Jupyter Notebook
No ratings yet
NaiveBayesClassifier - Jupyter Notebook
2 pages
Scikit-Learn Cheat Sheet Python For Data Science: Preprocessing The Data Evaluate Your Model's Performance
100% (1)
Scikit-Learn Cheat Sheet Python For Data Science: Preprocessing The Data Evaluate Your Model's Performance
1 page
Machine Learning Aiml
No ratings yet
Machine Learning Aiml
7 pages
Sklearn
No ratings yet
Sklearn
141 pages
K Means
No ratings yet
K Means
3 pages
1 10
No ratings yet
1 10
4 pages
Dsbda Ouput 1-10
No ratings yet
Dsbda Ouput 1-10
89 pages
PR 6
No ratings yet
PR 6
6 pages
AML Lab3 2021wb15156
No ratings yet
AML Lab3 2021wb15156
13 pages
AML Lab
No ratings yet
AML Lab
14 pages
TranMinhTu1 bt2 2
No ratings yet
TranMinhTu1 bt2 2
5 pages
Naive Bayes Classifier 066
No ratings yet
Naive Bayes Classifier 066
14 pages
DSBDA6
No ratings yet
DSBDA6
3 pages
33NaiveBayesOn Iris
No ratings yet
33NaiveBayesOn Iris
1 page
Ai Int-1
No ratings yet
Ai Int-1
6 pages
EXP 9 DWM - Merged
No ratings yet
EXP 9 DWM - Merged
11 pages
3 Classification
No ratings yet
3 Classification
16 pages
ML Functions
No ratings yet
ML Functions
12 pages
SC Assignment Q2
No ratings yet
SC Assignment Q2
7 pages
Unit-3 Machine Learning Model With FastAPI For Iris Dataset
No ratings yet
Unit-3 Machine Learning Model With FastAPI For Iris Dataset
3 pages
ML Classification
No ratings yet
ML Classification
54 pages
Comparison of Classifiers
No ratings yet
Comparison of Classifiers
6 pages
It - S All About Neighbors - Completed
No ratings yet
It - S All About Neighbors - Completed
14 pages
Computer Engineering Laboratory Solution Primer
From Everand
Computer Engineering Laboratory Solution Primer
Karan Bhandari
No ratings yet
PR
No ratings yet
PR
17 pages
Aiml
No ratings yet
Aiml
18 pages
ML II Lab
No ratings yet
ML II Lab
5 pages
02 - Decision Tree Classification On Iris Dataset
No ratings yet
02 - Decision Tree Classification On Iris Dataset
6 pages
Reast Cancer Prediction Using Debt
No ratings yet
Reast Cancer Prediction Using Debt
18 pages
The Essential R Reference
From Everand
The Essential R Reference
Mark Gardener
No ratings yet
Lab 1 - Machine Learning with Python - ML Engineering مهم
No ratings yet
Lab 1 - Machine Learning with Python - ML Engineering مهم
10 pages
Python Decision Tree
No ratings yet
Python Decision Tree
2 pages
Support Vector Machine
No ratings yet
Support Vector Machine
7 pages
Profound Python Data Science
From Everand
Profound Python Data Science
Onder Teker
No ratings yet
Introduction to PHP, Part 2, Second Edition
From Everand
Introduction to PHP, Part 2, Second Edition
Adam Majczak
No ratings yet
Java Programming Tutorial With Screen Shots & Many Code Example
From Everand
Java Programming Tutorial With Screen Shots & Many Code Example
Desmond Ohwofosirai
No ratings yet
Oracle Certified Professional Java Programmer OCPJP 1Z0 809
From Everand
Oracle Certified Professional Java Programmer OCPJP 1Z0 809
Manish Soni
No ratings yet
C Programming
From Everand
C Programming
Netra
No ratings yet
Supervision Training Handbook. V1.2022-20231 2
No ratings yet
Supervision Training Handbook. V1.2022-20231 2
30 pages
Rood Lighting BOQ (AMBO GUDER)
No ratings yet
Rood Lighting BOQ (AMBO GUDER)
1 page
ATmega328 Timer-Counter1 Compare Match B
No ratings yet
ATmega328 Timer-Counter1 Compare Match B
1 page
Modified Study On Customer Gratification Towards Online Market and Super /hyper Marke
No ratings yet
Modified Study On Customer Gratification Towards Online Market and Super /hyper Marke
11 pages
Farzana Akter - Energy Conversions
0% (2)
Farzana Akter - Energy Conversions
4 pages
Strengths and Weaknesses of Approaches To Teaching Writing
80% (10)
Strengths and Weaknesses of Approaches To Teaching Writing
10 pages
Cossh Risk Assessment: Carried Out By: Department: Date: Substance Name: CRA Number
No ratings yet
Cossh Risk Assessment: Carried Out By: Department: Date: Substance Name: CRA Number
2 pages
Ha 2023
No ratings yet
Ha 2023
22 pages
Lupox Gp1000H: Description Application
No ratings yet
Lupox Gp1000H: Description Application
2 pages
Manipulating Time
No ratings yet
Manipulating Time
2 pages
Instant Download Process Validation in Manufacturing of Biopharmaceuticals 3rd Edition Anurag S. Rathore PDF All Chapters
100% (10)
Instant Download Process Validation in Manufacturing of Biopharmaceuticals 3rd Edition Anurag S. Rathore PDF All Chapters
85 pages
Complex Numbers - Part 1
No ratings yet
Complex Numbers - Part 1
3 pages
Driving NC Ii Post Test
100% (2)
Driving NC Ii Post Test
2 pages
Application Guide For Certification of BIM Manager (PN01-G-01) (Sep 2023)
No ratings yet
Application Guide For Certification of BIM Manager (PN01-G-01) (Sep 2023)
15 pages
Date Sheet For The BS 4 Years Program Third Semester Examination Fall 40108 PDF
No ratings yet
Date Sheet For The BS 4 Years Program Third Semester Examination Fall 40108 PDF
2 pages
Elt2 Midterm 2022 How To Approach Genre Analysis
No ratings yet
Elt2 Midterm 2022 How To Approach Genre Analysis
3 pages
Research Paper Coping Mechanism of SHS 2022
No ratings yet
Research Paper Coping Mechanism of SHS 2022
29 pages
EN - BioMajesty 6010 - C
100% (1)
EN - BioMajesty 6010 - C
2 pages
Topcon GR 5 Manual: Click Here To Download
No ratings yet
Topcon GR 5 Manual: Click Here To Download
3 pages
Example Summary Writing A Goal of Service To Humankind Summary
No ratings yet
Example Summary Writing A Goal of Service To Humankind Summary
2 pages
General Biology 1 Workbook
No ratings yet
General Biology 1 Workbook
24 pages
Excel VBA Programming Golden Rules
100% (6)
Excel VBA Programming Golden Rules
31 pages
Calalang vs. Williams
No ratings yet
Calalang vs. Williams
6 pages
2578 - Citizen C690
No ratings yet
2578 - Citizen C690
5 pages
Cat Questions
No ratings yet
Cat Questions
5 pages
Architecture and Algorithms For Tracking Football Players With Multiple Cameras
No ratings yet
Architecture and Algorithms For Tracking Football Players With Multiple Cameras
5 pages
EE3311 - Set 3
No ratings yet
EE3311 - Set 3
3 pages
Terrence Tao - An Epsilon of Room, I - Real Analysis
No ratings yet
Terrence Tao - An Epsilon of Room, I - Real Analysis
358 pages
Tecstrip Flat & Flexible Phenolic Insulating Strip: Linda B - We Simplif y Const Ruc T Ion
No ratings yet
Tecstrip Flat & Flexible Phenolic Insulating Strip: Linda B - We Simplif y Const Ruc T Ion
2 pages
Syntax Meeting 6 & 7 PDF
No ratings yet
Syntax Meeting 6 & 7 PDF
5 pages

Laboratoare SBC

Uploaded by

Laboratoare SBC

Uploaded by

Curs 05.

k_range = range(1, 26) # 25 de valori de la 1 la 25

# seaborn si matplotlib pt prezentare grafica

from sklearn.model_selection import train_test_split

sns.pairplot(floricele, hue = 'variety')

X_train, X_test, y_train, y_test = train_test_split(X, y_encoded, test_size = 0.3,

Lab 25.03 – continuare lab 11.03

# apoi de face predictia, matricea de confuzii ca la modelul de dinainte

#encoding la campul de etichetare ('variety')

from sklearn.model_selection import train_test_split

X = flori.drop('variety', axis = 1) #adica pe linii

from sklearn.metrics import accuracy_score

#normalizare - de ex cand sunt unitati de masura diferita

# sarim peste LabelEncoding - il face sklearn automat

print(f'media scorurilor prntru IG: {sum(scoruri_entropie) /

print(f'media scorurilor prntru IG: {np.mean(scoruri_entropie)}')

model_gini = DecisionTreeClassifier(criterion = 'gini', random_state = 42)

print(f'media scorurilor prntru IG: {np.mean(scoruri_gini)}')

df = pd.DataFrame(irisi.data, columns = irisi.feature_names)

df[df.target == 1].head() #o-setosa, 1-versicolor, 2-virginica

df['nume_floare'] = df.target.apply(lambda x: irisi.target_names[x])

from matplotlib import pyplot as plt

import matplotlib.pyplot as plt

X_train, X_test, y_train, y_test = train_test_split(X_lda[:,0], X_lda[:,1], test_size

from sklearn.metrics import accuracy_score

rf_clasificator = RandomForestClassifier(n_estimators = 100, random_state =

print('Acuratetea : ', accuracy_score(y_test, predictii))

rf_clas_grid = RandomForestClassifier(random_state = 42)

print("Cei mai buni hiperparametri: ", grid_search.best_params_)

#dictionar pt memorarea modelelor antrenate

# nu functioneaza decat cu decision tree deoarece XGB nu mai are

kmeans = KMeans(n_clusters = 3, random_state = 42)

# standardizare = le fortam sa semene cu o gausiana

dbscan = DBSCAN(eps = 0.5, min_samples = 5)

You might also like