0% found this document useful (0 votes)

23 views5 pages

Scikit Learn CheatSheet BFCS0011

Uploaded by

alialiye33333

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

23 views5 pages

Scikit Learn CheatSheet BFCS0011

Uploaded by

alialiye33333

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 5

blog.faradars.

org ‫مجله فرادرس‬ ‫ – تقلبنامه پایتون برای علم داده‬BFCS0011

Scikit-Learn ‫کتابخانه‬

Scikit-Learn ‫معرفی کتابخانه‬

‫) برای زبان پایتون است که طیفی از‬Open Source( »‫ یک کتابخانه «متنباز‬،)Scikit-learn( »‫«سایکیتلِرن‬
‫ «اعتبارسنجی‬،)Data Pre-Processing( »‫ «پیشپردازش دادهها‬،)Machine Learning( »‫الگوریتمهای «یادگیری ماشین‬
.‫) را با استفاده از یک رابط یکپارچه پیادهسازی یمکند‬Visualization( »‫) و «بصریسازی‬Cross Validation( »‫متقابل‬

‫یک مثال پایهای‬

>>> from sklearn import neighbors, datasets, preprocessing

>>> from sklearn.model_selection import train_test_split
>>> from sklearn.metrics import accuracy_score
>>> iris = datasets.load_iris()
>>> X, y = iris.data[:, :2], iris.target
>>> X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=33)
>>> scaler = preprocessing.StandardScaler().fit(X_train)
>>> X_train = scaler.transform(X_train)
>>> X_test = scaler.transform(X_test)
>>> knn = neighbors.KNeighborsClassifier(n_neighbors=5)
>>> knn.fit(X_train, y_train)
>>> y_pred = knn.predict(X_test)
>>> accuracy_score(y_test, y_pred)

)Loading The Data( ‫بارگذاری دادهها‬

‫ دیگر انواعی‬.‫ ذخیره شده باشند‬SciPy ‫ یا ماتریس خلوت‬NumPy ‫دادهها باید به صورت عددی و آرایههای‬
.‫ نیز قابل پذیرش هستند‬Pandas ‫ مانند دیتافریم‬،‫که قابل تبدیل به آرایههای عددی هستند‬
>>> import numpy as np
>>> X = np.random.random((10,5))
>>> y = np.array(['M','M','F','F','M','F','M','M','F','F','F'])
>>> X[X < 0.7] = 0

)Training And Test Data( ‫دادههای آموزش و آزمون‬

>>> from sklearn.model_selection import train_test_split

>>> X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=0)

.‫ به این لینک مراجعه فرمایید‬،‫برای مشاهده دیگر «تقلبنامههای» مجله فرادرس‬

blog.faradars.org ‫مجله فرادرس‬ ‫ – تقلبنامه پایتون برای علم داده‬BFCS0011

)Preprocessing The Data( ‫پیشپردازش دادهها‬

)Encoding Categorical Features( ‫رمزنگاری ویژیگهای طبقهای‬ )Standardization( ‫استانداردسازی‬
>>> from sklearn.preprocessing import LabelEncoder >>> from sklearn.preprocessing import StandardScaler
>>> enc = LabelEncoder() >>> scaler = StandardScaler().fit(X_train)
>>> y = enc.fit_transform(y) >>> standardized_X = scaler.transform(X_train)
>>> standardized_X_test = scaler.transform(X_test)

)Missing Values( ‫جایگذاری مقادیر ناموجود‬ )Normalization( ‫نرمالسازی‬

>>> from sklearn.preprocessing import Imputer >>> from sklearn.preprocessing import Normalizer
>>> imp = Imputer(missing_values=0, strategy='mean', axis=0) >>> scaler = Normalizer().fit(X_train)
>>> imp.fit_transform(X_train) >>> normalized_X = scaler.transform(X_train)
>>> normalized_X_test = scaler.transform(X_test)

)Polynomial Features( ‫ساخت ویژیگهای چند جملهای‬ )Binarization( ‫دودوییسازی‬

>>>from sklearn.preprocessing import PolynomialFeatures >>> from sklearn.preprocessing import Binarizer
>>> poly = PolynomialFeatures(5) >>> binarizer = Binarizer(threshold=0.0).fit(X)
>>> poly.fit_transform(X) >>> binary_X = binarizer.transform(X)

‫ساخت مدل‬

)Supervised Learning Estimators( ‫برآوردگرهای یادگیری نظارت شده‬

)Linear Regression( ‫رگرسیون خطی‬
>>> from sklearn.linear_model import LinearRegression
>>> lr = LinearRegression(normalize=True)
)Support Vector Machines | SVM( ‫ماشین بردار پشتیبان‬
>>> from sklearn.svm import SVC
>>> svc = SVC(kernel='linear')
)Naive Bayes( ‫نایو بیز‬
>>> from sklearn.naive_bayes import GaussianNB
>>> gnb = GaussianNB()
)K-Nearest Neighbors | KNN( ‫ نزدیکترین همساییگ‬K
>>> from sklearn import neighbors
>>> knn = neighbors.KNeighborsClassifier(n_neighbors=5)

)Unsupervised Learning Estimators( ‫برآوردگرهای یادگیری نظارت نشده‬

)K Means( ‫ میانگین‬K )Principal Component Analysis ( ‫تحلیل مولفه اسایس‬

>>> from sklearn.cluster import KMeans >>> from sklearn.decomposition import PCA
>>> k_means = KMeans(n_clusters=3, random_state=0) >>> pca = PCA(n_components=0.95)

.‫ به این لینک مراجعه فرمایید‬،‫برای مشاهده دیگر «تقلبنامههای» مجله فرادرس‬

blog.faradars.org ‫مجله فرادرس‬ ‫ – تقلبنامه پایتون برای علم داده‬BFCS0011

)Model Fitting( ‫برازش مدل‬

)Supervised Learning( ‫یادگیری نظارت شده‬
‫ >>> برازش مدل برای دادهها‬lr.fit(X, y)
>>> knn.fit(X_train, y_train)

)Unsupervised Learning( ‫یادگیری نظارت نشده‬

‫ >>> برازش مدل برای دادهها‬k_means.fit(X_train)
‫ >>> برازش برای دادهها و سپس تبدیل آن‬pca_model = pca.fit_transform(X_train)

)Prediction( ‫پیشبیین‬
‫برآوردگرهای نظارت شده‬
‫ >>> پیشبیین برچسبها‬y_pred = svc.predict(np.random.random((2,5)))
‫ >>> پیشبیین برچسبها‬y_pred = lr.predict(X_test)
‫ >>> تخمین احتمال یک برچسب‬y_pred = knn.predict_proba(X_test)

‫برآوردگرهای نظارت نشده‬

‫ >>> پیشبیین برچسبها در الگوریتمهای خوشهبندی‬y_pred = k_means.predict(X_test)

)Model Performance Evaluation( ‫ارزیایب کارایی مدل‬

)Classification Metrics( ‫سنجههای دستهبندی‬

)Accuracy Score( ‫امتیاز صحت‬
‫ >>> روش امتیاز برآوردگر‬knn.score(X_test, y_test)
‫ >>> توابع امتیازدهی متریک‬from sklearn.metrics import accuracy_score
>>> accuracy_score(y_test, y_pred)

)Classification Report( ‫گزارش دستهبندی‬

‫ و‬f1-Score ،)Recall( »‫ «دقت‬،)Precision( »‫ >>> «صحت‬from sklearn.metrics import classification_report
)Support( »‫ >>> «پشتیبان‬print(classification_report(y_test, y_pred))

)Confusion Matrix( ‫ماتریس درهمریختیگ‬

>>> from sklearn.metrics import confusion_matrix
>>> print(confusion_matrix(y_test, y_pred))

)Regression Metrics( ‫سنجههای رگرسیون‬

)R² Score( R2 ‫امتیاز‬

>>> from sklearn.metrics import r2_score

>>> r2_score(y_true, y_pred)

.‫ به این لینک مراجعه فرمایید‬،‫برای مشاهده دیگر «تقلبنامههای» مجله فرادرس‬

blog.faradars.org ‫مجله فرادرس‬ ‫ – تقلبنامه پایتون برای علم داده‬BFCS0011

)Mean Absolute Error( ‫میانگین قدر مطلق خطا‬

>>> from sklearn.metrics import mean_absolute_error
>>> y_true = [3, -0.5, 2]
>>> mean_absolute_error(y_true, y_pred)

)Mean Squared Error( ‫میانگین خطای مربعات‬

>>> from sklearn.metrics import mean_squared_error
>>> mean_squared_error(y_test, y_pred)

)Clustering Metrics( ‫سنجههای خوشهبندی‬

)Adjusted Rand Index( Rand ‫اندیس تصادفی شده‬

>>> from sklearn.metrics import adjusted_rand_score
>>> adjusted_rand_score(y_true, y_pred)

)Homogeneity( ‫همگن بودن‬

>>> from sklearn.metrics import homogeneity_score
>>> homogeneity_score(y_true, y_pred)

)V-measure( V ‫اندازه‬
>>> from sklearn.metrics import v_measure_score
>>> metrics.v_measure_score(y_true, y_pred)

)Cross-Validation( ‫اعتبارسنجی متقابل‬

>>> from sklearn.cross_validation import cross_val_score

>>> print(cross_val_score(knn, X_train, y_train, cv=4))
>>> print(cross_val_score(lr, X, y, cv=2))

)Model Tuning( ‫تنظیم مدل‬

)Grid Search( ‫جستوجوی شبکهای‬

>>> from sklearn.grid_search import GridSearchCV
>>> params = {"n_neighbors": np.arange(1,3),
"metric": ["euclidean", "cityblock"]}
>>> grid = GridSearchCV(estimator=knn,
param_grid=params)
>>> grid.fit(X_train, y_train)
>>> print(grid.best_score_)
>>> print(grid.best_estimator_.n_neighbors)

.‫ به این لینک مراجعه فرمایید‬،‫برای مشاهده دیگر «تقلبنامههای» مجله فرادرس‬

‫‪blog.faradars.org‬‬ ‫مجله فرادرس‬ ‫‪ – BFCS0011‬تقلبنامه پایتون برای علم داده‬

‫بهینهسازی پارامتر تصادفی شده (‪)Randomized Parameter Optimization‬‬

‫‪>>> from sklearn.grid_search import RandomizedSearchCV‬‬
‫‪>>> params = {"n_neighbors": range(1,5),‬‬
‫}]"‪"weights": ["uniform", "distance‬‬
‫‪>>> rsearch = RandomizedSearchCV(estimator=knn,‬‬
‫‪param_distributions=params,‬‬
‫‪cv=4,‬‬
‫‪n_iter=8,‬‬
‫)‪random_state=5‬‬
‫)‪>>> rsearch.fit(X_train, y_train‬‬
‫)_‪>>> print(rsearch.best_score‬‬

‫مجموعه آموزشهای دادهکاوی فرادرس (‪+‬کلیک کنید)‬

‫برای مشاهده دیگر «تقلبنامههای» مجله فرادرس‪ ،‬به این لینک مراجعه فرمایید‪.‬‬

‫جهت آگاهی از آخرین تقلبنامههای منتشر شده‪ ،‬در کانال تلگرام مجله فرادرس عضو شوید‪.‬‬

‫تهیه و تنظیم‪ :‬مجله فرادرس‬

‫منبع‬

‫برای مشاهده دیگر «تقلبنامههای» مجله فرادرس‪ ،‬به این لینک مراجعه فرمایید‪.‬‬

NumPy CheatSheet BFCS0010
No ratings yet
NumPy CheatSheet BFCS0010
6 pages
Python Libraries CheatSheet BFCS0004
No ratings yet
Python Libraries CheatSheet BFCS0004
2 pages
HW#1 STD
No ratings yet
HW#1 STD
6 pages
Eps Ca0
No ratings yet
Eps Ca0
4 pages
Deep Learning in MATLAB BFCS0029
No ratings yet
Deep Learning in MATLAB BFCS0029
4 pages
Final Exam (Malek - 942) & Ans
No ratings yet
Final Exam (Malek - 942) & Ans
7 pages
ML HW#5
No ratings yet
ML HW#5
7 pages
Programming Project-EngProb3
No ratings yet
Programming Project-EngProb3
4 pages
HW#1 STD
No ratings yet
HW#1 STD
5 pages
hw4 Solution
No ratings yet
hw4 Solution
11 pages
NNDL HW1
No ratings yet
NNDL HW1
16 pages
Pamphlet (Session04)
No ratings yet
Pamphlet (Session04)
18 pages
FDS HW3
No ratings yet
FDS HW3
3 pages
MATLAB Optimization Toolbox
No ratings yet
MATLAB Optimization Toolbox
4 pages
برنامه نویسی پیشرفته پارت ۲
No ratings yet
برنامه نویسی پیشرفته پارت ۲
13 pages
X Cifar10
No ratings yet
X Cifar10
2 pages
05 Grid Search - Fa
No ratings yet
05 Grid Search - Fa
2 pages
STD N Umber N Ame: (Parameter-Efficient Fine-Tuning)
No ratings yet
STD N Umber N Ame: (Parameter-Efficient Fine-Tuning)
2 pages
AP Mirkhan Ch01
No ratings yet
AP Mirkhan Ch01
22 pages
جزوه ۲ داده کاوی
No ratings yet
جزوه ۲ داده کاوی
88 pages
Abaqus - Rpy Abaqus - Rpy
No ratings yet
Abaqus - Rpy Abaqus - Rpy
50 pages
MDA2024HW2
No ratings yet
MDA2024HW2
4 pages
Jozveban - Ir Elegram - Me/jozveban T Ir/sopnuu App. S
No ratings yet
Jozveban - Ir Elegram - Me/jozveban T Ir/sopnuu App. S
41 pages
Flask 1643457812
No ratings yet
Flask 1643457812
69 pages
14 - Learning From Examples - SVM
No ratings yet
14 - Learning From Examples - SVM
37 pages
Deeplearning
No ratings yet
Deeplearning
206 pages
ML HW6
No ratings yet
ML HW6
5 pages
ماشین بردار پشتیبان چیست
No ratings yet
ماشین بردار پشتیبان چیست
12 pages
NNDL HW2
No ratings yet
NNDL HW2
11 pages
جزییات سرفصل های دانشمندداده
No ratings yet
جزییات سرفصل های دانشمندداده
11 pages
02 Statistical - Learning - Farsi
No ratings yet
02 Statistical - Learning - Farsi
32 pages
03 Linear - Regression - Farsi
No ratings yet
03 Linear - Regression - Farsi
50 pages
Python Commands CheatSheet BFCS0005
No ratings yet
Python Commands CheatSheet BFCS0005
2 pages
deepـlearning
No ratings yet
deepـlearning
205 pages
تمرین سری هفتم
No ratings yet
تمرین سری هفتم
5 pages
Learning About Kears and Tensorflow 1731502002
No ratings yet
Learning About Kears and Tensorflow 1731502002
22 pages
ML - 97 - 1 - Chp04 - Parametric Methods - 2
No ratings yet
ML - 97 - 1 - Chp04 - Parametric Methods - 2
36 pages
01 Preprocessing - Selected - Farsi
No ratings yet
01 Preprocessing - Selected - Farsi
35 pages
Demo v2
No ratings yet
Demo v2
85 pages
تابع در پایتون
No ratings yet
تابع در پایتون
22 pages
Py 41
No ratings yet
Py 41
22 pages
Machine Learning - Challenge 2
No ratings yet
Machine Learning - Challenge 2
1 page
ارائه یادگیری ماشینی
No ratings yet
ارائه یادگیری ماشینی
12 pages
Dissertation Part 1 and 2
No ratings yet
Dissertation Part 1 and 2
63 pages
نمونه سوالات ساختمان داده
No ratings yet
نمونه سوالات ساختمان داده
8 pages
Py 43
No ratings yet
Py 43
24 pages
PDF Prj١
No ratings yet
PDF Prj١
6 pages
Stat 14012 A1 Solutions
No ratings yet
Stat 14012 A1 Solutions
7 pages
مسابقه انتخابی هکاتون UT AI - دست - خط زشت
No ratings yet
مسابقه انتخابی هکاتون UT AI - دست - خط زشت
3 pages
فصل پنجم
100% (4)
فصل پنجم
56 pages
TSK Modeling
No ratings yet
TSK Modeling
29 pages
Lecture 13 - Sum of Independent RVs
No ratings yet
Lecture 13 - Sum of Independent RVs
16 pages
Speed R A 1 MPH 1.6 KMPH B C
No ratings yet
Speed R A 1 MPH 1.6 KMPH B C
2 pages
1 Merged
No ratings yet
1 Merged
28 pages
آزمون میان - ترم
No ratings yet
آزمون میان - ترم
2 pages
Comp 3
No ratings yet
Comp 3
30 pages
Assignment 1 - Loss-Less Compression
No ratings yet
Assignment 1 - Loss-Less Compression
2 pages
Python 3.10
No ratings yet
Python 3.10
43 pages
برنامه نویسی پیشرفته پارت ۳
No ratings yet
برنامه نویسی پیشرفته پارت ۳
9 pages

Scikit Learn CheatSheet BFCS0011

Uploaded by

Scikit Learn CheatSheet BFCS0011

Uploaded by

blog.faradars.

org ‫مجله فرادرس‬ ‫ – تقلبنامه پایتون برای علم داده‬BFCS0011

Scikit-Learn ‫معرفی کتابخانه‬

‫یک مثال پایهای‬

>>> from sklearn import neighbors, datasets, preprocessing

)Loading The Data( ‫بارگذاری دادهها‬

)Training And Test Data( ‫دادههای آموزش و آزمون‬

>>> from sklearn.model_selection import train_test_split

.‫ به این لینک مراجعه فرمایید‬،‫برای مشاهده دیگر «تقلبنامههای» مجله فرادرس‬

)Preprocessing The Data( ‫پیشپردازش دادهها‬

)Missing Values( ‫جایگذاری مقادیر ناموجود‬ )Normalization( ‫نرمالسازی‬

)Polynomial Features( ‫ساخت ویژیگهای چند جملهای‬ )Binarization( ‫دودوییسازی‬

)Supervised Learning Estimators( ‫برآوردگرهای یادگیری نظارت شده‬

)Unsupervised Learning Estimators( ‫برآوردگرهای یادگیری نظارت نشده‬

)K Means( ‫ میانگین‬K )Principal Component Analysis ( ‫تحلیل مولفه اسایس‬

.‫ به این لینک مراجعه فرمایید‬،‫برای مشاهده دیگر «تقلبنامههای» مجله فرادرس‬

)Model Fitting( ‫برازش مدل‬

)Unsupervised Learning( ‫یادگیری نظارت نشده‬

‫برآوردگرهای نظارت نشده‬

)Model Performance Evaluation( ‫ارزیایب کارایی مدل‬

)Classification Metrics( ‫سنجههای دستهبندی‬

)Classification Report( ‫گزارش دستهبندی‬

)Confusion Matrix( ‫ماتریس درهمریختیگ‬

)Regression Metrics( ‫سنجههای رگرسیون‬

)R² Score( R2 ‫امتیاز‬

>>> r2_score(y_true, y_pred)

.‫ به این لینک مراجعه فرمایید‬،‫برای مشاهده دیگر «تقلبنامههای» مجله فرادرس‬

)Mean Absolute Error( ‫میانگین قدر مطلق خطا‬

)Mean Squared Error( ‫میانگین خطای مربعات‬

)Clustering Metrics( ‫سنجههای خوشهبندی‬

)Adjusted Rand Index( Rand ‫اندیس تصادفی شده‬

)Homogeneity( ‫همگن بودن‬

)Cross-Validation( ‫اعتبارسنجی متقابل‬

>>> from sklearn.cross_validation import cross_val_score

)Model Tuning( ‫تنظیم مدل‬

)Grid Search( ‫جستوجوی شبکهای‬

.‫ به این لینک مراجعه فرمایید‬،‫برای مشاهده دیگر «تقلبنامههای» مجله فرادرس‬

‫بهینهسازی پارامتر تصادفی شده (‪)Randomized Parameter Optimization‬‬

‫مجموعه آموزشهای دادهکاوی فرادرس (‪+‬کلیک کنید)‬

‫تهیه و تنظیم‪ :‬مجله فرادرس‬

You might also like