0% found this document useful (0 votes)

45 views7 pages

Chapter05 Fundamentals-Of-Ml

This notebook summarizes key concepts from the book Deep Learning with Python. It contains code examples and explanations for fundamental machine learning topics like overfitting, generalization, improving model fit, and regularization. Code blocks demonstrate techniques like adding noise channels to mitigate overfitting, tuning hyperparameters like learning rate, and using dropout and weight regularization to improve generalization. The notebook is intended to be used alongside the corresponding text from the book.

Uploaded by

Jas Lim

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOC, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

45 views7 pages

Chapter05 Fundamentals-Of-Ml

Uploaded by

Jas Lim

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOC, PDF, TXT or read online on Scribd

You are on page 1/ 7

This is a companion notebook for the book Deep Learning with Python, Second Edition.

For
readability, it only contains runnable code blocks and section titles, and omits everything
else in the book: text paragraphs, figures, and pseudocode.
If you want to be able to follow what's going on, I recommend reading the notebook
side by side with your copy of the book.
This notebook was generated for TensorFlow 2.6.

Fundamentals of machine learning

Generalization: The goal of machine learning
Underfitting and overfitting

Noisy training data

Ambiguous features

Rare features and spurious correlations

Adding white-noise channels or all-zeros channels to MNIST
from tensorflow.keras.datasets import mnist
import numpy as np

(train_images, train_labels), _ = mnist.load_data()

train_images = train_images.reshape((60000, 28 * 28))
train_images = train_images.astype("float32") / 255

train_images_with_noise_channels = np.concatenate(
[train_images, np.random.random((len(train_images), 784))], axis=1)

train_images_with_zeros_channels = np.concatenate(
[train_images, np.zeros((len(train_images), 784))], axis=1)

Training the same model on MNIST data with noise channels or all-zero channels
from tensorflow import keras
from tensorflow.keras import layers

def get_model():
model = keras.Sequential([
layers.Dense(512, activation="relu"),
layers.Dense(10, activation="softmax")
])
model.compile(optimizer="rmsprop",
loss="sparse_categorical_crossentropy",
metrics=["accuracy"])
return model

model = get_model()
history_noise = model.fit(
train_images_with_noise_channels, train_labels,
epochs=10,
batch_size=128,
validation_split=0.2)

model = get_model()
history_zeros = model.fit(
train_images_with_zeros_channels, train_labels,
epochs=10,
batch_size=128,
validation_split=0.2)

Plotting a validation accuracy comparison

import matplotlib.pyplot as plt
val_acc_noise = history_noise.history["val_accuracy"]
val_acc_zeros = history_zeros.history["val_accuracy"]
epochs = range(1, 11)
plt.plot(epochs, val_acc_noise, "b-",
label="Validation accuracy with noise channels")
plt.plot(epochs, val_acc_zeros, "b--",
label="Validation accuracy with zeros channels")
plt.title("Effect of noise channels on validation accuracy")
plt.xlabel("Epochs")
plt.ylabel("Accuracy")
plt.legend()

The nature of generalization in deep learning

Fitting a MNIST model with randomly shuffled labels
(train_images, train_labels), _ = mnist.load_data()
train_images = train_images.reshape((60000, 28 * 28))
train_images = train_images.astype("float32") / 255

random_train_labels = train_labels[:]
np.random.shuffle(random_train_labels)

model = keras.Sequential([
layers.Dense(512, activation="relu"),
layers.Dense(10, activation="softmax")
])
model.compile(optimizer="rmsprop",
loss="sparse_categorical_crossentropy",
metrics=["accuracy"])
model.fit(train_images, random_train_labels,
epochs=100,
batch_size=128,
validation_split=0.2)

The manifold hypothesis

Interpolation as a source of generalization

Why deep learning works

Training data is paramount

Evaluating machine-learning models

Training, validation, and test sets

Simple hold-out validation

K-fold validation

Iterated K-fold validation with shuffling

Beating a common-sense baseline

Things to keep in mind about model evaluation

Improving model fit

Tuning key gradient descent parameters
Training a MNIST model with an incorrectly high learning rate
(train_images, train_labels), _ = mnist.load_data()
train_images = train_images.reshape((60000, 28 * 28))
train_images = train_images.astype("float32") / 255

model = keras.Sequential([
layers.Dense(512, activation="relu"),
layers.Dense(10, activation="softmax")
])
model.compile(optimizer=keras.optimizers.RMSprop(1.),
loss="sparse_categorical_crossentropy",
metrics=["accuracy"])
model.fit(train_images, train_labels,
epochs=10,
batch_size=128,
validation_split=0.2)

The same model with a more appropriate learning rate

model = keras.Sequential([
layers.Dense(512, activation="relu"),
layers.Dense(10, activation="softmax")
])
model.compile(optimizer=keras.optimizers.RMSprop(1e-2),
loss="sparse_categorical_crossentropy",
metrics=["accuracy"])
model.fit(train_images, train_labels,
epochs=10,
batch_size=128,
validation_split=0.2)

Leveraging better architecture priors

Increasing model capacity

A simple logistic regression on MNIST
model = keras.Sequential([layers.Dense(10, activation="softmax")])
model.compile(optimizer="rmsprop",
loss="sparse_categorical_crossentropy",
metrics=["accuracy"])
history_small_model = model.fit(
train_images, train_labels,
epochs=20,
batch_size=128,
validation_split=0.2)

import matplotlib.pyplot as plt

val_loss = history_small_model.history["val_loss"]
epochs = range(1, 21)
plt.plot(epochs, val_loss, "b--",
label="Validation loss")
plt.title("Effect of insufficient model capacity on validation loss")
plt.xlabel("Epochs")
plt.ylabel("Loss")
plt.legend()

model = keras.Sequential([
layers.Dense(96, activation="relu"),
layers.Dense(96, activation="relu"),
layers.Dense(10, activation="softmax"),
])
model.compile(optimizer="rmsprop",
loss="sparse_categorical_crossentropy",
metrics=["accuracy"])
history_large_model = model.fit(
train_images, train_labels,
epochs=20,
batch_size=128,
validation_split=0.2)
Improving generalization
Dataset curation

Feature engineering

Using early stopping

Regularizing your model

Reducing the network's size

Original model
from tensorflow.keras.datasets import imdb
(train_data, train_labels), _ = imdb.load_data(num_words=10000)

def vectorize_sequences(sequences, dimension=10000):

results = np.zeros((len(sequences), dimension))
for i, sequence in enumerate(sequences):
results[i, sequence] = 1.
return results
train_data = vectorize_sequences(train_data)

model = keras.Sequential([
layers.Dense(16, activation="relu"),
layers.Dense(16, activation="relu"),
layers.Dense(1, activation="sigmoid")
])
model.compile(optimizer="rmsprop",
loss="binary_crossentropy",
metrics=["accuracy"])
history_original = model.fit(train_data, train_labels,
epochs=20, batch_size=512, validation_split=0.4)

Version of the model with lower capacity

model = keras.Sequential([
layers.Dense(4, activation="relu"),
layers.Dense(4, activation="relu"),
layers.Dense(1, activation="sigmoid")
])
model.compile(optimizer="rmsprop",
loss="binary_crossentropy",
metrics=["accuracy"])
history_smaller_model = model.fit(
train_data, train_labels,
epochs=20, batch_size=512, validation_split=0.4)

Version of the model with higher capacity

model = keras.Sequential([
layers.Dense(512, activation="relu"),
layers.Dense(512, activation="relu"),
layers.Dense(1, activation="sigmoid")
])
model.compile(optimizer="rmsprop",
loss="binary_crossentropy",
metrics=["accuracy"])
history_larger_model = model.fit(
train_data, train_labels,
epochs=20, batch_size=512, validation_split=0.4)

Adding weight regularization

Adding L2 weight regularization to the model
from tensorflow.keras import regularizers
model = keras.Sequential([
layers.Dense(16,
kernel_regularizer=regularizers.l2(0.002),
activation="relu"),
layers.Dense(16,
kernel_regularizer=regularizers.l2(0.002),
activation="relu"),
layers.Dense(1, activation="sigmoid")
])
model.compile(optimizer="rmsprop",
loss="binary_crossentropy",
metrics=["accuracy"])
history_l2_reg = model.fit(
train_data, train_labels,
epochs=20, batch_size=512, validation_split=0.4)

Different weight regularizers available in Keras

from tensorflow.keras import regularizers
regularizers.l1(0.001)
regularizers.l1_l2(l1=0.001, l2=0.001)

Adding dropout
Adding dropout to the IMDB model
model = keras.Sequential([
layers.Dense(16, activation="relu"),
layers.Dropout(0.5),
layers.Dense(16, activation="relu"),
layers.Dropout(0.5),
layers.Dense(1, activation="sigmoid")
])
model.compile(optimizer="rmsprop",
loss="binary_crossentropy",
metrics=["accuracy"])
history_dropout = model.fit(
train_data, train_labels,
epochs=20, batch_size=512, validation_split=0.4)

Summary

DLV Lab Manual Print
No ratings yet
DLV Lab Manual Print
29 pages
Applied Machine Learning For Engineers: Artificial Neural Networks
0% (1)
Applied Machine Learning For Engineers: Artificial Neural Networks
6 pages
Design A Neural Network For Classifying Movie Reviews
No ratings yet
Design A Neural Network For Classifying Movie Reviews
5 pages
C1W3 Assignment
No ratings yet
C1W3 Assignment
7 pages
Deep Learning Practical File
No ratings yet
Deep Learning Practical File
36 pages
Formula and Notes For Class 11 Maths Download PDF Chapter 15. Statistics
No ratings yet
Formula and Notes For Class 11 Maths Download PDF Chapter 15. Statistics
16 pages
DL 22Q71A4206
No ratings yet
DL 22Q71A4206
65 pages
Labpractice 2
100% (2)
Labpractice 2
29 pages
Lab
No ratings yet
Lab
12 pages
HW4ML Project Code
No ratings yet
HW4ML Project Code
24 pages
Hand Written
No ratings yet
Hand Written
13 pages
IMDB - Colaboratory
No ratings yet
IMDB - Colaboratory
10 pages
Stress Level Detection
No ratings yet
Stress Level Detection
10 pages
MNIST Classification Using CNN
No ratings yet
MNIST Classification Using CNN
5 pages
CNN Train Mnist
No ratings yet
CNN Train Mnist
3 pages
LAB03
No ratings yet
LAB03
8 pages
CNN Ise
No ratings yet
CNN Ise
5 pages
Program 5
No ratings yet
Program 5
3 pages
01 249212 012 10129792044 11122022 112910pm
No ratings yet
01 249212 012 10129792044 11122022 112910pm
8 pages
DL Record Merged
No ratings yet
DL Record Merged
113 pages
Real-Mode Memory Addressing
No ratings yet
Real-Mode Memory Addressing
20 pages
Explore The Implementation of CNNs in Python
No ratings yet
Explore The Implementation of CNNs in Python
10 pages
EXP4 Regulizars
No ratings yet
EXP4 Regulizars
8 pages
Dlweek 6
No ratings yet
Dlweek 6
4 pages
Mathematical Preliminary and Optimization Theory
No ratings yet
Mathematical Preliminary and Optimization Theory
21 pages
AIML Lab Ex 2
No ratings yet
AIML Lab Ex 2
4 pages
DL Lab Manual
100% (1)
DL Lab Manual
35 pages
Lab Manual
No ratings yet
Lab Manual
45 pages
DL2 - Jupyter Notebook
No ratings yet
DL2 - Jupyter Notebook
5 pages
AI Lab 12 Lab Tasks - 39
No ratings yet
AI Lab 12 Lab Tasks - 39
12 pages
VGG16 Estudo
No ratings yet
VGG16 Estudo
10 pages
Assignment No 2
No ratings yet
Assignment No 2
3 pages
Assignment 2.4.1 Multiclass Classification
No ratings yet
Assignment 2.4.1 Multiclass Classification
5 pages
Unit - I CHP - 5
No ratings yet
Unit - I CHP - 5
26 pages
Import Libraries
No ratings yet
Import Libraries
4 pages
DL 5 Excuted
No ratings yet
DL 5 Excuted
13 pages
DL Exp-6 16010422230
No ratings yet
DL Exp-6 16010422230
8 pages
DL Practical 3
No ratings yet
DL Practical 3
5 pages
1-GAN Mnist - Ipynb - Colab
No ratings yet
1-GAN Mnist - Ipynb - Colab
4 pages
DL Internal
No ratings yet
DL Internal
12 pages
MLP 40522 97.11%
No ratings yet
MLP 40522 97.11%
12 pages
DL Lab 7 Excuted
No ratings yet
DL Lab 7 Excuted
4 pages
DL Practical
No ratings yet
DL Practical
23 pages
Final Code
No ratings yet
Final Code
16 pages
Compression Test em 327: Mechanics of Materials Laboratory: Objectives
88% (8)
Compression Test em 327: Mechanics of Materials Laboratory: Objectives
5 pages
General Education Final Report
No ratings yet
General Education Final Report
34 pages
Deep Learning Experiments
No ratings yet
Deep Learning Experiments
42 pages
Statistics Using Stata An Integrative Approach: Weinberg and Abramowitz 2016
No ratings yet
Statistics Using Stata An Integrative Approach: Weinberg and Abramowitz 2016
46 pages
Practical 2: Amtics Enrollment No: 202203103510493
No ratings yet
Practical 2: Amtics Enrollment No: 202203103510493
6 pages
Deep Learning
No ratings yet
Deep Learning
30 pages
Deep Learning
No ratings yet
Deep Learning
46 pages
Exp. No.: I. Aim: AIML634P Neural Network Lab 2262034
No ratings yet
Exp. No.: I. Aim: AIML634P Neural Network Lab 2262034
6 pages
Deep Learning Lab With Tensorflow
No ratings yet
Deep Learning Lab With Tensorflow
84 pages
Chapter04 - Getting Started With Neural Networks
No ratings yet
Chapter04 - Getting Started With Neural Networks
9 pages
8086 Sys
No ratings yet
8086 Sys
5 pages
Assignment 2 DL
No ratings yet
Assignment 2 DL
10 pages
Deep Learning Programs Updated
No ratings yet
Deep Learning Programs Updated
24 pages
DL LAB MANUAL Mugesh
No ratings yet
DL LAB MANUAL Mugesh
12 pages
Historiography of Mental Symptoms and Diseases
No ratings yet
Historiography of Mental Symptoms and Diseases
16 pages
Assignment 2
No ratings yet
Assignment 2
3 pages
Ancova 2
No ratings yet
Ancova 2
8 pages
Multi Layer Perceptron Tf2 Code Description
No ratings yet
Multi Layer Perceptron Tf2 Code Description
10 pages
Case Study - AP23322130042
No ratings yet
Case Study - AP23322130042
7 pages
Nndlmac
No ratings yet
Nndlmac
9 pages
Final Project Documentation
No ratings yet
Final Project Documentation
53 pages
DL Lab1
No ratings yet
DL Lab1
15 pages
Quality Control (QC) Process Quality Control
No ratings yet
Quality Control (QC) Process Quality Control
2 pages
Lesson 3 Measures of Central Tendency
No ratings yet
Lesson 3 Measures of Central Tendency
6 pages
Letter: Machine-Learning-Assisted Materials Discovery Using Failed Experiments
No ratings yet
Letter: Machine-Learning-Assisted Materials Discovery Using Failed Experiments
5 pages
Introduction To Keras!: Vincent Lepetit!
No ratings yet
Introduction To Keras!: Vincent Lepetit!
33 pages
Aligood Terjemahan Bagian 6
No ratings yet
Aligood Terjemahan Bagian 6
21 pages
Untitled Presentation
No ratings yet
Untitled Presentation
20 pages
Statistics - Probability - Finding The Mean and Variance
No ratings yet
Statistics - Probability - Finding The Mean and Variance
39 pages
Jurnal Rehab Medik-Riki Keiya
No ratings yet
Jurnal Rehab Medik-Riki Keiya
12 pages
Lecture Note 7-8
No ratings yet
Lecture Note 7-8
9 pages
Data Science: A Comprehensive Overview: General and Reference
No ratings yet
Data Science: A Comprehensive Overview: General and Reference
42 pages
Neonatal ICU Monitoring: Lena Hellstro M-Westas, Linda S. de Vries and Ingmar Rose N
No ratings yet
Neonatal ICU Monitoring: Lena Hellstro M-Westas, Linda S. de Vries and Ingmar Rose N
16 pages
Neural DEEP
No ratings yet
Neural DEEP
39 pages
Workshop On SEM Intro NRMS
No ratings yet
Workshop On SEM Intro NRMS
29 pages
10 1 1 1013 689 PDF
No ratings yet
10 1 1 1013 689 PDF
12 pages
Comparing Ordinary Kriging Interpolation Variance and Indicator Kriging Conditional Variance For Assessing Uncertainties at Unsampled Locations
No ratings yet
Comparing Ordinary Kriging Interpolation Variance and Indicator Kriging Conditional Variance For Assessing Uncertainties at Unsampled Locations
5 pages
Eapp 2ND QTR Week 3.1
No ratings yet
Eapp 2ND QTR Week 3.1
8 pages
Psyc870 Reference Assignment
No ratings yet
Psyc870 Reference Assignment
19 pages
Practice For Chapter 1
No ratings yet
Practice For Chapter 1
4 pages
MCO-3 ENG-D16 Compressed
No ratings yet
MCO-3 ENG-D16 Compressed
2 pages
Al Manja Hie 2020
No ratings yet
Al Manja Hie 2020
15 pages
MATH3004 Industrial Project Semester 2 2018 Bentley Campus INT
No ratings yet
MATH3004 Industrial Project Semester 2 2018 Bentley Campus INT
9 pages
Logistic Regression in Machine Learning
No ratings yet
Logistic Regression in Machine Learning
3 pages
2SLS Notes
No ratings yet
2SLS Notes
44 pages
Individual Assignment Fundamental of Biostatistics
No ratings yet
Individual Assignment Fundamental of Biostatistics
2 pages
Elementary Statisctics Reviewer
No ratings yet
Elementary Statisctics Reviewer
5 pages
Unit 2 ML
No ratings yet
Unit 2 ML
14 pages
NNDL Lab Record
No ratings yet
NNDL Lab Record
26 pages
Profound Python Data Science
From Everand
Profound Python Data Science
Onder Teker
No ratings yet