Building An Effective Data Science Practice: A Framework To Bootstrap and Manage A Successful Data Science Practice Vineet Raina Instant Download
Building An Effective Data Science Practice: A Framework To Bootstrap and Manage A Successful Data Science Practice Vineet Raina Instant Download
https://ebookmeta.com/product/building-an-effective-data-science-
practice-a-framework-to-bootstrap-and-manage-a-successful-data-
science-practice-vineet-raina/
https://ebookmeta.com/product/effective-data-science-
infrastructure-how-to-make-data-scientists-productive-1st-
edition-ville-tuulos/
https://ebookmeta.com/product/fundamentals-of-data-science-
theory-and-practice-1st-edition-jugal-k-kalita/
https://ebookmeta.com/product/new-labor-in-new-york-precarious-
workers-and-the-future-of-the-labor-movement-1st-edition-ruth-
milkman-editor-edward-ott-editor/
Mastering DALK A Video Textbook on Deep Anterior
Lamellar Keratoplasty 1st Edition Soosan Jacob
https://ebookmeta.com/product/mastering-dalk-a-video-textbook-on-
deep-anterior-lamellar-keratoplasty-1st-edition-soosan-jacob/
https://ebookmeta.com/product/selling-hard-lessons-learned-12th-
edition-alec-burlakoff/
https://ebookmeta.com/product/unesco-biosphere-reserves-
supporting-biocultural-diversity-sustainability-and-society-1st-
edition-maureen-gail-reed/
https://ebookmeta.com/product/practice-pearls-in-neurology-
series-ii-1st-edition-bhanu-kesavamurthy-d-vasudevan-a-v-
srinivasan/
https://ebookmeta.com/product/hope-isn-t-stupid-utopian-affects-
in-contemporary-american-literature-1st-edition-sean-austin-
grattan/
The Theory of Idle Resources William H Hutt
https://ebookmeta.com/product/the-theory-of-idle-resources-
william-h-hutt/
Building an
Effective Data
Science Practice
A Framework to Bootstrap and
Manage a Successful Data Science
Practice
—
Vineet Raina
Srinath Krishnamurthy
Building an Effective
Data Science Practice
A Framework to Bootstrap
and Manage a Successful Data
Science Practice
Vineet Raina
Srinath Krishnamurthy
Building an Effective Data Science Practice: A Framework to Bootstrap
and Manage a Successful Data Science Practice
Part I: Fundamentals�������������������������������������������������������������������1
Chapter 1: Introduction: The Data Science Process������������������������������3
What We Mean by Data Science���������������������������������������������������������������������������4
The Data Science Process������������������������������������������������������������������������������������6
Machine Learning��������������������������������������������������������������������������������������������8
Data Capture (from the World )������������������������������������������������������������������������9
Data Preparation��������������������������������������������������������������������������������������������12
Data Visualization������������������������������������������������������������������������������������������13
Inference�������������������������������������������������������������������������������������������������������14
Data Engineering�������������������������������������������������������������������������������������������15
Terminology Chaos: AI, ML, Data Science, Deep Learning, Etc.���������������������������15
Conclusion����������������������������������������������������������������������������������������������������������20
Further Reading��������������������������������������������������������������������������������������������������21
References����������������������������������������������������������������������������������������������������������21
iii
Table of Contents
iv
Table of Contents
Chapter 5: Regression������������������������������������������������������������������������57
Data Capture�������������������������������������������������������������������������������������������������������58
Data Preparation�������������������������������������������������������������������������������������������������59
Data Visualization������������������������������������������������������������������������������������������������60
Machine Learning�����������������������������������������������������������������������������������������������61
Inference�������������������������������������������������������������������������������������������������������������62
Conclusion����������������������������������������������������������������������������������������������������������62
v
Table of Contents
Chapter 7: Clustering��������������������������������������������������������������������������75
Data Capture�������������������������������������������������������������������������������������������������������76
Data Preparation�������������������������������������������������������������������������������������������������78
Handling Missing Values��������������������������������������������������������������������������������78
Normalization������������������������������������������������������������������������������������������������79
Data Visualization������������������������������������������������������������������������������������������������79
Machine Learning�����������������������������������������������������������������������������������������������80
Similarity of Observations�����������������������������������������������������������������������������81
Data Visualization Iteration����������������������������������������������������������������������������84
Inference�������������������������������������������������������������������������������������������������������������86
Interpreting the Dendrogram�������������������������������������������������������������������������86
Actionable Insights for Marketing�����������������������������������������������������������������88
Conclusion����������������������������������������������������������������������������������������������������������89
Further Reading��������������������������������������������������������������������������������������������������89
Reference������������������������������������������������������������������������������������������������������������89
vi
Table of Contents
Complex Anomalies�������������������������������������������������������������������������������������������108
Collective Anomalies�����������������������������������������������������������������������������������108
Contextual Anomalies����������������������������������������������������������������������������������109
Conclusion��������������������������������������������������������������������������������������������������������111
Further Reading������������������������������������������������������������������������������������������������112
References��������������������������������������������������������������������������������������������������������112
Chapter 9: Recommendations����������������������������������������������������������113
Data Capture�����������������������������������������������������������������������������������������������������114
Items and Interactions���������������������������������������������������������������������������������114
Quantifying an Interaction���������������������������������������������������������������������������114
Example Data����������������������������������������������������������������������������������������������115
Data Preparation�����������������������������������������������������������������������������������������������116
Normalization����������������������������������������������������������������������������������������������117
Handling Missing Values������������������������������������������������������������������������������118
Data Visualization����������������������������������������������������������������������������������������������118
Machine Learning���������������������������������������������������������������������������������������������119
Clustering-Based Approach�������������������������������������������������������������������������119
Inference�����������������������������������������������������������������������������������������������������������120
End-to-End Automation�������������������������������������������������������������������������������������121
Conclusion��������������������������������������������������������������������������������������������������������122
Further Reading������������������������������������������������������������������������������������������������122
References��������������������������������������������������������������������������������������������������������123
vii
Table of Contents
Processing Videos���������������������������������������������������������������������������������������������129
Video Classification�������������������������������������������������������������������������������������130
Object Tracking��������������������������������������������������������������������������������������������130
Data Science Process for Computer Vision�������������������������������������������������������131
The World and Data Capture������������������������������������������������������������������������131
Data Preparation������������������������������������������������������������������������������������������132
Data Visualization����������������������������������������������������������������������������������������134
Machine Learning����������������������������������������������������������������������������������������134
Inference�����������������������������������������������������������������������������������������������������136
Data Engineering�����������������������������������������������������������������������������������������137
Conclusion��������������������������������������������������������������������������������������������������������138
Further Reading������������������������������������������������������������������������������������������������138
References��������������������������������������������������������������������������������������������������������139
viii
Table of Contents
ix
Table of Contents
Transforming Images����������������������������������������������������������������������������������������182
Libraries and Tools��������������������������������������������������������������������������������������������184
Libraries������������������������������������������������������������������������������������������������������184
Tools������������������������������������������������������������������������������������������������������������184
Data Engineering�����������������������������������������������������������������������������������������������185
Conclusion��������������������������������������������������������������������������������������������������������185
x
Table of Contents
Logistic Regression�������������������������������������������������������������������������������������214
Support Vector Machine������������������������������������������������������������������������������220
Decision Tree�����������������������������������������������������������������������������������������������225
Random Forest��������������������������������������������������������������������������������������������232
Gradient Boosted Trees��������������������������������������������������������������������������������234
Artificial Neural Network�����������������������������������������������������������������������������238
Convolutional Neural Network���������������������������������������������������������������������247
Evaluating and Tuning Models��������������������������������������������������������������������������249
Evaluating Models���������������������������������������������������������������������������������������249
Tuning models���������������������������������������������������������������������������������������������252
Cross-Validation������������������������������������������������������������������������������������������253
Libraries and Tools��������������������������������������������������������������������������������������������255
Data Engineering�����������������������������������������������������������������������������������������������255
Conclusion��������������������������������������������������������������������������������������������������������256
Further Reading������������������������������������������������������������������������������������������������256
References��������������������������������������������������������������������������������������������������������256
xi
Table of Contents
xii
Table of Contents
xiii
Table of Contents
Data Scientist����������������������������������������������������������������������������������������������313
Chief Data Scientist�������������������������������������������������������������������������������������313
Deviations in Skills��������������������������������������������������������������������������������������������314
Conclusion��������������������������������������������������������������������������������������������������������314
xiv
Other documents randomly have
different content
—— Edgecumbe, Esq;
Rev. Mr Edgley
Rev. Dr Edmundson, President of St. John’s Coll. Cambridge
Arthur Edwards, Esq;
Thomas Edwards, Esq;
Vigerus Edwards, Esq;
Capt. Arthur Edwards
Mr Edwards
Mr William Elderton
Mrs Elizabeth Elgar
Sir Gilbert Eliot, of Minto, Bart. one of the Lords of Session
Mr John Elliot, Merchant
George Ellis, of Barbadoes, Esq;
Mr John Ellison, of Sheffield
Sir Richard Ellys, Bart.
Library of Emanuel College, Cambridge
Francis Emerson, Gent.
Thomas Emmerson, Esq;
Mr Henry Emmet
Mr John Emmet
Thomas Empson, of the Middle-Temple, Esq;
Mr Thomas Engeir
Mr Robert England
Mr Nathaniel English
Rev. Mr Ensly, Minister of the Scotch Church in Rotterdam
John Essington, Esq;
Rev. Mr Charles Este, of Christ-Church, Oxon
Mr Hugh Ethersey, Apothecary
Henry Evans, of Surry, Esq;
Isaac Ewer, Esq;
Mr Charles Ewer
Rev. Mr Richard Exton
Sir John Eyles, Bar.
Sir Joseph Eyles
Right Hon. Sir Robert Eyre, Lord Chief Justice of the Common Pleas.
Edward Eyre, Esq;
Henry Samuel Eyre, Esq;
Kingsmill Eyre, Esq;
Mr Eyre
H.
K
His Grace the Duke of Kingston
Right Honourable Gerrard, Lord Viscount Kingsale
Right Reverend Lord Bishop of Killale
Rt. Rev. Lord Bishop of Killdare
Right Reverend Lord Bishop of Killmore
Rev. Mr William Kay, Rector of Wigginton, Yorkshire
Benjamin Keene, Esq;
Hon. Major General Kellum
Mr Thomas Kemp, M. A of St. John’s College, Oxon
Mr Robert Kendall
Mr Clayton Kendrick
John Kendrick, Esq;
John Kemp, of the Middle Temple, Esq;
Mr Chidrock Kent
Samuel Kent, Esq;
Rev Mr Samuel Kerrick, Fellow of Christ Church College,
Cambridge.
Mr Kidbey
Mr Robert Kidd
Library of King’s College, Cambridge
Benjamin King, of Antigua, Esq;
Mr Matthias King
Mrs Jane King
Hon. Colonel Pearcy Kirke
Mr Thomas Knap
Rev. Samuel Knight, D. D. Prebendary of Ely
Mr Robert Knight, jun.
Francis Knowllyes, Esq;
Mr Ralph Knox
M.