Chiru Internship

Uploaded by

chirusaikokkirala

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PPTX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

5 views14 pages

Chiru Internship

Uploaded by

chirusaikokkirala

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PPTX, PDF, TXT or read online on Scribd

You are on page 1/ 14

DATA SCIENCE

Presented By:
K.Chiru Sai
23555A4404
CSE(DS)
GIER
Lecture Details:
DATA SCIENCE
Internship using skilldzire platform
Contents
 Introduction to Data Science
 Python
 Numpy
 Pandas
 Matplotlib
 SQL
 Machine Learning
 Linear Regression
 Logistic Regression
Data Science

Data science is an interdisciplinary field that

employs scientific methods, procedures, algorithms, and
systems to derive knowledge and insights from structured
and unstructured information. It combines subject expertise,
programming abilities, and mathematical and statistical
understanding to interpret data for decision-making .
Python
 Python is a high-level, object-oriented
programming language that is interpreted
and has dynamic semantics.
 Python's concise, easy-to-learn syntax
emphasises readability, which saves
programme maintenance costs.
 Python has modules and packages, which
promote programme modularity and code
reuse.
Python

Python is used in data science to analyse

data, generate statistical models, develop machine
learning algorithms, visualise data for insights, and
effectively manage enormous datasets. It's adaptable,
simple to learn, and works well with other tools,
making it suitable for everything from data cleansing
to complex analytics.
NumPy
NumPy, or Numerical Python, is
a core Python package for manipulating and
computing huge arrays and matrices. It
provides a strong interface for array-oriented
computing, allowing for operations such as
mathematical, logical, shape manipulation,
sorting, choosing, I/O operations, discrete
Fourier transforms, basic linear algebra, basic
statistical operations, random simulation, and
many others.
Pandas

 Pandas is an open-source Python library that offers

high-performance, user-friendly data structures and

data analysis capabilities.

 Pandas excels in handling tabular data, with

extensive indexing, slicing, merging, reshaping, and

aggregation tools.

 Pandas interfaces smoothly with other libraries like

as NumPy, which improves its numerical computing

and data handling capabilities.

Matplotlib
Matplotlib is a sophisticated
Python charting toolkit that produces high-
quality graphs, figures, and plots. It
provides a diverse set of charting tools for
visualizing data, ranging from simple line
charts to complicated heat maps and 3D
plots. Matplotlib offers fine-grained control
over plot aesthetics and supports a variety of
output formats.
Structured Query Language (SQL)

 SQL (Structured Query Language) is the standard language for managing and manipulating data in
relational database management systems (RDBMS).
 It is declarative, focusing on specifying what data to retrieve or manipulate rather than the specifics
of how to do it.
 Key commands include SELECT for retrieving data, INSERT for adding new records, UPDATE for
modifying existing records, and DELETE for removing records.
Structured Query Language (SQL)

 SQL supports various data types like INTEGER, VARCHAR, and DATE, and enables powerful
operations such as joins to combine data from different tables based on related columns,
aggregations for calculating values across rows, and constraints to ensure data integrity.
 Adhering to best practices like using meaningful names and formatting queries for readability
enhances its effectiveness in database management and application development.
Machine Learning
• Machine learning is a branch of
artificial intelligence that includes creating
algorithms that can learn from data and make
predictions or judgments based on that
information. It focuses on developing models
that can learn and grow on their own, rather than
relying on explicit instructions. Machine
learning applications range from predictive
analytics to natural language processing,
computer vision, and autonomous systems.
Regression
 Linear regression is a statistical approach for
determining the connection between a dependent
variable and one or more independent variables. It
aids in predicting how the dependent variable will
change when the independent factors shift.
 Multiple linear regression is a kind of linear
regression that uses multiple independent
variables to predict a dependent variable. It
investigates how a dependent variable changes
when two or more independent variables are
modified concurrently.
Logistic Regression
 Logistic regression is a statistical model that
predicts the likelihood of a binary result (often
coded as 0 or 1) using one or more predictor
variables.
 Logistic regression is frequently utilized in
many sectors, including healthcare (forecasting
illness presence), marketing (predicting client
behavior), and finance (predicting loan defaults),
where understanding and predicting binary
outcomes is crucial.
THANK YOU

Ocs353dsf Unit Wise Notes
100% (2)
Ocs353dsf Unit Wise Notes
121 pages
OCS353 - Data Science Manual-FULL
No ratings yet
OCS353 - Data Science Manual-FULL
64 pages
Sap R/3 Basis Training User & Authorization
No ratings yet
Sap R/3 Basis Training User & Authorization
79 pages
Instruction-Level Parallelism (ILP), Since The
100% (1)
Instruction-Level Parallelism (ILP), Since The
57 pages
Statistics and Machine Learning in Python
No ratings yet
Statistics and Machine Learning in Python
218 pages
StatisticsMachineLearningPythonDraft PDF
100% (1)
StatisticsMachineLearningPythonDraft PDF
219 pages
Data Science I: Charles C.N. Wang
No ratings yet
Data Science I: Charles C.N. Wang
68 pages
Rakshitha.M - 1BO17EC031
No ratings yet
Rakshitha.M - 1BO17EC031
26 pages
Data Science: by Neha Tyagi
100% (1)
Data Science: by Neha Tyagi
17 pages
New Ebook Guide To AI Data Science
No ratings yet
New Ebook Guide To AI Data Science
50 pages
Data Structures: 5. Class Templates
No ratings yet
Data Structures: 5. Class Templates
24 pages
Uniprocessor Scheduling: 1.1 Types of Processor Scheduling
No ratings yet
Uniprocessor Scheduling: 1.1 Types of Processor Scheduling
12 pages
Time Delay in PIC
100% (2)
Time Delay in PIC
2 pages
Report File
No ratings yet
Report File
40 pages
Data Analytics PDF
0% (1)
Data Analytics PDF
6 pages
Big Data Analytics: Snapshot of Class Lab and Data Camp Course
No ratings yet
Big Data Analytics: Snapshot of Class Lab and Data Camp Course
38 pages
C++ Slides - 6: File Handling: Formatted I/O, Hierarchy of File Stream Classes, Opening
No ratings yet
C++ Slides - 6: File Handling: Formatted I/O, Hierarchy of File Stream Classes, Opening
26 pages
Python Libraries Seminar Report
100% (2)
Python Libraries Seminar Report
16 pages
Python
No ratings yet
Python
23 pages
Advance Data Science Clusters
No ratings yet
Advance Data Science Clusters
10 pages
Data Science With Python Updated Brochure
No ratings yet
Data Science With Python Updated Brochure
13 pages
Cheat Sheet EE 2310 Trtyest 2
No ratings yet
Cheat Sheet EE 2310 Trtyest 2
3 pages
A Distributed Service Oriented Architecture For Business Process Execution
No ratings yet
A Distributed Service Oriented Architecture For Business Process Execution
31 pages
Python For Data Science
No ratings yet
Python For Data Science
8 pages
DP - Report of Inventory Managment System
No ratings yet
DP - Report of Inventory Managment System
7 pages
CS3361 Data Science Lab Manual
No ratings yet
CS3361 Data Science Lab Manual
82 pages
Test Code Mytap Mysql Dan Jawaban Mahasiswa
No ratings yet
Test Code Mytap Mysql Dan Jawaban Mahasiswa
17 pages
Data Science Lab Manual
No ratings yet
Data Science Lab Manual
74 pages
Plant Disease Identification Using A Novel Convolutional Neural Network
No ratings yet
Plant Disease Identification Using A Novel Convolutional Neural Network
44 pages
New Ebook Guide To AI & Data Science
No ratings yet
New Ebook Guide To AI & Data Science
175 pages
Unit2 PDS
No ratings yet
Unit2 PDS
17 pages
Data Science With Python
No ratings yet
Data Science With Python
4 pages
Vibhin Pro
No ratings yet
Vibhin Pro
36 pages
World University of Bangladesh: Assignment
No ratings yet
World University of Bangladesh: Assignment
6 pages
Lesson1 Introduction To The Data Science Process and The Value of Learning Data Science
No ratings yet
Lesson1 Introduction To The Data Science Process and The Value of Learning Data Science
6 pages
178 hw1
No ratings yet
178 hw1
4 pages
Colour Functions in Excel
No ratings yet
Colour Functions in Excel
7 pages
Comp 111 - Syllabus
No ratings yet
Comp 111 - Syllabus
6 pages
AI - ML Curriculum Powered by IBM - Pregrad
No ratings yet
AI - ML Curriculum Powered by IBM - Pregrad
31 pages
F
No ratings yet
F
101 pages
Samuel Haile: Washington, D.C., United States (267) 934-0203 In/bloomberg
No ratings yet
Samuel Haile: Washington, D.C., United States (267) 934-0203 In/bloomberg
2 pages
Applied Data Science With Python-N
No ratings yet
Applied Data Science With Python-N
17 pages
Q1. What Is The Difference Between An Option Button and A Check Box Control? Ans. Option Button
No ratings yet
Q1. What Is The Difference Between An Option Button and A Check Box Control? Ans. Option Button
4 pages
Daa Unit 2
No ratings yet
Daa Unit 2
12 pages
Unit-Iv Awt Notes
No ratings yet
Unit-Iv Awt Notes
50 pages
Introduction-It Skills
No ratings yet
Introduction-It Skills
20 pages
Unit 1 FUNDAMENTALS OF DATA SCIENCE-1
No ratings yet
Unit 1 FUNDAMENTALS OF DATA SCIENCE-1
27 pages
C Multiple Choice Questions and Answers PDF
100% (1)
C Multiple Choice Questions and Answers PDF
2 pages
Python For Data Science
No ratings yet
Python For Data Science
20 pages
Data Science
No ratings yet
Data Science
17 pages
PYTHON
No ratings yet
PYTHON
11 pages
Solution Lab6
No ratings yet
Solution Lab6
6 pages
AI & Data Science
No ratings yet
AI & Data Science
152 pages
Presentation 2
No ratings yet
Presentation 2
9 pages
Using Server Result Cache
No ratings yet
Using Server Result Cache
15 pages
E-Content - DBMS - Unit - 1
No ratings yet
E-Content - DBMS - Unit - 1
18 pages
AIML-Curriculum by Pregrad
No ratings yet
AIML-Curriculum by Pregrad
33 pages
Suraj Report File
No ratings yet
Suraj Report File
17 pages
PG Program Dsba
No ratings yet
PG Program Dsba
28 pages
Python Lab Record
No ratings yet
Python Lab Record
81 pages
Data Science Lecture 5 6th Semster
No ratings yet
Data Science Lecture 5 6th Semster
3 pages
TY FDS Workbook
No ratings yet
TY FDS Workbook
56 pages
Introduction To Data Science
No ratings yet
Introduction To Data Science
25 pages
AI ML June 4 2022
No ratings yet
AI ML June 4 2022
40 pages
Python For Data Analysis
No ratings yet
Python For Data Analysis
49 pages
Tool and Lib in Data Science
No ratings yet
Tool and Lib in Data Science
32 pages
Data Science
No ratings yet
Data Science
42 pages
Report Print
No ratings yet
Report Print
22 pages
213j1a05h6 Data Science Cse-F
No ratings yet
213j1a05h6 Data Science Cse-F
25 pages
Group
No ratings yet
Group
43 pages
Intro To DS Assignmnt 1 (Amna Iqbal) ....
No ratings yet
Intro To DS Assignmnt 1 (Amna Iqbal) ....
4 pages
Syllabus v1
No ratings yet
Syllabus v1
10 pages
Data Analytics Curriculum
No ratings yet
Data Analytics Curriculum
8 pages
Acds&ai 2024
No ratings yet
Acds&ai 2024
19 pages
Advanced Bash Shell Scripting Guide - Reference Cards
No ratings yet
Advanced Bash Shell Scripting Guide - Reference Cards
5 pages
SystemVerilog Veriflcation
No ratings yet
SystemVerilog Veriflcation
184 pages
Data Analytics in Python (Johar) SP2022
No ratings yet
Data Analytics in Python (Johar) SP2022
4 pages
AIML Curriculum Powered by IBM - Pregrad-Merged
No ratings yet
AIML Curriculum Powered by IBM - Pregrad-Merged
66 pages
Data Science Lab
No ratings yet
Data Science Lab
61 pages
Syllabus
No ratings yet
Syllabus
7 pages
Capstone Project Rinshana
No ratings yet
Capstone Project Rinshana
17 pages
Data Science Using Python - Introduction
No ratings yet
Data Science Using Python - Introduction
6 pages
Data Science Lectureflow
No ratings yet
Data Science Lectureflow
10 pages
Wa0005.
No ratings yet
Wa0005.
29 pages
Explain Variable Manipulation in PHP
No ratings yet
Explain Variable Manipulation in PHP
3 pages
Nac PDF
No ratings yet
Nac PDF
23 pages
Klein B. Data Analysis With Python. Numpy, Matplotlib and Pandas 2021
No ratings yet
Klein B. Data Analysis With Python. Numpy, Matplotlib and Pandas 2021
515 pages
DS Unit 1 - NUMPY
No ratings yet
DS Unit 1 - NUMPY
29 pages
Practical Holistics for Data Analysts: Definitive Reference for Developers and Engineers
From Everand
Practical Holistics for Data Analysts: Definitive Reference for Developers and Engineers
Richard Johnson
No ratings yet
Data Scientist Roadmap
From Everand
Data Scientist Roadmap
Mohammed Ahmed
5/5 (1)

Chiru Internship

Uploaded by

Chiru Internship

Uploaded by

DATA SCIENCE

Data science is an interdisciplinary field that

Python is used in data science to analyse

 Pandas is an open-source Python library that offers

high-performance, user-friendly data structures and

data analysis capabilities.

 Pandas excels in handling tabular data, with

extensive indexing, slicing, merging, reshaping, and

 Pandas interfaces smoothly with other libraries like

as NumPy, which improves its numerical computing

and data handling capabilities.

You might also like