0% found this document useful (0 votes)

17 views22 pages

Data Analytics Using Python

The document provides an overview of Python's applications in data analytics and artificial intelligence, highlighting its ease of use and versatility for tasks ranging from data preprocessing to machine learning and natural language processing. It discusses various Python libraries such as NumPy, Pandas, and Scikit-learn, which facilitate data manipulation, analysis, and visualization. Additionally, it outlines specific projects and applications that can be developed using Python in fields like healthcare, finance, and social media.

Uploaded by

aditi31.kapil

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PPTX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

17 views22 pages

Data Analytics Using Python

Uploaded by

aditi31.kapil

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PPTX, PDF, TXT or read online on Scribd

You are on page 1/ 22

Data

Analytics
Using
Python
ELC Activity
Thapar Institute of Engineering and
Technology
By:
Dr. Aditi Sharma
Assistant Professor
Python

A High-level Programming Language, as well as a scripting

language

Python is an easy language to learn because of its simple

syntax

It can be used for simple tasks as well as complex tasks

like machine learning

Different data types available: primitive, string, list, tuple,

set, dictionary.
Applications of Python for AI
Data Preprocessing: Python libraries like Pandas and NumPy are widely used for cleaning,
transforming, and preprocessing raw data into a suitable format for machine learning models.

Machine Learning Libraries: Python offers powerful machine learning libraries such as
scikit-learn, TensorFlow, and PyTorch. Scikit-learn provides simple and efficient tools for data
mining and data analysis, while TensorFlow and PyTorch are deep learning frameworks that
allow users to build and train complex neural network models.
Natural Language Processing (NLP): Python's NLTK (Natural Language Toolkit) and spaCy
libraries are extensively used for processing and analyzing human language data. These
libraries are crucial for applications like sentiment analysis, language translation, and
chatbots.

Computer Vision: Libraries like OpenCV and Dlib are widely used for computer vision tasks
such as image and video analysis, facial recognition, object detection, and image segmentation.
Applications of Python for AI
Reinforcement Learning: Python is often used in reinforcement learning
applications, and libraries like OpenAI Gym provide environments for
developing and testing reinforcement learning algorithms.

Big Data Processing: Python can be integrated with big data processing
frameworks such as Apache Hadoop and Apache Spark for large-scale
machine learning tasks on big datasets.

Web Development and APIs: Python frameworks like Flask and Django
are used to deploy machine learning models as web applications or APIs,
allowing easy integration of machine learning functionalities into web
services.
Applications of Python for AI
Automated Machine Learning (AutoML): Python has several AutoML libraries
like TPOT and Auto-sklearn that automate the process of selecting the best machine
learning model and hyperparameters for a given dataset, making it easier for non-
experts to work on machine learning projects.

Data Visualization: Libraries like Matplotlib, Seaborn, and Plotly enable data
visualization, helping data scientists and researchers to understand complex
patterns and relationships in data, which is crucial for feature selection and model
evaluation.

Predictive Analytics: Python is used for building predictive models in various

domains such as finance, healthcare, marketing, and sales, helping businesses make
data-driven decisions.
Python Libraries

Numpy Pandas Scipy

Scikit- Matplot Seabor

Learn lib n
Numpy

NumPy is a powerful library in Python used for numerical computing.

Provides support for large, multi-dimensional arrays and matrices,

along with a collection of high-level mathematical functions to operate
on these arrays.
NumPy is a fundamental package for scientific computing in Python
and is widely used in various fields such as physics, engineering, data
science, and machine learning.
Arrays: Multidimensional homogenous array of fixed size is provided
in Numpy.
• import numpy as np
• # Creating a 1D array
• a = np.array([1, 2, 3, 4, 5])
• # Creating a 2D array
• b = np.array([[1, 2, 3], [4, 5, 6]])
Numpy • # Element-wise operations
• a = np.array([1, 2, 3])
• b = np.array([4, 5, 6])
• c = a + b # [5, 7, 9]
Numpy Functions

Shape and Dimesions

Indexing and Slicing
Universal Function
Linear Algebra
Scientific Computing
Pandas

Pandas is a popular open-source data analysis and manipulation

library for Python.

It provides easy-to-use data structures such as Series and

DataFrame, along with data analysis tools for cleaning,
transforming, and analyzing structured data.

Pandas is widely used in data science, machine learning, and

finance for handling and analyzing data efficiently.
Series & DataFrame
A Series is a one-dimensional labeled array that can hold any data
type. It is like a column in a DataFrame or a single attribute of an
object.
# Creating a Series
s = pd.Series([1, 3, 5, 6, 8])

A DataFrame is a two-dimensional labeled data structure with

columns that can be of different data types. It is similar to a
spreadsheet or SQL table or a dictionary of Series objects. You
can think of it like a table in a relational database or an Excel
spreadsheet.
• import pandas as pd

• # Creating a DataFrame from a

dictionary

DataFram • data = {'Name': ['Alice', 'Bob',

'Charlie'],
e • 'Age': [25, 30, 35],
• 'City': ['New York', 'London',
'Paris']}

• df = pd.DataFrame(data)
• data = {'state': ['Ohio', 'Ohio', 'Ohio',
'Nevada', 'Nevada'],
DataFram • 'year': [2000, 2001, 2002, 2001, 2002],

e •
•
'pop': [1.5, 1.7, 3.6, 2.4, 2.9]}
frame = DataFrame(data)
DataFrame can be treated as
an ordered collection of • print(frame)
columns: Each column can be state year pop
a different data type and Have
both row and column indices. 0 Ohio 2000 1.5
1 Ohio 2001 1.7
2 Ohio 2002 3.6
3 Nevada 2001 2.4
4 Nevada 2002 2.9
A column in a DataFrame can be retrieved as a
Series by dict-like notation or as attribute
• data = {'state': ['Ohio', 'Ohio', 'Ohio', 'Nevada', 'Nevada'],
•

DataFram
'year': [2000, 2001, 2002, 2001, 2002],
• 'pop': [1.5, 1.7, 3.6, 2.4, 2.9]}
• frame = DataFrame(data)

e–
• print(frame['state’])
0 Ohio
1 Ohio

Retrievin 2
3
4
Ohio
Nevada
Nevada

ga •
Name: state, dtype: object
print(frame.state)

Column
0 Ohio
1 Ohio
2 Ohio
3 Nevada
4 Nevada
Name: state, dtype: object
• data = {'state': ['Ohio', 'Ohio', 'Ohio', 'Nevada', 'Nevada'],
• 'year': [2000, 2001, 2002, 2001, 2002],
• 'pop': [1.5, 1.7, 3.6, 2.4, 2.9]}
• frame2 = DataFrame(data, columns=['year', 'state', 'pop', 'debt'], index=['A', 'B', 'C',
'D', 'E'])
• print(frame2.loc[['A', 'B']])
• print(frame2)

DataFram year state pop debt

A 2000
B 2001
Ohio 1.5 NaN
Ohio 1.7 NaN
year state pop debt
A 2000 Ohio 1.5 NaN
B 2001 Ohio 1.7 NaN

e–
• print(frame2.loc['A':'E',['state','pop']])
C 2002 Ohio 3.6 NaN
state pop
D 2001 Nevada 2.4 NaN
A Ohio 1.5
E 2002 Nevada 2.9 NaN

Fetching
B Ohio 1.7
• print(frame2.loc['A’])
C Ohio 3.6
year 2000
D Nevada 2.4
state Ohio

Rows
E Nevada 2.9
pop 1.5
• print(frame2.iloc[:,1:3])
debt NaN state pop
Name: A, dtype: object A Ohio 1.5
• print(frame2.iloc[1:3]) B Ohio 1.7
year state pop debt C Ohio 3.6
B 2001 Ohio 1.7 NaN D Nevada 2.4
C 2002 Ohio 3.6 NaN E Nevada 2.9
• frame2['debt'] = 0
• print(frame2)
year state pop debt
A 2000 Ohio 1.5 0
B 2001 Ohio 1.7 0
C 2002 Ohio 3.6 0
D 2001 Nevada 2.4 0

DataFram
E 2002 Nevada 2.9 0

• frame2['debt'] = range(5)
• print(frame2)

e–
year state pop debt
A 2000 Ohio 1.5 0
B 2001 Ohio 1.7 1
C 2002 Ohio 3.6 2

Modifying •
D 2001 Nevada 2.4
E 2002 Nevada 2.9
3
4

val = Series([10, 10, 10], index = ['A', 'C', 'D'])

Columns
• frame2['debt'] = val
• print(frame2)
year state pop debt
A 2000 Ohio 1.5 10.0
B 2001 Ohio 1.7 NaN
C 2002 Ohio 3.6 10.0
D 2001 Nevada 2.4 10.0
E 2002 Nevada 2.9 NaN

• Rows or individual elements can be modified similarly.

Using loc or iloc.
DataFram • del frame2['debt']
• print(frame2)

e– A
year
2000
state pop
Ohio 1.5
B 2001 Ohio 1.7
Removing C
D
2002
2001
Ohio 3.6
Nevada 2.4
Columns E 2002 Nevada 2.9
• data = pd.read_csv('data.csv')
Data • data.to_csv('output.csv',
index=False)
Reading/ • pd.read_excel(‘myfile.xlsx’,sheet
Writing _name=‘sheet1’,
Pandas provides functions index_col=None,
to read data from various
na_values=[‘NA’])
file formats like CSV,
Excel, SQL databases, and • pd.read_sata(‘myfile.dta’)
output data to these
formats. • pd.read_sas(‘myfile.sas7bdat’)
• pd.read_hdf(‘myfile.h5’, ‘df’)
Pandas provides functions for
handling missing data, dropping
unnecessary columns, filling missing
values, and performing other data
cleaning tasks.
Data # Handling missing data
Cleaning
and
Preprocessi df.dropna() # Drop rows with
missing values
ng

df.fillna(value=0) # Fill missing

values with 0
Projects

Automated Social
Fraud Healthcar
Machine Media
Detection e
Learning Analytics

Voice Customer Automated

Recognitio Segmentat Machine
n ion Learning
Projects

Text Handwritte Object

Emotion
Summariza n Data Identificati
Analysis
tion Recognition on

Game
Sentiment Recommen
Developme
Analysis der System
nt
Thank You

Pandas Basics
No ratings yet
Pandas Basics
84 pages
HTML Css Js Revision
No ratings yet
HTML Css Js Revision
11 pages
Python Pandas
No ratings yet
Python Pandas
96 pages
Data Science With Python - Lesson 07 - Data Manipulation With Python - Pandas
No ratings yet
Data Science With Python - Lesson 07 - Data Manipulation With Python - Pandas
72 pages
04 Introduction To Python-1
No ratings yet
04 Introduction To Python-1
29 pages
Python For Data Analysis
No ratings yet
Python For Data Analysis
96 pages
Pierian Data - Python For Finance & Algorithmic Trading Course Notes
No ratings yet
Pierian Data - Python For Finance & Algorithmic Trading Course Notes
11 pages
Pandas
No ratings yet
Pandas
36 pages
12 SM Ip
No ratings yet
12 SM Ip
180 pages
Python Data Frame New
No ratings yet
Python Data Frame New
32 pages
Pandas Dataframe Export The CSV File
No ratings yet
Pandas Dataframe Export The CSV File
9 pages
Chapter 5 - Data Exploration and Visualization With
No ratings yet
Chapter 5 - Data Exploration and Visualization With
39 pages
Unit 04 Pandas
No ratings yet
Unit 04 Pandas
46 pages
Unit6 - Working With Data
No ratings yet
Unit6 - Working With Data
29 pages
On Data Handling Using Pandas-I
100% (2)
On Data Handling Using Pandas-I
63 pages
Lecture 3 - Pandas
No ratings yet
Lecture 3 - Pandas
37 pages
More On Pandas
No ratings yet
More On Pandas
51 pages
Starting Out With Pandas - Ext
No ratings yet
Starting Out With Pandas - Ext
18 pages
Class XII IP Key Points (Python Pandas)
No ratings yet
Class XII IP Key Points (Python Pandas)
5 pages
FDS Module 2 Notes
No ratings yet
FDS Module 2 Notes
24 pages
Unit 4
No ratings yet
Unit 4
36 pages
Interchange Fifth Edition Presentation Plus - User Guide
No ratings yet
Interchange Fifth Edition Presentation Plus - User Guide
18 pages
All Document Reader 1715619870900
No ratings yet
All Document Reader 1715619870900
6 pages
Edu 426 Special Education 426
No ratings yet
Edu 426 Special Education 426
139 pages
05getting Started With Pandas
No ratings yet
05getting Started With Pandas
44 pages
Transition To SAP S/4HANA 20Q1: Run Realize Deploy Explore Prepare Discover
No ratings yet
Transition To SAP S/4HANA 20Q1: Run Realize Deploy Explore Prepare Discover
5 pages
UNIT - 3 Pandas
No ratings yet
UNIT - 3 Pandas
21 pages
Pandas
No ratings yet
Pandas
12 pages
ML File Updated
No ratings yet
ML File Updated
60 pages
Weight Indicator/Transmitter Mini 11-100P/F: Operating and Service Manual
No ratings yet
Weight Indicator/Transmitter Mini 11-100P/F: Operating and Service Manual
34 pages
Meaning and Importance of Data
100% (1)
Meaning and Importance of Data
7 pages
Ii Unit Pandas
No ratings yet
Ii Unit Pandas
30 pages
Introduction To Pandas For Data Analysis
No ratings yet
Introduction To Pandas For Data Analysis
6 pages
Pandas - Digitalocean
No ratings yet
Pandas - Digitalocean
15 pages
Barkatullah University Online Migration Form
67% (6)
Barkatullah University Online Migration Form
34 pages
Class 6 Pandas
No ratings yet
Class 6 Pandas
13 pages
Cli Commands For ASA
No ratings yet
Cli Commands For ASA
26 pages
Undergraduate Engineering Program
No ratings yet
Undergraduate Engineering Program
26 pages
Unit 5
No ratings yet
Unit 5
27 pages
Pandas
No ratings yet
Pandas
25 pages
The Pandas Library
No ratings yet
The Pandas Library
39 pages
Python Pandas
No ratings yet
Python Pandas
13 pages
Python Pandas
No ratings yet
Python Pandas
21 pages
Unit 3 (FODS)
No ratings yet
Unit 3 (FODS)
34 pages
Pandas
No ratings yet
Pandas
25 pages
Se Unit-1
No ratings yet
Se Unit-1
37 pages
Singleton Pattern
No ratings yet
Singleton Pattern
22 pages
Lecture Notes 5
No ratings yet
Lecture Notes 5
11 pages
Abbey Road Studio 3: User Guide
No ratings yet
Abbey Road Studio 3: User Guide
21 pages
Pandas PDF
No ratings yet
Pandas PDF
25 pages
Chapter2 Malware Part1
No ratings yet
Chapter2 Malware Part1
44 pages
Crashes
No ratings yet
Crashes
2 pages
Instructions For Filling Online Application Form-3 Year
No ratings yet
Instructions For Filling Online Application Form-3 Year
10 pages
18 Pandas
No ratings yet
18 Pandas
33 pages
Decrypt Stored Procedures
No ratings yet
Decrypt Stored Procedures
7 pages
Pandas, Numpy, Matplotlib
No ratings yet
Pandas, Numpy, Matplotlib
11 pages
Unit 5 PythonPackages (Numpy, Pandas, Tkinter)
No ratings yet
Unit 5 PythonPackages (Numpy, Pandas, Tkinter)
68 pages
Cs Learning Journal Unit 6
No ratings yet
Cs Learning Journal Unit 6
4 pages
Prototyping Methods
No ratings yet
Prototyping Methods
9 pages
Tugas Minggu Ke 2
No ratings yet
Tugas Minggu Ke 2
9 pages
Class Notes Dicd
No ratings yet
Class Notes Dicd
39 pages
Catalog English EXTREME Networks
No ratings yet
Catalog English EXTREME Networks
15 pages
Fos Cleaning Materials and Procedures Activity
100% (1)
Fos Cleaning Materials and Procedures Activity
2 pages
Pandas
No ratings yet
Pandas
63 pages
Lab-3 Pandas Library
No ratings yet
Lab-3 Pandas Library
14 pages
Practical 7
No ratings yet
Practical 7
8 pages
DevOps Session 3 Pandas
No ratings yet
DevOps Session 3 Pandas
33 pages
Unit 04 Pandas
No ratings yet
Unit 04 Pandas
46 pages
B13N Eng V2
No ratings yet
B13N Eng V2
66 pages
Mettler Toledo B520 Manual
No ratings yet
Mettler Toledo B520 Manual
2 pages
MM UNIT 2 Material
No ratings yet
MM UNIT 2 Material
102 pages
Xii CS Syntax and Examples
No ratings yet
Xii CS Syntax and Examples
4 pages
Class Xii Information Practices PPT On Data Handling Using Pandas-I
No ratings yet
Class Xii Information Practices PPT On Data Handling Using Pandas-I
64 pages
Capstonefinalpdf
No ratings yet
Capstonefinalpdf
15 pages
Module 6
No ratings yet
Module 6
48 pages
Unit 2 DL
No ratings yet
Unit 2 DL
43 pages
Pandas Shan Ver2
No ratings yet
Pandas Shan Ver2
25 pages
Ip Study
No ratings yet
Ip Study
18 pages
04 Getting Started With Pandas
No ratings yet
04 Getting Started With Pandas
85 pages
Python Pandas
No ratings yet
Python Pandas
2 pages
Data Structures Unit 01
No ratings yet
Data Structures Unit 01
55 pages
NumPy and Pandas
No ratings yet
NumPy and Pandas
12 pages
Wa0005.
No ratings yet
Wa0005.
29 pages
UNIT II Notes
No ratings yet
UNIT II Notes
23 pages
Pandas
No ratings yet
Pandas
13 pages
Week 4.1
No ratings yet
Week 4.1
16 pages
DAP 3 Module
No ratings yet
DAP 3 Module
62 pages
Unit V Pandas AIML A B Lastupdated 18-06-2024
No ratings yet
Unit V Pandas AIML A B Lastupdated 18-06-2024
33 pages
Data Handling Using Pandas-1
No ratings yet
Data Handling Using Pandas-1
60 pages
程序员学数据结构: Chinese Edition
From Everand
程序员学数据结构: Chinese Edition
Posts & Telecom Press
No ratings yet

Data Analytics Using Python

Uploaded by

Data Analytics Using Python

Uploaded by

Data

A High-level Programming Language, as well as a scripting

Python is an easy language to learn because of its simple

It can be used for simple tasks as well as complex tasks

Different data types available: primitive, string, list, tuple,

Predictive Analytics: Python is used for building predictive models in various

Numpy Pandas Scipy

Scikit- Matplot Seabor

NumPy is a powerful library in Python used for numerical computing.

Provides support for large, multi-dimensional arrays and matrices,

Shape and Dimesions

Pandas is a popular open-source data analysis and manipulation

It provides easy-to-use data structures such as Series and

Pandas is widely used in data science, machine learning, and

A DataFrame is a two-dimensional labeled data structure with

• # Creating a DataFrame from a

DataFram • data = {'Name': ['Alice', 'Bob',

DataFram year state pop debt

val = Series([10, 10, 10], index = ['A', 'C', 'D'])

• Rows or individual elements can be modified similarly.

df.fillna(value=0) # Fill missing

Voice Customer Automated

Text Handwritte Object

You might also like