0% found this document useful (0 votes)

11 views6 pages

Week1 Numpy, Pandas (178) .Ipynb Colab

Uploaded by

motikikavya.21.it

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

11 views6 pages

Week1 Numpy, Pandas (178) .Ipynb Colab

Uploaded by

motikikavya.21.it

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 6

7/3/24, 9:28 PM Week1-Numpy,pandas(178).

ipynb - Colab

from google.colab import files

uploaded = files.upload()

Choose Files Airline Dataset.csv

Airline Dataset.csv(text/csv) - 12540770 bytes, last modified: 6/3/2024 - 100% done
Saving Airline Dataset.csv to Airline Dataset.csv

import numpy as np

import numpy as np
arr = np.array([1, 2, 3, 4, 5])
print(arr)

[1 2 3 4 5]

import numpy as np
arr = np.array((1, 2, 3, 4, 5))
print(arr)

[1 2 3 4 5]

import numpy as np
arr = np.array(42)
print(arr) # 0-D array

import numpy as np
arr = np.array([1, 2, 3, 4, 5])
print(arr) #1-D

[1 2 3 4 5]

import numpy as np
arr = np.array([[1, 2, 3], [4, 5, 6]])
print(arr) #2-D

[[1 2 3]
[4 5 6]]

import numpy as np
arr = np.array([1, 2, 3, 4])
print(arr[2] + arr[3]) #Indexing

import numpy as np
data = [1, 2, 3, 4, 5]
mean_value = np.mean(data)
print("Mean value:", mean_value) # np.mean():Compute the arithmetic mean along the specified axia.

https://colab.research.google.com/drive/1qwaH1GyJBP9YIkz6cQk4o_FZZunCeHhO#scrollTo=cG2TGH6DPEjK&printMode=true 1/6
7/3/24, 9:28 PM Week1-Numpy,pandas(178).ipynb - Colab

Mean value: 3.0

import numpy as np
data = [1, 2,np.nan, 4, 5, np.nan, 7]
median = np.nanmedian(data)
print("The median, ignoring NaN values, is:", median)
# np.nanmean():Compute the median of an array ignoring any NaN values

The median, ignoring NaN values, is: 4.0

import numpy as np
data = [1, 2, 3, 4, 5]
std = np.std(data)
print("Standard Deviation value:", std) #np.std():Compute standard deviation along the specified axis.

Standard Deviation value: 1.4142135623730951

import numpy as np
data = [1, 2, 3, 4, 5]
var = np.var(data)
print("Variance value:", var)

Variance value: 2.0

import numpy as np
data = [1, 2, 2, 3, 4, 4, 4, 5, 5, 6]
unique_elements = np.unique(data)
print("Unique elements in the data are:", unique_elements)
#np.unique():Find unique elements in array

Unique elements in the data are: [1 2 3 4 5 6]

import pandas as pd

import pandas as pd
data=pd.read_csv('Airline Dataset.csv') #read_csv():read our csv file

import pandas as pd
data=pd.read_csv('Airline Dataset.csv')
data.head(5) #data.head():returns first 5rows

https://colab.research.google.com/drive/1qwaH1GyJBP9YIkz6cQk4o_FZZunCeHhO#scrollTo=cG2TGH6DPEjK&printMode=true 2/6
7/3/24, 9:28 PM Week1-Numpy,pandas(178).ipynb - Colab

Airport
Passenger First Last Airport Country Airport Departure Arrival
Gender Age Nationality Country Continents
ID Name Name Name Name Continent Date Airport
Code

Coldfoot United North

0 10856 Edithe Leggis Female 62 Japan US NAM 6/28/2022 CXF
Airport States America

Kugluktuk North
1 43872 Elwood Catt Male 62 Nicaragua CA Canada NAM 12/26/2022 YCO
Airport America

Grenoble-
2 42633 Darby Felgate Male 67 Russia Isère FR France EU Europe 1/18/2022 GNB
Airport

Ottawa /
North
3 78493 Dominica Pyle Female 71 China Gatineau CA Canada NAM 9/16/2022 YND
America
Airport

Next steps: Generate code with data

toggle_off View recommended plots

import pandas as pd
data=pd.read_csv('Airline Dataset.csv')
data.describe() #Generate descriptive statistics(excluding NaN values)

https://colab.research.google.com/drive/1qwaH1GyJBP9YIkz6cQk4o_FZZunCeHhO#scrollTo=cG2TGH6DPEjK&printMode=true 3/6
7/3/24, 9:28 PM Week1-Numpy,pandas(178).ipynb - Colab

1 to 8 of 8 entries Filter
index Passenger ID Age
count 98619.0 98619.0
mean 55168.68952230301 45.50402052342855
std 25985.44369560229 25.92984855207266
min 10000.0 1.0
25% 32608.0 23.0
50% 55338.0 46.0
75% 77695.0 68.0
max 99999.0 90.0
Show 25 per page

Like what you see? Visit the data table notebook to learn more about interactive tables.

Distributions

2-d distributions

Values

import pandas as pd
data=pd.read_csv('Airline Dataset.csv')
data.shape #Provides dimensions of the dataset.

(98619, 15)

import pandas as pd
data = {
'Category': ['A', 'B', 'A', 'C', 'B', 'A', 'A', 'C', 'C', 'C', 'B', 'A']
}
df = pd.DataFrame(data)
print("Sample DataFrame:")
print(df)
value_counts = df['Category'].value_counts()

https://colab.research.google.com/drive/1qwaH1GyJBP9YIkz6cQk4o_FZZunCeHhO#scrollTo=cG2TGH6DPEjK&printMode=true 4/6
7/3/24, 9:28 PM Week1-Numpy,pandas(178).ipynb - Colab
print("\nValue counts for the 'Category' column:")
print(value_counts) #Index.value_counts(): returns object containing counts of unique values in descending order.

Sample DataFrame:
Category
0 A
1 B
2 A
3 C
4 B
5 A
6 A
7 C
8 C
9 C
10 B
11 A

Value counts for the 'Category' column:

Category
A 5
C 4
B 3
Name: count, dtype: int64

import pandas as pd
data = {
'Name': ['Alice', 'Bob', 'Charlie', 'Dave', 'Eve'],
'Age': [25, None, 35, None, 28],
'City': ['New York', 'Los Angeles', None, 'Chicago', 'Boston']
}
df = pd.DataFrame(data)
print("Original DataFrame:")
print(df) #display original df
df_cleaned = df.dropna() #df.dropna():Remove missing values
print("\nDataFrame after dropping rows with missing values:")
print(df_cleaned)
df_cleaned_columns = df.dropna(axis=1) #Drop columns with any missing values (NaN)
print("\nDataFrame after dropping columns with missing values:")
print(df_cleaned_columns)

Original DataFrame:
Name Age City
0 Alice 25.0 New York
1 Bob NaN Los Angeles
2 Charlie 35.0 None
3 Dave NaN Chicago
4 Eve 28.0 Boston

DataFrame after dropping rows with missing values:

Name Age City
0 Alice 25.0 New York
4 Eve 28.0 Boston

DataFrame after dropping columns with missing values:

Name
0 Alice
1 Bob

https://colab.research.google.com/drive/1qwaH1GyJBP9YIkz6cQk4o_FZZunCeHhO#scrollTo=cG2TGH6DPEjK&printMode=true 5/6
7/3/24, 9:28 PM Week1-Numpy,pandas(178).ipynb - Colab
2 Charlie
3 Dave
4 Eve

import pandas as pd
data = {

https://colab.research.google.com/drive/1qwaH1GyJBP9YIkz6cQk4o_FZZunCeHhO#scrollTo=cG2TGH6DPEjK&printMode=true 6/6

AI Practical 2025
No ratings yet
AI Practical 2025
14 pages
Assessing Affective Learning Outcomes
50% (2)
Assessing Affective Learning Outcomes
45 pages
12 Information Practices Text Book Preeti Arora
No ratings yet
12 Information Practices Text Book Preeti Arora
45 pages
Sarthak Python
No ratings yet
Sarthak Python
6 pages
Cheat Sheet: The Pandas Dataframe Object: Preliminaries Get Your Data Into A Dataframe
100% (1)
Cheat Sheet: The Pandas Dataframe Object: Preliminaries Get Your Data Into A Dataframe
12 pages
Pandas Practicals - Term-1
100% (1)
Pandas Practicals - Term-1
18 pages
Johanson Cointegration Test and ECM
100% (7)
Johanson Cointegration Test and ECM
7 pages
ARS122 Engine Spare Part Catalogue PDF
100% (2)
ARS122 Engine Spare Part Catalogue PDF
134 pages
Pandas DataFrame Notes
No ratings yet
Pandas DataFrame Notes
13 pages
3rd Semester DDM AI DAA DEV Print Pages For Spiral Record 25-1-24 - Removed
No ratings yet
3rd Semester DDM AI DAA DEV Print Pages For Spiral Record 25-1-24 - Removed
28 pages
3.4 Diaphragm Wall
No ratings yet
3.4 Diaphragm Wall
16 pages
Class 1 - 2024 Business Analytics
No ratings yet
Class 1 - 2024 Business Analytics
8 pages
Assignments IP Class 12
No ratings yet
Assignments IP Class 12
9 pages
Creation of Series Using List, Dictionary & Ndarray
No ratings yet
Creation of Series Using List, Dictionary & Ndarray
65 pages
Day 4 Data Manipulation With Pandas
No ratings yet
Day 4 Data Manipulation With Pandas
4 pages
Dataframe
No ratings yet
Dataframe
19 pages
Ip File
No ratings yet
Ip File
66 pages
Practical 1
No ratings yet
Practical 1
65 pages
PYTHON PROGRAMMING: Data Handling
No ratings yet
PYTHON PROGRAMMING: Data Handling
12 pages
Unit 1 Python Pandas
No ratings yet
Unit 1 Python Pandas
20 pages
Data Cleaning
No ratings yet
Data Cleaning
13 pages
12 Pandas
No ratings yet
12 Pandas
9 pages
Pandas - Ipynb - Colab
No ratings yet
Pandas - Ipynb - Colab
22 pages
DV Lab Manual Modified
No ratings yet
DV Lab Manual Modified
31 pages
IP Practical
No ratings yet
IP Practical
28 pages
Data Mining Lab 03
No ratings yet
Data Mining Lab 03
10 pages
Exp3 Python
No ratings yet
Exp3 Python
15 pages
Create A Pandas Series From A Dictionary of Values and An Ndarray
No ratings yet
Create A Pandas Series From A Dictionary of Values and An Ndarray
15 pages
Practical File
No ratings yet
Practical File
19 pages
L32, 33 Pandas
No ratings yet
L32, 33 Pandas
7 pages
FDS Record-1-4
No ratings yet
FDS Record-1-4
18 pages
ML Lab Manual Final
No ratings yet
ML Lab Manual Final
36 pages
Numpy Dataframe
No ratings yet
Numpy Dataframe
12 pages
Dealing With Missing Values
No ratings yet
Dealing With Missing Values
19 pages
Exercise 7 - Pandas
No ratings yet
Exercise 7 - Pandas
2 pages
Data Analysis Tools
No ratings yet
Data Analysis Tools
26 pages
Loading Pandas
No ratings yet
Loading Pandas
23 pages
Pandas
No ratings yet
Pandas
5 pages
Practical File Questions With Answers
No ratings yet
Practical File Questions With Answers
7 pages
Ge Sem II Dav Upc 2344001201 Sl. No. Qp. 2012 July 2023
No ratings yet
Ge Sem II Dav Upc 2344001201 Sl. No. Qp. 2012 July 2023
16 pages
Data Science Practical Book - Ipynb
No ratings yet
Data Science Practical Book - Ipynb
21 pages
Dmdw-Lab Manual
No ratings yet
Dmdw-Lab Manual
61 pages
Pandas
No ratings yet
Pandas
27 pages
PW2 DataCleaning
No ratings yet
PW2 DataCleaning
6 pages
Unit3 - 3) Pandas - Ipynb - Colab
No ratings yet
Unit3 - 3) Pandas - Ipynb - Colab
11 pages
DXE 24gksmknvj
No ratings yet
DXE 24gksmknvj
16 pages
Exp - 1 - Introduction To Data Analytics and Python Fundamentals - SDK - Ok
No ratings yet
Exp - 1 - Introduction To Data Analytics and Python Fundamentals - SDK - Ok
9 pages
Experiment 1 Solution
No ratings yet
Experiment 1 Solution
5 pages
DP Prog
No ratings yet
DP Prog
10 pages
IP Practic MINE
No ratings yet
IP Practic MINE
30 pages
Sowmi DS
No ratings yet
Sowmi DS
27 pages
DAV Practicle File
No ratings yet
DAV Practicle File
28 pages
UNIT-4 Important Q-A
No ratings yet
UNIT-4 Important Q-A
28 pages
Term 1 IP AK
No ratings yet
Term 1 IP AK
6 pages
Cheat Sheet - Pandas
No ratings yet
Cheat Sheet - Pandas
12 pages
Numpy Boolean Indexing: Filter
No ratings yet
Numpy Boolean Indexing: Filter
39 pages
VLSI STA Interview Guide
No ratings yet
VLSI STA Interview Guide
5 pages
DSC Lab Programs
No ratings yet
DSC Lab Programs
24 pages
Data Analysis 6060
No ratings yet
Data Analysis 6060
6 pages
DA Lab
No ratings yet
DA Lab
27 pages
Even Students
No ratings yet
Even Students
36 pages
NumPy and Pandas Step
No ratings yet
NumPy and Pandas Step
9 pages
RESEARCH PLAN. Energy Harvesting Through Piezoelectric Generator Installed To Footwear.
No ratings yet
RESEARCH PLAN. Energy Harvesting Through Piezoelectric Generator Installed To Footwear.
10 pages
City Sci Yb2019
No ratings yet
City Sci Yb2019
19 pages
RCW - Eng
No ratings yet
RCW - Eng
77 pages
Dev Lab Record
No ratings yet
Dev Lab Record
21 pages
Oddstudents
No ratings yet
Oddstudents
35 pages
16 Passage 2 - Computer Provides More Questions Than Answers Q14-26
No ratings yet
16 Passage 2 - Computer Provides More Questions Than Answers Q14-26
6 pages
Sol Review Scientific Investigation
No ratings yet
Sol Review Scientific Investigation
34 pages
Term Paper On Chile
100% (1)
Term Paper On Chile
4 pages
Shift Registors
No ratings yet
Shift Registors
7 pages
Analisis Perubahan Faktor Keamanan Lereng Akibat Hujan: (Analysis of Changes Safety Factor of Slope Due To Rainfall)
No ratings yet
Analisis Perubahan Faktor Keamanan Lereng Akibat Hujan: (Analysis of Changes Safety Factor of Slope Due To Rainfall)
8 pages
Busi BOSCH Retail
No ratings yet
Busi BOSCH Retail
1 page
General Ledger Conversion Document - Workday Community
No ratings yet
General Ledger Conversion Document - Workday Community
7 pages
Private Placement Memorandum Manager
No ratings yet
Private Placement Memorandum Manager
4 pages
PROB STAT.4photo
No ratings yet
PROB STAT.4photo
11 pages
Vocab Words Economist
No ratings yet
Vocab Words Economist
38 pages
Spin Coherent State Through Path Integral & Semi-Classical Physics
No ratings yet
Spin Coherent State Through Path Integral & Semi-Classical Physics
44 pages
MAF11 Revision Question Sem 1 2019 Final Exam
No ratings yet
MAF11 Revision Question Sem 1 2019 Final Exam
2 pages
Resource Persons: Chief Patron Patron Chairman Convenor Co-Convenors
No ratings yet
Resource Persons: Chief Patron Patron Chairman Convenor Co-Convenors
2 pages
Business Model Evolution-Nnzvdw
No ratings yet
Business Model Evolution-Nnzvdw
23 pages
Intended VS Implemented VS Achieved
No ratings yet
Intended VS Implemented VS Achieved
9 pages
10 Things High Performing Leaders Never Do
No ratings yet
10 Things High Performing Leaders Never Do
12 pages
Mesin Skala Industri
No ratings yet
Mesin Skala Industri
2 pages
209-Article Text-803-1-10-20220211
No ratings yet
209-Article Text-803-1-10-20220211
12 pages
Formatting Tags Available in ArcMap
No ratings yet
Formatting Tags Available in ArcMap
11 pages
Imiforce 200 SC
No ratings yet
Imiforce 200 SC
5 pages
Pradeep Kumar Kadela: Educator
No ratings yet
Pradeep Kumar Kadela: Educator
2 pages
IT Cheat Sheet
No ratings yet
IT Cheat Sheet
2 pages
The Foundry NukeX 7 for Compositors
From Everand
The Foundry NukeX 7 for Compositors
Prof. Sham Tickoo
No ratings yet

Week1 Numpy, Pandas (178) .Ipynb Colab

Uploaded by

Week1 Numpy, Pandas (178) .Ipynb Colab

Uploaded by

7/3/24, 9:28 PM Week1-Numpy,pandas(178).

from google.colab import files

Choose Files Airline Dataset.csv

Mean value: 3.0

The median, ignoring NaN values, is: 4.0

Standard Deviation value: 1.4142135623730951

Variance value: 2.0

Unique elements in the data are: [1 2 3 4 5 6]

Coldfoot United North

Next steps: Generate code with data

Value counts for the 'Category' column:

DataFrame after dropping rows with missing values:

DataFrame after dropping columns with missing values:

You might also like