0% found this document useful (0 votes)

7 views5 pages

Fds Assigns

The document contains multiple assignments related to data analysis and visualization using Python libraries such as NumPy, Pandas, and Matplotlib. It includes tasks like generating random data, creating various plots (line, scatter, histogram, box plot, pie chart, and bar chart), handling missing values, and performing data preprocessing techniques like normalization and one-hot encoding. Additionally, it covers basic DataFrame operations, including reading CSV files, data description, and handling duplicates and null values.

Uploaded by

psb18039

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

7 views5 pages

Fds Assigns

Uploaded by

psb18039

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

You are on page 1/ 5

Assign 4

Set A

1]import numpy as np
random_data = np.random.randint(1, 100, size=50)
print(random_data)

import matplotlib.pyplot as plt

plt.figure(figsize=(10,6))
plt.plot(random_data, color='blue')
plt.title('Line Chart of Random Integers')
plt.xlabel('Index')
plt.ylabel('Value')
plt.grid()
plt.show()

plt.figure(figsize=(10,6))
plt.scatter(range(50), random_data, color='red')
plt.title('Scatter plot of random integers')
plt.xlabel('index')
plt.ylabel('value')
plt.grid()
plt.show()

plt.subplot(2,2,3)
plt.hist(random_data, bins=10, color='g', edgecolor='blue')
plt.title('Histogram')
plt.xlabel('Value')
plt.ylabel('Frequency')

plt.subplot(2,2,4)
plt.boxplot(random_data, patch_artist=True, boxprops=dict(facecolor='purple'))
plt.title("Box Plot")
plt.ylabel('Value')

2]x= random_data
plt.boxplot(x,vert=False)
plt.show()

3]import matplotlib.pyplot as plt

marks=[10,20,30,40,50,60]
subject=['english','hindi','science','maths','sst','geography']
plt.pie(marks,labels=subject)
plt.show()

import matplotlib.pyplot as plt

marks=[10,20,30,40,50,60]
subject=['english','hindi','science','maths','sst','geography']
plt.bar(marks,subject)
plt.show()

SET B

2]import pandas as pd
import matplotlib.pyplot as plt
df=pd.read_csv('/home/ty138/IRIS.csv')
plt.scatter(df['sepal_length'],df['petal_length'],color='red')
plt.title('Relationship')
plt.xlabel('Sepal length')
plt.ylabel('Petal length')
plt.show()

ASSIGN 3

SET A

1]a)import pandas as pd
data=pd.read_csv('data1.csv')
print(data)
data.describe()

b)data.shape

c)data.head(3)

2]meanAge=data['Age'].mean()
meanSal=data['Salary'].mean()
data['Age'].fillna(meanAge,inplace=True)
data['Salary'].fillna(meanSal,inplace=True)
data

3]a)from sklearn.preprocessing import OneHotEncoder

enc = OneHotEncoder(handle_unknown='ignore')
enc_df = pd.DataFrame(enc.fit_transform(data[['Country']]).toarray())
enc_df

data = data.join(enc_df)
data

b)from sklearn.preprocessing import LabelEncoder

labelEncoder = LabelEncoder()
data['Purchased'] = labelEncoder.fit_transform(data['Purchased'])
data

SET B
1]import pandas as pd
data=pd.read_csv('winequality-red.csv')
data

2]from sklearn import preprocessing

data_scaler = preprocessing.MinMaxScaler(feature_range=(0,100))
data_scaled = data_scaler.fit_transform(data)
data_scaled.round(2)

import numpy as np
import scipy.stats as s
X_train = data_scaled.round(2)
print("Initial array : ",X_train)
print("Initial Mean :",s.tmean(X_train).round(2))

dn = preprocessing.normalize(data,norm='l1')
dn.round(4)

data_binarized = preprocessing.Binarizer(threshold=5).transform(data)
print(data_binarized)
ASSIGN 2

SET A

1]import numpy as np
data=np.array([[0,1],[2,3]])
print("original flattened array is:\n",data )
print("maximum value of the above flattened array:\n",np.max(data))
print("minimum vale of the above flattemed array:\n",np.min(data))

4]def manhattan(point1 , point2):

return abs(point1[0]-point2[0])+abs(point1[1]-point2[1])
def sum_of_man(points):
distance = 0
for i in range(len(points)):
for j in range(i+1,len(points)):
distance += manhattan(points[i],points[j])
return distance

points = [(1,2),(3,4),(5,6),(7,8)]
print("Sum : ",sum_of_man(points))

5]import numpy as np
import matplotlib.pyplot as plt
nums = np.array([0.5,0.7,1,1.2,1.3,2.1])
bins = np.array([0,1,2,3])
hist,_ = np.histogram(nums,bins=bins)
plt.bar(bins[:-1],hist,width=0.5)
plt.xticks(bins)
plt.ylabel('Frequency')
plt.title('Histogram of nums against bins')
plt.show()

SET B

1]import pandas as pd
import numpy as np
df=pd.read_csv('/home/ty138/IRIS.csv')
df

print("Maximun of above data: ",np.max(df))

print("\n")
print("Minimun of above data: ",np.min(df))

ASSIGN 1

SET A

1]import pandas as pd
df=pd.DataFrame(columns=['Name','Age','Percentage'])
df.loc[0]=['Ankit',18,67.8]
df.loc[1]=['Maya',16,68.05]
df.loc[2]=['Seema',21,84.21]
df.loc[3]=['Raj',19,76.66]
df.loc[4]=['Sayali',17,78.91]
df.loc[5]=['Veer',18,55.86]
df.loc[6]=['Om',19,67]
df.loc[7]=['Kaushik',19,78]
df.loc[8]=['Prachiti',20,77]
df.loc[9]=['Sonal',21,88]
df

2]df.shape
df.size
df.columns

3]import pandas as pd
df=pd.DataFrame(columns=['Name','Age','Percentage'])
df.loc[0]=['Ankit',18,67.8]
df.loc[1]=['Maya',16,68.05]
df.loc[2]=['Seema',21,84.21]
df.loc[3]=['Raj',19,76.66]
df.loc[4]=['Sayali',17,78.91]
df.loc[5]=['Veer',18,55.86]
df.loc[6]=['Om',19,67]
df.loc[7]=['Kaushik',19,78]
df.loc[8]=['Prachiti',20,77]
df.loc[9]=['Sonal',21,88]
df

df.dtypes
df.describe()

4]import pandas as pd
df=pd.DataFrame(columns=['Name','Age','Persentage'])
df.loc[0]=['Ankit',18,67.8]
df.loc[1]=['Ankit',16,68.05]
df.loc[2]=['Seema',20,84.21]
df.loc[3]=['Raj',19,76.66]
df.loc[4]=['Sayali',17,78.91]
df["Remarks"]=None
df

6]df["Remarks"]=None
df

df.drop(4)

df.isnull()
df.duplicate()

7]import pandas as pd
df=pd.DataFrame(columns=['Name','Age','Persentage'])
df.loc[0]=['Ankit',18,67.8]
df.loc[1]=['Maya',None,68.05]
df.loc[2]=['Maya',None,68.05]
df.loc[3]=['Raj',19,76.66]
df.loc[4]=['Sayali',17,78.91]
df.loc[5]=['Veer',18,55.86]
df.loc[6]=['Veer',18,55.86]
df.loc[7]=['Kaushik',19,78]
df.loc[8]=['Prachiti',20,77]
df.loc[9]=['Sonal',21,88]
df

import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
df.plot(x="Name", y="Persentage")
plt.show()

8]df.plot(kind="scatter",x='Name',y='Persentage')
plt.show()

CAD 110 Inventor Basics 2026
No ratings yet
CAD 110 Inventor Basics 2026
104 pages
VenkatSAP MM Resume
No ratings yet
VenkatSAP MM Resume
6 pages
Identification of Safety Critical Equipment (SCE) : Guide
100% (3)
Identification of Safety Critical Equipment (SCE) : Guide
28 pages
SMM Overview Updated
No ratings yet
SMM Overview Updated
9 pages
Kenya
No ratings yet
Kenya
84 pages
PP Manual Exp No.08
No ratings yet
PP Manual Exp No.08
9 pages
Hands On Data Visualization Using Matplotlib
100% (1)
Hands On Data Visualization Using Matplotlib
7 pages
Python Gcolab - Colab
No ratings yet
Python Gcolab - Colab
6 pages
Aphical Representation
No ratings yet
Aphical Representation
8 pages
Unit 5 UCSD Notes
No ratings yet
Unit 5 UCSD Notes
2 pages
DSDBAAssignment2 SUMEET
No ratings yet
DSDBAAssignment2 SUMEET
8 pages
Ids Exp13
No ratings yet
Ids Exp13
2 pages
Ai&Ml Bail606 ML Lab Manual
No ratings yet
Ai&Ml Bail606 ML Lab Manual
50 pages
RPS 1000 RPS 2500 RPS 5000 RPS 10000: User Manual
No ratings yet
RPS 1000 RPS 2500 RPS 5000 RPS 10000: User Manual
49 pages
Lab01 - Classical Cryptography
No ratings yet
Lab01 - Classical Cryptography
10 pages
Lesson Plan
50% (2)
Lesson Plan
7 pages
Preksha Ai Practical Class 10th - 070428
No ratings yet
Preksha Ai Practical Class 10th - 070428
13 pages
Gec Practicals
No ratings yet
Gec Practicals
31 pages
Maths Assignment
No ratings yet
Maths Assignment
3 pages
Profound Python Data Science
From Everand
Profound Python Data Science
Onder Teker
No ratings yet
Assignment 2
No ratings yet
Assignment 2
2 pages
23bet10114 Naman Gupta Assignment-1
No ratings yet
23bet10114 Naman Gupta Assignment-1
17 pages
Vanshika Goyal Gec Practicals
No ratings yet
Vanshika Goyal Gec Practicals
31 pages
Mayank Chaudhary DEV Practicals
No ratings yet
Mayank Chaudhary DEV Practicals
14 pages
Histogram
No ratings yet
Histogram
16 pages
ML Lab
No ratings yet
ML Lab
12 pages
Chapter 2 - Part 2 - (Histogram)
No ratings yet
Chapter 2 - Part 2 - (Histogram)
18 pages
SH Assignment
No ratings yet
SH Assignment
6 pages
Visual - Wrksht-3 (With Solutions)
No ratings yet
Visual - Wrksht-3 (With Solutions)
3 pages
File Handling in Python
No ratings yet
File Handling in Python
25 pages
Chapter 6 - JAVASCRIPT - Hamid
No ratings yet
Chapter 6 - JAVASCRIPT - Hamid
55 pages
Practical Solutions
No ratings yet
Practical Solutions
6 pages
PL 900
No ratings yet
PL 900
14 pages
DAV Practicle File
No ratings yet
DAV Practicle File
28 pages
Python Codes
No ratings yet
Python Codes
15 pages
Man Avg
No ratings yet
Man Avg
2 pages
WIRES-X Connection Kit HRI-200 (Includes New DG-ID Feature) Instruction Manual
No ratings yet
WIRES-X Connection Kit HRI-200 (Includes New DG-ID Feature) Instruction Manual
109 pages
Practical 1 (223321027)
No ratings yet
Practical 1 (223321027)
10 pages
42 Histograms2
No ratings yet
42 Histograms2
6 pages
Edaunit IV
No ratings yet
Edaunit IV
15 pages
AD3411
No ratings yet
AD3411
28 pages
S33120+Kate Saenko+Fighting Dataset Bias in Computer Vision - 1617924588759001FZj3
No ratings yet
S33120+Kate Saenko+Fighting Dataset Bias in Computer Vision - 1617924588759001FZj3
47 pages
Lecture 4
No ratings yet
Lecture 4
60 pages
Exp 2 SDK Ok
No ratings yet
Exp 2 SDK Ok
18 pages
MrCooper Interview Experience
No ratings yet
MrCooper Interview Experience
3 pages
42 Histograms
No ratings yet
42 Histograms
5 pages
Python Code - Summary Statistics
No ratings yet
Python Code - Summary Statistics
6 pages
Abhishek Pandey - BI Lab - Exp 1
No ratings yet
Abhishek Pandey - BI Lab - Exp 1
4 pages
HW 1
No ratings yet
HW 1
11 pages
Data Science Algorithmen Master - 02 Data Handling
No ratings yet
Data Science Algorithmen Master - 02 Data Handling
76 pages
Bar Graphs and Histograms
No ratings yet
Bar Graphs and Histograms
9 pages
Moscad-L: SCADA Remote Terminal Unit
No ratings yet
Moscad-L: SCADA Remote Terminal Unit
2 pages
Assignment 3 Informatics Practices
No ratings yet
Assignment 3 Informatics Practices
9 pages
ZMF4ECL Users Guide
No ratings yet
ZMF4ECL Users Guide
254 pages
Matplotlib Record Programs
No ratings yet
Matplotlib Record Programs
5 pages
The Computing Profession
No ratings yet
The Computing Profession
21 pages
Practical Graph
No ratings yet
Practical Graph
8 pages
Solved - The Fourth-Degree Polynomial F (X) 230x4 + 18x3 + 9x2...
No ratings yet
Solved - The Fourth-Degree Polynomial F (X) 230x4 + 18x3 + 9x2...
7 pages
COREN Registration and Guide
No ratings yet
COREN Registration and Guide
3 pages
Python Slips
No ratings yet
Python Slips
9 pages
Print Print Print Print: Import As
No ratings yet
Print Print Print Print: Import As
6 pages
Planning and Implementing Disaster Recovery
No ratings yet
Planning and Implementing Disaster Recovery
31 pages
Dal Programs With Output
No ratings yet
Dal Programs With Output
11 pages
CIRE 2131: Lab 9: Optoelectronic Devices
No ratings yet
CIRE 2131: Lab 9: Optoelectronic Devices
6 pages
Hands On Matplotlib?
No ratings yet
Hands On Matplotlib?
40 pages
DAV Practicals
No ratings yet
DAV Practicals
26 pages
Fds Slips
No ratings yet
Fds Slips
6 pages
Unit 5
No ratings yet
Unit 5
10 pages
How To Configure DHCP in Cisco Router Using Packet Tracer and Gns3 - Router Switch Configuration Using Packet Tracer GNS3
100% (1)
How To Configure DHCP in Cisco Router Using Packet Tracer and Gns3 - Router Switch Configuration Using Packet Tracer GNS3
5 pages
FDS All Practicals
No ratings yet
FDS All Practicals
10 pages
Experiment - 2.3 Krikita
No ratings yet
Experiment - 2.3 Krikita
12 pages
Data Science Practical Book - Ipynb
No ratings yet
Data Science Practical Book - Ipynb
21 pages
FDS Lab 1 Manuel .1..1new
No ratings yet
FDS Lab 1 Manuel .1..1new
38 pages
An Insight Into Embedded System Design: Pantech Solutions PVT LTD Chennai-17
No ratings yet
An Insight Into Embedded System Design: Pantech Solutions PVT LTD Chennai-17
83 pages
FDS Lab 1 Manuel .1..1new
No ratings yet
FDS Lab 1 Manuel .1..1new
34 pages
Data Visulization Notes
No ratings yet
Data Visulization Notes
3 pages
PML Ex3
No ratings yet
PML Ex3
20 pages
CH 1 Python Revision Tour - I
No ratings yet
CH 1 Python Revision Tour - I
60 pages
Lakhan Frontpage
No ratings yet
Lakhan Frontpage
7 pages
SESION 12 (Pandas)
No ratings yet
SESION 12 (Pandas)
41 pages
Parametric Curves Surfaces
No ratings yet
Parametric Curves Surfaces
24 pages
AAC Flash Encoder Plug-In
No ratings yet
AAC Flash Encoder Plug-In
15 pages
Data Visualization With Python
No ratings yet
Data Visualization With Python
34 pages
DATA VISUALIZATION - Part 4
No ratings yet
DATA VISUALIZATION - Part 4
12 pages
TC & BSC Overview
No ratings yet
TC & BSC Overview
36 pages
Machinelearning Prac
No ratings yet
Machinelearning Prac
17 pages
Python For Beginners
From Everand
Python For Beginners
Célio Azevedo
No ratings yet
Data Visualization
No ratings yet
Data Visualization
35 pages
Histrogram: A Histogram Is A Graph Showing Frequency Distributions
No ratings yet
Histrogram: A Histogram Is A Graph Showing Frequency Distributions
10 pages
Matplotlib Starter: Import As Import As Import As
No ratings yet
Matplotlib Starter: Import As Import As Import As
24 pages

Fds Assigns

Uploaded by

Fds Assigns

Uploaded by

Assign 4

import matplotlib.pyplot as plt

3]import matplotlib.pyplot as plt

import matplotlib.pyplot as plt

3]a)from sklearn.preprocessing import OneHotEncoder

b)from sklearn.preprocessing import LabelEncoder

2]from sklearn import preprocessing

4]def manhattan(point1 , point2):

print("Maximun of above data: ",np.max(df))

You might also like