Practical 1
Practical 1
Roll No:23
Aim:
Perform following operation on given dataset. a) Find Shape of Data b) Find Missing
Values c) Find data type of each column d) Finding out Zero's e) Find Mean age of
patients f) Now extract only Age, Sex, ChestPain, RestBP, Chol. Randomly divide dataset
in training (75%) and testing (25%).
In [5]: df = pd.read_csv("C:\\Users\\samruddhi\\Downloads\\Heart.csv")
In [4]: df.head()
Out[4]: Unnamed:
Age Sex ChestPain RestBP Chol Fbs RestECG MaxHR ExAng O
0
In [5]: df.shape
In [6]: df.isnull().sum()
file:///C:/Users/maaka/AppData/Local/Microsoft/Windows/INetCache/IE/4F19044N/harsh.html 1/7
Out[6]: Unnamed: 0 0
Age 0
Sex 0
ChestPain 0
RestBP 0
Chol 0
Fbs 0
RestECG 0
MaxHR 0
ExAng 0
Oldpeak 0
Slope 0
Ca 4
Thal 2
AHD 0
dtype: int64
In [7]: df.info
In [8]: df.dtypes
file:///C:/Users/maaka/AppData/Local/Microsoft/Windows/INetCache/IE/4F19044N/harsh.html 2/7
Out[8]: Unnamed: 0 int64
Age int64
Sex int64
ChestPain object
RestBP int64
Chol int64
Fbs int64
RestECG int64
MaxHR int64
ExAng int64
Oldpeak float64
Slope int64
Ca float64
Thal object
AHD object
dtype: object
In [9]: df==0
Out[9]: Unnamed:
Age Sex ChestPain RestBP Chol Fbs RestECG MaxHR ExAng
0
0 False False False False False False False False False True
1 False False False False False False True False False False
2 False False False False False False True False False False
3 False False False False False False True True False True
4 False False True False False False True False False True
... ... ... ... ... ... ... ... ... ... ...
298 False False False False False False True True False True
299 False False False False False False False True False True
300 False False False False False False True True False False
301 False False True False False False True False False True
302 False False False False False False True True False True
In [10]: df[df==0]
file:///C:/Users/maaka/AppData/Local/Microsoft/Windows/INetCache/IE/4F19044N/harsh.html 3/7
Out[10]: Unnamed:
Age Sex ChestPain RestBP Chol Fbs RestECG MaxHR ExAng
0
0 NaN NaN NaN NaN NaN NaN NaN NaN NaN 0.0
1 NaN NaN NaN NaN NaN NaN 0.0 NaN NaN NaN
2 NaN NaN NaN NaN NaN NaN 0.0 NaN NaN NaN
3 NaN NaN NaN NaN NaN NaN 0.0 0.0 NaN 0.0
4 NaN NaN 0.0 NaN NaN NaN 0.0 NaN NaN 0.0
... ... ... ... ... ... ... ... ... ... ...
298 NaN NaN NaN NaN NaN NaN 0.0 0.0 NaN 0.0
299 NaN NaN NaN NaN NaN NaN NaN 0.0 NaN 0.0
300 NaN NaN NaN NaN NaN NaN 0.0 0.0 NaN NaN
301 NaN NaN 0.0 NaN NaN NaN 0.0 NaN NaN 0.0
302 NaN NaN NaN NaN NaN NaN 0.0 0.0 NaN 0.0
In [11]: (df==0).sum()
Out[11]: Unnamed: 0 0
Age 0
Sex 97
ChestPain 0
RestBP 0
Chol 0
Fbs 258
RestECG 151
MaxHR 0
ExAng 204
Oldpeak 99
Slope 0
Ca 176
Thal 0
AHD 0
dtype: int64
In [12]: df.Age.mean()
Out[12]: 54.43894389438944
In [13]: df.columns
file:///C:/Users/maaka/AppData/Local/Microsoft/Windows/INetCache/IE/4F19044N/harsh.html 4/7
In [20]: train,test = train_test_split(data,test_size=0.25,random_state=1)
In [21]: train.shape
Out[21]: (227, 5)
In [22]: test.shape
Out[22]: (76, 5)
Out[24]: array([1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.,
1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.,
1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 0., 0., 0., 0., 0., 0.,
0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
0., 0., 1., 1., 1., 1., 1.])
file:///C:/Users/maaka/AppData/Local/Microsoft/Windows/INetCache/IE/4F19044N/harsh.html 5/7
Out[25]: array([1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.,
1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.,
1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.,
1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.,
1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.,
1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 0., 0.,
0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
0., 0., 0., 0., 0., 0., 0.])
In [26]: type(predicted)
Out[26]: numpy.ndarray
In [27]: ConfusionMatrixDisplay.from_predictions(actual,predicted)
file:///C:/Users/maaka/AppData/Local/Microsoft/Windows/INetCache/IE/4F19044N/harsh.html 6/7
In [28]: from sklearn.metrics import classification_report
from sklearn.metrics import accuracy_score
In [29]: print(classification_report(actual,predicted))
In [30]: accuracy_score(actual,predicted)
Out[30]: 0.88
In [ ]:
file:///C:/Users/maaka/AppData/Local/Microsoft/Windows/INetCache/IE/4F19044N/harsh.html 7/7