0% found this document useful (0 votes)

3 views

Assignment Ds Midterm

Uploaded by

sadaamabdi993

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

3 views

Assignment Ds Midterm

Uploaded by

sadaamabdi993

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 2

In [3]: import numpy as np

import pandas as pd
import matplotlib.pyplot as plt

In [5]: df = pd.read_excel('C:/Users/hp/Desktop/juppyter/assign/Employee_Dataset_Pandas.xlsx')
df

Out[5]: Employee_ID Name Age Department Salary Joining_Date

0 E001 Laila Hussein 49 Operations 76794.67 2023-12-21

1 E002 Omar Abdullahi 59 IT 58597.15 2016-07-07

2 E003 NaN 23 Finance 53918.98 2023-05-09

3 E004 Abdullah Osman 50 Operations 46909.28 2010-07-17

4 E005 Sara Ismail 40 HR 500000.00 2017-01-13

... ... ... ... ... ... ...

97 E098 Sagal Ibrahim 44 Marketing 25848.25 2019-12-12

98 E099 Sara Abubakar 25 Marketing 21662.88 2010-11-14

99 E100 Hassan Abubakar 52 Operations 58625.36 2010-04-18

100 E001 Laila Hussein 49 Operations 76794.67 2023-12-21

101 E002 Omar Abdullahi 59 IT NaN 2016-07-07

102 rows × 6 columns

1. Average Salary by Department:

In [8]: avg_salary_by_Department = df.groupby('Department')['Salary'].mean()

Out[8]: Employee_ID Name Age Department Salary Joining_Date

0 E001 Laila Hussein 49 Operations 76794.67 2023-12-21

1 E002 Omar Abdullahi 59 IT 58597.15 2016-07-07

2 E003 NaN 23 Finance 53918.98 2023-05-09

3 E004 Abdullah Osman 50 Operations 46909.28 2010-07-17

4 E005 Sara Ismail 40 HR 500000.00 2017-01-13

... ... ... ... ... ... ...

97 E098 Sagal Ibrahim 44 Marketing 25848.25 2019-12-12

98 E099 Sara Abubakar 25 Marketing 21662.88 2010-11-14

99 E100 Hassan Abubakar 52 Operations 58625.36 2010-04-18

100 E001 Laila Hussein 49 Operations 76794.67 2023-12-21

101 E002 Omar Abdullahi 59 IT NaN 2016-07-07

102 rows × 6 columns

In [9]: # Display avg_salary_by_Department

print (avg_salary_by_Department)

Department
Finance 55309.961111
HR 83892.270714
IT 54651.742500
Marketing 47693.682222
Operations 58020.254286
Sales 51101.622222
Name: Salary, dtype: float64

2. Employees_Joining_Date Each Year

In [6]: #df['Joining_Year'] = pd.to_datetime(df['Joining_Date']).dt.Year

#Employees_Each_Year = df.groupby('Joining_Year').size().rest_index(name= 'Employee_count')
#print(Employees_Each_Year)
df['Joining_Date'] = pd.to_datetime(df['Joining_Date'], errors='coerce')
df['JoinYear'] = df['Joining_Date'].dt.year
employees_joined_year = df['JoinYear'].value_counts().sort_index()
print(employees_joined_year)

JoinYear
2010.0 15
2011.0 5
2012.0 8
2013.0 4
2014.0 9
2015.0 9
2016.0 9
2017.0 5
2018.0 5
2019.0 8
2020.0 8
2021.0 5
2022.0 6
2023.0 5
Name: count, dtype: int64

3. Salary Distribution by Department, you can visualize any

chart

In [5]: data = pd.read_excel('Employee_Dataset_Pandas.xlsx')

In [7]: plt.plot(data['Department'],data ['Salary'], marker= 'o', linestyle = '-' , color= 'yellow')

plt.xlabel("Department")
plt.ylabel("Salary")

Out[7]: Text(0, 0.5, 'Salary')

4. Age vs. Salary (Scatter Plot) or Line chart

In [54]: plt.scatter(df['Age'], df['Salary'], alpha=0.7)

plt.title('Age vs Salary')
plt.show()

5. Gender Distribution by Department (if "Gender" is available)

In [59]: Age_Distribution = df.groupby(['Department','Age']).size().unstack()

print(Age_Distribution )

Age 22 23 24 25 26 27 28 29 31 32 ... 49 50 \
Department ...
Finance NaN 1.0 NaN 1.0 NaN 2.0 NaN NaN NaN 1.0 ... NaN NaN
HR NaN NaN NaN 1.0 NaN 1.0 1.0 NaN 1.0 NaN ... NaN NaN
IT 1.0 NaN 1.0 1.0 1.0 NaN NaN 1.0 NaN NaN ... NaN 1.0
Marketing NaN 1.0 NaN 2.0 NaN 1.0 1.0 NaN NaN 1.0 ... NaN 1.0
Operations NaN NaN NaN 1.0 1.0 1.0 1.0 1.0 NaN NaN ... 4.0 1.0
Sales NaN 2.0 1.0 1.0 NaN 2.0 NaN NaN NaN 1.0 ... NaN NaN

Age 51 52 54 55 57 58 59 60
Department
Finance NaN NaN NaN NaN NaN NaN 1.0 NaN
HR 2.0 1.0 1.0 1.0 1.0 2.0 NaN NaN
IT 1.0 2.0 1.0 NaN NaN NaN 2.0 NaN
Marketing 1.0 NaN 1.0 NaN 1.0 1.0 NaN 1.0
Operations NaN 1.0 2.0 NaN 1.0 NaN 1.0 NaN
Sales NaN 1.0 NaN NaN NaN NaN 2.0 2.0

[6 rows x 35 columns]

This result shows the quantity of male and female representatives in every division, assisting with grasping orientation portrayal inside divisions.

6. Department with Highest Average Age

In [69]: Average_Age_by_Department = df.groupby('Department')['Age'].mean()

highest_Average_Depatment = Average_Age_by_Department .idxmax()
highest_Average_Age = Average_Age_by_Department.max()
print(f'Department with the highest average age: {highest_Average_Depatment} (Average Age: {highest_Average_Age })')

Department with the highest average age: HR (Average Age: 44.357142857142854)

7. Top 5 Highest-Paid Employees and Their Departments

In [70]: top_5_highest_paid = df[['Employee_ID' ,'Department','Salary']]

print(top_5_highest_paid)

Employee_ID Department Salary

0 E001 Operations 76794.67
1 E002 IT 58597.15
2 E003 Finance 53918.98
3 E004 Operations 46909.28
4 E005 HR 500000.00
.. ... ... ...
97 E098 Marketing 25848.25
98 E099 Marketing 21662.88
99 E100 Operations 58625.36
100 E001 Operations 76794.67
101 E002 IT NaN

[102 rows x 3 columns]

Ottoman Bows - An Assessment of Draw Weight, Performance and Tactical Use
No ratings yet
Ottoman Bows - An Assessment of Draw Weight, Performance and Tactical Use
11 pages
Data Preprocessing & Visualization1
No ratings yet
Data Preprocessing & Visualization1
2 pages
Employee Info
No ratings yet
Employee Info
2 pages
Ads Exam 21c3
No ratings yet
Ads Exam 21c3
22 pages
AI Assignment 6 - Employee Performance Analysis - Jupyter Notebook
No ratings yet
AI Assignment 6 - Employee Performance Analysis - Jupyter Notebook
9 pages
Ml Projects
No ratings yet
Ml Projects
22 pages
SQL & Python Interview Q&A
No ratings yet
SQL & Python Interview Q&A
7 pages
Mastering_Pandas_with_103_Practical_Questions_and_Solution_1731584558
No ratings yet
Mastering_Pandas_with_103_Practical_Questions_and_Solution_1731584558
48 pages
Answer Key for SET-1 TO 3
No ratings yet
Answer Key for SET-1 TO 3
7 pages
211423205047-Exp1d
No ratings yet
211423205047-Exp1d
6 pages
Pandas Cheat Sheet
No ratings yet
Pandas Cheat Sheet
17 pages
ML lab manual 1-10
No ratings yet
ML lab manual 1-10
58 pages
Data Visualization EDA-print
No ratings yet
Data Visualization EDA-print
18 pages
Predictive+Modelling+-+Logistic+Regression+-+Student+Version-New2.3.ipynb - Colaboratory
No ratings yet
Predictive+Modelling+-+Logistic+Regression+-+Student+Version-New2.3.ipynb - Colaboratory
12 pages
Maxbox Starter139 Top5 Data Diagram Types
No ratings yet
Maxbox Starter139 Top5 Data Diagram Types
4 pages
Set B
No ratings yet
Set B
8 pages
prints
No ratings yet
prints
43 pages
Python
No ratings yet
Python
32 pages
Data Analysis Using Python
No ratings yet
Data Analysis Using Python
12 pages
Lab Programmes Adwaith
No ratings yet
Lab Programmes Adwaith
18 pages
Student Notebook HR Analysis
No ratings yet
Student Notebook HR Analysis
11 pages
Half Yearly Answers
No ratings yet
Half Yearly Answers
10 pages
Kunj Project 1
No ratings yet
Kunj Project 1
34 pages
Python Pandas-DataFrames Complete - Jupyter Notebook
No ratings yet
Python Pandas-DataFrames Complete - Jupyter Notebook
34 pages
Usage of NumPy for Numerical Data in Detail
No ratings yet
Usage of NumPy for Numerical Data in Detail
52 pages
Pandas_Dataframe_All_Operations_1735471870
No ratings yet
Pandas_Dataframe_All_Operations_1735471870
4 pages
L6 and 7-Data Preprocessing-coding
No ratings yet
L6 and 7-Data Preprocessing-coding
34 pages
Business Intelligence and Analytics
No ratings yet
Business Intelligence and Analytics
8 pages
[email protected]
No ratings yet
[email protected]
13 pages
IP_Employee_Project
No ratings yet
IP_Employee_Project
31 pages
Pps Ui22cs57lab 10
No ratings yet
Pps Ui22cs57lab 10
17 pages
Ip Project File
No ratings yet
Ip Project File
46 pages
Project
No ratings yet
Project
12 pages
Parth IP Employee Management Project (1)
No ratings yet
Parth IP Employee Management Project (1)
32 pages
ANS KEY SET A
No ratings yet
ANS KEY SET A
6 pages
Advance Operations On Dataframes: Create A Dataframe With Following Values
No ratings yet
Advance Operations On Dataframes: Create A Dataframe With Following Values
3 pages
Viksit Ip Project File
No ratings yet
Viksit Ip Project File
33 pages
ip file class 12
No ratings yet
ip file class 12
26 pages
Kunj Project 1
No ratings yet
Kunj Project 1
34 pages
Coding
No ratings yet
Coding
9 pages
vertopal.com_12_Pandas
No ratings yet
vertopal.com_12_Pandas
14 pages
GR12 RECORD PROGRAMS 6TH ONWARDS
No ratings yet
GR12 RECORD PROGRAMS 6TH ONWARDS
18 pages
11. Data Cleaning
No ratings yet
11. Data Cleaning
1 page
Assignment 7
No ratings yet
Assignment 7
1 page
Ip Sample Paper 6 Answer Key
No ratings yet
Ip Sample Paper 6 Answer Key
6 pages
Diwali Sales Analysis EDA 1696347982
No ratings yet
Diwali Sales Analysis EDA 1696347982
8 pages
Project Sale Analysis
No ratings yet
Project Sale Analysis
8 pages
Ip Kamalesh
No ratings yet
Ip Kamalesh
29 pages
ANS KEY SET 2
No ratings yet
ANS KEY SET 2
5 pages
Kunj 3
No ratings yet
Kunj 3
34 pages
Practical 3
No ratings yet
Practical 3
8 pages
Capstone Project Assignment
No ratings yet
Capstone Project Assignment
3 pages
#Group: B (ML) : Numpy NP Pandas PD
No ratings yet
#Group: B (ML) : Numpy NP Pandas PD
9 pages
Social Network Analysis: Cheruvu Nvss Suhas 21BCE8374
No ratings yet
Social Network Analysis: Cheruvu Nvss Suhas 21BCE8374
10 pages
DSBDA3 - Jupyter Notebook
No ratings yet
DSBDA3 - Jupyter Notebook
12 pages
Employee Management Project
No ratings yet
Employee Management Project
33 pages
Practical 2024 (1)
No ratings yet
Practical 2024 (1)
10 pages
Churn Prediction Model
No ratings yet
Churn Prediction Model
36 pages
profitanalysis
No ratings yet
profitanalysis
18 pages
Aligning Business and IT Strategies for Success
From Everand
Aligning Business and IT Strategies for Success
Dwaipayan Sethi
No ratings yet
Managing Convention Centers
From Everand
Managing Convention Centers
Prashant Raturi
No ratings yet
Chi Square POGIL
No ratings yet
Chi Square POGIL
3 pages
Spectrum Estimation
No ratings yet
Spectrum Estimation
49 pages
3300xl - 8mm Proximity Transducer System Datasheet
No ratings yet
3300xl - 8mm Proximity Transducer System Datasheet
36 pages
SDP Services Limited: MT-102-HP Trailer-Mounted Fracturing Blender Unit
No ratings yet
SDP Services Limited: MT-102-HP Trailer-Mounted Fracturing Blender Unit
126 pages
Becoming AI Engineer Learning Path
No ratings yet
Becoming AI Engineer Learning Path
4 pages
2003-2004 Hyde School Faculty and Staff Directory
No ratings yet
2003-2004 Hyde School Faculty and Staff Directory
36 pages
StolPer Samuelson Theorem Note
No ratings yet
StolPer Samuelson Theorem Note
10 pages
Broiler Preventive Maintenance Checklist
No ratings yet
Broiler Preventive Maintenance Checklist
5 pages
Categorizing Traditional Chinese Painting Images: Lecture Notes in Computer Science October 2004
No ratings yet
Categorizing Traditional Chinese Painting Images: Lecture Notes in Computer Science October 2004
9 pages
Wireless Power Transfer For Electric Vehicle Applications PDF
No ratings yet
Wireless Power Transfer For Electric Vehicle Applications PDF
14 pages
Designing an effective Quantity Take
No ratings yet
Designing an effective Quantity Take
4 pages
MECHANICSimnida (1)
No ratings yet
MECHANICSimnida (1)
31 pages
HSAD Assignment
No ratings yet
HSAD Assignment
2 pages
OSI Model
No ratings yet
OSI Model
2 pages
Grade 6-Mathematics Revision Paper (3rd Term)
No ratings yet
Grade 6-Mathematics Revision Paper (3rd Term)
6 pages
Transistor Sizing - TSPC and C2MOS
100% (1)
Transistor Sizing - TSPC and C2MOS
7 pages
EXXI 040-00-00 CI STD 0001 2S - Tipico de Instalación Civil
No ratings yet
EXXI 040-00-00 CI STD 0001 2S - Tipico de Instalación Civil
30 pages
Adaptive Thermal Comfort, Principles and Practice - Fergus Nicol, Michael Humphreys, Susan Roaf
No ratings yet
Adaptive Thermal Comfort, Principles and Practice - Fergus Nicol, Michael Humphreys, Susan Roaf
208 pages
CSTR
100% (1)
CSTR
25 pages
Lab Report 05
No ratings yet
Lab Report 05
20 pages
Ls Dyna Beams
No ratings yet
Ls Dyna Beams
18 pages
Chapter 5 updated-1
No ratings yet
Chapter 5 updated-1
27 pages
Aman Shukla DBMS
No ratings yet
Aman Shukla DBMS
7 pages
Lubitel 166b
No ratings yet
Lubitel 166b
12 pages
Taslagyan Karen 201409 PHD
No ratings yet
Taslagyan Karen 201409 PHD
381 pages
Chemistry:: Exploring Life Through Science
No ratings yet
Chemistry:: Exploring Life Through Science
11 pages
2.1 Python Ass
No ratings yet
2.1 Python Ass
3 pages
Datasheet Din 7991
No ratings yet
Datasheet Din 7991
6 pages
Poster Presentation
No ratings yet
Poster Presentation
1 page

Assignment Ds Midterm

Uploaded by

Assignment Ds Midterm

Uploaded by

In [3]: import numpy as np

Out[5]: Employee_ID Name Age Department Salary Joining_Date

0 E001 Laila Hussein 49 Operations 76794.67 2023-12-21

1 E002 Omar Abdullahi 59 IT 58597.15 2016-07-07

2 E003 NaN 23 Finance 53918.98 2023-05-09

3 E004 Abdullah Osman 50 Operations 46909.28 2010-07-17

4 E005 Sara Ismail 40 HR 500000.00 2017-01-13

... ... ... ... ... ... ...

97 E098 Sagal Ibrahim 44 Marketing 25848.25 2019-12-12

98 E099 Sara Abubakar 25 Marketing 21662.88 2010-11-14

99 E100 Hassan Abubakar 52 Operations 58625.36 2010-04-18

100 E001 Laila Hussein 49 Operations 76794.67 2023-12-21

101 E002 Omar Abdullahi 59 IT NaN 2016-07-07

102 rows × 6 columns

1. Average Salary by Department:

In [8]: avg_salary_by_Department = df.groupby('Department')['Salary'].mean()

Out[8]: Employee_ID Name Age Department Salary Joining_Date

0 E001 Laila Hussein 49 Operations 76794.67 2023-12-21

1 E002 Omar Abdullahi 59 IT 58597.15 2016-07-07

2 E003 NaN 23 Finance 53918.98 2023-05-09

3 E004 Abdullah Osman 50 Operations 46909.28 2010-07-17

4 E005 Sara Ismail 40 HR 500000.00 2017-01-13

... ... ... ... ... ... ...

97 E098 Sagal Ibrahim 44 Marketing 25848.25 2019-12-12

98 E099 Sara Abubakar 25 Marketing 21662.88 2010-11-14

99 E100 Hassan Abubakar 52 Operations 58625.36 2010-04-18

100 E001 Laila Hussein 49 Operations 76794.67 2023-12-21

101 E002 Omar Abdullahi 59 IT NaN 2016-07-07

102 rows × 6 columns

In [9]: # Display avg_salary_by_Department

2. Employees_Joining_Date Each Year

In [6]: #df['Joining_Year'] = pd.to_datetime(df['Joining_Date']).dt.Year

3. Salary Distribution by Department, you can visualize any

In [5]: data = pd.read_excel('Employee_Dataset_Pandas.xlsx')

In [7]: plt.plot(data['Department'],data ['Salary'], marker= 'o', linestyle = '-' , color= 'yellow')

Out[7]: Text(0, 0.5, 'Salary')

4. Age vs. Salary (Scatter Plot) or Line chart

In [54]: plt.scatter(df['Age'], df['Salary'], alpha=0.7)

5. Gender Distribution by Department (if "Gender" is available)

In [59]: Age_Distribution = df.groupby(['Department','Age']).size().unstack()

6. Department with Highest Average Age

In [69]: Average_Age_by_Department = df.groupby('Department')['Age'].mean()

Department with the highest average age: HR (Average Age: 44.357142857142854)

7. Top 5 Highest-Paid Employees and Their Departments

In [70]: top_5_highest_paid = df[['Employee_ID' ,'Department','Salary']]

Employee_ID Department Salary

[102 rows x 3 columns]

You might also like