EDA IPL Data

The document analyzes cricket match data from a CSV file loaded into a pandas dataframe. It explores the data through value counts, groupbys, filters, aggregations and merges. Key metrics analyzed include the most common venues, unique umpires, total runs by season excluding 4s and 6s, highest win margins by season, matches between two teams, counts of player of the matches, batting performances between 50-100 runs and over 100 runs, and the number of centuries by team.

Uploaded by

timesevolution

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

17 views4 pages

EDA IPL Data

Uploaded by

timesevolution

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

You are on page 1/ 4

df = pd.read_csv('matches.

csv')
df.head()

df.nunique()
df.winner.value_counts().head(3).sum()

total = df.winner.count()
total

df.winner.unique()
df.winner.value_counts()

#Q8
df['venue'].value_counts().sort_values(ascending=False)
#unique value sorted with name.
dict_st ={'Feroz Shah Kotla Ground': 'Feroz Shah Kotla', 'MA Chidambaram Stadium, Chepauk': 'M.
A. Chidambaram Stadium', 'M. Chinnaswamy Stadium': 'M Chinnaswamy Stadium',
'Rajiv Gandhi International Stadium, Uppal': 'Rajiv Gandhi Intl. Cricket Stadium', 'ACA-
VDCA Stadium': 'Dr. Y.S. Rajasekhara Reddy ACA-VDCA Cricket Stadium'}
df['stadium'] =df['venue'].replace(dict_st)
df['stadium'].value_counts().sort_values(ascending=False)
df['stadium'].nunique()

#Q9
df.head()
ump = df['umpire1'].value_counts() + df['umpire2'].value_counts()
ump.sort_values(ascending = False).head(3).sum()

#Q10
ump.reset_index()

#Q11
df_j= pd.merge(df,df1,left_on='id',right_on='match_id')
df_j.head()
df_j['total_runs'].sum()-df_j[df_j['batsman_runs']==4]['batsman_runs'].sum()-
df_j[df_j['batsman_runs']==6]['batsman_runs'].sum()

#Q12

df_j.groupby('season')['total_runs'].sum() -df_j[df_j['batsman_runs']==4].groupby('season')
['batsman_runs'].sum() -df_j[df_j['batsman_runs']==6].groupby('season')['batsman_runs'].sum()

#Q 13
max_win_margin_runs = df.groupby('season')['win_by_runs'].max().sum()
max_win_margin_runs

#Q14
df.groupby('season')['win_by_runs'].max().sort_values().tail(1)

#Q 15
#df[(df['team1']=='Mumbai Indians') & (df['team2']=='Chennai Super Kings')]

df[(df['team1'].isin(['Mumbai Indians', 'Chennai Super Kings'])) & (df['team2'].isin(['Mumbai Indians',

'Chennai Super Kings']))]['player_of_match'].count()

#Q16

df[(df['team1'].isin(['Mumbai Indians', 'Chennai Super Kings'])) & (df['team2'].isin(['Mumbai Indians',

'Chennai Super Kings']))].groupby('player_of_match')['player_of_match'].count()

#Q17

temp_df = df1.groupby(['batsman','match_id'])
['batsman_runs'].agg('sum').reset_index().sort_values(by='batsman_runs',
ascending=False).reset_index(drop=True)

temp_df[(temp_df['batsman_runs'] >=50) & (temp_df['batsman_runs'] <100)]['batsman_runs'].count()

#Q18
temp_df[(temp_df['batsman_runs'] >=50) & (temp_df['batsman_runs'] <100)]['batsman'].nunique()

#Q19

temp_df[temp_df['batsman_runs'] >=100]['batsman_runs'].count()

#Q20

team_100 = df1.groupby(['batsman', 'batting_team', 'match_id'])

['batsman_runs'].agg('sum').reset_index().sort_values(by='batsman_runs',
ascending=False).reset_index(drop=True)

hundreds_by_teams = team_100[team_100['batsman_runs'] >= 100].groupby(['batting_team',

'batsman'])['match_id'].count().reset_index()
hundreds_by_teams
total_hundreds_by_teams = hundreds_by_teams.groupby('batting_team')['match_id'].sum()
total_hundreds_by_teams[total_hundreds_by_teams > 10].count()

Virat Kohil
No ratings yet
Virat Kohil
31 pages
Data Analytics Part 2
No ratings yet
Data Analytics Part 2
12 pages
IPL T20 Cricket Analysis Shallshkagksgsohssgsigsgslhsagsjsgsjgsjsh
No ratings yet
IPL T20 Cricket Analysis Shallshkagksgsohssgsigsgslhsagsjsgsjgsjsh
37 pages
Data Analytics Using Python
No ratings yet
Data Analytics Using Python
14 pages
Phil Salt T20 Career Analysis
No ratings yet
Phil Salt T20 Career Analysis
38 pages
Capgeini Data Engineer - Spark Questions
No ratings yet
Capgeini Data Engineer - Spark Questions
3 pages
Pds
No ratings yet
Pds
3 pages
Matchdata - Ipynb - Colaboratory
No ratings yet
Matchdata - Ipynb - Colaboratory
3 pages
Soln
No ratings yet
Soln
3 pages
Data Analytics Part 3
No ratings yet
Data Analytics Part 3
15 pages
INFO II Practice 7
No ratings yet
INFO II Practice 7
15 pages
Sports - Ipynb - Colab
No ratings yet
Sports - Ipynb - Colab
4 pages
SREE
No ratings yet
SREE
24 pages
IPL Data Analysis
100% (1)
IPL Data Analysis
26 pages
Ipl Tasks
No ratings yet
Ipl Tasks
3 pages
Case Study Assignment 5
No ratings yet
Case Study Assignment 5
3 pages
Ipl Data Analysis
No ratings yet
Ipl Data Analysis
19 pages
Kohli Batting Analysis
No ratings yet
Kohli Batting Analysis
19 pages
Program Dataframe
No ratings yet
Program Dataframe
8 pages
XII IP Practical List - Anand
No ratings yet
XII IP Practical List - Anand
25 pages
24 Gourav
No ratings yet
24 Gourav
75 pages
ML 1
No ratings yet
ML 1
16 pages
20 SQL Pandas
No ratings yet
20 SQL Pandas
14 pages
Indian Premier League Ip Project File
No ratings yet
Indian Premier League Ip Project File
42 pages
E22cseu1389 Assignment8 1
No ratings yet
E22cseu1389 Assignment8 1
5 pages
PythonFinal (8,9,10,11)
No ratings yet
PythonFinal (8,9,10,11)
12 pages
Lab4-Factors & DataFrames
No ratings yet
Lab4-Factors & DataFrames
5 pages
BTapRDD - Trương Quang Đ T - 21522922
No ratings yet
BTapRDD - Trương Quang Đ T - 21522922
3 pages
Import As Import As From Import
No ratings yet
Import As Import As From Import
23 pages
56 Assignments
No ratings yet
56 Assignments
12 pages
Himadri
No ratings yet
Himadri
6 pages
16 Advanced Operations On Dataframe
No ratings yet
16 Advanced Operations On Dataframe
7 pages
YEAR: 2024 - 2025: Ipl Data Analysis Using Mysql and Python Connectivy
No ratings yet
YEAR: 2024 - 2025: Ipl Data Analysis Using Mysql and Python Connectivy
22 pages
The Series Data Structure: Import Pandas As PD
No ratings yet
The Series Data Structure: Import Pandas As PD
8 pages
Ip Project
No ratings yet
Ip Project
16 pages
Informatics Practices Project File PDF
0% (1)
Informatics Practices Project File PDF
45 pages
Iplprediction - Ipynb - Colab
No ratings yet
Iplprediction - Ipynb - Colab
37 pages
ML Lab Programs
No ratings yet
ML Lab Programs
21 pages
XII IP Practical Code and Output
No ratings yet
XII IP Practical Code and Output
4 pages
SQL90 GH 97
No ratings yet
SQL90 GH 97
5 pages
Answer Key
No ratings yet
Answer Key
2 pages
PythonFinal (8,9,10,11) Removed
No ratings yet
PythonFinal (8,9,10,11) Removed
8 pages
PandasAI + Cricket
No ratings yet
PandasAI + Cricket
10 pages
Practical File 2024
No ratings yet
Practical File 2024
25 pages
Advanced IPL Match Analysis Using Python (Advanced)
No ratings yet
Advanced IPL Match Analysis Using Python (Advanced)
4 pages
SRM Eswari Workshop Day 1 - Feb 2025 - Jupyter Notebook
No ratings yet
SRM Eswari Workshop Day 1 - Feb 2025 - Jupyter Notebook
39 pages
RAKESH
No ratings yet
RAKESH
24 pages
Partition by
No ratings yet
Partition by
1 page
Pandas Tutorial1 - Informatics
No ratings yet
Pandas Tutorial1 - Informatics
43 pages
Sports Analytics Management Answers
No ratings yet
Sports Analytics Management Answers
3 pages
Day 26
No ratings yet
Day 26
6 pages
T 20 WC
No ratings yet
T 20 WC
4 pages
# Update The Template To Remove Pla
No ratings yet
# Update The Template To Remove Pla
2 pages
Info4602 Final Eda
No ratings yet
Info4602 Final Eda
2 pages
IPL Data Analytics
No ratings yet
IPL Data Analytics
20 pages
Dsbda Assignment 1
No ratings yet
Dsbda Assignment 1
5 pages
Hands On 1 Data Visualization
No ratings yet
Hands On 1 Data Visualization
8 pages
Methodes Pour Dataframes
No ratings yet
Methodes Pour Dataframes
10 pages
No Ph.D. Game Design With Three.js
From Everand
No Ph.D. Game Design With Three.js
Nikiforos Kontopoulos
No ratings yet