Capstone Project Guidelines

Guidelines for some project how to do it

Uploaded by

zainali.x21

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

119 views2 pages

Capstone Project Guidelines

Guidelines for some project how to do it

Uploaded by

zainali.x21

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 2

Capstone Project Guidelines

A capstone project involves applying your knowledge to analyze a given dataset. You will
conduct extensive research, use critical thinking, and apply practical skills to derive meaningful
insights and solutions. This project will demonstrate your expertise in data analysis and your
ability to tackle real-world problems.

1. Data Exploration and Cleaning

- Task 1: Load the dataset into a pandas DataFrame and display the first few rows.
- Task 2: Summarize the dataset by providing basic statistics (mean, median, mode, standard
deviation, etc.).
- Task 3: Identify and handle missing values. Explain the chosen method for handling them.
- Task 4: Identify and handle duplicate rows if any.
- Task 5: Convert categorical variables to numerical values using appropriate encoding
techniques (e.g., one-hot encoding, label encoding).

2. Data Visualization
- Task 6: Create visualizations to understand the distribution of numerical features (e.g.,
histograms, box plots).
- Task 7: Create visualizations for categorical features (e.g., bar charts, pie charts).
- Task 8: Generate correlation heatmaps to identify relationships between numerical features.
- Task 9: Use pair plots to visualize relationships between features.

3. Feature Engineering
- Task 10: Create new features that might be useful for the analysis (e.g., date-related features
from timestamps, interaction terms).
- Task 11: Standardize or normalize numerical features if needed.

4. Model Building
- Task 12: Split the dataset into training and testing sets.
- Task 13: Train a simple linear regression model (if the task is regression) or a logistic
regression model (if the task is classification).
- Task 14: Evaluate the model performance using appropriate metrics (e.g., RMSE for
regression, accuracy/F1-score for classification).
- Task 15: Experiment with at least two other algorithms (e.g., decision tree, random forest,
k-nearest neighbors) and compare their performance.

5. Model Tuning
- Task 16: Perform hyperparameter tuning using GridSearchCV or RandomizedSearchCV.
- Task 17: Evaluate and compare the tuned models’ performance.

6. Data Visualization with Power BI

- Task 18: Import the cleaned and preprocessed dataset into Power BI.
- Task 19: Create interactive dashboards to visualize key insights from the data, such as:
- Distribution of numerical features
- Comparison of categorical features
- Correlation heatmap
- Key model metrics and performance indicators
- Task 20: Use Power BI features to allow dynamic exploration of the data (e.g., slicers, filters).

7. Reporting
- Task 21: Summarize the findings and results in a Jupyter Notebook (.ipynb file), including
visualizations and explanations.
- Task 22: Create a final report or presentation summarizing the entire process and key insights,
integrating Power BI visualizations.

8. Optional Advanced Tasks

- Task 23: Deploy the model using a simple web application (e.g., Flask, Streamlit).
- Task 24: Perform additional analysis such as time-series forecasting if the dataset has a time
component.

Note: Submit the project in .ipynb format along with the presentation file(report).

Chapter 2 Routine and Non Routine Problem
100% (1)
Chapter 2 Routine and Non Routine Problem
16 pages
ENG Chopra DynamicsofStructures 6E
0% (1)
ENG Chopra DynamicsofStructures 6E
1 page
Maths Class Ix Chapter 01 02 and 03 Practice Paper 01 Answers
67% (3)
Maths Class Ix Chapter 01 02 and 03 Practice Paper 01 Answers
6 pages
Predictive Modeling (MP) Project Report
100% (1)
Predictive Modeling (MP) Project Report
73 pages
Masters in Public Administration Course of Study Curriculum
100% (1)
Masters in Public Administration Course of Study Curriculum
15 pages
Achievement Test
No ratings yet
Achievement Test
17 pages
Torque Values For Nut
No ratings yet
Torque Values For Nut
1 page
Milestone
No ratings yet
Milestone
7 pages
ChemPhysChem - 2018 - Mayerhöfer - Beer S Law Why Absorbance Depends Almost Linearly On Concentration
No ratings yet
ChemPhysChem - 2018 - Mayerhöfer - Beer S Law Why Absorbance Depends Almost Linearly On Concentration
5 pages
Aero Engg Mock Board Exam Mathematics 2014-Answer Keys
No ratings yet
Aero Engg Mock Board Exam Mathematics 2014-Answer Keys
6 pages
Techniques of Integration
No ratings yet
Techniques of Integration
17 pages
Assignment JTW115E 2023-2024 v5
No ratings yet
Assignment JTW115E 2023-2024 v5
5 pages
04 Exercise Solutions e PDF
No ratings yet
04 Exercise Solutions e PDF
15 pages
Machine Learning Project Checklist
100% (1)
Machine Learning Project Checklist
10 pages
DAS601 Project
No ratings yet
DAS601 Project
7 pages
Data Analysis and Data Science Task - 1
No ratings yet
Data Analysis and Data Science Task - 1
3 pages
Project Guidelines (ISE-291 - T 241)
No ratings yet
Project Guidelines (ISE-291 - T 241)
3 pages
Design of Beam
No ratings yet
Design of Beam
70 pages
Partial Differential Equations
No ratings yet
Partial Differential Equations
45 pages
Project On Data Mining: Prepared by Ashish Pavan Kumar K PGP-DSBA at Great Learning
No ratings yet
Project On Data Mining: Prepared by Ashish Pavan Kumar K PGP-DSBA at Great Learning
50 pages
Hgs Phase II
No ratings yet
Hgs Phase II
27 pages
Java Module Part1
No ratings yet
Java Module Part1
74 pages
Capstone Project Synopsis
No ratings yet
Capstone Project Synopsis
36 pages
Kavin
No ratings yet
Kavin
13 pages
MAT 1100 Inequalities - 2020
No ratings yet
MAT 1100 Inequalities - 2020
15 pages
Buble Sort
No ratings yet
Buble Sort
97 pages
Data - Science - Manaul (Te)
No ratings yet
Data - Science - Manaul (Te)
78 pages
ML Checklist PDF
No ratings yet
ML Checklist PDF
4 pages
Tugas FTF - Annisa Vada Febriani - 2307054003 - P5
No ratings yet
Tugas FTF - Annisa Vada Febriani - 2307054003 - P5
29 pages
MPRA Paper 83458
No ratings yet
MPRA Paper 83458
32 pages
Phase 2
No ratings yet
Phase 2
14 pages
Finaldoc
No ratings yet
Finaldoc
19 pages
Subject - Machine Learning Group - E27-24 Name
No ratings yet
Subject - Machine Learning Group - E27-24 Name
18 pages
Zernik e Polynomials A Guide Final
No ratings yet
Zernik e Polynomials A Guide Final
18 pages
Arsalan Shirzad's Mini Projects Portfolio
No ratings yet
Arsalan Shirzad's Mini Projects Portfolio
24 pages
Support Vector Machine
No ratings yet
Support Vector Machine
21 pages
Project - Data Mining: Bank - Marketing - Part1 - Data - CSV
No ratings yet
Project - Data Mining: Bank - Marketing - Part1 - Data - CSV
4 pages
The Rubber Ball Project JC
No ratings yet
The Rubber Ball Project JC
10 pages
CHAPTER 3 - Removed
No ratings yet
CHAPTER 3 - Removed
18 pages
Data Mining & Machine Learning Courseoutline
No ratings yet
Data Mining & Machine Learning Courseoutline
7 pages
Python - Data Analysis
No ratings yet
Python - Data Analysis
11 pages
Sample Phase 2 Document
No ratings yet
Sample Phase 2 Document
7 pages
Reliability in Pavement Design: Paola Dalla Valle, Nick Thom
No ratings yet
Reliability in Pavement Design: Paola Dalla Valle, Nick Thom
15 pages
ITECH2302 MainAssessment Report
No ratings yet
ITECH2302 MainAssessment Report
8 pages
A Structured Learning Guide For Becoming A Data Scientist
No ratings yet
A Structured Learning Guide For Becoming A Data Scientist
9 pages
Naan Mudhalvan Phase 2
No ratings yet
Naan Mudhalvan Phase 2
13 pages
Index: SR. NO. Practical Name Date of Perform NO. Sign
No ratings yet
Index: SR. NO. Practical Name Date of Perform NO. Sign
28 pages
Machine Learning
No ratings yet
Machine Learning
7 pages
REVIEWER
No ratings yet
REVIEWER
9 pages
Final Document
No ratings yet
Final Document
14 pages
Matplotlib Project Report AIPT
No ratings yet
Matplotlib Project Report AIPT
6 pages
AS Physics Mechanics Newtons Laws Answers OCR AQA Edexcel Ms
No ratings yet
AS Physics Mechanics Newtons Laws Answers OCR AQA Edexcel Ms
6 pages
Dsbda Lab - 1 - 1736243987425
No ratings yet
Dsbda Lab - 1 - 1736243987425
10 pages
Measure of Dispersion
No ratings yet
Measure of Dispersion
11 pages
Yangon Wind Speed
No ratings yet
Yangon Wind Speed
5 pages
Each Stage of A Data Mining Project
No ratings yet
Each Stage of A Data Mining Project
5 pages
Chirality-Controlled Spin Scattering Through Quantum
No ratings yet
Chirality-Controlled Spin Scattering Through Quantum
8 pages
Phase-2 For DS
No ratings yet
Phase-2 For DS
6 pages
Assignment 3-PDS Python-24S3
No ratings yet
Assignment 3-PDS Python-24S3
5 pages
Data Analyst Specialist - Projects Ideas
No ratings yet
Data Analyst Specialist - Projects Ideas
6 pages
Project2 - 158755. 4.21
No ratings yet
Project2 - 158755. 4.21
3 pages
Final Project Guidelines: Dataset Selection & Planning
No ratings yet
Final Project Guidelines: Dataset Selection & Planning
3 pages
Module 3 Notes
No ratings yet
Module 3 Notes
5 pages
FinalProject Instruction
No ratings yet
FinalProject Instruction
5 pages
Model Test 2
No ratings yet
Model Test 2
6 pages
III Unit
No ratings yet
III Unit
4 pages
Data Analyst Specialist - Projects Ideas
No ratings yet
Data Analyst Specialist - Projects Ideas
6 pages
BDA Lab 9 Manual
No ratings yet
BDA Lab 9 Manual
3 pages
Final Project
No ratings yet
Final Project
4 pages
A1991370857 65680 10 2025 Csm355ca1
No ratings yet
A1991370857 65680 10 2025 Csm355ca1
6 pages
Advance Python
No ratings yet
Advance Python
5 pages
ASSIGNMENT 2 (Business Analytics For Managers)
No ratings yet
ASSIGNMENT 2 (Business Analytics For Managers)
5 pages
Project Guidelines Credit Score Classification
No ratings yet
Project Guidelines Credit Score Classification
3 pages
F3401201815 - Raihan Rivellino Adzani - LAPORAN BAB 5
No ratings yet
F3401201815 - Raihan Rivellino Adzani - LAPORAN BAB 5
4 pages
AI Course Help Guide
No ratings yet
AI Course Help Guide
3 pages
Mid Term Project
No ratings yet
Mid Term Project
3 pages
Group Assignment 01
No ratings yet
Group Assignment 01
3 pages
Data Preparation Basics#
No ratings yet
Data Preparation Basics#
2 pages
Notes Potential Flow Around Cylinder
No ratings yet
Notes Potential Flow Around Cylinder
4 pages
Techorbit - KiranInumula - Machine Learning - 4.08 - Yrs - Ganji Nagasai
No ratings yet
Techorbit - KiranInumula - Machine Learning - 4.08 - Yrs - Ganji Nagasai
4 pages
Java - Util.Inputmismatchexception Java - Util.Scanner Java - Util.Stack
No ratings yet
Java - Util.Inputmismatchexception Java - Util.Scanner Java - Util.Stack
3 pages
Machine Learning Assignment-02
No ratings yet
Machine Learning Assignment-02
2 pages
Lab Questionbank
No ratings yet
Lab Questionbank
3 pages
Capstone Project Assignment
No ratings yet
Capstone Project Assignment
3 pages
Dsur Ea2352001010391 W7
No ratings yet
Dsur Ea2352001010391 W7
3 pages
1data Cleansing Cheklist
No ratings yet
1data Cleansing Cheklist
2 pages
Final Coursework - 24.2 Ad Cert Python
No ratings yet
Final Coursework - 24.2 Ad Cert Python
2 pages
19-10-2024 SR - Super60 Nucleus&Sterling-bt Jee-Main Rptm-11&14 Final Key
No ratings yet
19-10-2024 SR - Super60 Nucleus&Sterling-bt Jee-Main Rptm-11&14 Final Key
1 page
DATA MINING AND MACHINE LEARNING. PREDICTIVE TECHNIQUES: REGRESSION, GENERALIZED LINEAR MODELS, SUPPORT VECTOR MACHINE AND NEURAL NETWORKS
From Everand
DATA MINING AND MACHINE LEARNING. PREDICTIVE TECHNIQUES: REGRESSION, GENERALIZED LINEAR MODELS, SUPPORT VECTOR MACHINE AND NEURAL NETWORKS
César Pérez López
No ratings yet
Mastering Data Structures and Algorithms in Python & Java
From Everand
Mastering Data Structures and Algorithms in Python & Java
Sachin Naha
No ratings yet