0% found this document useful (0 votes)

20 views6 pages

Report

Abc

Uploaded by

Umaid Ali Keerio

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

20 views6 pages

Report

Abc

Uploaded by

Umaid Ali Keerio

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

You are on page 1/ 6

Classification of Wine Quality Using Machine

Learning Models

i. Team Information
Members:

 Member 1: [Name], ID: [ID], Signature: [Signature]

 Member 2: [Name], ID: [ID], Signature: [Signature]
 Member 3: [Name], ID: [ID], Signature: [Signature]
 Member 4: [Name], ID: [ID], Signature: [Signature]

Abstract
The wine industry relies heavily on maintaining consistent quality standards to meet customer
expectations and ensure brand reputation. This project investigates the use of machine
learning models to automate the process of wine quality classification, thereby reducing
reliance on subjective and time-consuming sensory evaluations.

We applied five machine learning algorithms—Logistic Regression, Decision Trees, Support

Vector Machines (SVM), K-Nearest Neighbors (KNN), and Neural Networks—to predict
wine quality based on physicochemical properties. Evaluation metrics such as accuracy,
precision, recall, F1-score, and ROC-AUC were used to measure performance. Neural
Networks outperformed other models, achieving an accuracy of 80.5%, demonstrating their
effectiveness for complex classification tasks.

ii. Introduction
Context and Importance:

Wine quality significantly influences consumer satisfaction and purchasing decisions in the
competitive beverage industry. Traditional quality assessment methods rely on human tasters,
introducing subjectivity and variability into the process. Machine learning provides an
opportunity to automate and standardize this evaluation, ensuring consistency, reducing costs,
and offering valuable insights into the production process.

Objectives:

1. Develop and train machine learning models to classify wine quality using
physicochemical properties.
2. Evaluate the performance of these models using appropriate metrics.
3. Identify the model best suited for wine quality classification and explore its practical
applications.

This study aims to provide actionable insights into applying machine learning for automated
quality control in wine production.

iii. Background
Machine Learning in Quality Control:

Machine learning is widely used across industries for tasks such as defect detection, anomaly
detection, and classification. In the beverage industry, it has been applied to optimize
production processes, ensure consistent product quality, and enhance customer satisfaction.

Related Work:

1. Studies highlight the success of ensemble models (e.g., Random Forest, Gradient
Boosting) in handling non-linear relationships and noisy datasets.
2. Simple models like Logistic Regression are valued for their interpretability, though
they often underperform in complex tasks.
3. Neural Networks and SVM are well-regarded for their ability to model non-linear
relationships, but they require more computational resources.

This project builds on these findings, balancing interpretability and accuracy to determine the
best approach for wine quality classification.

iv. Dataset
Source and Description:

The dataset used is the Wine Quality Dataset, sourced from the UCI Machine Learning
Repository. It includes data on 1,599 red wine samples from Portugal's vineyards.

Features and Target Variable:

1. Input Features: 11 physicochemical properties, including:

o Fixed acidity, volatile acidity, citric acid, residual sugar, chlorides, free sulfur
dioxide, total sulfur dioxide, density, pH, sulfates, and alcohol.
2. Target Variable: A wine quality score ranging from 0 to 10, determined by sensory
evaluations.
Challenges:

1. Class Imbalance: Quality scores are skewed toward certain values (e.g., 5 and 6),
requiring preprocessing techniques to address imbalance.
2. Multicollinearity: Some features may be highly correlated, potentially impacting
model performance.

Preprocessing Steps:

1. Class Balancing: SMOTE (Synthetic Minority Oversampling Technique) was used to

create synthetic samples for underrepresented classes.
2. Feature Selection: Random Forest identified the 8 most important features to reduce
noise and improve model performance.
3. Scaling: StandardScaler normalized feature values to ensure equal weighting during
model training.

v. Methodology
Model Development:

We implemented five models, each tailored to address specific challenges in the dataset:

1. Logistic Regression:
o Used multinomial logistic regression for multi-class classification.
o Hyperparameter tuning was performed using GridSearchCV to optimize
performance.

2. Decision Tree:
o Limited tree depth to prevent overfitting.
o Captured non-linear relationships between features and quality scores.

3. SVM (Support Vector Machine):

o Employed an RBF kernel to handle non-linear decision boundaries.
o Configured probability outputs for ROC analysis.

4. KNN (K-Nearest Neighbors):

o Weighted neighbors by distance to improve classification in overlapping
regions.
o Optimized the number of neighbors (k) to balance bias and variance.

5. Neural Networks:
o Designed a feedforward architecture with two hidden layers (128 and 64
neurons) and ReLU activation.
o Configured dropout layers to reduce overfitting.
Evaluation Metrics:

1. Accuracy: Proportion of correct predictions.

2. Precision, Recall, and F1-Score: Evaluated the balance between false positives and
false negatives.
3. ROC Curves: Visualized the trade-offs between sensitivity and specificity for each
model.

vi. Results

Model Accuracy Precision Recall F1-Score

Logistic
36.7% 35.6% 36.7% 35.2%
Regression
Decision Tree 63.5% 63.3% 63.5% 63.1%
SVM 72.8% 72.5% 72.8% 72.3%
KNN 79.9% 79.1% 79.9% 79.3%
Neural Network 80.5% 80.4% 80.5% 80.2%

Key Observations

1. Neural Networks achieved the highest accuracy, followed closely by KNN.

2. Logistic Regression performed poorly due to its linear assumptions.
3. SVM and Decision Trees demonstrated moderate performance.

Visualizations

 Confusion Matrices: Showed that Neural Networks consistently reduced

misclassifications across classes.
 ROC Curves: Highlighted superior performance of Neural Networks and KNN in
distinguishing between classes.
Confusion Matrix Graphs for all Models

vii. Discussion
Analysis of Results:

 Neural Networks captured complex patterns and delivered the best results across all
metrics.
 KNN performed nearly as well, highlighting its suitability for moderately complex
datasets.
 Logistic Regression struggled due to its linear assumptions, highlighting its
limitations for non-linear problems.

Comparison

Metric Logistic Decision SVM KNN Neural

Regression Tree Network
Accuracy 36.7% 63.5% 72.8% 79.9% 80.5%
Precision 35.6% 63.3% 72.5% 79.1% 80.4%

Use Case Benefits:

1. Automated Quality Control: Reduces reliance on subjective human evaluations.

2. Production Insights: Identifies key factors influencing wine quality.
3. Improved Customer Satisfaction: Ensures consistent quality, building trust.

viii. Conclusion
This study demonstrated the effectiveness of machine learning for wine quality classification.
Neural Networks emerged as the top-performing model with an accuracy of 80.5%,
showcasing their potential for complex classification tasks. These findings highlight the
opportunity to integrate machine learning into wine production workflows, automating
quality control and optimizing processes.

ix. Future Work

1. Data Augmentation: Incorporate datasets for white wines and other varieties.
2. Advanced Architectures: Test convolutional and recurrent neural networks for
enhanced performance.
3. Explainability: Use SHAP or LIME to interpret model predictions.
4. Real-Time Applications: Develop predictive tools for real-time quality assessment in
production lines.

x. References
1. "Wine Quality Data Set," UCI Machine Learning Repository,
https://archive.ics.uci.edu/ml/datasets/wine+quality.
2. Géron, A., "Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow,"
2nd Edition, O'Reilly Media, 2019.
3. Scikit-learn Documentation, https://scikit-learn.org.
4. Chen, T., & Guestrin, C., "XGBoost: A Scalable Tree Boosting System," Proceedings
of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and
Data Mining, 2016.

Combined Synthetic Minority Oversampling Technique and Deep Neural Network For Red Wine Quality Prediction
No ratings yet
Combined Synthetic Minority Oversampling Technique and Deep Neural Network For Red Wine Quality Prediction
6 pages
Business Statistics: Fourth Canadian Edition
No ratings yet
Business Statistics: Fourth Canadian Edition
33 pages
Chapter 3
71% (7)
Chapter 3
4 pages
Wine Quality Classification
No ratings yet
Wine Quality Classification
36 pages
Machine Learning (16CIC73) Project Report Template
33% (3)
Machine Learning (16CIC73) Project Report Template
12 pages
Muet 2006 To 2019 Past Papers
100% (4)
Muet 2006 To 2019 Past Papers
148 pages
Cha 5
50% (4)
Cha 5
9 pages
Honours LY Project
No ratings yet
Honours LY Project
31 pages
Wine Quality Prediction Using Machine Learning Algorithms
100% (1)
Wine Quality Prediction Using Machine Learning Algorithms
4 pages
5th Sem Mini Project Synopsis 2
No ratings yet
5th Sem Mini Project Synopsis 2
2 pages
ML Project Report
No ratings yet
ML Project Report
12 pages
10.1007@978 981 13 7403 623
No ratings yet
10.1007@978 981 13 7403 623
9 pages
ML PR
No ratings yet
ML PR
32 pages
Mahima 2020
No ratings yet
Mahima 2020
8 pages
Wine Quality Prediction Report
No ratings yet
Wine Quality Prediction Report
2 pages
Performance Evaluation of Multiple Machine Learning Models For Wine Quality Prediction
No ratings yet
Performance Evaluation of Multiple Machine Learning Models For Wine Quality Prediction
15 pages
Big Data Projecct
No ratings yet
Big Data Projecct
12 pages
Wine Quality Prediction Project Report
No ratings yet
Wine Quality Prediction Project Report
4 pages
Machine Learning Miniproject
No ratings yet
Machine Learning Miniproject
10 pages
Wine Quality Prediction GHAR
No ratings yet
Wine Quality Prediction GHAR
19 pages
VinQCheck: An Intelligent Wine Quality Assessment
No ratings yet
VinQCheck: An Intelligent Wine Quality Assessment
9 pages
w15z3q
No ratings yet
w15z3q
10 pages
ML Mini Report
No ratings yet
ML Mini Report
6 pages
DWDM Glob
No ratings yet
DWDM Glob
20 pages
Mini Project Report
No ratings yet
Mini Project Report
12 pages
Finaldocmp
No ratings yet
Finaldocmp
40 pages
Wine Quality Prediction PoC Report
No ratings yet
Wine Quality Prediction PoC Report
2 pages
Wine Quality Predictor
0% (1)
Wine Quality Predictor
9 pages
ML Miniproject
No ratings yet
ML Miniproject
19 pages
Wine Quality Predictions
No ratings yet
Wine Quality Predictions
13 pages
Exploratory Data Analysis and Case
No ratings yet
Exploratory Data Analysis and Case
29 pages
1st Poster
No ratings yet
1st Poster
1 page
Humair Arshad Wine Quality Revised
No ratings yet
Humair Arshad Wine Quality Revised
16 pages
Wine Quality Prediction: Implementation
No ratings yet
Wine Quality Prediction: Implementation
3 pages
Machine Learning Based Predictive Modelling For The Enhancement of Wine Quality
No ratings yet
Machine Learning Based Predictive Modelling For The Enhancement of Wine Quality
18 pages
Irjmets Journal
No ratings yet
Irjmets Journal
7 pages
An Investigation of Wine Quality Testing Using Machine Learning Techniques
No ratings yet
An Investigation of Wine Quality Testing Using Machine Learning Techniques
8 pages
Wine Quality
No ratings yet
Wine Quality
8 pages
Wine Quality
100% (1)
Wine Quality
2 pages
S Selection Nofimp Portant Fe Machi Eatures A Ne Learn and Pred Ning Tech Dicting W Hniques Wine Qual Lity Using G
No ratings yet
S Selection Nofimp Portant Fe Machi Eatures A Ne Learn and Pred Ning Tech Dicting W Hniques Wine Qual Lity Using G
8 pages
Wine Quality Analysis
No ratings yet
Wine Quality Analysis
27 pages
Wine5 PDF
No ratings yet
Wine5 PDF
29 pages
Prediction of Wine Quality Using Machine Learning
100% (1)
Prediction of Wine Quality Using Machine Learning
12 pages
Wine Quality Prediction
No ratings yet
Wine Quality Prediction
22 pages
Red Wine Quality Prediction Using Machine Learning
No ratings yet
Red Wine Quality Prediction Using Machine Learning
4 pages
Wine Quality Prediction Using Machine Learning
No ratings yet
Wine Quality Prediction Using Machine Learning
10 pages
Wine Quality Dataset
No ratings yet
Wine Quality Dataset
2 pages
MLP Slides Merged
No ratings yet
MLP Slides Merged
480 pages
Data Set Information WINE QUALITY
100% (1)
Data Set Information WINE QUALITY
4 pages
University of Mauritius: Assignment On Supervised & Unsupervised Machine Learning Algorithms
No ratings yet
University of Mauritius: Assignment On Supervised & Unsupervised Machine Learning Algorithms
71 pages
In Vino Veritas Data Mining and Machine Learning Final Project
No ratings yet
In Vino Veritas Data Mining and Machine Learning Final Project
11 pages
Wine Quality Synopsis
No ratings yet
Wine Quality Synopsis
3 pages
Wine Quality Prediction Using ML PPR
100% (1)
Wine Quality Prediction Using ML PPR
8 pages
Vit Assignment 4
No ratings yet
Vit Assignment 4
1 page
Project CST 383
No ratings yet
Project CST 383
1,083 pages
Guillermo Garcia Rodriguez - Rivendel S.L
No ratings yet
Guillermo Garcia Rodriguez - Rivendel S.L
85 pages
DT-1 Project Report
No ratings yet
DT-1 Project Report
12 pages
Homework #1 - Hida Efri Nurfina
No ratings yet
Homework #1 - Hida Efri Nurfina
13 pages
Red Wine Quality Detection
No ratings yet
Red Wine Quality Detection
17 pages
Bài Tập Nhóm AI 1
No ratings yet
Bài Tập Nhóm AI 1
47 pages
Wine Quality Prediction Research Paper 22
No ratings yet
Wine Quality Prediction Research Paper 22
6 pages
Machine Learning On Wine Quality: Prediction and Feature Importance Analysis
No ratings yet
Machine Learning On Wine Quality: Prediction and Feature Importance Analysis
5 pages
DATA MINING and MACHINE LEARNING: CLUSTER ANALYSIS and kNN CLASSIFIERS. Examples with MATLAB
From Everand
DATA MINING and MACHINE LEARNING: CLUSTER ANALYSIS and kNN CLASSIFIERS. Examples with MATLAB
César Pérez López
No ratings yet
DATA MINING and MACHINE LEARNING. CLASSIFICATION PREDICTIVE TECHNIQUES: NAIVE BAYES, NEAREST NEIGHBORS and NEURAL NETWORKS: Examples with MATLAB
From Everand
DATA MINING and MACHINE LEARNING. CLASSIFICATION PREDICTIVE TECHNIQUES: NAIVE BAYES, NEAREST NEIGHBORS and NEURAL NETWORKS: Examples with MATLAB
César Pérez López
No ratings yet
Machine Learning Assignment 2: Assessment Type
No ratings yet
Machine Learning Assignment 2: Assessment Type
11 pages
Taask
No ratings yet
Taask
18 pages
Spring 2025 - SE601P - 1
No ratings yet
Spring 2025 - SE601P - 1
1 page
Trigonometric Notes With Tricks and Formulas)
No ratings yet
Trigonometric Notes With Tricks and Formulas)
64 pages
Std. 12th Perfect Maths Part - II
No ratings yet
Std. 12th Perfect Maths Part - II
29 pages
Practical Centre (Karachi)
No ratings yet
Practical Centre (Karachi)
11 pages
Learners Academy: Chemistry - XI (Chap - 02, Test - 02 - Liquid)
No ratings yet
Learners Academy: Chemistry - XI (Chap - 02, Test - 02 - Liquid)
2 pages
Scientific Facts in Quran: November 2015
No ratings yet
Scientific Facts in Quran: November 2015
4 pages
Homework 1 - Simple Linear Regression - Neal Pania
No ratings yet
Homework 1 - Simple Linear Regression - Neal Pania
4 pages
L4b - Perfomance Evaluation Metric - Regression
No ratings yet
L4b - Perfomance Evaluation Metric - Regression
6 pages
Real Statistics Examples Correlation Reliability
No ratings yet
Real Statistics Examples Correlation Reliability
404 pages
Job Profile / Description
No ratings yet
Job Profile / Description
2 pages
Data Science Q&A
No ratings yet
Data Science Q&A
4 pages
Living in The It Era Social Media App Chap 1 To 10
No ratings yet
Living in The It Era Social Media App Chap 1 To 10
104 pages
Estimating A VAR - Gretl
No ratings yet
Estimating A VAR - Gretl
9 pages
Capstone Project 2025
No ratings yet
Capstone Project 2025
64 pages
Thesis Proposal
No ratings yet
Thesis Proposal
4 pages
Allen Resume - Final
No ratings yet
Allen Resume - Final
1 page
FEM 3004 - Lab 8 - 24.12.20
No ratings yet
FEM 3004 - Lab 8 - 24.12.20
35 pages
BAN 602 - Project2
No ratings yet
BAN 602 - Project2
4 pages
Car Worksheets 2018 Ernesinia Alimagno
No ratings yet
Car Worksheets 2018 Ernesinia Alimagno
12 pages
Summative 4iii q4
No ratings yet
Summative 4iii q4
3 pages
Applied Statistic Poster
No ratings yet
Applied Statistic Poster
2 pages
Grade 9 (AI Project Cycle)
No ratings yet
Grade 9 (AI Project Cycle)
21 pages
Masteral ED 202 Activties To Be Answered
100% (1)
Masteral ED 202 Activties To Be Answered
15 pages
Linear Correlation (Pearson) : Assumptions
No ratings yet
Linear Correlation (Pearson) : Assumptions
2 pages
Business Intelligent - Assignment 1 - Greenwich FPT
No ratings yet
Business Intelligent - Assignment 1 - Greenwich FPT
15 pages
Time Series - pp04b
No ratings yet
Time Series - pp04b
46 pages
Data Science Techniques For Predictive Modelling and Decision Making Full Paper
No ratings yet
Data Science Techniques For Predictive Modelling and Decision Making Full Paper
4 pages
Seemingly Unrelated Regressions Stata Program and Output
No ratings yet
Seemingly Unrelated Regressions Stata Program and Output
4 pages
Group3 - Pilgrim Bank (A) Customer Profitability
No ratings yet
Group3 - Pilgrim Bank (A) Customer Profitability
13 pages
SBI PO Syllabus PDF
No ratings yet
SBI PO Syllabus PDF
2 pages
F Distribution
No ratings yet
F Distribution
16 pages
Contemporary Practice in Education Research Action Research Proposal Michael Allen - 110045956
No ratings yet
Contemporary Practice in Education Research Action Research Proposal Michael Allen - 110045956
19 pages
Automations With Ai For Youtube Channel
50% (2)
Automations With Ai For Youtube Channel
19 pages

Report

Uploaded by

Report

Uploaded by

Classification of Wine Quality Using Machine

 Member 1: [Name], ID: [ID], Signature: [Signature]

We applied five machine learning algorithms—Logistic Regression, Decision Trees, Support

Features and Target Variable:

1. Input Features: 11 physicochemical properties, including:

1. Class Balancing: SMOTE (Synthetic Minority Oversampling Technique) was used to

3. SVM (Support Vector Machine):

4. KNN (K-Nearest Neighbors):

1. Accuracy: Proportion of correct predictions.

Model Accuracy Precision Recall F1-Score

1. Neural Networks achieved the highest accuracy, followed closely by KNN.

 Confusion Matrices: Showed that Neural Networks consistently reduced

Metric Logistic Decision SVM KNN Neural

Use Case Benefits:

1. Automated Quality Control: Reduces reliance on subjective human evaluations.

ix. Future Work

You might also like