0% found this document useful (0 votes)

21 views27 pages

Vmaf Icip17

Uploaded by

Ayoub J•シ

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

21 views27 pages

Vmaf Icip17

Uploaded by

Ayoub J•シ

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 27

Measuring perceptual video

quality with VMAF

Zhi Li
Video Algorithms, Netflix

9/18/17 @ ICIP 2017

Outline

● The need for a better quality metric for video

● How VMAF works
● VMAF open-source project
Ways to measure video quality

Subjective Assessment Automated Assessment

using PSNR, SSIM, or VMAF
PSNR 37.3 dB
PSNR 32.9 dB
Need a better perceptual metric

● Accurately measures human perception of quality

● Consistent across content
● Can be run at scale
● Works well relevant to adaptive streaming
○ Compression artifacts
○ Scaling artifacts

VMAF: Video Multimethod Assessment Fusion

PSNR 37.1 dB, VMAF 71.1
PSNR 32.9 dB, VMAF 70.2
PSNR 29.1 dB, VMAF 20.4
PSNR 29.3 dB, VMAF 69.8
Video Multimethod Assessment Fusion
● Full-reference video quality metric

● Combines multiple elementary quality metrics

○ Visual quality fidelity (VIF*) @ 4 scales
○ Detail loss measure (DLM**)
○ Temporal information (TI) - average pixel difference between adj. frames

● Machine-learning regression to predict a final “fused” score, guided

by subjective data
*Visual Information Fidelity - H. Sheikh and A. Bovik, “Image Information and Visual Quality”.

**Detail Loss Measure - S. Li, F. Zhang, L. Ma, and K. Ngan, “Image Quality Assessment by
Separately Evaluating Detail Losses and Additive Impairments”.
How VMAF works
Pixel Neighborhood Frame Level
spatial feature
within-frame
extraction
spatial pooling
(VIF, DLM)

temporal feature
extraction (TI) temporal
pooling

training with trained SVM

per-frame score
subjective data model prediction
“Fusion”
The
Power
Of
Fusion
DLM TI

*Tested on LIVE
Video Database
Performance evaluation
● SROCC: Spearman Rank Order Correlation Coefficient
● PLCC: Pearson Linear Correlation Coefficient
● RMSE: Root Mean Squared Error [ sqrt(mean((y - x)2)) ]

Source: Wikipedia
Results

SRCC PCC RMSE SRCC PCC RMSE

PSNR 0.746 0.725 24.577 PSNR 0.416 0.394 16.934
SSIM* 0.603 0.417 40.686 SSIM* 0.658 0.618 12.340
MS FastSSIM* 0.685 0.605 31.233 MS FastSSIM* 0.566 0.561 13.691
PSNR-HVS* 0.845 0.839 18.537 PSNR-HVS* 0.589 0.595 13.213
VMAF v0.6.1 0.931 0.948 10.616 VMAF v0.6.1 0.727 0.709 10.877

NFLX-TEST Dataset LIVE Video Database

(Compression-relevant impairments)

*https://github.com/xiph/daala/tree/master/tools
VMAF: advantages and limitations

● Evolvability: can easily incorporate new metrics for better accuracy

● Limited applicability: accuracy and scope are as good as training data

○ Generalization is not guaranteed
○ Default VMAF model: 1080p pristine source from Netflix catalog,
living room viewing condition (3*height)

● Customizability: metrics/training data can be tailored

○ Examples: content, artifacts, viewing conditions
○ Build model for your specific application
VMAF open-source project
https://github.com/Netflix/vmaf
Usages

● Basic
○ ./run_vmaf: python wrapper calling c executable
○ wrapper/vmafossexec: c++ wrapper
○ ./ffmpeg2vmaf: piping FFmpeg with VMAF
● Advanced
○ ./run_vmaf_training: train a new VMAF model
○ ./run_testing: validate VMAF model on a dataset
VMAF phone model

Predict how the quality of a

video is perceived when
viewed on a mobile device
720 1080
Adoption and external contributions
● Adoption
○ Alliance for Open Media (AOM)
○ http://arewecompressedyet.com
○ Academic papers start evaluating/using VMAF
○ ...
● External contributions
○ libvmaf library
○ FFmpeg integration
○ Docker support
○ Windows/Visual Studio support
○ ...
How you can contribute

● Report bugs, request features, implement features

● Integrate new metrics
● Share subjective dataset
● Share trained models
● … and many more
Backup Slides
How to train a VMAF model
To begin with: run a subjective test

● Example: subjective test for VMAF 0.6.1 (1080p model)

○ Source: 23 videos, each 10-sec long, selected from Netflix catalog
○ Distortion: each source video is encoded with 6 resolutions up to
1080p, and 3 quality parameters (in total 18 impaired per source)
○ Subjects: ~55
○ Selective sampling: not all videos were viewed by each subject
○ Test methodology: absolute category rating (ACR)
■ Subject is instructed to watch an impaired video and give a
rating on a continuous scale from bad to excellent
Collect data in a dataset file
example_raw_dataset.py
Dataset validation

● ./run_testing PSNR NFLX_dataset_raw.py --cache-result

Train a new model
● Training:
○ ./run_vmaf_training NFLX_dataset_raw.py
resource/feature_param/vmaf_feature_v3.py
resource/model_param/libsvmnusvr_v3.py test_model.pkl
--cache-result
● Testing:
○ ./run_testing VMAF LIVEVideo_dataset.py --vmaf-model
test_model.pkl --cache-result
● Single run:
○ ./run_vmaf yuv420p 576 324
python/test/resource/yuv/src01_hrc00_576x324.yuv
python/test/resource/yuv/src01_hrc01_576x324.yuv --model
test_model.pkl --out-fmt xml

Final Year Project Report
100% (1)
Final Year Project Report
59 pages
Fast VP Deep Dive
No ratings yet
Fast VP Deep Dive
60 pages
CNN-VGG16 Hybrid Model For Onion Purple Blotch Disease Severity Multi-Level Grading
No ratings yet
CNN-VGG16 Hybrid Model For Onion Purple Blotch Disease Severity Multi-Level Grading
5 pages
Explain Machine Learning Model Using SHAP
No ratings yet
Explain Machine Learning Model Using SHAP
28 pages
Wan Video Research Paper
No ratings yet
Wan Video Research Paper
60 pages
Vision Transformer & How They Work
No ratings yet
Vision Transformer & How They Work
6 pages
Tesi
No ratings yet
Tesi
113 pages
m41993 OMAF Overview 20171210 d06
No ratings yet
m41993 OMAF Overview 20171210 d06
105 pages
Openai O1 System Card: December 5, 2024
No ratings yet
Openai O1 System Card: December 5, 2024
52 pages
Unit 3 1 Aiml Notes
No ratings yet
Unit 3 1 Aiml Notes
43 pages
1 - An Introduction To SHAP Values and Machine Learning Interpretability - DataCamp
No ratings yet
1 - An Introduction To SHAP Values and Machine Learning Interpretability - DataCamp
12 pages
Video On Demand (VOD) : Technical Data Deck
No ratings yet
Video On Demand (VOD) : Technical Data Deck
59 pages
Lecture 10 Introduction To Video Processing & Applications: CSE 489-02 & CSE 589-02 Multimedia Processing
No ratings yet
Lecture 10 Introduction To Video Processing & Applications: CSE 489-02 & CSE 589-02 Multimedia Processing
104 pages
Corporatepresentation20152 150529012243 Lva1 App6891
No ratings yet
Corporatepresentation20152 150529012243 Lva1 App6891
51 pages
Proposal FadelThariqGifari
No ratings yet
Proposal FadelThariqGifari
51 pages
Data Pruning
No ratings yet
Data Pruning
52 pages
A Survey On Perceptually Optimized Video Coding
No ratings yet
A Survey On Perceptually Optimized Video Coding
36 pages
AIX.5L AU75 Virtualization Performance Management Student Guide
No ratings yet
AIX.5L AU75 Virtualization Performance Management Student Guide
392 pages
Vqeg Sam 2018 111 Analysistoolsinvmaf
No ratings yet
Vqeg Sam 2018 111 Analysistoolsinvmaf
30 pages
Research Notes
No ratings yet
Research Notes
9 pages
Video Classification Project
No ratings yet
Video Classification Project
52 pages
The Lecture Contains:: Lecture 41: Performance Measures, Intraframe Coding, Predictive and Transform Coding
No ratings yet
The Lecture Contains:: Lecture 41: Performance Measures, Intraframe Coding, Predictive and Transform Coding
9 pages
Copie de AI Speech Classifier Pitch Deck by Slidesgo
No ratings yet
Copie de AI Speech Classifier Pitch Deck by Slidesgo
29 pages
Per Title SMC2021-1
No ratings yet
Per Title SMC2021-1
38 pages
Vision Processing Unit
No ratings yet
Vision Processing Unit
44 pages
Intro To IPMV
No ratings yet
Intro To IPMV
28 pages
MAGVIT Masked Generative Video Transformer
No ratings yet
MAGVIT Masked Generative Video Transformer
30 pages
AMT All Pairs Multi Field Transforms For Efficient Frame Interpolation
No ratings yet
AMT All Pairs Multi Field Transforms For Efficient Frame Interpolation
21 pages
VQA ViT
No ratings yet
VQA ViT
24 pages
fMRI Data Quality Assurance and Preprocessing
No ratings yet
fMRI Data Quality Assurance and Preprocessing
84 pages
6 Batchnorm
No ratings yet
6 Batchnorm
30 pages
On VMAF's Property in The Presence of Image Enhancement Operations
No ratings yet
On VMAF's Property in The Presence of Image Enhancement Operations
27 pages
22cs503 Machine Learning - Unit - III
No ratings yet
22cs503 Machine Learning - Unit - III
73 pages
Final Report of Mini Project
No ratings yet
Final Report of Mini Project
52 pages
Internet of Things
No ratings yet
Internet of Things
52 pages
19MIS0424 Yerram Karthik
No ratings yet
19MIS0424 Yerram Karthik
72 pages
Evaluation and Prediction of Transportation Resilience Under Extreme Weather Events A Diffusion Graph Convolutional Approach
No ratings yet
Evaluation and Prediction of Transportation Resilience Under Extreme Weather Events A Diffusion Graph Convolutional Approach
20 pages
Motionmag Siggraph2005
No ratings yet
Motionmag Siggraph2005
30 pages
Mambavision: A Hybrid Mamba-Transformer Vision Backbone: Ali Hatamizadeh, Jan Kautz Nvidia
No ratings yet
Mambavision: A Hybrid Mamba-Transformer Vision Backbone: Ali Hatamizadeh, Jan Kautz Nvidia
13 pages
Group 43
No ratings yet
Group 43
11 pages
Movinets: Mobile Video Networks For Efficient Video Recognition
No ratings yet
Movinets: Mobile Video Networks For Efficient Video Recognition
21 pages
Unit 3 - Machine Learning - WWW - Rgpvnotes.in
No ratings yet
Unit 3 - Machine Learning - WWW - Rgpvnotes.in
29 pages
Planet Techspec Carbon
No ratings yet
Planet Techspec Carbon
15 pages
LinRegDroid Detection of Android Malware Using Multiple Linear Regression Models-Based Classifiers
No ratings yet
LinRegDroid Detection of Android Malware Using Multiple Linear Regression Models-Based Classifiers
14 pages
Comprehensive Survey of Model Compression and Speed Up For Vision Transformers - Chen Et Al
No ratings yet
Comprehensive Survey of Model Compression and Speed Up For Vision Transformers - Chen Et Al
12 pages
UHD Database Focus On Smart Cities and Smart Trans
No ratings yet
UHD Database Focus On Smart Cities and Smart Trans
19 pages
An Industry Perspective On VVG Research
No ratings yet
An Industry Perspective On VVG Research
24 pages
An Overview of Omnidirectional MediA Format OMAF
No ratings yet
An Overview of Omnidirectional MediA Format OMAF
17 pages
Paper 1
No ratings yet
Paper 1
14 pages
30 Page Sample Format For Project Report of DT
No ratings yet
30 Page Sample Format For Project Report of DT
30 pages
Gao SimVP Simpler Yet Better Video Prediction CVPR 2022 Paper
No ratings yet
Gao SimVP Simpler Yet Better Video Prediction CVPR 2022 Paper
11 pages
NVIDIA Video Codec SDK 6.0 High-Performance-Video PDF
No ratings yet
NVIDIA Video Codec SDK 6.0 High-Performance-Video PDF
34 pages
Semantically Video Coding: Instill Static-Dynamic Clues Into Structured Bitstream For AI Tasks
No ratings yet
Semantically Video Coding: Instill Static-Dynamic Clues Into Structured Bitstream For AI Tasks
14 pages
VMS Datasheet
No ratings yet
VMS Datasheet
17 pages
5 J MST 87 2023 40 49 7279
No ratings yet
5 J MST 87 2023 40 49 7279
10 pages
Code Instructions
No ratings yet
Code Instructions
5 pages
Paper 3
No ratings yet
Paper 3
7 pages
XDV
No ratings yet
XDV
54 pages
Federated Learning For Iot Intrusion Detection: Riccardo Lazzarini, Huaglory Tianfield and Vassilis Charissis
No ratings yet
Federated Learning For Iot Intrusion Detection: Riccardo Lazzarini, Huaglory Tianfield and Vassilis Charissis
22 pages
AI Associate
No ratings yet
AI Associate
11 pages
AINA Conf 06550411
No ratings yet
AINA Conf 06550411
6 pages
Data Analysis On Video Streaming QoE Over Mobile Networks
No ratings yet
Data Analysis On Video Streaming QoE Over Mobile Networks
10 pages
IOT Based Pothole Detection and Notification System: S. Gnanapriya, V.B. Padmashree, V. Bagyalakshmi and G.A. Pravallikha
No ratings yet
IOT Based Pothole Detection and Notification System: S. Gnanapriya, V.B. Padmashree, V. Bagyalakshmi and G.A. Pravallikha
8 pages
Contrastive Learning With Semantic Consistency Constraint
No ratings yet
Contrastive Learning With Semantic Consistency Constraint
9 pages
2017.study On The Accuracy of QoE Monitoring For HTTP Adaptive Video Streaming Using VNF
No ratings yet
2017.study On The Accuracy of QoE Monitoring For HTTP Adaptive Video Streaming Using VNF
6 pages
BERT Fine-Tuning For Sentiment Analysis On Indonesian Mobile Apps Reviews
No ratings yet
BERT Fine-Tuning For Sentiment Analysis On Indonesian Mobile Apps Reviews
10 pages
A Classification and Regression Tree Algorithm For Heart Disease Modeling and Prediction
No ratings yet
A Classification and Regression Tree Algorithm For Heart Disease Modeling and Prediction
9 pages
Paper 5
No ratings yet
Paper 5
4 pages
Features For Benchmarking The Video Accuracy
No ratings yet
Features For Benchmarking The Video Accuracy
4 pages
22IZ023 Nikhil - Exercise 7 A - Decision Trees
No ratings yet
22IZ023 Nikhil - Exercise 7 A - Decision Trees
4 pages
Part 1 - Introduction To AI
No ratings yet
Part 1 - Introduction To AI
3 pages
Overview of SimVP
No ratings yet
Overview of SimVP
3 pages
Spring 2025 - CS619 - 10921
No ratings yet
Spring 2025 - CS619 - 10921
2 pages
Fps
No ratings yet
Fps
2 pages
Clustering and Visualisation of Data - 2020
No ratings yet
Clustering and Visualisation of Data - 2020
5 pages
Football Match Winner Prediction
No ratings yet
Football Match Winner Prediction
3 pages
Parkinsons Disease Prediction - Ieee
No ratings yet
Parkinsons Disease Prediction - Ieee
5 pages
New Model To Predict Bearing Capacity of Shallow F
No ratings yet
New Model To Predict Bearing Capacity of Shallow F
18 pages
White Paper: How To Do Objective Video Testing: 1566 La Pradera DR Campbell, CA 95008 408-379-6952
No ratings yet
White Paper: How To Do Objective Video Testing: 1566 La Pradera DR Campbell, CA 95008 408-379-6952
3 pages
MambaVision: NVIDIA's Hybrid Vision Transformer For AI
No ratings yet
MambaVision: NVIDIA's Hybrid Vision Transformer For AI
8 pages
Real-Time Stock Forecasting: Leveraging Live Data and Advanced Algorithms For Accurate Predictions
No ratings yet
Real-Time Stock Forecasting: Leveraging Live Data and Advanced Algorithms For Accurate Predictions
8 pages
Mastering Video Coding A Comprehensive Dive From Tools To Consumer Deployment
No ratings yet
Mastering Video Coding A Comprehensive Dive From Tools To Consumer Deployment
8 pages
Neat Video Noise Reduction Plug-In For VirtualDub Quick Start Guide
No ratings yet
Neat Video Noise Reduction Plug-In For VirtualDub Quick Start Guide
2 pages
Subtitle
No ratings yet
Subtitle
3 pages
Vision Mamba: Rethinking Visual Representation With Bidirectional LSTMs
No ratings yet
Vision Mamba: Rethinking Visual Representation With Bidirectional LSTMs
7 pages
08 Android Multimedia Framework Overview
No ratings yet
08 Android Multimedia Framework Overview
29 pages
Video Quality Measurement Standards - Current Status and Trends
No ratings yet
Video Quality Measurement Standards - Current Status and Trends
5 pages

Vmaf Icip17

Uploaded by

Vmaf Icip17

Uploaded by

Measuring perceptual video

quality with VMAF

9/18/17 @ ICIP 2017

● The need for a better quality metric for video

Subjective Assessment Automated Assessment

● Accurately measures human perception of quality

VMAF: Video Multimethod Assessment Fusion

● Combines multiple elementary quality metrics

● Machine-learning regression to predict a final “fused” score, guided

training with trained SVM

SRCC PCC RMSE SRCC PCC RMSE

NFLX-TEST Dataset LIVE Video Database

● Evolvability: can easily incorporate new metrics for better accuracy

● Limited applicability: accuracy and scope are as good as training data

● Customizability: metrics/training data can be tailored

Predict how the quality of a

● Report bugs, request features, implement features

● Example: subjective test for VMAF 0.6.1 (1080p model)

● ./run_testing PSNR NFLX_dataset_raw.py --cache-result

You might also like