0% found this document useful (0 votes)

59 views18 pages

Audio/Speech Signal Processing: An Overview

This document discusses audio/speech signal processing. It provides an overview of application fields like FM broadcasting, music recording, and sound synthesis. It also describes common signal processing tasks like audio encoding/decoding using codecs, and digital filtering for audio effects. Specific techniques are explained like echo cancellation in voice calls, frequency-domain compression in codecs, and time-domain processing for echo effects. Resources for further learning about audio signal processing are provided.

Uploaded by

paul

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

59 views18 pages

Audio/Speech Signal Processing: An Overview

Uploaded by

paul

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 18

Audio/Speech Signal Processing

An Overview
Application Fields

Audio Processor: FM Broadcasting

Sound Mixer: Music Recording

Synthesizer: Sound Synthesis

Voice call: Noise reduction and Speech

Codecs
Signal Processing Tasks

• Audio/Speech Encoding/Decoding - Codecs

( DFT – Spectral Analysis, Filtering & Modifications)

• Audio effects
( FIR/IIR - Digital Filtering & Spectral Modifications)
Audio/Speech Codecs
Voice Call flow through mobile

Echo Cancellation
Speech Codec
Noise Reduction
Approximate data transfer size for 60 sec Call
Raw Data: (Just analog to digital converted data)

Sampling rate: 8000 samples/sec

Storage space for one sample : 8bit

Total data size = Number of samples * Storage space for one sample
= Samples/sec * Number of seconds * Storage space
= 8000 * 60 * 8 bits = 3840 Kbits

Bit rate = Samples/sec * Storage space for one sample = 64 Kbits/sec

Encoded/Compressed data: (DSP algorithm over sampled digital data)

Bit rate = 6.5 to 13 Kbits/sec (GSM Speech codecs output)

Data size = Transferred bits/sec * Number of seconds

= Bit rate * Number of seconds = 6.5 (13.5) * 60 = 390 to 810 Kbits
Audio Quality Measure

Audio 1 Raw Audio

1441Kbps

Audio 2 Compressed audio at

128Kbps

Audio 3 Compressed audio at

32Kbps
Signal Compression in Frequency domain
Audio/Speech Codecs
Spectrogram : Frequency variation with time
1411 Kbits Raw Audio

Frequency

128 Kbits MP3 Encoded Audio

Frequency

32 Kbits MP3 Encoded Audio

Frequency

Time
Audio and Speech Codecs

Audio Frequency Range: 20Hz – 20KHz

Speech Frequency Range: 300Hz – 3500Hz

Speech Codecs: (Linear Prediction approach)

AMR, G.723
bitrate: 1.2 Kbits/sec
Sampling rate: 8 - 16Khz

Audio Codecs : (MDCT, Psychoacoustics analysis)

MP3, AAC
bitrate: 32-768 Kbits/sec
Sampling rate : 8 - 48Khz
Audio/Sound Effects – Android Apps
Audio Effects

• Intelligent Loudness Control (Automatic Gain Control)

• Wideband Automatic Noise Removal (WANR)

• Envelope/Stereo Processing

• Voice/Vocal Enhancement

• Base Enhancement

• Sibilant/Fricative Smoothing

• Dynamic Listening Fatigue Reduction (DLFR)

• Multi-Band Graphic Equalizer (Equalizer)

• Low Pass Filtering

Echo Effect : Information in Time domain

Signal delay:
y(t) = x(t) + decay*x(t-delay)

Raw Sound:

Echoed Sound:
Bass Enhancement :Information in Frequency domain

Subwoofer: reproduce low-pitched audio frequencies

known as bass (e.g.: Drum Sound)

Frequency range : 20-200Hz

Bass system frequency response

Resources

QA Community:
Signal Processing Stack exchange
http://dsp.stackexchange.com/

Open Source Contribution:

Audacity: Free Audio Editor and Recorder
audacity.sourceforge.net/

FFmpeg (solution to record, convert and stream audio and video)

https://www.ffmpeg.org/
Resources

Indian Research Start-ups:

• ATC Labs, Noida
• Violet 3D, Bangalore
• Akshar Speech Technologies, Hyderabad

Research Labs:
• Fraunhofer Institute, Germany
• Dolby Laboratories
• Philips Research
• DTS/SRS Labs
Acknowledgment

Special thanks to,

Prof. Naren Naik

&
ATC Labs, Noida, India
Thanks for your time.

Sbi Statement
No ratings yet
Sbi Statement
36 pages
602
No ratings yet
602
8 pages
Transfer 982950
No ratings yet
Transfer 982950
2 pages
PDF
No ratings yet
PDF
4 pages
Pre-Paid: Pickup Receipt - Delhivery Challan Awb - 2829213505003 / Delhivery Direct Standard Order ID - O1594446668522
No ratings yet
Pre-Paid: Pickup Receipt - Delhivery Challan Awb - 2829213505003 / Delhivery Direct Standard Order ID - O1594446668522
1 page
Digital Representation of Audio Information
No ratings yet
Digital Representation of Audio Information
22 pages
E Passbook 2022 10 12 11 54 44 Am
No ratings yet
E Passbook 2022 10 12 11 54 44 Am
34 pages
Statement of Account: Date Narration Chq./Ref - No. Value DT Withdrawal Amt. Deposit Amt. Closing Balance
No ratings yet
Statement of Account: Date Narration Chq./Ref - No. Value DT Withdrawal Amt. Deposit Amt. Closing Balance
34 pages
Factorytalk Batch View Quick Start Guide
No ratings yet
Factorytalk Batch View Quick Start Guide
22 pages
Aqar Report 2018-19 Saurashtra University
No ratings yet
Aqar Report 2018-19 Saurashtra University
33 pages
GSTR1 33cfhpd2441a1zb 122022
No ratings yet
GSTR1 33cfhpd2441a1zb 122022
4 pages
PDF
No ratings yet
PDF
22 pages
Extended Warranty Detail Invoice Report
No ratings yet
Extended Warranty Detail Invoice Report
1 page
PitchBook All Columns 2021 05 27 01 04 03
No ratings yet
PitchBook All Columns 2021 05 27 01 04 03
1,000 pages
Firmware Specification: Edition November 2018 EPOS4 Positioning Controllers Firmware Specification Maxon Motor Control
No ratings yet
Firmware Specification: Edition November 2018 EPOS4 Positioning Controllers Firmware Specification Maxon Motor Control
278 pages
Certificate Cum Insurance Policy Schedule LE: United India Insurance Company Limited
No ratings yet
Certificate Cum Insurance Policy Schedule LE: United India Insurance Company Limited
4 pages
Girnar Insurance Brokers Private Limited: Salary Slip For The Month of November - 2022
No ratings yet
Girnar Insurance Brokers Private Limited: Salary Slip For The Month of November - 2022
2 pages
TIA Selection Tool: Release Notes V2022.05
No ratings yet
TIA Selection Tool: Release Notes V2022.05
10 pages
Schedule of Premium (Amount in RS.)
No ratings yet
Schedule of Premium (Amount in RS.)
4 pages
FIN AL: Form GSTR-1
No ratings yet
FIN AL: Form GSTR-1
5 pages
PDF
No ratings yet
PDF
12 pages
Account Statement: NSDL Payments Bank
No ratings yet
Account Statement: NSDL Payments Bank
3 pages
Bike Insurance Tata JH05BA 0882
No ratings yet
Bike Insurance Tata JH05BA 0882
8 pages
Bike Insurance
No ratings yet
Bike Insurance
1 page
Group 22
No ratings yet
Group 22
24 pages
Axis Bank Staement
No ratings yet
Axis Bank Staement
2 pages
2024t1all
No ratings yet
2024t1all
5 pages
Ref - No. 9662905-18736889-7: Syed Zabiulla
No ratings yet
Ref - No. 9662905-18736889-7: Syed Zabiulla
7 pages
Approval of ES01
No ratings yet
Approval of ES01
2 pages
Consumer Base Report GANGANDHARAN
No ratings yet
Consumer Base Report GANGANDHARAN
4 pages
Cynna Technologies Private Limited - Aakcc8643g - Q4 - Fy202324 - 16a
No ratings yet
Cynna Technologies Private Limited - Aakcc8643g - Q4 - Fy202324 - 16a
3 pages
Just Dial Limited: Tax Invoice
No ratings yet
Just Dial Limited: Tax Invoice
2 pages
Ford Aspire Insu Policy 2020 PDF
No ratings yet
Ford Aspire Insu Policy 2020 PDF
3 pages
Scikit-Learn-Exercises - Jupyter Notebook
100% (2)
Scikit-Learn-Exercises - Jupyter Notebook
28 pages
GSTIN Certificate - KTVPL
No ratings yet
GSTIN Certificate - KTVPL
3 pages
Cambridge IGCSE™: Information and Communication Technology 0417/11 May/June 2022
No ratings yet
Cambridge IGCSE™: Information and Communication Technology 0417/11 May/June 2022
14 pages
Print - Udyam Registration Certificate
No ratings yet
Print - Udyam Registration Certificate
1 page
Policy
No ratings yet
Policy
2 pages
Advanced Programming Course Tutorial
No ratings yet
Advanced Programming Course Tutorial
44 pages
Isa-Tr84 00 07-2018
No ratings yet
Isa-Tr84 00 07-2018
106 pages
For Royal Hut Unit Ii
No ratings yet
For Royal Hut Unit Ii
3 pages
Print - Udyam Registration Certificate
No ratings yet
Print - Udyam Registration Certificate
4 pages
Sub:Risk Assumption Letter: Insured Vehicles Details
No ratings yet
Sub:Risk Assumption Letter: Insured Vehicles Details
4 pages
CCC Question Paper 1
No ratings yet
CCC Question Paper 1
5 pages
Account Statement From 2 Jan 2022 To 2 Jul 2022: TXN Date Value Date Description Ref No./Cheque No. Debit Credit Balance
No ratings yet
Account Statement From 2 Jan 2022 To 2 Jul 2022: TXN Date Value Date Description Ref No./Cheque No. Debit Credit Balance
2 pages
Accounting Voucher
No ratings yet
Accounting Voucher
1 page
Two Wheeler Insurance Package Policy (1) - Insurance - Cheque
No ratings yet
Two Wheeler Insurance Package Policy (1) - Insurance - Cheque
5 pages
Logcat 1678553025034
No ratings yet
Logcat 1678553025034
56 pages
Certificate of Registration: Maheshwaram Medicine Galaxy
No ratings yet
Certificate of Registration: Maheshwaram Medicine Galaxy
1 page
Tata Sky Sample
No ratings yet
Tata Sky Sample
1 page
Account Statement: Folio No.: 8859269 / 96
No ratings yet
Account Statement: Folio No.: 8859269 / 96
3 pages
DX Diag
No ratings yet
DX Diag
33 pages
Dr. Faris Llwaah
No ratings yet
Dr. Faris Llwaah
25 pages
Cs Program File
No ratings yet
Cs Program File
13 pages
Bhariti Axa Ape Ato
No ratings yet
Bhariti Axa Ape Ato
2 pages
Tn22cq1238 Insurance Liberty Videocon 10 Jun 2018
No ratings yet
Tn22cq1238 Insurance Liberty Videocon 10 Jun 2018
3 pages
Strength and Behavior of Polypropylene Fiber Reinforced Concrete Double Tee Beams
No ratings yet
Strength and Behavior of Polypropylene Fiber Reinforced Concrete Double Tee Beams
8 pages
Ultrathin Keyboard Folio S310: For Samsung Galaxy Tab 3™ (10.1")
No ratings yet
Ultrathin Keyboard Folio S310: For Samsung Galaxy Tab 3™ (10.1")
20 pages
Digit Two-Wheeler Package Policy: Go Digit General Insurance LTD
No ratings yet
Digit Two-Wheeler Package Policy: Go Digit General Insurance LTD
2 pages
CA NO:153131650: Rajjak Bashir Hakim
No ratings yet
CA NO:153131650: Rajjak Bashir Hakim
2 pages
Acctstmt F
No ratings yet
Acctstmt F
3 pages
02 Dinesh Kumar Axis Statement
No ratings yet
02 Dinesh Kumar Axis Statement
3 pages
UDIN Penupothula
No ratings yet
UDIN Penupothula
2 pages
168278
No ratings yet
168278
1 page
Payslip Feb 2023
No ratings yet
Payslip Feb 2023
2 pages
DSE 3153 26 Sep 2023
No ratings yet
DSE 3153 26 Sep 2023
10 pages
Liquiloans Statement 2022-04-01 To 2022-04-15
No ratings yet
Liquiloans Statement 2022-04-01 To 2022-04-15
1 page
Reviewer For Computer (3rd)
No ratings yet
Reviewer For Computer (3rd)
6 pages
Indian Income Tax Return Acknowledgement 2021-22: Assessment Year
No ratings yet
Indian Income Tax Return Acknowledgement 2021-22: Assessment Year
1 page
Folio 7775960443 AllMonths
No ratings yet
Folio 7775960443 AllMonths
2 pages
Wego Insurance
No ratings yet
Wego Insurance
1 page
RE Thunderbird 350cc Bike Insurance
No ratings yet
RE Thunderbird 350cc Bike Insurance
2 pages
Sahida Engicon AUDIT REPORT AY 22-23
No ratings yet
Sahida Engicon AUDIT REPORT AY 22-23
12 pages
A Topology Optimization Formulation Applied To Highly Flexible Structures
No ratings yet
A Topology Optimization Formulation Applied To Highly Flexible Structures
4 pages
Resume Faiz 230221 180146
No ratings yet
Resume Faiz 230221 180146
4 pages
Invertis University, Bareilly Faculty of Computer Applications (MCA) Curriculum Analysis (Course Category)
No ratings yet
Invertis University, Bareilly Faculty of Computer Applications (MCA) Curriculum Analysis (Course Category)
8 pages
GST Certificate 1
No ratings yet
GST Certificate 1
3 pages
Deepak Kumar
No ratings yet
Deepak Kumar
1 page
Account Statement From 1 Sep 2011 To 30 Sep 2011: TXN Date Value Date Description Ref No./Cheque No. Debit Credit Balance
100% (1)
Account Statement From 1 Sep 2011 To 30 Sep 2011: TXN Date Value Date Description Ref No./Cheque No. Debit Credit Balance
1 page
2015 Summer Model Answer Paper
No ratings yet
2015 Summer Model Answer Paper
41 pages
Bbs Soa
No ratings yet
Bbs Soa
3 pages
Mendeley For Literature Review
100% (1)
Mendeley For Literature Review
5 pages
Research Application Form
No ratings yet
Research Application Form
5 pages
GSTN - Draft Manual On Invoice Management System 17.09.024
No ratings yet
GSTN - Draft Manual On Invoice Management System 17.09.024
18 pages
Understanding Operating Systems, 8th Ed. 8th Edition Ann Mchoes
No ratings yet
Understanding Operating Systems, 8th Ed. 8th Edition Ann Mchoes
49 pages
Apple - Invoice of Cable Apple
No ratings yet
Apple - Invoice of Cable Apple
1 page
Fundamentals of Database Systems Course Outlinen
No ratings yet
Fundamentals of Database Systems Course Outlinen
4 pages
Internet Programming II Question Bank
No ratings yet
Internet Programming II Question Bank
4 pages
AI ML Developer
No ratings yet
AI ML Developer
3 pages
30 Days Cybersecurity Challenge
No ratings yet
30 Days Cybersecurity Challenge
20 pages

Audio/Speech Signal Processing: An Overview

Uploaded by

Audio/Speech Signal Processing: An Overview

Uploaded by

Audio/Speech Signal Processing

Audio Processor: FM Broadcasting

Sound Mixer: Music Recording

Voice call: Noise reduction and Speech

• Audio/Speech Encoding/Decoding - Codecs

Sampling rate: 8000 samples/sec

Bit rate = Samples/sec * Storage space for one sample = 64 Kbits/sec

Encoded/Compressed data: (DSP algorithm over sampled digital data)

Bit rate = 6.5 to 13 Kbits/sec (GSM Speech codecs output)

Data size = Transferred bits/sec * Number of seconds

Audio 1 Raw Audio

Audio 2 Compressed audio at

Audio 3 Compressed audio at

128 Kbits MP3 Encoded Audio

32 Kbits MP3 Encoded Audio

Audio Frequency Range: 20Hz – 20KHz

Speech Codecs: (Linear Prediction approach)

Audio Codecs : (MDCT, Psychoacoustics analysis)

• Intelligent Loudness Control (Automatic Gain Control)

• Wideband Automatic Noise Removal (WANR)

• Dynamic Listening Fatigue Reduction (DLFR)

• Multi-Band Graphic Equalizer (Equalizer)

• Low Pass Filtering

Subwoofer: reproduce low-pitched audio frequencies

Frequency range : 20-200Hz

Bass system frequency response

Open Source Contribution:

FFmpeg (solution to record, convert and stream audio and video)

Indian Research Start-ups:

Special thanks to,

Prof. Naren Naik

You might also like