UE: Traitement de Son: TP N°3: Analyse Spectrale

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 9

2 MP ISI Année Universitaire : 2015-2016

UE : Traitement de son
TP n°3 : Analyse spectrale

Objectif : Analyser les spectres et les spectrogrammes des fichiers son.

1- Transformé de Fourier et Série de Fourier :

Activité-1 : Transformé de Fourier

1- Tracer le spectre d’un créneau (signal porte), qu’est-ce que vous remarquez lorsqu’on augmente la largeur
de la fonction « porte ».

2- Vérifiez que la transformé de Fourier d’un sinus cardinal est une fonction porte. Utilisez le fichier son suivant
pour générer une fonction sinus cardinal : sinc.wav

2 MP ISI -1- TP Traitement de son (AU 2015-16)


Activité-2 : Série de Fourier- Motif périodique et spectre de raies

1- Grâce à l’outil retouche (icône ci-dessous), générer un motif quelconque

Exemple de motif :

Dupliquer ce motif pour créer un son. Une méthode possible est la suivante : en maintenant Ctrl+V appuyé, on
peut copier indéfiniment une période (au préalable il faut avoir copié un morceau de piste, et placé le curseur
en la fin de la piste). Ne pas oublier de supprimer la composante DC si elle existe. Tracer le spectre.

1- Pourquoi a-t-on un spectre de raies ? Identifier le fondamental et les harmoniques

2- Phénomène Gibbs :

2-1 Générer plusieurs sinusoïdes sur plusieurs pistes différentes avec les fréquences suivantes :
100 Hz, 300 Hz, 500 Hz, 700 Hz, 900 Hz et les amplitudes suivantes : 0.1, 0.033, 0.02, 0.0142, 0.0111.
Sommer toutes les pistes. Quel est le résultat ?
2-2 Générer un signal carré de 50 Hz puis rééchantillonner à 8000 Hz. On voit apparaître le phénomène
de Gibbs (oscillations aux jointures) car la série de Fourier est tronquée.

Remarque : il est possible aussi d’appliquer un filtrage passe-bas avec un flanc très abrupt, le maximum étant
de 48dB par décade (Effets>Low pass filter>Rolloff 48 dB>Cutoff 8000 Hz).

2 MP ISI -2- TP Traitement de son (AU 2015-16)


2- Transformé de Fourier Discrète TFD :

2-1- Transformé de Fourier Rapide FFT

La FFT (acronyme de fast fourier transform) est une TFD particulière basée (en général) sur
l’algorithme de Cooley-Tukey. La FFT apporte un gain de temps : elle nécessite N*log2(N) opérations de
calcul au lieu de N2 pour la TFD.

Le spectre dans Audacity


La Transformée de Fourier Discrète (TFD) et la Transformée de Fourier rapide (FFT) sont à la base de
l’analyse spectrale en informatique. Audacity utilise la FFT, mais de manière un peu particulière.
La méthode utilisée par Audacity est la suivante : le signal est découpé en K intervalles de N points (on
applique sur ces intervalles une fenêtre, celle de Hanning par exemple). Les fenêtres ne se recouvrent pas. On
fait la FFT de chaque intervalle, puis on moyenne les K FFTs, en prenant le module au carré (|FFT|² ou
Re(FFT)²+Im(FFT)²). Au final Audacity montre un spectre en énergie.

- Echelle verticale : elle représente une énergie en dB (c’est donc une échelle logarithmique).
Dans cette représentation, le bruit prend autant d’importance que le signal lui-même.
Il est impossible de changer cette échelle : une astuce est d’ajouter un bruit blanc (et ainsi réduire
l'échelle verticale et zoomer) pour éviter les grandes différences de niveaux.
L’échelle verticale est négative (- X dB) : en effet, une amplitude de 1.0 dans le domaine
temporel (amplitude maximale avant saturation) donne une amplitude de 0 dB dans le domaine fréquentiel.
Une amplitude de 0 dB correspond donc à un signal non écrêté (sans distorsion), c’est-à-dire au signal de
plus forte amplitude possible. C’est une norme inverse des dB audibles où 0 dB correspondent au son de
plus petite amplitude possible.
Cela explique que l’échelle verticale soit négative. L’amplitude d’un signal va dépendre aussi de la
fenêtre employée : ainsi la fenêtre de Kaiser-Bessel donne la « bonne » amplitude alors que la fenêtre de
Hamming donne la « bonne » fréquence.

Les dB ne correspondent pas au niveau sonore réel, cela dépend du niveau de la piste, mais aussi de
l’efficacité des haut-parleurs, et la distance au haut-parleur. Si l’amplificateur est éteint, un silence
correspond à –infini. Si l’amplifier est allumé mais le son inaudible, c’est 0 dB.

Important : le spectre obtenu par TFD est forcément discontinu. Or Audacity nous montre une
courbe continue. En effet, cette courbe est obtenue par une interpolation cubique (par des polynômes de
degré 3) des points issus de la FFT. Lorsqu’on exporte le spectre, on constate que celui-ci est bien constitué
de valeurs discrètes.

2 MP ISI -3- TP Traitement de son (AU 2015-16)


- Echelle horizontale : fréquences en Hz.
 A fréquence nulle, on trouve la moyenne du signal (appelée aussi « composante DC9 »).
 L’échelle peut être logarithmique (auquel cas la valeur 0 est rejetée à moins l’infini) ou linéaire.

Important : la fréquence maximale est Fe/2 et on visualise N/2 points. En effet, le signal entre Fe/2 et
Fe est l’image du signal entre 0 et Fe.
 N est une puissance de 2 car on utilise un algorithme de FFT, la résolution fréquentielle est donc
Fe/N.
 Le paramètre Taille ne peut pas dépasser le nombre de points du signal, le fichier à l’export
présente Taille/2 points.
 Il y a un bug dans l'affichage : le spectre affiché est celui du dernier spectre obtenu même s’il ne
peut pas calculer ce spectre.

- Le curseur : La valeur curseur indique la fréquence pointée par la croix, tandis que Crête donne
la fréquence du pic le plus proche. Les notations entre parenthèses traduisent la fréquence absolue en
notation MIDI : A#3 signifie « LA dièse de l’octave 3 ».

- Durée maximum du signal analysé : la longueur maximum analysable est de 10485760 échantillons. A
un taux de 44100 Hz, on trouve 237.77234 secondes. Si on dépasse cette valeur (c’est usuellement le cas
dans un morceau de musique courant) un message d'erreur s'affiche : « Too much audio was selected.
Only the first %.1f seconds of audio will be analyzed ». On peut analyser simultanément plusieurs
signaux, mais ils doivent tous avoir le même taux d'échantillonnage.

- L’export : l'export du spectre donne un fichier de 2 colonnes : "Fréquence (Hz), Niveau (dB)".
L'autocorrélation standard et les choix suivants donnent un fichier de 3 colonnes : "Décalage (secondes),
Fréquence (Hz), Niveau"

2 MP ISI -4- TP Traitement de son (AU 2015-16)


Activité-3 : Transformé de Fourier d’un créneau

Grâce à l’outil retouche (icône ci-dessous), il est facile de générer un créneau

Exemple de créneau:

1- Quel est le spectre attendu ? Correspond-t-il au spectre donné par Audacity ? Que se passe-t-il si on
augmente la largeur du créneau ?

Activité-4 : Valeur moyenne (Offset vertical, composante DC)

Voici un son qui possède une composante DC : soundshift.wav

1- Visualiser le spectre (avec fenêtre de Hanning) puis utiliser l’outil suivant : Effets > normaliser
> Supprimer tout décalage DC. Que remarquez-vous ?

2-2- Résolution spectrale

Activité-5 : Battements

1- Générer 2 pistes de 440 et 442 Hz à 0.5 d’amplitude, séparées. Ecouter. Que remarquez-vous ?

Application : le battement sert à accorder les instruments car un battement est dissonant

2 MP ISI -5- TP Traitement de son (AU 2015-16)


Activité-6 : Technique de « zéros padding »

On rajoute des zéros supplémentaires à la fin du signal étudié.


- le nombre de points du spectre augmente
- l’intervalle entre 2 points du spectre augmente car ∆f=Fe/N mais la résolution fréquentielle reste la même
car la durée du signal reste inchangée.
- utile pour ajouter des points pour atteindre 2^n valeurs nécessaires à la FFT.
- il n'y a pas d'information supplémentaire par l’ajout de ces zéros.
- c’est une technique d’interpolation

1- Comment effectuer le zero-padding simplement sous Audacity ? Prendre une piste quelconque, effectuer
un zéro-padding et comparer les spectres. La résolution (le plus petit intervalle fréquentiel) est-elle modifiée
?

2- Dans Audacity, le zéro-padding ne peut pas améliorer la résolution spectrale, pourquoi ?

Activité-7 : Fenêtrage

1- Observons l’effet du fenêtrage sur le spectre.


Exemple : générer 2 sinus de 200 et 243 Hz d'amplitude 0,98 et 0,01.
Observer le spectre, entre la fenêtre "naturelle" rectangulaire et une fenêtre moins abrupte de Hanning.

2- Générer une sinusoïde de fréquence 10 kHz, puis la fenêtrer et observer l’élargissement du lobe principal.

2 MP ISI -6- TP Traitement de son (AU 2015-16)


3- Spectrogramme et analyse temps-fréquence

Le spectrogramme dans Audacity

Un spectrogramme est la visualisation de l’amplitude de Fourier dans le plan temps-fréquence. La figure


montrée par Audacity est la projection d’un diagramme 3D amplitude-temps-fréquence en 2D. L’échelle
des couleurs indique la valeur de l’amplitude. Plus la fenêtre temporelle est petite et plus la résolution en
fréquence est médiocre. Ce phénomène est analogue au principe d’incertitude de Heisenberg en physique.
En traitement du signal, on l’appelle parfois l’inégalité de Heisenberg-Gabor.

Exemple de spectrogramme dans Audacity :

L’affichage du spectrogramme est accessible via le panneau en début de piste (voir les deux figures ci-dessous) :

Important : les différents paramètres sont accessibles via le menu : Edition > Préférences >
Spectrogramme.
L’image du spectrogramme peut être sauvée via le menu Help>Screenshots Tools.
L’échelle verticale est divisée en N/2 bandes où N est la taille de la fenêtre d’analyse.

Important : la fréquence max visualisée par le spectrogramme est Fe/2 par défaut, de la même manière que
le spectre va de 0 à Fe/2.
Pour des sons concentrés dans les basses fréquences, sous-échantillonner permet d’améliorer parfois la
qualité du spectrogramme.

2 MP ISI -7- TP Traitement de son (AU 2015-16)


Il existe un type très courant de représentation courante, en 3 parties, où les différents axes sont mis en
correspondance :

Voici un exemple :

2 MP ISI -8- TP Traitement de son (AU 2015-16)


Activité-8 : Spectrogrammes

On vous propose de visualiser le spectrogramme de quelques sons complexes.


Réglez au mieux les paramètres pour améliorer la visualisation.

Voici quatre exemples de sons complexes :


Chauve-souris : bat.wav
Un gong : gong.wav
Baleine : whales.wav

Activité-9 : Apollo 11

On s’intéresse ici à une « énigme historique ». Juste après le premier alunissage, le 21 juillet 1969,
l’astronaute Neil Armstrong prononça la fameuse phrase: « That's one small step for a man; one giant leap for
mankind ». Il y a un doute sur la présence de l’article « a » : l’astronaute l’a-t-il prononcé ?

Visualiser la phrase dans un spectrogramme, et essayer de conclure : voyelles_wiki.wav

Le fichier original est librement accessible sur Wikipédia : Frase_de_Neil_Armstrong.ogg

Activité-10 : Localisation

Créer un son (Fe=8kHz donc fréquence max =4000 Hz) qui comporte deux sinusoïdes collées de fréquence
1000 et 2000 Hz. Utiliser l’outil de glissement temporel pour coller les deux bouts de piste.

1- Visualiser ce son dans un spectrogramme et faire varier la taille de la fenêtre N. Pour quelle taille de fenêtre
mesure-t-on le mieux l’instant de raccordement ?

2 MP ISI -9- TP Traitement de son (AU 2015-16)

Vous aimerez peut-être aussi