UE: Traitement de Son: TP N°3: Analyse Spectrale
UE: Traitement de Son: TP N°3: Analyse Spectrale
UE: Traitement de Son: TP N°3: Analyse Spectrale
UE : Traitement de son
TP n°3 : Analyse spectrale
1- Tracer le spectre d’un créneau (signal porte), qu’est-ce que vous remarquez lorsqu’on augmente la largeur
de la fonction « porte ».
2- Vérifiez que la transformé de Fourier d’un sinus cardinal est une fonction porte. Utilisez le fichier son suivant
pour générer une fonction sinus cardinal : sinc.wav
Exemple de motif :
Dupliquer ce motif pour créer un son. Une méthode possible est la suivante : en maintenant Ctrl+V appuyé, on
peut copier indéfiniment une période (au préalable il faut avoir copié un morceau de piste, et placé le curseur
en la fin de la piste). Ne pas oublier de supprimer la composante DC si elle existe. Tracer le spectre.
2- Phénomène Gibbs :
2-1 Générer plusieurs sinusoïdes sur plusieurs pistes différentes avec les fréquences suivantes :
100 Hz, 300 Hz, 500 Hz, 700 Hz, 900 Hz et les amplitudes suivantes : 0.1, 0.033, 0.02, 0.0142, 0.0111.
Sommer toutes les pistes. Quel est le résultat ?
2-2 Générer un signal carré de 50 Hz puis rééchantillonner à 8000 Hz. On voit apparaître le phénomène
de Gibbs (oscillations aux jointures) car la série de Fourier est tronquée.
Remarque : il est possible aussi d’appliquer un filtrage passe-bas avec un flanc très abrupt, le maximum étant
de 48dB par décade (Effets>Low pass filter>Rolloff 48 dB>Cutoff 8000 Hz).
La FFT (acronyme de fast fourier transform) est une TFD particulière basée (en général) sur
l’algorithme de Cooley-Tukey. La FFT apporte un gain de temps : elle nécessite N*log2(N) opérations de
calcul au lieu de N2 pour la TFD.
- Echelle verticale : elle représente une énergie en dB (c’est donc une échelle logarithmique).
Dans cette représentation, le bruit prend autant d’importance que le signal lui-même.
Il est impossible de changer cette échelle : une astuce est d’ajouter un bruit blanc (et ainsi réduire
l'échelle verticale et zoomer) pour éviter les grandes différences de niveaux.
L’échelle verticale est négative (- X dB) : en effet, une amplitude de 1.0 dans le domaine
temporel (amplitude maximale avant saturation) donne une amplitude de 0 dB dans le domaine fréquentiel.
Une amplitude de 0 dB correspond donc à un signal non écrêté (sans distorsion), c’est-à-dire au signal de
plus forte amplitude possible. C’est une norme inverse des dB audibles où 0 dB correspondent au son de
plus petite amplitude possible.
Cela explique que l’échelle verticale soit négative. L’amplitude d’un signal va dépendre aussi de la
fenêtre employée : ainsi la fenêtre de Kaiser-Bessel donne la « bonne » amplitude alors que la fenêtre de
Hamming donne la « bonne » fréquence.
Les dB ne correspondent pas au niveau sonore réel, cela dépend du niveau de la piste, mais aussi de
l’efficacité des haut-parleurs, et la distance au haut-parleur. Si l’amplificateur est éteint, un silence
correspond à –infini. Si l’amplifier est allumé mais le son inaudible, c’est 0 dB.
Important : le spectre obtenu par TFD est forcément discontinu. Or Audacity nous montre une
courbe continue. En effet, cette courbe est obtenue par une interpolation cubique (par des polynômes de
degré 3) des points issus de la FFT. Lorsqu’on exporte le spectre, on constate que celui-ci est bien constitué
de valeurs discrètes.
Important : la fréquence maximale est Fe/2 et on visualise N/2 points. En effet, le signal entre Fe/2 et
Fe est l’image du signal entre 0 et Fe.
N est une puissance de 2 car on utilise un algorithme de FFT, la résolution fréquentielle est donc
Fe/N.
Le paramètre Taille ne peut pas dépasser le nombre de points du signal, le fichier à l’export
présente Taille/2 points.
Il y a un bug dans l'affichage : le spectre affiché est celui du dernier spectre obtenu même s’il ne
peut pas calculer ce spectre.
- Le curseur : La valeur curseur indique la fréquence pointée par la croix, tandis que Crête donne
la fréquence du pic le plus proche. Les notations entre parenthèses traduisent la fréquence absolue en
notation MIDI : A#3 signifie « LA dièse de l’octave 3 ».
- Durée maximum du signal analysé : la longueur maximum analysable est de 10485760 échantillons. A
un taux de 44100 Hz, on trouve 237.77234 secondes. Si on dépasse cette valeur (c’est usuellement le cas
dans un morceau de musique courant) un message d'erreur s'affiche : « Too much audio was selected.
Only the first %.1f seconds of audio will be analyzed ». On peut analyser simultanément plusieurs
signaux, mais ils doivent tous avoir le même taux d'échantillonnage.
- L’export : l'export du spectre donne un fichier de 2 colonnes : "Fréquence (Hz), Niveau (dB)".
L'autocorrélation standard et les choix suivants donnent un fichier de 3 colonnes : "Décalage (secondes),
Fréquence (Hz), Niveau"
Exemple de créneau:
1- Quel est le spectre attendu ? Correspond-t-il au spectre donné par Audacity ? Que se passe-t-il si on
augmente la largeur du créneau ?
1- Visualiser le spectre (avec fenêtre de Hanning) puis utiliser l’outil suivant : Effets > normaliser
> Supprimer tout décalage DC. Que remarquez-vous ?
Activité-5 : Battements
1- Générer 2 pistes de 440 et 442 Hz à 0.5 d’amplitude, séparées. Ecouter. Que remarquez-vous ?
Application : le battement sert à accorder les instruments car un battement est dissonant
1- Comment effectuer le zero-padding simplement sous Audacity ? Prendre une piste quelconque, effectuer
un zéro-padding et comparer les spectres. La résolution (le plus petit intervalle fréquentiel) est-elle modifiée
?
Activité-7 : Fenêtrage
2- Générer une sinusoïde de fréquence 10 kHz, puis la fenêtrer et observer l’élargissement du lobe principal.
L’affichage du spectrogramme est accessible via le panneau en début de piste (voir les deux figures ci-dessous) :
Important : les différents paramètres sont accessibles via le menu : Edition > Préférences >
Spectrogramme.
L’image du spectrogramme peut être sauvée via le menu Help>Screenshots Tools.
L’échelle verticale est divisée en N/2 bandes où N est la taille de la fenêtre d’analyse.
Important : la fréquence max visualisée par le spectrogramme est Fe/2 par défaut, de la même manière que
le spectre va de 0 à Fe/2.
Pour des sons concentrés dans les basses fréquences, sous-échantillonner permet d’améliorer parfois la
qualité du spectrogramme.
Voici un exemple :
Activité-9 : Apollo 11
On s’intéresse ici à une « énigme historique ». Juste après le premier alunissage, le 21 juillet 1969,
l’astronaute Neil Armstrong prononça la fameuse phrase: « That's one small step for a man; one giant leap for
mankind ». Il y a un doute sur la présence de l’article « a » : l’astronaute l’a-t-il prononcé ?
Activité-10 : Localisation
Créer un son (Fe=8kHz donc fréquence max =4000 Hz) qui comporte deux sinusoïdes collées de fréquence
1000 et 2000 Hz. Utiliser l’outil de glissement temporel pour coller les deux bouts de piste.
1- Visualiser ce son dans un spectrogramme et faire varier la taille de la fenêtre N. Pour quelle taille de fenêtre
mesure-t-on le mieux l’instant de raccordement ?