Tech Mult
Tech Mult
Tech Mult
Multimédia?
Digital Content
Toute application utilisant ou servant à travailler sur
au moins un média spécifique
En informatique :
Réunion sur un même support de plusieurs média.
3
INTRODUCTION
4
INTRODUCTION
Intérêt
10 % de ce quil LIT
50 % de ce quil ENTEND et LIT
70 % de ce quil ENTEND, LIT et VOIT
5
INTRODUCTION
Domaines :
6
INTRODUCTION
Métiers
Journaliste
Graphiste
Webdesigner
Animateur 3d
Monteur vidéo
Infographiste
Art numérique
Développement
Impression
7
INTRODUCTION
Technologie matérielle
Numérisation
Son
Vidéo
Image
8
INTRODUCTION
Technologie logicielle
9
INTRODUCTION
Processus de création dun objet multimédia (1)
10
INTRODUCTION
Processus de création dun objet multimédia (2)
11
INTRODUCTION
La scène
12
INTRODUCTION
Que faut-il représenter ?
Vision industrielle
Imagerie médicale
Imagerie satellite
Microscopie
Télécommunications
Animations, Images de synthèse
14
LIMAGE ET SES CARACTÉRISTIQUES
Quest-ce quune image?
Discrétisation
15
LIMAGE ET SES CARACTÉRISTIQUES
Contenu de limage
31
1 Image = 1 Ensemble de pixels
1 valeur (ou plusieurs) par pixel
196
157
16
IMAGES MULTIVALUÉES
Plusieurs valeurs par pixel
Images couleurs
= + +
17
IMAGES MULTIVALUÉES
Exemple dimages
multispectrales
18
VOLUMES 3D
Empilement de coupes (images)
20
DES EXEMPLES DAPPLICATION
INA, Archives,
Navigation et recherche dans les documents
Identifier :
Changements de plan
Changements de scène
Mouvement de caméra
Mouvements des objets
21
DES EXEMPLES DAPPLICATION
Vidéo-surveillance
Lieux publics
Détection dactivités « anormales »
22
DES EXEMPLES DAPPLICATION
Imagerie satellite
Généralement multispectrale, hyperspectrale
23
DES EXEMPLES DAPPLICATION
Imagerie sonar
24
DES EXEMPLES DAPPLICATION
Analyse sportive
Satisfaire lentraîneur
revers : 90 %
service : 60 %
…
Satisfaire le supporter
25
DES EXEMPLES DAPPLICATION
Imagerie médicale
Différentes modalités :
IRM
Scanner
Radiologie
Echographie
De nombreux problèmes à résoudre
But : aide au praticien (localisation, mesure)
26
DES EXEMPLES DAPPLICATION
Imagerie médicale
Mesures automatiques
27
DES EXEMPLES DAPPLICATION
Imagerie médicale
Analyse et reconstruction
28
DES EXEMPLES DAPPLICATION
Titre, haut de
Analyse de documents imprimés
page
Reconnaissance de caractères Zone de texte
Documents anciens (médiévaux)
Lettrine
Note
en marge
Illustration Légende
29
© Université de Tours
DES EXEMPLES DAPPLICATION
Ecriture manuscrite
En ligne / Hors ligne
Applications :
Écriture
Chèques
Signature
30
DES EXEMPLES DAPPLICATION
Bases de données
BDD image, BDD multimédia
31
DES EXEMPLES DAPPLICATION
Robotique
Vision stéréoscopique
Reconnaissance de scène
32
DES EXEMPLES DAPPLICATION
Véhicules intelligents
Aide au conducteur
Conduite automatique
33
DES EXEMPLES DAPPLICATION
Chemins de fers
Aide au conducteur : surveillance de quai
34
DES EXEMPLES DAPPLICATION
Réalité augmentée
Analyse/Traitement + Synthèse
35
DES EXEMPLES DAPPLICATION
Biométrie
Différentes modalités : iris, empreinte, visage,
signature,
36
DES EXEMPLES DAPPLICATION
Et bien dautres encore
Vision industrielle
Aide aux handicapés
Nouveaux modes dinteraction
Représentation de données
Physique, biologie
37
CODAGE DES IMAGES
RAPPELS GÉNÉRALITÉS SUR LE CODAGE
En informatique, toute information (texte, image,
son ) est codée sous forme binaire, cest à dire
composée de 0 et de 1. Lunité dinformation la
plus petite est appelée un bit (« binary digit »),
une série de 8 bits est appelée un octet (en
anglais byte). Un octet permet de stocker un
caractère, telle quune lettre, un chiffre Ce
regroupement de nombres par série de 8 permet
une lisibilité plus grande, au même titre que
lon apprécie, en base décimale, de regrouper les
nombres par trois pour pouvoir distinguer les
milliers.
Par exemple, le nombre 1 256 245 est plus lisible que 39
1256245.
COMMENT LINFORMATION EST-ELLE
CODÉE EN BINAIRE ?
41
COMMENT LINFORMATION EST-ELLE
CODÉE EN BINAIRE?
42
EXEMPLE
43
EXERCICE
44
CODAGE DES IMAGES
Il existe actuellement une très grande diversité
de formats dimages. Chaque logiciel ne peut
traiter quun nombre limité de ces formats. On
peut les classer en deux grandes catégories :
Les images vectorisées
Les images codées par points (codage Bitmap ou
matriciel)
45
LES IMAGES VECTORISÉES
Description géométrique de limage.
suite de formules mathématiques décrivant les formes
élémentaires constituant limage (carré, cercle,...).
Chaque forme possède un certain nombre dattributs tels que
la couleur, lépaisseur du trait,...
48
LES IMAGES CODÉES PAR POINTS
50
LES IMAGES CODÉES PAR POINTS
Lors dune capture, il faut choisir la résolution la
plus adaptée.
Visualisation sur écran ou impression sur papier?
1er cas : résolution plus basse que le 2ème
Ne pas augmenter le nombre lumineux dun écran
au-delà de certaines limites
51
LES IMAGES CODÉES PAR POINTS
Le nombre de couleurs à coder est un facteur
déterminant quand à la qualité de limage
restituée mais également quant à la taille du
fichier.
Suivant le nombre de couleurs, le codage de
chaque pixel se fait sur
un bit (noir et blanc)
2 bits (quatre nuances de gris)
4 bits (16 couleurs)
8 bits (256 couleurs)
16 bits (65536 couleurs)
True color :
24 bits (plus de 16 millions de couleurs)
Rajouter une information de transparence : 32 bits 52
LES IMAGES CODÉES PAR POINTS
La taille du fichier correspondant est forcément
chaque fois en proportion.
53
LES IMAGES CODÉES PAR POINTS
Taille de limage en fonction du nombre de
couleurs choisies
54
IMAGES CODÉES PAR POINTS
Exemple :
Image de dimension 640x480 codée en 256 couleurs
55
IMAGES CODÉES PAR POINTS
Formats de fichiers
56
IMAGES CODÉES PAR POINTS
Quelques formats de fichiers
GIF (Graphic Interchange Format) (Format
déchange graphique)
Format propriétaire (Compuserve).
GIF stocke les images comme une séquence de pixel en
valeur de couleur RGB.
Chaque image est précédée
dune signature (no de version, etc.),
une définition décran (permet lajustage à lécran de
visualisation)
et une échelle de couleur.
Les données sont compressées avec lalgorithme LZW, ce
qui engendre une perte de données lors de
lagrandissement.
Facilité demploi + largement diffusé 57
IMAGES CODÉES PAR POINTS
GIF
Chaque image possède une palette de 256 couleurs
maximum, chaque couleur de la palette est codée sur
3 octets (RVB), elle est donc choisie dans 16 millions
de nuances.
Chaque point de limage est ensuite codé par le n°
dordre de la couleur dans la palette (index).
58
IMAGES CODÉES PAR POINTS
PNG Portable Network Graphics (Graphiques
transmissibles en réseau)
Projet Norme internationale (W3C)
En plus de fonctionnalités de GIF, PGN devrait
supporter:
des images en couleur vraie de plus de 48 bits/pixel
des images en grisé de plus de 16 bits/pixel
un canal de texte (masque transparent général)
des infos sur le gamma de limage (=affichage inaltérable)
une détection de la corruption de fichier
un affichage progressif rapide
59
IMAGES CODÉES PAR POINTS
TIFF Tag Image File Format (format de fichier
dimage étiquetées )
Format propriétaire (Adobe).
définit une séries de description de fichiers
permettant la reconnaissance de la plupart des
formats de données en deux dimensions.
TIFF défini des types de classe selon les données
numérisées.
Des marqueurs (tags) privés peuvent être ajoutés
pour définir des types dimage particuliers.
60
IMAGES CODÉES PAR POINTS
JPEG Joint Photographic Expert Group
standard
Norme internationale
Format de compression variable permettant la
compression sans perte ou avec perte dinformation
Gains de place mémoire et de vitesse daffichage
(internet) pour les images fortement compressées.
61
IMAGES CODÉES PAR POINTS
Parmi toutes les extensions de format dimages
codées par point selon ce principe, la plus connue
est BMP.
62
COMPRESSION
Un exemple : Image couleur 512*512 pixels
512 * 512 * 3 * 1 octet = 768 Ko
Autre exemple : Film couleur 320*200 d1h
320 * 200 * 3600 * 25 * 3 * 1 octet = 16 Go
63
Techniques Multimédia
COMPRESSION SANS PERTE
On peut récupérer entièrement les données
initiales
769 Ko 210 Ko
10101011
10011000
769 Ko 3 Ko
10101011
10011000
Techniques Multimédia
STANDARDS DE COMPRESSION
Compression dimage
sans perte : TIFF, GIF
avec perte : JPEG, JPEG 2000 ...
Compression de vidéo
MPEG-1, MPEG-2, MPEG-4 (DivX)
66
Techniques Multimédia
TECHNIQUES DE COMPRESSION
Suppression des répétitions : RLE (Run Length
Encoding)
n caractères successifs c sont remplacés par c suivi
d'un caratère spécial et du nombre d'occurrence
NAME:xxxxxxxxxxxxx
N A M E : x R 13
Transformations :
On passe du domaine temporel ou spatial au domaine
fréquentiel
On élimine les coefficients les moins significatifs
Fourier, Cosinus,... 68
Transformée de Fourier 2D
Image = images sinusoïdales (A,f, )
F( f x , f y ) f ( x , y ) exp( 2 j (f x x f y y )) dxdy
fx
(Module de
F(fx , fy)
y fy 69
Transformée Cosinus Discrète
c(u) 2 N pour u 0
Avec
c(u) 1 N pour u 0
70
TECHNIQUES DE COMPRESSION
LZW : Lempel-Ziv-Welch
Algorithme de compression des données sans perte. Il
s'agit d'une amélioration des algorithmes LZ77 (1977)
et LZ78 (1978), tous les deux écrits par Abraham
Lempel et Jacob Ziv. LZW fut créé en 1984 par Terry
Welch, d'où son nom.
Breveté par Unisys
Lalgorithme a été conçu de manière à être rapide à
implémenter, mais nest la plupart du temps pas
optimal car il effectue une analyse limitée des
données à compresser.
Utilisation dune table de traduction
71
CODAGE DES COULEURS
RGB
Sur les ordinateurs et en télévision on utilisera le
plus souvent un codage RVB (Rouge, Vert, Bleu).
Ces trois couleurs primaires permettent par synthèse
additive la recomposition de toutes les couleurs
visibles.
Laffichage sur un écran dordinateur est par principe
additif, lutilisation des 3 couleurs au maximum de
luminosité donne du blanc.
72
CODAGE DES COULEURS
CMJN
En imprimerie, la synthèse des couleurs étant
soustractive, on utilise les primaires de la peinture
(Cyan, Magenta,Jaune) auxquels on ajoute le Noir car
lutilisation des 3 primaires ne donne pas en général
un noir satisfaisant.
On travaille alors en quadrichromie. Le codage de
base est le plus souvent en 32 bits (4x8).
73
CODAGE DES COULEURS
Peu de logiciels permettent le codage des
couleurs directement en CMJN.
Corel Draw
La conversion RVB vers CMJN peut réserver des
surprises car certaines couleurs RVB ne pourront
être correctement imprimées.
Pour éviter ces désagréments, il est conseillé
dutiliser des nuanciers de type « PANTONE »
pour la création des images à imprimer.
Pour des impressions de luxe, on utilise parfois un
séparateur Hexachromatique (avec les couleurs du
nuancier Pantone). 74
CODAGE DES COULEURS
75
TRAITEMENT DIMAGES
POURQUOI TRAITE-T-ON DES IMAGES?
Moins cher
Quand il ny a pas dautres choix
Quand on veut utiliser pleinement les données
Grande-profondeur, capteurs de haute résolution,
Images multi-spectrales,
Rendering de données 3D,
Et plus encore.
77
POURQUOI TRAITE-T-ON DES IMAGES?
On traite des images pour avoir des images
subjectivement plus « jolies ».
78
Quelle image est meilleure ?
POURQUOI TRAITE-T-ON DES IMAGES?
Before / After
79
POURQUOI TRAITE-T-ON DES IMAGES?
80
POURQUOI TRAITE-T-ON DES IMAGES?
81
POURQUOI TRAITE-T-ON DES IMAGES?
82
POURQUOI TRAITE-T-ON DES IMAGES?
83
POURQUOI TRAITER DES IMAGES PAR
ORDINATEUR?
Humain
Identification
Reconnaissance
Voir et décrire les relations
Interprétation expérimentée
Ordinateur
Mesure des valeurs absolues
Calculs
Infatigable
Pas cher
84
Objectif
TRAITER UNE IMAGE,
EN QUOI ÇA CONSISTE ?
Coder
Améliorer
Simplifier
Analyser
Interpréter
...
85
Techniques Multimédia
CARACTÉRISTIQUES USUELLES
Des pixels, des valeurs, quen fait-on ?
Notions globales
ex : lhistogramme
Notions locales
ex : le voisinage
86
Techniques Multimédia
NOTIONS DE VOISINAGE, CONNEXITÉ ET
DISTANCE
Beaucoup de traitements font intervenir la
notion de voisinage
Un pixel possède plusieurs voisins (4 ou 8)
On parlera de connexité 4 ou 8
Distance City-Block d c ( f , f ) i k x j l y
longueur du chemin en connexité 4
88
HISTOGRAMME
Permet de mesurer la répartition globale des
valeurs des pixels de limage (probabilités)
89
Techniques Multimédia
BON OU MAUVAIS TRAITEMENT ?
Besoin de comparer des méthodes
mais pas toujours facile !
Il faut tenir compte de :
qualité
efficacité
adaptabilité
facilité
90
Techniques Multimédia
QUALITÉ DUNE SOLUTION
Comment quantifier la qualité ?
Mesures de qualité
rappel
précision
Comparaison avec résultat idéal
obtenu à la main
obtenu automatiquement
Corpus de test
91
Techniques Multimédia
EFFICACITÉ DUNE SOLUTION
Temps de calcul
Estimable a priori
Peut dépendre dun matériel spécifique
processeur embarqué (DSP )
architecture parallèle
92
Techniques Multimédia
ADAPTABILITÉ DUNE SOLUTION
La situation :
Méthodes spécifiques à un contexte
Lidéal :
Méthodes génériques
Lobjectif à atteindre :
Réutilisation !
93
Techniques Multimédia
FACILITÉ DUNE SOLUTION
Pour bien fonctionner, chaque méthode a besoin
dêtre configurée
Evaluation de la facilité :
Nombre de paramètres
Facilité de réglage
94
Techniques Multimédia
ETAPES DE TRAITEMENT DIMAGES
95
Eclairage Scène, objets 2D 3D...
Formation de l’image
Image 2D,3D,...
Numérisation
96
BDO
Tatouage
Compression
Segmentation
Transmission Reconnaissance
de formes
97
Décision
ACQUISITION DUNE IMAGE
98
CAPTEUR : PRINCIPE GÉNÉRAL
Principe général (ex: photodiode)
L'énergie incidente est convertie en signal électrique
Sortie est proportionnelle à la lumière
Filtre pour augmenter la sélectivité
99
CAPTEURS MATRICE 2D
KAF-1600 - Kodak
100
CAPTEUR CCD
Caméras numériques CCD
Matrice CCD (Charged Coupled Devices)
Système d'acquisition numérique 2D le plus
utilisé
La réponse est proportionnelle à l'intégrale de
l'énergie lumineuse qui atteint chaque élément
Pour la couleur, on utilise trois capteurs par pixel
réagissant à des longueurs d'ondes différentes
(rouge, vert et bleu)
Limage dentrée ne devra pas contenir trop de
hautes fréquences ( Ne passez pas à la télé avec 101
un costume rayé ! )
RAPPEL : QUEST-CE QUUNE IMAGE
NUMÉRIQUE?
102
IMAGE NUMÉRIQUE
Les valeurs de f (x,y) sont la réponse du capteur au
phénomène observé
Les valeurs de f (x,y) sont des valeurs de « voltage»
continu
Les valeurs de f (x,y) doivent être converties vers le
domaine numérique
Conversion Analogique/Numérique (A/N)
x
y
x
i j x - i x , y - j y ) Peigne de Dirac 2D
105
THÉORÈME DE SHANNON
La fréquence d'échantillonnage d'un signal doit
être égale ou supérieure au double de la fréquence
maximale contenue dans ce signal, afin de convertir
ce signal d'une forme analogique à une
forme numérique. Ce théorème est à la base de la
conversion numérique des signaux.
La meilleure illustration de l'application de ce
théorème est la détermination de la fréquence
d'échantillonnage d'un CD audio, qui est de 44,1 kHz.
En effet, l'oreille humaine peut capter lessons jusqu'à
16 kHz, quelquefois jusqu'à 20 kHz. Il convient donc,
lors de la conversion, d'échantillonner le signal audio
à au moins 40 kHz. 44,1 kHz est la
valeur normalisée par l'industrie 106
ÉCHANTILLONNAGE ET INFORMATION
107
ÉCHANTILLONNAGE ET QUANTIFICATION
108
ÉCHANTILLONNAGE ET QUANTIFICATION
Léchantillonnage est limité par la capacité du
capteur, donc le nombre de pixels disponible (ou
autre limite imposée)
La quantification est limitée par la quantité de
tons
(de gris) définie dans lintervalle
109
ÉCHANTILLONNAGE ET QUANTIFICATION
Avec un capteur à matrice
110
ÉCHANTILLONNAGE ET QUANTIFICATION
111
REPRÉSENTATION DES IMAGES
Matrice de dimension M X N
Chaque élément a une valeur entière dans
l'intervalle [Lmin , Lmax]
Le nombre de « bits » requis pour représenter les
niveaux de gris dans lintervalle « L » est « K »
La relation entre « K » et « L » est :
L=2K
Le nombre de bit pour entreposer un image est
donc :
b=MXNXK
112
RÉSOLUTION DES IMAGES
Résolution spatiale
Le plus petit détail discernable
113
RÉSOLUTION DES IMAGES
114
Effets de l'échantillonnage : pixelisation
Correction de l'éclairage
118
• Flou de bougé/filé dû à un temps de pose/intégration trop long
Techniques Multimédia
FILTRAGE : REHAUSSEMENT DE CONTRASTE
Améliorer la lisibilité de limage
121
121
Techniques Multimédia
SEGMENTATION
Simplification qui permet de mieux
comprendre le contenu de limage
Techniques Multimédia
LES VIDÉOS
LES DIFFÉRENTES ÉTAPES DE LA PRISE
DE DONNÉES À LANALYSE
Préparation du dispositif denregistrement Audio-vidéo :
1- Choix du matériel denregistrement / vérification de son
fonctionnement / Préparation des accessoires et consommables
USB Acquisition /
Numérisation
Cordons
analogiques
(et carte dacquisition)
Compression
126
LES LOGICIELS NÉCESSAIRES À LACQUISITION
Lacquisition sur ordinateur nécessite un logiciel intégrant
une fonction de capture. La plupart des logiciels de
montage vidéo proposent ce type de fonction :
Les logiciels de montage « grand public »
Caractéristiques : simple à utiliser et généralement gratuit.
Fonctions limitées pour le montage et lenregistrement des
données
» Imovie (Mac) ; Windows Movie Maker (Windows XP et Vista) ;
» Les logiciels livrés avec les caméscopes
Les logiciels de montage semi-professionnels :
Caractéristiques : relativement complets et ergonomiques ; coût
abordable
Ex : Premiere Elements, FinalCut Express, Pinnacle Studio
Les logiciels de montage professionnels :
Caractéristiques : très complets, complexes à utiliser ; onéreux ;
lourds 127
128
LES LOGICIELS NÉCESSAIRES À LACQUISITION
Adobe Premiere Elements
129
LES LOGICIELS NÉCESSAIRES À LACQUISITION
Adobe Premiere Pro
130
COMPOSITION ET LECTURE DES FICHIERS
VIDÉOS
Un fichier vidéo se compose généralement de 2 éléments :
Le conteneur. Il correspond généralement au format du fichier. Son rôle
est de rassembler et dorganiser dans un fichier, différents types de
données (flux audio, vidéos, sous-titres, meta-données ). Exemple de
conteneurs :
LAudio Video Interleave (.AVI), Quicktime (.MOV), Real Media (.RM),
MP4
FLV (Flash Vidéo), MKV (Matroska), le WMV (Windows Media Video),
Chaque conteneur possède ses spécificités en termes de nombre de
pistes acceptées pour la vidéo et laudio, de codecs reconnus
Le(s) contenu(s) : Ils se composent essentiellement de flux audios et/ou
vidéos.
Ceux-ci sont généralement compressés à laide dun codec (algorithme de
compression/decompression) comme le Divx, le H264, le mp3
Ex : un flux vidéo au format Divx peut être « encapsulé » dans un
conteneur AVI ou Quicktime.
Un fichier vidéo nécessite un « lecteur multimedia» (« player » en anglais) pour
le lire
ex: Windows Media Player pour les fichiers AVI, Quicktime pour les MOV, Real
Player pour les RM, VLC, MediaPlayer Classic 131
Remarque : les lecteurs ne savent lire quun nombre restreint de conteneurs (ainsi
on ne pourra pas lire les fichiers Quicktime avec Windows Media Player )
INTÉRÊT DE LA COMPRESSION
Constat : une fois capturées les vidéos sont très
volumineuses :
- 1 heure de vidéo non compressée occupe environ 85 Go
(dimension 720/576 ; 24 img/s ; couleurs 24 bits)
- 1 heure au format DV occupe environ 13 Go sur le disque dur
132
LES DIFFÉRENTS TYPES DE
COMPRESSIONS
Compression non destructives (lossless):
Des algorithmes mathématiques compressent les données
sans aucune perte dinformation
La décompression restitue intégralement les données
initiales
Le gain de taille par rapport à loriginal est moindre
Exemple de compression non destructive : le format ZIP
Compression destructives (lossy) :
Supprime définitivement les informations peu
représentatives (détails ) ou non perceptibles (fréquences
non audibles, nuances de couleurs )
Le gain de taille est très important. Le ratio de compression
peut être très important (ex. 10 : 1 voire beaucoup plus)
Exemples de compressions destructives : le JPEG, le MPEG
133
LES TECHNIQUES DE COMPRESSION
Compression spatiale
Dans une image fixe non compressée, les pixels sont codés
individuellement
Compression temporelle
Dans une suite dimages (vidéo), seuls sont codés les éléments qui
varient dune image à lautre.
Ex. : personnage qui bouge dans un plan fixe 134
LES CODECS
(COMPRESSEUR / DECOMPRESSEUR)
Il existe différents algorithmes de compression plus
ou moins performants. Chaque codec possède ses
spécificités et ses domaines de prédilection.
Les plus anciens : Le MPEG 1, Cinepak, Sorenson
Video
Les plus récents, ils sont tous dérivés de la norme
MPEG 4 :
Le DIVX : format très populaire sur Internet
XVID : similaire au DIVX en termes de performances mais
gratuit (format « open source »)
WMV : le format propriétaire de Microsoft
H264 - MPEG4-AVC : résulte du travail du groupe MPEG et
IUT-T 135
TEMPS DE COMPRESSION ET NOTION DE
DÉBIT
Le temps de compression dépend de plusieurs facteurs :
facteurs matériels : caractéristiques du micro-processeur équipant
lordinateur, quantité de mémoire installée
facteurs logiciels : codec et logiciel utilisés, options choisies
qualité du rendu final : nombre dimages par seconde, dimension
de limage (résolution), débit (bitrate), nombre dimages clés
Notion de débit (bitrate en anglais) :
Le débit désigne la quantité dinformations transférée en lespace dune
seconde. Lunité de mesure est le bit par seconde (bit/s) et ses
différents multiples (Kilo-bits par seconde, Mega-bits par seconde..).
Le choix du débit aura un impact direct sur la taille et la qualité du
fichier final
- le poids du fichier est directement proportionnel au débit utilisé
- à partir dun certain débit, lamélioration de la qualité nest plus
perceptible
- on estime quun débit de 1 500 Kbit/s (~150 Ko/s) représente un bon
compromis pour obtenir une vidéo de qualité à partir dun codec136
dérivé du MPEG 4 (DIVX, WMV, XVID, H264 ). Attention, la
notation anglaise du Ko est KByte (ne pas confondre avec le Kilobit)
TABLEAU COMPARATIF (CODECS)
137
LES CODECS EN RÉSUMÉ
Si lon désire travailler avec un format « universel » :
MPEG 1 ou 4, le DIVX (du fait de son intégration
progressive dans les équipements multimédias)
Pour sa simplicité dutilisation : Le Windows Media Video (intégré à
Windows Movie Maker ou téléchargeable sur le site de Microsoft)
141
EXPLOSION DE LA VIDÉO SUR INTERNET
DANS TOUS LES SECTEURS
142
142
143
LES INTERNAUTES CONSOMMENT ET
PRODUISENT DE PLUS EN PLUS DE CONTENU
VIDÉO
Sources : http://www.pewinternet.org/PPF/r/219/report_display.asp
144
Journal du Net
QUEL LECTEUR UTILISENT LES
INTERNAUTES ?
145
CONTRAINTES TECHNIQUES
Palier à l incompatibilité des lecteurs.
Permettre une lecture instantanée et multi
plate forme.
Associer la vidéo à une interface intuitive.
Naviguer par chapitre à l intérieur d une
vidéo.
Automatiser le renseignement et la
manipulation de méta données.
146
FORMATS DE VIDÉO PC ET MOBILES
147
MÉTHODES DE DIFFUSION DE FLUX VIDÉO
2. Téléchargement progressif
Début de la lecture avant la fin du téléchargement
Lecture de haute qualité quelle que soit la vitesse de
connexion des utilisateurs.
149
SOLUTIONS DE GESTION DE VIDÉO
Serveur de
stockage
Fichiers
Serveur
numériques vidéo
Fichiers
VIDEO
Autres
fichiers
Appli Web
PHP
150
SOLUTIONS DE GESTION DE VIDÉO
Macromedia FLASH
Format FLV (Flash video)
Ne Supporte pas les fichiers vidéos de
téléphones
Serveur d application « Flash Media Server »
FLASH 10 11 Video Encoder
Plugin Flash (98,3 %)
VIDEOLAN
Solution open source
Streaming vidéo
Support des formats vidéos
(PC et mobiles)
Gestion des contrôles via javascript
Inconvénients : plugin VLC disponible
uniquement sous Firefox (12%)
Solutions commerciales :
gestion de contenu vidéo, diffusion et
stockage
VitalStream (Flash et Windows Media)
MediaBox (Flash video)
155
Techniques Multimédia
SIGNAL VIDÉO
Sur un récepteur de télévision, une image est obtenue par
balayage électronique successif des lignes de luminophores
constituant lécran.
Un écran au standard PAL ou SECAM comprend 625 lignes, alors
quun écran au standard NTSC nen possède que 525.
On sait que, pour donner à lil humain une impression
déclairement continu à laide dune source lumineuse émettant de
façon discontinue (vidéo projecteur, projecteur de cinéma, écran
TV, ), il faut au moins 40 éclats par seconde :
Une fréquence de 20 à 40 éclats provoque une impression de
scintillement
Une fréquence au-dessous de 20 éclats, léclairement paraît saccadé
Pour obtenir une impression de continuité parfaite avec 25 images/s,
on divise chaque image en 2 demi-images projetées successivement,
provoquant ainsi 50 sensations différentes par seconde.
156
Techniques Multimédia
LA VIDÉO NUMÉRIQUE
NTSC :
standard de diffusion TV du continent nord-américain et du Japon, la
fréquence du courant électrique est 60Hz, la fréquence daffichage est de 30
images/s (exactement 29,97 im/s) sur 525 lignes.
PAL :
standard de diffusion TV couleur, qui a été mis point en Allemagne vers
1960. Son principal avantage relativement au standard américain dont il est
très proche, est de remédier aux erreurs de phase dont souffre ce dernier.
SECAM :
standard français, il comporte 625 lignes et 25 images/s. la fréquence du
courant électrique distribué en Europe est en effet de 50Hz.
Standard CCIR 601 :
comité international des radiocommunications. Cet organisme a été remplacé
par le secteur de radiocommunication de lunion internationale des
télécommunications (UIT) : standard concernant la vidéo numérique.
157
Techniques Multimédia
LA VIDÉO NUMÉRIQUE
Image en continuité parfaite :
Les demi-images ou trames sont obtenues par balayage des seules
lignes paires dans un 1er temps, puis des lignes impaires dans un
2e temps.
limage complète est obtenue par entrelacement des 2 trames.
Exemple :
le signal vidéo analogique est donc découpé en 25 ou 29,97 images/s (en. frames),
elles-mêmes divisées en 25 x 2 = 50 ou en 29,97 x 2 = 59,94 trames (en. fields) ,
celles-ci étant à leur tour analysées en 312,5 ou 262,5 lignes.
+ =
158
Trame paire Trame impaire image
Techniques Multimédia
LA VIDÉO NUMÉRIQUE
159
y (lignes)
Techniques Multimédia
ÉCHANTILLONNAGE VIDÉO
Échantillonner la ligne :
en vidéo analogique, lunité minimale est la ligne, car le signal est
conçu pour piloter en continu les déplacements du triple faisceau
délectrons (RVB) et NON pour exprimer la couleur spécifique de
chaque point de limage.
Résolution verticale :
le nombre de lignes sur un écran (résolution verticale) est
exactement déterminé par chaque standard :
S
PAL et SECAM distinguent 625 lignes dont 576
seulement sont destinées au balayage réel de
limage, le reste étant affecté à divers « services » I
de synchronisation et de positionnement des
faisceaux (changement de ligne et de trame)
NTSC naffecte quant à lui que 480 lignes sur 525 S
à laffichage de limage Résolution verticale
160
Techniques Multimédia
LA VIDÉO NUMÉRIQUE
Résolution horizontale :
la résolution horizontale quant à elle nest pas un paramètre fixe du
signal vidéo analogique: elle dépend de la bande passante allouée à la
vidéo et à la qualité du moniteur sur laquelle elle viendra safficher.
Limage télévisée standard obéit à un ratio de 4:3 (ie. largeur de
limage est 1,33 fois plus grande que sa hauteur), on peut estimer le
nombre de points par ligne (ie. estimer la largeur de limage en nombre
de points) :
PAL, SECAM :
Limage ayant une hauteur de 575 lignes, sa largeur sera :
575 x 1,33 = 768 points
NTSC :
Limage ayant une hauteur de 480 lignes, sa largeur sera de 640 points.
La résolution théorique du standard NTSC est à lorigine du célèbre
affichage VGA de 640 x 480 sur les moniteurs informatiques.
161
Techniques Multimédia
LA VIDÉO NUMÉRIQUE
Au cours des années 1970, les industriels commencent à prendre
conscience de lavenir de la vidéo en passant par le numérique.
En conséquence, ils commencent à sintéresser aux techniques de
numérisation applicables au secteur des télécommunications,
télédiffusions, télédétections, etc.
Pour éviter lanarchie dans les formats propriétaires, en 1982, le
standard CCIR 601 a été adapté par lUIT pour la télévision
numérique :
Le nombre de points actifs par ligne est de 720 (pour tous les autres
standards)
Le nombre total des points par ligne (ppl) est de :
858 ppl en NTSC (525 lignes / 59,94 trames par seconde)
864 ppl en PAL et SECAM (575 lignes / 50 trames par seconde).
162
Techniques Multimédia
EXEMPLES :
Dans le standard PAL, à raison de 625 lignes par image, de 864 points par ligne et
de 25 images/seconde, on obtient :
625 lignes/image x 864 points/ligne x 25 images/s
= 13 500 000 points/s
Dans le standard NTSC, on obtient exactement le même nombre de points par
seconde :
858 points/ligne x 525 lignes/s x 30 images/s x 1000/1001
= 13 500 000 points/s
si 1 seconde de vidéo correspond à 13 500 000 points et
si lon veut conserver toute linformation concernant ces points
alors il est nécessaire de les décrire individuellement.
pour 1 seconde vidéo, on doit définir 13 500 000 échantillons : la fréquence déchantillonnage
requise dans ces conditions est donc de 13,5 MHz
163
Techniques Multimédia
LE STANDARD MPEG
LE MPEG
(MOVING PICTURES EXPERTS GROUP)
165
LE STANDARD MPEG
Image Codeur de
encodée Quantificateur
Huffman
166
LE STANDARD MPEG
DCT 167
LE STANDARD MPEG
168
STANDARDS ET NORMES VIDÉOS
le MPEG-1, développé en 1988, est un standard pour la compression des données
vidéos et des canaux audio associés (jusqu'à 2 canaux pour une écoute stéréo). Il
permet le stockage de vidéos à un débit de 1.5Mbps dans une qualité proche des
cassettes VHS sur un support CD appelé VCD (Vidéo CD).
le MPEG-21, en cours d'élaboration, dont le but est de fournir un cadre de travail (en
anglais framework) pour l'ensemble des acteurs du numériques (producteurs,
consommateurs, ...) afin de standardiser la gestion de ces contenus, les droits d'accès,
les droits d'auteurs, ... 169
Techniques Multimédia
LE STANDARD MPEG
Estimation du mouvement:
170
LE STANDARD MPEG
Les trames I, P et B:
171
FRAMES I :
172
Techniques Multimédia
FRAMES P :
Ces images sont définies par différence par rapport à
l'image précédente. L'encodeur recherche les différences de
l'image par rapport à la précédente et définit des blocs,
appelés macroblocs (16x16 pixels) qui se superposeront à
l'image précédente.
L'algorithme compare les deux images bloc par bloc et à
partir d'un certain seuil de différence, il considère le bloc de
l'image précédente différent de celui de l'image en cours et
lui applique une compression JPEG.
C'est la recherche des macroblocs qui déterminera la vitesse
de l'encodage, car plus l'algorithme cherche des "bons"
blocs, plus il perd de temps...
Par rapport aux frames-I (compressant directement), les
frames-P demandent d'avoir toujours en mémoire l'image
précédente.
173
Techniques Multimédia
FRAMES B :
De la même façon que les frames P, les frames B sont
travaillées par différences par rapport à une image de
référence, sauf que dans le cas des frames B cette
différence peut s'effectuer soit sur la précédente
(comme dans les cas des frames P) soit sur la
suivante, ce qui donne une meilleure compression,
mais induit un retard (puisqu'il faut connaître l'image
suivante) et oblige à garder en mémoire trois images
(la précédente, l'actuelle et la suivante).
174
Techniques Multimédia
FRAMES D :
Ces images donnent une résolution de très basse
qualité mais permettent une décompression très
rapide, cela sert notamment lors de la visualisation en
avance rapide car le décodage "normal" demanderait
trop de ressources processeur.
Dans la pratique :
Afin d'optimiser le codage MPEG, les séquences d'images
sont dans la pratique codées suivant une suite d'images
I, B, et P (D étant réservé à l'avance rapide) dont l'ordre
a été déterminé expérimentalement. La séquence type
appelée GOP (Group Of Pictures ou en français groupes
d'images) est la suivante: IBBPBBPBBPBBI
Une image I est donc insérée toutes les 12 frames.
175
Techniques Multimédia
LE SON
REPRÉSENTATION NUMÉRIQUE DU SIGNAL
(ENCODAGE CD)
Ts
Définitions
- Fréquence d'échantillonnage ( ) : Fs=1/Ts.
= nombre d'échantillons prélevés pour une seconde du signal.
- Résolution = nombre de bits utilisés pour coder un échantillon,
-Débit ( ) = nombre de bits utilisés pour coder 1 seconde de son.
Qualité CD :
- Fs = 44100 Hz (44100 éch/s de son)
- Résolution 16 bits
- Stéréo } 44100*16*2 = 1.41Mbits/sec
Stockage
(CD, DAT, Restitution
disque dur...) du son original,
Son original altéré ou non
Compression Décompression
(Encodage) (Décodage)
Streaming
(transmission
via un réseau)
= au détriment de la qualité
Les sons que l'on retrouve dans la nature sont complexes (constitués de
nombreuses composantes fréquentielles).
T a u x de T a ille p our 1
Bit r a t e Qu a lit é
com pr e ssion m in u t e de son
Mp3 “classique”
Représentation note par note d'un extrait musical. Chaque note est
décrite par un chiffre qui donne sa hauteur, sa durée et son intensité.
DE L'ENCODAGE
À LA COMPOSITION DE SCÈNES SONORES
Mixing
Composition
Effects processing
Audio Scene
Description
Playback
Presentation
Spatial presentation
Natural Coding :
signal original restitution d'un signal
Encodage Décodage
proche de l'original
Synthetic coding
algorithme
de synthèse
synthèse
Encodage Décodage
d'un son original
paramètres
de synthèse
Un son est généré à partir d'un algorithme à qui sont fournis des
paramètres pour la synthèse.
Composition
= mixage des objets sonores
dans la scène (multicanal)
= traitements sonores
(postprocessing) AudioBIFS
& AdvancedAudioBIFS
Présentation
= Reproduction spatialisée de la
scène (enceintes, headphones)
- Ensemble de techniques
LEFFET DE MASQUE
- Exemple :
Le pépiement des oiseaux couvert par le
passage dun avion dans le ciel
On entend plus les oiseaux
Son des oiseaux inutile
Son des oiseaux supprimé
202
MP3
LE RESERVOIR DOCTETS
LE JOINT STÉRÉO
- Défaillance de loreille :
204
MP3
CODE HUFFMAN
Comparable à MP3
Compression avec perte
Débit entre 30 et 500 kbits/s
Format libre : www.vorbis.com
Compression à débit variable
Taux de compression > MP3
Mais nécessite un traitement plus complexe
207
FLAC
208