Compresión de Vídeo
Compresión de Vídeo
Compresión de Vídeo
Para entender el proceso de la compresión de video, es una buena idea comenzar definiendo
la entidad de trabajo, la señal de video.
La crominancia, por el contrario, contiene todo lo relacionado con el color de los objetos,
separada en los tres colores básicos. Las señales de crominancia se obtienen de las llamadas
señales diferencia de color: rojo menos luminancia (R-Y), azul menos luminancia (B-Y) y
verde menos luminancia (G-Y). De estas tres señales sólo necesitamos dos, al poder obtener
la otra mediante la combinación de las anteriores. En la siguiente tabla vemos la equivalencia
entre estas señales:
La forma más común de la señal de video todavía es la señal analógica. Esta señal se obtiene
a través de un proceso conocido como scanning. Este proceso graba los valores de intensidad
de la señal espacio-temporal en la dirección h, convirtiéndola en una señal unidimensional.
Esta señal se señaliza con pulsos de sincronización verticales y horizontales para conseguir la
señal de video final.
La progresiva escanea todas las líneas horizontales para formar el cuadro (frame) completo
y se usa en la industria de los monitores de computadoras.
El scanning entrelazado se utiliza en la industria de TV. Aquí, las líneas horizontales pares
e impares de un cuadro se escanean de forma separada consiguiendo los dos campos de un
cuadro.
Video Compuesto.
S-Video ó S-VHS.
En el formato S-Video, también conocido como Y/C, existen dos señales independientes,
una de ellas contiene únicamente la información de luminancia, mientras que el segundo
canal contiene la información de crominancia C (U y V). El estándar de video Compuesto
incluye el formato NTSC utilizado en USA y Japón, y PAL/SECAM utilizado en Europa.
Conceptos Básicos
Cuando un decodificador de vídeo restaura un vídeo descodificando la transmisión de
bits fotograma a fotograma, la descodificación debe comenzar siempre por un
fotograma I. Los fotogramas P y B, en caso de usarse, deben descodificarse junto a los
fotogramas de referencia.
Secuencia con fotogramas I, B y P
Fotograma I o Intra-fotograma
Latencia
Códec de vídeo
Intra-frame o Intra-fotograma
Inter-frame o Inter-fotograma
Este método está basado en la similitud temporal entre los distintos cuadros de imagen
o fotogramas. También se conoce por compresión temporal. Los archivos generados
son de menor tamaño, ya que excluye mucha información, resultando de menor
calidad. El formato MPEG-2 utiliza este tipo de compresión.
Formatos de compresión
Motion JPEG (M-JPEG)
Esta compresión utiliza la tecnología de codificación intra-fotograma. Los datos se
reducen a un fotograma y es comprimido por separado por una serie de imágenes JPEG
individuales (JPEG son las siglas de Joint Photographic Experts Group – Grupo de
Expertos Fotográficos Unidos). Este formato se utiliza frecuentemente en dispositivos
portátiles tales como cámaras digitales. Al visualizar 16 o más imágenes por segundo,
el ojo humano lo percibe como un vídeo en movimiento. Motion-JPEG es el método
elegido para las aplicaciones donde se envía la misma información a todos los usuarios,
las broadcast.
Compresión de vídeo-4
La primera imagen de
la secuencia se codifica en su totalidad, en las imágenes siguientes existen referencias
a la primera imagen, en cuanto a los elementos estáticos, ejemplo, la casa. Sólo se
codifican los elementos en movimiento, a través de vectores de movimiento, esto con
el fin de reducir la cantidad de información que se almacena.
MPEG-4
H.264
H.264 o MPEG–4 parte 10 es una norma que define un códec de vídeo de alta
compresión, desarrollada conjuntamente por el ITU-T Video Coding Experts Group
(VCEG) y el ISO/IEC Moving Picture Experts Group (MPEG). Es el estándar más actual
de MPEG para la codificación de vídeo. Un codificador H.264 puede reducir el tamaño
de un archivo de vídeo digital en más de un 80% si se compara con el formato Motion
JPEG, y hasta un 50% más en comparación con el estándar MPEG-4, todo esto sin
comprometer la calidad de la imagen. Esto se traduce en menos espacio de
almacenamiento y ancho de banda, es decir, se puede lograr mayor calidad de imagen
de vídeo para una frecuencia de bits determinada.
La mayor utilidad de este estándar es en el sector de la video vigilancia, ya que en este
sector se necesitan velocidades y resoluciones altas, como es el caso de la vigilancia de
autopistas, aeropuertos y casinos, lugares donde por lo general se usa una velocidad
de 30/25 (NTSC/PAL) imágenes por segundo. Las ventajas de reducción de ancho de
banda y almacenamiento afectaran positivamente tu economía.
¿Cuál formato es mejor?
A continuación, se visualiza un cuadro comparativo en el cual se muestra que el
formato H.264 es el estándar de compresión de vídeo más eficaz.
características principales
Capacidad de compactación de la energía en el dominio transformado. La
transformada coseno discreto (DCT- Discrete Cosine Transform) consigue
En general sólo trataremos con bloques cuadrados cuyos tamaños son, como
hemos comentado, una potencia de 2.
Propiedades de la DCT
La DCT por sí misma, al pasar de una matriz a otra del mismo tamaño no implica
compresión alguna, pero tiene algunas características importantes que la hacen muy
útil para nuestro propósito. Sin llegar a hacer un estudio exhaustivo, nos vamos a centrar
en aquellas propiedades que nos van a ser útiles en los procesos de compresión de
imágenes.
a)- Una de las propiedades más importantes y que se puede comprobar directamente
de la definición es la de “separabilidad”. En este caso. la separabilidad quiere
decir que una DCT bidimensional se puede expresar como un conjunto de varias
DCTs unidimensionales.
c)- Los coeficientes resultado de la DCT presentan entre sí una muy pequeña
correlación. Esta propiedad es especialmente importante en aplicaciones de
compresión de imágenes, ya que de esta forma será posible dar a los coeficientes
tratamientos totalmente diferentes dependiendo del lugar que ocupen dentro de
la matriz de coeficientes.
d)- La transformada de Fourier es una transformada compleja, con parte real y parte
imaginaria, lo que complicado el trabajo con ella. Sin embargo la DCT es una
transformada real; sus resultados son muestras de la función coseno, y esto
simplifica mucho su manejo.