Este documento trata sobre el procesamiento digital de audio y video. Describe cómo el ser humano capta información a través de la vista y el oído y cómo ha evolucionado para transformar estas señales en información tecnológica. Explica los conceptos básicos de audio digital como la grabación, edición y compresión de sonido, así como los formatos y sistemas de almacenamiento de audio y video. También cubre temas como la captura, transmisión, edición y compresión de video digital.
Este documento trata sobre el procesamiento digital de audio y video. Describe cómo el ser humano capta información a través de la vista y el oído y cómo ha evolucionado para transformar estas señales en información tecnológica. Explica los conceptos básicos de audio digital como la grabación, edición y compresión de sonido, así como los formatos y sistemas de almacenamiento de audio y video. También cubre temas como la captura, transmisión, edición y compresión de video digital.
Este documento trata sobre el procesamiento digital de audio y video. Describe cómo el ser humano capta información a través de la vista y el oído y cómo ha evolucionado para transformar estas señales en información tecnológica. Explica los conceptos básicos de audio digital como la grabación, edición y compresión de sonido, así como los formatos y sistemas de almacenamiento de audio y video. También cubre temas como la captura, transmisión, edición y compresión de video digital.
Este documento trata sobre el procesamiento digital de audio y video. Describe cómo el ser humano capta información a través de la vista y el oído y cómo ha evolucionado para transformar estas señales en información tecnológica. Explica los conceptos básicos de audio digital como la grabación, edición y compresión de sonido, así como los formatos y sistemas de almacenamiento de audio y video. También cubre temas como la captura, transmisión, edición y compresión de video digital.
Descargue como PDF, TXT o lea en línea desde Scribd
Descargar como pdf o txt
Está en la página 1de 38
Autores:
Rafael Montante Lpez
Jos Luis Villarreal Bentez Procesamiento Digital de Audio y Video NDICE Introduccin.................................................................................................................................1 1. Audio........................................................................................................................................3 1.1 Introduccin......................................................................................................................3 1.2 Sonido digital.....................................................................................................................5 1.3 Tecnologa MIDI................................................................................................................6 1.4 Formatos de archivos de audio..........................................................................................8 1.5 Grabacin de audio...........................................................................................................9 1.5.1 Compresin de audio: MP3...................................................................................10 1.6 Edicin de audio..............................................................................................................11 2. Video digital...........................................................................................................................17 2.1 Captura de video.............................................................................................................19 2.2 Despliegue de video........................................................................................................20 2.2.1 El modelo RGB......................................................................................................20 2.3 Transmisin de video.......................................................................................................21 2.4 Videoconferencia.............................................................................................................23 2.5 Video interactivo.............................................................................................................24 2.6 Sistemas de almacenamiento...........................................................................................26 2.6.1 Sistemas analgicos...............................................................................................26 2.6.2 Sistemas digitales..................................................................................................27 2.6.2.1 Almacenamiento magntico......................................................................27 2.6.2.2 Almacenamiento ptico............................................................................29 2.7 Compresin.....................................................................................................................31 2.7.1 Video MPEG-1 y MPEG-2.....................................................................................32 2.8 Edicin no lineal..............................................................................................................33 2.9 Televisin digital .................................................................................................................34 Procesamiento digital de audio y video 1 INTRODUCCIN El ser humano cuenta con sentidos muy especializados para captar la informacin de su ambiente, stos son: el sentido de la vista, el tacto, el olfato, el gusto, el sentido auditivo y el del equilibrio. Todos estos sentidos son muy importantes para reconocer nuestro entorno; sin embargo, son la vista y el oido, los que ms usamos y los que nos proporcionan informacin ms inteligible. Estos sentidos captan informacin de nuestro ambiente, la cual se presenta como seales continuas y nuestro cuerpo est adaptado para percibir las seales que ms informacin til contienen. De tal forma que slo omos un rango limitado de frecuencias de ondas sonoras; aquellas que necesitamos para oir a nuestros semejantes y poder comunicarnos, filtrando as, las bajas frecuencias que escuchan algunos animales y que usan para comunicarse porque su ambiente as se los impone. El ser humano ha evolucionado para transformar estas seales de su entorno en informacin, y siempre ha tenido la inquietud de emular estas capacidades con la tecnologa, deseando algn da llegar a superarlas. Para lo cual ha desarrollado formas anlogas de transformar estas seales en informacin, transmitirlas a travs del espacio, guardarlas a travs del tiempo y reconvertirlas en seales percibibles por nuestros sentidos (p.ej. La voz que viaja a travs de lneas telefnicas). De esta forma, el esquema ha sido el uso de codificadores y decodificadores. En la figura I.1 se puede notar el esquema bsico de captura de una seal de audio a travs de una fuente, el sonido es captado por el micrfono y convertido en una seal analgica, que es procesada para llegar a su destino, el cual est representado por la persona que escucha la meloda del violn.
Figura I.1 Esquema bsico del proceso de adquisicin y reproduccin del audio. Rafael Montante Lpez y Jos Luis Villarreal Bentez 2 Con el advenimiento de las computadoras digitales, el hombre ha continuado en el avance del control de la informacin y ha transformado las seales sonoras y las visuales en ceros y unos, o sea, en informacin digital. As mismo, ha logrado ampliar su espectro sensorial para ver y or lo antes imposible. El uso de las computadoras ha llevado al ser humano a no solo continuar en el dominio de las seales, sino en el control y mejoramiento de stas para utilizarlas como informacin y conocimiento; ya que las computadoras han permitido almacenar y transmitir esta informacin, transformarla y crear nuevas seales sonoras y auditivas. Esta tecnologa ha fascinado a las personas y cada da en las actividades humanas se infiltra con ms naturalidad. Muchas de las decisiones diarias de los individuos en los tiempos actuales, involucran el uso de tecnologas de software y hardware computacionales, los cuales ofrecen vas alternativas para acceder y desplegar informacin, Permitiendo al ser humano el anlisis de un rango ms amplio de seales auditivas y visuales, as como su almacenamiento y transmisin global, sin fronteras; pero tambin lo ha llevado a modificar estas seales y a poder inventar nuevas, o sea a la sntesis de audio y video electrnicos. Procesamiento digital de audio y video 3 1. AUDIO 1.1 Introduccin Cuando en un medio, algo vibra movindose de un lado a otro, genera ondas de presin, las cuales se dispersan en el medio (como el aire) y si esas ondas alcanzan un rango de vibracin que nuestros odos pueden percibir, lo que detectamos es sonido. En el aire, el sonido se propaga alrededor de 1200 kilmetros por hora; lo que se conoce como Match 1 al nivel del mar. Las ondas sonoras varan en el ruido o volumen (medido en decibeles o dB) 1 y la frecuencia o el grado de vibraciones por segundo (medido en Hertz o Hz). Muchas ondas sonoras se mezclan formando sonidos ms complejos. La figura 1.1 muestra la representacin de una onda (sonido) producido por un instrumento metlico (diapasn) que viaja por el aire a determinada frecuencia y que nuestros odos pueden percibirla como una nota musical.
Figura 1.1 De diapasn. La acstica es la ciencia que estudia al sonido, considerndolo como energa. Los niveles de presin del sonido (volumen), son medidos en decibeles (dB), los cuales pueden ser representados como la proporcin entre un punto de referencia escogido sobre su escala logartmica y el nivel que se est experimentando al momento; por ejemplo, cuando el sonido es cuadruplicado en su poder de salida, la medicin incrementa nicamente en 6dB, si el sonido aumenta cien veces, se alcanzan slo 20dB. Esta escala tiene sentido, ya que los seres humanos percibimos los niveles de presin del sonido, sobre un rango amplio extraordinariamente dinmico, o sea, que ajustamos nuestra percepcin. En la figura 1.2 se puede notar una grfica de barras que muestra la intensidad que alcanza el sonido (medido en decibeles) en diferentes momentos o situaciones.
1 El Bel es una medida que indica ganancia en voltaje, corriente o potencia. Un Bel est definido como una medida que se incrementa cada 10 veces su potencia, por ejemplo, si a una seal se le incrementa su potencia 10 veces, la ganancia en potencia es 1 Bel o 10 decibeles (dB). Rafael Montante Lpez y Jos Luis Villarreal Bentez 4
Figura 1.2 Intensidad o niveles de sonido en diferentes situaciones. En trminos de volumen, lo que el odo oye subjetivamente, no es lo que se oye objetivamente. La percepcin del ruido o volumen depende de la frecuencia o grado de sonido: a frecuencias bajas se requiere ms poder para alcanzar la misma percepcin de volumen. Como se ilustra en la figura 1.3 al instrumento conocido como Gong es necesario aplicarle ms fuerza para que el odo perciba su sonido, dado que ste produce sonidos con frecuencias bajas, mientras que al instrumento Tringulo no es necesario aplicarle tanta fuerza para percibir los sonidos producidos por ste, ya que se genera sonido de frecuencia ms alta que el Gong. Para el uso de sonido en proyectos de multimedia, no se necesita ser especialista en armnicas, intervalos, ondas sinusoidales, notacin, octavas o en la fsica de la acstica y las vibraciones. Pero si es importante recordar cmo hacer sonidos, grabarlos y editarlos, e incorporarlos en los trabajos.
Figura 1.3 Generacin de sonidos por medio de instrumentos de percusin. Procesamiento digital de audio y video 5 1.2 Sonido digital El sonido puede ser digitalizado utilizando un micrfono, un sintetizador, reproductoras de audiocassettes, radio o televisin, o cualquier fuente de sonidos naturales o pregrabados. Digitalizar sonido es tomar muestras de la seal continua de sonido, tomando o registrando el sonido cada fraccin de tiempo (de manera discreta o discontnua) y almacenndolo como informacin digital en bits; estas muestras son contabilizadas en un periodo de tiempo, lo cual produce una tasa, denominada tasa de muestreo.
Figura 1.4 Muestreo de la seal. Las frecuencias de muestreo ms utilizadas en multimedia son 44.1kHz, 22.05kHz y 11.025kHz, utilizando 8 o 16 bits. Entre ms corta sea la frecuencia de muestreo y ms bits para guardar el valor de la amplitud o niveles del sonido, mayor calidad en el sonido (o fidelidad en la reproduccin); aunque por otro lado, el almacenamiento es ms costoso en espacio. Un tamao de muestra de 8 bits, permite 256 unidades iguales para describir el rango dinmico o amplitud, para cada intervalo de muestreo; mientras que con 16 bits es posible contar con 65536 unidades, lo que hace que la calidad del sonido sea mejor, la nica desventaja es que se requiere de ms espacio de almacenamiento en la computadora. La demanda de espacio de almacenamiento aumenta al doble cuando se requieren dos canales para estreo lo cual permite obtener sonidos de alta calidad (1Mb para guardar 11 segundos de sonido estreo sin compresin). En la figura 1.5 se ilustra el proceso de codificacin de una seal de audio digitalizada. Hay que notar que en esta figura el codificador utiliza slo 4 bits para codificar las muestras de la seal de audio digital. Rafael Montante Lpez y Jos Luis Villarreal Bentez 6
Figura 1.5 Diagrama por bloques de un proceso de conversin analgica/digital para la codificacin de la seal. Sin embargo, con tcnicas de compresin, es posible almacenar sonido en un octavo del espacio normal; aunque la compresin en audio implica prdida de informacin (fidelidad), ya que los valores muestreados son redondeados al entero ms cercano (lo que se denomina cuantizacin). Por ello, en multimedios, se usa una tasa de muestreo de 22.05 kHz y un tamao de muestra de 8 bits; para obtenerse una calidad similar al de radio AM. Las necesidades de almacenamiento pueden ser estimadas con la siguiente frmula: (tasa de muestreo por bits por muestra) / 8 =bytes por segundo. Por ejemplo, si una seal de audio en formato WAV se muestrea a una tasa de 11.05 kHz usando 8 bps, la cantidad en bytes por segundo que se necesitan para almacenar un segundo de audio es: (11.05 10 3 8) / 8 =11 050 bytes/segundo es decir, 11.05 kBytes en cada segundo. 1.3 Tecnologa MIDI Al tener los sonidos codificados en ceros y unos, es posible el uso de las tecnologas electrnicas computarizadas para almacenar, transformar y reproducir o transferir esta informacin, por ejemplo cuando se usan los sintetizadores o teclados electrnicos. Lo primero es tener una forma de captar estas seales sonoras con un instrumento electrnico que permita transformar las seales analgicas (continuas) u ondas que producen presin, en una seal elctrica que es interpretada por un dispositivo o tarjeta de sonido y convertida en una seal discreta codificada en ceros y unos. Procesamiento digital de audio y video 7 Otra forma de obtener estos sonidos digitales es producirlos por un instrumento que genera patrones de bits que equivalen a los sonidos que el odo humano puede or y han sido previamente construidos por el ser humano. Estos sintetizadores pueden tener una interface para reproducir los sonidos, emulando a un instrumento musical o se puede acceder a stos mediante el monitor de una computadora. MIDI (de Musical Instrument Digital Interface, interface para instrumentos musicales digitales) es una tecnologa estndar industrial desarrollada a inicios de los 80s. Permite que se comuniquen los sintetizadores de msica y sonidos producidos por diferentes fabricantes. La comunicacin se lleva a cabo a travs de mensajes a lo largo de cables que conectan a los dispositivos. Los archivos codificados con esta tecnologa tienen la extensin .mid (a veces denominado formato midi) y regularmente no ocupan tanto espacio para su almacenamiento. Para hacer partituras en MIDI es necesario contar con un secuenciador y un sintetizador de sonidos va software (Midisoft, Studio para Windows) o incluidos en la tarjeta de sonido. Otro dispositivo til es un teclado MIDI. Un archivo MIDI puede contener 16 canales de datos de msica, lo que permite grabar diferentes instrumentos y reproducirlos en cada uno de los diferentes canales.
Figura 1.6 Proceso de creacin de Midis. 1.4 Formatos de archivos de audio Los sonidos digitales son recuperados de un dispositivo (un disco duro, un CD, un DVD) por un software. Para lograrlo, es necesario indicarle al software que esas cadenas de bits son sonidos y Rafael Montante Lpez y Jos Luis Villarreal Bentez 8 que deben ser ledos con ciertas reglas. La forma en la que se guardan estos bits y en la que son interpretados constituyen un formato. Una secuencia de sonidos que deben ser ledos como una pieza (una cancin, una conversacin) es guardada como un archivo con un formato especfico para ser reproducido por un software que pueda interpretar dicho formato. En los equipos Macintosh, los sonidos digitales pueden ser guardados como archivos de datos .AIF (Audio Interchange File Format o .IFF)o .SND. En Windows, los sonidos son guardados tpicamente en archivos wave (.WAV). Muchos de los formatos de audio utilizan un proceso de digitalizacin conocido como PCM o modulacin por codificacin de pulsos (pulse code modulation), el cual realiza la funcin de convertidor analgico-digital principalmente y la diferencia de un formato a otro radica en cmo distribuyen esta informacin producida por el PCM en sus archivos (p.ej. informacin de cabeceras sonido estreo, monoaural, cantidad de bits, etctera). Cada fabricante puede proponer su propio formato, pero siempre basado en un estndar, es por eso que existe software con el cual se puede realizar la conversin de un formato a otro; por tanto, es posible convertir un archivo de audio que fue generado para una Machintosh (.aif) a un formato para Windows (.wav). Estos formatos pueden ser convertidos de uno a otro, con herramientas como WaveEdit y Convert. Los CDs de audio o msica contienen informacin codificada en pistas o tracks en un formato conocido como CDA, este formato es un estndar en esa industria y puede ser reproducido por cualquier dispositivo o unidad de CD. Cada vez que se quiera almacenar una pista de audio en una computadora tendr que hacerse bajo el estndar usado por el sistema operativo, por ejemplo, si se quiere guardar una cancin de un CD en una mquina con sistema operativo Windows, se podr hacer grabando en formato WAV para su posterior reproduccin. Actualmente ya existen otras formas de almacenar audio en computadoras y que hacen referencia a mtodos de compresin de audio, tal es el caso del formato MP3 que ser descrito posteriormente en este manual. Cabe aclarar que lo que es conocido como buena calidad en audio digital o en muchas ocasiones denominada calidad CD, el audio tiene que ser por lo menos digitalizado con PCM con una tasa de muestreo de 44.1 kHz, codificando cada muestra a 16 bps (bits por segundo) y con dos canales para sonido estreo. Este proceso se realiza sin aplicar ningn mtodo de compresin de audio, por lo cual en un CD slo puede almacenarse hasta 74 minutos de audio o un mximo de 750 Mbytes. 1.5 Grabacin de audio Muchos desarrolladores de multimedios graban los sonidos que utilizarn en cintas y luego de editar sobre este dispositivo barato, digitalizan el material almacenndolo en disco duro. Para Procesamiento digital de audio y video 9 alcanzar una calidad de CD, es necesario digitalizar el sonido a 44.1 kHz y 16 bits; para lo cual se necesita un estudio de grabacin. Las videograbadoras (VCR) cuentan con excelentes circuitos de audio estereofnico y pueden usarse las pistas de audio de las cintas de video, para digitalizar el audio. Los sistemas para cintas de audio digital (DAT) proveen una tasa de muestreo de 44.1 kHz a 16 bits y posibilidades de reproduccin directa; y generalmente estos dispositivos cuentan con dispositivos perifricos de alta fidelidad, como micrfonos, eliminadores de ruido, entre otros. Una buena sesin de grabacin de sonido requiere conocer el software y el hardware que se usar, un entendimiento tcnico de los sonidos y voces que se grabarn, as como del ambiente en el estudio. La digitalizacin del audio puede realizarse directamente sobre una computadora, a travs de una tarjeta de sonido. Sin embargo, el sonido digital ocupa grandes espacios de almacenamiento en un disco duro u otro dispositivo. Por lo que es recomendable preparar la grabacin y realizar una edicin previa sobre cintas magnticas; despus se podr digitalizar y producir el producto final en la computadora. La produccin de trabajos de audio puede aprovechar el poder de las computadoras para la edicin no lineal (la cual es muy rpida, ya que permite el acceso directo a las diferentes piezas de audio o archivos y a cualquiera de sus partes) para agregar efectos especiales, transformar los sonidos para mejorarlos o simplemente para generar nuevos sonidos a partir de los originales analgicos. Sin embargo, an con la digitalizacin del mnimo de tiempo de sonidos para realizar un trabajo, los costos de almacenamiento son muy altos y es recomendable guardar los trabajos en CDs, los cuales tpicamente tienen una capacidad de almacenamiento de 750 MB. El gran tamao que pueden llegar a tener los archivos de sonido, ha llevado al desarrollo de herramientas de compresin, las cuales pueden estar implementadas en las mismas tarjetas de sonido o pueden estar disponibles como software. La compresin de los archivos de audio se logra con algoritmos que transforman los datos digitales y los organizan en un formato especfico. Un software que requiera reproducir un archivo de audio, necesita interpretar este formato y decodificar los datos para reproducirlos como sonidos. 1.5.1 Compresin de audio: MP3 El formato de compresin de audio MP3 ha ganado mucha popularidad debido a las tasas de compresin que soporta para comprimir audio con alta calidad. El significado de MP3 proviene de Moving Picture Experts Group, Audio Layer III, esto quiere decir que sus creadores son parte del grupo de expertos que crearon el estndar de compresin Rafael Montante Lpez y Jos Luis Villarreal Bentez 10 de video MPEG. Con MP3 los archivos de audio pueden ser comprimidos a diferentes tasas, siendo los de tasas ms altas los que tienen peor calidad de sonido. Tpicamente se usa una tasa de 10:1, lo cual permite que un archivo de audio de aproximadamente 3 minutos ocupe alrededor de 4 MB para su almacenamiento, en lugar de los 40 MB aprox. que se necesitaran si se almacenara sin compresin. La razn por la cual ha adquirido mucha popularidad este formato se debe principalmente a que las personas que tienen la patente original la dispusieron libre de cargo para que cualquiera pudiera realizar decodificadores o reproductores de audio con este formato. A diferencia de otros formatos de audio digital, los cuales incluso pueden ser ms eficientes o tener mejor calidad de audio que MP3, pero dichos formatos tienen compaas propietarias como Yamaha o Microsoft, los cuales restringen su tecnologa y no cualquiera puede usarlos. Debido a que el MP3 es de uso libre (gratis), otra aplicacin de este formato es el envo de audio a travs de tramas o paquetes, el cual se puede asemejar al envo continuo de audio a travs de Internet por ejemplo, o lo que tcnicamente se conoce como webcasting. En la actualidad hay diversas estaciones de radio que transmiten a todo el mundo por medio de esta aplicacin. Estas estaciones digitalizan su seal y es codificada a formato MP3. De esta forma es posible escuchar por medio de Internet estaciones de radio japonesas, alemanas, argentinas e incluso mexicanas, por nombrar algunas, las cuales codifican su seal y transmiten en tiempo real al WEB y uno la escucha decodificando en tiempo-real la seal en formato MP3 por medio de un software especializado. Ya que no es necesario contar con alguna licencia para desarrollar un reproductor de archivos con formato MP3, existen muchos que estn disponibles para el libre uso, ya sea por medio de Internet u otras fuentes. Algunos de ellos son Winamp, Sonique, MusicMatch, aunque tambin cierto tipo software comercial como el Windows Media Player de Microsoft y el Real Jukebox de Real Networks, reproducen audio en formato MP3, adems de sus propios formatos. Esta es otra forma de obtener audio digital para poder elaborar productos en una computadora personal. De esta forma, es posible reunir material de distintos medios para posteriormente acomodarlos en una secuencia deseada, incluir slo las partes que se deseen, modificar algunos sonidos y agregar efectos especiales, etc., en un proceso conocido como edicin. 1.6 Edicin de audio La edicin de audio es la manipulacin de sonidos digitalizados; cortando y pegando partes, adicionando efectos especiales, mezclando sonidos. Para llevar a cabo esta tarea, se dispone de software comercial y de dominio pblico o freeware. En las plataformas Macintosh se cuenta Procesamiento digital de audio y video 11 con SoundEdit Pro de MacroMedia, Alchemy y AudioTrax de Passport, SoundTools de DigiDesign; para Windows se tiene MediaVisions Stereo Studio F/X, WaveEdit.
Figura 1.7 Software de edicin de audio. La edicin del audio contempla una serie de operaciones tcnicas que la mayora del software usa y que pueden ser transparentes para el usuario, por lo que a continuacin se explican algunos trminos usados, indicando el efecto que producen en el sonido. En la siguiente figura (1.8), se muestra un ejemplo de seal de audio, la cual fue producida por el programa de edicin WaveCreator a un fragmento de 10 segundos de una pista de audio.
Figura 1.8 Seal de audio. Amplificacin de sonido La operacin de amplificacin aumenta la amplitud de la onda, el efecto en el espectador es el aumento del volumen. Rafael Montante Lpez y Jos Luis Villarreal Bentez 12
Figura 1.9 Seal de audio amplificada. Inversin del sonido Las crestas de las ondas se transforman en valles y viceversa. Si se invierten dos canales en una grabacin estreo no se percibe efecto alguno, pero si se invierte un solo canal, se puede percibir un cambio interesante, provocando cierto tipo de efecto especial.
Figura 1.10 Seal de audio invertida. Retraso (Delay) Se obtiene al retrasar el sonido una determinada cantidad de tiempo. Si se trabaja con una grabacin monoaural se podra separar sta en dos canales idnticos y despus desfasar un canal haciendo un retraso de milisegundos, esto creara un efecto espacial, de manera que se percibira que la fuente de sonido est ubicada a un lado de nosotros, ya que el cerebro estara percibiendo que en uno de los odos llega el sonido ligeramente atrasado con respecto a otro. Para percibir este efecto es necesario el uso de audfonos. Procesamiento digital de audio y video 13
Figura 1.11 Seal retrasada. Eco y cmara de eco Este efecto surge cuando un sonido rebota en paredes dentro de una cavidad, pudiendo rebotar el sonido varias veces, cada vez que rebota el sonido puede atenuarse de acuerdo con el grado de absorcin de las vibraciones sonoras en las paredes. Los factores ms importantes que determinan el efecto son el tamao del cuarto, el nmero de ecos, factores de amortiguamiento de las paredes, posicin del micrfono, posicin de la fuente sonora, entre otros. Con este efecto tambin es posible transformar un sonido mono en estreo al separar en canales y hacer un tratamiento independiente a los canales.
Figura 1.12 Seal con eco. Envolvente Es posible transformar la amplitud de toda la onda en un intervalo de tiempo, multiplicando sta por el valor de una funcin que tenga una forma definida. Entonces el volumen del sonido resultante tendr las mismas variaciones que la funcin que sirvi para multiplicar el sonido inicial, visualmente la grfica de la onda de sonido resultante se observa como si estuviera envuelta en la forma que tena la funcin que aplicamos como factor. Rafael Montante Lpez y Jos Luis Villarreal Bentez 14
Figura 1.13 Seal con envolvente. Estiramientos Es posible comprimir o expandir una onda en el tiempo, esto crea un cambio en la frecuencia que se refleja como un cambio en el tono de la seal transformada y un acortamiento o crecimiento en la duracin del segmento de sonido modificado. Cuando se trata de modificar una grabacin para cambiar su tono a uno ms agudo, se tiende a acortar la duracin del segmento modificado, pero normalmente se desea mantener la duracin del segmento de sonido modificado y solamente modificar el tono. Para lograr esto se divide el segmento de sonido en cuestin, en muchos segmentos ms pequeos, luego se altera en cada uno la frecuencia, para entonces con estos pedacitos de sonidos modificados rellenar uniformemente el espacio de tiempo que ocupaba el segmento de sonido original, multiplicndose en nmero conforme sea necesario. Para evitar el que aparezcan cambios abruptos en la forma de la onda (los cuales son percibidos como ruidos abruptos por el oyente) en la unin de los mltiples segmentos pequeos, se puede hacer una correccin en las uniones para hacer ms contnua la transicin de una a otra, o tambin se puede aplicar reverberacin para alisar un poco las transiciones de un segmento a otro. Expandir la seal implica disminuir la frecuencia, o sea es escuchar el sonido con un tono ms bajo. Esto invariablemente implica aumentar la duracin de la seal original porque si se quiere conservar la duracin del segmento de sonido original, habr que recortarla. Procesamiento digital de audio y video 15
Figura 1.14 Seal con estiramientos. Reversa Tiene el efecto de desplegar la seal interpretndola de atrs para adelante.
Figura. Seal en reversa. Reverberacin A diferencia del eco, el cual genera ecos especficos a tiempos especficos, la reverberacin crea una gama ms dispersa de sonidos aleatorios desfasados muy cerca del sonido original y no se pueden distinguir ecos especficos a tiempos determinados. Algunos parmetros para ajustar la reverberacin son: Tiempo de absorcin de alta frecuencia: en el ambiente natural, los sonidos de alta frecuencia son atenuados ms fcilmente que los de baja frecuencia (esto no incluye la forma en la que se dispersan los sonidos, lo cual es diferente, por decirlo de alguna manera, los sonidos graves dan vuelta a obstculos ms fcil que los agudos, por ejemplo). Este parmetro sirve para determinar que tan rpido se atenan las altas frecuencias. Rafael Montante Lpez y Jos Luis Villarreal Bentez 16 Tiempo de ataque: es el tiempo que tarda la reverberacin en alcanzar su mximo poder. Porcentajes de mezclado: con esto controlamos qu tanto se van a mezclar la seal original y la seal resultante. Corte en cero: la lnea central de una onda es la lnea cero. Sobre esta lnea corresponde el punto de descanso en el movimiento vibratorio de un objeto que produce sonido. En el procesamiento digital es importante hacer el corte de las ondas de sonido en este punto, de lo contrario, se producen sonidos desagradables y posiblemente estridentes. Un consejo para visualizar el espectro de frecuencias para ganar ms resolucin y ver ms detalle en las frecuencias bajas, es convertir la seal a una frecuencia de muestreo ms baja; as la mayor frecuencia de muestreo que podr aparecer en el espectro, ser la mitad de la nueva frecuencia de muestreo y tendr ms resolucin en la grfica del espectro de frecuencias. Procesamiento digital de audio y video 17 2. VIDEO DIGITAL El video inicia cuando la luz del mundo exterior es proyectada por medios pticos en el interior de una cmara. La imagen proyectada es enfocada hacia una superficie sensible a la luz, mientras una barra de electrones barre horizontalmente el dorso de la superficie. Esta barra genera una seal analgica continua. Las variaciones en la amplitud de las seales son proporcionales a la intensidad de luz acumulada sobre la superficie sensitiva. Esta superficie es un dispositivo que transforma la energa de la luz fotones en electrones. La seal electrnica puede ser vista como un arreglo secuencial de puntos de luz proyectados sobre una superficie sensible. Actualmente el dispositivo que es muy usado para hacer la funcin de sensor es llamado CCD 2 . Este es un circuito integrado que ejecuta las dos funciones principales en el proceso de sensado de una imagen: almacenamiento y exploracin (scanning). Est basado en un arreglo de celdas de dos dimensiones, en donde en cada celda se acumula o se almacena una carga elctrica proporcional a la luz que incide sobre ella. Esta carga puede ser movida a una celda adyacente, ya sea horizontal o verticalmente, segn se haya construido el CCD, lo cual ayuda a que una lnea de celdas o un arreglo completo de celdas puedan ser operadas para transferir el contenido de las lneas o renglones, o incluso la imagen entera en el proceso de exploracin o scanning. Muchos dispositivos CCD contienen dos arreglos de celdas, uno para almacenar la imagen enfocada y otro que est protegido de la luz, usado para transferir la carga en el proceso de exploracin. Debido a esto se dice que un CCD tiene dos modos, un modo de almacenamiento y un modo de transferencia. En un periodo activo la imagen se capta y se almacena y en un periodo usado en la exploracin se utiliza el modo de transferencia para mover la imagen a un puerto de salida. En la figura 2.1 se puede notar cmo la iluminacin producida por la fuente incide sobre el objeto de la escena, en donde el lente (en este caso celdas CCD) absorve la luz reflejada por ste convirtindola en seal analgica, que a su vez refleja el objeto de la escena en un plano de imagen.
Figura 2.1 Proceso de adquisicin de una imagen.
2 CCD: dispositivo acoplado por carga (del ingls Charge Couple Device). Rafael Montante Lpez y Jos Luis Villarreal Bentez 18 La variacin de luz obtenida hace la parte activa de la seal de video. Se agrega un pulso de sincrona al final de cada periodo activo para indicar el final de una lnea barrida y el inicio de una nueva lnea horizontal. Entonces, las lneas barridas o escaneadas son agrupadas para formar una imagen completa o cuadro (frame), al final del cual se introduce otra seal de sincrona para indicar el trmino de cada cuadro. Un monitor basado en CRT (tubo de rayos catdicos) invierte el proceso de la cmara, convirtiendo en luz cada punto electrnico conforme aparecen en secuencia, a travs de la estimulacin de una sustancia fosfrica que emite fotones cuando la golpean los electrones. Este proceso es conocido como refresco de la imagen (display refresh). Cuando este refresco es llevado a cabo del inicio al fondo de la imagen, sin interrupciones, es llamado refrescamiento no entrelazado. Las tasas normales del refresco estn en una rango entre 50 y 70 Hz. La figura 2.2 ilustra el proceso de adquisicin de la imagen mencionado anteriormente junto con el proceso de envo de la seal de video (formada por cuadros o frames) a un dispositivo de despliegue (tubo de rayos catdicos). Despus de que el lente de la camara realiz el proceso de exploracin (scanning), la seal de video es procesada para adecuarla ya sea para su almacenamiento o para el proceso de transmisin (modulacin). Cuando la seal es requerida para su despliegue, se vuelve a procesar de nuevo la seal para que pueda ser convertida en flujo de electrones que produce el CRT, los cuales se movern de arriba abajo como muestra la figura, desplegando as la seal captada por el lente.
Figura 2.2 Reproduccin electrnica de la imagen. Procesamiento digital de audio y video 19 La tecnologa de video permite manejar secuencias de imgenes que pueden ser seales de televisin o de otros dispositivos, as como de imgenes sintetizadas. Las secuencias de imgenes pueden ser capturadas y reproducidas a diferentes tasas, lo comn en sistemas de cmputo son 30 cuadros por segundo. Desafortunadamente, en la ejecucin del video digital, existen al menos dos restricciones: Capturar una imagen en 1/30 segundos de la pantalla completa con toda su profundidad de color y guardarlos en el disco duro o en la memoria RAM. Para esto es necesario hacer una digitalizacin de video en tiempo real eficientemente, por lo que se requiere de hardware especial y software de compresin, as como una gran cantidad de espacio de almacenamiento digital. Desplegar la informacin previamente generada. El problema en este caso se debe a que son requeridas lecturas rpidas al disco duro. Ambos procesos exceden las capacidades de las computadoras de escritorio, por lo que es conveniente usar tarjetas de video dedicadas. 2.1 Captura de video La captura de video en una computadora puede hacerse de dos maneras. Una es generando un video con lo que aparece en la pantalla, es decir, el software que genera el video toma su entrada con todo aquello que aparece en un recuadro marcado en la pantalla, de esta forma todos los movimientos que se realicen dentro de l sern almacenados en un archivo con formato de video. El sistema operativo Windows no cuenta con una herramienta de este tipo como parte de su software de instalacin, para realizarlo bajo este sistema es necesario adquirir software especializado como Adobe Premiere y otros. Otra manera de capturar video es por medio de una camara para PC, tambin conocida como Web Cam. En la adquisicin de estas cmaras se aade una tarjeta de captura de video que se inserta dentro de la computadora, as como su software que permite interaccionar con sta. De esta forma la cmara puede captar lo que est dentro de su rango de sensado y generar video. La tarjeta de captura es la encargada de realizar la digitalizacin y el software de generar un archivo con formato de video. Los formatos para almacenamiento y despliegue de video digital estn disponibles en los paquetes ms comunes, como QuickTime de Macintosh y Microsoft Windows Media Player, o en los sistemas que leen el formato AVI (Audio Video Interleaved), stos se ilustran en la figura 2.3. En Internet tambin se pueden encontrar paquetes como el Real Player, el cual permite adquirir una versin limitada de manera gratuita para desplegar y reproducir varios formatos de video y audio, respectivamente. Rafael Montante Lpez y Jos Luis Villarreal Bentez 20
Figura 2. 3 Software de edicin de video. QuickTime es un organizador de datos en muchas formas: video y sonido digitales, animacin por computadora, MIDI, dispositivos externos como reproductores de CD-ROM y discos duros. Actualmente se est volviendo popular en herramientas multimedia, la tecnologa de DVI (Digital Video Interactive), tanto de Intel como de IBM. 2.2 Despliegue de video Para la representacin de colores en un monitor, se usa un modelo que considera los tres parmetros ms importantes de la luz. Los dispositivos de despliegue para video (monitor de una computadora, televisor, etc.) usan el modelo RGB (rojo, verde, azul). La luz puede ser descrita especificando su matiz de color (HUE), la saturacin y la luminancia. El matiz del color es su longitud de onda dominante, el cual est asociado con el color dominante; la luminancia est relacionada con la intensidad de la luz; la saturacin es definida como el porcentaje de la intensidad de la luz que reside en el color dominante (por ejemplo, cuando no hay una longitud de onda dominante, la saturacin es cero y la luz es blanca). 2.2.1 El modelo RGB Un color o matiz primario es un color en el modelo, que no puede ser generado a partir de los otros colores usados en l. Los colores primarios son la base para crear otros colores a partir de sus mezclas. Cualquier color generado a partir de la mezcla de dos colores primarios es un color secundario. En el modelo RGB, los colores primarios son el rojo, verde y azul. Los colores secundarios son el magenta (rojo +azul), el cian (azul +verde) y el amarillo (rojo +verde). Procesamiento digital de audio y video 21 Los monitores CRT (tubo de rayos catdicos) usan el modelo RGB, donde son emitidos tres rayos (o flujos de electrones) que inciden en una placa formada por fsforo, en donde la intensidad de cada rayo genera uno de los tres colores. Los colores son mezclados en el ojo humano, dando la apariencia de una mezcla perfecta; ya que los conos en el ojo son muy sensibles a estos colores. Para la generacin de colores en video, tambin se usan los modelos YIQ e YUV, los cuales son bsicamente un tipo de representacin alterna del modelo RGB (figura 2.4) y que comnmente son utilizados para que la transmisin y manejo de video sea ms eficiente.
Figura 2.4 Gamma de colores del modelo RGB. 2.3 Transmisin de video Las seales de televisin y video digital, principalmente son transmitidas con base en un estndar. Los estndares ms comunes a nivel mundial son el NTSC (National Televisin System Committee), usado en Amrica y Japn, el sistema PAL (Phase Alternation Line), principalmente usado en Europa y Asia, y el SECAM (Sequential Colour avec Memoire), usado en Francia, los pases de la ex Unin Sovitica y Oriente Medio. En el cuadro siguiente se muestran algunas caractersticas de estos estndares. Rafael Montante Lpez y Jos Luis Villarreal Bentez 22 Sistema Cuadros/segundo Lneas por cuadro Total/activas Amrica y Japn Mono (s/color) Color NTSC
30 29.97
525/480 525/480 Europa y Asia Color PAL
25
625/580 Francia y Rusia Color SECAM
25
625/580 Cuadro 1. Estndares de televisin a nivel mundial. Para propsitos de transmisin o broadcasting es necesario combinar los tres colores primarios en una sola seal de video, conocida como video compuesto, ya que por razones tcnicas no es conveniente transmitir o grabar tres seales al mismo tiempo. El modo de comunicacin ms comn en los equipos de video actuales, como las videocaseteras y monitores, es realizado con base en esta seal de video. La nica desventaja de almacenar, transmitir o conectar dispositivos con seal de video compuesto es que se pierde calidad cuando el video es desplegado. Durante la etapa de conversin de la seal RGB y la de video compuesto, hay una etapa intermedia, la cual es llamada componente de video, en esta etapa las tres seales son convertidas en un conjunto de seales diferentes llamadas Y,U y V. Las seales U y V no corresponden realmente con nada visible de la imagen, es decir, si se pudiera ver que representa esas seales, no se observara nada, en cambio la seal Y, llamada luminancia, corresponde al brillo de la imagen y a diferencia de las otras, esta seal es en blanco y negro. Cuando lleg la televisin a color, fue necesario mantener la compatibilidad de la nueva tecnologa con la tecnologa de blanco y negro, para lograr que la misma seal pudiera ser recibida y vista en televisores blanco y negro o en color. Para lograrlo, la seal original fue modificada adicionndole la seal de color; la crominancia, codificada en los valores I y Q del modelo de color YIQ, a la seal de brillantez (la luminancia o valor de Y), necesaria para la reproduccin blanco y negro. 2.4 Videoconferencia Cuando varias personas se comunican entre s, estando en diferentes localidades, a travs de canales de comunicacin, usando la misma combinacin de video y audio, esto es llamado videoconferencia (VC). En sus inicios, la videoconferencia estaba muy limitada, debido a los Procesamiento digital de audio y video 23 costos del equipo necesario para llevar a cabo este propsito. Sin embargo, debido a los avances en la tecnologa y en las comunicaciones digitales, el costo por usar la videoconferencia se ha reducido considerablemente, como es el caso de las cmaras digitales y los canales para hacer el enlace y el transporte de los datos, los cuales pueden ser incluso los canales para usar Internet. Gran parte del costo de estos sistemas se deben al ancho de banda necesario para transmitir audio y video, por lo cual la VC es una de las aplicaciones principales de las tecnologas de compresin digital de audio y video que ayudan a reducir estos anchos de banda. Actualmente existe software para PCs que permite tener una aplicacin conocida como videoconferencia de escritorio (desktop videoconferencing, DTVC) y que ha resultado ser una de las alternativas ms baratas para la VC. Este sistema consiste de una tarjeta que digitaliza y comprime una seal de video, la cual es descomprimida en la estacin receptora para tener una aproximacin a la seal original. El esquema de compresin y descompresin es llamado CODEC (COmpression-DECompression) y es realizado por software o hardware. Las principales lneas de comunicacin entre dos estaciones en videoconferencia son la red de servicios telefnicos y la red de servicios integrados de tecnologa digital (ISDN). El primero tiene la desventaja de tener un ancho de banda limitado y ocasiona algunos retrasos de la seal de video, una calidad baja de la imagen y algunos problemas de sincrona del audio y video. El segundo tiene la ventaja de contar con un ancho de banda ms amplio que el anterior, adems de contar con canales ms rpidos, lo cual lo hace ms apropiado para el manejo de esta aplicacin. En la figura 2.5 se observa un enlace de videoconferencia entre dos locaciones. Se puede notar que cada grupo en cada locacin cuenta con el material necesario para que la comunicacin entre los grupos sea lo ms claro y entendible posible, para esto es necesario contar con cmaras de grupo que capten la presencia del grupo o persona que expone, se cuenta tambin con una cmara que capta los detalles de los documentos que puedan llegar a utilizarse, debido a esto es necesario contar con dispositivos de despliegue como un televisor o un monitor de computadora; para el sonido es necesario contar con micrfonos y bocinas en cada locacin. Todos estos dispositivos tienen que ser conectados al procesador o controlador que se encuentra en cada una de las locaciones y que permite el desempeo eficiente de la comunicacin entre stas, para lo cual hoy en da es conveniente trabajar las seales en forma digital. Rafael Montante Lpez y Jos Luis Villarreal Bentez 24
Figura 2.5 Sistema de videconferencia. 2.5 Video interactivo Actualmente, la codificacin electrnica de video est siendo la competencia de las cmaras convencionales. La seal de video es proporcional a la variacin de la intensidad de luz o brillo de la imagen original. El video interactivo trata con la organizacin, procesamiento y presentacin de informacin de video por medio de computadoras. Esta modalidad de video est restringida a imgenes pregrabadas. Esto significa que el usuario est limitado a ver una secuencia de imgenes, a diferentes velocidades y en cualquier orden, pero siempre la misma secuencia de imgenes. Procesamiento digital de audio y video 25 El video interactivo tambin es conocido como video en demanda. En un sistema que cuenta con este servicio se requiere de dispositivos que permitan almacenar gran cantidad de datos de audio y video regularmente por medio de discos duros. El video en demanda se refiere a que cualquier usuario puede realizar en cualquier momento una peticin de algn video contenido en un dispositivo de almacenamiento para observarlo a travs de un medio de despliegue, el cual puede ser un televisor o el monitor de una PC. Dichos videos estn disponibles a todos los usuarios en una lista. Los sistemas de video interactivo pueden ser tanto analgicos como digitales, aunque ya los analgicos no son muy usados, debido a que el costo de su equipo es ms caro en comparacin con el digital. El equipo de video en demanda lo forman cinco elementos principales: 1. Una biblioteca de videos, la cual contiene el material en su formato original y es de alta calidad. 2. Codificador, el cual hace la labor de digitalizar, codificar y comprimir el video analgico para su almacenamiento en un medio digital. 3. Servidor de video, que administra los recursos del sistema para almacenar y proporcionar el servicio de video en demanda. 4. Red de distribucin, permite la interaccin entre los clientes y los servicios en demanda a travs de una interconectividad ya sea por medio de Internet, Intranet, fibra ptica, lnea de telfono o cable. 5. Cliente de video, se refiere al software y al sistema local que est funcionando para realizar las peticiones de video en demanda. Este cliente de video puede ser un dispositivo como: una PC, una T.V. o una estacin de trabajo, donde el video recibido puede ser decodificado y procesado para su despliegue.
Figura 2.6 Sistemas de video anlogicos y digitales. Rafael Montante Lpez y Jos Luis Villarreal Bentez 26 Esta nueva tecnologa est siendo desarrollada ltimamente por algunas universidades y compaas debido a las diversas aplicaciones que puede ofrecer, como los servicios de pelculas, telecompra y de videojuegos en demanda. 2.6 Sistemas de almacenamiento Las seales que genera una cmara de video son analgicas, ya que varan tanto en el tiempo como en su amplitud. Mientras que el video digital es un flujo discreto de nmeros binarios que corresponden a un valor de intensidad de luz de un pixel de la imagen en un tiempo particular. Sin embargo, el video digital slo tiene desventajas frente al video analgico, en trminos del ancho de banda. Este ancho de banda se traduce en el detalle o agudeza (sharpness) de la imagen, que a su vez, en video blanco y negro se traduce en el nmero de lneas verticales que definen a la imagen. Para alcanzar la misma calidad de imagen, el video digital necesita mayor ancho de banda que el video analgico. 2.6.1 Sistemas analgicos El proceso de almacenamiento analgico toma la seal de video en video compuesto, extrayendo las seales de crominancia y luminancia y grabndolas en el mismo medio o substrato; tpicamente medios magnticos u pticos. Esto se consigue al magnetizar pequeas partculas de metal oxidado que contienen las cintas, a travs de las seales elctricas del video. Este proceso permite el reuso de las cintas, lo cual, aunado a lo barato de las cintas, permite el almacenamiento de video a muy bajo costo. La desventaja que tiene, es que debido a su reuso continuo, la cinta se desgasta a consecuencia del proceso de lectura, ya que la cabeza lectora roza con la superficie de la cinta, ocasionando el degrade del material. Los problemas de estos sistemas de almacenamiento son que el video es grabado en secuencia y la recuperacin de una secuencia especfica es muy lenta. Los formatos de cassettes para video son muy variados. Los principales son: a) Cintas de una pulgada, este formato tipo C, es un el formato profesional tpico. Las cintas de una pulgada pueden registrar 480 lneas de resolucin. b) BetaCam, es el formato profesional para video, tiene cuatro pistas de audio y una de video. Actualmente existen sistemas analgicos y digitales. c) U-matic, es un formato semiprofesional. Este formato permite grabar a una resolucin de 340 lneas. d) S-VHS, es un formato semiprofesional que permite grabar a una resolucin de 400 lneas. Procesamiento digital de audio y video 27 e) Hi8 (400 lneas). f) VHS, es el formato comercial ms popular. Estas cintas de media pulgada pueden alcanzar a grabar con una resolucin de 240 lneas. La alternativa para el uso de las cintas son los sistemas de grabacin en medios pticos o discos lseres analgicos; los cuales graban el video en crculos concntricos, con un solo cuadro por crculo. Este sistema permite tanto el acceso cuadro por cuadro como efectos especiales de congelamiento de la imagen, cmara lenta, avances y retrocesos rpidos. El acceso sigue siendo secuencias, pero la velocidad para alcanzar un cuadro especfico es mucho ms rpido. Este sistema permite almacenar 54000 cuadros por cada lado del disco, lo cual se traduce en 30 minutos de video en formato NTSC a 30 cuadros por segundo, por cada lado del disco. 2.6.2 Sistemas digitales Los dispositivos de almacenamiento digital fueron usados en primer instancia por computadoras para grabar cualquier tipo de datos antes de que fueran utilizados principalmente para grabar audio y video. Esto fue debido a que en un inicio no se tena la capacidad para cubrir los dos requerimientos fundamentales para grabar audio y video, que son: 1) el grabado y la reproduccin deberan ser en tiempo real y 2) el sistema tiene que grabar o reproducir ininterrumpidamente por una hora o ms. El grabado en tiempo real significa que se debe grabar a cualquier tasa que produzca la fuente de datos, lo cual no implica que se pueda grabar una seal por partes. De esta forma si una seal de video necesita una tasa de 100 Mb/s, el sistema de grabado debe grabar a esa tasa, entregando al final la grabacin de la duracin completa de la seal sin interrupciones. Una de las formas para que los sistemas de grabado alcanzaran esas tasas fue el recorrer la cinta de grabacin a altas velocidades, la desventaja fue que slo se lograban grabar pocos minutos. Debido a esto se propusieron tcnicas que permitieran grabar a altas tasas por periodos largos. Desde hace cuarenta aos han predominado bsicamente dos mtodos de grabacin y son referidos como: mtodos de grabado magnticos y mtodos de grabado pticos. 2.6.2.1 Almacenamiento magntico Los mtodos de grabado magntico para almacenar seales digitales usan los mismos principios que para grabar seales analgicas, con la diferencia de poder utilizar mtodos de codificacin para optimizar el uso del medio de almacenamiento. El grabado se realiza en cintas y discos magnticos, en donde la cinta presenta ventajas al almacenar mayor cantidad de datos que el disco, debido a que este ltimo tiene la limitante de su tamao. Un concepto importante al grabar informacin en estos medios es llamado factor Rafael Montante Lpez y Jos Luis Villarreal Bentez 28 de densidad de rea, expresado en bits por unidad de rea, que se refiere a cuanta informacin (bits) puede ser almacenada en un rea determinada en el medio. Con el grabado digital este factor se increment en comparacin con el analgico, de manera digital se han logrado rebasar los 100 megabits por pulgada cuadrada (Mb/in 2 ), mientras que el grabado analgico se encuentra alrededor de los 10 Mb/in 2 . El punto de comparacin con el grabado analgico se puede lograr haciendo una conversin del ancho de banda, usando dos bits por ciclo en la frecuencia ms alta de la seal analgica. Los primeros sistemas de grabacin digital en cinta fueron usados para transmisin de televisin comercial o para produccin de programas. Los formatos para grabacin fueron identificados por la SMPTE (Society of Motion Picture and Television Engineers) con la letra D, a la cual se le aadi una secuencia conforme se iban proponiendo nuevos formatos. De esta forma las caractersticas de los principales formatos de grabacin son: D1: usado para grabar seal de video en formato 4:2:2 (el cual se refiere a mandar toda la componente de luminancia y solo la mitad de la componente de crominancia roja, as como de la roja) usando 8 bits por muestra. Utiliza una cinta con un ancho de 19 mm y permite grabar alrededor de 94 minutos. Es ideal para usarse en trabajos de post- produccin debido al formato de entrada de video que acepta. La desventaja de este formato es que el equipo necesario es muy costoso. D2: es el estndar de grabacin de video en cintas para los formatos NTSC o PAL. Utiliza una cinta de 19 mm de ancho y permite grabar 208 minutos en un solo cassette. Emplea 8 bits por muestra en la codificacin y tiene la desventaja de presentar algunas deficiencias en la calidad del video, ya que no utiliza los mismos anchos de banda que el D1. D3: este formato utiliza una cinta de 1/2-pulgada para grabar seales en formato NTSC o PAL muestreadas a 8 bits. Es posible grabar desde 50 hasta 245 minutos en un solo cassette. Este formato surgi principalmente para aplicaciones porttiles. D5: es muy parecido al D3, slo que este utiliza 10 bits por muestra, lo que ocasiona que la calidad del video pueda ser comparada con el D1, haciendo que su uso sea conveniente para los estudios de post-produccin. Adems de aceptar los formatos de los estndares NTSC y PAL, tambin puede ser aplicado para HDTV, debido a que en el mtodo de grabacin se pueden alcanzar tasas de compresin de 4:1. D6: utiliza una cinta de 19 mm para grabar material de televisin de alta definicin a 1.2 Gbps. Permite grabar alrededor de 60 minutos. Acepta los formatos europeos y japoneses de televisin de alta definicin. D7: tambin conocido como DCVPRO. Desarrollado por Panasonic para utilizarse en cintas de 6.35 mm (1/4-pulgada). Utiliza la tecnologa actual para compresin de video, Procesamiento digital de audio y video 29 para alcanzar tasas de 5:1. Puede ser usado para formatos NTSC o PAL, pero con la desventaja de usar menos ancho de banda en las componentes de la seal de video (4:1:1), lo que ocasiona algunas deficiencias en la calidad del color del video. Soporta tambin dos canales de audio de 16 bits. D9: usa una cinta de 1/2-pulgada y fue desarrollado por la compaa JVC. Usa un formato de video 4:2:2 (como el D1), pero usando tambin tecnologa de compresin de video para alcanzar una tasa de 3.3:1. Usa tambin 2 canales de audio de 16 bits. 2.6.2.2 Almacenamiento ptico Los mtodos de grabado pticos surgieron como una aplicacin del uso de la luz lser. Debido a que se puede almacenar informacin en un rea muy pequea con esta tcnica, se han alcanzado densidades por arriba de los 1000 Mb/in 2 . Adems de los altos factores de densidad, tambin se han mostrado las siguientes ventajas: Ya que la forma de leer es por medio de un haz de luz, no hay necesidad de que la cabeza lectora tenga contacto con el medio, ayudando a eliminar partes mecnicas de los dispositivos y a que el medio que almacena dure ms tiempo. Es posible generar grabaciones de solo lectura despus de realizada la primer creacin, lo cual es conveniente para mantener la integridad de los datos. La capacidad de almacenar informacin con un factor de densidad alto, junto con los bajos costos que producen los sistemas de almacenamiento ptico ha ocasionado que estos sistemas sean muy adecuados para almacenamiento de grandes cantidades de datos (almacenamiento masivo). Dichos sistemas estn basados en la tecnologa del disco compacto (CD), el cual fue originalmente usado para grabar audio. Un CD de audio puede almacenar alrededor de 74 minutos de audio continuo digitalizado a una tasa de 44.1 kHz en 16 bits, con dos canales para estreo. Haciendo la conversin necesaria un CD de audio, puede almacenar alrededor de 750 MB. Debido a los bajos costos de un disco compacto virgen y a la capacidad de almacenamiento que permiten, fue propuesta otra alternativa para su uso, el cual permite almacenar cualquier tipo de dato de una computadora a un bajo costo. Debido a la necesidad de mantener ntegros los datos que se almacenen, al formato de grabacin se le aadi un cdigo detector de errores ms robusto que el usado para grabar audio digital. Esto ocasion que se redujera el espacio de almacenamiento a un valor tpico de 650 MB. De esta forma surgi otro estndar, el cual es llamado CD-ROM o disco compacto de solo lectura. Rafael Montante Lpez y Jos Luis Villarreal Bentez 30 Los sistemas o dispositivos de grabado para CD han estado disponibles desde hace varios aos, pero debido a los altos costos, no eran tan accesibles para los usuarios de computadoras. En este sentido, es deseable que los usuarios tuvieran la posibilidad de almacenar los datos importantes para ellos. En relacin con esto y con los avances de la tecnologa y la demanda por su uso, han salido al mercado grabadores de discos compactos que son ms accesibles, debido a que sus costos se han decrementado considerablemente. Este sistema fue llamado CD- R y usa discos vrgenes o sin grabar, los cuales contienen una capa con tinte orgnico, que se ve afectada cuando un haz de luz lser quema su superficie, cambiando sus propiedades de reflexin. Un disco CD-R puede ser reproducido (ledo), en casi todos los sistemas CD-ROM y CD-DA (digtal audio), ya que usan el mismo formato de grabacin. Los discos se pueden grabar slo una vez, aun as son una buena opcin para usarse como dispositivos de almacenamiento porttiles. Posteriores a stos salieron al mercado los CD-RW (dicos compactos de lectura- escritura) que permiten ser re-grabados no slo una vez, sino un gran nmero de veces, siendo esta la nica diferencia que tienen con los CD-R. La nica desventaja que tienen es que las unidades de CD de baja velocidad de lectura tienen algunas dificultades para leer la informacin contenida en stos. Debido a las caractersticas de los sistemas CD-ROM, se permite grabar video con calidad aceptable usando un mtodo de compresin. Esto ha ocasionado que los CD-ROM sean una alternativa para almacenar video-juegos o video de corta duracin. De esta forma algunas compaas de software lanzaron al mercado programas que permitan observar video sin tanta calidad en una ventana de un cuarto del tamao completo del monitor, algunos de stos fueron el Indeo de Intel, el Cinepak de SuperMac y el QuickTime de Apple. Estos programas fueron muy usados para reproducir video-juegos y algunos videos incluidos en enciclopedias digitales. Estos sistemas no eran convenientes para la distribucin de pelculas comerciales, debido al tiempo de video que permite almacenar (74 minutos). De esta forma se cre otro sistema denominado DVD, el cual en ocasiones es nombrado como Disco de Video Digital y en otras como Disco Verstil Digital. Este sistema permite almacenar hasta 4.7 GB por lado del disco, permitiendo grabar por uno o ambos lados del disco. El sistema DVD permite usarse como DVD-ROM, para video DVD-V, para audio DVD-A y como DVD-R para almacenar todo tipo de dato. Este sistema utiliza el estndar de compresin MPEG- 2 para codificar video, el cual produce video de mejor calidad que el usado por el sistema de transmisin de televisin comercial. Como el caso ideal es que los sistemas de grabado permitan almacenar todo tipo de dato cuantas veces sea necesario. La tecnologa DVD actualmente est dando pauta a una competencia entre compaas en cuanto a ganar un estndar en el mercado. Por lo cual estn surgiendo sistemas DVD que permiten grabar datos no slo una vez, sino varias veces; stos son DVD-RW, el DVD-RAM y el DVD+RW. Hasta ahora nicamente han salido al mercado los Procesamiento digital de audio y video 31 DVD-R, los DVD-RAM y los DVD-RW, esperando que para fines del ao 2001, estn disponibles los sistemas DVD+RW. Todos estos sistemas han contemplado que sea posible leer CD-A, CD-V, CD-ROM, hasta los DVD-R y DVD-RAM. Actualmente el dispositivo de almacenamiento en formato DVD que ofrece menores costos es el DVD-RAM. Este sistema tiene la capacidad de almacenar hasta 5.2 GB (2.6 por lado) y est formado por discos que pueden venir con o sin un cartucho especial, que sirve para poder grabar el disco. Otra alternativa para grabar video en forma digital hoy en dia, es hacerlo con video grabadoras que no requieren cassettes con cinta, sino de discos duros. Varias compaas comerciales han sacado al mercado dispositivos que permiten conectarse directamente a un televisor para almacenar video por ms de una hora. stos permiten grabar un programa de televisin en vivo, teniendo la ventaja de poder ejecutar repeticiones instantneas por 7 segundos sin dejar de grabar. Tambin es posible reproducir con cmara lenta (slow motion) y observar un video cuadro por cuadro. En la actualidad el almacenamiento masivo se est convertiendo en un aspecto primordial para muchas empresas y centros de investigacin. Esto tienen que ver con la gran cantidad de datos que se producen y que es necesario almacenarlos. En este sentido la tecnologa ha propuesto discos duros con velocidades de acceso cada vez mayores, as como sistemas de almacenamiento masivo que se comunican con canales de alta velocidad, los cuales incluso pueden estar formados por fibra ptica y que tcnicamente son conocidos como fiber channel. 2.7 Compresin La cantidad de datos generados por los convertidores analgicos-digitales es tan grande que el audio y video digital pueden ser imprcticos si la cantidad de datos para generarlos no es reducida. La compresin de audio y video es una de las caractersticas que permiten a los sistemas digitales usar anchos de banda o dispositivos de almacenamiento pequeos con la gran ventaja de que el desempeo o el rendimiento de estos sistemas puedan ser comparados con sus similares analgicos. El proceso de compresin tanto de audio como de video viene acompaado siempre de dos partes, un compresor y un descompresor. Un proceso de compresin principalmente es utilizado en sistemas que tienen limitaciones en sus canales de comunicacin o en sus dispositivos de almacenamiento. La compresin se realiza sobre datos de entrada originales, dando como resultado un conjunto de datos con cierta forma o formato. Cuando sea necesario utilizar los datos que fueron comprimidos, tendr que ejecutarse un proceso de descompresin, el cual de acuerdo con el algoritmo de compresin utilizado restablecer los datos originales o una aproximacin a stos. Rafael Montante Lpez y Jos Luis Villarreal Bentez 32 Los algoritmos de compresin de video estn muy relacionados con los algoritmos de compresin de imgenes estticas, debido a la relacin que hay entre imagen y video, no queriendo decir con esto que para realizar compresin de video se deba comprimir cada cuadro de video por separado; este puede ser el esquema ms sencillo pero es el ms ineficiente, por lo que para realizar dicho proceso se determinan otro tipo de consideraciones como la prediccin de pixeles a partir de una imagen y la estimacin de movimiento en la sencuencia de imgenes. Al igual que en la compresin de imgenes estticas, para video tambin existe un grupo de investigadores que evalan propuestas y estndares para esquemas de compresin de video. Este grupo es conocido como MPEG (Motion Picture Expert Group) o grupo de expertos para imgenes en movimiento. 2.7.1 Video MPEG-1 y MPEG-2 Una de las formas o algoritmos de compresin de video y audio que se est utilizando en muchas aplicaciones prcticas en la actualidad es conocido como MPEG. El MPEG surgi como una alternativa para codificar o comprimir imgenes en movimiento (video). Se bas inicialmente en el estndar de compresin de imgenes fijas conocido como JPEG. El grupo de expertos formado para trabajar sobre este problema, propuso inicialmente dos formatos, el MPEG-1 y el MPEG-2. La diferencia entre uno y otro se debe principalmente a la tasa con la que manejan los datos y la calidad de la imagen del video. El MPEG-1 fue diseado para tasas de transmisin de alrededor de los 1.5 Mbits/s y trabaja con la limitacin de lograr buena calidad en la imagen y se adapta bien a aplicaciones de audio y video para CD-ROM, ya que el video codificado junto con el audio genera una tasa aproximada de 1.4 Mbits/s. El MPEG-2 soporta tasas de transmisin por arriba de los 20 Mbits/s y logra reproducir imgenes de muy alta calidad; es utilizado por el modo de transmisin de televisin de alta definicin (HDTV) as como para video de entretenimiento casero. Aunque la tcnica MPEG puede ser utilizada en una PC con un buen desempeo, requiere cierto tipo de hardware base para su uso. Existen de cualquier manera algoritmos de compresin que han sido especficamente diseados para su uso en las computadoras personales, lo cual ocasiona que exista cierto compromiso entre grado de compresin y calidad para reducir la carga computacional necesaria al efectuar el proceso de descompresin. De acuerdo con esto, muchos son considerados sistemas asimtricos (que no hacen compresin y descompresin en tiempo real). Algunos de los estndares disponibles son el Indeo de Intel, Microsoft Video para Windows, Apple Quick Time (para Macintosh y PC) y SuperMac CinePak. En cualquiera de las anteriores el software para descompresin o decodificacin puede ser adquirido gratuitamente pero los codificadores (o compresores) tienen que ser comprados. Procesamiento digital de audio y video 33 2.8 Edicin no lineal Es un mtodo de edicin que se distingue del mtodo lineal cuando ste es realizado en una cinta. El trmino no lineal se refiere a no tener que editar el material generado en una secuencia de un programa final y no involucra algn proceso de copiado para hacer la edicin. Este proceso permite que a cualquier parte se puede tener acceso sin re-editar o re-copiar el material que est siendo editado. Este proceso de edicin se ha vuelto atractivo ya que el material se puede colocar en los discos duros de una computadora y ejecutar la edicin usando la capacidad de acceso aleatorio que el disco duro permite. Con esto se tiene la capacidad de elegir o acceder a determinados cuadros (frames) de un video instantneamente sin necesidad de rebobinar alguna cinta. El problema de la edicin en una computadora es la gran cantidad de datos que se requieren para tener audio y video digital. Sin embargo con las tcnicas de compresin de datos actuales se ha logrado solventar de alguna forma este problema. Aun as, debido a la prdida de calidad que el proceso de compresin genera en audio y video, mucha gente prefiere no utilizar los esquemas de compresin, optando por mantener sus datos con la ms alta calidad posible. La desventaja en este caso, es que hace que el equipo de edicin no lineal sea muy costoso. Las computadoras tambin permiten el procesamiento de la seal que se requiere para producir diversos efectos especiales al video, aunque esto puede estar limitado por las velocidades de procesamiento de una computadora para aplicaciones en tiempo real, de esta forma es necesario aadir hardware adicional (tarjetas) al equipo de edicin. En la figura 2.7 se ilustra un diagrama por bloques del proceso de edicin no lineal.
Figura 2.7 Diagrama por bloques de un sistema de edicin de video no lineal. Rafael Montante Lpez y Jos Luis Villarreal Bentez 34 2.9 Televisin digital Junto con el desarrollo de la tecnologa y los avances en las tcnicas del procesamiento de seales, particularmente video, y de la televisin de alta definicin (HDTV), en la actualidad el envo de una seal de televisin digital es ya una realidad. Los principales estndares de televisin a nivel mundial como el japons, europeo y el norteamericano, estn siendo migrados hoy en da para transmitir la seal de televisin comercial codificada de manera digital. Existen varias razones para usar una seal de televisin de manera digital dentro de las cuales se pueden mencionar las siguientes: Como toda seal digital, la ventaja de usarla en este modo se debe a su fcil reconstruccin. Regularmente una seal est expuesta a muchos factores que pueden alterarla cuando es procesada y transportada. Algunos de estos factores pueden ser el ruido, el cual es un trmino usado para sealar aquel factor que altera una seal,como puede ser el medio ambiente, la interferencia con otras seales, los motores, etc.; tambin una seal est expuesta a un retraso y atenuaciones, entre otros. Lo importante es que muchos de esos factores pueden ser eliminados o reducidos en su efecto, cuando la seal es tratada en forma digital, en tanto resulta ms difcil hacerlo con una seal analgica. El manejo mismo de la seal digital tiene una ventaja sobre la analgica a nivel de la circuitera electrnica; una seal digital puede manejarse con circuitos integrados o microchips, logrando velocidades de procesamiento ms altas que las que se pueden obtener con una seal analgica. Otra de las ventajas de tener un sistema de televisin digital son los servicios que se pueden agregar a ste; ya que al tener el sistema de televisin completo de forma digital, se pueden agregar algunos servicios como el comercio electrnico, el uso de Internet y algunas cosas que se puedan realizar de manera interactiva como observar varios canales a la vez, controlar el punto de vista o la cmara en un partido de ftbol, etc. Todo lo anterior ya se realiza de manera semejante en la televisin satelital dado que el manejo de esa seal es digital. La nica diferencia es que por ahora la televisin satelital cobra ms caros sus servicios que la televisin comercial o abierta. En los Estados Unidos de Amrica est siendo aprobado el estndar denominado ATSC, el cual hasta la fecha, est en fase de pruebas. La codificacin de la seal de televisin analgica captada por las cmaras es realizada por el estndar de codificacin de video MPEG-2, mientras que la etapa de la transmisin (broadcast), est siendo probada con una forma de modular la seal llamada 8-VSB. Esta ltima etapa es la que ha originado que en estos momentos no se tenga un estndar definitivo, ya que a determinadas condiciones, esa forma de Procesamiento digital de audio y video 35 modular es muy buena, pero tiene la desventaja de requerir demasiadas estaciones repetidoras en un rea demasiado grande, como la que abarca el pas. Aun as se prevee que en ese pas para el ao 2004, la transmisin de televisin comercial sea totalmente digital. En europa tambin se propuso un estndar a nivel mundial denominado DVB-T y tanto este como el estadounidense se estn consolidando como los estndares ms fuertes para ser tomados en cuenta a nivel mundial. El DVB-T tambin utiliza MPEG-2 para codificar la seal de video analgica, y para la transmisin se propuso el mtodo conocido como COFDM. Esta manera de codificar la seal MPEG est dando muy buenos resultados en cuanto a recepcin de la seal en medios mviles. Cada uno de los dos estndares tiene sus ventajas y desventajas, aunque en publicaciones recientes el estndar europeo est tomando ventaja al estndar estadounidense, en cuanto a recepcin y eliminacin de factores presentes en cualquier seal de televisin transmitida, como ruido, presencia de fantasmas, etctera. Hasta el momento es posible observar canales de televisin de prueba codificados de forma digital, slo que para esto es necesario contar con un televisor apto para este tipo de seal, ya que los televisores usados actualmente son inservibles para dicho propsito. Este tipo de televisores en la actualidad no son muy econmicos, en tanto los precios se encuentran alrededor de los $2000.00 dls. Es por eso que el tiempo estimado para que cada familia en un pas pueda adquirir un televisor con estas caractersticas, es de dos aos. Actualmente es posible comprar un televisor digital para observar la seal de televisin analgica, el cual contiene un aparato que codifica la seal de televisin NTSC a su formato digital (ATSC) para poder observarla a la resolucin del televisor. Este aparato es conocido como Set-Top Box. En Mxico tambin se estn haciendo pruebas para transmitir la seal de televisin codificada en forma digital, slo que actualmente no se ha adoptado algn estndar y se prevee que tambin en pocos aos se pueda contar con este esquema de transmisin.