Sonido
Sonido y PCs • Hasta la segunda mitad de los 90 los PCs no tienen capacidad de proceso y almacenamiento para multimedia • En los finales de los 90 y con la aparición de las tarjetas PCI comienza un gran desarrollo de las tarjetas de sonido • Utilidades del sonido en el PC: – – – – – –
Juegos Aplicaciones multimedia Composición, edición y mezcla de música Grabación, edición y ejecución de música digital Enseñanza de instrumentos Etc…
Sonido • El sonido se produce por la colisión de varios cuerpos, generando una onda de presión en todas direcciones a través de la cual se libera energía • Esta onda de presión se recibe en nuestros tímpanos y es interpretada por el cerebro • Cuando el sonido llega a un micrófono los cambios de presión modifican el diafragma del micrófono traduciéndose en cambios en voltaje. • La creación del sonido se produce al revés, la tarjeta genera una señal eléctrica que produce una variación en la membrana del altavoz generando una onda de presión y por tanto sonido
Sonido • El cerebro posee además la capacidad de localizar la dirección de la fuente de sonido • El sonido que recibimos es una combinación de la emisión directa de la fuente (Primer orden) y los reflejos (Segundo orden) en el entorno (El entorno y sus propiedades de absorción modifican la percepción) • Las ondas reflejadas además llegan con retraso respecta a la emisión directa debido a que recorren una distancia mayor. • El cerebro combina todas las reflexiones generándose un efecto de eco llamado reverberación
Medida • Rango de frecuencia audible : 20Hz - 20 KHz • Medida en dB : – Gama muy grande de valores numéricos (2e-5 / 2e+2 N/m2) – La magnitud de una sensación es proporcional al log. del estímulo. (Ley de Weber-Fechner)
• Ruido de fondo ( despreciable si ∆Lp > 10dB ). • El oído no reacciona linealmente con la frecuencia
Componentes de una tarjeta de sonido • Esta compuesta por dos subsistemas: – Captura de audio digital – Síntesis de música (2 modos): • Sintetizador FM • Ejecución de un sonido digitizado
Subsistema de audio digital • • • • • • •
Compuesto por un DAC (digital-analogue converter) y un ADC (analogue-digital converter) de x(16,24) bits y un generador de frecuencia de muestreo programable. El generador de frecuencia de muestreo proporciona la frecuencia de trabajo a los DAC y ADC, que leen datos desde el computador o se los envían. Las tarjetas usan canales DMA (Direct Memory Access) para leer y escribir el audio digital. Las tarjetas que simultáneamente pueden leer y escribir el sonido se denominan fullduplex. El generador de sonido usa un DSP (Digital Signal Processor) que genera el sonido de las notas en función de un banco de datos de sonidos e instrumentos almacenado en la Wavetable a diferentes velocidades y las multiplexa. El máximo número de notas simultáneas disponible depende de la capacidad del DSP y se denomina polifonía. Los DSP generan efectos como – – – –
Reverberación (ej. Ambientes donde se escucha) Coros (varios instrumentos tocándose a la vez cuando en realidad solo se toca 1 Retrasos etc
FM Modulación en frecuencia • Desarrollado en Stanford en 1970 • Generan una sinusoidal pura (portadora) y la mezclan con una forma de onda (moduladora) • Yamaha lo adopta y desarrolla (DX7 y OPL3 hardware) • Creados inicialmente de forma anlógica, hoy en día la implementación es digital.
Sintesis Wavetable • Utiliza samples de instrumentos reales. • Sample: representación digital de una forma de onda generada por un instrumento • Mejor calidad, ésta depende de: – – – –
La calidad de los samples La frecuencia a la que se graban El número de samples usados para cada instrumento Los métodos de compresión para almacenarlos
• Modificando la frecuencia de reproducción del sample se consiguen diferentes octavas. • Se utilizan varios samples para un mismo instrumento para obtener una reproducción mejor. • También se graban variaciones y efectos.
Conexiones típicas
Audio standards • Primeros standards de facto (Soundblaster mono, soundblaster pro, etc) para DOS • DirectX 1 y 2-DirectSound (primer API standard de Microsoft)- Left-Right effect • DirectX3-DirectSound3D (DS3D) – 3D effects (positional audio) + SW effects • DirectX5- DS3D accelerated hardware • DirectX6- DS3D+DirectMusic • DirectX extensions: soporte de características adicionales por terceros: reverberación, etc: A3D, EAX
Aureal’s A3D • Desarrollado por la NASA para sus simuladores de vuelo • A3D1: entornos atmosféricos (niebla, agua, etc) • A3D2: reflexiones y oclusiones (Wave tracing) • A3D3: – – – –
Volumetric sound sources (no sólo puntuales) MP3 playback Reverberación (suma de reflexiones con retardo) Streaming audio
• Fin de A3D :Bancarrota de Aureal en 2000
Creative EAX (Environmental Audio Extensions) • Inicio en 1998 para añadir reverberación en Soundblaster Live! • EAX 1.0: – Objetivo: Crear sensación de entorno – Trabaja con efectos predefinidos
• EAX 2.0: – Efectos más sofisticados: Obstrucción y oclusión – Air absorcion model
• Finales 2000: los efectos de EAX se añaden a DirectX8 • Creative añade Dolby Digital y e incorpora su decodificador en las versiones 5.1
MIDI: Musical Instrument Data Interface • Se crea como un standard para comunicar controladores de música como teclados con generadores de sonido como sintetizadores o drum machines • Es un lenguaje de descripción musical de eventos en tiempo real que admite 16 instrumentos por dispositivo • Los mensajes que se envían se forman con: – Status byte: tipo de evento y el canal al que se envía(ej. Note On – qué instrumento suena) – Note number: tecla que se pulsa – nota musical – Velocity value: fuerza con que se pulsa la tecla
• El sintetizador que lo recibe ejecuta la orden hasta una orden de parada (Note off) • General MIDI: standarización incluyendo 128 instrumentos y 47 sonidos de percusión
MP3 • Sistema de compresión de señales de audio basado en psicoacústica (cómo el cerebro percibe el sonido) • Divide el espectro de frecuencias en 576 bandas y comprime cada una de forma independiente • Usa el perceptual coding: – Si 2 sonidos ocurren a la vez, solo comprime el que oiría el cerebro – Si un sonido débil sigue a uno fuerte se suprime, etc.
• Se comprime el stereo (solo se almacena una vez si el sonido es idéntico en los 2 canales • Compresión en factor de 12 (DCT-Discrete Cosine transform)