How Digital Audio Works – MSP 4.5 Tutorials and Topics (tradução: Lawrence Shum) 1
Como Funciona o Áudio Digital Uma explanação aprofundada sobre como o áudio digital funciona está além do escopo deste manual. O que segue é uma breve explanação que lhe dará um conhecimento mínimo necessário para usar o MSP satisfatoriamente. Para obter informações mais detalhadas a respeito de áudio digital, recomendamos a leitura do livro The Computer Music Tutorial de Curtis Roads, publicado em 1996 pela editora MIT Press. A obra inclui uma ampla bibliografia sobre o assunto.
Som Movimento harmônico simples Os sons que ouvimos são flutuações na pressão do ar – pequenas variações da pressão atmosférica normal – causadas por objetos vibrantes. (Bem, tecnicamente, pode ser também a pressão da água se você estiver ouvindo debaixo d’água, mas mantenha seu computador fora da piscina). Quando um objeto se move, ele desloca moléculas de ar próximas a ele, que por sua vez deslocam outras moléculas de ar e assim sucessivamente, o que resulta em uma “frente de alta pressão” momentânea que trafega a partir do objeto vibrante (em direção aos nossos ouvidos). Assim, se fizermos com que um objeto vibre – uma batida em um diapasão, por exemplo – e, então, medirmos a pressão do ar em algum ponto próximo com um microfone, o microfone irá detectar um pequeno aumento na pressão do ar, à medida que a “frente de alta pressão” se move. Como “garfo” do diapasão é rígido e fixo em uma de suas extremidades, uma força contrária tende a levalo à sua posição original, e até que a energia vibratória se esgote, ocorre um movimento pendular. A conseqüência é que o microfone detecta um aumento da pressão do ar, seguido de uma diminuição, seguido de novos aumentos e diminuições sucessivos, correspondentes às vibrações do diapasão para frente e para trás. Se desenharmos um gráfico das mudanças de pressão sonora detectadas pelo microfone ao longo do tempo, veremos uma forma senoidal (uma senóide) subindo e descendo, correspondente às vibrações para frente e para trás do diapasão.
Variação senoidal na pressão do ar causada por uma vibração simples p/ frente e p/ trás
How Digital Audio Works – MSP 4.5 Tutorials and Topics (tradução: Lawrence Shum) 2
Estes contínuos aumentos e diminuições de pressão criam uma onda sonora. A quantidade de variação na pressão do ar, em relação à pressão atmosférica normal, é chamada de amplitude de onda (literalmente, seu “tamanho”). Comumente usamos o termo “amplitude” para se referir ao pico de amplitude, a maior variação de pressão alcançada pela onda. Este tipo de movimento simples para frente e para trás (também visto no balanço de um pêndulo) é chamado de movimento harmônico simples. É considerado a forma mais simples de vibração porque o objeto realiza um ciclo completo para (para frente e para trás) em uma taxa constante. Embora a velocidade se modifique quando o ritmo diminui para mudar de direção e aumente ao ganhar impulso na direção oposta – como vemos na curva da senóide – a velocidade média de um ciclo a outro é a mesma. Cada ciclo vibratório completo ocorre em um intervalo de tempo igual (em um dado período de tempo), de modo que a onda é chamada de periódica. O número de ciclos que ocorrem em um segundo é a freqüência da vibração. Por exemplo, se o diapasão se movimenta (para frente e para trás) 440 vezes por segundo, sua freqüência é 440 ciclos por segundo, e seu período é de 1/440 de segundo por ciclo.
Para ouvirmos as variações de pressão é preciso que: • As flutuações sejam substanciais o suficiente para afetar a membrana do tímpano, mas não para nos ferir. Na prática, a intensidade das mudanças na pressão do ar deve ser maior que 10 9 vezes a pressão atmosférica, mas não maior do que 10 3 vezes a pressão atmosférica. Você não precisa decorar estes valores. Isto apenas significa que o som mais suave que podemos ouvir tem cerca de um milionésimo de intensidade do som mais intenso possível, que podemos suportar. É uma enorme gama de possibilidades. • As flutuações têm que repetir em uma taxa regular suficientemente rápida para que possam ser percebidas como som (acima de 20 ciclos por segundo), e não tão rápida que exceda o limite de nossa percepção auditiva. Teoricamente, a faixa auditiva humana vai de 20 a 20,000 ciclos por segundo, também chamados de hertz (Hz). Na realidade, isto varia de pessoa para pessoa. Alguém de meia idade ou que tenha ouvido músicas em volume muito alto, possivelmente ouve até 17.000 Hz (17 kHz) ou menos. Nota do tradutor: a má notícia para os homens é que a perda da percepção de altas freqüências costuma ocorrer antes das mulheres, a partir dos 40 anos de idade.
How Digital Audio Works – MSP 4.5 Tutorials and Topics (tradução: Lawrence Shum) 3
Tons complexos Quando um objeto vibra em um movimento harmônico simples, dizemos que possui um modo de vibração ressonante – uma freqüência na qual tende naturalmente a vibrar, ao ser colocado em movimento. Entretanto, a maior parte dos objetos no mundo real apresenta vários modos de vibração ressonante e, por este motivo, vibra em muitas freqüências ao mesmo tempo. Um som que contenha mais de uma única freqüência (um som que não seja uma simples senóide) é chamado de tom complexo. Vejamos uma corda de guitarra, por exemplo. Uma corda de guitarra tem uma massa uniforme ao longo de seu comprimento, um tamanho definido, já que suas extremidades estão fixas, e apresenta uma tensão específica, dependendo do quão esticada está de acordo com sua afinação. Como a corda está presa nas duas extremidades, movese mais em sua parte central.
Uma corda pinçada vibrando em seu modo ressonante fundamental A freqüência na qual vibra depende de sua massa, tensão e comprimento. Como estes fatores mantémse relativamente constantes ao longo de uma nota, há uma freqüência fundamental na qual vibra. Entretanto, outros modos de vibração também são possíveis.
Os modos possíveis de vibração são limitados, já que a corda mantémse fixa em cada extremidade. Isto limita seus modos de ressonância a divisões inteiras de seu comprimento.
Este modo de ressonância é impossível porque a corda está presa em cada extremidade
How Digital Audio Works – MSP 4.5 Tutorials and Topics (tradução: Lawrence Shum) 4
Pelo fato de que a tensão e a massa estão definidas, as divisões inteiras do comprimento da corda resultam em múltiplos inteiros da freqüência fundamental.
Cada modo ressonante resulta em uma freqüência diferente
Na verdade, uma corda ao ser pinçada vibrará em todos os modos ressonantes possíveis simultaneamente, criando energia em todas as freqüências correspondentes. Certamente, cada modo de vibração (e conseqüentemente cada freqüência) apresentará uma amplitude distinta (No exemplo da corda de guitarra, os segmentos maiores têm mais liberdade para vibrar). O tom resultante será uma soma de todas essas freqüências, cada uma com uma amplitude diferente. À medida que as vibrações vão perdendo força, cada freqüência “morre” em uma taxa distinta, isto é, cada freqüência tem um tempo de duração específico. De fato, em muitos sons, as amplitudes das diferentes freqüências que os integram podem variar separadamente e diferentemente entre si. Esta variação de níveis de amplitude entre as diversas freqüências é um dos fatores fundamentais em nossa percepção de que os sons possuem cores tonais (timbres), e o timbre de uma única nota pode mudar drasticamente ao longo da execução desta nota.
How Digital Audio Works – MSP 4.5 Tutorials and Topics (tradução: Lawrence Shum) 5
Tons harmônicos A combinação de freqüências – e suas respectivas amplitudes – que estão presentes em um som é chamada de espectro sonoro (assim como as diferentes freqüências e intensidades de luz constituem o espectro de cores). Cada freqüência individual que faz parte de um tom complexo é recebe o nome de parcial (é uma parte do tom completo). Quando os parciais (freqüências que integram um som) em um tom complexo são todos múltiplos inteiros da mesma freqüência fundamental, como em nosso exemplo da corda de guitarra, dizemos que o som apresenta um espectro harmônico. Cada componente de um espectro harmônico é chamado de parcial harmônico ou, simplesmente, harmônico. A soma de todas estas freqüências harmônicas, relacionadas entre si, ainda resulta em uma onda periódica que tem uma freqüência fundamental. As freqüências múltiplas inteiras fundemse “harmoniosamente” em um único tom.
A soma das freqüências relacionadas harmonicamente continua a repetir sua freqüência fundamental
Esta fusão é apoiada pelo famoso teorema de JeanBaptiste Joseph Fourier, segundo o qual, qualquer onda periódica, não importa quão complexa, pode ser demonstrada como a soma de diferentes freqüências relacionadas harmonicamente (ondas senoidais), cada uma com sua própria amplitude e fase (fase é um ponto de início a partir de alguma fração de um ciclo).
Freqüências relacionadas harmonicamente criam um contorno particular de tonalidades.
Harmônicos parciais de uma freqüência fundamental ƒ, onde ƒ = 65.4 Hz = o C (Dó) grave
How Digital Audio Works – MSP 4.5 Tutorials and Topics (tradução: Lawrence Shum) 6
Cada vez que a freqüência fundamental é multiplicada por 2 – 2, 4, 8, 16, etc. – a afinação musical percebida sobe uma oitava. Todas as culturas parecem compartilhar a percepção de que há um certo “parentesco” na sonoridade entre freqüências relacionadas por oitavas distintas. Os demais múltiplos inteiros da fundamental criam novos tons musicais. Sempre que você ouve um tom harmônico complexo, está na verdade ouvindo um acorde! Como vimos, o resultado combinado da soma da fundamental com os harmônicos repete a freqüência fundamental e, por isso, tendemos a fundir estas freqüências juntas, de modo que percebemos um único tom. Tons inarmônicos e ruído Alguns objetos – como sinos, por exemplo – vibram em modos ainda mais complexos, com muitos modos de vibração diferentes que podem não produzir um conjunto de parciais harmônicos. Se as freqüências presentes em um tom não são múltiplas inteiras de uma única fundamental, a onda não se repete periodicamente. Assim, um conjunto de parciais inarmônicos não se funde tão facilmente em nossa percepção. Podemos ser capazes de identificar parciais individuais sem dificuldade, e – especialmente quando os parciais são muitos e completamente inarmônicos – não percebemos a soma como um tom único e discernível. Quando um tom é tão complexo que contém muitas freqüências diferentes sem relações matemáticas aparentes, percebemos o som como ruído. Um som com muitas freqüências e amplitudes completamente aleatórias – essencialmente quando todas as freqüências estão presentes em proporção igual – se parece com o barulho típico de estática ou de TV fora do ar, o chamado ruído branco (analogamente à luz branca que contém todas as freqüências de luz). Assim, podemos dizer que há uma vasta gama de sons que vai desde formas puras e previsíveis (senóides) até a total aleatoriedade (ruído branco). A maioria dos sons encontrase entre os dois extremos de um contínuo sonoro. Um tom harmônico – uma nota de trompete ou guitarra, por exemplo – está em um lado, enquanto a batida em um prato de bateria está mais próximo do limiar do ruído. Tímpanos e sinos podem apresentar um espectro harmônico sugestivo com uma fundamental identificável e, ao mesmo tempo, parciais inarmônicos. Outros instrumentos de percussão produzem sons próximos a ruídos com largura de banda limitada – freqüências relacionadas aleatoriamente entre si, mas restritas a uma região de freqüências – dando a sensação de que há uma região tonal ou um tom não específico, ao invés de uma fundamental identificável. É importante ter este contínuo de variedades sonoras em mente ao sintetizar sons.
How Digital Audio Works – MSP 4.5 Tutorials and Topics (tradução: Lawrence Shum) 7
Envelope de Amplitude Outro fator importante na quase infinita variedade de sons é a mudança geral de amplitude de um som ao longo de seu tempo de duração. A forma desta mudança geral macroscópica na amplitude de um som é chamada de envelope de amplitude. A porção inicial de um som, à medida que o envelope de amplitude aumenta do silêncio para a região audível, crescendo até seu pico, é conhecida como ataque de um som. O envelope e, especialmente o ataque, de um som são fatores importantes em nossa habilidade em distinguir, reconhecer e comparar sons. Temos pouco conhecimento sobre como ler uma representação gráfica de uma onda sonora e “ouvir” o som em nossa cabeça, como um bom instrumentista consegue fazer com a notação musical. No entanto, o envelope de amplitude pode, pelo menos, nos informar acerca da evolução geral da amplitude de um som ao longo do tempo.
O envelope de amplitude é a evolução do volume de um som ao longo do tempo A relação entre a amplitude de um som medida objetivamente e a nossa impressão subjetiva de seu volume é complexa e depende de muitos fatores. Sem tentar explicar todos esses fatores, podemos ao menos destacar que nosso senso de volume relativo entre dois sons está relacionado à razão de suas intensidades, ao invés da diferença matemática entre suas intensidades. Por exemplo, em uma escala arbitrária de medição, a relação entre um som de amplitude 1 e um som de amplitude 0,5 é equivalente à relação entre um som de amplitude 0,25 e outro som de amplitude 0,125. A diferença subtrativa entre as amplitudes é de 0,5 no primeiro caso e de 0,125 no segundo, mas no que concerne à percepção está a razão de 2:1 em ambos os casos. Se você duplicar a amplitude de um som, ele soará duas vezes mais intenso? Geralmente, a resposta é “não”. Primeiro, porque nosso senso subjetivo de “volume” não é diretamente proporcional à amplitude. Experimentos revelaram que para a maioria dos ouvintes, a sensação (extremamente subjetiva) de que um som está “duas vezes mais alto” requer um aumento muito maior do que o dobro. Além disso, nosso senso de volume varia consideravelmente, dependendo da região de freqüências dos sons. Somos muito mais sensíveis a freqüências entre 300 Hz e 7.000 Hz (7 kHz) do que a freqüências fora desta região (Isto pode ser conseqüência do processo evolutivo que priorizou a escuta
How Digital Audio Works – MSP 4.5 Tutorials and Topics (tradução: Lawrence Shum) 8
da fala e de muitos outros sons importantes para a sobrevivência que estão nesta faixa de freqüências). Nota do tradutor: este assunto está relacionado às curvas de audibilidade A, B e C. Por outro lado, há uma correlação – ainda que não perfeitamente linear – entre amplitude e volume, de modo que é útil saber a amplitude relativa de dois sons. Como dissemos anteriormente, o som mais suave que podemos ouvir tem cerca de um milionésimo da amplitude do som mais intenso suportável. Ao invés de falar de amplitude usando esta gama tão grande de números entre 0 e 1.000.000, é mais comum comparar amplitudes em uma escala logarítmica. A razão entre duas amplitudes é comumente discutida em termos de decibéis (dB). Um valor expresso em decibéis é uma afirmação de relação entre dois valores – não uma medida absoluta. Se considerarmos uma amplitude como uma referência a qual chamemos de A0, então a amplitude relativa do outro som em decibéis pode ser calculada através da equação:
nível em decibéis = 20 log10 (A/A0) Se considerarmos a amplitude máxima possível como uma referência com um valor numérico de 1, então, um som com amplitude 0,5 tem 1/2 da amplitude (igual a 10 0.3 ), de forma que seu nível é:
20 log10 (0.5/1) _ 20 (0.3) = 6 dB Cada vez que dividimos em dois a amplitude de um som, criamos uma diferença de cerca de 6 dB; cada vez que multiplicamos por dois a amplitude de um som, ocorre um incremento de cerca de 6 dB. Assim, se uma amplitude é 48 dB maior que outra, podemos estimar que é aproximadamente 2 8 (256) vezes maior.
Resumo Um entendimento teórico sobre ondas senoidais, tons harmônicos, tons complexos inarmônicos e ruído, como foi discutido aqui, é útil para a compreensão da natureza do som. Entretanto, a maioria dos sons é, na verdade, combinações complicadas destas descrições teóricas, mudando de um instante a outro. Por exemplo, uma corda de arco pode incluir o ruído do atrito entre o arco e a corda, variações de amplitude decorrentes de alterações na pressão e na velocidade do arco, mudanças na predominância de diferentes freqüências de acordo com a posição do arco, flutuações de amplitude e de freqüência fundamental (e seus harmônicos), conforme movimentos vibratórios na mão esquerda, etc. Uma nota de percussão pode soar como ruído, mas pode também evoluir de tal forma que enfatize, em certas regiões de seu espectro,
How Digital Audio Works – MSP 4.5 Tutorials and Topics (tradução: Lawrence Shum) 9
sons que sugiram um tom harmônico, criando a impressão da presença de uma fundamental. A análise de sons existentes e a experimentação na síntese de novos sons oferecem insights a respeito de como os sons são compostos. O computador provê esta oportunidade.