Listening in 3d

Ouvindo em 3D

Uma das habilidades notáveis do nosso sistema auditivo é que ele pode identificar a localização das fontes sonoras.

Por: Matthias Scholz
Designer  de Interface do Usuário
PhD Acústica Aplicada
Brüel & Kjær

Isso é vital em muitas situações da vida, como navegação segura no trânsito. Mas as propriedades espaciais do som são igualmente importantes para alcançar um ambiente acústico realista em configurações de jogos e cinema em casa. Então, como funciona e o que é necessário para recriar uma experiência autêntica?

Listening in 3dDiferença de tempo interaural
Fig. 1a: Com o som vindo de frente, a diferença de tempo interaural é zero (esquerda). Vindo de lado, com um tamanho de cabeça de cerca de 20 cm e uma velocidade de som de 340 m/s, a diferença horária máxima é de 0,58 ms (à direita)
Listening in 3dDiferença de fase interaural
Fig. 1b: Embora normalmente os ouvidos sintam uma diferença de fase (esquerda), dependendo da frequência e do ângulo do incidente, eles podem detectar uma falsa correspondência de fase (direita)

Como localizamos o som?
A primeira pista que nossa audição usa é a diferença de tempo interaural (fig. 1a). O som de uma fonte diretamente à nossa frente ou atrás de nós chegará simultaneamente aos dois ouvidos. Se a fonte se mover para a esquerda ou direita, nosso sistema auditivo reconhece que o som da mesma fonte chegou aos dois ouvidos, mas com um certo atraso, ou visto ao contrário, os dois ouvidos captam diferentes fases do mesmo sinal.

Deciframos melhor as diferenças de fase em baixas frequências. Em frequências mais altas, os comprimentos de onda podem ser tão curtos em comparação com o tamanho da cabeça, que o padrão se repete e ambas as orelhas podem coincidir na mesma fase (fig. 1b).

Felizmente, o sistema auditivo tem outra pista para trabalhar: a sombra acústica criada por nossa cabeça quando o som chega de lado, um fenômeno que aumenta com a frequência. Em frequências muito baixas, o tamanho da nossa cabeça é pequeno comparado ao comprimento de onda do som no ar. Consequentemente, a pressão do som é essencialmente a mesma nos ouvidos esquerdo e direito, independentemente da direção em que o som chega. No entanto, com o aumento da frequência, o comprimento de onda diminui e o tamanho da nossa cabeça não é mais desprezível. Torna-se um obstáculo que protege e reflete o som, de modo que, em comparação com o ouvido voltado para a fonte, o conteúdo de maior frequência será atenuado quando chegar ao ouvido no lado oposto da cabeça.

A forma de nossas pinças também fornece uma variedade de pistas espectrais (dependentes da frequência). Como a sombra acústica da cabeça, o pino funciona como um escudo atenuando as frequências mais altas de som que não entram diretamente da frente. Você pode experimentar isso se afastando e voltando para uma fonte. Ao fazer isso, você deve sentir uma pequena alteração nas altas frequências, algo em que normalmente não prestaria atenção.

Além disso, dependendo da frequência e direção do incidente, a forma da pino afeta o som conforme é refletido nos canais auditivos, melhorando algumas frequências e atenuando outras.

Audição binaural e reprodução de som
Geralmente, para uma experiência acústica espacial correta, precisamos das duas orelhas (binaural), pois a comparação entre a orelha esquerda e a direita fornece as pistas mais fortes sobre a localização das fontes. Pode não ser uma surpresa que tenhamos mais dificuldade em localizar fontes no plano médio, onde quase não há diferença interaural.

No entanto, muito do nosso senso direcional é construído com base na experiência, que está ligada à nossa própria fisiologia - o tamanho e a forma de nossos canais de cabeça, pino e ouvido. Com o tempo, nosso sistema auditivo cria um conjunto de referências, como perceber que o som por trás soa um pouco mais sombrio.

Portanto, para criar uma experiência espacial convincente, onde é possível detectar a localização exata das fontes sonoras, a reprodução do som deve fornecer todas as informações às quais nosso sistema auditivo está acostumado. Existem basicamente duas maneiras de fazer isso.

1: Gravação Binaural
Uma gravação binaural pode ser feita com um par de microfones transportados perto das orelhas ou - como geralmente é feito - usando uma cabeça artificial com os microfones colocados na entrada dos canais auditivos. Essa gravação é destinada à reprodução direta em fones de ouvido de alta qualidade; isto é, o som é reproduzido o mais próximo possível no mesmo ponto em que foi capturado. A reprodução em alto-falantes sem processamento adicional de sinal, como cancelamento de conversa cruzada, não funcionaria, pois o sinal seria enviado pela sala e ao redor da cabeça do ouvinte, criando uma experiência completamente diferente.

Listening in 3dFig. 2: A reprodução exata de paisagens sonoras tridimensionais usando alto-falantes requer salas com alta absorção de som para evitar reflexos


2: Microfone de array
Nesta abordagem, utiliza-se um conjunto de microfones dispostos em um padrão tridimensional espaçado. Isso gravará o som em um ponto, mas com informações espaciais sobre a direção do incidente. Com a ajuda de algoritmos sofisticados, é possível reproduzir um campo sonoro semelhante usando um arranjo de alto-falantes ao redor do ouvinte. O resultado é melhor se a sala de audição for altamente absorvente de som, para que o som que passou pelo ouvinte não seja refletido. Caso contrário, as características da sala seriam adicionadas (fig. 2). Essa técnica requer que o ouvinte permaneça em uma posição fixa ou pelo menos dentro de uma área limitada. No entanto, a experiência pareceria autêntica; girar em direção aos diferentes alto-falantes faria com que você sentisse que estava enfrentando as fontes de som reais.

Listening in 3dFig. 3: Medição da HRTF para uma fonte em um ângulo específico


Funções de transferência relacionados à cabeça
Podemos combinar as duas técnicas e reproduzir o som através de fones de ouvido, mesmo que ele tenha sido gravado com uma matriz de microfone. Isso também requer algum processamento para converter a gravação da matriz em um sinal binaural. Para fazer isso, precisamos levar em consideração a presença da cabeça do ouvinte e como ela influencia o som à medida que afeta as várias direções.

Essa relação é descrita pela função de transferência relacionada à cabeça (HRTF). Um único HRTF descreve como um som criado em um ponto específico será percebido no ouvido direito ou esquerdo. Você poderia dizer que é a impressão digital acústica da cabeça e do tronco.

Para medir uma HRTF, coloca-se um alto-falante no local da fonte e um microfone no ouvido (fig. 3). Embora essa seja uma tarefa gerenciável para um ou poucos locais de origem, cobrir todos os ângulos possíveis exigirá um vasto conjunto de HRTFs e um conjunto para cada ouvido (fig. 4), mas o resultado é gratificante.

Comparado à escuta de uma gravação binaural direta, a vantagem de usar um sinal, que foi gravado com uma matriz e processado através de um HRTF, é que a configuração de reprodução pode utilizar um sensor para captar a orientação da cabeça e corrigir a processamento em conformidade. Como exemplo, quando você vira a cabeça para a esquerda, uma fonte de som que estava originalmente à sua frente aparecerá à sua direita e vice-versa. Isso então dá uma sensação semelhante de 'estar presente' como na configuração dos alto-falantes, mas sem as limitações de ter que estar em uma sala especial, pois o som vai direto do fone de ouvido para os ouvidos.

Listening in 3d

Fig. 4: Para processar o som de qualquer direção, a medição HRTF deve ser repetida para muitos pontos de origem ao redor da cabeça


Mais artigos sobre a física do ruído e vibração: