sonomag

Audio 3D #5 – L’audio orienté scène

10 Sep 2025 | n°512, Tutoriels

Après avoir détaillé les principes de l’audio orienté canaux et objet, intéressons-nous à un autre type de contenus 3D dits « orienté scène sonore ». Nous allons voir qu’ils présentent des vertus inédites et complémentaires de celles des sons canaux et objets. Les sons orientés scène proposent en effet une approche universelle et manipulable de l’espace sonore.

L’audio orienté scène repose sur une représentation à 360° de l’espace sonore. Elle se présente sous des formats indépendants du système de diffusion sonore utilisé. Contrairement aux méthodes traditionnelles centrées sur les canaux (stéréo, 5.1), l’audio orienté scène capte en un point donné l’ensemble des sons directs et réverbérés, pour permettre de restituer la scène sonore avec une fidélité très proche de l’écoute naturelle acoustique. Son format agnostique permet ensuite une restitution sur tout type de système, que ce soit en stéréo sur haut-parleurs, en binaural au casque ou via les dispositifs immersifs les plus variés.

Principes

L’audio orienté scène s’appuie sur les principes de l’Ambisonic, format qui a été développé à partir des années 1970 par M. Gerzon, qui s’est lui-même inspiré des recherches de A. Blumlein, le créateur du couple associant deux micros bidirectionnels à angle droit. L’Ambisonic n’a cependant rencontré un vrai succès que depuis que l’audio 3D s’implante dans notre quotidien, et que les processeurs numériques en permettent le traitement efficace en temps réel.

L’Ambisonic est basée sur une géométrie sphérique pour la capture et la reproduction de scènes sonores à 360°. C’est une décomposition du champ sonore en harmoniques sphériques qui fonctionnent en différences d’intensité. On peut considérer que l’Ambisonic est une version augmentée du couple MS, ce dernier permettant la captation de scènes sonores en 2D ensuite manipulables dans leur largeur en post-production.

Les ordres de l’Ambisonic

Les solutions de captation Ambisonic se présentent sous la forme d’un ensemble de capsules microphoniques réparties uniformément en périphérie d’une sphère. Plus le nombre de micros est élevé, plus la finesse de représentation de l’espace sonore est importante.
Le format audio de la captation Ambisonic est initialement un flux audio multicanal avec autant de canaux que le nombre de micros sur la sphère.
Le nombre de micros n’est pas libre. Un capteur Ambisonic compte (l+1)2 micros, l étant l’ordre du capteur. Un ordre zéro donne (0+1)2 = 1 micro, c’est le format mono.

Un ordre 1 nécessite (1+1)2 = 4 micros. L’ordre 1 est la solution minimale pour permettre une représentation Ambisonic à 360°.
Un ordre 2 contient (2+1)2 = 9 micros, donc neuf canaux à enregistrer. Un ordre 3 contient (3+1)2 = 16 micros, etc.

Ces ordres de niveau supérieur sont appelés HOA pour Higher-Order Ambisonic. Plus l’ordre est élevé, plus la finesse de restitution de l’espace sonore est importante, mais plus le dispositif demande de ressources. Le compromis satisfaisant est à trouver pour chaque situation.

02 ok sonomag tuto son 3D ambisonic Eric Moutot ordre
Cette cartographie inventorie les modèles directionnels pouvant être obtenus à partir du principe Ambisonic. L’ordre 0 en haut, équivalent à une prise de son avec un micro omni mono, à l’ordre 4 en bas. Le premier ordre produit trois caractéristiques bidirectionnelles orthogonales, tandis que les systèmes supérieurs présentent une quantité de lobes croissant avec l’ordre.

Du format A au format B

L’empreinte sonore obtenue via les capsules réparties sur la sphère n’est pas directement utilisable. Sa forme discrète multicanal est appelée format A.
Un principe de matriçage, qu’il est inutile de détailler ici puisqu’il est directement réalisé en numérique dans l’un des multiples plug-ins dédiés à cette étape, permet d’encoder les informations spatiales dans une représentation indépendante du système de haut-parleurs. Il est appelé format B.
C’est ce format B qui sera décodé pour être conformé à la configuration de haut-parleurs choisie pour la diffusion.

Loading...