Les outils liés à l’immersion sonores fleurissent en nombre ces temps-ci. Alors pourquoi présenter celui-ci en particulier ? Parce qu’il est développé par une société française et en collaboration avec des chercheurs, étudiants et professionnels du son de l’Hexagone. Est-ce un atout suffisant pour se distinguer des autres propositions ? C’est la question à laquelle nous allons essayer de répondre, tout comme nous allons aussi éclairer la notion de
« binaural ».
Au départ donc, il y a la société Music Unit qui existe depuis plus de 20 ans et est sise à Montreuil, en Seine-Saint-Denis. Cette structure dispose de studios, intervient sur des installations sonores, et a créé une branche spin-off nommée LESON, destinée au développement de solutions technologiques dans l’univers de l’audio, particulièrement la VR, l’AR et la XR. L’idée est de proposer des briques technologiques innovantes qui seront intégrées à des produits industrialisés. C’est ce département LESON qui soutient le projet DeepStereo Upmixer, plug-in VST3, AU et AAX compatible macOS et Windows, qui peut donc être intégré à toute station de travail audionumérique.
Upmix binaural
Le plug-in DeepStereo Upmixer annonce transformer en temps réel, par un processus de synthèse binaurale, tout contenu audio mono ou stéréo en média audio 3D compatible avec tout système d’écoute standard à deux canaux. Les casques donc, mais aussi les enceintes et barres de son.
Cette prouesse annoncée s’appuie sur l’algorithme MyBeeKnows, fruit d’une douzaine d’année de recherche collaborative entre LESON et des institutions françaises d’excellence, dont le CNRS, l’École polytechnique et le Conservatoire national supérieur de musique et de danse de Paris (CNSMDP).
Nos recherches d’informations détaillées sur MyBeeKnows ont pointé de rares occurrences, vers un texte laconique sur le site de l’Ircam ou encore un clip réalisé au CES de Las Vegas en 2023, qui montre des visiteurs s’extasiant lors de comparaisons entre MyBeeKnows et des algorithmes comme ceux d’Apple Music. Mais la bande son diffusée n’illustre en rien le propos. Dommage.
Le binaural
Pour nous remettre de cette frustration, consacrons un instant pour évoquer le binaural. Le son binaural désigne une technique de production sonore qui vise à reproduire la perception naturelle de l’espace audio tel que l’entend un être humain. Il y a deux façons de produire un contenu binaural. En réalisant un enregistrement binaural natif, ou en faisant appel aux algorithmes permettant un binaural de synthèse.
Le binaural natif
Il désigne une technique d’enregistrement qui vise à reproduire fidèlement l’écoute humaine naturelle en trois dimensions sans traitement numérique ultérieur. La captation est directement réalisée à l’aide de deux microphones placés dans les conduits auditifs, soit sur une tête artificielle, soit sur la tête du preneur de son ou de l’artiste. Chacun des deux micros capte ainsi l’environnement sonore influencé par les différents phénomènes psychoacoustiques. Différences de temps, d’intensité et de spectre induisent les fonctions de transfert – HRTF – qui permettent au cerveau de localiser précisément les sons dans l’espace.
Pour écouter ces captations binaurales en 3D, on utilise le procédé inverse, à savoir l’écoute au casque permettant au son de directement parvenir aux tympans. Le dispositif est à la fois simple à mettre en œuvre et particulièrement bluffant. Notons que la scène sonore est fixe, c’est-à-dire qu’il n’est pas possible d’agir sur la position des sons, ni de réaliser aucune autre opération de post-production sauf éventuellement une réduction mono.