Les liaisons audio PCM point à point

par | 10 Juil 2021 | Tutoriel Son

1RE PARTIE : AES, AES-3ID, S/PDIF ET ADAT

A l’image de son alter ego DMX pour la lumière relèvant des mêmes principes de codage numérique, le protocole audio AES3, qui permet la transmission normalisée de son en PCM, a vu le jour au mitant des années 1980. Il est depuis universellement utilisé et décliné dans divers formats, dont les versions en multicanal ADAT Optical Interface et MADI. Tous ont en commun une préservation totale du signal audio initial et le fait d’assurer un transport unidirectionnel, d’un point A vers un point B.

L’AES3 est souvent appelé AES, tout court, mais aussi AES/EBU. Les puristes se plairont à savoir que l’on doit dire AES/EBU dès lors que des transformateurs d’isolation sont utilisés sur la ligne, alors que l’AES3 rend la chose optionnelle. N’en parlons plus et adoptons, pour la suite de notre tuto, le simple sigle AES3. AES est en fait l’acronyme de Audio Engineering Society, la structure qui a publié en 1985 le standard. La même année, l’UER (Union européenne de radiodiffusion), que l’on nomme en anglais EBU, pour European Broadcasting Union, a ratifié le protocole, en imposant donc l’ajout de transformateurs.

L’objectif du protocole AES3 est de permettre la transmission, via une liaison série, de deux canaux audio numériques au format PCM.

LE CODAGE AUDIO PCM

Le sigle PCM provient de l’anglais pulse-code modulation (modulation par impulsions et codage). Il désigne un procédé de codage numérique du signal électrique analogique (fig. 1).

Le premier brevet de l’encodage PCM date de 1937, à destination de la téléphonie, et la Seconde Guerre mondiale a été son premier terrain d’exploitation.

Pour être numérisé, le signal est dans un premier temps échantillonné, c’est-à-dire que l’on en mesure le niveau instantané, à une périodicité correspondant à celle de la fréquence d’échantillonnage (Fe) choisie. Avec une Fe de 48 kHz, par exemple, le signal est mesuré 48 000 fois par seconde.

Chacune des valeurs mesurées est quantifiée, c’est-à-dire convertie en données numériques suivant une échelle plus ou moins étendue. Une quantification sur 3 bits (fig. 2) donne une échelle de 23, soit huit valeurs. Une quantification sur 24 bits permettra une échelle de 224, plus de 16 millions de valeurs codées en binaire.

Notre signal PCM est donc constitué comme une suite de mots numériques qui décrivent fidèlement le signal électrique audio analogique (fig. 3). Aucune compression destructive de données n’est autorisée en PCM.

Plus la fréquence d’échantillonnage et plus le rang de quantification sont élevés, plus la description numérique se rapproche fidèlement de l’original analogique. Mais aussi plus le nombre de données à traiter est important. Il convient donc de déterminer quels paramètres de codage sont suffisants pour obtenir un résultat adapté à chaque usage. Dans le monde de la téléphonie, par exemple, où une restitution de la voix avec une bande passante de 300 Hz à 3 kHz et une dynamique réduite sont suffisantes, il a été choisi d’encoder les signaux en 8 kHz 8 bits.

Sans entrer dans le détail des théorèmes permettant d’expliquer ces résultats, un son PCM 44,1 kHz 24 bits permet d’assurer une bande passante de plus de 20 kHz et une dynamique supérieure à 140 dB, soit des performances meilleures que ce que notre oreille est capable de percevoir. Cela garantit le respect de l’intégrité de notre signal initial. En audio professionnel, on considère donc que 44,1 kHz 24 bits est un format satisfaisant.

Il est adopté par l’univers du live et du son à l’image. 44,1 kHz est utilisé en musique enregistrée. En spectacle et pour le son à l’image, on a choisi la Fe de 48 kHz, qui assure également l’intégrité totale du signal audio.

Augmenter la quantification peut avoir un intérêt dans certains cas. Une quantification sur 32 bits, par exemple, permet aux processeurs d’effets audio de proposer sur les faibles niveaux des finesses sonores inatteignables en 24 bits. Concernant la Fe, il est courant d’utiliser des multiples de 44,1 ou 48 kHz, mais autant cette pratique avait un sens lorsque les filtres anti-repliement étaient compliqués et chers à réaliser, autant aujourd’hui, le bénéfice n’est plus évident.

Loading...