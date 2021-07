Le premier brevet de l’encodage PCM date de 1937, à destination de la téléphonie, et la Seconde Guerre mondiale a été son premier terrain d’exploitation.

Pour être numérisé, le signal est dans un premier temps échantillonné, c’est-à-dire que l’on en mesure le niveau instantané, à une périodicité correspondant à celle de la fréquence d’échantillonnage (Fe) choisie. Avec une Fe de 48 kHz, par exemple, le signal est mesuré 48 000 fois par seconde.

Chacune des valeurs mesurées est quantifiée, c’est-à-dire convertie en données numériques suivant une échelle plus ou moins étendue. Une quantification sur 3 bits (fig. 2) donne une échelle de 23, soit huit valeurs. Une quantification sur 24 bits permettra une échelle de 224, plus de 16 millions de valeurs codées en binaire.

Notre signal PCM est donc constitué comme une suite de mots numériques qui décrivent fidèlement le signal électrique audio analogique (fig. 3). Aucune compression destructive de données n’est autorisée en PCM.

Plus la fréquence d’échantillonnage et plus le rang de quantification sont élevés, plus la description numérique se rapproche fidèlement de l’original analogique. Mais aussi plus le nombre de données à traiter est important. Il convient donc de déterminer quels paramètres de codage sont suffisants pour obtenir un résultat adapté à chaque usage. Dans le monde de la téléphonie, par exemple, où une restitution de la voix avec une bande passante de 300 Hz à 3 kHz et une dynamique réduite sont suffisantes, il a été choisi d’encoder les signaux en 8 kHz 8 bits.

Sans entrer dans le détail des théorèmes permettant d’expliquer ces résultats, un son PCM 44,1 kHz 24 bits permet d’assurer une bande passante de plus de 20 kHz et une dynamique supérieure à 140 dB, soit des performances meilleures que ce que notre oreille est capable de percevoir. Cela garantit le respect de l’intégrité de notre signal initial. En audio professionnel, on considère donc que 44,1 kHz 24 bits est un format satisfaisant.

Il est adopté par l’univers du live et du son à l’image. 44,1 kHz est utilisé en musique enregistrée. En spectacle et pour le son à l’image, on a choisi la Fe de 48 kHz, qui assure également l’intégrité totale du signal audio.

Augmenter la quantification peut avoir un intérêt dans certains cas. Une quantification sur 32 bits, par exemple, permet aux processeurs d’effets audio de proposer sur les faibles niveaux des finesses sonores inatteignables en 24 bits. Concernant la Fe, il est courant d’utiliser des multiples de 44,1 ou 48 kHz, mais autant cette pratique avait un sens lorsque les filtres anti-repliement étaient compliqués et chers à réaliser, autant aujourd’hui, le bénéfice n’est plus évident.