Flac, Monkey’s audio, MP3…
La compression des données audio
Avant tout, signalons qu’il ne faut pas confondre la compression au sens de celle que réalisent les compresseurs audio, qui modifie la dynamique du son, avec la compression des données numériques, qui conduit à la réduction de leur quantité initiale, donc à la diminution du débit numérique ou du poids des fichiers. Seul le mot compression est commun aux deux domaines.
LA COMPRESSION SANS PERTE
En informatique, la compression de don–nées consiste donc à transformer, via un algorithme, aussi appelé Codec (pour codeur décodeur), une information numérique sous forme de suite de bits 0 et 1 en une suite plus courte exprimant les mêmes informations que la suite initiale.Un autre algorithme, de décompression celui-ci, permet de faire l’opération inverse et de retrouver, dans le cas d’une compression sans perte, les informations d’origine intactes.Il s’agit de la manipulation que l’on réalise quand on produit des fichiers .zip, .rar… sur son ordinateur. Le principe de la compression sans perte est d’écrire les informations sans les modifier, mais sous forme plus concise. Elle peut s’appliquer à tout type de fichier mais n’a pas toujours un intérêt flagrant.
LE POIDS DU SON
Quel qu’il soit, un fichier audio numérique se caractérise par sa fréquence d’échantillonnage et sa quantification. Pour les exemples de cet article, nous nous baserons sur les caractéristiques d’un fichier audio issu d’un CD, à savoir 44,1 kHz et 16 bits.
Le débit de données d’un tel fichier, en kilobits par seconde (kb/s), s’obtient par le calcul. On multiplie la quantité d’échantillons par seconde avec le poids de l’échantillon et le nombre de canaux. Pour notre CD, cela donne : 44100 x 16 x 2 = 1 411,2 kb/s
Le kb/s est une unité que connaissent bien les utilisateurs des formats compressés MP3, AAC… Lorsque l’on dit « un fichier en 128 k », ce sont en fait 128 kb/s, la quantité de bits transférés en une seconde.
Le poids du fichier audio numérique s’obtient en multipliant le débit de données par la durée du son (en secondes). Notre titre exemple utilisé pour la compression zip dure 3’58’’. En secondes, cela donne 3 x 60 + 58 = 238 s.
Le calcul de son poids donne 1411,2 x 238 = 335 865,6 kb. Pour obtenir une valeur en mégaoctets (Mo), l’unité fréquemment utilisée pour les fichiers audio, il nous faut réaliser une conversion.Passons d’abord notre valeur de kb en octets, sachant qu’un octet contient 8 bits : 335 865,6 kb = 335 865,6 / 8 ko = 41 983,2 ko
Sachant qu’un mégaoctet contient lui-même 1 024 octets, notre conversion va être complète en réalisant 41 983,2 ko / 1024 = 41 Mo (ou 41 Mio, comme le préconise la norme – voir encadré ci-dessous). Notre fichier audio cité plus haut était donné pour 42 Mo dans sa forme originelle, et 39,1 Mo en version compressée. Notre valeur calculée de 41 Mo est dans le vrai.
COMPRESSER LES DONNÉES AUDIO
Nous avons vu que les principes de compression informatique courants n’apportent pas grand-chose à la réduction des quantités de données d’un fichier audio. Il a donc été imaginé des algorithmes spécifiques permettant une réduction significative.
Chapitre 1 – LA COMPRESSION SANS PERTE
Il paraît assez légitime, au moins dans le domaine professionnel, de souhaiter que les opérations de réduction de don-nées préservent l’intégrité du son. Mais il n’existe pas de technique universelle de compression de données sans perte, qui s’appliquerait à tout contenu numérique. Ainsi ont été développés des algorithmes de réduction de données non destructifs dédiés au son.Ceux-ci sont basés sur des spécificités des signaux audio. Prenons le cas, très fréquent, de fichiers stéréo. L’une des premières pistes de travail repose sur le fait que, en musique, une bonne partie des informations contenues dans les deux canaux est corrélée. La voix de l’artiste, par exemple, est souvent placée au centre.
Un article d'
Eric Moutot
DANS LA RUBRIQUE SON, LIRE AUSSI...