la compression audio

Ou comment tirer le meilleur d'un fichier audio compressé
 (et  par là même mettre à plat quelques idées reçues...) 
 
Navigation: utiliser les liens pour aller consulter le tableau. Pour revenir au texte, utilisez les liens ou la flèche "retour" de votre browser. Le lien vous ramène en tête de chapitre, la flèche retour d'où vous êtes parti pour consulter le tableau. Les liens tels que winamp, real audio, liquid audio, mènent aux sites de ces sociétés.

introduction  <retour sommaire>


En vue de la préparation de ce site, et de la partie MM de "persifle et signe" je me suis livré à de nombreux essais de qualité, utilisant tous les encodeurs et formats de compression que j'avais à disposition. Le but était de déterminer quel serait le format de compression offrant la meilleure réduction en taille tout en maintenant une qualité acceptable pour mes oreilles... (critère subjectif).


les formats WAV PCM et ADPCM <retour sommaire>  <tableau>


Je suis parti d'un fichier wav PCM 16bits 44kHz stéréo de 30s soit environ 5M (référence pour le calcul du taux de compression, pour tous les essais menés)
  1. Premier essai le format ADPCM de microsoft (?):  Taux de compression 4 (1.25M), vraiment aucune différence avec le fichier original...
  2. re-échantillonage du fichier original en PCM 22kHz 16bits (en utilisant un filtre de lissage) : Pas trop mauvais, mais perte d'aigus notable  : taille 2.5M
  3. ADPCM/22khz 16bits même qualité que ci-dessus, taille 625K (taux de compression 4- le fait de re-échantillonner en 22kHz n'étant pas à proprement parler une compression, disons rapport de taille 1:8)
  4. Pour voir j'ai essaye le 8 bits... aucun intérêt pour la musique (impression de bruit de fond)... à oublier...
  5. Il est évident que si on passe le fichier en Mono on gagne encore un rapport 2, on ne peut pas parler non plus de compression, mais on arrive quand même a un rapport en  taille de 1:16 (320K)  en ADPCM/22kHz mono, par rapport au fichier initial... ça peut être utile dans certains cas (le format ADPCM étant lu par n'importe quel PC équipé de Microsoft-Windows).
Bon c'est tout pour les formats wav, (les autres formats de compression proposés par les soft-audio et par Windows étants, sauf erreur, destinés au speech-processing et à la téléphonie, plutôt qu'à la musique). La qualité d'un fichier ADPCM est excellente, mais on va voir que l'on peut faire d'aussi bonne qualité, mais plus petit.


la compression MPEG layer 3 <retour sommaire> <tableau>


C'est un domaine qui évolue vite, comme on le verra pour les formats real-audio. Désormais les formats Mpeg layer 1 et 2, n'offrent plus aucun intérêt, je me suis donc limité au layer3 qui est de loin le plus répandu.

A. Préambule

  1. premier point a clarifier, il n'y a aucune différence entre un fichier xxxx.wav (utilisant la compression MPEG layer 3), et un fichier xxxx.MP3; Il suffit de changer l'extension du fichier et on passe de l'un a l'autre sans problèmes... Ça c'est la théorie, il semble néanmoins que certains encodeurs MP3 produisent des fichiers, non lisibles, quand renommés en wav (merci Simon). Tout dépend bien sur du Codec MPEG installé sur la machine.
  2. Pas besoin d'un lecteur MP3 style winamp pour lire un fichier compressé en MPEG3, il suffit d'avoir le codec installé (panneau de configuration, rubrique multimédia, paramètres avancés, audio codecs), et d'associer l'extension MP3 au media-player (ou renommer les xxx.MP3 en xxx.WAV). Seul problème, la plupart des Codecs ne sont pas libres de droits, ce qui empêche de le distribuer sur un CD par ex.
  3. Le taux de compression (donc la taille du fichier) ne dépend QUE du bit rate: Le bit-rate exprime la vitesse de transmission nécessaire à la lecture en temps réel du fichier (streaming). Il est exprimé en kbps (kilo bits par seconde) qu'il ne faut pas confondre avec des Ko/s (vitesse affichée par nos browsers quand on charge un fichier).
  4. Le format MP3 a été conçu pour le streaming (lecture en temps réel sans chargement préalable). Toutefois même avec un modem 56kbps, la vitesse maximum sur une ligne téléphonique classique se situe autour de 42kbps (où j'habite en tous cas...),  sans compter les net-congestions. Ceci est donc réservé aux accès ISDN ou plus rapides, à moins qu'on ne surcompresse le fichier pour l'amener à 32 kbps... Ce bit rate n'a à mon sens pas grand intérêt en MP3... (j'y reviens)
Résumé: un fichier MPEG encodé en 128kbps montrera toujours un taux de compression de 11 qu'il soit mono, stéréo, en 22kHz (ou quoi que ce soit...). C'est la qualité qui variera, pas la taille...

 B. Essais <tableau>(pour revenir ici utiliser la flèche retour de votre navigateur)

  1.  Bit rate 128kbps / 44khz stéréo : C'est le format "qualité CD"  (taux de compression 11): Là il faut faire attention à la vitesse d'encodage: On a pas vraiment de la qualité CD si on utilise un encodeur en mode ultra-rapide. On commence déjà à entendre le gargouillis (flange) propre aux taux de compression élevés. En revanche on s'en approche de très près si on utilise un encodeur en mode "high quality"... (il faut être patient... c'est tout... on peut batcher et faire ça pendant qu'on dort!).
  2. Le MPEG offre un tas de possibilités aussi diverses que variées. Je passe sur le 128Kbps mono/joint-stereo et le 22kHz qui à ce stade n'ont guère d'intérêt... (là taille du fichier étant toujours la même). Cependant, il faut éviter le mode "dual mono" car la dégradation est notable (équivalent d'un fichier encodé en 64kbps joint-stereo mais 2 fois plus gros... aucun intérêt... J'y reviens). En revanche pour l'encodage ultra rapide, on a tout intérêt à utiliser le mode joint-stereo. On retrouve alors une qualité quasi-identique à un encodage en mode "high quality" et il n'y a pas de différence notable sur la stéréo du fichier (même si on utilise le format joint-stereo 4 bits).
  3. 64 Kbps, taux de compression 1:22 (225K)  Si on passe le fichier en mono on aura une qualité de son équivalente à un 128kbps, mais sans la stéréo (évidemment!). Si on part d'un fichier échantillonné en 22Khz-mono, on aura la même taille de fichier, mais une qualité nettement inférieure avec un manque d'aigus très net (à éviter donc...).- Le meilleur choix pour ce bit-rate me semble être le joint-stereo 4bits, 44khz: on arrive à une qualité à peine inférieure à celle d'un 128kbps stéréo encode en mode ultrarapide, mais avec une taille de fichier réduite par 2... Si on veut une qualité quasi-équivalente on peut utiliser 80kbps joint-stereo 4bits (compression 1:18), et là il est très dur de faire la différence avec un full-qualité encodé en mode ultra-rapide...
  4. 48kbps (compression 1:30- 170k): Bon là, la perte de qualité devient évidente (aigus bouffés, et son gargouilleux), La encore on a intérêt à tirer avantage du mode joint-stereo, toutefois le mode mono offrira un son moins gargouilleux: Tout dépend si on veut privilégier la qualité du son, ou  la stéréo...
Aucun  de mes 3 encodeurs MPEG ne me permettaient pas de faire du 32kbps, mais à ce bit-rate (taux de compression 44, real-audio me parait être un meilleur choix depuis l'apparition du format G2 ... j'y reviens...

C. Résumé <tableau>(pour revenir ici utiliser la flèche retour de votre navigateur)

Il y a une différence notable de qualité, en fonction de la manière dont on a fait l'encodage, et en fonction de l'encodeur utilisé.
Le fait de re-échantillonner un fichier en 22kHz n'offre aucun intérêt dans le cadre d'une compression MPEG... on bouffe beaucoup d'aigus pour zéro benef.
Pour les fichiers de qualité inférieure à 128kbps, on a tout intérêt à tirer avantage du mode joint-stereo 4bits qui permet de réduire la taille par un facteur 1.5 sans perte notable de qualité.
Pour les taux de compression élevés (1:30 et plus), il faut faire un choix, soit la stéréo (de préférence joint stéréo 4bits), soit la qualité du son...
Si l'encodeur  le permet on peut également utiliser des bit rates intermédiaires. Toutefois attention, Il faut s'assurer qu'ils sont supportés par le codec. C'est résumé dans le tableau joint... Avec mon codec, 80 et 56 sont supportés, pas 96 par ex. Dans le cadre d'une distribution, il est donc préférable de se cantonner aux formats les plus répandus 128, 64, 48 et 32kbps.

D.Conclusion <tableau>(pour revenir ici utiliser la flèche retour de votre navigateur)

Un codec MPEG n'est normalement pas fourni avec windows, et certains sont protégés: Des exemples récents de poursuites  (programme d'encodages MP3 utilisant un codec commercial bien connu) ont montré qu'il faut être extrêmement prudent.
Heureusement la société nullsoft qui produit le très fameux lecteur Winamp, a depuis la version 2.5 décidé de distribuer son programme en freeware... Ce qui autorise à en distribuer l'installation sur un CD.  Ceci est une bonne nouvelle pour ceux qui font des CD à destination de gens qui n'ont pas tous accès au net...
D'autre part Winamp permet de reconvertir les fichiers MP3 en WAV pour le gravage "at home" de CD-audios...  L'intégrale de la plupart des chanteurs sur un seul CD, en qualité 128-stereo... 13h30 de musique ininterrompue... La révolution MP3 est en marche...


real audio G2 <retour sommaire> <tableau>

 A. Préambule

Depuis le format G2, le format real-audio n'est plus seulement synonyme de "son qualité ondes courtes". Dans une version précédente de ce topo, et n'ayant pas encore eu la possibilité de tester le G2, j'avais classé un peu hâtivement le real-audio dans la catégories des trucs inutilisables pour la musique (format ra-2, ra-3, ra-5). J'ai néanmoins gardé le data des formats 3 et 5 dans le tableau récapitulatif.
Le G2 permet désormais le streaming avec une qualité décente à une vitesse compatible avec les vitesses modem  (à partir de 28.8 ou mieux 56k). D'autre part la distribution des versions de base du lecteur et de l'encodeur, est gratuite (toutefois la licence ne permet pas la distribution sur CD)

 B. Essais <tableau>(pour revenir ici utiliser la flèche retour de votre navigateur)

  1. Je passe rapidement sur les qualités "corporate Lan" (96.7kbps) et "double ISDN" (64.7kbps), car chez moi la lecture est erratique (interruptions au milieu du fichier). Je n'ai pu déterminer s'il s'agissait d'un problème d'encodage ou de lecture, une vitesse d'accès disque ou une vitesse de processing insuffisante, mais alors que la lecture à 256kbps d'un fichier MP3 ne pose aucun problème, la lecture à 64kbps d'un fichier RA stéréo en pose...
  2. En qualité ISDN (44.1kbps) on arrive a un taux de compression de l'ordre de 30 (170K pour le fichier test de 30s).  En stéréo la dégradation est sensible, mais inférieure à ce qu'on obtient d'un MP3 en 48kbps; Moins de flange, plus d'aigus... Disons qu'à quelque chose près on obtient une qualité équivalente à ce qu'on obtient d'un fichier MP3 -64kbps - joint stéréo, mais ce dernier offre un taux de compression nettement inférieur. En mono la qualité est quasi équivalente à celle d'un MP3-64kbps-mono, mais là encore avec une fois une réduction de taille de l'ordre de 1.5. Pour mon goût personnel, on atteint ici la limite d'utilisation de la stéréo.
  3. En qualité "modem 56K" (32kbps), le taux de compression atteint 44 (117k pour le fichier test de 30s), et en mono la qualité est vraiment étonnante pour un tel taux de compression... En stéréo la qualité reste acceptable, mais le son devient "confus" avec l'apparition sensible de flange et de chuintements...
  4. En qualité "modem 28.8" (20.7kbps) on atteint le taux de compression étonnant de 62.5 (82k pour l'échantillon témoin), avec une qualité mono tout à fait acceptable. Une chanson de 3'30 en moins de 600k, avec une qualité meilleure que le broadcast  "grandes ondes" est quelque chose qui était inenvisageable il y a encore quelques années...C'est le format que j'ai retenu pour les fichiers se trouvant sur la page chargement.
C. Résumé et conclusion <tableau>(pour revenir ici utiliser la flèche retour de votre navigateur)

Depuis l'apparition du format G2, real-audio cesse d'être un format réservé au broadcast basse qualité. Les formats 44 (stéréo et mono),  32 et 20.7 (mono) permettent de forts taux de compression tout en maintenant une qualité acceptable.
Real-audio est un format propriétaire, même si le chargement du lecteur et de l'encodeur, sont gratuits, leur distribution n'est pas autorisée. D'autre part les formats 96.7 et 64.7 semblent poser quelques problèmes sur certaines machines.
Un autre avantage du G2 est qu'il permet le multi-rate streaming, ce qui veut dire que le bit-rate est adaptif, et fonction de la qualité de la liaison entre l'émetteur et le récepteur. Toutefois cette fonction nécessite un serveur spécifique.


liquid audio <retour sommaire> <tableau> 

 
  1. Liquid audio, n'est pas à proprement parler un format de compression, puisqu'il en utilise plusieurs, y compris le MPEG.  Son développement a été réalisé par Texas, et Dolby Labs, à la demande des compagnies de disques... Il s'agit d'enrayer le succès du MP3: Au contraire du MP3 les fichiers L.A ne peuvent pas être encodés par un amateur (jusqu'à quand ?), et ne peuvent être dupliqués, même par un passage par l'analogique. Des "watermarks" (filigranes) restants présents dans le data, qui indiquent l'origine du fichier...
  2. Les fichiers commerciaux chargeables montrent un taux de compression de 6.5 ou 13 (700K/mn). En termes de qualité, on est très proche du MP3 (à rapport de compression un peu supérieur ).
  3. Le développement de LA est lié, au développement de la vente de musique en ligne, et comparé au MP3 il offre l' emballage (photo de la pochette, de l'artiste, lyrics et notes), le tout en capsulé dans un fichier unique, le lecteur se chargeant d'afficher également l'emballage.
  4. tout comme le RA-G2, le LA offre le multi-rate streaming (adaptation de la vitesse de streaming en fonction de la vitesse de transfert), mais au contraire du G2 le serveur n'est accessible qu'aux sociétés de vente officielles. En règle générale le streaming est fait en mono (en tous cas quand on ne dispose que d'un modem 56kbps).

en guise de résumé... <retour sommaire> <tableau>

  1. liquid-Audio n'étant pas accessible à l'amateur, il n'offre aucun intérêt dans le cadre de ce topo.
  2. Les formats de compression ADPCM ont pour principal avantage d'être lisibles directement par windows sans ajout de codec, ou de lecteur particulier. Toutefois, un taux de compression de 4 est aujourd'hui peu attrayant.
  3. A mon avis le MPEG (wav ou MP3) reste le format le plus intéressant pour la distribution "non commerciale" sur "support dur" de fichier compressés: Ses avantages sont: a) Des lecteurs distribuables légalement - b) Une conversion facile vers WAV pour le gravage de CD "maison" -c) Une qualité très proche de l'original avec un taux de compression de 11 -d) Pas ou peu de problèmes liés à la machine. Les inconvénients sont:  Mauvaise qualité aux taux de compression élevés ce qui interdit le streaming aux vitesses modem même 56k.
  4. A moins qu'on ne dispose d'un accès meilleur que double ISDN, Real-Audio G2 offre une bien meilleure performance pour les taux de compression élevés: C'est le meilleur format pour le streaming à travers le net, car il est possible de streamer même avec un modem 28.8. Ses avantages sont: -a) Excellent rapport qualité / taille -b)- Lecteurs/ encodeurs chargeables gratuitement dans leur version de base. Les inconvénient sont:- a) Lecture problématique en haute qualité -b) Lecteur non distribuable.
Il me semble donc judicieux de préférer le MP3  pour la distribution sur support dur (CD), et de préférer le Real-Audio pour tout ce qui touche au net, qu'il s'agisse de streaming de download ou de fichiers transférés par email.
 


tableau récapitulatif <retour sommaire>


Notes: Pour MPEG et RA, les chiffres qui apparaissent dans la colonne sample rate, et bits/samples sont ceux du fichier WAV encodé.
Les Notes sont subjectives. La qualité du son a été notée en fonction de critères tels que brillance des aigus, clarté du son, flange, bruit de fond, etc...
Les formats  qui me paraissent les plus intéressants apparaissent  sur fond gris.
 
format sample/rate (kHz) bits/sample bit/rate stéréo taille (Ko/mn) rapport de taille fichier  commentaires note st. note mo. choix
WAV-PCM 44 16 n/a full 10242 ref référence: Qualité CD 10 très bien mais très gros
WAV-PCM 44 16 n/a mono 5122 2.0 qualité CD mais mono - 10 très bien mais très gros
WAV-PCM 22 16 n/a full 5122 2.0 qualité FM: manque aigus 9 - bcp trop gros pour qualité
WAV-PCM 22 8 n/a full 2562 4.0 qualité AM: manque aigus+bruit 3 - très très mauvais rapport q/t
WAV-ADPCM 44 16 n/a full 2560 4.0 idem ref 10 - très bien mais gros
WAV-ADPCM 22 16 n/a full 1280 8.0 qualité FM: manque aigus 8 - trop gros pour qualité
WAV-ADPCM 22 8 n/a full 640 16.0 qualité AM: manque aigus+bruit 3 - très mauvais rapport q/t
WAV-ADPCM 22 16 n/a mono 640 16.0 qualité FM: manque aigus /mono - 7 pas intéressant sauf compatibilité Windows
MPEG/MP3 44 16 128 full 928 11.0 idem ref si encodage HQ 9.8 - bon rapport qualite/taille
MPEG/MP3 44 16 128 J-st. 4bits 928 11.0 quasi-idem ref si encodage U-fast 9.5 - bon rapport qualite/taille si préssé
MPEG/MP3 44 16 128 mono 928 11.0 idem ref, mais aucun intérêt - 9.9 le 64khz est un meilleur choix
MPEG/MP3 22 16 128 full 928 11.0 qualité FM, aucun intérêt 7 - mauvais rapport q/t
MPEG/MP3 44 16 128 dual-mono 928 11.0 qualité dégradée aucun intérêt 6 - très mauvais rapport q/t
MPEG/MP3 44 16 80 j-st 4bits 580 17.7 très légèrement dégradé 9 - bon rapport qualite/taille, mais RA plus petit
MPEG/MP3 44 16 64 mono 464 22.1 idem ref si encodage HQ/ mono - 9.8 meilleur choix pour mono
MPEG/MP3 44 16 64 J-st 4bits 464 22.1 légèrement dégradé 8 - bon rapport qualité /taille, mais RA plus petit
MPEG/MP3 44 16 64 full 464 22.1 plus dégradé que Joint-stereo 4bits 7 - moyen
MPEG/MP3 22 16 64 full 464 22.1 degrade+manque aigu, aucun intérêt 6 - mauvais rapport q/t
MPEG/MP3 44 16 56 J-st 4bits 406 25.2 légèrement meilleur que 64 - st 7  - assez bon rapport taille qualité
MPEG/MP3 44 16 48 mono 348 29.4 manque peu d'aigus, son un peu gargouilleux - 7 choix moyen pour petit fichier mono
MPEG/MP3 44 16 48 j-st 4bits 348 29.4 un peu moins bon que mono 6 - choix moyen pour petit fichier stéréo
MPEG/MP3 44 16 48 full 348 29.4 nettement moins bon que mono 5 - assez mauvais rapport q/t
MPEG/MP3 22 16 48 full 348 29.4 encore un peu moins bon 4.5 - mauvais rapport q/t
REAL AUDIO G2 44 16 97 ra-st 746 13.7 bon (Câble modem - corp. LAN) 9.8  - lecture erratique sur P166
REAL AUDIO G2 44 16 65 ra-st 476 21.5 bon (2x ISDN) 9  - lecture erratique sur P166
REAL AUDIO G2 44 16 44 ra-st 330 31.0 bon (ISDN) 8  - bon rapport q/t- bit rate mini pour st.
REAL AUDIO G2 44 16 44 mono 350 29.3 Excellent (ISDN)  - 9 excellent choix pour un fichier mono
REAL AUDIO G2 44 16 32 ra-st 234 43.8 qualité moyenne (56k modem) 6.5 assez bon rapport taille qualité
REAL AUDIO G2 44 16 32 mono 234 43.8 assez bon (56k modem) - 8 bon choix pour petit fichier mono / streaming
REAL AUDIO G2 44 16 20.7 ra-st 164 62.5 médiocre (28.8modem) 5 préférer le mono
REAL AUDIO G2 44 16 20.7 mono 164 62.5 pas mal... (28.8 modem)  - 7 excellent rapport q/t. Bon choix pour streaming
REAL AUDIO 5 44 16 32 ra-st 234 43.8 qualité "ondes courtes" 3 - A oublier depuis le G2
REAL AUDIO 5 44 16 32 mono 234 43.8 un peu moins mauvais que st - 4 A oublier depuis le G2
REAL AUDIO 3 44 16 15.2 mono 114 89.8 très mauvais 2 - trop mauvais pour quoi que ce soit !
REAL AUDIO 3 44 16 15.2 ra-st 114 89.8 très très mauvais - 1 trop mauvais pour quoi que ce soit !


Last Updated on 08/10/99
Copyright Destrem Patrick 1999: Toute utilisation autre que strictement personnelle est soumise à accord préalable.
Email: patrick.destrem@libertysurf.fr
<retour sommaire page> 
retour accueil