la compression
audio
Ou comment tirer le
meilleur d'un fichier audio compressé
(et par
là même mettre à plat quelques idées reçues...)
Navigation: utiliser les liens pour
aller consulter le tableau. Pour revenir au texte, utilisez les liens
ou la flèche "retour" de votre browser. Le lien vous ramène
en tête de chapitre, la flèche retour d'où vous êtes
parti pour consulter le tableau. Les liens tels que
winamp, real audio, liquid audio, mènent aux sites de ces sociétés.
introduction
<retour sommaire>
En
vue de la préparation de ce site, et de la partie MM de "persifle
et signe" je me suis livré à de nombreux essais de qualité,
utilisant tous les encodeurs et formats de compression que j'avais à
disposition. Le but était de déterminer quel serait le format
de compression offrant la meilleure réduction en taille tout en
maintenant une qualité acceptable pour mes oreilles... (critère
subjectif).
les
formats WAV PCM et ADPCM <retour sommaire>
<tableau>
Je suis parti d'un fichier
wav PCM 16bits 44kHz stéréo de 30s soit environ 5M (référence
pour le calcul du taux de compression, pour tous les essais menés)
-
Premier
essai le format ADPCM de microsoft (?): Taux de compression 4 (1.25M),
vraiment aucune différence avec le fichier original...
-
re-échantillonage du
fichier original en PCM 22kHz 16bits (en utilisant un filtre de lissage)
: Pas trop mauvais, mais perte d'aigus notable : taille 2.5M
-
ADPCM/22khz
16bits même qualité que ci-dessus, taille 625K (taux de compression
4- le fait de re-échantillonner en 22kHz n'étant pas à
proprement parler une compression, disons rapport de taille 1:8)
-
Pour voir
j'ai essaye le 8 bits... aucun intérêt pour la musique (impression
de bruit de fond)... à oublier...
-
Il est évident que si
on passe le fichier en Mono on gagne encore un rapport 2, on ne peut pas
parler non plus de compression, mais on arrive quand même a un rapport
en taille de 1:16 (320K) en ADPCM/22kHz mono, par rapport au
fichier initial... ça peut être utile dans certains cas (le
format ADPCM étant lu
par n'importe quel PC équipé de Microsoft-Windows).
Bon c'est
tout pour les formats wav, (les autres formats de compression proposés
par les soft-audio et par Windows étants, sauf erreur, destinés
au speech-processing et à la téléphonie, plutôt
qu'à la musique). La qualité d'un fichier ADPCM est excellente,
mais on va voir que l'on peut faire d'aussi bonne qualité, mais
plus petit.
la
compression MPEG layer 3
<retour sommaire> <tableau>
C'est un domaine qui évolue
vite, comme on le verra pour les formats real-audio. Désormais les
formats Mpeg layer 1 et 2, n'offrent plus aucun intérêt, je
me suis donc limité au layer3 qui est de loin le plus répandu.
A. Préambule
-
premier point a clarifier, il
n'y a aucune différence entre un fichier xxxx.wav (utilisant la
compression MPEG layer 3), et un fichier xxxx.MP3; Il suffit de changer
l'extension du fichier et on passe de l'un a l'autre sans problèmes...
Ça c'est la théorie, il semble néanmoins que certains
encodeurs MP3 produisent des fichiers, non lisibles, quand renommés
en wav (merci Simon). Tout dépend bien sur du Codec MPEG installé
sur la machine.
-
Pas besoin
d'un lecteur MP3 style winamp pour lire un fichier compressé en
MPEG3, il suffit d'avoir le codec installé (panneau de configuration,
rubrique multimédia, paramètres avancés, audio codecs),
et d'associer l'extension MP3 au media-player (ou renommer les xxx.MP3
en xxx.WAV). Seul
problème, la plupart des Codecs ne sont pas libres de droits, ce
qui empêche de le distribuer sur un CD par ex.
-
Le taux de compression (donc
la taille du fichier) ne dépend QUE du bit rate: Le bit-rate exprime
la vitesse de transmission nécessaire à la lecture en temps
réel du fichier (streaming). Il est exprimé en kbps (kilo
bits par seconde) qu'il ne faut pas confondre avec des Ko/s (vitesse affichée
par nos browsers quand on charge un fichier).
-
Le format
MP3 a été conçu pour le streaming (lecture en temps
réel sans chargement préalable). Toutefois même avec
un modem 56kbps, la vitesse maximum sur une ligne téléphonique
classique se situe autour de 42kbps (où j'habite en tous cas...),
sans compter les net-congestions. Ceci
est donc réservé aux accès ISDN ou plus rapides, à
moins qu'on ne surcompresse le fichier pour l'amener à 32 kbps...
Ce bit rate n'a à mon sens pas grand intérêt en MP3...
(j'y reviens)
Résumé: un fichier MPEG encodé
en 128kbps montrera toujours un taux
de compression de 11 qu'il soit mono, stéréo, en 22kHz (ou
quoi que ce soit...). C'est la qualité
qui variera, pas la taille...
B. Essais
<tableau>(pour revenir ici utiliser
la flèche retour de votre navigateur)
-
Bit rate 128kbps / 44khz
stéréo : C'est le format "qualité CD" (taux
de compression 11): Là il faut faire attention à la vitesse
d'encodage: On
a pas vraiment de la qualité CD si on utilise un encodeur en mode
ultra-rapide. On commence déjà à entendre le gargouillis
(flange) propre aux taux de compression élevés. En revanche
on s'en approche de très près si on utilise un encodeur en
mode "high quality"... (il faut être patient... c'est tout... on
peut batcher et faire ça pendant qu'on dort!).
-
Le MPEG
offre un tas de possibilités aussi diverses que variées.
Je passe sur le 128Kbps mono/joint-stereo et le 22kHz qui à ce stade
n'ont guère d'intérêt... (là taille du fichier
étant toujours la même). Cependant, il faut éviter
le mode "dual mono" car la dégradation est notable (équivalent
d'un fichier encodé en 64kbps joint-stereo mais 2 fois plus gros...
aucun intérêt... J'y reviens). En revanche
pour l'encodage ultra rapide, on a tout intérêt à utiliser
le mode joint-stereo. On retrouve alors une qualité quasi-identique
à un encodage en mode "high quality" et il n'y a pas de différence
notable sur la stéréo du fichier (même si on utilise
le format joint-stereo 4 bits).
-
64 Kbps, taux de compression
1:22 (225K)
Si on passe le fichier en mono on aura une qualité de son équivalente
à un 128kbps, mais sans la stéréo (évidemment!).
Si on part d'un fichier échantillonné en 22Khz-mono, on aura
la même taille de fichier, mais une qualité nettement inférieure
avec un manque d'aigus très net (à éviter donc...).-
Le meilleur choix pour ce bit-rate me semble être le joint-stereo
4bits, 44khz: on arrive à une qualité à peine inférieure
à celle d'un 128kbps stéréo encode en mode ultrarapide,
mais avec une
taille de fichier réduite par 2... Si on veut une qualité
quasi-équivalente on peut utiliser 80kbps joint-stereo 4bits (compression
1:18), et là il est très dur de faire la différence
avec un full-qualité
encodé en mode ultra-rapide...
-
48kbps
(compression 1:30- 170k): Bon là, la perte de qualité devient
évidente (aigus bouffés, et son gargouilleux), La encore
on a intérêt à tirer avantage du mode joint-stereo,
toutefois le mode mono offrira un son moins gargouilleux: Tout dépend
si on veut privilégier la qualité du son,
ou la stéréo...
Aucun de mes 3 encodeurs
MPEG ne me permettaient pas de faire du 32kbps, mais à ce bit-rate
(taux de compression 44, real-audio me parait être un meilleur choix
depuis l'apparition du format G2 ... j'y reviens...
C.
Résumé <tableau>(pour
revenir ici utiliser la flèche retour de votre navigateur)
Il y a une différence
notable de qualité, en fonction de la manière dont on a fait
l'encodage, et en fonction de l'encodeur utilisé.
Le fait de re-échantillonner un
fichier en 22kHz n'offre aucun intérêt dans le cadre d'une
compression MPEG... on bouffe beaucoup d'aigus pour
zéro benef.
Pour les fichiers
de qualité inférieure à 128kbps, on a tout intérêt
à tirer avantage du mode joint-stereo 4bits qui permet de réduire
la taille par un facteur 1.5 sans perte notable de qualité.
Pour les taux de compression élevés
(1:30 et plus), il faut faire un choix, soit la stéréo (de
préférence joint stéréo 4bits), soit la qualité
du son...
Si l'encodeur
le permet on peut également utiliser des bit rates intermédiaires.
Toutefois attention, Il faut s'assurer qu'ils sont supportés par
le codec. C'est résumé dans le tableau
joint... Avec mon codec, 80 et 56 sont supportés, pas 96 par ex.
Dans le cadre d'une distribution, il est donc
préférable de se cantonner aux formats les plus répandus
128, 64, 48 et 32kbps.
D.Conclusion
<tableau>(pour revenir ici utiliser
la flèche retour de votre navigateur)
Un codec MPEG n'est normalement
pas fourni avec windows, et certains sont protégés: Des exemples
récents de poursuites (programme d'encodages MP3 utilisant
un codec commercial bien connu) ont montré qu'il faut être
extrêmement prudent.
Heureusement la société
nullsoft qui produit le très fameux lecteur Winamp,
a depuis la version 2.5 décidé de distribuer son programme
en freeware... Ce qui autorise à en distribuer l'installation sur
un CD. Ceci est une bonne nouvelle pour ceux qui font des CD à
destination de gens qui n'ont pas tous accès au net...
D'autre part Winamp permet
de reconvertir les fichiers MP3 en WAV pour le gravage "at home" de CD-audios...
L'intégrale de la plupart des chanteurs sur un seul CD, en qualité
128-stereo... 13h30 de musique ininterrompue... La révolution MP3
est en marche...
real
audio G2 <retour sommaire> <tableau>
A. Préambule
Depuis
le format G2, le format real-audio
n'est plus seulement synonyme de "son qualité ondes courtes". Dans
une version précédente de ce topo, et n'ayant pas encore
eu la possibilité de tester le G2, j'avais classé un peu
hâtivement le real-audio dans la catégories des trucs inutilisables
pour la musique (format ra-2, ra-3, ra-5). J'ai
néanmoins gardé le data des formats 3 et 5 dans le tableau
récapitulatif.
Le
G2 permet désormais le streaming avec une qualité décente
à une vitesse compatible avec les vitesses modem (à
partir de 28.8 ou mieux 56k). D'autre part la distribution des versions
de base du lecteur et de l'encodeur, est gratuite (toutefois la licence
ne permet pas la distribution sur CD)
B. Essais
<tableau>(pour revenir ici utiliser
la flèche retour de votre navigateur)
-
Je passe
rapidement sur les qualités "corporate Lan" (96.7kbps) et "double
ISDN" (64.7kbps), car chez moi la lecture est erratique (interruptions
au milieu du fichier). Je n'ai pu déterminer s'il s'agissait d'un
problème d'encodage ou de lecture, une vitesse d'accès disque
ou une vitesse de processing insuffisante, mais alors que la lecture à
256kbps d'un fichier MP3 ne pose aucun problème, la lecture à
64kbps d'un fichier RA stéréo en pose...
-
En qualité
ISDN (44.1kbps) on arrive a un taux de compression de l'ordre de 30 (170K
pour le fichier test de 30s). En stéréo la dégradation
est sensible, mais inférieure à ce qu'on obtient d'un MP3
en 48kbps; Moins de flange, plus d'aigus... Disons qu'à quelque
chose près on obtient une qualité équivalente à
ce qu'on obtient d'un fichier MP3 -64kbps - joint stéréo,
mais ce dernier offre un taux de compression nettement inférieur.
En mono la qualité est
quasi équivalente à celle d'un MP3-64kbps-mono, mais là
encore avec une fois une réduction de taille de l'ordre de 1.5.
Pour mon goût personnel,
on atteint ici la limite d'utilisation de la stéréo.
-
En qualité
"modem 56K" (32kbps), le taux de compression atteint 44 (117k pour le fichier
test de 30s), et en mono la qualité est vraiment étonnante
pour un tel taux de compression... En stéréo la qualité
reste acceptable, mais le son devient "confus" avec l'apparition sensible
de flange et de chuintements...
-
En qualité "modem 28.8"
(20.7kbps) on atteint le taux de compression étonnant de 62.5 (82k
pour l'échantillon témoin), avec une qualité mono
tout à fait acceptable. Une chanson de 3'30 en moins de 600k, avec
une qualité meilleure que le broadcast "grandes ondes" est
quelque chose qui était inenvisageable il y a encore quelques années...C'est
le format que j'ai retenu pour les fichiers se trouvant sur la page chargement.
C. Résumé
et conclusion <tableau>(pour
revenir ici utiliser la flèche retour de votre navigateur)
Depuis l'apparition
du format G2, real-audio
cesse d'être un format réservé au broadcast basse qualité.
Les formats 44 (stéréo et mono), 32 et 20.7 (mono)
permettent de forts taux de compression tout en maintenant une qualité
acceptable.
Real-audio est un format propriétaire,
même si le chargement du lecteur et de l'encodeur, sont gratuits,
leur distribution n'est pas autorisée. D'autre part les formats
96.7 et 64.7 semblent poser quelques problèmes sur certaines machines.
Un autre avantage
du G2 est qu'il permet le multi-rate streaming, ce qui veut dire que le
bit-rate est adaptif, et fonction de la qualité de la liaison entre
l'émetteur et le récepteur. Toutefois cette fonction nécessite
un serveur spécifique.
liquid
audio <retour sommaire> <tableau>
-
Liquid
audio, n'est pas à proprement parler un format de compression,
puisqu'il en utilise plusieurs, y compris le MPEG. Son développement
a été réalisé par Texas, et Dolby Labs, à
la demande des compagnies de disques... Il s'agit d'enrayer le succès
du MP3: Au contraire du MP3 les fichiers L.A ne peuvent pas être
encodés par un amateur (jusqu'à quand ?), et ne peuvent être
dupliqués, même par un passage par l'analogique. Des "watermarks"
(filigranes) restants présents dans le data, qui indiquent l'origine
du fichier...
-
Les fichiers commerciaux chargeables
montrent un taux de compression de 6.5 ou 13 (700K/mn). En termes de qualité,
on est très proche du MP3 (à rapport de compression un peu
supérieur ).
-
Le développement
de LA est lié, au développement de la vente de musique en
ligne, et comparé au MP3 il offre l' emballage (photo de la pochette,
de l'artiste, lyrics et notes), le tout en capsulé dans un fichier
unique, le lecteur se chargeant d'afficher également l'emballage.
-
tout comme le RA-G2, le LA offre
le multi-rate streaming (adaptation de la vitesse de streaming en fonction
de la vitesse de transfert), mais au contraire du G2 le serveur n'est accessible
qu'aux sociétés de vente officielles. En règle générale
le streaming est fait en mono (en tous cas quand on ne dispose que d'un
modem 56kbps).
en
guise de résumé... <retour
sommaire> <tableau>
-
liquid-Audio n'étant
pas accessible à l'amateur, il n'offre aucun intérêt
dans le cadre de ce topo.
-
Les formats
de compression ADPCM ont pour principal avantage d'être lisibles
directement par windows sans ajout de codec, ou de lecteur particulier.
Toutefois, un taux de compression de 4 est aujourd'hui peu attrayant.
-
A mon avis le MPEG (wav ou MP3)
reste le format le plus intéressant pour la distribution "non commerciale"
sur "support dur" de fichier compressés: Ses
avantages sont: a)
Des lecteurs distribuables légalement -
b) Une conversion facile vers WAV pour le gravage de CD "maison"
-c) Une qualité très
proche de l'original avec un taux de compression de 11 -d)
Pas ou peu de problèmes liés à la machine. Les
inconvénients sont:
Mauvaise qualité aux taux de compression élevés ce
qui interdit le streaming aux vitesses modem même 56k.
-
A moins
qu'on ne dispose d'un accès meilleur que double ISDN, Real-Audio
G2 offre une bien meilleure performance pour les taux de compression élevés:
C'est le meilleur format pour le streaming à travers le net, car
il est possible de streamer même avec un modem 28.8. Ses avantages
sont: -a)
Excellent rapport qualité / taille -b)-
Lecteurs/ encodeurs chargeables gratuitement dans leur version de base.
Les inconvénient sont:- a) Lecture problématique en haute
qualité -b)
Lecteur non distribuable.
Il me semble donc judicieux
de préférer le MP3 pour la distribution sur support
dur (CD), et de préférer le Real-Audio pour tout ce qui touche
au net, qu'il s'agisse de streaming de download ou de fichiers transférés
par email.
tableau
récapitulatif <retour sommaire>
Notes:
Pour MPEG et RA, les chiffres qui apparaissent dans la colonne sample rate,
et bits/samples sont ceux du fichier WAV encodé.
Les
Notes sont subjectives. La qualité du son a été notée
en fonction de critères tels que brillance des aigus, clarté
du son, flange, bruit de fond, etc...
Les
formats qui me paraissent les plus intéressants apparaissent
sur fond gris.
format |
sample/rate
(kHz) |
bits/sample |
bit/rate |
stéréo |
taille (Ko/mn) |
rapport
de taille fichier |
commentaires |
note st. |
note mo. |
choix |
WAV-PCM |
44 |
16 |
n/a |
full |
10242 |
ref |
référence:
Qualité CD |
10 |
- |
très bien mais très
gros |
WAV-PCM |
44 |
16 |
n/a |
mono |
5122 |
2.0 |
qualité
CD mais mono |
- |
10 |
très
bien mais très gros |
WAV-PCM |
22 |
16 |
n/a |
full |
5122 |
2.0 |
qualité FM: manque
aigus |
9 |
- |
bcp trop gros pour qualité |
WAV-PCM |
22 |
8 |
n/a |
full |
2562 |
4.0 |
qualité
AM: manque aigus+bruit |
3 |
- |
très
très mauvais rapport q/t |
WAV-ADPCM |
44 |
16 |
n/a |
full |
2560 |
4.0 |
idem ref |
10 |
- |
très bien mais gros |
WAV-ADPCM |
22 |
16 |
n/a |
full |
1280 |
8.0 |
qualité
FM: manque aigus |
8 |
- |
trop
gros pour qualité |
WAV-ADPCM |
22 |
8 |
n/a |
full |
640 |
16.0 |
qualité AM: manque
aigus+bruit |
3 |
- |
très mauvais rapport
q/t |
WAV-ADPCM |
22 |
16 |
n/a |
mono |
640 |
16.0 |
qualité
FM: manque aigus /mono |
- |
7 |
pas
intéressant sauf compatibilité Windows |
MPEG/MP3 |
44 |
16 |
128 |
full |
928 |
11.0 |
idem
ref si encodage HQ |
9.8 |
- |
bon
rapport qualite/taille |
MPEG/MP3 |
44 |
16 |
128 |
J-st.
4bits |
928 |
11.0 |
quasi-idem
ref si encodage U-fast |
9.5 |
- |
bon
rapport qualite/taille si préssé |
MPEG/MP3 |
44 |
16 |
128 |
mono |
928 |
11.0 |
idem ref, mais aucun intérêt |
- |
9.9 |
le 64khz est un meilleur
choix |
MPEG/MP3 |
22 |
16 |
128 |
full |
928 |
11.0 |
qualité
FM, aucun intérêt |
7 |
- |
mauvais
rapport q/t |
MPEG/MP3 |
44 |
16 |
128 |
dual-mono |
928 |
11.0 |
qualité dégradée
aucun intérêt |
6 |
- |
très mauvais rapport
q/t |
MPEG/MP3 |
44 |
16 |
80 |
j-st
4bits |
580 |
17.7 |
très
légèrement dégradé |
9 |
- |
bon
rapport qualite/taille, mais RA plus petit |
MPEG/MP3 |
44 |
16 |
64 |
mono |
464 |
22.1 |
idem
ref si encodage HQ/ mono |
- |
9.8 |
meilleur
choix pour mono |
MPEG/MP3 |
44 |
16 |
64 |
J-st 4bits |
464 |
22.1 |
légèrement
dégradé |
8 |
- |
bon rapport qualité
/taille, mais RA plus petit |
MPEG/MP3 |
44 |
16 |
64 |
full |
464 |
22.1 |
plus
dégradé que Joint-stereo 4bits |
7 |
- |
moyen |
MPEG/MP3 |
22 |
16 |
64 |
full |
464 |
22.1 |
degrade+manque aigu, aucun
intérêt |
6 |
- |
mauvais rapport q/t |
MPEG/MP3 |
44 |
16 |
56 |
J-st
4bits |
406 |
25.2 |
légèrement
meilleur que 64 - st |
7 |
- |
assez
bon rapport taille qualité |
MPEG/MP3 |
44 |
16 |
48 |
mono |
348 |
29.4 |
manque peu d'aigus, son
un peu gargouilleux |
- |
7 |
choix moyen pour petit
fichier mono |
MPEG/MP3 |
44 |
16 |
48 |
j-st
4bits |
348 |
29.4 |
un
peu moins bon que mono |
6 |
- |
choix
moyen pour petit fichier stéréo |
MPEG/MP3 |
44 |
16 |
48 |
full |
348 |
29.4 |
nettement moins bon que
mono |
5 |
- |
assez mauvais rapport q/t |
MPEG/MP3 |
22 |
16 |
48 |
full |
348 |
29.4 |
encore
un peu moins bon |
4.5 |
- |
mauvais
rapport q/t |
REAL
AUDIO G2 |
44 |
16 |
97 |
ra-st |
746 |
13.7 |
bon (Câble modem
- corp. LAN) |
9.8 |
- |
lecture erratique sur P166 |
REAL
AUDIO G2 |
44 |
16 |
65 |
ra-st |
476 |
21.5 |
bon
(2x ISDN) |
9 |
- |
lecture
erratique sur P166 |
REAL
AUDIO G2 |
44 |
16 |
44 |
ra-st |
330 |
31.0 |
bon
(ISDN) |
8 |
- |
bon
rapport q/t- bit rate mini pour st. |
REAL
AUDIO G2 |
44 |
16 |
44 |
mono |
350 |
29.3 |
Excellent
(ISDN) |
- |
9 |
excellent
choix pour un fichier mono |
REAL AUDIO G2 |
44 |
16 |
32 |
ra-st |
234 |
43.8 |
qualité moyenne
(56k modem) |
6.5 |
- |
assez bon rapport taille
qualité |
REAL
AUDIO G2 |
44 |
16 |
32 |
mono |
234 |
43.8 |
assez
bon (56k modem) |
- |
8 |
bon
choix pour petit fichier mono / streaming |
REAL
AUDIO G2 |
44 |
16 |
20.7 |
ra-st |
164 |
62.5 |
médiocre (28.8modem) |
5 |
- |
préférer
le mono |
REAL
AUDIO G2 |
44 |
16 |
20.7 |
mono |
164 |
62.5 |
pas
mal... (28.8 modem) |
- |
7 |
excellent
rapport q/t. Bon choix pour streaming |
REAL AUDIO 5 |
44 |
16 |
32 |
ra-st |
234 |
43.8 |
qualité "ondes courtes" |
3 |
- |
A oublier depuis le G2 |
REAL
AUDIO 5 |
44 |
16 |
32 |
mono |
234 |
43.8 |
un
peu moins mauvais que st |
- |
4 |
A
oublier depuis le G2 |
REAL
AUDIO 3 |
44 |
16 |
15.2 |
mono |
114 |
89.8 |
très mauvais |
2 |
- |
trop mauvais pour quoi
que ce soit ! |
REAL
AUDIO 3 |
44 |
16 |
15.2 |
ra-st |
114 |
89.8 |
très
très mauvais |
- |
1 |
trop
mauvais pour quoi que ce soit ! |
Last Updated on 08/10/99
Copyright Destrem Patrick 1999: Toute utilisation
autre que strictement personnelle est soumise à accord préalable.
Email: patrick.destrem@libertysurf.fr
<retour sommaire page>
retour accueil