Contrôle actif d'écoulements décollés par jets pulsés - DUMAS
Mémoire : Le contrôle de la compression, de la prise de son au matriçage
Transcript of Mémoire : Le contrôle de la compression, de la prise de son au matriçage
Le contrôle de la compression, de la prise de son au matriçage
Une approche intégrée pour l’examen de problèmes relatifs à la perte de la gamme
dynamique causée par la compression lors du matriçage
Mémoire
Dragos Chiriac
Maîtrise sur mesure en réalisation audionumérique
Maître en musique (M.Mus.)
Québec, Canada
© Dragos Chiriac, 2014
iii
Résumé du mémoire
Dans le cadre de notre mémoire, nous nous intéressons aux moyens d‘obtenir des
niveaux de sonie élevés, particulièrement lorsqu‘une telle pratique est pertinente (dans
notre cas, pour la musique électronique et pour le hip-hop), soit des sons qui sont forts du le
point de vue de la perception (loudness), et ce, sans obtenir des distorsions relatives à
l‘écrêtage, soit la coupure horizontale d‘une amplitude, et sans perdre trop de gamme
dynamique, soit la diminution de l‘écart entre la valeur en dB la plus faible et la plus élevée
d‘une pièce (par l‘utilisation agressive de limiteurs/compresseurs).
Concrètement, nous tentons trois approches autonomes parallèles qui s‘inscrivent
dans cette méthode organique :
1) Concevoir la conception sonore en fonction de la perception du niveau de sonie ;
2) Contrôler dynamique des percussions en prévision de la compression ;
3) Mixer et matricer en même temps.
v
Abstract
This study is interested in the means of obtaining loud mixes, particularly in
musical genres where such practices are pertinent (electronic music and hip-hop, in our
case), while avoiding the usual disadvantages and defects of loud mixes. In other words, we
are seeking for ways to achieve loud tunes from the listener‘s subjective perception,
without encountering distortions caused by the squaring of the waves‘ amplitudes, usually
associated with the heavy usage of compressors and limiters, and without loosing to much
dynamic variety and/or dynamic range (the range between the lowest and the highest value
[dB] in a mix).
For these endeavours we have tried three different—yet parallel—autonomous
methods. These are:
1) Sound design in function of our subjective perception of loudness
(psychoacoustics);
2) Dynamic control of percussions for an efficient compression at the mastering stage;
3) Mixing and mastering at the same time.
vii
Table des matières
Résumé du mémoire .................................................................................................................................... iii
Abstract ......................................................................................................................................................... v
Table des matières ...................................................................................................................................... vii
Liste des Figures .......................................................................................................................................... xi
Liste des Tableaux ...................................................................................................................................... xv
Notes sur l’utilisation des fichiers fournis avec le mémoire .................................................................. xvii
Avant-propos ............................................................................................................................................. xix
Introduction .................................................................................................................................................. 1 Mise en contexte .............................................................................................................. 1
État de la recherche ......................................................................................................... 4
Problématique .................................................................................................................. 7
Méthodologie ................................................................................................................... 8
Chapitre 1 : Sur l’application de théories de la sonie lors de la conception sonore .............................. 11
Introduction ................................................................................................................................................ 11 Notre perception de la sonie .......................................................................................... 11
Méthode de recherche et hypothèses ............................................................................. 12
Tests, choix et justifications au stade de la conception sonore ..................................... 14
Test no1 (extrait de BWV 883) ...................................................................................... 17
Test no2 (Danse percussive 1) ....................................................................................... 19
Test no3 (Danse percussive 2) ....................................................................................... 20
Test no4 (Danse percussive 3) ....................................................................................... 21
Test no5 (House 90‘ #1) ................................................................................................. 22
Test no6 (Sax Trip-Hop 90‘) .......................................................................................... 23
Test no7 (House 90‘ # 2) ................................................................................................ 24
Test no8 (Filter French House 1) ................................................................................... 25
Test no9 (Filter French House 2) ................................................................................... 27
Test no10 (Filter French House 3) ................................................................................. 28
Test no11 (House percussif) ........................................................................................... 29
Test no12 (Dubstep) ....................................................................................................... 30
Test no13 (Danse Voix) ................................................................................................. 31
Test no14 (House 90‘ #3) ............................................................................................... 32
Test no15 (Filter French House #4) ............................................................................... 33
Informations préliminaires à l’analyse des données ................................................................................ 34 Constats ......................................................................................................................... 34
Quelles sont les données pertinentes à l‘analyse de nos tests? ...................................... 35
EBU R 128, ITU-R BS. 1770 (v. 1, 2 et 3) et EBU – Tech 3341-2 présentés en rafale 36
viii
La marge dynamique, une autre mesure avec ses propres standards pertinents pour
nous ............................................................................................................................... 40
Nos outils de travail ...................................................................................................... 41
Mesures ........................................................................................................................................................ 44 Mesures dynamiques des pistes au mix à l‘aide du TT-DR VST et du TT-DR Offline 44
Mesures soniques (Nugen LM) : Pistes Mix ................................................................. 45
Mesures soniques (Nugen LM) & dynamiques (TT DR) des pistes limitées ............... 46
Ajustements des fréquences après l‘augmentation de gain au limiteur ........................ 47
Tests de puissance acoustique au LANTISS (ULaval) ................................................. 51
Conclusion : analyse des résultats ............................................................................................................. 53 Versions A et B au mix ................................................................................................. 53
Versions A et B limitées ............................................................................................... 54
Sommaire ..................................................................................................................................................... 56
Chapitre 2 : Programmation des boucles et paramétrage du traitement de signal en vue du contrôle
de la dynamique des percussions ............................................................................................................... 57
Introduction ................................................................................................................................................ 57 Problématique ............................................................................................................... 57
Méthodologie ................................................................................................................ 59
La programmation de nos percussions en images ......................................................... 63
Le contrôle des crêtes .................................................................................................... 66
Collecte des données ................................................................................................................................... 68 Résultats avant compression : ....................................................................................... 68
Résultats après compression : ....................................................................................... 73
Interprétation des résultats : graphiques et commentaires ..................................................................... 80 Résultats primaires ........................................................................................................ 80
Les différentes variations : comparaison des versions à « groove » versus les versions
avec une programmation standard par la mesure de leur écart. .................................... 83
Écarts entre les Variations (« y » par rapport à « x ») : comparaison de la version
compressée latéralement par rapport à la version aux variations de vélocité ............... 86
Conclusion ................................................................................................................................................... 89 Portée des résultats ........................................................................................................ 89
La compatibilité initiale des échantillons ..................................................................... 89
Représentativité de notre échantillon statistique et efficacité des mesures .................. 89
Sommaire ..................................................................................................................................................... 92
Chapitre 3 : Mixage et matriçage simultanés ........................................................................................... 93
Mixer et matricer en même temps ............................................................................................................. 95
Analyse critique de cette méthode ............................................................................................................. 98
Écoute critique des pistes ayant été mixées/matricées ........................................................................... 100
ix
Dragos, Something about being a man ........................................................................ 102
Careful ....................................................................................................................................................... 106
Mesures comparatives des chansons mixées/matricées ......................................................................... 108
Sommaire .................................................................................................................................................. 110
Conclusion du mémoire ........................................................................................................................... 111
Bibliographie ............................................................................................................................................. 119
Annexes ..................................................................................................................................................... 123
Annexe 1 : le cas de l’article « ‘Dynamic Range’ & The Loudness War » .......................................... 123 Introduction ................................................................................................................. 123
Confusion des genres ................................................................................................... 124
Notre interprétation de la recherche ............................................................................ 125
Annexe 2 : Notre expérience en matriçage avec Serges Samson .......................................................... 127
xi
Liste des Figures
Figure 1 : Courbes isosoniques en fonction de la fréquence (Hz)..................................................................... 11 Figure 2 : Subtraktor, synthétiseur FM polyphonique additif (capture d‘écran) ............................................... 14 Figure 3 : Thor, synthétiseur polyphonique à trois oscillateurs (CÉ) ............................................................... 15 Figure 4 : Malström, synthétiseur granulaire à deux oscillateurs (CÉ) ............................................................. 15 Figure 5 : Big Meter de Reason en action, modes VU et Peak (CÉ) ................................................................ 16 Figure 6 : 1A WL (A = crêtes de la version originale) (CÉ) ............................................................................. 17 Figure 7 : 1B WL (B = crêtes de la version modifiée) (CÉ). ............................................................................ 17 Figure 8 : Changement d‘index (accentuant les harmoniques de l‘oscillateur en changeant le point de départ
de l‘échantillon du grain) (CÉ). ........................................................................................................................ 18 Figure 9 : Utilisation d‘une onde en dents de scie plutôt qu‘une onde de type sinusoïdale (moins riche en
harmoniques) (CÉ). ........................................................................................................................................... 18 Figure 10 : Allongement léger de la durée des notes MIDI, de manière à augmenter leur perception (CÉ). ... 18 Figure 11 : Ajustement du gain à la baisse via une programmation automatisant en même temps le volume de
tous les synthétiseurs de la piste (CÉ). .............................................................................................................. 18 Figure 12 : 2A WL. Amplitude des crêtes élevée, mais densité moindre que la version modifiée (CÉ). ......... 19 Figure 13 : 2B WL. Diminution de l‘amplitude des crêtes et augmentation de la densité (aire totale sous la
courbe) des amplitudes (CÉ). ............................................................................................................................ 19 Figure 14 : Augmentation du temps de déclin et légère compensation négative du gain (CÉ). ........................ 19 Figure 15 : 3A WL (CÉ) ................................................................................................................................... 20 Figure 16 : 3B WL. Maintien de l‘amplitude des crêtes, mais augmentation de leur densité (CÉ). ................. 20 Figure 17 : Léger ajustement du gain de sortie des modules à la baisse pour rester au même niveau RMS,
augmentation de la fréquence du filtre d‘enveloppe et augmentation du temps de relâchement (CÉ). ............ 20 Figure 18 : Rallongement des notes MIDI. ....................................................................................................... 20 Figure 19 : 4A WL (CÉ). .................................................................................................................................. 21 Figure 20 : 4B WL. La densité et l‘amplitude des nouvelles courbes similaires (CÉ). .................................... 21 Figure 21 : Compensation négative du gain et augmentation du temps de relâchement (CÉ). ......................... 21 Figure 22 : Changement de modulation pour plus d‘harmoniques (CÉ)........................................................... 21 Figure 23 : 5A WL (CÉ). .................................................................................................................................. 22 Figure 24 : 5B WL, la densité et les crêtes sont similaires (CÉ). ...................................................................... 22 Figure 25 : Augmentation du temps de déclin, de la fréquence du filtre d‘enveloppe, du nombre de cycles de
l‘onde modulée FM et compensation négative du gain (CÉ). ........................................................................... 23 Figure 26 : 6A WL (CÉ). .................................................................................................................................. 23 Figure 27 : 6B WL (CÉ). .................................................................................................................................. 23 Figure 28 : Changement d‘onde de l‘oscillateur et compensation négative du gain (CÉ). ............................... 24 Figure 29 : 7A WL (CÉ). .................................................................................................................................. 24 Figure 30 : 7B WL (CÉ). .................................................................................................................................. 24 Figure 31 : Changement de type d‘oscillateur (CÉ). ......................................................................................... 25 Figure 32 : 8A WL (CÉ). .................................................................................................................................. 25 Figure 33 : 8B WL. Les amplitudes sont similaires (CÉ). ................................................................................ 26 Figure 34 : Les oscillateurs sont automatisés pour plus d‘harmoniques (CÉ). ................................................. 26 Figure 35 : 9A WL (CÉ). .................................................................................................................................. 27 Figure 36 : 9B WL. Les amplitudes semblent légèrement moins denses (CÉ). ................................................ 27 Figure 37 : Augmentation des harmoniques (CÉ). ............................................................................................ 27 Figure 38 : 10A WL (CÉ). ................................................................................................................................ 28 Figure 39 : 10B WL. Les crêtes des amplitudes sont similaires (CÉ). .............................................................. 28 Figure 40 : Notes MIDI allongées (CÉ). ........................................................................................................... 28
xii
Figure 41 : augmentation des harmoniques (CÉ). ............................................................................................. 28 Figure 42 : 11A WL (CÉ). ................................................................................................................................ 29 Figure 43 : 11B WL. Légère augmentation de la densité des amplitudes (CÉ). ............................................... 29 Figure 44 : Compensation négative du gain, augmentation du temps de relâchement et augmentation des
harmoniques (CÉ). ............................................................................................................................................ 29 Figure 45: 12A WL (CÉ). ................................................................................................................................. 30 Figure 46: 12B WL. Les courbes demeurent stables alors que la sonie augmente (CÉ). .................................. 30 Figure 47 : Augmentation de la fréquence du filtre et changement d‘onde pour plus d‘harmoniques (CÉ). .... 30 Figure 48 : 13A WL (CÉ). ................................................................................................................................ 31 Figure 49 : 13B WL. Gain de sonie, conservation du niveau des amplitudes (CÉ). ......................................... 31 Figure 50 : Augmentation des harmoniques (CÉ). ............................................................................................ 31 Figure 51 : 14A WL (CÉ). ................................................................................................................................ 32 Figure 52 : 14B WL. Les amplitudes sont semblables et la sonie a augmenté (CÉ). ........................................ 32 Figure 53 : Allongement des notes MIDI et augmentation des harmoniques (CÉ). .......................................... 32 Figure 54 : 15A WL (CÉ). ................................................................................................................................ 33 Figure 55 : 15B WL. Les crêtes sont similaires et la sonie a augmenté (CÉ). .................................................. 33 Figure 56 : Compensation négative du gain, augmentation des harmoniques et allongement des notes MIDI. 33 Figure 57 : Oxford Limiter & Oxford EQ (CÉ). ............................................................................................... 42 Figure 58 : Exemples de courbes en affichage -6 dB à + 6dB (CÉ).................................................................. 42 Figure 59 : Nugen True Peak Meter & Nugen Loudness Meter (Mode EBU + 18FS) (CÉ). ........................... 42 Figure 60 : TT Dynamic Range Meter Offline et Online (CÉ). ........................................................................ 43 Figure 61 : Égaliseur 1A (CÉ). ......................................................................................................................... 47 Figure 62 : Égaliseur 1B (CÉ). .......................................................................................................................... 47 Figure 63 : Égaliseur 2A (CÉ). ......................................................................................................................... 47 Figure 64 : Égaliseur 2B (CÉ). .......................................................................................................................... 47 Figure 65 : Égaliseur 3A (CÉ). ......................................................................................................................... 47 Figure 66 : Égaliseur 3B (CÉ). .......................................................................................................................... 47 Figure 67 : Égaliseur 4A (CÉ). ......................................................................................................................... 47 Figure 68 : Égaliseur 4B (CÉ). .......................................................................................................................... 48 Figure 69 : Égaliseur 5A (CÉ). ......................................................................................................................... 48 Figure 70 : Égaliseur 5B (CÉ). .......................................................................................................................... 48 Figure 71 : Égaliseur 6A (CÉ). ......................................................................................................................... 48 Figure 72 : Égaliseur 6B (CÉ). .......................................................................................................................... 48 Figure 73 : Égaliseur 7A (CÉ). ......................................................................................................................... 48 Figure 74 : Égaliseur 7B (CÉ). .......................................................................................................................... 48 Figure 75 : Égaliseur 8A (CÉ). ......................................................................................................................... 48 Figure 76 : Égaliseur 8B (CÉ). .......................................................................................................................... 49 Figure 77 : Égaliseur 9A (CÉ). ......................................................................................................................... 49 Figure 78 : Égaliseur 9B (CÉ). .......................................................................................................................... 49 Figure 79 : Égaliseur 10A (CÉ). ....................................................................................................................... 49 Figure 80 : Égaliseur 10B (CÉ). ........................................................................................................................ 49 Figure 81 : Égaliseur 10A (CÉ). ....................................................................................................................... 49 Figure 82 : Égaliseur 11B (CÉ). ........................................................................................................................ 49 Figure 83 : Égaliseur 12A (CÉ). ....................................................................................................................... 49 Figure 84 : Égaliseur 12B (CÉ). ........................................................................................................................ 50 Figure 85 : Égaliseur 13A (CÉ). ....................................................................................................................... 50 Figure 86 : Égaliseur 13B (CÉ). ........................................................................................................................ 50 Figure 87 : Égaliseur 14A (CÉ). ....................................................................................................................... 50 Figure 88 : Égaliseur 14B (CÉ). ........................................................................................................................ 50
xiii
Figure 89 : Égaliseur 15A (CÉ). ....................................................................................................................... 50 Figure 90 : Égaliseur 15B (CÉ). ....................................................................................................................... 50 Figure 91 : Filtres communs dans la mesure des dB SPL ................................................................................. 51 Figure 92 : Programmation de boucles standard (CÉ). ..................................................................................... 63 Figure 93 : programmation de boucles aux vélocités variées (CÉ). .................................................................. 63 Figure 94 : Programmation de percussions avec compression latérale (CÉ). ................................................... 64 Figure 95 : Programmation du signal externe pour la compression latérale. .................................................... 64 Figure 96 : Synthétiseur générant le signal externe pour la compression latérale (CÉ). ................................... 65 Figure 97 : Compresseur pour le traitement latéral (CÉ). ................................................................................. 65 Figure 98 : Limiteur Oxford (CÉ). .................................................................................................................... 66 Figure 99 : Oxford EQ, Waves Trans X Wide & Oxford Limiter (CÉ). ........................................................... 67 Figure 100 : Pochette de Something about being a man ................................................................................. 102 Figure 101 : un logo de Careful ...................................................................................................................... 106
xv
Liste des Tableaux
Tableau 1 : Classification hiérarchique, par dossiers, des fichiers fournis avec le mémoire .......................... xvii Tableau 2 : Mesures dynamiques des pistes au mix à l‘aide du TT-DR VST et du TT-DR Offline ................. 44 Tableau 3 : Mesures soniques (Nugen LM) : Pistes Mix .................................................................................. 45 Tableau 4 : Mesures soniques (Nugen LM & dynamiques (TT-DR) des pistes limitées. ................................. 46 Tableau 5 : Ajustements des fréquences après l‘augmentation de gain du limiteur.......................................... 47 Tableau 6 : Tests de puissance acoustique au LANTISS (ULaval) .................................................................. 51 Tableau 7 : Résultats des tests de puissance acoustique au LANTISS ............................................................. 52 Tableau 8 : Boucles standard sans variation aux vélocités. .............................................................................. 68 Tableau 9 : Boucles avec variation de vélocités. .............................................................................................. 69 Tableau 10 : Boucles avec compression latérale externe (side-chain compression). ........................................ 70 Tableau 11 : [Avant compression] v. (variation) des versions à « groove dynamique » par rapport à la version
originale sans v. de vélocités, où « x » = à la v. de la version aux vélocités variées et « y » =à la v. de la
version latéralement compressée. Les « - » indiquent qu‘il y a eu un changement à la baisse quant à la gamme
dynamique et/ou une augmentation quant à la sonie dans le présent contexte. ................................................ 71 Tableau 12 : [Avant compression] V. (variation) des variations, « y » par rapport à « x ». Les « - » indiquent
qu‘il y a eu un changement à la baisse quant à la gamme dynamique et/ou une augmentation quant à la sonie
dans le présent contexte. ................................................................................................................................... 72 Tableau 13 : Boucles standard sans variations aux vélocités. ........................................................................... 73 Tableau 14 : Boucles avec variation de vélocités ............................................................................................. 75 Tableau 15 : Boucles avec copression latérale externe (side-chain compression) ............................................ 76 Tableau 16 : [Après compression] v. (variation) des versions à « groove dynamique » par rapport à la version
originale sans v. de vélocités, où « x » = à la v. de la version aux vélocités variées et « y » = à la v. de la
version compressée latéralement. Les « - » représentent qu‘il y a eu un changement à la baisse quant à la
gamme dynamique etùou une augmentation quant à la sonie dans le présent contexte. ................................... 77 Tableau 17 : (Après compression) V. (variation) des variations, « y » par rapport à « x ». Les « - » indiquent
qu‘il y a eu un changement à la baisse quant à la gamme dynamique et/ou une augmentation quant à la sonie
dans le présent contexte. ................................................................................................................................... 78 Tableau 18 : dB RMS intégrés selon la fréquence des résultats. ...................................................................... 80 Tableau 19 : dB RMS intégrés, fréquence des résultats (après compression). .................................................. 80 Tableau 20 : Gamme dynamique intégrée en dB FS selon la fréquence des résultats. ..................................... 81 Tableau 21 : Gamme dynamique intégrée en dB FS selon la fréquence des résultats (après compression) ..... 81 Tableau 22 : Sonie intégrée en LUFS (EBU + 18) selon la fréquence des résultats. ........................................ 82 Tableau 23 : Sonie intégrée en LUFS (EBU + 18) selon la fréquence des résultats (après compression) ........ 82 Tableau 24 : dB RMS intégrés selon la fréquence des résultats. ...................................................................... 83 Tableau 25 : dB RMS intégrés selon la fréquence des résultats (après compression) ...................................... 83 Tableau 26 : Gamme dynamique intégrée en dB FS selon la fréquence des résultats. ..................................... 84 Tableau 27 : Gamme dynamique intégrée en dBFS selon la fréquence des résultats (après compression). ..... 84 Tableau 28 : Sonie intégrée LUFS (EBU + 18) selon la fréquence des résultats. ............................................. 85 Tableau 29 : Sonie intégrée LUFS (EBU + 18) selon la fréquence des résultats (après compression) ............. 85 Tableau 30 : dB RMS intégrés selon la fréquence des résultats. ...................................................................... 86 Tableau 31 : dB RMS intégrés selon la fréquence des résultats (Après compression) ..................................... 86 Tableau 32 : Gamme dynamique intégrée en dB FS selon la fréquence des résultats. ..................................... 87 Tableau 33 : Gamme dynamique intégrée en dB FS selon la fréquence des résultats (après compression). .... 87 Tableau 34 : Sonie intégrée en LUFS (EBU + 18) selon la fréquence des résultats. ........................................ 88 Tableau 35 : Sonie intégrée en LUFS (EBU + 18) selon la fréquence des résultats (après compression). ...... 88 Tableau 36 : Comparaisons de gamme dynamique et niveau maximum ........................................................ 108
xvii
Notes sur l’utilisation des fichiers fournis avec le mémoire
En plus du présent document, le mémoire est accompagné de 311 fichiers audio et
de 3 feuilles de calculs Microsoft Excel réalisés par son auteur. Les fichiers audio fournis
(format wav 16 bits/44,1 kHz pour les chapitres 1 et 2, puis format mp3 320 kb/s pour le
chapitre 3) sont divisés par chapitres. Les dossiers fournis sont nommés sans accents pour
une meilleure compatibilité sur des systèmes de langues différentes. Visuellement, nous
obtenons une classification hiérarchique des dossiers, du plus général au plus spécifique :
Tableau 1 : Classification hiérarchique, par dossiers, des fichiers fournis avec le mémoire
Les noms propres de chaque fichier audio fourni correspondent exactement aux
mêmes noms auxquels nous nous référons tout au long de ce mémoire (figures, texte et
tableaux), afin d‘éviter toute forme d‘équivocité. Par exemple, si nous nous référons au test
audio sans variation de vélocités no 11, après compression, au chapitre 2, le chemin d‘accès
à ce dernier sera « ... Fichiers/Chapitre 2/Audio/Tests apres compression/Tests sans
variation de velocites/11.wav ». En ce qui concerne les trois fichiers Excel fournis dans le
dossier « Calculs Excel », ceux-ci sont tous identiques, mais de formats différents pour une
compatibilité avec divers systèmes (Mac en format csv, MS-DOS en format csv et Excel en
format Feuille de travail Microsoft Excel). Plusieurs tableaux du chapitre 2 de ce document
ont été extraits directement de ces feuilles de calcul. Ces tableaux conservent des titres
Fichiers
Chapitre 1
Tests avant compression
Tests apres compression
Chapitre 2
Calculs Excel Audio
Tests avant compression
Tests avec variation de
velocites
Tests compression
laterale
Tests sans variation de
velocites
Tests apres compression
Tests avec variation de
velocites
Tests compression
laterale
Tests sans variation de
velocites
Chapitre 3
Audio
xviii
identiques d‘un document à un autre, afin que le lecteur puisse consulter les données, ainsi
que les formules de calculs, qui ont permis l‘atteinte de nos résultats. Finalement, l‘écoute
des fichiers et la consultation des feuilles de calculs n‘est pas obligatoire ou nécessaire à la
compréhension des idées avancées dans ce mémoire : les fichiers sont un extra pour les
lecteurs qui souhaitent comparer de manière critique leur écoute à celle de l‘auteur.
xix
Avant-propos
Les groupes qui sont concernés par cette étude sont nombreux, car quiconque
travaille un peu dans le domaine de l‘audionumérique pourra y trouver quelque élément
pertinent; soit dans les étapes de la réalisation par la compréhension de principes soniques
divers ou soit dans le processus de création par l‘élaboration d‘une méthode de travail
harmonique avec, ou facilitant, les processus de réalisation et de postproduction pour de
meilleurs résultats finaux en terme de qualité sonore (en maintenant une sonie élevée tout
en diminuant l‘écrêtage et la perte de gamme dynamique). D‘une manière globale, nous
désirons que les techniques utilisées demeurent assez accessibles pour le compositeur,
souhaitant davantage aborder l‘aspect technique de la composition et non de faire d‘un
réalisateur compositeur un technicien.
1
Introduction
Mise en contexte
Notre première rencontre avec la sonie (loudness) a eu lieu lorsque, en tant que jeune
compositeur/réalisateur de musique électronique, nous avons comparé nos chansons aux
titres commerciaux que nous avions l‘habitude d‘écouter. Comme plusieurs néophytes
avant nous, nous nous sommes senti frustré de réaliser que nos propres créations musicales
n‘étaient pas aussi larges, aussi vivantes et puissantes que les titres commerciaux. Nous
avons compris, avec Rick Snoman, que si le niveau de sonie de nos pièces n‘était pas aussi
élevé que celui des autres enregistrements, nos pièces n‘allaient pas être aussi
impressionnantes1.
La sonie en soi n‘est pas pertinente, mais elle le devient lorsque nous comparons
plusieurs sonies; cela signifie que notre expérience d‘un son ayant une intensité de 60dB
SPL (Sound pressure level), par exemple, peut être influencée par une exposition préalable
à un son de 80dB SPL2. Lorsque nous comparons des albums ou des pièces de musique
d‘artistes différents, certains nous paraissent plus forts du point de vue du niveau sonore, et
ce, sans que nous ayons changé le niveau du « volume » de notre radio, de notre lecteur
DC, de notre lecteur mp3… Jim Johnston, un chercheur en psychoacoustique renommé, a
démontré que l‘effet d‘une augmentation de 3dB, comparativement à une diminution de
3dB (et ce, pour une même source), était perçu comme un plus grand changement
d‘intensité sonore, en comparant les temps d‘attaque et de relâchement des cellules ciliées
excitées (cellules de l‘oreille interne)3. Aussi, une telle comparaison a des conséquences sur
notre perception de certaines fréquences, notamment les très basses (< 100 Hz) et les très
hautes (>10 kHz). Globalement et sommairement, plus la sonie d‘une pièce est élevée, plus
notre perception de ces deux bandes extrêmes de fréquences sera accentuée. Autrement dit,
plus la sonie d‘une pièce est élevée par rapport à d‘autres, plus celle-ci nous paraitra
vivante. Pour des auteurs-compositeurs de musique dansante (comme l‘auteur de ce
mémoire), il est primordial de s‘intéresser à ce phénomène si nous voulons pouvoir fournir
aux auditeurs une musique à la hauteur de son office. Ainsi, ce travail se positionne
1 Rick Soman, The Dance Music Manual, 2
e édition (Oxford: Focal Press, 2009), 399.
2 Thomas D. Rossing, Springer Handbook of Acoustics, (Stanford: Springer, 2007), 468.
3 Bob Katz, « About the loudness war pt.1 », présentation savante AES 2009, 00:02:29, web.
2
parfaitement dans ce contexte très actuel, car la comparaison est omniprésente dans
l‘écoute des amateurs de musique d‘aujourd‘hui, lesquels consomment plus que jamais des
compilations, notamment en raison de la popularisation et de la facilité du partage du léger
format mp34.
Nous nous sommes mis alors à chercher des moyens pour atteindre des niveaux de
sonie plus efficaces pour les appliquer à nos propres pièces musicales avec la conviction
que les gains en sonie aideraient notre musique à se démarquer dans le contexte de
l‘émergence des studios maison et des nouveaux réseaux de distribution sur Internet. Nous
avons découvert qu‘il existait plusieurs moyens d‘atteindre ces niveaux, et que, depuis le
milieu des années 1980, et en particulier depuis 2000, on observe sur le plan dynamique
une recherche constante d‘une sonie de plus en plus élevée, notamment dans le but de se
démarquer de la concurrence5. Avec toute la compétition face à laquelle les musiciens
doivent faire face, il est compréhensible que ces derniers veuillent bénéficier de tous les
outils pouvant les faire ressortir du lot, surtout lorsqu‘il s‘agit de genres musicaux où une
forte sonie est pertinente, comme pour la musique « dance » par exemple.
Généralement parlant, ces outils (compresseurs, limiteurs, exciteurs harmoniques,
modulateurs de transitoires, etc.) fonctionnaient d‘une manière très similaire lorsqu‘ils
étaient employés pour augmenter la sonie d‘une pièce musicale : ils augmentaient les
niveaux moyens des crêtes en dB RMS. En fait, cette description correspond parfaitement à
la définition de la sonie dans le domaine de la psychoacoustique, qui est associée avec la
présence d‘une moyenne élevée des niveaux des crêtes, ou, autrement dit, d‘une densité
importante de l‘aire sous la courbe des crêtes6. Il y a, toutefois, d‘autres facteurs, comme la
durée/maintien d‘un son et son timbre/fréquence qui influencent notre perception de sa
sonie (voir chapitre 1).
4 Il est à noter que nous souhaitons simplement explorer les possibilités et les limites dans les pratiques
audionumériques visant des sonies élevées. Nous prendrons position sur la pertinence de celles-ci, comme l‘a
déjà fait une pléthore d‘auteurs... lors de la conclusion du mémoire. 5 Pour une description de l‘escalade des dernières décennies dans les pratiques réduisant la gamme dynamique
pour obtenir une sonie plus forte, voir Bob Katz, Mastering Audio : The Art and the Science, (New York,
Focal Press, 2002), 271-278. 6 David Howard M. et Jamie Angus, Acoustics and psychoacoustics, 3
e édition (Elsevier, Focal Press, 2006),
15.
3
Une fois que nous avions trouvé les outils qui allaient nous procurer la sonie élevée
désirable pour la musique « dance », nous les avons tous utilisés en même temps, d‘une
manière déraisonnable bien entendu, sur nos mix stéréo. Disons simplement, afin d‘être
poli envers nous-même, que le résultat était affreux. Nous avons alors mis un frein à nos
ardeurs en réduisant la compression globale du bus maitre, mais le résultat ne fut pas
encore tout à fait satisfaisant. En rehaussant les niveaux moyens, l‘harmonie entre les
niveaux des éléments avait été significativement déséquilibrée en envoyant des éléments de
l'arrière-plan vers l'avant plan de la scène virtuelle. Les compresseurs eurent l‘effet fâcheux
d‘augmenter le niveau des sections calmes, diminuant ainsi le contraste normalement
attendu entre ces sections et les plus fortes (comme les refrains par exemple). Nous
souhaitions que nos basses soient plus claires et intenses, mais elles étaient brouillées. Nous
voulions que les éléments harmoniques et les éléments percussifs soient plus percutants,
mais nous avions perdu toutes nos dynamiques; tout semblait agressif et monotone. Nous
voulions que nos voix soient cristallines et mises à l‘avant, mais il n‘y avait que des
distorsions. Afin de corriger ces problèmes, nous avions utilisé des égaliseurs dans le but de
rectifier les hernies sonores rebelles, causées par la compression agressive (régulièrement
autour des graves à < 80 Hz et ses harmoniques, des moyennes-basses fréquences boueuses
à 120 - 150 Hz et leurs harmoniques et des hautes fréquences agressives à 1.2 – 5 kHz)7. Ici
encore nous n‘étions pas satisfait. En corrigeant l‘agressivité des voix, nous avions
également diminué le niveau de nos cymbales-à-pied (hi-hats en anglais) et de nos autres
instruments aigus. En supprimant le surplus de graves de nos basses, nous avions également
atténué l‘aspect percussif de nos grosses caisses. En diminuant les moyennes-basses
boueuses, nous avions perdu la chaleur et le corps de nos chansons. Nous étions alors
directement, quoique maladroitement, en contact avec le travail de l‘ingénieur en pleine
activité de matriçage.
Traditionnellement, le rôle de l‘ingénieur de matriçage est de donner une cohérence à
un ensemble d‘enregistrements (le plus souvent constituant un album), cohérence qui se
manifeste principalement sur les plans spectral (équilibre des fréquences d‘une pièce à
7 Mike Senior, Mixing secrets for the small studio, (Elsevier, Focal Press, 2011), 240.
4
l‘autre)8 et dynamique (uniformité du niveau sonore de l‘ensemble des pièces)
9. Or, pour
obtenir l‘effet désiré, l‘ingénieur doit augmenter le niveau moyen des enregistrements en
utilisant des compresseurs et des limiteurs, lesquels, paradoxalement, génèrent des artéfacts
indésirables comme des distorsions et la perte de nuances dynamiques10
. En rehaussant les
niveaux moyens, l‘équilibre des éléments des mix peuvent aussi être significativement
déséquilibrés : il est fréquent que des éléments destinés à être situés à l‘arrière-plan soient
augmentés de manière disproportionnelle, ce qui les ramène à l‘avant de la scène sonore
virtuelle11
. Comme nous l‘avons déjà évoqué, les compresseurs auront aussi l‘effet fâcheux
d‘augmenter le niveau des sections calmes, diminuant d‘autant le contraste normalement
attendu entre ces sections et les plus fortes (comme les refrains par exemple). L‘ingénieur
de matriçage doit alors travailler en tenant compte des effets pervers de ses outils afin de
minimiser certains artéfacts indésirables. Résultat? Pour que le matriçage génère les
niveaux de sonie souhaités, on accepte de plus en plus de distorsions, une perte croissante
des nuances dynamiques et une altération de l‘équilibre par rapport aux mix d‘origine.
L‘ingénieur tente alors de minimiser ces problèmes par d‘autres effets globaux, qui,
lorsqu‘ils aident, contribuent tout de même à altérer l‘équilibre original des mix. Pour Bob
Katz, la plus célèbre autorité sur le sujet, plusieurs enregistrements qui nous sont
contemporains sonnent moins bien que les enregistrements des années 197012
.
État de la recherche
Au début de l‘année 2013, nous avons adressé une question aux techniciens animateurs
du HomeRecordingShow, une très populaire émission audio spécialisée sur la réalisation
audionumérique dans les studios maison : « would you be willing to have a show on
loudness and the problems related to dynamic reduction… and how it is possible to avoid
them and still obtaining a loud mix ? ». À notre avis, la réponse reçue reflète bien
l‘approche habituelle des ingénieurs envers la résolution des problèmes causés par la
réduction de la marge dynamique au matriçage : « Is that a recording riddle ?... We
definitely talked about the negative aspects of loudness, but not how to overcome it, other
8 David Moulton, Total recording : The complete guide to audio production and engineering, (Etats-Unis,
Kendall Printing, 2000), 402. 9 Katz, Mastering Audio, 11-12 et 87-88.
10 Thomas Lund, « Loudness Wars pt. 1 », présentation savante à Rome Calling, 2011, web.
11 Roey Izhaki, Mixing audio, Concepts, Practices and Tools, (Burlington, Focal Press, 2008), 327.
12 Katz, Mastering Audio, 271-278
5
than ‗don‘t make it loud‘, ‗make it dynamic‘ ». Cet avis de type « condamnant » envers la
compression est également partagé par les autorités les plus réputées actuellement sur la
question de la sonie, de la réduction de la marge dynamique et de leurs inconvénients
(Katz, Lund, Tischmeyer). « The problem is that dynamic range in pop music has become
an increasingly rare phenomenon, due to the fruitless volume wars and pressure from A&R
to make a record that can get through the noise », déplore Katz13
. Tischmeyer, lui, suggère
de préserver des niveaux de gamme dynamique qui nous semblent assez atteignables et
réalisables. Toutefois, ses suggestions de dynamique en fonction des styles musicaux
consistent à tenter d‘éviter la compression, sans proposer de solutions pour minimiser les
effets de la compression14
. Lund, l‘autorité la plus importante en matière de mesure de la
sonie et de la gamme dynamique (il a notamment collaboré avec TC Electronics à
l‘élaboration des documents techniques EBU R 128 dont nous expliquons au premier
chapitre), quant à lui, propose de préserver la dynamique d‘une pièce musicale à un niveau
encore plus élevé que Tischmeyer, soit à un niveau de -23 LUKFS de gamme de sonie.
Bien qu‘il apporte des points extrêmement pertinents sur la compression des formats audio
(mp3 par exemple) et sur la préservation d‘un seuil entre le signal sonore et la limite de
0 dB FS (headroom) plus grand que la moyenne, son approche consiste essentiellement à
ne pas diminuer la gamme dynamique (autant que possible), pour se rapprocher d‘un
niveau semblable à celui du milieu des années 198015
. Sans une législation pénalisante pour
les pièces musicales ayant une sonie élevée, une solution populaire que nous ne jugeons pas
idéale (voir la conclusion), il nous semble qu‘une gamme de sonie de -23 LUKFS n‘est ni
réalisable (compte tenu du contexte compétitif actuel), ni idéale à l‘application musicale (le
public visé par les normes du EBU R 128 est surtout celui de la télévision), ni souhaitable,
car un niveau élevé de sonie nous apparait pertinent dans des genres comme la musique
dansante. Ainsi, et malgré l‘expérience et le grand esprit de synthèse des autorités que nous
venons de nommer, ces derniers n‘explorent pas les possibilités de réaliser des pièces
musicales compressées ayant une sonie élevée, tout en évitant le plus possible les
problèmes reliés à l‘utilisation « agressive » de compresseurs et de limiteurs. Bref, plutôt
13
Katz, Mastering Audio, 265. 14
Pleasurize Music Foundation, web. 15
Thomas Lund, « Loudness : The Quest for the Holy Grail », présentation savante, Audio Engineering
Society, 121e convention, 5 oct. 2006, 7, web.
6
que de tenter de contrôler la compression et ses effets pervers, les autorités dans le domaine
de la réalisation audionumérique et du matriçage préfèrent l‘éviter, lorsque leurs clients
sont enclins à écouter leurs bons conseils.
Un autre aspect essentiel de l‘état de la recherche sur la compression à l‘étape du
matriçage est que les standards et les outils (décrits en détail au premier chapitre) pour
mesurer d‘une manière quantitative les mesures de psychoacoustique que sont la gamme
sonique et la sonie sont très récents et pas tout à fait destinés à être appliqués à la mesure de
pièces musicales. Nous utilisons plusieurs de ces outils et standards au long des trois
chapitres du mémoire et nous arrivons à la conclusion qu‘ils ne sont pas assez précis et que,
dans bien des cas, l‘observation subjective semble plus appropriée pour décrire la sonie
d‘une pièce. Lors de notre conclusion, nous avançons l‘hypothèse selon laquelle il existe un
problème structurel dans le fait de chercher à exprimer des expériences subjectives comme
la sonie en termes quantitatifs. Cela peut expliquer l‘état embryonnaire des standards et des
outils de mesure actuels (formulés à partir de 2006 avec le document technique ITU BS
1770-1, que nous expliquons au premier chapitre). D‘ailleurs, l‘auteur de Acoustics and
hearing, Peter Damaske, nous semble très pertinent à ce propos :
The history of science shows that the investigation of an acoustical phenomenon usually
begins with purely physical methods. Later on, when sufficient amounts of knowledge
have been acquired, properties of the auditory system may be more and more taken into
account. The slow scientific acquisition of the term loudness is a good example of this
process. Its present precision could be achieved only over a period of more than 100
years.16
Ainsi, lorsque nous nous intéressons à la recherche sur la compression au matriçage dans le
but d‘obtenir des mix aux niveaux de sonie élevés, en plus de n‘avoir de solutions pratiques
pour limiter les effets indésirables de la réduction de la marge dynamique, il faut garder à
l‘esprit que la recherche pour la mesure de la sonie demeure très nouvelle, assez mal
comprise et, la plupart du temps, non destinée à mesurer la sonie des pièces musicales (on
vise davantage la télévision). Il est sans doute essentiel de garder un esprit critique et de
faire confiance à sa propre écoute subjective, tout en cherchant à confirmer nos propres
observations à l‘aide de données empiriques, puisque la recherche sur la mesure de la sonie
16
Peter Damaske, Acoustics and Hearing, (Berlin, Springer, 2008), 70.
7
et des moyens à prendre pour éviter ses effets désavantageux dans des pièces musicales
n‘est pas encore mature.
À propos des problèmes relatifs à la mesure de la sonie et de la gamme de sonie,
nous consacrons également quelques pages à la critique de plusieurs conclusions de
monsieur Emmanuel Deruty, auteur de l‘article « Dynamic Range » & The Loudness War
paru en 2011 dans la revue SoundOnSound, dans lequel, à l‘aide d‘une application douteuse
des nouveaux standards de mesure de la sonie des documents EBU et ITU, il parvient à la
conclusion (peu partagée) selon laquelle les pistes de musique qui nous sont
contemporaines ont une marge dynamique supérieure à celle des pistes des années 1960-
199017
. Deruty condamne également les pratiques de compression en vue d‘un niveau de
sonie élevé pour les distorsions engendrées (il donne Metallica en exemple), mais, à la
lumière de sa recherche en laquelle nous n‘avons pas confiance, il ne les condamne pas
pour leur réduction de la gamme dynamique, mais pour les distorsions qu‘elle peut
engendrer. En somme, il n‘y a actuellement pas de recherches, dans le « jeune » domaine
de la mesure de la sonie des pièces musicales audionumérique, visant à éviter les effets
pervers de la compression tout en tentant d‘obtenir des mix ayant une sonie élevée. La
littérature sur le sujet associe plutôt la réduction de la marge dynamique et une sonie élevée
à la perte de qualité d‘un signal audio.
Problématique
Comme le suggère l‘état général de la recherche qui précède, lorsqu‘on aborde les
problèmes reliés à la compression, les auteurs se contentent presque toujours de déplorer la
situation actuelle en condamnant, à des degrés différents, les pratiques de réduction de la
gamme dynamique. En fait, plutôt que d‘envisager ce phénomène comme une lacune ou un
problème, nous souhaitons apporter un savoir positif en proposant une approche
intégrée/organique des processus de réalisation audionumérique de la conception sonore, du
mixage et du matriçage : à la lumière d‘expériences décrites aux chapitres 1 à 3 et de la
littérature scientifique qui traite séparément de chaque étape du processus de création d‘une
œuvre musicale (la maison d‘édition Focal propose de nombreux ouvrages auxquels nous
nous rapportons tout au long de notre mémoire), nous croyons qu‘il est possible de
17
Emmanuel Deruty, « ‗Dynamic Range‘ & The Loudness War », SoundOnSpund, septembre 2011, web.
8
remédier de manière significative à plusieurs des désavantages de la compression audio lors
du matriçage, et ce, sans devoir se soustraire au contexte des attentes actuelles de la
réception plus haut. Nous abordons ainsi toutes nos expériences de la conception sonore
(chapitre 1), de programmation de percussions (chapitre 2) et du mixage/matriçage
(chapitre 3) avec la question suivante en esprit : Dans quelle mesure est-il possible de
minimiser significativement les désavantages liés à la compression du matriçage? Plus
précisément, il s‘agira de voir comment un travail de sculpture du son dès les étapes
préliminaires de réalisation peut contribuer à obtenir une sonie élevée sans avoir à passer
par une compression élevée au moment du matriçage et il s‘agira de voir, lorsqu‘il y aura
compression au matriçage, de voir de quelle manière on peut réduire les effets indésirables
de la réduction de la gamme dynamique tout en maintenant une sonie élevée.
Méthodologie
De manière générale, nous utilisons des outils assez accessibles et génériques, afin
que les résultats de l‘étude puisse, autant que possible, être indépendants des outils dont
nous nous sommes servis : il s‘agit de plug-ins numériques classiques (compresseurs,
limiteurs, égaliseurs...) et non d‘effets ésotériques rares limités à une seule compagnie
d‘outils audionumériques. Le même principe est appliqué lorsqu‘il s‘agit des synthétiseurs
et des autres instruments virtuels programmés en MIDI dans les logiciels que nous utilisons
(Ableton Live 8 et Propellerhead Reason 5). La nature exacte des effets et des instruments
est expliquée au cours des chapitres qui suivent.
Le corpus de la recherche est composé de nos propres pièces, ce qui nous permet de
distribuer la recherche pour une sonie élevée sur l‘ensemble des grandes étapes de la
production phonographique. Au premier chapitre, nous tentons d‘augmenter la sonie de 15
extraits de musique dansante réalisés à l‘aide du logiciel Propellerheads Reason 5 en
altérant un à la fois les paramètres d‘un synthétiseur. La nature de ces altérations est
expliquée en détail pour chacun des exemples. Nous comparons alors la sonie de ces 15
extraits de musique électronique réalisés dans notre studio maison à leurs doubles originaux
non altérés pour terminer avec un corpus de 30 extraits au premier chapitre. Au deuxième
chapitre, nous comparons un corpus de 240 extraits audio de percussions de musique
dansante, programmées par nous-mêmes et réalisées dans notre studio maison avec le
9
logiciel Ableton Live 8, avant et après la compression. Nous comparons particulièrement
40 programmations standard sans variations de vélocité18
avec 40 programmations avec
variations de vélocité pour générer un effet de « groove dynamique » et 40 programmations
avec une variation dynamique fabriquée à l‘aide d‘une compression latérale externe (side-
chain compression en anglais) pour accentuer les contretemps, le tout, avant et après
l‘application d‘une réduction de la marge dynamique sur chaque type de programmation
pour une augmentation de la sonie. La nature exacte de chaque programmation et de chaque
compression est expliquée en détail au cours de ce chapitre. Au troisième et dernier
chapitre, nous travaillons avec un corpus de 11 chansons réalisées par nous-mêmes dans
une régie du LARC (Laboratoire audionumérique de recherche et de création, Université
Laval) en les mixant et matriçant en même temps, dont 8 sont des chansons complètes de
musique dansante (parues sur l‘album Sometthing about being a man en 2013) et dont 3
sont des chansons de musque hip-hop (chansons seules pour notre projet hip-hop nommé
Careful). Ces chansons sont toutes réalisées, mixées et matricées avec le logiciel Ableton
Live 8. Au total, on compte 281 échantillons audio décrits en détail au fur et à mesure du
mémoire. Tous nos exercices sont abordés avec une approche psychoacoustique. La sonie,
la perception subjective du niveau de puissance sonore d‘une chanson, d‘un film, d‘une
publicité, etc., est notamment un concept fondamental de notre recherche. L‘aspect spectral
de la sonie est abordé selon l‘héritage des premières recherches psychoacoustiques de
Fletcher-Munson alors que les aspects de dynamique et de mesure de la sonie sont abordés
selon les récents documents techniques ITU 1770, EBU Tech 3341 et EBU R 128 : il d‘agit
présentement des autorités les plus sérieuses dont nous disposons. Nous entamons
d‘ailleurs le premier chapitre en abordant la littérature psychoacoustique, puis nous
expliquons en détail le contenu des théories sur la mesure quantitative de la sonie au fur et à
mesure du mémoire, lorsque l‘utilisation de ces dernières est utile ou nécessaire.
En somme, nous distribuons le travail lié au matriçage sur l‘ensemble de quelques
grandes étapes de production phonographique pour minimiser les inconvénients reliés à une
pratique visant une forte sonie. Le format qui en résulte a les allures d‘un rapport de
laboratoire commenté axé sur une méthodologie permettant de trouver des moyens de 18
La plupart du temps, pour les stations de travail numériques, le contrôle de vélocité est divisée en 127
incréments.
10
mesurer et de confirmer nos observations. Nous fournissons, en plus de ce texte, autour de
281 extraits audio en format. wav et mp3, puis deux feuilles de calculs Excel pour
permettre au lecteur, s‘il le désire, de vérifier nos calculs.
11
Chapitre 1 : Sur l’application de théories de la sonie lors de la conception sonore
Introduction
Notre perception de la sonie
La sonie est perçue d‘une manière très particulière qui consiste à faire un mélange
subjectifs de plusieurs facteurs audibles : la pression sonore (dB SPL), la fréquence des
éléments (Hz) et la durée des éléments19
. On le constate que notre perception de la sonie est
non linéaire lorsqu‘on examine une illustration des courbes Fletcher-Munson corrigées (ou
courbes isosoniques), lesquelles expriment de manière approximative des relations entre la
pression sonore (dB SPL au point de référence de 20 µPa) et notre perception du niveau
sonore, la sonie (exprimée en Phon – unité de mesure de la sonie pour les tons purs/ondes
sinusoïdales en cycles par secondes [c/s ou Hz]) selon les fréquences des stimulus sonores
(Hz) 20
Figure 1 : Courbes isosoniques en fonction de la fréquence (Hz)21
Il s‘agit simplement d‘exprimer la compensation nécessaire en dB à une fréquence
pour une pression donnée par rapport à une autre fréquence pour que les deux soient
perçues au même niveau ou, si nous le reformulons à l‘envers, il s‘agit d‘exprimer la
différence en dB pour deux fréquences différentes perçues au même niveau sonore (ou
ayant la même sonie). Par exemple, 1 kHz à 80 dB aura la même sonie que 50 Hz à 92 dB,
19
Thomas Lund, Loudness : The Quest for the Holy Grail, 8, web. 20
Bogh Brixen, Eddy, Audio Metering, Measurements, standards and practice, 2e édition, (Oxford, Focal
Press, 2011), 51. 21
Lindosland, Equal loudness contours, Wikimedia Commons.
12
et le rapport entre les deux puissances est de type logarithmique, ce qui signifie que l‘écart
entre les deux valeurs est très élevé selon le point de vue des instruments de mesure. Il est
possible de démontrer la même relation, entre la perception de la puissance sonore d‘une
source en fonction de la fréquence de celle-ci, en procédant par la méthode de Zwicker.
Toutefois, ce dernier prend en compte des facteurs plus pointus en précision : le son frontal
direct par rapport au son dans un champ diffus et sa fréquence (1/3 d‘octave par Phon
lorsque le rapport entre deux fréquences est de X<Y, sinon les valeurs sont reliées par des
traits parallèles aux courbes logarithmiques inverses lorsque le rapport entre deux
fréquences est de X>Y22
). Par exemple, et pour comprendre facilement cette méthode, si
nous traçons une ligne à 60 Phon pour toutes les fréquences, nous obtenons une courbe
presque identique à celle du tableau corrigé de Fletcher-Munson. Bref, notre audition est
non linéaire. Nous est-il alors possible de bénéficier des particularités de notre système
auditif pour favoriser notre capacité à percevoir nos propres pièces musicales? Est-ce que
de telles considérations pourraient nous permettre d‘éviter ou de diminuer notre recours à
l‘augmentation du niveau moyen des crêtes?
Méthode de recherche et hypothèses
Notre méthode de recherche consiste à transposer certains principes théoriques tirés
d‘ouvrages sur l‘acoustique et de la psychoacoustique pour les appliquer dans un contexte
pratique de composition audionumérique, afin de voir quelles sont les limites et les
possibilités de leurs applications pour éviter le recours à la compression pour augmenter le
niveau de sonie d‘une pièce. Concrètement, nous voulons exploiter le fonctionnement de
notre système d‘audition, qui est, pour des raisons physiques et psychologiques,
discriminatoire envers certains types de sons (notamment les sons d‘une durée de moins de
200 ms, qui sont perçus plus faiblement que les sons soutenus)23
et envers certaines
fréquences (notre sensibilité est particulièrement efficace entre 1 kHz et 3 kHz alors qu‘elle
l‘est moins dans les extrêmes du spectre sonore). Pour cela, nous réaliserons plusieurs petits
extraits avec différentes combinaisons instrumentales afin de les soumettre à une analyse.
22
Bogh Brixen, Eddy, Audio Metering, Measurements, standards and practice, 2e édition, (Oxford, Focal
Press, 2011), 51. 23
Orban Loudness Meter for Windows v. 2.0.8, 2012, 15, web.
13
Nous savons que notre canal d‘audition agit en guise de résonateur et qu‘en raison
de sa forme, notre sensibilité est accrue dans la région spectrale des 1 kHz à 3 kHz. Avec
une onde de type sinusoïdale, des expériences ont démontré une augmentation de 200 %
des activités neuronales (en impulsions [spikes] par 10s) 24 en passant d‘un stimulus de
1000 Hz à 70dB SPL à 3000Hz pour la même pression, soit une augmentation sur à peine
une octave et demie. Devant ces faits physiques et psychologiques, notre raisonnement est
le suivant : nous pourrions en partie compenser pour l‘écrêtage d‘une chanson en
rééquilibrant des éléments dominants du mix autour de ces valeurs harmoniques.
Concrètement, les crêtes de cette région spectrale ne seraient pas plus élevées à l‘échelle
FS, l‘échelle numérique de graduation d‘un signal audio, mais la sonie serait plus élevée, de
de manière à gagner peut-être gagner quelques phones (unité de mesure approximative de
la perception d‘une pression acoustique à une fréquence donnée) sans avoir à augmenter
significativement la moyenne des dB RMS. Par exemple, nous pourrions créer des
mélodies aux fondamentales se situant autour du registre d‘octave C7 et C8 théoriques25
, ou
bien utiliser des instruments aux sons riches en harmoniques de type C7 et C8, par exemple
des sons aux cycles irréguliers comme les ondes en dents de scie ou de type « bruit » plutôt
que des ondes de type sinusoïdales, ondes plus faibles en harmoniques. Il s‘agit de tenter
d‘établir un équilibre entre des sons complexes sur les plans des harmoniques et des
éléments plus purs (sinusoïdales). Ce faisant, nous intègrerons au principe de sensibilité des
fréquences le principe de sommation sonique (loudness summation) : plus la puissance du
son (SPL) est étendue sur un nombre élevé d‘octaves, ou plus la largeur de la bande
harmonique est importante, plus grande est alors la sonie26
. De plus, et en ce qui concerne
les sons courts inférieurs à 200 ms (plus faiblement perçus par rapport aux sons soutenus),
il nous faut vérifier si nous pouvons composer des morceaux rythmiquement intéressants
avec des notes aussi longues que 200 ms à différents BPM. De cette manière, nous
exploitons notre perception pour obtenir un mix avec une sonie plus élevée, sans pour
autant réellement augmenter les crêtes en amplitude, en espérant que cela n‘augmente pas
trop leur étendue ou leur densité. Nous tentons donc de préserver la hauteur des crêtes,
24
J. L Goldstein, « Phase effects in two-tone suppression investigated with a binaural lateralisation
paradigm », Psychophysics and Physiology of Hearing, (New York, Academin Press, 1977), 177. 25
Roey Izhaki, Mixing audio, Concepts, Practices and Tools, 540. 26
B. B. Bauer et E. L. Torick, « Researches in Loudness Measurement», IEE Transactions on Audio and
Electroacoustics, Vol. AU-14, No 3, (septembre 1966), 149.
14
selon le point de vue de l‘ordinateur, tout en augmentant la qualité sonique, de notre point
de vue, des extraits musicaux. Notre constat préliminaire basé uniquement sur nos écoutes
– c‘est le même pour tous les tests à suivre – est un constat de réussite, comme les tests qui
suivent l‘illustrent, nous sommes parvenus à obtenir des versions modifiées
significativement plus audibles par rapport à leurs homologues originaux, et ce, sans
utiliser des fonctions relatives au gain.
Tests, choix et justifications au stade de la conception sonore
Tous les tests sont divisés et effectués sur deux parties audio distinctes : la partie A
est une composition originale (c.-à-d. en ne tenant pas compte des éléments soniques) et la
partie B est une version différente de l‘originale, qui prend en considération les éléments
théoriques relatifs à la sonie, en ne modifiant qu‘un seul instrument du mix à la fois
(souvent composé de plusieurs modules). Il est à noter que la partie B ne comporte aucun
ajout (d‘instruments ou d‘effets sonores additionnels par rapport à la partie A), car nous ne
voulons pas augmenter l‘amplitude des signaux. Pour modifier la version initiale en vue
d‘obtenir une sonie élevée, nous jouons avec la synthèse et l‘enveloppe des modules de
manière à augmenter les harmoniques (particulièrement autour de 2kHz et de 3kHz) en
gardant le même nombre d‘oscillateurs, puis, dans certains cas, nous allongeons légèrement
les notes MIDI (pour atteindre les 200ms), dans la mesure où la longueur de celles-ci ne
nuit pas à l‘esprit initial des compositions. Ci-dessous, voici les trois modules dont nous
nous servons, pour leur flexibilité au chapitre de la conception sonore :
Figure 2 : Subtraktor, synthétiseur FM polyphonique additif (capture d‘écran27
)
27
Nous utilisons l‘abréviation « CÉ » pour captures d‘écran suivantes.
15
Figure 3 : Thor, synthétiseur polyphonique à trois oscillateurs (CÉ)
Figure 4 : Malström, synthétiseur granulaire à deux oscillateurs (CÉ)
Nous avons choisi d‘illustrer ces trois modules par un souci d‘ergonomie : dans la
suite des tests qui vont suivre, nous n‘avons qu‘à illustrer des sections isolées de chaque
module, soit les sections concernées par les changements entre les versions A et B (le plus
souvent des oscillateurs ou des réglages d‘enveloppe), au lieu de devoir illustrer les
modules entiers pour chaque exemple. Aussi, il est pertinent, voire essentiel, de souligner le
fait que des petits changements d‘enveloppe peuvent modifier considérablement le timbre
d‘un instrument; il ne faut donc pas s‘étonner si une comparaison des timbres de A à B peut
sembler radicale, notre but étant d‘explorer les possibilités de compositions qui sont
optimisées pour une sonie élevée pour et non de produire des versions totalement
identiques d‘une même composition. Lorsque ces changements occasionnent une
16
augmentation du niveau de sortie (en VU/RMS et en Peak), nous compensons la hausse en
diminuant le niveau du gain, de façon à obtenir des niveaux, autant que possible, identiques
aux originaux.
Figure 5 : Big Meter de Reason en action, modes VU et Peak (CÉ)
Pour les niveaux de type Peak (crêtes), cela est facile, mais pour les niveaux RMS
(niveaux moyens établis sur un laps de temps), il nous faut faire des approximations en
observant visuellement de manière honnête les fluctuations des niveaux. Il y a donc un
risque ici relatif à la marge d‘erreur humaine, quoique notre recherche porte
fondamentalement sur des éléments relatifs à des aspects subjectifs de l‘expérience
d‘écoute des phénomènes audio et quoique les crêtes soient demeurées assez stables d‘une
version à une autre (voir les illustrations Wavelab [abréviation choisie : « WL »] dans la
suite des tests). Finalement, nous tentons, dans nos choix de conception sonore, de parvenir
à des résultats conformes aux attentes du style pour les parties A et B (tant du point de vue
du style, que du point de vue sonore), afin de véritablement être en mesure de les comparer,
ne cherchant pas à prouver certaines hypothèses en faisant une conception sonore
désagréable à dessein – ce serait là faire un sabotage de notre recherche de vérité ou de
recherche-création.
17
Test no1 (extrait de BWV 883)
Le premier test est un réchauffement efficace pour plonger le lecteur dans la logique
de tous les autres qui le suivent, car les changements de A à B sont pleinement expliqués,
alors que les exemples qui suivent découleront des prémisses élaborées du premier test. En
ce qui concerne le présent test, il s‘agit d‘un extrait d‘un Prélude du Clavier bien tempéré
de Bach programmé à l‘aide du séquenceur de Propellerhead Reason5.
Figure 6 : 1A WL (A = crêtes de la version originale) (CÉ)
Figure 7 : 1B WL (B = crêtes de la version modifiée) (CÉ).
Ici, les crêtes semblent demeurer relativement semblables d‘une version à une autre.
L‘amplitude de l‘ensemble est plus faible que le reste des expériences puisque la piste, un
Prélude d‘un seul synthétiseur, n‘est pas composée d‘éléments percussifs, qui contribuent à
augmenter les amplitudes.
Les images des figures 8 à 11 illustrent les changements qui ont été faits; la partie
de gauche représente la configuration initiale (A), alors que la partie de droite représente la
18
configuration changée en vue d‘obtenir une sonie élevée (B), la même logique est appliquée
pour les illustrations qui suivent.
Figure 8 : Changement d‘index (accentuant les harmoniques de l‘oscillateur en changeant le point de départ
de l‘échantillon du grain) (CÉ)28
.
Figure 9 : Utilisation d‘une onde en dents de scie plutôt qu‘une onde de type sinusoïdale (moins riche en
harmoniques) (CÉ)29
.
Figure 10 : Allongement léger de la durée des notes MIDI, de manière à augmenter leur perception (CÉ).
Figure 11 : Ajustement du gain à la baisse via une programmation automatisant en même temps le volume de
tous les synthétiseurs de la piste (CÉ)30
.
Avant de poursuivre vers les autres tests, nous souhaitons nous montrer rassurants :
ces détails techniques sont décrits pour la forme et par souci de rigueur. Toutefois, le
lecteur peut se fier simplement à ses oreilles en écoutant les extraits fournis avec le
28
Simon Price, « Using the Malström synth in Reason », Sound on Sound, (aout 2005), web. 29
Hollin Jones, « Sound design using Thor », MusiTech Focus, Synthesis : The in-depth guide for the creative
musician, treisième édition, (2011), 22. 30
Les contrôleurs gris correspondent à une fonction offerte par le module Combinator, qui est un appareil ne
produisant pas de son lui-même, mais qui peut servir à regrouper plusieurs modules et synthétiseurs, qui, eux
produisent et affectent le son, en les programmant tous ensemble. Bref, parfois il est plus simple d‘assigner un
seul contrôle, plutôt que d‘automatiser chaque module (Thor, Subtractor et Malström) individuellement.
19
mémoire, l‘essentiel étant de parvenir à un résultat satisfaisant appuyé par des données.
Comme nous l‘avons déjà indiqué, les expériences à suivre ont mené aux mêmes résultats :
les crêtes demeurent très semblables d‘une version à une autre, alors que le niveau de sonie
des exemples B semble être supérieur aux versions non modifiées A.
Test no2 (Danse percussive 1)
Dans ce test, nous modifions le synthétiseur percussif.
Figure 12 : 2A WL. Amplitude des crêtes élevée, mais densité moindre que la version modifiée (CÉ).
Figure 13 : 2B WL. Diminution de l‘amplitude des crêtes et augmentation de la densité (aire totale sous la
courbe) des amplitudes (CÉ).
Figure 14 : Augmentation du temps de déclin et légère compensation négative du gain (CÉ).
20
Test no3 (Danse percussive 2)
Dans ce test, nous modifions l‘élément percussif présent.
Figure 15 : 3A WL (CÉ)
Figure 16 : 3B WL. Maintien de l‘amplitude des crêtes, mais augmentation de leur densité (CÉ).
Figure 17 : Léger ajustement du gain de sortie des modules à la baisse pour rester au même niveau RMS,
augmentation de la fréquence du filtre d‘enveloppe et augmentation du temps de relâchement (CÉ).
Figure 18 : Rallongement des notes MIDI.
21
Test no4 (Danse percussive 3)
Au cours de ce test, nous modifions la synthèse de la basse.
Figure 19 : 4A WL (CÉ).
Figure 20 : 4B WL. La densité et l‘amplitude des nouvelles courbes similaires (CÉ).
Figure 21 : Compensation négative du gain et augmentation du temps de relâchement (CÉ).
Figure 22 : Changement de modulation pour plus d‘harmoniques (CÉ).
22
Test no5 (House 90’ #1)
Dans ce test, nous changeons l‘instrument mélodique qui commence à partir de 9 secondes.
Figure 23 : 5A WL (CÉ).
Figure 24 : 5B WL, la densité et les crêtes sont similaires (CÉ).
23
Figure 25 : Augmentation du temps de déclin, de la fréquence du filtre d‘enveloppe, du nombre de cycles de
l‘onde modulée FM et compensation négative du gain (CÉ).
Test no6 (Sax Trip-Hop 90’)
Dans ce test, c‘est la basse que nous changeons pour qu‘elle active des harmoniques autour
de 1kHz.
Figure 26 : 6A WL (CÉ).
Figure 27 : 6B WL (CÉ).
Ce cas est assez particulier, car en augmentant légèrement la sonie, nous avons réussi à
maintenir, et parfois à diminuer, la densité des amplitudes. De plus, le changement du
timbre de la basse a eu pour conséquence de laisser augmenter les amplitudes des
24
percussions, ce qui nous fait penser que la basse originale engendrait un effet de masque,
c.-à-d. qu‘elle rendait des éléments percussifs inaudibles. Le fait d‘éliminer cet effet de
masque sera sans doute désirable lors de l‘étape de la compression, où nous perdons
habituellement de la clarté.
Figure 28 : Changement d‘onde de l‘oscillateur et compensation négative du gain (CÉ).
Test no7 (House 90’ # 2)
Dans ce test, nous modifions l‘instrument percussif en arpège des 15 premières secondes.
Figure 29 : 7A WL (CÉ).
Figure 30 : 7B WL (CÉ).
25
Bien que la sonie ait augmenté considérablement, les amplitudes rapides des crêtes ont-
elles aussi augmenté, alors qu‘elles représentent les percussions, en principe intouchées.
Cela est peut-être dû à un masquage non détecté lors de la version originale…
Figure 31 : Changement de type d‘oscillateur (CÉ).
Test no8 (Filter French House 1)
Pour ce test, nous avons modifié l‘instrument mélodique principal.
Figure 32 : 8A WL (CÉ).
26
Figure 33 : 8B WL. Les amplitudes sont similaires (CÉ).
Figure 34 : Les oscillateurs sont automatisés pour plus d‘harmoniques (CÉ).
27
Test no9 (Filter French House 2)
Pour ce test, nous avons modifié les accords du synthétiseur d‘accompagnement.
Figure 35 : 9A WL (CÉ).
Figure 36 : 9B WL. Les amplitudes semblent légèrement moins denses (CÉ).
Figure 37 : Augmentation des harmoniques (CÉ).
Nous avons changé l‘onde en dents de scie pour une synthèse additive de type FM, qui,
avec la même puissance en dB RMS, concentre plutôt le spectre autour de 1kHz-2kHz au
lieu de couvrir une plus grande étendue. Cependant, nous avons perdu du corps, ce qui a
quelque peu changé le caractère planant d‘origine, de sorte que l‘accompagnement, un peu
vide, mais prégnant, semble avoir un effet de « outro ». Cet aspect stylistique sera à traiter
cas par cas, tout dépendamment du seuil de tolérance du réalisateur audionumérique. Il
reste que la perte de corps (diminution des moyennes graves) est régulièrement une étape
préliminaire à la compression pour des résultats plus efficaces.
28
Test no10 (Filter French House 3)
Pour ce test, nous avons modifié la basse, qui sonne nasillarde.
Figure 38 : 10A WL (CÉ).
Figure 39 : 10B WL. Les crêtes des amplitudes sont similaires (CÉ).
Figure 40 : Notes MIDI allongées (CÉ).
Figure 41 : augmentation des harmoniques (CÉ).
29
Test no11 (House percussif)
Au cours de ce test, nous modifions la basse.
Figure 42 : 11A WL (CÉ).
Figure 43 : 11B WL. Légère augmentation de la densité des amplitudes (CÉ).
Gain substantiel en sonie, par la mise à l‘avant d‘harmoniques tels que 400Hz, 800 Hz et
1.6kHz (dans une mesure moindre), des fréquences moins énergivores et plus perceptibles
que les 120 Hz de la version A.
Figure 44 : Compensation négative du gain, augmentation du temps de relâchement et augmentation des
harmoniques (CÉ).
30
Test no12 (Dubstep)
Pour ce test, nous avons modifié le seul instrument de l‘extrait.
Figure 45: 12A WL (CÉ).
Figure 46: 12B WL. Les courbes demeurent stables alors que la sonie augmente (CÉ).
Figure 47 : Augmentation de la fréquence du filtre et changement d‘onde pour plus d‘harmoniques (CÉ).
31
Test no13 (Danse Voix)
Au cours de ce test, nous avons modifié le synthétiseur à accords.
Figure 48 : 13A WL (CÉ).
Figure 49 : 13B WL. Gain de sonie, conservation du niveau des amplitudes (CÉ).
Figure 50 : Augmentation des harmoniques (CÉ).
32
Test no14 (House 90’ #3)
Au cours de ce test, nous modifions la synthèse de l‘instrument mélodique percussif.
Figure 51 : 14A WL (CÉ).
Figure 52 : 14B WL. Les amplitudes sont semblables et la sonie a augmenté (CÉ).
Figure 53 : Allongement des notes MIDI et augmentation des harmoniques (CÉ).
33
Test no15 (Filter French House #4)
Pour ce test, nous avons modifié le synthétiseur virtuel qui fait des arpèges.
Figure 54 : 15A WL (CÉ).
Figure 55 : 15B WL. Les crêtes sont similaires et la sonie a augmenté (CÉ).
Figure 56 : Compensation négative du gain, augmentation des harmoniques et allongement des notes MIDI.
34
Informations préliminaires à l’analyse des données
Constats
À ce stade, soit après avoir allongé les notes MIDI, après avoir augmenté les temps
de relâchement et de déclin et après avoir enrichi les harmoniques des instruments à
modifier des versions B, nous pouvons tenter de déduire des constats à partir des écoutes et
des graphiques à crêtes. Premièrement, l‘augmentation des harmoniques et du temps de
relâchement ont donné un timbre particulier de « cloche » à quelques versions B de nos
tests : c‘est le cas pour 1B, 2B, 3B, 4B, 5B, 7B, 9B, 11B et 14B. Ànotre avis, cela découle en
partie du fait que l‘auteur a un penchant pour les sons aux attaques prononcées et aux
déclins rapides, de sorte qu‘une fois aigus et avec un relâchement lent, nous obtenons des
sons similaires à des sons de cloches. En ce qui concerne ce dernier constat, nous n‘y
voyons pas d‘inconvénients ou d‘avantages particuliers.
Le deuxième constat nous parrait moins positif : après avoir comparé les versions A
et B, nous avons l‘impression générale que les versions B sont plus agressives ou qu‘elles
ont la caractéristique d‘être plus irritantes à l‘écoute. Aussi, nous avons constaté, dans le
même ordre d‘idées, que la littérature savante sur l‘acoustique et l‘audionumérique tiennent
en proximité les termes loudness et annoyance31
: plus un son est long (jusqu‘à 200 ms) et
plus il a une forte sonie (Torick et Bauer, 1966)32
alors que plus un son est long, plus il est
irritant (Raichel, 2006)33
. Toutefois, l‘agressivité d‘un son n‘est pas uniquement due à sa
longueur, mais également (entre autres) à sa composition harmonique. Par exemple, en
regardant un tableau des termes subjectifs pour décrire les régions spectrales, nous pouvons
voir que les régions des 800 Hz à 5kHz, lorsque trop présentes dans un mix, correspondent
à des caractéristiques désagréables comme un son de « boite » autour de 500-800Hz, un son
nasal autour de 1-2kHz ou sibilant et agressif autour de 2 à 9 kHz34
. Pour l‘instant, cela ne
nous semble pas inquiétant suite à l‘écoute des versions B sur lesquelles nous venons de
travailler. Ce qui nous préoccupe est plutôt de voir si ces caractéristiques sonores
31
Eddy Bogh Brixen, Audio Metering, Measurements, standards and practice, 79. 32
Orban Loudness Meter for Windows v. 2.0.8, 15, web. 33
Daniel R. Raichel, The science and applications of acoustics, 2e édition, (New York, New York, 2006),
324. 34
Roey Izhaki, Mixing Audio, 213.
35
(maintenant présentes) ressortent de manière exacerbée une fois que nous aurons augmenté
les amplitudes des pistes à l‘aide d‘un limiteur pour obtenir des versions « prototype »35
de
matriçage, soit l‘étape technique/artistique36
ultime avant la distribution d‘une œuvre.
Il y a un risque en ce qui concerne les fréquences agressives : si nous devons trop
diminuer les fréquences qui nous ont donné notre sonie lors de la réduction de dynamique
au premier test de mise en place pour le matriçage, nous pourrions alors perdre ce pour quoi
nous avons travaillé, ou, du moins, maintenir un niveau de sonie équivalent à la version
originale, sans obtenir d‘avantages pour le travail supplémentaire. Ainsi, il est possible que
nous perdions l‘avantage sonique des versions B par rapport aux versions A, si nous avons
moins de marge de manœuvre lors de la réduction de la gamme dynamique au
« prototype » de matriçage. Ce cas advenant, notre utilisation créative des principes
soniques lors du processus de réalisation aura été vaine, et si l‘avantage sonique est
complètement déclassé par une perte préalable de marge dynamique importante, il se peut
alors que les versions B soient moins puissantes du point de vue de la sonie que leurs
homologues originales. Quoi qu'il en soit, nous irons là où les résultats nous mèneront.
Quelles sont les données pertinentes à l’analyse de nos tests?
Avant de nous lancer dans des essais de réduction de dynamique, il nous faut
recueillir des données chiffrées et des standards dynamiques et soniques recommandés par
des professionnels sur les pistes que nous avons réalisées jusqu‘à présent, afin d‘être en
mesure de les comparer entre elles-mêmes et par rapport à ce que les plus compétents que
nous-mêmes jugent être un standard de qualité : cela est un impératif logique. Pour la
collecte de données sur nos tests, afin de pouvoir en faire une interprétation « éclairée »,
nous avons recherché parmi les dernières publications sérieuses (le savoir en matière de
sonie et de dynamique évolue à une vitesse fulgurante). Pour faire court, les termes « EBU
35
Voir l‘Annexe 2. Nous employons le mot « prototype », car nous n‘utilisons qu‘un limiteur et un égaliseur
afin de mieux permettre l‘universalisation de nos expériences, alors que la chaine d‘outils du matriçage peut
être plus complexe, ce qui augmente l‘apport de la qualité des outils de réduction de la gamme dynamique
dans l‘équation de la qualité globale du résultat obtenu. 36
Bob Katz, Mastering Audio, 11.
36
R 128 », « ITU-R BS.1770 [1, 2 et 3] » et « EBU – TECH 3341-2 » sont très discutés
actuellement dans le monde de l‘audionumérique.
EBU R 128, ITU-R BS. 1770 (v. 1, 2 et 3) et EBU – Tech 3341-2 présentés en rafale
Ces trois termes font référence à trois séries de recommandations par des
organismes internationaux en télécommunications sur la dynamique et la normalisation des
signaux audio. Dans le cas qui nous concerne, cellux-ci émettent des constats à propos des
technologies, mais aussi à propos des méthodes de mesure, de méthodes de traitements
dynamiques et de méthodes de normalisation qui nous sont contemporaines.
Ces organismes arrivent à différents constats. La normalisation par les crêtes (peak
normalisation), la méthode de normalisation la plus repandue, est incapable de régulariser
les sonies de différents programmes37
(on appelle programme: une publicité, une chanson,
un film, bref, toute œuvre ou tout élément audio pour sa durée entière) de manière à ce
qu‘un enchaînement de programmes ne soit pas accompagné d‘un changement de sonie
perceptible par l‘auditeur. L‘incapacité de la normalisation à régulariser les sonies découle
du fait que la sonie ne se mesure pas et ne se contrôle pas par le niveau des crêtes d‘un
programme. Fondamentalement, toute la question réside dans notre méthode de mesure par
QPPM ou Quasi-Peak Programme Meter ou Sample Peak Meter (crête-mètre), soit ce que
nous appelons couramment à demi tort le Peak Meter, outil de mesure approximative des
crêtes.
Premièrement, l‘échantillonnage du QPPM (limité par l‘échantillonnage du fichier
audio ou par la limite « logicielle » du plugiciel) est trop faible pour rendre compte des
réelles courbes de signaux, soit les signaux tels que captés par les enceintes à la fin de la
conversion analogique/numérique. Cela signifie que les crêtes détectées par le QPPM ne
sont q‘une approximation arrondie du niveau des crêtes par le bas, car les transitoires
rapides des attaques des signaux peuvent être (et sont très souvent) ignorés par l‘instrument
de mesure. Autrement dit, l‘utilisation d‘un limiteur de type brickwall (qui ne laisse rien
37
Selon l‘orthographe et la définition du document du EBU R 128, cf. EBU R 128, Loudness normalisation
and permitted maximum level of audio signals, 2011, web.
37
passer au-dessus du niveau de sortie indiqué) à un niveau de sortie de -0,3 dBFS n‘est pas
une garantie certaine contre l‘écrêtage et les distorsions (artéfacts audibles) qui en résultent.
Pourtant, -0,3 dBFS est le niveau de sortie recommandé par Friedemann Tischmeyer en
200738
, même si presque tous les limiteurs fonctionnent en QPPM ou sans
suréchantillonnage (oversampling)39
(y compris les modules issus de la suite Oxford par
Sonnox). La figure ci-dessous représente bien cette réalité : nous pouvons voir que l‘onde
analogique atteint à chaque fois un sommet plus élevé que les échantillons qui décrivent la
courbe du son. Si nous nous rapprochons trop du 0 dBFS lors du matriçage (ou même au
mix), nous courrons de grands risques d‘écrêter notre signal (à partir d‘aussi bas que -3
dBFS40
), et ainsi, il se peut que nous obtenions des distorsions, surtout lorsqu‘il y a du
matériel de qualité non professionnel (le matériel typique dans la plupart des maisons) dans
la chaine de lecture. Deuxièmement, la mesure des crêtes/des amplitudes n‘est qu‘un indice
de ce à quoi peut correspondre la perception du niveau sonore chez l‘être humain. Comme
nous l‘avons vu précédemment, il y a une multitude de facteurs psychoacoustiques que
nous devons prendre en considération (nous avons plus spécifiquement travaillé sur les
facteurs de la durée et des fréquences), ne serait-ce que pour avoir une idée du niveau
sonique d‘un programme audio.
Les gens de l‘EBU (European Broadcasting Union) ont alors cherché à établir des
normes soniques (décrites en EBU R 128) pour l‘élaboration d‘instruments de mesure
(ITU-R BS 1770 [1, 2 et 3] et EBU-Tech 3341) permettant facilement aux ingénieurs et aux
réalisateurs audionumériques de contrôler les niveaux réels des crêtes et les niveaux
soniques de leurs programmes de manière à ce qu‘ils répondent à ces dites normes (EBU R
128).
38
Friedemann Tischmeyer, Audio Mastering Tutorial DVD Vol. III, (Santa Cruz, Tischmeyer Publishing,
2007). 39
Note : très peu de limiteurs travaillent en mode suréchantillonnage, comme le Nugen ISL ou le TC LM2, des
modules dispendieux qui s‘affirment attestés ITU-R BS 1770, une norme déjà vieille de 6 ans, encore
inconnue du grand public en 2011, et qui a subi deux changements considérables au chapitre de la
détermination des niveaux soniques dans les derniers mois… La phrase notée expirera donc sans doute en
validité très prochainement. 40
Thomas Lund, Loudness Wars, web.
38
Les méthodes qui en découlent sont les suivantes : le Programme Loudness ou
Integrated Loudness (sonie intégrée) en LKFS (loudness units filtrés « K »,
où -1 LUFS = -1 dBFS et 1 LU = 1 dB), le Momentary Loudness (sonie du moment sur
400ms), le Short Term Loudness (sonie sur 3s), le Loudness Range (gamme sonique) et le
True Peak Level (ou crêtes réelles). Mais comment ces méthodes fonctionnent-elles?
La sonie est évaluée sur des cases de temps de 400 ms, et ce, à tous les 100ms, avec
un chevauchement des cases de 75 % dans le BS. 177041 - 42
. Chaque case de 400ms
constitue une moyenne en dB RMS, et nous avons 10 de ces cases pour 1 seconde, car la
sonie est calculée à chaque 100 ms. Ainsi, lorsque nous désirons connaitre la sonie sur 3 s,
nous faisons une moyenne des dB RMS des cases de 400 ms (30 pour 3s) et nous obtenons
ainsi une moyenne de moyennes que nous exprimons en LUFS43
. Par la suite, nous
appliquons au LUFS un filtre nommé « K ». Le filtre « K » (ou K-weighting) est en fait une
version simplifiée, composé de quelques filtres de base (voir figure 58.1 à la page
suivante), des courbes isosoniques (equal loudness contour) inversées. Nous obtenons alors
des niveaux en LKFS (LUFS + K-weighting). Par la suite, et pour que la moyenne obtenue
ne soit pas altérée par les valeurs trop faibles en dB d‘un programme, on élimine, par une
méthode de porte-de-bruit (gating) (activation et désactivation de l‘effet d‘un module par
un seuil établi), toutes les données des fenêtres de 400 ms en dessous de -70 LKFS. Une
fois ces données rejetées, nous recalculons une moyenne sonique avec les fenêtres de 400
ms restantes. Finalement, et une fois cette dernière calculée, nous éliminons toutes les
fenêtres de 400 ms ayant des valeurs inférieures de 10 LU à cette dernière moyenne
obtenue, puis nous procédons à un nouveau calcul de la moyenne des cases restantes : c‘est
ainsi que nous obtenons numériquement la valeur sonique d‘un signal audio.
41
Cf., EBU R 128 et ITU BS 1770 (1, 2 et 3). 42
Il est possible que le terme overlap ou emboitement ait porté à confusion Emanuel Deruty, auteur de
l‘article « ‗Dynamic Range‘ & The Loudness WarI », dans SoundOnSound, (septembre 2011), web, article
qui porte en fait sur le Loudness Range. L‘‘Annexe 1 commente quelques contradictions relevées dans cet
article. 43
Il y a plusieurs échelles de graduation relatives, mais nous préférons ne nous servir que de l‘échelle Full
Scale pour son « 0 » absolu.
39
La simplicité du filtre « K » 44 était un compromis à faire sur la précision quant à la
traduction inverse des courbes isosoniques, afin de pouvoir permettre une mise en marché
pratique ($) de modules de mesure soniques physiques. Nous avons de solides doutes quant
à la précision et à la pertinence d‘utiliser ce filtre45
, mais c‘est tout ce dont nous disposons
pour le moment.
En ce qui concerne la gamme sonique (Loudness Range), elle est calculée en faisant
la différence entre la moyenne des sonies fortes et la moyenne des sonies faibles. Celle-ci
est une mesure statistique basée sur la répartition des densités des amplitudes, moins les
valeurs extrêmes. Si la gamme sonique est un indice ou un effet de la gamme dynamique
d‘un programme, elle n‘est cependant, pas une mesure de la gamme dynamique! Elle
représente plutôt la variation du niveau sonique telle que théoriquement perçue par l‘être
humain. Autrement dit, elle compare les différentes sonies au sein d‘un même programme.
Nous avons également des doutes quant à la précision d‘un tel standard de mesure sur une
chanson, car ce standard nous semble aller au-delà d‘une simple mesure de la marge
dynamique intégrée et du peak level, deux mesures qui seraient pourtant suffisantes pour
décrire le niveau de sonie d‘une pièce bien mixée et matriçée qui présente une courbe de
fréquences neutre ou équilibrée, en diluant trop les données recueillies pour les adapter à la
mesure de programmes durant plus de 30-40 minutes. Encore une fois, il reste que c‘est
tout ce dont nous disposons, alors il vaut la peine d‘essayer ces méthodes de mesure.
Les True Peak Level (ou les vraies crêtes) représentent les crêtes telles qu‘elles sont
réellement après la conversion des échantillons en ondes analogiques. Pour arriver à une
mesure plus juste, soit une mesure représentative de l‘onde analogique, par les échantillons
numériques (couramment autour de 48 kHz), nous augmentons le nombre des échantillons
pour obtenir plus de données dans la courbe constituée de points d‘échantillons. Comment
44
Emmanuel Deruty, « ‗Dynamic Range‘ & The Loudness War », SoundOnSound, (septembre 2011), web. 45
À notre avis, le filtre « K » est trop gobal et ne peut s‘appliquer à tous les genres musicaux. Par exemple,
pour la musique hip-hop et pour la musique électronique dansante, il faudrait un filtre passe-haut plus
prononcé pour rendre compte des graves plus présentes de ces styles, sans quoi le niveau de sonie obtenu sera
exagéré par rapport à la perception de l‘auditeur, qui évalue la sonie d‘une pièce davantage en proportion aux
hautes fréquences qu‘aux graves fréquences. En ce qui concerne le filtre « K », et la plupart des standards
EBU et ITU, il semble s‘appliquer surtout aux dialogues, qui ont une quantité insignifiante de graves
fréquences et qui sont plus difficilement agressifs, par rapport à des instruments, lorsqu‘on augmente le gain
de leurs hautes fréquences.
40
est-ce alors possible d‘augmenter le nombre d‘échantillons lorsque nous sommes limités
par l‘échantillonnage prédéfini du fichier audio? Un suréchantillonnage (oversampling) est
possible en insérant des échantillons de valeur « 0 » entre les échantillons du fichier audio.
Conformément à la loi de Nyquist-Shannon, nous devons ensuite appliquer un filtre pour
éliminer les hautes fréquences (> 22 kHz) obtenues des suites de la transformation. Ainsi,
un suréchantillonnage de 4X sur un fichier de 48 kHz produira l‘équivalent d‘un fichier de
192 kHz, pas en qualité sonore, mais en capacité de mesurer le signal audio de manière
fine.
Quels sont les standards? -23 LKFS pour la normalisation et -1 dB pour les crêtes
true peak. En ce qui concerne le premier, « -23 » est une valeur non absolue, qui ne fait pas
consensus dans la communauté audionumérique, notamment chez Orban et les Laboratoires
CBS46
, ou chez l‘AES (Audio Engineering Society)47
: il s‘agit de ramener les programmes
à une moyenne de valeurs dynamiques de -23 LKFS (la moyenne de l‘étendue des données
doit être de -23 LKFS). La limite des crêtes à -1 dB est une bonne suggestion, en vue de la
conversion au format mp3 et de la lecture des appareils de qualité consommateur qui
distorsionnent en bas de 0 dBFS, par Thomas Lund, l‘autorité en matière de haute
définition et de perception chez TC. Nous avons testé cette suggestion, plus prudente que la
limite de -0,3 dBFS de Tischmeyer. Un peu incrédules, nous n‘avons, cependant, pas été
prêt à sacrifier 1 dB de marge dynamique pour éviter l‘écrêtage. Même en appliquant une
limite de -0,7 dBFS avec un limiteur brickwall, et après une conversion haute-qualité au
format mp3 320 kb/s, nous avons eu une chanson sur huit dans notre album (voir chapitre
3) qui a écrêté dans une des deux pistes du mix stéréo. Il faut donc être très prudent.
La marge dynamique, une autre mesure avec ses propres standards pertinents pour nous
Jusqu‘à présent, nous n‘avons pas discuté de mesures et de moyens propres à la
détermination de la dynamique de nos extraits à analyser. À notre avis, Tyschmeyer apporte
une contribution fort intéressante dans ce domaine avec la Pleasurize Music Foundation,
une organisation qui prône la protection de la gamme dynamique et des avantages qui lui 46
Orban Loudness Meter for Windows v. 2.0.8, p. 18, web. 47
Luis Miranda, « Multichannel Loudness Listening Test », communication savante, 124e congrès de l‘Audio
Engineering Society, (1er mai 2008), web.
41
sont reliés. Les membres de cette organisation ont mis au point une table de graduation des
gammes dynamiques en fonction des styles musicaux, un standard qu‘ils voudraient voir
devenir celui de l‘industrie de la musique tout entière. Tout comme certains souhaitent que
les aliments trangéniques soient étiquetées, la Pleasurize Music Foundation48 souhaite voir
la gamme dynamique affiché sur les albums de musique, afin que l‘auditeur sache si la
musique respecte les normes. En collaboration avec Algorithmix, ceux-ci ont également
élaboré un plugiciel servant à déterminer la gamme dynamique en ligne (live) par VST ou
hors ligne (calcul d‘ensemble): le TT Dynamic Range Meter.
Quels standards et quelles mesures allons-nous utiliser pour notre cueillette de
données? Pour réponde à cette question, il faut tout d‘abord nous demander quel est le but
de notre cueillette de données. Cela peut se résumer ainsi : nous souhaitons, avec notre petit
échantillon de pièces (60 en tout) constituées de versions A et B au MIX (30) et de versions
A et B une fois limitées (30 aussi), tenter d‘établir des fonctions entre diverses
caractéristiques soniques et dynamiques dans le but de savoir si notre exercice d‘application
créative de principes soniques lors de la composition est pertinent, c.-à-d. de voir si nous
pouvons tirer des avantages quelconques de cette pratique. Ainsi, et puisque la qualité est
également une finalité de notre recherche, nous allons tenter de nous soumettre aux divers
standards dynamiques et soniques des normes décrites dans ce chapitre tout en observant si
certains de nos choix de conception sonore ont été productifs au chapitre de la gamme
dynamique, du niveau sonique et de la qualité en général, et ce, d‘une manière
significativement supérieure à leur version originale.
Concrètement, nous nous servons des mesures suivantes : la gamme dynamique, le
niveau des « vraies crêtes » (true peak), la sonie intégrée, la gamme sonique intégrée et la
puissance sonore en dB SPL (filtres A et B).
Nos outils de travail
Dans cette section, nous prenons quelques pages pour présenter nos outils de travail
ainsi que nos outils de mesure utilisés au cours de ce premier chapitre. Débutons par les
plugiciens utilisés pour traiter nos différents mix.
48
Pleasurize Music Foundation, web: http://www.pleasurizemusic.com & http://www.dynamicrange.de
42
Figure 57 : Oxford Limiter & Oxford EQ (CÉ).
L‘égalisateur de Type-3 (très large) nous a été conseillé par Serges Samson, technicien de
l‘Université Laval pour des résultats plus doux et naturels.
Figure 58 : Exemples de courbes en affichage -6 dB à + 6dB (CÉ).
Figure 59 : Nugen True Peak Meter & Nugen Loudness Meter (Mode EBU + 18FS) (CÉ).
43
Cet outil de Nugen remplit les normes ITU-R BS1770/1, ATSC A/85 et EBU R 128 (nous
avons choisi ce standard, car c‘est celui qui est le plus discuté de tous).
Figure 60 : TT Dynamic Range Meter Offline et Online (CÉ).
Le logo qui apparait en blanc (DR 10) représente la gamme dynamique intégrée d‘un
programme (10 dB dans ce cas).
44
Mesures
Mesures dynamiques des pistes au mix à l’aide du TT-DR VST et du TT-DR Offline
Tableau 2 : Mesures dynamiques des pistes au mix à l‘aide du TT-DR VST et du TT-DR Offline
Pistes
mix Temps
[X à Y[
sec
DR VST
min
dB
DR
VST
max
dB
DR
médiane
dB
DR
Offline
Pk
L
VST
dB
Pk
R
VST
dB
Pk
L
Off
dB
Pk
R
Off
dB
1A 5 à 10 10,8 13,2 11,00 10++ -14 -11 -14,4 -11,3
1B 5 à 10 12,1 13,8 13,95 13+++++ -11 -11 -11,4 -11,2
2A 20 à 25 10,6 12,6 11,60 11+++ -1,1 -1,1 -0,54 -0,12
2B 20 à 25 9,5 13,2 11,35 11+++ -1,6 -1,6 -0,93 -0,93
3A 20 à 25 12,5 15,3 13,90 13+++++ -0,7 -0,3 -0,00 -0,04
3B 20 à 25 11,5 15,0 13,25 13+++++ 0,0 -0,1 -0,04 -0,00
4A 20 à 25 12,8 14,6 13,70 12++++ -0,6 -1,0 -0,44 -0,62
4B 20 à 25 12,5 14,8 13,65 12++++ -1,0 -0,9 -0,67 -0,94
5A 20 à 25 13,4 16,9 15,15 12++++ -1,0 -1,1 -0,54 -1,02
5B 20 à 25 13,6 17,3 15,45 13+++++ -0,7 -1,3 -0,52 -0,95
6A 20 à 25 12,3 17,7 15,00 12 -2,0 -2,5 -0,93 -1,55
6B 20 à 25 13,1 17,6 15,35 11- -1,7 -2,0 -1,26 -1,48
7A 5 à 10 9,9 13,7 11,80 13+++++ -2,4 -2,0 -0,60 -0,66
7B 5 à 10 12,1 15,6 13,85 12++++ -0,1 -1,5 -0,12 -0,79
8A 0 à 5 10,4 13,3 11,85 11+++ -0,7 -0,7 -0,66 -0,55
8B 0 à 5 11,4 13,4 12,40 11+++ -0,7 -0,5 -0,67 -0,53
9A 0 à 5 114 13,8 12,60 11+++ -0,6 -0,7 -0,54 -0,62
9B 0 à 5 10,3 14,0 12,15 11+++ -0,4 -0,6 -0,39 -0,60
10A 5 à 10 10,5 13,1 11,80 12++++ -1 -1 -0,97 -0,98
10B 5 à 10 10,1 13,2 11,65 12++++ -1 -1 -1,00 -0,96
11A 0 à 5 12,1 13,4 12,75 12++++ -3 -3,3 -3,16 -3,47
11B 0 à 5 11,0 13,9 12,45 12++++ -2,5 -2,7 -2,40 -2,29
12A 0 à 5 12,2 16,2 14.20 11+++ -3,3 -3,5 -3,27 -3,55
12B 0 à 5 11,1 16,1 13,60 12++++ -3,5 -4,3 -3,54 -3,83
13A 0 à 5 11,0 14,1 12,55 12++++ -4,0 -3,8 -3,38 -2,97
13B 0 à 5 11,7 14,4 13,05 12++++ -3,8 -3,9 -3,62 -3,14
14A 0 à 5 11,0 12,7 11,85 11+++ -2,4 -2,3 -2,12 -2,02
14B 0 à 5 11,0 13,2 11,60 10++ -2,3 -2,2 -2,33 -2,02
15A 0 à 5 9,3 12,6 10,95 11+++ -2,4 -2,3 -2,35 -2,34
15B 0 à 5 9,8 12,8 11,30 10++ -2,5 -2,5 -2,33 -2,23
Légende :
DR = Dynamic Range (Gamme dynamique)
VST = mesuré avec le TT Dynamic Range Meter en ligne
Offline = mesuré avec le TT Dynamic Range Meter hors ligne
PK L = Peak Left (crête gauche)
PK R = Peak Right (crête droite)
« - » ou « + » pour chaque degré inférieur/supérieur à la norme de Tischmeyer par genre
45
Mesures soniques (Nugen LM) : Pistes Mix
Méthodologie des mesures : comme les mesures soniques sont des indications relatives (il
n‘y a pas de mesures absolues), nous avons comparé les mêmes séquences pour les versions
A et B lors des passages aux instruments concernés par les changements, entre 20 et 30
secondes de longueur ou pour l‘échantillon au complet lorsqu‘il était plus court.
Tableau 3 : Mesures soniques (Nugen LM) : Pistes Mix
Pistes Mix PL
EBU +18 dB
LR
EBU +18 dB
1A -24,7 0.6
1B -24,8 0.6
2A -15,8 2.4
2B -15,7 1.0
3A -14,8 1.3
3B -14.7 1.4
4A -16.2 0.9
4B -16.6 0.8
5A -15.1 1.2
5B -15.5 0.5
6A -16.4 1.7
6B -16.0 3.8
7A -16.8 1.9
7B -15.9 1.2
8A -14.0 0.9
8B -13.9 0.8
9A -14.3 0.8
9B -14.2 0.6
10A -14.6 0.5
10B -14.4 0.5
11A -18.3 0.7
11B -18.1 1.2
12A -17.8 1.5
12B -17.5 0.5
13A -18.8 1.1
13B -18.7 1.5
14A -15.3 0.8
14B -15.3 0.6
15A -16.0 0.7
15B -15.9 0.3
Légende :
PL = Programme Loudnes ou sonie intégrée en mode EBU + 18
LR = Integrated Loudness Range ou gamme sonique intégrée en mode EBU + 18
46
Mesures soniques (Nugen LM) & dynamiques (TT DR) des pistes limitées
Méthodologie des mesures : même que précédente.
Tableau 4 : Mesures soniques (Nugen LM & dynamiques (TT-DR) des pistes limitées.
Légende :
Gain entrée = augmentation de gain appliquée (Oxford Limiter natif)
Gain sortie = limite du brick wall (Oxford Limiter)
DR = Dynamic Range (Gamme dynamique)
Offline = mesuré avec le TT Dynamic Range Meter hors ligne
PL = Programme Loudnes ou sonie intégrée en mode EBU + 18 (Nugen LM)
LR = Integrated Loudness Range ou gamme sonique intégrée en mode EBU + 18
« - » ou « + » pour chaque degré inférieur/supérieur à la norme de Tischmeyer par genre
Pistes
limitées
Gain entrée
dB
(18 max)
Gain sortie
dB
Réduction
gain max
dB
DR
Offline
dB
PL
dB
LR
dB
1A 18.0 -1 3 8 - 10.6 3.3
1B 18.0 -1 3 8 - 9.80 2.0
2A 7.00 -1 5 7- - 11.1 1.8
2B 9.00 -1 6 7- -10.1 1.0
3A 14.6 -1 12 8 -10.3 0.6
3B 13.6 -1 9 7- -10.1 0.3
4A 12.9 -1 12 7- -10.9 16.8
4B 13.0 -1 12 7- -10.0 17.3
5A 7.78 -1 5 8 -10.7 1.9
5B 7.78 -1 5 8 -10.9 3.0
6A 4.14 -1 1 11- -15.0 9.7
6B 4.14 -1 1 10-- -14.7 9.5
7A 7.48 -1 3 8 -11.7 1.5
7B 7.66 -1 4 8 -11.5 2.1
8A 3.65 -1 1.5 9+ -12.1 1.1
8B 3.65 -1 1.5 9+ -12.1 1.0
9A 7.30 -1 5 8 -11.1 0.7
9B 7.03 -1 5 8 -11.1 0.5
10A 6.25 -1 4 8 -10.2 0.5
10B 6.08 -1 4 8 -10.1 0.5
11A 8.03 -1 2 9+ -12.2 0.8
11B 9.24 -1 3 8 -11.5 0.9
12A 9.00 -1 3 8 -10.7 0.7
12B 9.49 -1 3 8 -9.7 0.4
13A 8.51 -1 1 8 -11.7 1.2
13B 8.31 -1 1 8 -11.8 1.0
14A 5.01 -1 1 9+ -11.9 1.3
14B 5.24 -1 1 8 -11.7 1.3
15A 6.03 -1 3 8 -11.3 0.7
15B 6.03 -1 3 10++ -11.2 0.7
47
Ajustements des fréquences après l’augmentation de gain au limiteur
Tableau 5 : Ajustements des fréquences après l‘augmentation de gain du limiteur.
Pistes
compressées
Réduction des fréquences Constats :
compensation nécessaire?
1A
Figure 61 : Égaliseur 1A (CÉ).
ORIGINAL
1B
Figure 62 : Égaliseur 1B (CÉ).
La nature du son a trop changé de la
version A à la version B, de sorte
qu‘une comparaison est difficile.
2A
Figure 63 : Égaliseur 2A (CÉ).
ORIGINAL
2B
Figure 64 : Égaliseur 2B (CÉ).
Légère diminution du facteur
agressif à environ 2 kHz.
3A
Figure 65 : Égaliseur 3A (CÉ).
ORIGINAL
3B
Figure 66 : Égaliseur 3B (CÉ).
Diminution du corps autour de
150 Hz et diminution du facteur
agressif et sibilant entre 2 kHz et
7 kHz.
4A
Figure 67 : Égaliseur 4A (CÉ).
ORIGINAL
48
4B
Figure 68 : Égaliseur 4B (CÉ).
Légère diminution du facteur
agressif autour de 1.5 kHz.
5A
Figure 69 : Égaliseur 5A (CÉ).
ORIGINAL
5B
Figure 70 : Égaliseur 5B (CÉ).
Légère diminution du facteur
sibilant autour de 5 kHz.
6A
Figure 71 : Égaliseur 6A (CÉ).
ORIGINAL
6B
Figure 72 : Égaliseur 6B (CÉ).
Aucun changement jugé nécessaire
par rapport à l‘original.
7A
Figure 73 : Égaliseur 7A (CÉ).
ORIGINAL
7B
Figure 74 : Égaliseur 7B (CÉ).
Légère diminution du facteur
sibilant autour de 5 kHz.
8A
Figure 75 : Égaliseur 8A (CÉ).
ORIGINAL
49
8B
Figure 76 : Égaliseur 8B (CÉ).
Aucun changement jugé nécessaire.
9A
Figure 77 : Égaliseur 9A (CÉ).
ORIGINAL
9B
Figure 78 : Égaliseur 9B (CÉ).
Diminution des moyennes
« boueuses » autour de 250-500 Hz.
Légère diminution du facteur
agressif autour de 2 kHz.
10A
Figure 79 : Égaliseur 10A (CÉ).
ORIGINAL
10B
Figure 80 : Égaliseur 10B (CÉ).
Adoucissement non significatif du
facteur agressif.
11A
Figure 81 : Égaliseur 10A (CÉ).
ORIGINAL
11B
Figure 82 : Égaliseur 11B (CÉ).
Légère diminution du corps autour
de 180 Hz.
12A
Figure 83 : Égaliseur 12A (CÉ).
ORIGINAL
50
12B
Figure 84 : Égaliseur 12B (CÉ).
Légère diminution des moyennes
boueuses autour de 400-500 Hz.
13A
Figure 85 : Égaliseur 13A (CÉ).
ORIGINAL
13B
Figure 86 : Égaliseur 13B (CÉ).
Légère diminution de la sibilance
autour de 8 kHz.
14A
Figure 87 : Égaliseur 14A (CÉ).
ORIGINAL
14B
Figure 88 : Égaliseur 14B (CÉ).
Adoucissement général non
significatif par rapport à l‘original.
15A
Figure 89 : Égaliseur 15A (CÉ).
ORIGINAL
15B
Figure 90 : Égaliseur 15B (CÉ).
Aucun changement jugé nécessaire.
51
Tests de puissance acoustique au LANTISS (ULaval)
Figure 91 : Filtres communs dans la mesure des dB SPL
49
Méthodologie des mesures : même que pour les mesures soniques.
Tableau 6 : Tests de puissance acoustique au LANTISS (ULaval)
Pistes SPL A
max dB
SPL C
max dB
Pistes Limitées SPL A
max dB
SPL C
max dB
1A 69 82.7 1A 88.4 95.6
1B 77.6 80.8 1B 94.8 95.4
2A 81.4 97.2 2A 82.8 96.6
2B 79.3 96.3 2B 83.6 97.0
3A 79.1 93.9 3A 84.1 96.8
3B 80.4 92.4 3B 85.2 97.8
4A 77.0 94.8 4A 84.3 100.8
4B 77.2 94.7 4B 83.7 95.9
5A 78.8 92.8 5A 84.9 95.6
5B 79.3 91.9 5B 85.4 96.3
6A 82.4 93.9 6A 83.2 95.6
6B 81.0 95.1 6B 82.5 95.1
7A 78.8 95.4 7A 84.6 95.9
7B 76.8 93.6 7B 84.4 97.2
8A 82.1 95.9 8A 82.5 95.6
8B 82.6 96.3 8B 82.9 95.4
9A 83.3 95.9 9A 84.6 94.8
9B 83.2 96.1 9B 84.6 96.6
10A 80.7 94.5 10A 84.6 95.6
10B 82.0 95.1 10B 85.0 96.8
11A 78.8 94.8 11A 82.9 95.9
11B 78.6 94.5 11B 81.8 96.8
12A 79.1 92.6 12A 86.0 96.3
12B 78.6 91.2 12B 86.9 95.4
13A 77.8 95.4 13A 83.9 96.1
13B 78.0 95.1 13B 82.6 96.6
14A 80.4 95.1 14A 83.8 96.1
49
Lindosland, A-Weighting, Wikimedia commons, web.
52
14B 78.5 96.3 14B 82.9 96.3
15A 78.4 93.9 15A 82.1 95.6
15B 78.6 95.6 15B 83.2 96.3
Légende :
SPL A = Mesure en dB SPL avec filtre de type A en mode maximum
SPL C = Mesure en dB SPL avec filtre de type C en mode maximum
Tableau 7 : Résultats des tests de puissance acoustique au LANTISS
Rouge = Baisse de niveau par rapport à l‘original
Bleu = Hausse de niveau par rapport à l‘original
Sous-Total :
MIX A : 7 V 8
MIX C : 10 V 5
LIMITÉES A : 8 V 7
LIMTÉES C : 5 V 11
Total :
MIX : 17 VS 13
LIMITÉES : 11 VS 19
53
Conclusion : analyse des résultats
Malgré notre échantillon et nos outils modestes, tentons de voir si nous pouvons
tirer une fonction ou observer une constante à partir de nos données. Allons-y alors en
ordre.
Versions A et B au mix
Pour les mesures dynamiques des pièces au Mix, nous constatons que toutes ont une
gamme dynamique supérieure à la norme de Tischmeyer, à l‘exception des pièces 6A et 6B,
qui entrent dans la catégorie hip-hop, ce qui demande plus de dynamique. Aussi, les
colonnes des crêtes sont toutes rouges, à l‘exception des premières, car toutes affichaient
l‘alerte clip au true peak meter, même si le Big Meter de Reason restait muet à cet égard.
En regardant les options du Nugen LM, nous avons constaté que cette lumière devait
s‘allumer à chaque fois qu'une crête dépassait la barre des -1 dB, ce qui nous fait penser
que cette fonction est plus préventive, qu‘une « réelle » détection d‘un dépassement du
niveau. En ce qui concerne les mesures soniques, nous sommes toujours au-dessus
des -23 LKFS visés par les normes EBU et ITU, de sorte que nous nous rangeons parmi les
réalisateurs audionumériques insatisfaits de cette norme qui, à notre avis, vise trop bas pour
les pièces de musique dansantes ou ne s‘adresse qu‘aux téléspectateurs cherchant à garder
un niveau des dialogues constants pour ne pas qu‘ils aient à ajuster le niveau sonore de leur
télévision. Comme nous, certains réalisateurs semblent être du même avis : « We have
encountered heated complaints by mixers and producers who stated that such material,
when automatically matched to the surrounding program material via the BS 1770 meter,
can air up to 3 dB quieter in subjective terms. In turn this has constrained the ability o
producers to specify the type of audio processing they had previously used to give this
material excitement and punch »50
, affirment les gens de chez Orban concernant la réponse
des réalisateurs aux standards de mesure BS 1770. Par contre et en ce qui concerne les
normes de Tischmeyer (TT DR), nous les avons plutôt trouvées très réalistes, fonctionnelles
et très utiles.
De manière générale, nous n‘avons pas pu mesurer des changements significatifs au
niveau de la sonie et de la dynamique entre les versions A et B, ce qui nous semble assez
50
Orban White Paper Using the ITU BS.1770-2 and CBS Loudness Meters to Measure Loudness Controller
Performance, web.
54
décevant. Nous avons tenté d‘élaborer des tableaux graphiques de type « nuage de points »,
mais aucune tangente intéressante n‘est apparue. Aussi, le fait que nous puissions
apercevoir une distinction sonique entre les versions, sans toutefois pouvoir la mesurer,
nous apprend potentiellement trois choses :
1. Même s‘ils sont perceptibles, les changements soniques et dynamiques entre les
versions A et B au Mix ne sont pas assez significatifs pour pouvoir être mesurés.
2. Les appareils et standards de mesure ne sont pas assez sensibles et développés pour
pouvoir rendre compte de notre perception à la hausse des changements soniques
des versions A aux versions B au Mix.
3. Notre échantillon est peut-être trop petit.
En ce qui concerne les différences de puissance acoustique entre les versions A et B
au Mix, il n‘y a, encore une fois, pas de changements significatifs. Nous avons
généralement observé que les versions B sont acoustiquement moins puissantes que les
versions A, lorsque nous avons utilisé un filtre de type C sur notre dB mètre. Cela nous
indique que les versions A ont sans doute plus de basses fréquences (détectables en mode
C), puisqu‘en mode A (plus près de la perception humaine), cette tendance des versions A à
B est radicalement inversée.
En combinant nos observations subjectives favorables à une hausse de la perception
sonique des versions B par rapport aux versions A, et en combinant celles-ci à nos données
mesurées, nous constatons que nos compositions « averties » dans l‘optique de l‘obtention
d‘une sonie élevée n‘ont pas apporté de changements significativement supérieurs en sonie.
Versions A et B limitées
Nous avons utilisé un limiteur sur les deux versions afin d‘observer s‘il y en a une
qui se travaille mieux par rapport aux autres. Pour des fins de compatibilité des
comparaisons, nous avons décidé de n‘utiliser qu‘un limiteur dans sa forme la plus simple
55
et un égaliseur, afin de pouvoir réellement comparer une pratique de conception sonore par
rapport à une autre51
.
Hélas, si nous voulons encore comparer les versions A aux versions B, nous
constatons, par l‘analyse des données et par des tentatives infructueuses à dresser des
tangentes dans des graphiques à nuages de points, que nous ne pouvons pas tracer une
fonction ou une constante démontrant ou infirmant une tendance sonique ou une tendance
dynamique des versions A par rapport aux versions B. De manière générale, les deux
versions ont le même profil dynamique et sonique (inutile de spécifier que nous étions bien
trop au-dessus de -23 LKFS, même si les pièces obtenues étaient bien moins fortes sur le
lan de la sonie que la plupart des chansons commerciales auxquelles nous pouvons nous
comparer, car les normes de Tischmeyer permettent une grande dynamique). Les hausses
d‘une version à l‘autre sont toujours équilibrées ou égalées par une autre baisse. Lorsque
nous avons mesuré les niveaux SPL des pistes limitées, nous avons pu observer une
tendance générale à la hausse des niveaux des versions A à B par rapport à ceux pour les
versions au Mix. Toutefois, la portée de cette tendance est très limitée, car les hausses
étaient généralement assez minimes (1 ou 2 dB, quoiqu‘il s‘agisse de valeurs
logarithmiques) d‘une version à l‘autre et parce que, comme nous l‘avons affirmé plusieurs
fois, la mesure du niveau sonore en dB est un indice du niveau de la sonie (car il y a
corrélation entre les deux), mais nous ne pouvons pas, pour cela, dresser un lien de cause à
effet et affirmer une hausse de la sonie.
En plus de n‘avoir obtenu aucun avantage sonique aux versions B par rapport aux
versions A, nous n‘avons pas obtenu davantage de dynamiques, car au final, les mesures
demeuraient presque identiques d‘une version à l‘autre. Aussi, nous croyons avoir annulé la
hausse sonique en diminuant les fréquences que nous avions tenté d‘augmenter à l‘étape de
la conception sonore à l‘aide des égaliseurs (13 cas sur 15). Nous avions voulu rester
honnête par rapport à nous-mêmes en apportant les modifications harmoniques qui nous
apparaissaient essentielles, et ce, en ne comptabilisant nos résultats qu‘à la fin. Nous nous
rendons maintenant compte que la plupart des changements que nous avons faits à l‘étape
51
Nous expliquons l‘origine de ce choix à Annexe 2.
56
de la conception sonore étaient trop agressifs à notre gout une fois que le signal audio avait
passé dans le limiteur.
Sommaire
En somme, et en toute conscience de l‘échantillon sonore et des outils modestes
dont nous disposions, les changements soniques obtenus par l‘utilisation créative de
principes soniques à l‘étape de la réalisation audionumérique ne sont pas suffisamment
satisfaisants pour justifier ou rendre pertinents, d‘un point de vue combiné de la perception
et de la mesure des résultats obtenus, l‘effort et les peines encourues par le souci d‘une
conception sonore qui risque d‘aller à l‘encontre des préférences de timbre du compositeur.
Comme notre échantillon était assez restreint, nous décidons d‘accorder encore une chance
aux standards de mesure soniques décevants au cours du prochain chapitre où nous
tournons notre approche organique du matriçage et du processus de réalisation
audionumérique vers une méthode qui, nous le croyons, aura moins d‘impact sur le
processus de création, mais un apport plus positif à la dynamique, et donc aussi à la sonie,
finales. Il s‘agit de travailler directement à partir de l‘élément dynamique le plus influent
d‘un mix de musique « dance » lourdement compressé ; il s‘agit des percussions, puisque
leurs amplitudes sont les premières à être altérées lorsqu‘il y a une forte réduction de la
marge dynamique à la suite de l‘usage d‘outils comme les limiteurs et les compresseurs.
57
Chapitre 2 : Programmation des boucles et paramétrage du traitement de signal en
vue du contrôle de la dynamique des percussions
Introduction
Problématique
Nous nous proposons maintenant d‘orienter notre recherche vers les percussions.
Comme celles-ci sont des éléments dynamiques apériodiques caractérisés par la puissance
de leur spectre52
, qui influencent énormément la constitution des crêtes lors des mix finaux,
nous pensons qu‘il s‘agit ici de phénomènes idéaux pour tester l‘incidence de la variation
des vélocités lors de leur programmation sur la gamme dynamique et les distorsions suite à
l‘écrêtage de l‘étape du matriçage en vue d‘obtenir un mix final à forte sonie. Nous voulons
simplement tester trois types de pratiques de programmation de percussions (notre but n‘est
pas d‘obtenir des résultats très réalistes), pour ensuite les écraser avec un limiteur afin de
voir s‘il nous est possible de dresser une tendance dynamique et/ou de sonie générale pour
chaque pratique de programmation. En faisant cela, nous souhaitons voir si une pratique est
plus avantageuse qu‘une autre pour l‘obtention d‘un résultat final à sonie élevée sans les
désavantages habituels (distorsions et perte de gamme dynamique). Sachant cela, notre
réalisateur hypothétique pourra peut-être mieux orienter ses pratiques de composition dès
l‘étape de la conception sonore et de la programmation en vue de faciliter le travail de
postproduction/matriçage soniquement et dynamiquement « agressifs », une pratique par
laquelle la gamme dynamique est réduite de manière à générer des mix perceptiblement
forts. Rappelons que cela est intrinsèquement lié au fait que nous percevons la sonie par le
niveau moyen d‘une piste et non par le degré d‘amplitude des crêtes (peak level)53
. De plus,
ce désir d‘une dynamique « agressive » s‘inscrit dans le contexte des pratiques
audionumériques et de la musique dance actuelles, quoique nous ne remettions pas en
question la réelle pertinence d‘aller aussi loin dans l‘écrêtage au cours du présent chapitre.
Concernant cette controversée pratique, il est très courant de lire des affirmations qui,
lorsqu‘elles ne considèrent pas la compression comme un élément esthétique désirable chez
les créateurs de musique house, l‘endossent complètement : « Compression plays a major
52
Heinrich Kuttruff, Acoustics – An Introduction, (New York, Taylor & Francis, 2007), 210. 53
Rick Snoman, The Dance Music Manual, 32.
58
part or my sound. I have them patched across every output of the desk », affirme le
compositeur de musique house Armand Van Helden, « Without compression, drums appear
wimpy in comparison to the chest thudding results heard in professionally produced music,
mixes can appear lacking in depth and basses, and vocals and leads can lack any real
presence », affirme Rick Snomann, auteur du Dance music manual54
. « Compression »,
« comparison » et « professionally produced music » sont les termes clés qui résument le
contexte dans lequel s‘inscrit ce chapitre.
Les changements des vélocités ont un certain effet sur les échantillons
déclenchés/générés par les modules de sons virtuels. Si ceux-ci désignent la force de frappe
de la note, nous pouvons nous demander qu‘est-ce que cela signifie concrètement sur le son
lorsqu‘il s‘agit d‘évènements audionumériques. Il y a un terrible manque d‘informations
quant au routage virtuel interne des stations de travail digitales et des instruments virtuels
sur contrôle de la vélocité. Il est très commun que les échantillons contrôlés par les
instruments virtuels soient les mêmes pour plusieurs vélocités. Traditionnellement, pour
une intonation différente, le contrôle de la vélocité est routé à un VCA (Voltage controlled
amplifier, où le voltage est utilisé pour contrôler l‘amplification) et/ou à un VCF, où le
voltage est utilisé pour altérer la fréquence d‘un filtre55
. Il arrive également que des
paramètres tels le vibrato et la hauteur (pitch) soient assignés à un contrôle de vélocité,
mais nous n‘utilisons pas de tels effets pour nos expériences avec les percussions. Ableton
Live, la station de travail digitale dont nous nous servons dans la présente section, utilise
certainement l‘amplification et le filtrage pour le contrôle de la vélocité des notes MIDI.
Cependant, la proportion et le type de l‘amplification contrôlée par la vélocité nous sont
inconnus. En ce qui a trait au filtre, il s‘agit par défaut d‘un passe-bas à 12dB par octave.
Ce dernier est modifiable, mais nous avons choisi d‘utiliser le standard pour ne pas
introduire des facteurs trop marginaux par rapport aux programmations habituelles. Malgré
cela, il nous est tout de même difficile de connaitre la proportion exacte de l‘affectation de
chacun de ces effets sur le son par l‘intermédiaire d‘un contrôle des vélocités. Cela est sans
doute une question d‘algorithmes que seuls les programmeurs du logiciel connaissent :
54
Rick Snoman, The Dance Music Manual, 31. 55
Martin Russ, Sound Synthesis and Sampling, 2e édition, (Elsevier, Focal Press, 2004), 88 et Bruno Lüthi,
Physical acoustics in the solid state, (New York, Springer, 2005), p. 8.
59
« How a device responds to these messages [MIDI channel pressure] will often vary from
manufacturer to manufacturer (or can be assigned by the user) »56
.
Il reste néanmoins que nous entendons des phénomènes constants dans notre
manipulation des vélocités de ce logiciel, de sorte que nous pouvons en tirer une constante
basée sur un raisonnement inductif, ou sur nos observations répétables, que certains
pourraient qualifier d‘empiriques. En effet, nous avons globalement observé que les notes
aux vélocités les plus fortes ont un gain plus élevé et des harmoniques plus riches que leurs
équivalentes à faibles vélocités pour des sons percussifs provenant de la banque de son de
Ableton Live 8. À l‘inverse, les notes à faibles vélocités ont moins d‘harmoniques (leur
enveloppe semble filtrée en passe-bas ou en shelving sur les fréquences élevées) et elles ont
un gain plus faible. Encore une fois, les proportions exactes de ces variations nous sont
inconnues et il se peut qu‘il y ait d‘autres facteurs changeants impliqués dans le contrôle
des vélocités, mais il est indéniable que le contrôle des vélocités affecte la dynamique et le
spectre de l‘échantillon qui lui est désigné. Nous tentons néanmoins d‘utiliser comme guide
ultime nos oreilles.
En prenant compte du déroulement des expérimentations et des résultats obtenus, il
ne sera peut-être pas trop extravagant que de projeter les conclusions obtenues sur des
pratiques similaires, soit des variations des vélocités pour la programmation MIDI d‘autres
instruments.
Méthodologie
Il est étonnamment difficile d‘élaborer une méthode « empirique » pour réaliser
notre entreprise, et il nous faut réfléchir à plusieurs facteurs avant de nous lancer dans la
conception sonore et la programmation. Premièrement, il nous faut évaluer entre eux des
boucles de percussions qui ont un niveau sonique et dynamique similaires dès le départ.
Pour cela, la mesure de niveaux « moyens » comme les dB RMS, la gamme dynamique et
les LUFS sont des candidats de mesure pratique, quoique leurs standards restent à être
éprouvés quant à leur efficacité à mesurer les nuances légères entre les échantillons.
56
David Huber, « MIDI : Handbook for Sound Engineers », Audio Engineering Explained, (Elsevier, Focal
Press, 2010), 463.
60
Comme nous évaluons des « évènements » auditifs très courts (crêtes/transiants) pour leur
sonie (niveaux moyens), il est difficile de savoir si des mesures soniques peuvent être
significatives. Dans un tel contexte, il est sans doute plus approprié d‘évaluer la sonie des
échantillons percussifs en fonction de leur gamme dynamique, où une gamme dynamique
faible est un équivalent corrélationnel à un niveau sonique élevé. Par « corrélationnel »,
nous voulons simplement indiquer qu‘une certaine gamme dynamique ne remplace pas ou
ne cause pas une certaine mesure sonique définie, mais seulement qu‘une mesure de
gamme dynamique est un bon indice de la sonie d‘un échantillon lorsqu‘il s‘agit d‘un
contexte où la pratique musicale vise une forte sonie (lorsque le niveau moyen du signal est
poussé contre un plafond défini près du « 0 » digital). Ainsi, pour qu‘une comparaison soit
possible, et pour qu‘une telle mesure dynamique soit connexe à une mesure de sonie, il
faut, dès le départ, utiliser une sorte de réduction de gain/compression/normalisation,
quoique plus faible que celle de l‘étape du limiteur broyeur de la postproduction, pour que
la gamme dynamique soit calculée à partir d‘un plafond commun (par exemple -3 dB FS),
afin que les échantillons puissent prétendre une quelconque forme de comparaison
quantitative pour appuyer nos observations subjectives. Aussi, lorsque nous parlons de
« comparaison », nous entendons une comparaison entre les différentes pratiques lors de
notre expérimentation, et non une comparaison entre tous les échantillons qui font partie de
notre expérience57
.
Autrement dit, pour qu‘une mesure dynamique ou une mesure moyenne des crêtes
se traduisent en un langage sonique comparatif entre plusieurs éléments auditifs, il faut que
ces éléments aient un même plafond, car un échantillon peu dynamique au plafond de -20
dBFS sera soniquement perçu à un niveau faible alors que le même échantillon peu
dynamique à un plafond de -1 dBFS sera soniquement perçu à un niveau très élevé. Ainsi
donc, dans ce dernier exemple, il est non significatif de comparer la gamme dynamique des
échantillons dans la perspective d‘obtenir un comparatif au niveau de leur sonie. Nous
ferons alors le contraire en mesurant la dynamique moyenne partir d‘un plafond commun
correspondant à un type de quantification se rapprochant du niveau sonique, ce qui est
pratique dans notre cas (car nous souhaitons vérifier des échantillons constitués d‘éléments
auditifs très brefs).
57
Voir chapitre Conclusion.
61
Il reste néanmoins qu‘il est très difficile d‘évaluer d‘une manière « quantitative » et
rigoureuse la question à savoir si les différentes versions des boucles des percussions sont
soniquement comparables entre elles au départ, car comme nous le savons déjà, la sonie ne
se quantifie que d‘une manière très bancale puisqu‘elle est le produit d‘une expérience
subjective, phénomène vécu d‘un domaine qualitatif. Il reste que nous croyons tout de
même qu‘il est pertinent de tenter d‘obtenir des mesures soniques quantitatives lorsqu‘elles
sont accompagnées d‘une écoute attentive et avertie, car cela permet un plus grand niveau
de rigueur dans l‘expérimentation. En somme et pour clore le présent paragraphe, il nous
faut normaliser le plafond des crêtes de nos boucles dès le départ (avant la compression en
vue de l‘obtention de la sonie), une étape qui a également fait partie de la méthodologie de
recherche d‘Emmanuel Deruty dans son enquête sur la dynamique de la musique entre
1969 et 2010, quoiqu‘il n‘explique pas en détails les particularités de son procédé de
normalisation58
. Pour nous, l‘élaboration d‘un plan de normalisation doit passer par les
points suivants :
a. Le niveau maximal atteint des crêtes doit être le même pour toutes les versions.
Nous nous assurons de cela en appliquant un premier limiteur sur chaque mix des
percussions à -3 dBFS, un niveau maximal de crêtes que nous considérons commun/normal
pour les percussions dans la musique « dance » à l‘étape du mixage59
. La réduction de gain
du limiteur devra être la même pour les versions à comparer : soit la réduction la plus basse
possible (< 0.1 dB). L‘action du limiteur (attaque, relâchement, etc.) sera la plus
courte/rapide possible, afin que le caractère des crêtes soit préservé de manière maximale et
puisqu‘il s‘agit d‘éléments percussifs rapides.
b. Pour qu‘il y ait une comparaison possible entre les niveaux RMS et la gamme
dynamique, toutes les programmations des percussions devront être identiques (BPM,
nombre d‘éléments percussifs, programmation MIDI des notes). Nous comprenons que la
moindre variation de ces éléments rendra nos résultats non significatifs : par exemple, si
nous diminuons la vitesse d‘un mix, la gamme dynamique augmentera soudainement, ce
qui nous rappelle encore les failles de la recherche de monsieur Deruty, qui introduit des 58
Emmanuel Deruty, « ‗Dynamic range‘ & the loudness war », web. 59
Il s‘agit bien du niveau maximal des crêtes et non d‘un niveau moyen (dB RMS). Ce niveau a été déterminé
simplement parce qu‘il ne manquait que très peu de puissance aux pistes pour atteindre -3 dB de sorte qu‘elles
n‘ont pas eu besoin d‘une très grande amplification.
62
aspects stylistiques non mesurables dans sa recherche, ce qui n‘est pas « nous renseigner
sur les pratiques soniques d‘une époque par rapport à une autre ». Comme nous focalisons
en particulier sur la musique « dance », nous définissons notre vitesse à 120 BPM. Nos
éléments percussifs seront standards : 1 grosse caisse, 1 caisse claire (ou un « clap ») et 1
type de cymbales-à-pied.
c. Les niveaux RMS et LUFS intégrés (soit les moyennes pour la durée totale des
boucles) des versions à comparer devront être similaires, quoique, en raison des limites des
mesures « quantitatives » de la sonie, ces mesures nous serviront seulement de références
pour avoir le point de vue de la « machine » ou, si vous voulez, connaitre leur importance
dans la bande passante disponible d‘une seule piste stéréo maitresse afin d‘apporter un
complément de rigueur à notre écoute.
Nous varions la programmation des vélocités avec comme but d‘obtenir des
percussions qui ont un effet de « groove dynamique », soit des percussions dansantes. Pour
les cymbales-à-pied, nous mettons l‘accent sur les 1/8 de mesures paires, ou dit en langage
courant, nous mettrons l‘accent sur les contretemps. Pour les coups de grosse caisse, nous
mettons l‘accent sur le deuxième temps, soir sur le temps du coup de la caisse claire.
Nous ajoutons également une troisième version dans laquelle l‘effet de « groove
dynamique » des cymbales-à-pied est fabriqué à l‘aide d‘une compression latérale (side-
chain compression en anglais)60
activée par un signal-fantôme externe déclenché en tout
temps, à l‘exception des contretemps. Pour cette troisième version, les cymbales-à-pied ont
tous une vélocité identique. Nous souhaitons tester ce type de compression afin de
connaître sa valeur de « groove dynamique » et pour tenter de voir si elle aura une
incidence sur la qualité du son.
60
Il s‘agit d‘une compression sur un signal, qui est programmée à agir lorsque le compresseur en reçoit
l‘ordre par un autre signal. Cela est couramment désigné comme une compression en « side-chain », un terme
venant de l‘expression anglaise « side-chain compression », mais que l‘on pourrait traduire par « compression
latérale » ou « compression par contrôle latéral ». Voir Roey Izhaki, Mixing Audio – Concepts, practices and
tools, 283.
63
La programmation de nos percussions en images
Figure 92 : Programmation de boucles standard (CÉ).
Il s‘agit ici de la programmation de nos boucles « standard » ou sans variation des
vélocités pour 4 mesures (nos échantillons audio sont constitués de 8 mesures, soit la durée
pour laquelle nous calculons les niveaux de nos échantillons) sur le « Drum Rack » de
Ableton Live 8. Les grosses caisses et les caisses claires ont la même vélocité. cymbales-à-
pied ont une vélocité légèrement plus basse : cette dernière a été déterminée de manière à
s‘assurer que les niveaux dynamiques et soniques demeurent constants d‘une version à une
autre. Remarquons aussi que les coups de caisses claires sont toujours appuyés par un coup
de grosse caisse, comme il est commun de le faire dans certains types de musique
« dance ».
Figure 93 : programmation de boucles aux vélocités variées (CÉ).
Cette figure illustre notre programmation pour les boucles à vélocités variées. Ici,
les cymbales-à-pied sont programmés de manière à ce que nous obtenions des coups
marqués sur les contretemps afin de donner une sensation de mouvement aux percussions.
Aussi et comparativement à la figure précédente, la vélocité des caisses varie de manière à
64
créer du mouvement entre les coups de grosse caisse et de caisse claire, ce qui a un effet de
« groove dynamique »61
.
Figure 94 : Programmation de percussions avec compression latérale (CÉ).
Cette figure illustre notre programmation pour les boucles au « groove dynamique »
provoqué par une compression latérale sur les cymbales-à-pied. La vélocité de ces derniers
est plus élevée que la vélocité de nos exemples à programmation standard de manière à
obtenir des niveaux soniques et dynamiques comparables. La variation des vélocités des
grosses caisses est la même que pour l‘exemple précédent.
Figure 95 : Programmation du signal externe pour la compression latérale.
Cette figure illustre notre programmation du signal pour la compression latérale
externe. Les espaces entre les carrés rouges MIDI représentent les moments où les
cymbales-à-pied ont la ‗permission‘ d‘atteindre leurs crêtes maximales. Autrement dit, les
espaces blancs sont les moments où le compresseur n‘agit pas sur les cymbales-à-pied,
alors que les carrés rouges MIDI représentent les moments où elles sont affectées par le
compresseur.
Nous avons choisi une onde de type sinusoïdale comme signal fantôme (un signal
que nous n‘entendons pas dans le mix) pour le traitement dynamique latéral externe, mais
61
Dow Rory, « Programming realistic drum parts », Sound on Sound, septembre 2010, web.
65
cela aurait pu être n‘importe quelle sorte d‘onde, étant donné que son effet était appliqué
sur tout le spectre des cymbales-à-pied à être compressées. Les temps de l‘enveloppe sont
les éléments auxquels il a fallu faire attention :
Figure 96 : Synthétiseur générant le signal externe pour la compression latérale (CÉ).
Il fallait une attaque très rapide et un déclin qui demeurait à un niveau audible pour
au moins un quart de mesure. Le temps de relâchement était quasi nul, de sorte qu‘il nous a
fallu simplement couper la note MIDI du signal externe pour la compression latérale au
moment où nous voulions que la compression arrête. Les plus petits ajustements à cet égard
ont été réalisés à l‘aide du temps de relâchement des compresseurs. Pour que l‘effet soit
complet, il nous a donc fallu programmer les compresseurs de la manière suivante :
Figure 97 : Compresseur pour le traitement latéral (CÉ).
Il n‘y a rien de particulier à mentionner sur les caractéristiques de ces réglages, mis
à part qu‘ils sont assez drastiques et agressifs, afin de bien entendre les effets. Ceux-ci
auraient pu être totalement autres si le compresseur avait été combiné avec un signal de
latéral externe différent. Nous nous sommes simplement servi de nos oreilles pour
déterminer si le mouvement dynamique obtenu était intéressant et comparable à celui de
l‘exemple aux vélocités variées. Au final, le processus entourant le la compression latérale
est beaucoup plus long à expliquer qu‘à effectuer : dans ce cas particulier, un évènement
sonore externe gère le gain des cymbales-à-pied afin de créer un mouvement dynamique
intéressant pour la musique électronique dansante.
66
Pour synthétiser cette dernière section, nous souhaitons essayer de simuler une sorte
de performance humaine qui un effet de « groove dynamique » (en ne visant pas un
réalisme absolu). Cela s‘est, en somme, traduit en une production de 240 échantillons :
40 programmations sans varier les vélocités avant compression.
40 programmations sans varier les vélocités après compression.
40 programmations en variant les vélocités avant compression.
40 programmations en variant les vélocités après compression.
40 programmations avec une compression latérale externe activée par les
grosses caisses sur les cymbales-à-pied avant compression.
40 programmations avec une compression latérale externe activée par les
grosses caisses sur les cymbales-à-pied après compression.
Le contrôle des crêtes
Figure 98 : Limiteur Oxford (CÉ).
Limiteur Oxford : pour chaque échantillon d‘avant compression, il ne travaille qu‘au
minimum possible. Nous ajustons les niveaux des échantillons au mixeur de manière à faire
déclencher la première lumière de la graduation de la réduction du gain, afin de s‘assurer
que tous ont un plafond commun (-3.0 dB), sans néanmoins être encore significativement
compressés.
67
Figure 99 : Oxford EQ, Waves Trans X Wide & Oxford Limiter (CÉ).
En ordre, les modules après compression : Égaliseur Oxford (HP12 à 36.5Hz), TransX
Wide de Waves et Oxford Limiter avec un gain de 6.04 dB en entrée et une sortie limitée à
-0.82 dB62
. Nous enlevons légèrement les très basses fréquences, comme cela est très
courant de le faire63
, de manière à ne pas faire trop travailler le limiteur. Nous nous servons
légèrement du module Trans X Wide64
, nous l‘avons mis à 1.0 ce qui est assez faible), de
manière à donner de la largeur aux transients. Cela a pour effet d‘augmenter efficacement
la sonie avant le limiteur, ce qui nous permet d‘éviter une surcompensation au gain d‘entrée
de ce dernier.
62
Il vaudrait la peine d‘effectuer des recherches plus poussées concernant le « headroom » laissé aux pistes
après le matriçage. À la lumière de la présentation Loudness Wars de Thomas Lund (TC Electronics) à Rome
Calling et à la lumière de nos récentes observations, le standard commun de -0,3 dB (Tischmeyer, Audio
Mastering with PC workstations, par exemple) est trop faible pour empêcher l‘écrêtage, car nos mesures des
crêtes sont trop approximatives pour détecter les transitoires très rapides. Cela est encore plus vrai lorsque le
mix est destiné à être converti en un format mp3 léger. Sans entrer dans des détails trop poussés, la règle
générale de la prudence semble nous dicter qu‘il vaut mieux laisser plus de « headroom » que moins, d‘où
notre choix d‘une limite plus prudente que les conventionnelles. 63
Floyd Toole, Sound Reproduction, Loudspeakers and rooms, (Elsevier, Focal Press, 2008), 242. 64
Durant la dernière année, nous avons essayé de nombreux outils pour augmenter le niveau de sonie de nos
mix. La plupart de ces derniers bourrent vraiment sans les élargir le son de sorte qu‘ils compromettent
grandement la qualité du signal audio. Nous ne sommes vraiment pas des amateurs des plug-ins Waves en
général, mais le module Trans X Wide nous semble un choix parmi les moins pires au travers des plus-ins que
nous avons eu la chance d‘essayer… dans la foule d‘outils qu‘il est possible de trouver. Nous avons
également découvert que ce module était aussi utilisé par le producteur JJ Puig, voir Paul Tingen, « Secrets of
the mix engineers : JJ Puig », article paru dans la revue Sound on Sound, novembre 2007, web.
68
Collecte des données
Résultats avant compression :
Tableau 8 : Boucles standard sans variation aux vélocités.
Échantillon dB RMS
intégrés
Gamme
dynamique
intégrée dBFS
Sonie intégrée
LUFS (EBU + 18)
1 -21,9 18 -21,8
2 -23,9 19 -22,5
3 -21,5 17 -22,7
4 -19 15 -20,8
5 -24,2 20 -23,2
6 -17,6 14 -18,8
7 -19,2 16 -20,2
8 -19,5 16 -20,7
9 -20,3 17 -20
10 -20,5 17 -21,9
11 -15,3 12 -17,9
12 -30,3 27 -31,9
13 -12,5 9 -16
14 -21,8 19 -21,6
15 -17,7 14 -18,1
16 -16,7 13 -20,5
17 -21,9 19 -22,5
18 -18,7 15 -19
19 -17,1 13 -17,2
20 -20,2 17 -19,5
21 -20,7 17 -22,7
22 -23,8 20 -23,4
23 -23,8 20 -24
24 -20,8 17 -21,6
25 -22,7 18 -20,2
26 -21,7 18 -21,5
27 -23,4 21 -21,4
28 -20,1 17 -19,1
29 -22,7 19 -22,5
30 -22 18 -20,4
31 -15,1 12 -16,4
32 -13,3 10 -16,2
33 -14,3 11 -18,2
34 -17,9 14 -19,4
35 -16,7 14 -18,6
36 -17 14 -18,5
69
37 -22 18 -22,5
38 -15,7 12 -16,7
39 -15,2 12 -16,5
40 -19,4 16 -21,1
Min -30,3 9 -31,9
Max -12,5 27 -16
Tableau 9 : Boucles avec variation de vélocités.
Échantillon dB RMS
intégrés
Gamme
dynamique intégré
dBFS
Sonie intégrée
LUFS (EBU + 18)
1 -21,7 18 -21
2 -23,4 20 -21,7
3 -21,6 17 -21,8
4 -19,5 16 -20,9
5 -23,3 20 -21,1
6 -18,1 15 -19
7 -19,3 17 -19,9
8 -20 17 -20,4
9 -19,7 16 -19,3
10 -20,8 17 -21,8
11 -16,3 13 -18,6
12 -30,5 27 -32
13 -12,7 9 -16
14 -21,4 19 -20,6
15 -18,9 15 -19,2
16 -17,1 13 -20,3
17 -21,5 19 -21,3
18 -18,2 15 -17,9
19 -17,4 14 -16,7
20 -20,1 17 -19,1
21 -20,8 17 -22,1
22 -23,7 20 -23,2
23 -24,1 21 -24,5
24 -21,6 18 -21,9
25 -22,5 18 -19,7
26 -21,3 18 -20,2
27 -22,8 20 -20,3
28 -19,2 17 -17,2
29 -23 20 -23
30 -21,3 19 -18,6
31 -15,6 12 -16,7
32 -14 11 -17
70
33 -14,6 11 -18,8
34 -18,6 15 -20,3
35 -17,1 14 -18,2
36 -17,5 14 -18,1
37 -22,3 19 -23,5
38 -16,2 13 -17,7
39 -15,7 13 -17,8
40 -20,2 17 -21,7
Min -30,5 9 -32
Max -12,7 27 -16
Tableau 10 : Boucles avec compression latérale externe (side-chain compression).
Échantillon dB RMS
intégrés
Gamme
dynamique
intégrée dBFS
Sonie intégrée
LUFS (EBU + 18)
1 -21,7 18 -20,9
2 -23,4 20 -21,2
3 -21,4 17 -21,3
4 -19,5 16 -20,9
5 -23,2 20 -21
6 -18,1 15 -18,8
7 -19,3 17 -19,7
8 -20,2 17 -20,3
9 -19,6 16 -18,9
10 -20,8 17 -20,5
11 -16,3 13 -18,5
12 -30,4 27 -31,7
13 -12,7 9 -15,9
14 -21,3 18 -20,5
15 -18,9 15 -19,3
16 -17,1 13 -20,3
17 -21,4 18 -21,1
18 -18,1 15 -17,5
19 -17,3 14 -17
20 -20 17 -18,9
21 -20,6 17 -21,6
22 -23,7 20 -23,6
23 -24,1 21 -24,5
24 -21,5 18 -21,6
25 -22,5 18 -19,5
26 -21,2 18 -20
27 -22,6 20 -19,9
28 -18,6 16 -16,3
71
29 -23 20 -22,8
30 -21,2 19 -18,6
31 -15,5 12 -16,6
32 -14 11 -16,9
33 -14,6 12 -18,9
34 -18,5 15 -20,1
35 -17,1 14 -18,9
36 -17,5 14 -18,9
37 -22,2 19 -23,4
38 -16,1 13 -17,6
39 -15,7 13 -17,8
40 -20,2 17 -22,6
Min -30,4 9 -31,7
Max -12,7 27 -15,9
Tableau 11 : [Avant compression] v. (variation) des versions à « groove dynamique » par rapport à la version
originale sans v. de vélocités, où « x » = à la v. de la version aux vélocités variées et « y » =à la v. de la
version latéralement compressée. Les « - » indiquent qu‘il y a eu un changement à la baisse quant à la gamme
dynamique et/ou une augmentation quant à la sonie dans le présent contexte.
Échantillon dB RMS intégrés Gamme dynamique
intégrée dBFS
Sonie intégrée LUFS
(EBU + 18)
x y x y x y
-0,2 -0,2 0 0 -0,8 -0,9
2 -0,5 -0,5 1 1 -0,8 -1,3
3 0,1 -0,1 0 0 -0,9 -1,4
4 -0,5 -0,5 1 1 0,1 0,1
5 -0,9 -1 0 0 -2,1 -2,2
6 0,5 0,5 1 1 0,2 0
7 -0,1 -0,1 1 1 -0,3 -0,5
8 0,5 0,7 1 1 -0,3 -0,4
9 -0,6 -0,7 -1 -1 -0,7 -1,1
10 0,3 0,3 0 0 -0,1 -1,4
11 1 1 1 1 0,7 0,6
12 0,2 0,1 0 0 0,1 -0,2
13 0,2 0,2 0 0 0 -0,1
14 -0,4 -0,5 0 -1 -1 -1,1
15 1,2 1,2 1 1 1,1 1,2
16 0,4 0,4 0 0 -0,2 -0,2
17 -0,4 -0,5 0 -1 -1,2 -1,4
18 -0,5 -0,6 0 0 -1,1 -1,5
19 0,3 0,2 1 1 -0,5 -0,2
20 -0,1 -0,2 0 0 -0,4 -0,6
72
21 0,1 -0,1 0 0 -0,6 -1,1
22 -0,1 -0,1 0 0 -0,2 -0,9
23 0,3 0,3 1 1 0,5 0,5
24 0,8 0,7 1 1 0,3 0
25 -0,2 -0,2 0 0 -0,5 -0,7
26 -0,4 -0,5 0 0 -1,3 -1,5
27 -0,6 -0,8 -1 -1 -1,1 -1,5
28 -0,9 -1,5 0 -1 -1,9 -2,8
29 0,3 0,3 0 -1 0,5 0,3
30 -0,7 -0,8 1 1 -1,8 -1,8
31 0,5 0,4 0 0 0,3 0,2
32 0,7 0,7 1 1 0,8 0,7
33 0,3 0,3 0 1 0,6 0,7
34 0,7 0,6 1 1 0,9 0,7
35 0,4 0,4 0 0 -0,4 0,3
36 0,5 0,5 0 0 -0,4 0,4
37 0,5 0,4 1 1 1 0,9
38 0,5 0,4 1 1 1 0,9
39 0,5 0,5 1 1 1,3 1,3
40 0,8 0,8 1 1 0,6 1,5
Min -0,9 -1,5 -1 -1 -2,1 -2,8
Max 1,2 1,2 1 1 1,3 1,5
Tableau 12 : [Avant compression] V. (variation) des variations, « y » par rapport à « x ». Les « - » indiquent
qu‘il y a eu un changement à la baisse quant à la gamme dynamique et/ou une augmentation quant à la sonie
dans le présent contexte.
Échantillon dB RMS
intégrés
Gamme
dynamique
intégrée
dBFS
Sonie
intégrée
LUFS
(EBU+18)
0 0 -0,1
2 0 0 -0,5
3 0 0 -0,5
4 0 0 0
5 -0,1 0 -0,1
6 0 0 -0,2
7 0 0 -0,2
8 0,2 0 -0,1
9 -0,1 0 -0,4
10 0 0 -1,3
11 0 0 -0,1
12 -0,1 0 -0,3
73
13 0 0 -0,1
14 -0,1 -1 -0,1
15 0 0 0,1
16 0 0 0
17 -0,1 -1 -0,2
18 -0,1 0 -0,4
19 0,1 0 0,3
20 -0,1 0 -0,2
21 0 0 -0,5
22 0 0 -0,7
23 0 0 0
24 -0,1 0 -0,3
25 0 0 -0,2
26 -0,1 0 -0,2
27 -0,2 0 -0,4
28 -0,6 0 -0,9
29 0 -1 -0,2
30 -0,1 0 0
31 -0,1 0 -0,1
32 0 0 -0,1
33 0 1 0,1
34 -0,1 0 -0,2
35 0 0 0,9
36 0 0 1
37 -0,1 0 -0,1
38 -0,1 0 -0,1
39 0 0 0
40 0 0 0,9
Min -0,6 -1 -1,3
Max 0,2 1 1
Résultats après compression :
Tableau 13 : Boucles standard sans variations aux vélocités.
Échantillon dB RMS
intégrés
Gamme
dynamique
intégrée dBFS
Sonie intégrée
LUFS (EBU + 18)
1 -16,7 16 -17,1
2 -18,5 18 -17,3
3 -16,5 15 -17,8
4 -13,1 13 -15
5 -19,1 18 -18
6 -13,4 13 -13,6
74
7 -15,8 15 -15,4
8 -14,4 13 -15,7
9 -16 15 -16
10 -16,7 16 -16,2
11 -10,6 10 -13,3
12 -27 26 -28
13 -8,3 7 -11,7
14 -17 16 -16
15 -11,9 11 -15
16 -12,2 11 -16
17 -16,6 16 -16
18 -14,5 14 -13,9
19 -13,9 13 -13
20 -15,3 15 -14,4
21 -16,1 15 -17,9
22 -21 20 -20,3
23 -19 18 -20,2
24 -15,5 15 -16,3
25 -18,4 16 -15,8
26 -15,9 15 -15,7
27 -17,9 17 -15,6
28 -14,7 14 -13,3
29 -16,8 16 -17,3
30 -17,2 17 -15,2
31 -11,2 10 -12,4
32 -9,3 8 -12,1
33 -11,6 10 -13,5
34 -14,1 12 -15,1
35 -11,6 10 -13,9
36 -12,8 11 -14,3
37 -15,6 14 -17
38 -11,5 10 -13,4
39 -11,6 10 -12,9
40 -14,5 13 -16,1
Min -27 7 -28
Max -8,3 26 -11,7
75
Tableau 14 : Boucles avec variation de vélocités
Échantillon dB RMS
intégrés
Gamme
dynamique
intégrée dBFS
Sonie intégrée
LUFS (EBU + 18)
1 -16,9 16 -16,7
2 -18,9 18 -16,8
3 -16,1 15 -16,4
4 -13,9 13 -15,2
5 -18,7 18 -16,5
6 -14 13 -14,6
7 -16,8 16 -16,7
8 -15,4 14 -16
9 -16,1 15 -15,7
10 -16,4 16 -15,2
11 -11,9 11 -14,2
12 -27 26 -27,1
13 -8,9 8 -11,9
14 -17,1 16 -16,1
15 -13,2 12 -15,9
16 -12,5 11 -15,7
17 -16,2 16 -14,5
18 -13,8 13 -12,1
19 -14,2 14 -12,8
20 -14,6 14 -12,5
21 -16,2 16 -17
22 -20,5 20 -20
23 -19,4 18 -19,7
24 -16,2 16 -16,4
25 -18,4 16 -15,1
26 -16,7 16 -15,8
27 -18,6 18 -16,1
28 -15,5 15 -13,8
29 -17,2 17 -16,8
30 -18,2 18 -15,3
31 -11,5 9 -12,7
32 -9,5 8 -12,4
33 -11,5 10 -13,9
34 -14,7 13 -15,8
35 -12,9 11 -14,8
36 -13,2 11 -14,6
37 -16,2 15 -17,1
38 -12,2 11 -13,6
39 -12,4 11 -14,3
40 -15,3 14 -16,8
76
Min -27 8 -27,1
Max -8,9 26 -11,9
Tableau 15 : Boucles avec copression latérale externe (side-chain compression)
Échantillon dB RMS
intégrés
Gamme
dynamique
intégrée dBFS
Sonie intégrée
LUFS (EBU + 18)
1 -16,9 16 -16,8
2 -18,9 18 -16,8
3 -15,9 15 -15,9
4 -13,8 13 -15,3
5 -18,7 18 -16,5
6 -13,9 13 -14,3
7 -16,7 16 -16,4
8 -15,4 14 -15,6
9 -16 15 -15,8
10 -16,2 16 -14,9
11 -11,9 12 -14,2
12 -26,9 26 -27
13 -8,9 8 -11,8
14 -17 16 -15,9
15 -13,2 12 -15,9
16 -12,5 11 -15,5
17 -16 16 -14,1
18 -13,8 13 -12,1
19 -14,3 14 -13,1
20 -14,5 14 -12,6
21 -16 16 -16,4
22 -20,5 19 -19,7
23 -19,3 18 -19,6
24 -16,1 15 -16,1
25 -18,4 16 -15,1
26 -16,7 16 -15,7
27 -18,5 18 -15,7
28 -15,1 14 -13,2
29 -17,1 17 -16,7
30 -18,2 18 -15,3
31 -11,8 10 -12,7
32 -9,4 8 -12,3
33 -11,6 10 -14,3
34 -14,9 13 -15,3
35 -12,9 11 -14,8
77
36 -13,2 11 -14,6
37 -16,2 15 -17
38 -12,2 11 -13,5
39 -12,5 11 -14,4
40 -15,3 14 -16,8
Min -26,9 8 -27
Max -8,9 26 -11,8
Tableau 16 : [Après compression] v. (variation) des versions à « groove dynamique » par rapport à la version
originale sans v. de vélocités, où « x » = à la v. de la version aux vélocités variées et « y » = à la v. de la
version compressée latéralement. Les « - » représentent qu‘il y a eu un changement à la baisse quant à la
gamme dynamique etùou une augmentation quant à la sonie dans le présent contexte.
Échantillon dB RMS intégrés Gamme dynamique
intégrée dBFS
Sonie intégrée LUFS
(EBU + 18)
x y x y x y
1 0,2 0,2 0 0 -0,4 -0,3
2 0,4 0,4 0 0 -0,5 -0,5
3 -0,4 -0,6 0 0 -1,4 -1,9
4 0,8 0,7 0 0 0,2 0,3
5 0,4 0,4 0 0 -1,5 -1,5
6 0,6 0,5 0 0 1 0,7
7 1 0,9 1 1 1,3 1
8 1 1 1 1 0,3 -0,1
9 0,1 0 0 0 -0,3 -0,2
10 -0,3 -0,5 0 0 1 1,3
11 1,3 1,3 1 2 0,9 0,9
12 0 -0,1 0 0 -0,9 -1
13 0,6 0,6 1 1 0,2 0,1
14 0,1 0 0 0 0,1 -0,1
15 1,3 1,3 1 1 0,9 0,9
16 0,3 0,3 0 0 -0,3 -0,5
17 -0,4 -0,6 0 0 -1,5 -1,9
18 -0,7 -0,7 -1 -1 -1,8 -1,8
19 0,3 0,4 1 1 -0,2 0,1
20 -0,7 -0,8 -1 -1 -1,9 -1,8
21 0,1 -0,1 1 1 -0,9 -1,5
22 -0,5 -0,5 0 -1 -0,3 -0,6
23 0,4 0,3 0 0 -0,5 -0,6
24 0,7 0,6 1 0 0,1 -0,2
25 0 0 0 0 -0,7 -0,7
26 0,8 0,8 1 1 0,1 0
27 0,7 0,6 1 1 0,5 0,1
78
28 0,8 0,4 1 0 0,5 -0,1
29 0,4 0,3 1 1 -0,5 -0,6
30 1 1 1 1 0,1 0,1
31 0,3 0,6 -1 0 0,3 0,3
32 0,2 0,1 0 0 0,3 0,2
33 -0,1 0 0 0 0,4 0,8
34 0,6 0,8 1 1 0,7 0,2
35 1,3 1,3 1 1 0,9 0,9
36 0,4 0,4 0 0 0,3 0,3
37 0,6 0,6 1 1 0,1 0
38 0,7 0,7 1 1 0,2 0,1
39 0,8 0,9 1 1 1,4 1,5
40 0,8 0,8 1 1 0,7 0,7
Min -0,7 -0,8 -1 -1 -1,9 -1,9
Max 1,3 1,3 1 2 1,4 1,5
Tableau 17 : (Après compression) V. (variation) des variations, « y » par rapport à « x ». Les « - » indiquent
qu‘il y a eu un changement à la baisse quant à la gamme dynamique et/ou une augmentation quant à la sonie
dans le présent contexte.
Échantillon dB RMS
intégrés
Gamme
dynamique
intégrée
dBFS
Sonie
intégrée
LUFS
(EBU+18)
1 0 0 0,1
2 0 0 0
3 -0,2 0 -0,5
4 -0,1 0 0,1
5 0 0 0
6 -0,1 0 -0,3
7 -0,1 0 0,3
8 0 0 -0,4
9 0,1 0 0,1
10 -0,2 0 0,3
11 0 1 0
12 -0,1 0 -0,1
13 0 0 -0,1
14 0,1 0 -0,2
15 0 0 0
16 0 0 -0,2
17 -0,2 0 -0,4
18 0 0 0
19 0,1 0 0,3
79
20 -0,1 0 0,1
21 -0,2 0 -0,6
22 0 -1 -0,3
23 -0,1 0 -0,1
24 -0,1 1 -0,3
25 0 0 0
26 0 0 -0,1
27 -0,1 0 -0,4
28 -0,4 1 -0,6
29 -0,1 0 -0,1
30 0 0 0
31 0,3 1 0
32 -0,1 0 -0,1
33 0,1 0 0,4
34 0,2 0 -0,5
35 0 0 0
36 0 0 0
37 0 0 -0,1
38 0 0 -0,1
39 0 0 -0,1
40 0 0 0
Min -0,4 -1 -0,6
Max 0,3 1 0,4
80
Interprétation des résultats : graphiques et commentaires
Résultats primaires
Tableau 18 : dB RMS intégrés selon la fréquence des résultats.
Tableau 19 : dB RMS intégrés, fréquence des résultats (après compression).
Dans les deux cas, les trois types de boucles semblent suivre un patron traditionnel
de loi normale. Nous pouvons également observer que dans ces deux cas, les boucles à
« groove dynamique » (versions aux variations de vélocités et versions à compression
latérale) ont une moyenne RMS intégrée (sur toute la durée des échantillons) légèrement
0
2
4
6
8
10
12
14
Boucles Standard sansvariations aux vélocités
Boucles avec variation develocités
Boucles avec compressionlatérale (side-chain)
0
2
4
6
8
10
12
14
16
Boucles Standard sansvariations aux vélocités
Boucles avec variation develocités
Boucles avec compressionlatérale (side-chain)
81
plus élevée dans les trois régions les plus peuplées, alors que les boucles à variation
standard semblent légèrement se distribuer plus doucement à partir du centre de la cloche
vers les extrémités. Aussi, globalement, les deux régions aux niveaux extrêmes sont
légèrement plus peuplées par les boucles aux programmations standard. Compte tenu du
fait que ces variations sont très faibles et très régulières, il semble préliminairement que ces
trois pratiques occupent une bande passante relativement similaire dans la dynamique
digitale.
Tableau 20 : Gamme dynamique intégrée en dB FS selon la fréquence des résultats.
Tableau 21 : Gamme dynamique intégrée en dB FS selon la fréquence des résultats (après compression)
0
2
4
6
8
10
12
14
Boucles Standard sansvariations aux vélocités
Boucles avec variation develocités
Boucles aveccompression latérale(side-chain)
0
2
4
6
8
10
12
14
Boucles Standard sansvariations aux vélocités
Boucles avec variation develocités
Boucles aveccompression latérale(side-chain)
82
Ici, le patron de la loi normale traditionnelle est moins évident à observer. La
population des échantillons augmente de manière linéaire, puis elle descend
exponentiellement à partir de son point maximal. Dans les deux cas, pour la gamme
dynamique intégrée, les deux régions présentant des dynamiques les plus faibles sont
légèrement plus occupées par les boucles standard. Globalement, les boucles à « groove »
semblent légèrement plus dynamiques que celles sans « groove », quoiqu‘il soit difficile de
clairement démarquer avantageusement une pratique d‘une autre pour sa marge dynamique.
Tableau 22 : Sonie intégrée en LUFS (EBU + 18) selon la fréquence des résultats.
Tableau 23 : Sonie intégrée en LUFS (EBU + 18) selon la fréquence des résultats (après compression)
0
2
4
6
8
10
12
14
16
18
Boucles Standard sansvariations aux vélocités
Boucles avec variation develocités
Boucles avec compressionlatérale (side-chain)
0
2
4
6
8
10
12
14
16
18
20
Boucles Standard sansvariations aux vélocités
Boucles avec variation develocités
Boucles avec compressionlatérale (side-chain)
83
Ici, les mêmes observations précédentes s‘appliquent. Avant la compression, les
boucles standard semblent distribuées de manière plus égale que celles avec un effet de
« groove dynamique ». La sonie intégrée des dernières semble légèrement plus élevée après
et avant la compression, si nous observons les trois régions les plus peuplées, ce qui
correspond aussi à ce que nous percevons, mais il est difficile de clairement contraster une
pratique d‘une autre, car leurs distributions demeurent relativement égales.
Les différentes variations : comparaison des versions à « groove » versus les versions avec
une programmation standard par la mesure de leur écart.
Tableau 24 : dB RMS intégrés selon la fréquence des résultats.
Tableau 25 : dB RMS intégrés selon la fréquence des résultats (après compression)
0
5
10
15
20
-1,5 -1 -0,5 0 0,5 1 1,5
Légende : « x » = v. de la version aux vélocités variées
« y » = v. de la version compressée latéralement
x
y
0
2
4
6
8
10
12
14
16
-1,5 -1 -0,5 0 0,5 1 1,5
Légende : « x » = v. de la version aux vélocités variées
« y » = v. de la version copressée latéralement
x
y
84
Après la compression, la version variée par la programmation des vélocités occupe
légèrement une plus grande place dans la bande passante numérique que la version à
compression latérale par rapport à leur version standard initiale. Avant la compression,
leurs écarts sont plus égalitairement distribués. La différence entre ces deux pratiques
demeure assez légère, mais une telle tendance signifierait que la version compressée
latéralement pourrait être un peu plus écrasée dynamiquement (pour obtenir une sonie
élevée), car elle occupe une place plus faible dans la bande passante.
Tableau 26 : Gamme dynamique intégrée en dB FS selon la fréquence des résultats.
Tableau 27 : Gamme dynamique intégrée en dBFS selon la fréquence des résultats (après compression).
Avant la compression, il semble que la gamme dynamique de la version à
compression latérale était plus faible par rapport à la version standard que la version aux
0
5
10
15
20
25
-1 0 1
Légende : « x » = v. de la version aux vélocités variées
« y » = v. de la version latéralement compressée
x
y
0
5
10
15
20
25
-1 0 1
Légende : « x » = v. de la version aux vélocités variées
« y » = v. de la version compressée latéralement
x
y
85
vélocités programmées. Après la compression, il semble que ce soit la version aux
programmations des vélocités qui est plus dynamique par rapport à la version originale que
la version ayant été compressée latéralement. Encore une fois, les chiffres sont assez
constants d‘une version à une autre, de sorte qu‘il est difficile de tirer une conclusion claire.
Tableau 28 : Sonie intégrée LUFS (EBU + 18) selon la fréquence des résultats.
Tableau 29 : Sonie intégrée LUFS (EBU + 18) selon la fréquence des résultats (après compression)
Il semble qu‘après et avant la compression, les versions à « groove » avaient un
niveau de sonie plus élevé que la version standard. Dans les deux cas, il semble que c‘est la
version aux variations des vélocités qui ait le niveau de sonie le plus élevé, ce qui est assez
surprenant.
0
2
4
6
8
10
12
14
16
18
-3 -2 -1 0 1 2
Légende : « x » = v. de la version aux vélocités variées
« y » = v. de la version compressée latéralement.
x
y
0
5
10
15
20
25
-3 -2 -1 0 1 2
Légende : « x » = v. de la version aux vélocités variées
« y » = v. de la version compressée latéralement.
x
y
86
Écarts entre les Variations (« y » par rapport à « x ») : comparaison de la version
compressée latéralement par rapport à la version aux variations de vélocité
Tableau 30 : dB RMS intégrés selon la fréquence des résultats.
Tableau 31 : dB RMS intégrés selon la fréquence des résultats (Après compression)
En ce qui concerne le niveau des dB RMS intégré, les mesures indiquent que les
deux versions à « groove dynamique » occupent une place quasi-identique dans la bande-
passante digitale.
0
5
10
15
20
25
30
35
40
-0,6 -0,4 -0,2 0 0,2 0,4
0
5
10
15
20
25
30
35
-0,6 -0,4 -0,2 0 0,2 0,4
87
Tableau 32 : Gamme dynamique intégrée en dB FS selon la fréquence des résultats.
Tableau 33 : Gamme dynamique intégrée en dB FS selon la fréquence des résultats (après compression).
Pour la gamme dynamique intégrée, les deux versions à « groove » sont égales
entre-elles selon les mesures obtenues.
0
5
10
15
20
25
30
35
40
-1 0 1
0
5
10
15
20
25
30
35
40
-1 0 1
88
Tableau 34 : Sonie intégrée en LUFS (EBU + 18) selon la fréquence des résultats.
Tableau 35 : Sonie intégrée en LUFS (EBU + 18) selon la fréquence des résultats (après compression).
Encore une fois, les deux versions semblent presque égales entre-elles pour leur
niveau de sonie.
0
5
10
15
20
25
-1,3 -1 -0,7 -0,4 -0,1 0,2 0,5 0,8 1,2
0
2
4
6
8
10
12
14
16
-1,3 -1 -0,7 -0,4 -0,1 0,2 0,5 0,8 1,2
89
Conclusion
Portée des résultats
D‘abord, il nous faut mentionner que nous fournissons, en annexe, notre feuille de
calcul en format Excel, afin que le lecteur puisse vérifier nos affirmations. Ensuite et afin
d‘obtenir des résultats quantitatifs selon une méthodologie éclairée, nous avons
constamment eu recours à l‘aide critique d‘une étudiante en Actuariat pour répondre à nos
lacunes dans le domaine austère des nombres et des chiffres.
La compatibilité initiale des échantillons
La moyenne des écarts de nos mesures d‘avant-compression entre les différentes
versions et les différents types de mesures nous apprend qu‘il y a eu un écart moyen de :
0,1125 dB RMS pour les dB RMS intégrés, 0,375 dB pour la gamme dynamique intégrée et
-0,289 LUFS pour la Sonie intégrée. En moyenne absolue, cela équivaut respectivement à
des écarts de 0,481 dB, 0,538 dB et 0,796 LU. Il est à noter que l‘écart le plus grand, celui
de la mesure sonique, correspond à l‘outil de mesure le plus limité (car la sonie relève
d‘une expérience vécue). À notre avis, ces chiffres, combinés à notre écoute critique
démontrent la compatibilité à comparer initialement nos échantillons dans l‘optique
d‘obtenir une tendance sonique et dynamique générale entre les trois.
Représentativité de notre échantillon statistique et efficacité des mesures
Malgré ce que nous pouvions penser à l‘époque de notre cours collégial de
Méthodes quantitatives, nous nous rappelons que, afin d‘obtenir un échantillon significatif
statistiquement en sciences humaines représentatif de la population, il était demandé de
recueillir aléatoirement un échantillon d‘au moins 271 instances individuelles afin de
parvenir à une loi normale et à un écart-type qui avait théoriquement 95 % de chances de
représenter la population réelle avec un résultat près de ± 5 % du « vrai » résultat. Quoi
qu‘il en soit réellement du chiffre arbitraire « 271 », une valeur humaine loin d‘être
absolue, la plupart d‘entre nous concèdent l‘affirmation suivante : plus l‘échantillon
statistique est grand, plus l‘étude statistique est rigoureuse, pourvu que la méthodologie (la
90
méthode d‘échantillonnage, la neutralité des questions, etc.) soit sérieuse. Notre échantillon
est donc assez minime.
Toutefois, nous croyons qu‘il ne faut pas seulement considérer la grandeur de notre
échantillon selon une optique absolue où la quantité des données soutient notre savoir sur le
sujet étudié. Si nous regardons nos 40 échantillons selon leur structure (mesurés 240 fois
avec trois standards de mesure connexes différents et trois programmations différentes),
c‘est plutôt la logique interne et l‘angle d‘attaque de la question qui soutiennent notre
étude, quoiqu‘une plus grande quantité d‘échantillons à étudier n‘aurait certainement pas
nui.
En parlant de nuire, nous constatons de plus en plus des lacunes quant aux
nouveaux standards de mesure poussés par l‘AES et l‘EBU. Bien qu‘il s‘agisse de
standards industriels établis pour des fonctions particulières (notamment la normalisation
de la sonie des programmes télévisés) ne s‘appliquant peut-être pas à une pratique créative
se situant par essence en dehors des normes, nous avons observé que ces derniers ne
décrivent pas rigoureusement l‘expérience vécue de la sonie. Du moins, il est possible que
les outils que nous avons utilisés ne rendent pas justice à ces standards qu‘ils clament
pourtant respecter. Est-ce une simple stratégie de markéting pour pousser de nouveaux
produits « à avoir absolument » sur le marché? Il est possible que la réponse soit un
mélange de ces deux hypothèses.
Pourtant et selon notre écoute, les programmations aux « grooves dynamiques »
sont définitivement plus dynamiques que les programmations standard avant et après la
compression. Aussi, après la compression, les programmations aux « grooves » nous
semblent avoir un niveau de sonie aussi élevé (si non un peu plus) que les programmations
standard. Il s‘agit pour nous, à la lumière de notre écoute, de deux avantages sur une
programmation standard. La différence entre notre perception et le constat de nos mesures
s‘explique peut-être par le fait que l‘homme peut percevoir une incroyable variété de
timbres et de puissances sonores (de l‘ordre d‘un ratio de douze puissances de dix pour
un)65
, et ce, sans avoir à effectuer un quelconque changement physiologique entre les
différents degrés de puissances, comme cela est souvent le cas avec les appareils de mesure
65
Thomas D. Rossing, Springer Handbook of acoustics, 468.
91
électriques66
. De plus, et en ce qui concerne la différence de sonie perçue entre les versions,
cela est attribuable selon nous à la fluctuation des niveaux des cymbales-à-pied, qui ont une
forte présence dans des fréquences « facilement audibles », un fait décrit par les courbes
isosoniques traditionnelles67
. Si cette hypothèse est vraie, la programmation à effet de
« groove dynamique » sur les hautes percussions aurait un double avantage : une meilleure
dynamique et une sonie plus forte par rapport à une programmation standard.
Si nous comparons les deux programmations aux « grooves dynamiques », toujours
selon notre propre écoute, les deux nous paraissent stylistiquement différentes : celle
compressée latéralement nous semble avoir plus dansante pour son effet de « pompage » dû
à la compression latérale alors que celle aux vélocités programmées nous semble plus
naturelle sans l‘être entièrement. Malgré cela, nous sommes convaincus qu‘il est possible
de faire des compromis ou des mélanges entre ces deux pratiques pour obtenir le meilleur
des deux.
Quant aux chiffres et aux standards de mesure utilisés, c‘est là la partie décevante,
nous ne pouvons pas nous avancer sur aucune conclusion, car les données ne tendent pas
vers des différences significatives entre les pratiques. Il nous faudrait donc choisir une ou
plusieurs avenues, la plupart insatisfaisantes, parmi les suivantes :
a) Écraser moins les chansons pour les garder musicales.
b) Refaire une étude avec un échantillon plus étendu malgré le risque d‘utiliser de
nouveau les standards de mesures qui nous inquiètent.
c) Effectuer une étude subjective avec plusieurs personnes afin de déterminer si les
différences perçues dans notre recherche sont significatives, une démarche qui a ses
propres problèmes, comme le décrit très bien Kuttruff dans son ouvrage sur
l‘acoustique :
The only way to do this is by performing numerous time-consuming and delicate
experiments with test persons who are supposed to be cooperative and unbiased.
These persons are exposed to different acoustical stimuli which they are asked to
assess according to certain prescribed criteria. It is self-evident that results of such
tests are afflicted with strong fluctuations, and that only averaging over many single
66
Heinrich Kuttruff, Acoustics – An Introduction, 233. 67
David Howard et Jamie Angus, Acoustics and psychoacoustics, 92.
92
assessments leads to reliable results.68
d) Réaliser de la bonne musique et arrêter de perdre du temps avec le reste.
Sommaire
En somme, nous avons testé trois pratiques de programmation des percussions, afin
de tenter d‘observer une tendance quant à l‘avantage/l‘utilité d‘une pratique par rapport aux
autres. En faisant cela, nous souhaitons observer phénoménalement et quantitativement si
une pratique est meilleure pour conserver une gamme dynamique intéressante, tout en ayant
un niveau de sonie élevé, suite à un écrêtage agressif par un limiteur de manière à simuler
une des étapes de la pratique contemporaine du matriçage. Les trois pratiques que nous
avons mises à l‘épreuve sont les suivantes :
- Programmation « standard » sans variation de vélocités.
- Programmation avec variation de vélocités.
- Programmation avec variation dynamique par compression latérale.
Nous avons été en mesure d‘observer subjectivement des avantages dynamiques et
de niveau de sonie pour les versions ayant un effet de « groove dynamique » (variation des
vélocités et par compression latérale) par rapport aux versions « standard », mais il nous a
été impossible de confirmer nos observations par les données obtenues grâce aux
instruments de mesure disponibles. Nous décidons maintenant d‘arrêter d‘accorder de
l‘attention aux standards de mesure de la sonie de l‘AES et du EBU pour décrire la sonie
d‘une pièce de musique, car les résultats que nous obtenons ne sont ni cohérents avec notre
écoute ni linéaires entre eux. Nous allons adopter les pratiques aux effets de « groove
dynamique », mais nous comprenons qu‘il nous manque d‘appuis par des instruments de
mesure pour confirmer scientifiquement nos observations.
Nous pensons que, peu importe les conclusions de nos propres observations,
d‘espérer des changements mesurables à l‘étape du matriçage à la suite d‘opérations
subtiles aux étapes de la programmation des percussions et du design sonore est peut-être
une trop grande demande à faire à la technologie de mesure de la sonie. Par considération
pour cette pensée, nous continuons à notre dernier chapitre avec des mesures dynamiques
très globales et avec des analyses qualitatives (oui subjectives) avec l‘aide de notre mentor
audio Serges Samson dans l‘environnement contrôlé du LARC, le nouveau studio de
l‘Université Laval. Ces mesures et analyses porteront sur une méthode plus drastique et
significative pour l‘étape du matriçage : le mixage et le matriçage simultanés.
68
Heinrich Kuttruff, Acoustics – An Introduction, 239.
93
Chapitre 3 : Mixage et matriçage simultanés
Introduction
Pour parvenir à l‘idée de matricer et de mixer en même temps, il nous a fallu trois
années de tests sur nos propres réalisations musicales, dont plusieurs essais qui ont été plus
ou moins fructueux (les chapitres 1 et 2, par exemple). Nous croyons qu‘il y a assurément
des gens très compétents disposant de meilleurs outils que nous qui sont capables de
réaliser de très bons matriçages sur des pistes stéréo déjà mixées, mais il s‘agit de cas très
rares pour nous : avec de bonnes enceintes de travail, un endroit traité acoustiquement et un
amplificateur de classe « A », il n‘y a qu‘un seul album sur 50 qui nous semble
personnellement écoutable pour ses qualités techniques. Nous devons alors absolument ne
plus penser au mixage et au matriçage pour être en mesure d‘apprécier la musique; nous
sommes difficiles, nous en convenons. Nous croyons néanmoins que le matriçage, au sens
traditionnel du terme69
, n‘est pas le moyen le plus optimal pour obtenir un maximum de
contrôle sur la profondeur d‘un mix, arriver à un maximum de respect de l‘équilibre du mix
initial et parvenir à un maximum de dynamique (perçue et factuelle). À notre avis, le niveau
nécessaire de compression pour satisfaire les standards de la musique commerciale
« dance » est simplement trop élevé, et nous avons déjà énoncé plus haut les raisons de la
pertinence de la compression et le fait de tenter de minimiser ses inconvénients sans s‘y
soustraire. Il reste que matricer avec une compression agressive sur une piste stéréo pour
atteindre des niveaux élevés de sonie (nous avons observé 8 dB et moins de gamme
dynamique pour la majorité des nouvelles pistes de musique « dance ») altère
inévitablement d‘une manière ou d‘une autre le mix initial tel qu‘il est présenté à
l‘ingénieur avant le matriçage. Ces altérations incluent les suivantes :
1. La cohérence sonique. Il y a inévitablement des distorsions isolées qui ne sont
corrigibles que par un traitement global sur un mix stéréo tout entier. En écrasant les ondes
sonores (analogiques et numériques) contre la limite du « 0 » digital ou la limite du circuit
analogique, certaines ondes sont aplaties. Nous obtenons alors des ondes carrées,
harmoniquement plus riches et plus agressives, que celles du mix initial. Cela a pour effet 69
Dans ce dernier chapitre, nous examinons le matriçage comme une étape/moyen de parvenir à un résultat
musical ayant une forte sonie. Nous souhaitons simplement mentionner que nous sommes conscients que le
rôle de cette étape de postproduction peut être plus varié, comme de donner de la cohérence à un ensemble
d‘enregistrements (le plus souvent un album).
94
de causer des distorsions, d‘aplanir les transitoires et de créer un effet de « pompage » 70
.
Au fur et à mesure que les années passent, notre tolérance à ces artéfacts, de plus en plus
réguliers dans la musique que nous écoutons, est augmentée.
2. L’image du mix. Les niveaux des éléments de l‘« arrière-scène virtuelle »,
naturellement moins élevés, sont augmentés avec la compression. Ainsi, l‘équilibre des
niveaux des mix originels est altéré lorsqu‘une piste est agressivement compressée pour
satisfaire les standards commerciaux actuels. L‘augmentation des niveaux moyens des
crêtes a l‘effet fâcheux d‘exagérer la présence d‘éléments destinés à avoir des niveaux
faibles dans le mix initial. Concrètement, ce phénomène peut s‘observer lorsque le niveau
des réverbérations, des cymbales à pied, et des nappes est exagéré par la compression dans
la musique « dance ». En plus d‘altérer l‘équilibre d‘un mix, la compression sur une piste
stéréo aura pour conséquence d‘éliminer toute profondeur, ou du moins de l‘atténuer
considérablement.
3. La cohérence dynamique. Compresser un mix stéréo affecte la dynamique du mix
original. À moins d‘augmenter de manière significative le niveau des percussions, à des
niveaux exagérés dans le mix original, la compression d‘un mix stéréo a de grandes
chances de réduire l‘aspect percutant (punch) des percussions et d‘affecter l‘équilibre de
celles-ci sur le mix matricé. En augmentant le niveau moyen des crêtes, les mix ont
tendance à être moins percutants, car ils perdent la quantité de temps de silence entre
chaque coup de grosse caisse et de caisse claire. Parfois, et particulièrement lorsqu‘un
niveau élevé de sonie est requis, les sections instrumentales finissent par avoir un niveau de
sonie exagéré par rapport aux percussions. Lorsque cela se produit, l‘auditeur entend à
peine les percussions s‘il écoute la chanson très compressée à un niveau normal71
.
Finalement, en augmentant le niveau moyen des crêtes, une chanson perd sa gamme
dynamique, une fâcheuse conséquence qu‘il est possible d‘observer dans certains mix dont
les niveaux sont aussi élevés que les refrains. Ce problème peut être évité en utilisant des
quantités différentes de compression sur chaque partie d‘une chanson, même s‘il arrive très
souvent que les ingénieurs en matriçage ne se donnent pas cette peine (cela est également le
cas pour les artistes à grand succès). Enfin, même si nous compressons une chanson à
70
Izhaki Roey, Mixing audio, Concepts, Practices and Tools, 16. 71
Mike Senior, Mixing secrets for the small studio, p. 279.
95
différents niveaux pour chacune de ses parties, il n‘en demeure pas moins que l‘équilibre
du mix final par rapport au mix d‘origine sera altéré à l‘intérieur du mix.
Certains réagiront en argumentant que ce sont les mauvaises habitudes actuelles de
surcompression qui sont en cause. Nous pensons que ce contre argument est en partie vrai.
Cependant, avant de prendre une décision définitive sur le sujet, il faudrait considérer
l‘argument suivant. Il est vrai qu‘en ne recherchant pas des niveaux élevés de compression,
nous évitons la plupart des distorsions (à l‘exception de celles lors de la prise de son). Il est
également vrai qu‘une forte compression pour des niveaux de sonie élevés est certainement
responsable du dommage causé à la cohérence sonique, à l‘image à la dynamique d‘un mix.
Cependant, nous croyons, avec Tischmeyer, qui définit des gammes dynamiques à viser en
fonction des styles musicaux72, que la compression demeure pertinente dans certains genres
de musique, comme la musique électronique « dance », puisque ce sont des genres qui
fonctionnent bien avec des niveaux élevés de sonie. Nous voulons simplement atteindre la
sonie souhaitée sans les distorsions et sans la destruction de la dynamique et de l‘équilibre
du mix initial ou idéal de l‘artiste. Nous croyons être en mesure de parvenir à des résultats
intéressants en ne considérant pas le matriçage (en tant qu‘étape où nous obtenons un
niveau de sonie élevé) comme une étape séparée du reste du processus de réalisation.
Mixer et matricer en même temps
Cette méthode s‘appuie sur l‘idée de travailler avec la compression au lieu de
travailler contre elle. Le but de cette pratique est d‘avoir un maximum de contrôle sur la
manière dont le compresseur affecte inévitablement le mix. Hepworth-Sawyer (From Demo
to Delivery : The process of production, 2009) ouvre déjà la porte à un chevauchement
important entre les étapes traditionnelles de production. Toutefois, l‘auteur continue de
séparer complétement le matriçage des étapes précédentes, lesquelles peuvent aisément se
chevaucher. Comme nous l‘avons déjà mentionné, notre méthode consiste à intégrer et à
distribuer le matriçage, en tant que une étape permettant l‘obtention d‘une sonie élevée, sur
l‘ensemble des grandes étapes de la production phonographique. Pour un mixage-
matriçage, il s‘agit d‘avoir un maximum de contrôle sur les distorsions et la balance qu‘il y
72
Pleasurize Music Foundation, web.
96
a dans un mix. Nous ne souhaitons pas abolir le matriçage traditionnel ou voler le travail de
qui que ce soit; de toute façon, nous n‘avons pas un tel pouvoir. Nous croyons toutefois
qu‘il est impossible de maintenir l‘équilibre initial d‘un mix lorsqu‘il y a un matriçage
traditionnel avec une forte compression, même si le matriçage traditionnel sur une piste
stéréo a toujours fonctionné et qu‘il est habituellement agréable à entendre dans des
occasions d‘écoute normales ou non-audiophiles. Il reste néanmoins qu‘un changement
dans la dynamique d‘un mix résultera toujours à un changement de son équilibre. Lorsque
les dynamiques d‘un mix sont affectées d‘une manière légère au matriçage (c‘est le cas
traditionnellement avec la musique classique, où on tente de reproduire un événement
acoustique le plus fidèlement possible73
), le changement peut être très subtil et même
indétectable. Nous maintenons seulement que le matriçage traditionnel est loin d‘être la
solution optimale pour maintenir la balance d‘un mix lourdement compressé, comme cela
est souvent le cas avec la musique électronique « dance », qui peut subir de lourdes
réductions de gain allant jusqu‘à 13 dB, et nous proposons d‘examiner cette hypothèse en
faisant deux études de cas, soit l‘analyse de pièces de notre projet de musique électronique
dansante (8 pièces de notre album Dragos-Something about being a man [2013]) et
l‘analyse de pièces de notre projet de musique hip-hop nommé Careful (2013). Ces pièces
sont fournies avec le mémoire.
Premièrement, nous suggérons d‘utiliser une réduction dynamique légère sur le bus
maitre avec une légère augmentation du gain (3-4 dB) et un limiteur visant à prévenir le
« clipping ». La compression sur le bus maitre n‘est pas nécessaire, mais elle permet de
fixer/donner une cohésion au mix tout entier; notre méthode consiste surtout à appliquer la
compression sur chaque piste séparément. Nous suggérons de laisser de l‘espace entre le
seuil du limiteur et le 0 dBFS (pour notre album Something about being a man [2013] nous
avons fixé une limite entre -0,7 et -0,8 dB FS), car une faible marge entre le signal et la
limite de la bande passante digitale est presque toujours corrélative à une présence de
distorsions74
. En prévision de la conversion mp3, qui diminue inévitablement cet espace, il
est également souhaitable et prudent de laisser plus de headroom que les formats non
compressés en requièrent (< 0 dB FS) pour éviter l‘effet que Thomas Lund nomme « space 73
David Moulton, Total recording, 403. 74
Ibid., 146.
97
monkeys », un artéfact indésirable qui ressemble à l‘émission d‘un son sous l‘eau (surtout
avec les formats de diffusion internet : autour de 128 kb/s)75
. La faible fraction de
dynamique et de sonie qui est perdue en retranchant presque 1 dB est assez négligeable,
lorsque comparée avec la qualité gagnée après la compression au format mp3. En d‘autres
mots, l‘important à retenir est qu‘un type de réduction dynamique est nécessaire avant de
commencer le mix et avant de commencer à traiter individuellement chaque piste avec des
effets. En faisant cela, l‘ingénieur audio sera en mesure d‘entendre les artéfacts indésirables
de la compression dès le début du processus du mixage. Une fois que les artéfacts (comme
la « boue » et les distorsions) sont audibles, il est possible de les éliminer localement avec
des égaliseurs ou tout autre outil de son choix, tout en étant capable de garder l‘équilibre
désiré du mix. Après avoir traité les hernies sonores et avoir équilibré tous les niveaux,
incluant ceux des envois auxiliaires, il sera possible da parvenir à un résultat ayant de la
profondeur en laissant certains éléments dans l‘arrière-scène virtuelle (par une diminution
de leur gain) tout en ayant des pistes extrêmement compressées. Ceci devrait régler les
questions de l‘équilibre dynamique et sonique entre les éléments instrumentaux et l‘atteinte
de l‘image visée pour le mix. Pour régler le problème de l‘équilibre entre les différentes
parties de la chanson, il y a plusieurs solutions. Nous pouvons soit programmer des
automatisations pour les niveaux de gain des pistes de chaque instrument76
ou programmer
des automatisations sur un contrôle de gain global (le niveau d‘entrée du limiteur sur le bus
maitre, par exemple). Écrire des automatisations peut, toutefois, générer de la confusion
(spécialement s‘il y en a beaucoup et si on prévoit changer les niveaux par la suite). Une
autre solution consiste à dupliquer les pistes instrumentales afin d‘avoir, par exemple, une
piste instrumentale pour l‘introduction et d‘autres pour la conclusion et les refrains. De
cette manière, on peut simplement assigner un contrôle de gain de piste différent pour
chacune d‘entre elles. Avec les nouveaux ordinateurs, le souci pour la limite des ressources
en CPU tend de plus en plus à être une chose du passé.
75
Thomas Lund, Loudness wars, web. 76
Bob Katz, Mastering Audio; 114.
98
Analyse critique de cette méthode
Certains ont critiqué cette manière de faire, notamment lors de notre présentation de
cette méthode au Art of record production de l‘année 2013. Un premier argument peut être
formulé comme suit :
Argument 1 : L‘étape du matriçage doit être séparée de l‘étape du mixage. Nous
engageons un ingénieur en matriçage afin d‘obtenir une deuxième perspective sur
nos propres mix. L‘ingénieur en matriçage, avec son expérience et sa vue
d‘ensemble, saura mieux ce qui est bon pour notre propre musique : le point de vue
orienté de l‘artiste ne permet pas de faire les deux.
Nous croyons que cet argument est en partie fondé, quoiqu‘il soit, selon nous,
coupable du sophisme du « faux dilemme ». Bien sûr, le fait d‘avoir une deuxième
perspective sur tout ce que nous entreprenons dans la vie peut être bénéfique. Nous ne
pensons pas, toutefois, qu‘il est absolument nécessaire de séparer le mixage du matriçage
pour être en mesure de se permettre le luxe d‘avoir de bons conseils. Autrement dit, tant
qu‘à pouvoir obtenir un second avis, pourquoi pas sur tous les aspects de la production?
Ainsi, le travail en équipe n‘est pas obligatoirement exclu par cette méthode.
Argument 2 : Le mélange de l‘aspect créatif avec l‘aspect technique aura
probablement une incidence négative sur un des aspects, voire même sur les deux.
Pour avoir du succès dans ces deux domaines, il faut probablement être très discipliné et
expérimenté. Cependant, nous ne croyons pas que la difficulté d‘une quête est une
condition nécessaire et suffisante pour nous empêcher d‘y aspirer. Par analogie, nous ne
croyons pas que la difficulté (peut-être même l‘impossibilité) de parvenir à la paix dans le
monde est une raison suffisante pour ne pas y aspirer. Il s‘agit également d‘une question de
préférences et d‘aptitudes pour le musicien réalisateur : il peut choisir s‘il aime
suffisamment ou non les aspects techniques du son pour s‘y essayer. En ce qui nous
concerne, la réponse est « oui ».
Argument 3 : En mixant et en matriçant simultanément une chanson, il sera très
difficile de donner une cohérence sonique et dynamique à un groupe de chansons à
paraitre sur un seul et même album.
Pour nous, la cohérence d‘un album est presque entièrement un facteur relatif à la
composition des pièces musicales et moins un facteur relatif au travail de l‘ingénieur en
matriçage (même si ce dernier est extraordinaire). Si nous ne parlons que pour nous-
99
mêmes, nous affirmons que la cohérence (ou la non-cohérence) de nos propres réalisations
musicales dépend de notre propre processus de réalisation et du style de nos pièces (qui
sont habituellement assez uniforme pour un même album). Pour nous, ce fait règle la
question de la cohérence sonique de l‘album, quoique cela ne s‘applique pas à un album
réalisé par plusieurs personnes, telles des compilations, qui ne sont pas inclus dans la portée
de la présente recherche, davantage destinée aux compositeurs réalisateurs qu‘aux
techniciens en mixage qui ont des clients divers. En ce qui concerne la cohérence
dynamique et du niveau de sonie d‘un album, nous considérons la question assez simple.
Nous nous fixons une limite de référence en prenant une chanson de qualité moyenne de
l‘album pour la compresser jusqu‘au seuil de perte de la qualité sonore. Nous visons alors
le niveau de sonie obtenu pour les autres pièces de l‘album. Il est également important
d‘utiliser un bon outil de mesure comme un VU mètre analogique. Nous utilisons
personnellement le TT Dynamic Range Meter, que nous avons également utilisé aux
chapitres 1 et 2 et qui nous permet de garder des niveaux constants pour la réalisation de
notre album. Bien qu‘il ne s‘agisse pas d‘un outil de mesure de la sonie, celui-ci peut
parfaitement remplir cet office en raison du fait que la plupart des bons albums ont déjà une
cohérence stylistique et que le processus de mixage est, la plupart du temps, réalisé par une
même personne, qui utilise des techniques similaires au cours du même album. Comparer
des chansons aux mix et à la réalisation similaires en termes de marge dynamique pour
avoir une bonne approximation du niveau de sonie des pièces est alors tout à fait logique et
cohérent. Finalement, il reste qu‘en fin de compte nous faisons confiance à notre écoute
pour nos décisions finales.
Argument 4 : Vous affirmez que votre méthode est avantageuse puisqu‘elle vous
permet de parvenir à un mix au niveau de sonie élevée qui est fidèle à la balance
initiale du mix original. Il n‘y a, toutefois, aucun mix initial dans la méthode du
mixage-matriçage. Comment pouvez-vous alors comparer et évaluer la qualité de
votre mix final par rapport à un mix initial?
Cette objection présuppose une séparation entre les étapes du matriçage et du mixage.
Comme nous l‘avons déjà vu, notre méthode aborde le processus de réalisation comme un
tout organique. Cette objection est donc de forme sémantique, puisqu‘elle joue avec la
définition des mots et pose la mauvaise question. Lorsqu‘un musicien réalisateur fait un
mix, nous ne lui demandons pas de le comparer concrètement à son idéal d‘un mix bien
100
équilibré (l‘objectif qu‘il vise). Nous présupposons qu‘il a essayé de son mieux d‘atteindre
le meilleur avec les possibilités offertes par ses outils, ses capacités et ses goûts personnels.
Une personne qui adopte la méthode proposée tentera de parvenir à sa conception d‘un bon
mix (idéal). Il obtiendra alors un mix au niveau de sonie élevée fidèle à ce dernier. Nous
obtenons alors un mix au niveau de sonie élevé fidèle à ce que nous croyons (à tort ou à
raison) être le meilleur que nous pouvons faire dans le cadre de nos objectifs. À notre avis,
le recours au matriçage traditionnel ne permet pas d‘atteindre d‘aussi bons résultats,
puisque la méthode préconisée dans ce mémoire permet d‘avoir plus de contrôle sur chaque
instrument, chacun faisant l‘objet d‘une lourde compression. Pour nous, le recours à la
méthode traditionnelle ouvre la voie à plus d‘éléments non intentionnels et au hasard en
réalisation audionumérique (dépendant, par exemple, de qui fera le matriçage), alors que
nous cherchons plutôt un maximum du contrôle, sans pour autant se fermer au travail en
équipe ou à la réception de bons conseils.
Écoute critique des pistes ayant été mixées/matricées
Cette section est consacrée à l‘écoute critique des pièces que nous avons
mixées/matricées au cours de l‘été-automne 2013. L‘écoute a été réalisée au LARC,
l‘endroit où les pièces ont été également réalisées, un studio professionnellement traité,
avec un amplificateur de classe « A » et différents types d‘enceintes acoustiques
professionnelles avec l‘expérimenté ingénieur de son Serges Samson. Le format d‘écoute
de nos pistes et de celles auxquelles nous nous comparons est le mp3 320 kb/s, pour
simuler le résultat final et compressé tel qu‘écouté par la plupart des auditeurs. Le mot
d‘ordre a été de trouver des défauts aux pièces au point de vue des mix et du matriçage, et
nous avons été très sévères, car le système et la salle utilisés nous l‘ont permis. En somme,
moins il y a de commentaires sur une chanson, mieux c‘est. Nous n‘avons pas spécifié à
monsieur Samson que nous souhaitions particulièrement éprouver notre méthode de
mixage/matriçage, pour ne pas orienter son écoute.
Si nous synthétisons l‘ensemble des constats, nous avons surtout repéré des défauts
attribuables aux prises de son et à notre manque d‘expérience dans le mixage de certaines
101
pièces, sans parvenir à un constat qui pourrait réfuter la pertinence d‘avoir mixé et matricé
les pièces musicales en même temps. Le niveau de sonie est demeuré très constant pour nos
deux projets de styles différents. Notre plus récent album de musique électronique,
Something about being a man, qui a été mixé et matricé lentement dans une régie du LARC
durant l‘automne 2013, est comparable en qualité, et parfois supérieur, à des productions
ayant une qualité élevée (un tableau de mesures comparatives est donné quelques pages
plus loin). Les pièces de notre projet hip-hop nommé Careful, qui ont été réalisées dans
notre studio maison durant l‘automne 2013, sont comparables à des productions de bonne
qualité dans le style hip-hop sombre et planant, où une clarté de l‘image stéréophonique et
une présence profondeur n‘étaient pas visées. En ce qui concerne les résultats de l‘écoute
critique de notre album de musique électronique dansante, ce dernier dépasse tous les
albums de musique électronique en termes de dynamique et de profondeur, et nous avons
choisi de nous comparer aux productions que nous jugeons être de la meilleure qualité et du
meilleur professionnalisme, comme celles de Daft Punk (matricés par la légende Bob
Ludwig et Antoine Chabert en 2013), de James Blake (BBC sound of 2011) et de
Disclosure (Billboard UK no 2 en 2013), des groupes de musique électronique dansante qui
ont figuré au sommet des palmarès de popularité des dernières années et qui font partie du
Tableau 35 : Comparaisons de gamme dynamique et niveau maximum, quelques pages plus
loin. De plus, lorsque nous avons comparé notre album en termes de niveau de sonie à
d‘autres pièces relativement dynamiques de styles similaires, notre album égalait ou
dépassait en niveau de sonie ses compétiteurs. Nous pouvons affirmer que la qualité de
Something about being a man est supérieure en termes de définition, de dynamique et de
profondeur à la plupart de ses compétiteurs. En ce qui concerne, nous croyons être parvenus
à ce résultat grâce au contrôle maximal des artéfacts de la compression que la méthode du
mixage/matriçage nous a permis et grâce à la précision d‘écoute rendue possible par notre
passage au LARC (Laboratoire audionumérique de recherche et de création), équipé d‘une
console de mixage SSL 4000 et de moniteurs Adam S7K MK II, et à l‘avis professionnel et
académique de son ingénieur, Serges Samson77
.
77
Idéalement, il faudrait procéder à des tests de perception avec un public, afin de soutenir nos observations.
Toutefois et comme il s‘agit d‘un projet de recherche-création visant d‘abord notre propre satisfaction, un tel
test serait en-dehors des limites de ce mémoire.
102
Plongeons maintenant dans le vif du sujet en procédant à une écoute subjective et
critique de nos propres pièces, pour ensuite les mesurer et les comparer à d‘autres pièces
leur étant stylistiquement comparables.
Dragos, Something about being a man
Figure 100 : Pochette de Something about being a man
Cet album a été entièrement réalisé numériquement avec des plugiciels (plug-ins)
répliquant des sons de synthétiseurs analogiques classiques des années 1970-1980, comme
les populaires Jupiter, Juno, Prophet, Moog et Korg. Nous voulions que l‘album soit
agréable à entendre, autant comme un arrière-plan auditif pour une soirée entre amis que
pour une écoute attentive et analytique des instruments et des paroles. Le titre vient du fait
que nous avons tenté de dépeindre diverses facettes de l‘affect et de la raison chez l‘homme
(un exemple d‘hommerie), mais il s‘agit également d‘une instance d‘un homme (nous-
mêmes), d‘où le fait que le mot « being » soit estompé sur la pochette, suggérant ainsi cet
autre titre, Something about a man – Dragos. L‘un des objectifs était d‘obtenir un album
qui sonne bien tant dans des systèmes de très haute qualité que de très basse qualité. Sur le
plan de la sonie et de la dynamique, nous visions une performance équivalente à celle de
l‘album Discovery des Daft Punk (2001) (que nous avons bien dépassée). À notre avis, ces
objectifs ont été atteints ainsi que les objectifs faisant partie du cadre de notre maitrise, et
103
plus particulièrement de ce chapitre (surtout en tenant compte des très rapides progrès que
nous avons faits dans l‘année 2013).
Nous croyons toutefois que l‘album a manqué cruellement d‘un bon microphone et
d‘un bon préamplificateur pour les voix. Nous n‘avons travaillé qu‘avec des Sure SM57 et
SM58 directement dans les préamplificateurs de nos convertisseurs, ce qui a fonctionné
relativement bien pour des instruments, mais moins bien pour des voix. Il s‘agit d‘un
minimum extrêmement bas pour bien fonctionner, car en plus de travailler avec une basse
qualité à la source, nous devons inévitablement en perdre davantage avec la compression.
Très honnêtement, nous ne nous servons pas de l‘excuse classique selon laquelle il nous
aurait absolument fallu travailler avec des préamplificateurs Neve et des microphones U87
pour parvenir aux mêmes résultats que les groupes que nous aimons, car nous croyons qu‘il
est possible d‘arriver à d‘excellentes productions avec de l‘équipement d‘entrée de gamme.
Nous sommes néanmoins d‘avis que cela nous aurait grandement facilité la tâche que de
pouvoir enregistrer avec un bon microphone. Notre équipement d‘écoute était constitué
d‘un convertisseur Apogee Duet, d‘un amplificateur Bryston 2B (100W de classe AB) et de
moniteurs JBL L150. Le petit amplificateur n‘était peut-être pas optimal pour faire
fonctionner les massives JBL : après notre écoute au LARC nous avons constaté que nous
aurions pu sacrifier 2 dB dans les graves en échange d‘un peu plus de sonie, ce qui nous fait
croire que le Bryston avait peut-être de la difficulté à rendre toutes les graves réelles de nos
chansons. Au final, pour certains critiques, il s‘agit tout de même de « l‘un des albums
électro les mieux produits de toute l‘histoire du genre à Québec »78
. Voyons maintenant de
plus près chacune des pièces de l‘album, qui sont fournies avec le mémoire.
1. « Elegance and grace », ft. Rémi (coréalisé avec Jessy Caron)
Les synthétiseurs sont d‘une meilleure qualité que la voix, laquelle sonne comme
ayant été enregistrée avec un préamplificateur de piètre qualité. La voix prend une place
très carrée dans l‘image stéréophonique et dans la profondeur. Il y aurait fallu un meilleur
microphone pour la voix; il croit que nous n‘aurions pas pu faire mieux avec le SM58. Les
78
Genest Catherine, « Bye Bye 2013, version locale et sans Véronique Cloutier », Journal Voir, 11 décembre
2013, web.
104
guitares sonnent mieux que la quatrième chanson de l‘album (« Guest »), en raison de la
plus courte durée des notes. La dynamique est bien travaillée et le niveau de sonie est bon.
2. « Caring sphere » ft. Amélie et Thierry
La dynamique et le niveau de sonie entrent les standards habituels pour la musique
de ce genre (voir le Tableau 35 des mesures comparatives quelques pages plus loin). Les
voix sonnent mieux que la moyenne des autres chansons sur le reste de l‘album. L‘équilibre
des mix est bon et il y a de la profondeur.
3. « Sea people »
Le mix est super large, tant en hauteur qu‘en largeur; bon mélange de fréquences,
bonne profondeur pour un plugiciel. La prise de son du violoncelle sonne bien, la sonie de
la chanson est cohérente avec celle des autres et les différentes sections présentent des
variations dynamiques intéressantes.
4. « Guest » ft. Odile (coréalisé avec Jessy Caron)
La voix n‘est pas autant à la hauteur que le reste. Il y a trop d‘information pour la
quantité de compression appliquée à la chanson, un compromis sur la qualité que nous
avons dû faire pour que la chanson soit au même niveau de sonie que le reste de l‘album. Il
n‘y a pas suffisamment d‘espace entre les instruments. Le son n‘est pas assez découpé en
petits ilots dans l‘image stéréophonique. La basse prend beaucoup de place (toute la place).
Il y a matière à enlever des moyennes basses sur la guitare. Le niveau de sonie est bon.
5. « Sly Lust fig. 2 » ft. Gabrielle
Il n‘y aurait pas fallu que nous mixions cette basse et cette grosse caisse ensemble
dans le centre. Dès que la basse embarque, on perd la présence de la grosse caisse. Il y a
une fréquence dans les très graves qui flotte et qu‘on n‘entend que sur les gros moniteurs
Adam. La chanson n‘est pas assez large : elle donne l‘impression d‘être monophonique.
Elle est bourrée, mais sonne aussi loud que les autres chansons quoiqu‘elle ait un bon 2 dB
de moins au VU sur la SSL. La basse est beaucoup trop percussive pour l‘ensemble : si
nous voulions une basse aussi percussive, il y aurait fallu que nous composions autour. Le
105
niveau de sonie est bon. La qualité de la voix est basse, car sa hauteur a été diminuée après-
coup de deux tons avec la fonction de hauteur de base de Ableton Live 8.
6. « Friend » ft. Odile
La voix aurait pu être d‘une qualité supérieure. La chanson est beaucoup axée vers
les 400-600 Hz, ce qui comble beaucoup le centre, sans être nécessairement un défaut. La
dynamique et la profondeur sont bonnes. Le niveau de sonie est bon.
7. « A place to be » ft. Thierry
La chanson est large en hauteur et en largeur, partiellement à cause du petit bruit de
vinyle. La voix d‘accompagnement dans la réverbération ajoute énormément à l‘image
stéréophonique. Le mélange d‘effets sur la voix (chorus reverb) camoufle bien ses défauts.
La chanson a le niveau de sonie le plus élevé de l‘album.
8. « Hydrovince »
La qualité sonore est déséquilibrée. On dirait qu‘il y a du MP3 de piètre qualité
mélangé avec du bon mp3. Les hautes sont assez agressives, ce qui enlève de la profondeur.
Le fond est moins transparent, de sorte que même si elle est plus large en réalité que Sea
People, par exemple, elle sonne quand même moins large.
En somme, l‘abum Something about being a man est, pour nous, une réussite en
termes de qualité : de manière absolue et par comparaison à d‘autres albums (dans les pages
qui suivent nous procédons à des mesures comparatives) ainsi que par comparaison à notre
propre progression technique, les résultats liés à l‘utilisation de la technique de mixage-
matriçage sont prometteurs, malgré le fait que nous ayons repéré plusieurs lacunes dans la
profondeur, dans la distribution de l‘image stéréophonique et dans l‘agressivité des voix.
Tentons de voir si des résultats comparables peuvent être obtenus avec un autre style
musical. Dans la section qui suit, nous proposons un exercice identique avec l‘analyse de
trois chansons de musique hip-hop réalisées par nous-mêmes dans le cadre de notre projet
nommé Careful.
106
Careful
Figure 101 : un logo de Careful
Careful est le nom de notre projet hip-hop (coréalisé avec Vincent Laquerre) à partir
d‘échantillons granuleux, similaire aux sons pouvant être entendus sur de vieux vinyles
poussiéreux de Jazz et de Funk, dont certains échantillons sont d‘ailleurs tirés. Les trois
chansons que nous présentons ont été réalisées durant l‘automne 2013 dans notre studio
maison, traité acoustiquement, mais non professionnellement. L‘environnement de
réalisation n‘était donc pas autant optimal que celui du LARC, quoique, comme nous
l‘avons mentionné plus tôt, la clarté et la précision de l‘image stéréo et de la profondeur de
Something about being a man n‘était pas visée. Notre équipement d‘écoute était de
nouveau constitué d‘un convertisseur Apogee Duet, d‘un amplificateur Bryston 2B, un
amplificateur 100W de classe AB et de moniteurs JBL L150. Nous n‘avons, cependant, pas
rencontré le même problème des graves excessives : par prudence et par méfiance envers
notre environnement de travail (celui de notre studio maison), nous avons élevé plus de
graves que pour l‘album de musique électronique. Ainsi, un filtre passe-haut de 24 dB par
octave a été appliqué à 50 Hz pour toutes les pièces du projet « Careful », ce qui nous a
également permis, en libérant la bande passante disponible, d‘obtenir une sonie plus élevée
que Something about being a man.
107
En somme, l‘approche des mix et de la réalisation est très différente de celle de note
projet de musique électronique : nous avons tenté de répliquer les sons sombres des
groupes hip-hop instrumentaux comme Pete Rock et FloFilz, qui semblent être constitués
de vieux échantillons « basse-résolution » des anciens « drum machine » MPC (lesquels
n‘offraient pas encore une résolution minimale de 16 bits à 44.1 kHz).
1. Prism
Le mix est bien rempli dans les fréquences moyennes graves (80-600 Hz) et le
niveau de sonie est élevé. La définition, notamment des percussions, est plus basse que
celle de notre projet de musique électronique.
2. Rien de trop
Idem. La contrebasse et le saxophone (échantillons tirés d‘enregistrements Jazz
effectués au LARC) sonnent bien.
3. Yes ft. Gabrielle
Le mix a été trop travaillé, il n‘y a plus de gras et de chaleur (autour de 200-600 Hz)
et il y a un creux dans la région spectrale des hautes (autour de 1.2 kHz). Le niveau de
sonie bon. La chanson aurait pu être globalement plus sombre (moins de 7 kHz et plus) afin
d‘être plus cohérente, au point de vue spectral, que les deux autres chansons.
Au final, nous avons mixé-matricé trois chansons seules (singles) parues durant
l‘automne 2013, mais qui ne figurent sur aucun album pour le moment, ce qui peut fournir
une excuse (mince) pour le manque de cohérence spectrale pour la chanson « Yes » par
rapport aux deux autres. Le niveau de sonie des mix, qui sont fournis avec le mémoire, est
plus élevé que pour ceux de notre projet de musique électronique. La définition, la
profondeur et la distribution des éléments sur le champ stéréophonique aurait pu être
globalement meilleure, notamment en travaillant avec des échantillons de plus grande
qualité.
108
Mesures comparatives des chansons mixées/matricées
Prenons maintenant le temps d‘effectuer quelques mesures globales de nos
chansons mixées/matricées et comparons-les à un répertoire de quelques chansons
similaires pour avoir une référence. Le terme « clip » dans a colonne « Niveau maximum »
signifie que le signal audio du fichier a été écrêté, soit que l‘amplitude maximale a dépassé
le niveau de 0 dBFS (dans le domaine numérique, il est impossible de connaître de combien
le signal dépasse le 0 dBFS). Encore une fois, nous mesurons les fichiers en format mp3
320 kb/s à l‘aide du TT Dynamic Range Meter Offline, qui permet de mesurer la gamme
dynamique intégrée ainsi que le niveau maximal par piste (gauche/droite) pour une
meilleure précision.
Tableau 36 : Comparaisons de gamme dynamique et niveau maximum
Artiste Titre Année Gamme
dynamique
(dB)
Niveau
maximum
(peak)
gauche/droite
Daft Punk « Human after all » (2005) 2005 6 clip/clip
Daft Punk « One more time » (2001) 2001 9 clip/clip
Daft Punk « Da Funk » (1996) 1996 9 clip/clip
Daft Punk « Veridis Quo » (2001) 2001 11 clip/clip
Daft Punk « Face to Face » (2001) 2001 10 clip/clip
Daft Punk « Too long » (2001) 2001 9 clip/clip
James Blake « Retrograde » (2013) 2013 7 clip/clip
James Blake « Wilhelms Scream » (2012) 2012 5 clip/clip
Hot Chip « Flutes » (2012) 2012 5 clip/clip
Pete Rock « What you wainting for » (2001) 2001 10 clip/clip
Artful Dodger « Please don‘t turn me on » (Disclosure
Remix) (2013)
2013 6 clip/clip
Amirali « Hear Me » (2013) 2013 7 clip/clip
Chris Malinchak « So Good To Me » (2012) 2012 9 clip/clip
Friendly Fires « Paris » (Aeroplane Remix) (2009) 2009 7 clip/clip
Klangkarussel « Sonnentanz » (2012) 2012 6 clip/clip
Moon Boots « No one » (2013) 2013 7 clip/clip
The Jazzual
Suspects
« This beat » (2008) 2008 13 clip/clip
Dragos & Jessy « Elegance and grace » ft. Rémi (2013) 2013 7 clip/clip
Dragos « Caring sphere » ft. Amélie & Thierry
(2013)
2013 7 — 0,32/-0,22
Dragos « Sea people » (2013) 2013 8 clip/-0,51
Dragos & Jessy « Guest » ft. Odile (2013) 2013 6 -0,30/-0,43
Dragos « Sly lust fig. 2 » (2013) 2013 6 -0,20/clip
Dragos « Friend » ft. Odile (2013) 2013 6 -0,01/-0,14
Dragos « A place to be » ft. Thierry (2013) 2013 6 -0,40/-0,07
Dragos « Hydrovince » (2013) 2013 7 -0,18/-0,05
Careful « Prism » (2013) 2013 7 -0,32/-0,26
Careful « Rien de trop » (2013) 2013 7 -0,37/-0,49
Careful « Yes » ft. Gabrielle (2013) 2013 8 -2,21/-1,82
109
Comme ces mesures ont lieu dans le domaine numérique, les conditions d‘écoutes
dans différents environnements d‘écoute ne peuvent avoir d‘incidence sur celles-ci. Il est
intéressant de noter que la plupart de nos chansons n‘écrêtent pas, et que certaines ont un
maximum aussi bas que -2.20 dBFS, des maximums comparables aux chansons des
années 1990. Si nous avions effectué les mêmes mesures avec des fichiers décompressés
wav, nos chansons auraient atteint un maximum de -0,70 dBFS, une limite que nous avons
donnée à tous nos limiteurs sur les bus maitres. Une fois qu‘il y a conversion au
format mp3, nous voyons que cette limite s‘approche dangereusement du 0 dBFS et génère
même de l‘écrêtage, comme cela a été le cas pour tous nos morceaux de référence (et pour
toutes les chansons de format mp3 que nous avons mesurées, à l‘exception des nôtres).
L‘avantage d‘avoir des crêtes maximales à des niveaux aussi faibles est que cela diminue
les distorsions causées l‘équipement de lecture audio, surtout lorsqu‘il s‘agit d‘équipement
de qualité consommateur et de formats compressés comme le mp379
. Les transitoires
rapides et les hautes fréquences de nos chansons sont généralement plus doux et mieux
définis. Un autre élément intéressant à noter est que nos gammes dynamiques sont assez
faibles, même si à l‘écoute nos chansons paraissent très dynamiques par rapport aux
productions commerciales. Il semble que nous ayons réussi à créer une illusion de
profondeur et de dynamique, même si, dans les faits, notre gamme dynamique est toute
aussi étroite que la plupart des enregistrements commerciaux.
Finalement, le style d‘une pièce est un facteur déterminant dans le caractère
dynamique, et donc dans la gamme dynamique, d‘une pièce : par exemple, une pièce plus
lente risque d‘avoir plus de silence entre ses percussions et donc d‘être plus dynamique...
Le fait que nous ayons mixé et matricé en même temps nos chansons n‘a eu que peu d‘effet
sur le caractère (dynamique ou pas) de nos chansons. Il semble que la dynamique des
chansons, autant les nôtres que celles des autres artistes figurant dans le Tableau 35, est un
facteur qui découle surtout des choix esthétiques des artistes, ce qui nous laisse croire qu‘il
nous faudrait avoir une vision encore plus organique et encore plus englobante de tout le
processus de création et de réalisation pour bien décrire la dynamique et le niveau sonique
d‘une pièce musicale.
79
Thomas Lund, « Loudness Wars », web.
110
Sommaire
Dans ce chapitre, nous avons proposé une méthode consistant à mixer et à matricer
en même temps pour conserver un maximum de contrôle sur les aspects de dynamique, de
sonie et d‘image stéréophonique d‘un mix sans trop altérer le résultat créatif. Pour nous, il
s‘agit d‘un grand progrès dans la qualité de ce que nous sommes capables de réaliser,
surtout considérant d‘où nous sommes partis il y a de cela à peine un an. Nous pensons
néanmoins que le nombre de cas d‘utilisation de cette technique est insuffisant pour fonder
une méthode quelconque ou pour extrapoler des résultats généraux pour l‘utilisation de
cette méthode, voire même la recommander (en dehors de nos propres pratiques de création
musicale) à d‘autres réalisateurs. Maintenant que nous avons fait ces réalisations, ces mix et
ces matriçages, nous ne sommes pas totalement satisfaits : nous voulons encore plus de
dynamique, de pureté sonore (lorsque cela s‘applique au style) et surtout une image
cristalline plusieurs fois supérieure à ce que enceintes peuvent même rendre. Nous voulons
pouvoir, en marchant autour de l‘aire de projection des enceintes, avoir l‘impression de
faire le tour d‘un chanteur. Nous ne souhaitons pas fournir une conclusion nuancée,
quoique c‘est le résultat que nous obtenons présentement : le niveau de sonie est
grandement influencé par l‘esthétique des productions, bien plus que par la méthode de
compression qui a été employée au mixage, au matriçage ou au mixage/matriçage. Nous
aurions aimé plutôt avoir une affirmation éclatante où nous affirmerions avoir trouvé une
solution applicable universellement qui fonctionne à tout coup pour un résultat
systématiquement meilleur, mais ce n‘est pas le cas.
111
Conclusion du mémoire
Au début de ce mémoire, nous avons cherché à obtenir des niveaux soniques élevés
en considérant le processus de réalisation musical comme un tout intégré afin de nous
permettre de mieux contrôler les effets indésirables causés par une forte réduction de la
gamme dynamique. Ces derniers apparaissent sous la forme de distorsions, de perte de
nuances dynamiques et entrainent souvent l‘altération, voire la destruction de l‘image du
mix souhaité. Ainsi, nous avons cherché à obtenir les avantages d‘une sonie élevée pour
nos mix finaux (comme une meilleure perception du champ spectral et un mix plus
dynamique) tout en respectant notre idéal de ce qu‘est un bon mix. Nous avons tenté trois
approches pour arriver à nos fins : la conception sonore en vue d‘une sonie plus efficace
(chapitre 1), le travail de programmation de percussions en vue d‘une dynamique plus
efficace (chapitre 2) et le mixage/matriçage simultané pour un contrôle optimal et local des
altérations du son causées par les compresseurs et les limiteurs (chapitre 3). Sans exclure
les deux premières approches et leurs apports à l‘augmentation de la qualité et de la sonie,
la troisième approche nous a semblé la plus prometteuse, car, à notre avis, nous avons été
en mesure d‘augmenter la qualité de nos réalisations musicales, alors qu‘il ne nous avait
pas été possible d‘observer une augmentation de la qualité aussi évidente pour les
premières approches, bien qu‘il nous reste encore énormément de progrès à faire.
Nous mettons ici rapidement en doute la réelle possibilité de rendre compte d‘une
manière quantitative des catégories qualitatives dans le cadre d‘une étude en recherche-
création. Nous nous sommes constamment heurté aux mêmes problèmes lorsque nous
avons essayé de rendre compte d‘une manière quantifiable l‘expérience humaine de la sonie
et de la dynamique. À notre avis, les standards qui ont guidé notre travail doivent
radicalement être revus et, surtout, contextualisés afin qu‘ils permettent de mesurer d‘une
manière plus précise le niveau de sonie d‘une pièce musicale. Encore là, faudrait-il trouver
une manière d‘inclure et de rendre compte de considérations stylistiques et esthétiques
(tempo, instruments, traitement du signal, etc.) dans l‘équation pour le calcul de la sonie, ce
qui est fort probablement irréalisable, ou à tout le moins plutôt subjectif. Même si cela était
possible, nous pouvons certainement nous attendre à devoir faire face aux mêmes
problèmes que nous avons éprouvés en tentant de rendre une description quantifiable d‘une
112
expérience humaine essentiellement qualitative; ultimement, la description quantitative doit
toujours omettre des aspects cruciaux dans notre manière d‘expérimenter notre monde. Nos
propres observations subjectives nous mènent à penser que les méthodes avancées dans
tous les chapitres (design sonore, programmation des percussions et mixage/matriçage) ont
toutes contribué à augmenter le niveau final de sonie de nos exemples à des degrés plus ou
moins significatifs. Sans vouloir dresser un faux dilemme entre le recours aux standards de
production et l‘expérience esthétique subjective, nous pouvons tout de même nous poser la
question suivante : devons-nous rejeter la voix de notre subjectivité, tandis que l‘art est par
définition subjectif, individuellement et socialement, et abandonner notre expérience du
monde qui nous entoure au profit d‘un discours empirique et à ses instruments de mesure?
Est-ce cela ce que nous considérons comme une démarche logique et rigoureuse? Est-ce là
faire preuve d‘un esprit critique? Faut-il absolument que nos expériences subjectives soient
soutenues par des abstractions mesurées (gamme dynamique, sonie intégrée, gamme de
sonie) pour qu‘elles puissent avoir, elle aussi, une voix dans nos jugements finaux de l‘état
des choses? Nous n‘avons pas de réponse décisive à ces questions complexes, mais nous
croyons peut-être avoir donné trop d‘importance aux données quantitatives lors de cette
recherche, et pas assez accordé d‘importance aux processus créatifs tels que la composition
et le processus menant à la composition.
Au cours de nos études à la maitrise, nous avons eu l‘occasion de prendre
conscience de toute l‘exagération qui caractérise les pratiques visant les fortes sonies dans
le domaine de l‘audionumérique. L‘exemple le plus frappant de notre travail réside dans les
exemples 6A et 6B (Hip-Hop avec Saxophone) du premier chapitre sur le design sonore
pour une sonie plus efficace, lors de l‘étape de l‘utilisation du limiteur. Avec des chansons
aussi organiques (ayant des échantillons de vrais instruments et ayant des nuances
dynamiques telles que des crescendos et des décrescendos), le moindre changement, même
ridiculement petit, peut réduire considérablement la gamme dynamique de toute la pièce.
Les tests ont montré qu‘une hausse du gain d‘entrée pour la version 6B de 4,14 dB à
4,88 dB engendrait une diminution de la gamme dynamique de 10 à 8 dB! Cela équivaut à
une perte considérable des nuances dynamiques (quoique 8 dB est tout de même bien de
nos jours) pour un gain infime en sonie; et nous aurions même pu aller jusqu‘à augmenter
le gain de 10 dB.
113
D‘un autre côté, nous avons observé à quel point le fait de libérer les très graves
pouvait favoriser une hausse en gamme dynamique. Par exemple, une diminution de 2,2 dB
des 66,6 Hz pour la version 14A nous a permis, en gardant le même gain d‘entrée au
limiteur, de passer d‘une gamme dynamique de 7 dB à une gamme dynamique de 9 dB.
Dans certains cas, cela peut être désirable, car parfois le punch obtenu est plus avantageux
que la perte des basses très graves, que notre cerveau, de toute façon, fabrique plus souvent
(sans compter les barrières idéologiques, physiologiques et psychologiques de notre
perception) qu‘il ne perçoit80
. Parallèlement, nous pensons aussi que nous aurions pu
diminuer globalement les graves de notre album Peace and Knowledge, présenté au
troisième chapitre, pour obtenir un gain de dynamique ou bien pour investir l‘épargne faite
dans la bande passante de manière à augmenter le capital de sonie. Nous avions déjà pris la
précaution de ne pas utiliser de longues basses soutenues pour favoriser des petits sons
percussifs très rapides (à l‘exception de 3. Sea People), ce qui a été une bonne piste que
nous continuerons d‘explorer et d‘exploiter. Justement, nous croyons que notre approche
intégrée du processus de réalisation audionumérique pour un niveau de sonie optimal avec
le moins d‘artéfacts possible aurait dû inclure aussi les étapes de composition et peut-être
même une étape préliminaire où nous aurions passé beaucoup de temps à écouter et à
analyser les morceaux musicaux qui nous semblent les mieux réussis à ce chapitre pour
développer notre propre esthétique précise et intentionnelle au maximum. Bref, inclure les
catégories du style et de la composition (une idée à garder en tête pour un futur travail) à
notre recherche sur la phonographie aurait sans doute été bénéfique pour de meilleurs
résultats. Néanmoins, notre étude a permis de relever des méthodes qui demeurent très
prometteuses (surtout celle du mixage et du matriçage simultanés) pour la préservation de
la qualité sonore, pour l‘obtention d‘une sonie élevée, pour pouvoir aiguiller le processus
créatif vers un résultat plus fonctionnel, voire efficace, que ce soit au niveau de la
résolution des problèmes ou à l‘exploration ouverte de textures qui interagissent de manière
positive dans le spectre dynamique, et ce, même si les catégories stylistiques et de la
composition n‘ont été que peu exploitées.
Une question subsiste toujours : vaut-il réellement la peine de sacrifier une part de
la qualité audio pour une sonie plus élevée? Nous en avons sacrifié un peu pour notre
80
Daniel R. Raichel, The science and applications of acoustics, 226.
114
album dans les chansons qui étaient le plus chargées d‘éléments instrumentaux. Nous
pouvons également nous demander, compte tenu du fait que la capacité de la bande
passante double aux 20 mois avec les développements technologiques81
, et compte tenu du
fait que certaines sociétés comme Fidelio Technologies82
offrent déjà des services de
matriçage et de rematriçage HD (24Bits/352.8kHz) pour téléchargement, s‘il vaut la peine
de compromettre la qualité des pièces audio aujourd‘hui, en prenant le risque qu‘une
récupération future de la destruction causée par la compression des pièces musicales qui
nous sont contemporaines ne soit pas possible. Les réalisations musicales de notre ère
seraient alors marquées à tout jamais par cette mode. Cela dit, et malgré certains standards
très raisonnables proposés par Tischmeyer83
il n‘est pas certain que les pièces de musique
électronique dansantes puissent se passer de l‘aide d‘un peu de sonie pour obtenir un succès
commercial plus grand.
Ceci étant dit, nous ne pensons pas que les « mauvaises habitudes de compression »
changeront grâce à la bonne volonté des réalisateurs et des « décideurs » dans le domaine
de l‘industrie musicale. Nous ne pensons pas que notre connaissance des faits (comme le
fait de savoir que la lourde compression compromet la qualité audio), à elle seule, soit
suffisamment motivationnelle d‘un point de vue presque éthique pour pousser la
communauté de réalisateurs, par elle-même, à changer nos habitudes. L‘histoire nous
enseigne que nous, les humains, ne fonctionnons pas de cette manière. L‘histoire nous
enseigne que l‘homme ne tire pas des leçons de l‘histoire. Ceci est un phénomène
qu‘Aristote nommait « acrasie », au début du septième livre de l‘Éthique à Nicomaque, et
qui consiste à agir contre les impératifs rationnels de notre connaissance des faits. Pour
atteindre un point où les progrès technologiques, telles que l‘augmentation de la bande
passante, l‘augmentation de l‘espace de stockage, l‘augmentation de la gamme dynamique
de nos médiums musicaux et l‘augmentation considérable de la vitesse de téléchargement,
nous permettraient de changer nos habitudes sans efforts ou pertes face à la compétition
entre artistes, il se pourrait que 20 ans passent, ou même plus. Combien de temps sommes-
nous alors prêts à attendre ? Combien d‘albums de musique seront affectés par les artéfacts
81
Thomas Lund, « Loudness Wars », web. 82
Fidelio Technologies, web. 83
Pleasurize Music Foundation, web.
115
indésirables de la compression en attendant une possibilité très hypothétique (pour ne pas
tomber dans le positivisme technologique et historique) que la technologie apporte des
solutions à ces problèmes ? Jusqu‘à l‘arrivée à ce point, il vaut la peine de dépenser des
efforts pour trouver des solutions aux problèmes actuels générés par la compression, sans
se soustraire au contexte de compétition pour des niveaux élevés de sonie lorsqu‘elle
apporte des effets positifs à des genres musicaux où une telle pratique est avantageuse.
La plupart des auteurs condamnent la compression, sans tenter de trouver des
solutions qui sont applicables et pensées en fonction de notre contexte actuel : il y a des
tonnes d‘artistes et la compétition pour susciter l‘attention est plus grande que jamais. Il y a
probablement des milliers de jeunes adolescents qui réalisent une musique semblable à la
nôtre sur leur ordinateur. Rejeter complétement la compression en raison de ses mauvais
effets sur la qualité du son n‘est pas une solution avantageuse (dans notre contexte) pour les
artistes. Même si la situation peut être agaçante pour certains audiophiles, nous croyons
qu‘il y a tout de même une demande pour du matériel musical ayant des niveaux de sonie
très élevés. Nous n‘avons besoin que de nous remettre à l‘esprit les nombreux discours
passionnés que nous avons eus avec des amis au sujet des mauvais effets de la
compression. Ils partageaient tous le même avis que nous, jusqu‘à ce que nous leur
montrions des exemples de nos mix avant et après la compression. À l‘unisson, ils
affirmaient tous alors que la version compressée était meilleure. Nous réalisions alors que
nos arguments n‘étaient pas autant convaincants que l‘écoute comparative de gens habitués
à un matériel audio compressé, qui à son tour crée des attentes. Ces derniers ne sont pas à
blâmer, car leur réaction était spontanée et sincère.
Pour reformuler l‘argument en d‘autres termes, nous devons offrir une solution
avantageuse aux artistes (comme un processus de réalisation musicale intégré pour une
sonie plus efficace), au lieu de condamner la compression. Nous pouvons comparer cette
impasse à une situation similaire au début du 21e siècle, lorsque le piratage était un
« mauvais » phénomène « hors de contrôle » pour les grandes industries du divertissement
qui essayaient de faire voter des lois (c‘est encore le cas) dans le but de connaître l‘identité
des pirates, et ainsi, pouvoir ensuite les poursuivre en justice. Les clubs de location vidéo
116
faisaient faillite. iTunes et Netflix, au lieu de s‘asseoir sur le pôle de la condamnation de ces
pratiques, ont vu l‘occasion d‘offrir un service à domicile payant et pratique et ils eurent
beaucoup de succès84
. Ils ont compris que les gens ne volaient pas la musique et les films ;
ils étaient plutôt en train de montrer à l‘industrie du divertissement les moyens de se faire
de l‘argent. Bien que le profit monétaire n‘est pas ici notre objectif, nous pouvons tout de
même voir le contexte actuel d‘une manière similaire pour développer de nouvelles
méthodes de compression en minimisant les problèmes habituellement engendrés par celle-
ci au lieu de condamner cette pratique en demande, une critique qui n‘est pas très
constructive et ni avantageuse pour l‘artiste ou l‘auditeur.
Certains souhaitent qu‘il y ait une législation ou une imposition d‘une normalisation
pénalisant les mix musicaux « délinquants » ayant un niveau de sonie élevé par rapport aux
mix dynamiques. Selon certains articles, cela serait en train de se produire en ce moment
même85
. Nous ne sommes vraiment pas certains que la réglementation et la normalisation
sont des bons moyens de favoriser la diversité et l‘expression, il s‘agit justement d‘un
manque à ce niveau que les gens en faveur de ces mesures reprochent à la compression. En
fait, s‘il y a un domaine où nous devrions laisser les gens faire ce qu‘ils veulent faire, c‘est
bien dans le domaine de l‘art (et nous croyons avec le musicologue Juha Markus Mantere86
et plusieurs autres avant lui que la production phonographique est un art), et ce, peut
importe nos partis-pris esthétiques.
Nous croyons que les perspectives d‘avenir pour une méthode de réalisation
audionumérique intégrée sont très prometteuses, si nous continuons à mieux développer
notre écoute, notre esthétique, notre technique de travail et si nous continuons à avoir un
accès régulier à des infrastructures où une écoute de grande qualité est possible. Nous
croyons que plusieurs réalisateurs de musique font déjà certains (ou même la plupart) des
procédés que nous avons décrits dans ce mémoire. Il y a probablement une pléthore de
réalisateurs de musique électronique qui choisissent de travailler avec des matériaux très
84
Anthony Leather, « Online piracy was a missed opportunity », Forbes Magazine, (2013), web. 85
Paul Resnikoff, « How iTunes Radio Is Single-Handedly Ending the ‗Loudness Wars‘ », Digital Music
News, 28 Octobre 2013, web. 86
Juha Markus Mantere, The Gould Variations ; Technology, philosophy and criticism in Glenn Gould’s
Thought and Musical Practice, thèse acceptée à l‘Université de Tampere, (2006), p. 147.
117
larges et lourdement compressés87
, sans qu‘ils ne songent à trouver une méthode pour tirer
partie des avantages d‘une forte sonie tout en limitant ses dégâts inévitables causés par un
contrôle accru de la compression. Malgré cette très forte probabilité, la littérature
scientifique à ce sujet est extrêmement rare. Nous avons grandement besoin d‘une
recherche (impliquant des gens expérimentés et ayant recours à de la technologie de pointe)
sur les moyens d‘obtenir de meilleures réalisations musicales tout en demeurant compétitifs
face aux gabarits commerciaux et aux standards élevés des niveaux de sonie.
87
Nous pensons aux populaires plugiciels Nexus, Gladiator, and Massive, trois synthétiseurs virtuels dont la
sonie nous semble ridiculement élevée.
119
Bibliographie
Bauer, B. B. et Torick, E. L., « Researches in Loudness Measurement », IEE Transactions
on Audio and Electroacoustics, vol. AU-14, no 3, septembre 1966.
Bogh Brixen, Eddy, Audio Metering, Measurements, standards and practice, 2e édition.
Oxford : Focal Press, 2011.
Damaske, Peter, Acoustics and Hearing. Berlin : Springer, 2008.
Deruty, Emmanuel, « ‗Dynamic Range‘ & The Loudness War », Sound on Sound,
septembre 2011, web : http://www.soundonsound.com/sos/sep11/articles/loudness.htm
Deruty, Emmanuel, Elements of Popular Music Analysis, Dynamics: evolution over the
years, distributions, décembre 2012, web: http://1-1-1-1.net/IDS/?p=747
Dow, Rory, « Programming realistic drum parts », Sound on Sound, septembre 2010, web :
http://www.soundonsound.com/sos/sep10/articles/drum-prog.htm
EBU R 128, Loudness normalisation and permitted maximum level of audio signals, 2011,
web: http://tech.ebu.ch/docs/r/r128.pdf
EBU TECH 3342, Loudness Range: A measure to supplement loudness normalisation in
accordance with EBU R 128, 2011, web: http://tech.ebu.ch/docs/tech/tech3342.pdf
Fidelio Technologies, web: http://www.fideliotechnologies.com
Goldstein, J. L., « Phase effects in two-tone suppression investigated with a binaural
lateralisation paradigm », Psychophysics and Physiology of Hearing. New York:
Academin Press, 1977.
Hollin, Jones, « Sound design using Thor », MusiTech Focus, Synthesis : The in-depth
guide for the creative musician, treisième édition. Bath : Anthem Publishing, 2011.
Howard, M. David et Angus Jamie, Acoustics and psychoacoustics, 3e édition. Elsevier:
Focal Press, 2006.
120
Huber, David, « MIDI : Handbook for Sound Engineers », Audio Engineering Explained,
édition par Douglas Self. Elsevier : Focal Press, 2010.
ITU BS 1770-1, Algorithms to measure audio programme loudness and true-peak audio
level, 2006-2007, web: http://webs.uvigo.es/servicios/biblioteca/uit/rec/BS/R-REC-BS.1770-1-200709-
I!!PDF-E.pdf
ITU BS 1770-2, Algorithms to measure audio programme loudness and true-peak audio
level, 2012, web: http://www.itu.int/dms_pubrec/itu-r/rec/bs/R-REC-BS.1770-2-201103-S!!PDF-E.pdf
ITU BS 1770-3, Algorithms to measure audio programme loudness and true-peak audio
level, 2012, web: http://www.itu.int/dms_pubrec/itu-r/rec/bs/R-REC-BS.1770-3-201208-I!!PDF-E.pdf
Izhaki, Roey, Mixing audio, Concepts, Practices and Tools. Burlington: Focal Press, 2008.
Katz, Bob, « About the loudness war pt.1 », AES 2009, web:
http://www.youtube.com/watch?v=XCd6MHlo_iA
Katz, Bob, Mastering Audio; The art and the science. New York: Focal Press, 2002.
Kuttruff, Heinrich, Acoustics; An Introduction. New York: Taylor & Francis, 2007.
Lund, Thomas, « Loudness : The Quest for the Holy Grail », Audio Engineering Society,
121e convention, 5 oct. 2006, 8, web :
http://www.postmodernmastering.com/artigear/technicalpapers/6AES121_2006_Loudness.pdf
Lund, Thomas, Loudness Wars pt. 1, séminaire dans le cadre de Rome Calling, 2011, web:
https://www.youtube.com/watch?v=BhA7Vy3OPbc
Lüthi, Bruno, Physical acoustics in the solid state. New York: Springer, 2005, 426 p.
Mantere, Juha Markus, The Gould Variations ; Technology, philosophy and criticism in
Glenn Gould’s Thought and Musical Practice, thèse acceptée à l‘Université de Tampere,
(2006), web : https://repository.library.brown.edu/fedora/objects/bdr:11271/datastreams/PDF/content
Miranda, Luis, « Multichannel Loudness Listening Test », Audio Engineering Society, 124e
convention, mai 2008, web : http://www.aes.org/events/124/124thWrapUp.pdf
Moulton, David, Total Recording ; The complete guide to audio production and
engineering. États-Unis : Kendall Printing, 2000.
121
Orban, Robert, Orban White Paper, Using the ITU BS. 1770-2 and CBS Loudness Meters
to Measure Loudness Controller Performance, 2012, web:
http://www.orban.com/support/orban/techtopics/White%20Paper-
BS.1770%20vs%20CBS%20meter%20V2.pdf
Orban, Loudness Meter for Windows v. 2.0.8, 2012, web:
http://www.orban.com/meter/Installation.html
Pleasurize Music Foundation, web: http://www.pleasurizemusic.com & http://www.dynamicrange.de
Price, Simon, « Using the Malström synth in Reason », Sound on Sound, aout 2005, web:
http://www.soundonsound.com/sos/aug05/articles/reasontech.htm
Raichel, Daniel R., The science and applications of acoustics 2nd
edition. New York:
Springer, 2006.
Rossing, Thomas D., Springer Handbook of Acoustics. Stanford: Springer, 2007.
Russ, Martin, Sound Synthesis and Sampling, Édition seconde. Elsevier: Focal Press, 2004.
Snoman, Rick, The Dance Music Manual 2nd
edition. Oxford: Focal Press, 2009.
Sreedhar, Suhas, « The Future of Music; Part One: Tearing Down the Wall of Noise »,
IEEE Spectrum, aout 2007, web: http://spectrum.ieee.org/computing/software/the-future-of-music
Tischmeyer, Friedemann, Audio Mastering Tutorial DVD Vol. III. Santa Cruz: Tischmeyer
Publishing, 2007.
Tischmeyer, Friedemann, Audio Mastering with PC workstations, Vol. 1 (DVD). Santa
Cruz: Tischmeyer Publishing, 2007.
Tingen, Paul, « Secrets of the mix engineers : JJ Puig », Sound on Sound, novembre 2007,
web: http://www.soundonsound.com/sos/nov07/articles/insidetrack_1107.htm
Toole, Floyd, Sound Reproduction, Loudspeakers and rooms. Elsevier: Focal Press, 2008.
123
Annexes
Annexe 1 : le cas de l’article « ‘Dynamic Range’ & The Loudness War »88
Introduction
Dans l‘article intitulé « ‗Dynamic Range‘ & The Loudness War »89
écrit par
Emmanuel Deruty, plusieurs erreurs logiques fondamentales sont comises, selon nous, dans
la défense d‘une thèse découlant des résultats d‘une impressionnante recherche fondée sur
l‘analyse d‘un échantillon de plus de 4500 titres parus entre 1980 et 2010. Deruty suggère
au lecteur de poser un regard nouveau sur la Loudness War et les croyances « populaires »
lui étant associée qui prétendent que la gamme dynamique est moindre dans les chansons
d‘aujourd‘hui qu‘elle l‘était pour les chansons d‘avant. Ainsi, et à l‘encontre des opinions
émises par les plus grands spécialistes (Katz90
, Tischmeyer, Lund, la revue scientifique
IEEE Spectrum91
, et quantité d‘autres), l‘auteur défend la thèse selon laquelle la gamme
dynamique des chansons d‘aujourd‘hui est supérieure à celle des années 1980; par
exemple :
We all know music is getting louder. But is it less dynamic? Our ground-breaking research proves
beyond any doubt that the answer is no — and that popular beliefs about the ‗loudness war‘ need
a radical rethink92
.
Comment se fait-il alors que Tischmeyer lutte pour « rétablir » (re-establish)93
la gamme
dynamique? Comment se fait-il alors qu‘une autre version de la même recherche de Deruty
n‘aboutit pas aux mêmes conclusions94
, et qu‘elle est citée en plus sur le site web
dynamicrange.de95
, un site associé à Tischmeyer? Y a-t-il une quelconque logique dans
cette confusion? Est-ce qu‘un simple étudiant débutant sa maitrise peut s‘en prendre à une
recherche et un auteur aussi respectés? Globalement, nous ne sommes pas en désaccord
avec les faits individuels présentés dans la recherche de Deruty; ces faits ne nous font
88
Emmanuel Deruty, « ‗Dynamic Range‘ & The Loudness War‘ », web. 89
Idem. 90
Bob Katz, Mastering Audio; The Art and the Science, 271-278. 91
Suhas Sreedhar, « The Future of Music; Part One: Tearing Down the Wall of Noise », IEEE Spectrum,
(aout 2007), web. 92
Emmanuel Deruty, « ‗Dynamic Range‘ & The Loudness War‘ », web. 93
Pleasurize Music Foundation, web. 94
Emmanuel Deruty, Elements of Popular Music Analysis, Dynamics: evolution over the years, distributions,
(décembre 2012), web. 95
Pleasurize Music Foundation, web.
124
toutefois pas aboutir aux mêmes conclusions, de sorte que la présentation ou la forme de sa
présentation nous parait erronée.
Confusion des genres
En lisant l‘article, nous sentons un perpétuel malaise de l‘auteur (sans vouloir entrer
dans des interprétations psychologisantes ou herméneutiques), qui emploie les termes
Dynamic Range et Loudness Range souvent comme des synonymes. Avec comme arme à
la main les fameux EBU 3342 et BS 1770, celui-ci prétend parler de la dynamique des
pièces dans sa conclusion et dans son titre d‘article, alors qu‘il parle en fait de la gamme de
sonie. Parfois, on a l‘impression que l‘auteur sent lui-même ce malaise et tente
maladroitement de joindre son argumentaire en le liant de structures logiques qui laissent à
désirer : « However, we‘ve seen during this article that the loudness war actually didn‘t
result in any reduction in the closest well-defined descriptor there is to ―dynamic range‖,
which is loudness range as defined by the EBU 3342 technical document », dit-il en
contredisant lui-même une de ses premières affirmations : « The term ‗dynamic range‘ will
be reserved for the measure of signal-to-noise ratio of a recording medium.
Mais celui-ci ne se limite pas à se contredire lui-même, car il néglige aussi, très
ironiquement, une mise en garde fondamentale du EBU 334296
: « Loudness Range should
not be confused with other measures of dynamic range or crest factor, etc. ». C‘est entre
autres pour cette raison que nous soulignons le fait que la gamme de sonie n‘est qu‘un
indice/effet de la gamme dynamique, mais que ce n‘est pas une mesure dynamique97
. Ainsi,
lorsque Deruty affirme que les conclusions de sa recherche mettent en doute de manière
« radicale » les croyances populaires, lorsqu‘il affirme que les pièces d‘aujourd‘hui ne sont
pas moins dynamiques que celles d‘avant ou lorsqu‘il reproche à certains auteurs de ne pas
trop savoir de quoi ils parlent en se rapportant à la dynamique98
, nous pensons simplement
qu‘il ne parle pas de la même chose que les autres et que sa conclusion de recherche ne
s‘oppose qu‘en apparence aux « croyances populaires ».
96
EBU TECH 3342, Loudness Range: A measure to supplement loudness normalisation in accordance with
EBU R 128, 2011, web 97
Voir Chapitre 1, p 38-44. 98
Par exemple : « It‘s easy to find people, documents, web pages and so on that unanimously blame the
loudness war for damaging music. Many of them also link the loudness war to a reduction in ―dynamic
range‖, though they usually don‘t explain what dynamic range might be » dans Emmanuel Deruty,
« ‗Dynamic Range‘ & The Loudness War‘ », web.
125
Notre interprétation de la recherche
De quoi parle alors cette recherche? Elle doit bien servir à quelque chose, avec ses
graphiques chics et ses échantillons impressionnants? L‘auteur de l‘article a une manière
très particulière d‘effectuer ses tests pour parvenir à certains résultats. Premièrement, il
examine la gamme sonique sur des fenêtres de temps très brèves (une pratique, en aucun
cas, recommandée en EBU R 128, en EBU 3342 ou en BS 1770). Il compare des musiques
de styles différents et d‘époques différentes : des anciennes chansons qui avaient du bruit
de fond (analogique) versus des nouvelles chansons, percussives et n‘ayant pas de bruit de
fond (virtuellement, nous pouvons avoir du silence entre les attaques). Même si le calcul de
la gamme sonique tel qu‘indiqué en EBU 3342 et en BS 1770 comprend un système de
porte-de-bruit (gating) qui élimine les silences dans la comptabilisation des données
soniques, lorsque les anciennes chansons sont normalisées par les crêtes pour atteindre le
0 dB numérique (c‘est ce qui est fait dans la recherche de Deruty), le niveau du bruit
augmente nécessairement, ce qui fait en sorte qu‘une comparaison entre des genres anciens
et des genres nouveaux ne nous renseignera jamais sur la différence entre leur pratique
sonique, mais uniquement sur la différence entre la particularité sonique des différents
genres en fonction de leur époque. Cela signifie que la recherche publiée dans la revue
Sound on Sound, ne peut avoir une portée universelle en matière de gamme sonique (et non
de gamme dynamique), car elle porte sur des différences de genres particuliers qui sont
eux-mêmes différents et indépendants de la pratique sonique.
Pourquoi utiliser des fenêtres de temps inférieures à 0,18 s dans la détermination de
la gamme sonique (alors que le BS 1770 suggère des fenêtres de temps de 400 ms), si la
gamme sonique est une différence entre des moyennes (niveaux RMS élevés VS niveaux
RMS faibles) de moyennes (moyenne des RMS élevés VS moyenne des RMS faibles)? À
0,18 s, nos moyennes de moyennes seront constituées par une poignée d‘échantillons. Nous
ne pensons pas que cela corresponde à la pensée « populaire » : lorsque les gens affirment
« fallacieusement » que les chansons d‘aujourd‘hui sont moins dynamiques qu‘avant, ils ne
se réfèrent sûrement pas à des échelles de temps qui dépassent leur capacité à percevoir des
subtiles nuances dynamiques; ils ne se réfèrent pas à un fantôme imperceptible à l‘échelle
humaine. Aussi, le calcul de Deruty, avec de telles fenêtres de temps, aboutit à un constat
sur la répartition des moyennes des valeurs RMS : bien sûr, les nouvelles chansons ont
126
peut-être une plus grande répartition de ces valeurs (le bruit de fond a fait diminuer le
plancher des dB et l‘augmentation des BIT a augmenté le plafond FS), mais cela
n‘empêche pas que les moyennes des valeurs RMS obtenues sont toutes concentrées près
du « 0 » numérique. N‘est-ce pas une forme de réduction de la gamme dynamique? Ce fait,
Deruty le sait et il l‘affirme dans son article, ce qui augmente encore plus notre
incompréhension face sa forte conclusion, qui nous parait hâtive. Aussi, ne parvient-il pas à
la même conclusion dans les suites de sa recherche parue trois mois plus tard, en janvier
201299
. De plus, le chercheur mentionne qu‘un de ses collègues, Damien Tardieu, a procédé
à une analyse de la gamme sonique sur un corpus de plus de 20 000 chansons. Celui-ci est
parvenu à la conclusion que la gamme sonique n‘a pas diminué au cours des années, et non
qu‘elle a augmenté (ce n‘est pas la même conclusion!), sans compter que nous parlons
encore de gamme sonique et non de gamme dynamique. Il y a encore ici de la confusion.
Que la gamme sonique soit élevée pour les chansons récentes lorsqu‘on les observe
à des échelles de temps insignifiantes du point de vue de la perception humaine des nuances
soniques (on ne parle même pas des nuances dynamiques), cela est bien, ou la conclusion
semble valide. Bien que la variation de la gamme sonique ait une corrélation avec la
variation de la gamme dynamique, il nous est cependant strictement interdit d‘en tirer un
lien de cause à effet.
99
Emmanuel Deruty, Elements of Popular Music Analysis, Dynamics, web.
127
Annexe 2 : Notre expérience en matriçage avec Serges Samson
Au début du mois d‘octobre 2012, nous avons eu la chance de travailler avec Serges
Samson, technicien en travaux d'enseignement et de recherche à l‘Université Laval qui a
plusieurs centaines de productions à son nom, sur notre premier album de musique
électronique Peace and Knowledge paru le 9 du même mois et de la même année. Nous
jugeons pertinent de partager ici notre expérience de travail, parce qu‘elle a été structurante
pour notre technique de travail et qu‘elle transparait en partie à l‘étape du « prototype » de
matriçage lors de nos tests au limiteur et à l‘égaliseur. La présence de Serges Samson s‘est
faite donc sentir tout au long de cette recherche.
Lorsque nous avons travaillé sur Peace and Knwoledge, M. Samson employait une
méthode de travail par strates, soit une succession répétée de certains modules, afin de faire
ressortir les éléments harmoniques à problèmes pour les corriger doucement, et ce, toujours
en respectant la nature du mix qui lui était remis. Dans le cas de notre album et de notre
style de musique particuliers, nous avions premièrement donné du caractère et de la
cohérence aux mix en faisant passer le signal audio du convertisseur N/A vers un
compresseur subtil au ratio avoisinant les 1 : 1,2 et un préamplificateur de lecteur à ruban.
Par la suite, et c‘est ici que le travail par strates a été appliqué, nous avons successivement
fait passer le signal par des combinaisons de limiteurs et d‘égaliseurs (deux la plupart du
temps, et trois lorsque nécessaire). La logique de ce procédé était la suivante : dans
l‘optique d‘obtenir un niveau sonique intéressant, nous avons augmenté le niveau du gain
d‘entrée du limiteur jusqu‘au seuil où nous avons pu commencer à entendre des distorsions.
Ces distorsions ont été, par la suite, légèrement corrigées à l‘aide de l‘égaliseur à larges
bandes suivant le limiteur, après quoi nous avons redescendu le niveau du gain d‘entrée du
limiteur à un niveau qui n‘altérait pas la qualité du son. Nous avons ensuite répété cette
étape au besoin, le but étant de faire ressortir les hernies sonores des mix afin de les
corriger.
En ce qui concerne le cas particulier de notre style musical, de la combinaison des
jeux de timbres et des sons harmoniques complexes, les nœuds de nos mix se situaient
généralement aux mêmes endroits du champ spectral : lors de la première strate des
limiteurs et égaliseurs, ce sont les 70 Hz, 150 Hz, 250-350 Hz, les 500-600 Hz, 1 kHz et
128
autres harmoniques qui causaient les distorsions. Lorsque nous creusions une de ces
hernies, automatiquement ses harmoniques supérieures et inférieures ressortaient; c‘est ce
principe harmonique que M. Samson appelait pédagogiquement le principe du « ballon
d‘eau ». Lors de l‘application des deuxièmes et troisièmes strates, des hernies moindres
ressortaient là où nous n‘avions pas travaillé les harmoniques à la première étape. Nous
recommencions alors le même procédé. De manière globale, nous avons pu, en conclusion,
expérimenter les choix déchirants entre les basses fréquences et le corps, versus les fortes
sonies qui pouvaient paraitre « fades » ou « minces ».