Mémoire : Le contrôle de la compression, de la prise de son au matriçage

148
Le contrôle de la compression, de la prise de son au matriçage Une approche intégrée pour l’examen de problèmes relatifs à la perte de la gamme dynamique causée par la compression lors du matriçage Mémoire Dragos Chiriac Maîtrise sur mesure en réalisation audionumérique Maître en musique (M.Mus.) Québec, Canada © Dragos Chiriac, 2014

Transcript of Mémoire : Le contrôle de la compression, de la prise de son au matriçage

Le contrôle de la compression, de la prise de son au matriçage

Une approche intégrée pour l’examen de problèmes relatifs à la perte de la gamme

dynamique causée par la compression lors du matriçage

Mémoire

Dragos Chiriac

Maîtrise sur mesure en réalisation audionumérique

Maître en musique (M.Mus.)

Québec, Canada

© Dragos Chiriac, 2014

ii

iii

Résumé du mémoire

Dans le cadre de notre mémoire, nous nous intéressons aux moyens d‘obtenir des

niveaux de sonie élevés, particulièrement lorsqu‘une telle pratique est pertinente (dans

notre cas, pour la musique électronique et pour le hip-hop), soit des sons qui sont forts du le

point de vue de la perception (loudness), et ce, sans obtenir des distorsions relatives à

l‘écrêtage, soit la coupure horizontale d‘une amplitude, et sans perdre trop de gamme

dynamique, soit la diminution de l‘écart entre la valeur en dB la plus faible et la plus élevée

d‘une pièce (par l‘utilisation agressive de limiteurs/compresseurs).

Concrètement, nous tentons trois approches autonomes parallèles qui s‘inscrivent

dans cette méthode organique :

1) Concevoir la conception sonore en fonction de la perception du niveau de sonie ;

2) Contrôler dynamique des percussions en prévision de la compression ;

3) Mixer et matricer en même temps.

iv

v

Abstract

This study is interested in the means of obtaining loud mixes, particularly in

musical genres where such practices are pertinent (electronic music and hip-hop, in our

case), while avoiding the usual disadvantages and defects of loud mixes. In other words, we

are seeking for ways to achieve loud tunes from the listener‘s subjective perception,

without encountering distortions caused by the squaring of the waves‘ amplitudes, usually

associated with the heavy usage of compressors and limiters, and without loosing to much

dynamic variety and/or dynamic range (the range between the lowest and the highest value

[dB] in a mix).

For these endeavours we have tried three different—yet parallel—autonomous

methods. These are:

1) Sound design in function of our subjective perception of loudness

(psychoacoustics);

2) Dynamic control of percussions for an efficient compression at the mastering stage;

3) Mixing and mastering at the same time.

vi

vii

Table des matières

Résumé du mémoire .................................................................................................................................... iii

Abstract ......................................................................................................................................................... v

Table des matières ...................................................................................................................................... vii

Liste des Figures .......................................................................................................................................... xi

Liste des Tableaux ...................................................................................................................................... xv

Notes sur l’utilisation des fichiers fournis avec le mémoire .................................................................. xvii

Avant-propos ............................................................................................................................................. xix

Introduction .................................................................................................................................................. 1 Mise en contexte .............................................................................................................. 1

État de la recherche ......................................................................................................... 4

Problématique .................................................................................................................. 7

Méthodologie ................................................................................................................... 8

Chapitre 1 : Sur l’application de théories de la sonie lors de la conception sonore .............................. 11

Introduction ................................................................................................................................................ 11 Notre perception de la sonie .......................................................................................... 11

Méthode de recherche et hypothèses ............................................................................. 12

Tests, choix et justifications au stade de la conception sonore ..................................... 14

Test no1 (extrait de BWV 883) ...................................................................................... 17

Test no2 (Danse percussive 1) ....................................................................................... 19

Test no3 (Danse percussive 2) ....................................................................................... 20

Test no4 (Danse percussive 3) ....................................................................................... 21

Test no5 (House 90‘ #1) ................................................................................................. 22

Test no6 (Sax Trip-Hop 90‘) .......................................................................................... 23

Test no7 (House 90‘ # 2) ................................................................................................ 24

Test no8 (Filter French House 1) ................................................................................... 25

Test no9 (Filter French House 2) ................................................................................... 27

Test no10 (Filter French House 3) ................................................................................. 28

Test no11 (House percussif) ........................................................................................... 29

Test no12 (Dubstep) ....................................................................................................... 30

Test no13 (Danse Voix) ................................................................................................. 31

Test no14 (House 90‘ #3) ............................................................................................... 32

Test no15 (Filter French House #4) ............................................................................... 33

Informations préliminaires à l’analyse des données ................................................................................ 34 Constats ......................................................................................................................... 34

Quelles sont les données pertinentes à l‘analyse de nos tests? ...................................... 35

EBU R 128, ITU-R BS. 1770 (v. 1, 2 et 3) et EBU – Tech 3341-2 présentés en rafale 36

viii

La marge dynamique, une autre mesure avec ses propres standards pertinents pour

nous ............................................................................................................................... 40

Nos outils de travail ...................................................................................................... 41

Mesures ........................................................................................................................................................ 44 Mesures dynamiques des pistes au mix à l‘aide du TT-DR VST et du TT-DR Offline 44

Mesures soniques (Nugen LM) : Pistes Mix ................................................................. 45

Mesures soniques (Nugen LM) & dynamiques (TT DR) des pistes limitées ............... 46

Ajustements des fréquences après l‘augmentation de gain au limiteur ........................ 47

Tests de puissance acoustique au LANTISS (ULaval) ................................................. 51

Conclusion : analyse des résultats ............................................................................................................. 53 Versions A et B au mix ................................................................................................. 53

Versions A et B limitées ............................................................................................... 54

Sommaire ..................................................................................................................................................... 56

Chapitre 2 : Programmation des boucles et paramétrage du traitement de signal en vue du contrôle

de la dynamique des percussions ............................................................................................................... 57

Introduction ................................................................................................................................................ 57 Problématique ............................................................................................................... 57

Méthodologie ................................................................................................................ 59

La programmation de nos percussions en images ......................................................... 63

Le contrôle des crêtes .................................................................................................... 66

Collecte des données ................................................................................................................................... 68 Résultats avant compression : ....................................................................................... 68

Résultats après compression : ....................................................................................... 73

Interprétation des résultats : graphiques et commentaires ..................................................................... 80 Résultats primaires ........................................................................................................ 80

Les différentes variations : comparaison des versions à « groove » versus les versions

avec une programmation standard par la mesure de leur écart. .................................... 83

Écarts entre les Variations (« y » par rapport à « x ») : comparaison de la version

compressée latéralement par rapport à la version aux variations de vélocité ............... 86

Conclusion ................................................................................................................................................... 89 Portée des résultats ........................................................................................................ 89

La compatibilité initiale des échantillons ..................................................................... 89

Représentativité de notre échantillon statistique et efficacité des mesures .................. 89

Sommaire ..................................................................................................................................................... 92

Chapitre 3 : Mixage et matriçage simultanés ........................................................................................... 93

Mixer et matricer en même temps ............................................................................................................. 95

Analyse critique de cette méthode ............................................................................................................. 98

Écoute critique des pistes ayant été mixées/matricées ........................................................................... 100

ix

Dragos, Something about being a man ........................................................................ 102

Careful ....................................................................................................................................................... 106

Mesures comparatives des chansons mixées/matricées ......................................................................... 108

Sommaire .................................................................................................................................................. 110

Conclusion du mémoire ........................................................................................................................... 111

Bibliographie ............................................................................................................................................. 119

Annexes ..................................................................................................................................................... 123

Annexe 1 : le cas de l’article « ‘Dynamic Range’ & The Loudness War » .......................................... 123 Introduction ................................................................................................................. 123

Confusion des genres ................................................................................................... 124

Notre interprétation de la recherche ............................................................................ 125

Annexe 2 : Notre expérience en matriçage avec Serges Samson .......................................................... 127

x

xi

Liste des Figures

Figure 1 : Courbes isosoniques en fonction de la fréquence (Hz)..................................................................... 11 Figure 2 : Subtraktor, synthétiseur FM polyphonique additif (capture d‘écran) ............................................... 14 Figure 3 : Thor, synthétiseur polyphonique à trois oscillateurs (CÉ) ............................................................... 15 Figure 4 : Malström, synthétiseur granulaire à deux oscillateurs (CÉ) ............................................................. 15 Figure 5 : Big Meter de Reason en action, modes VU et Peak (CÉ) ................................................................ 16 Figure 6 : 1A WL (A = crêtes de la version originale) (CÉ) ............................................................................. 17 Figure 7 : 1B WL (B = crêtes de la version modifiée) (CÉ). ............................................................................ 17 Figure 8 : Changement d‘index (accentuant les harmoniques de l‘oscillateur en changeant le point de départ

de l‘échantillon du grain) (CÉ). ........................................................................................................................ 18 Figure 9 : Utilisation d‘une onde en dents de scie plutôt qu‘une onde de type sinusoïdale (moins riche en

harmoniques) (CÉ). ........................................................................................................................................... 18 Figure 10 : Allongement léger de la durée des notes MIDI, de manière à augmenter leur perception (CÉ). ... 18 Figure 11 : Ajustement du gain à la baisse via une programmation automatisant en même temps le volume de

tous les synthétiseurs de la piste (CÉ). .............................................................................................................. 18 Figure 12 : 2A WL. Amplitude des crêtes élevée, mais densité moindre que la version modifiée (CÉ). ......... 19 Figure 13 : 2B WL. Diminution de l‘amplitude des crêtes et augmentation de la densité (aire totale sous la

courbe) des amplitudes (CÉ). ............................................................................................................................ 19 Figure 14 : Augmentation du temps de déclin et légère compensation négative du gain (CÉ). ........................ 19 Figure 15 : 3A WL (CÉ) ................................................................................................................................... 20 Figure 16 : 3B WL. Maintien de l‘amplitude des crêtes, mais augmentation de leur densité (CÉ). ................. 20 Figure 17 : Léger ajustement du gain de sortie des modules à la baisse pour rester au même niveau RMS,

augmentation de la fréquence du filtre d‘enveloppe et augmentation du temps de relâchement (CÉ). ............ 20 Figure 18 : Rallongement des notes MIDI. ....................................................................................................... 20 Figure 19 : 4A WL (CÉ). .................................................................................................................................. 21 Figure 20 : 4B WL. La densité et l‘amplitude des nouvelles courbes similaires (CÉ). .................................... 21 Figure 21 : Compensation négative du gain et augmentation du temps de relâchement (CÉ). ......................... 21 Figure 22 : Changement de modulation pour plus d‘harmoniques (CÉ)........................................................... 21 Figure 23 : 5A WL (CÉ). .................................................................................................................................. 22 Figure 24 : 5B WL, la densité et les crêtes sont similaires (CÉ). ...................................................................... 22 Figure 25 : Augmentation du temps de déclin, de la fréquence du filtre d‘enveloppe, du nombre de cycles de

l‘onde modulée FM et compensation négative du gain (CÉ). ........................................................................... 23 Figure 26 : 6A WL (CÉ). .................................................................................................................................. 23 Figure 27 : 6B WL (CÉ). .................................................................................................................................. 23 Figure 28 : Changement d‘onde de l‘oscillateur et compensation négative du gain (CÉ). ............................... 24 Figure 29 : 7A WL (CÉ). .................................................................................................................................. 24 Figure 30 : 7B WL (CÉ). .................................................................................................................................. 24 Figure 31 : Changement de type d‘oscillateur (CÉ). ......................................................................................... 25 Figure 32 : 8A WL (CÉ). .................................................................................................................................. 25 Figure 33 : 8B WL. Les amplitudes sont similaires (CÉ). ................................................................................ 26 Figure 34 : Les oscillateurs sont automatisés pour plus d‘harmoniques (CÉ). ................................................. 26 Figure 35 : 9A WL (CÉ). .................................................................................................................................. 27 Figure 36 : 9B WL. Les amplitudes semblent légèrement moins denses (CÉ). ................................................ 27 Figure 37 : Augmentation des harmoniques (CÉ). ............................................................................................ 27 Figure 38 : 10A WL (CÉ). ................................................................................................................................ 28 Figure 39 : 10B WL. Les crêtes des amplitudes sont similaires (CÉ). .............................................................. 28 Figure 40 : Notes MIDI allongées (CÉ). ........................................................................................................... 28

xii

Figure 41 : augmentation des harmoniques (CÉ). ............................................................................................. 28 Figure 42 : 11A WL (CÉ). ................................................................................................................................ 29 Figure 43 : 11B WL. Légère augmentation de la densité des amplitudes (CÉ). ............................................... 29 Figure 44 : Compensation négative du gain, augmentation du temps de relâchement et augmentation des

harmoniques (CÉ). ............................................................................................................................................ 29 Figure 45: 12A WL (CÉ). ................................................................................................................................. 30 Figure 46: 12B WL. Les courbes demeurent stables alors que la sonie augmente (CÉ). .................................. 30 Figure 47 : Augmentation de la fréquence du filtre et changement d‘onde pour plus d‘harmoniques (CÉ). .... 30 Figure 48 : 13A WL (CÉ). ................................................................................................................................ 31 Figure 49 : 13B WL. Gain de sonie, conservation du niveau des amplitudes (CÉ). ......................................... 31 Figure 50 : Augmentation des harmoniques (CÉ). ............................................................................................ 31 Figure 51 : 14A WL (CÉ). ................................................................................................................................ 32 Figure 52 : 14B WL. Les amplitudes sont semblables et la sonie a augmenté (CÉ). ........................................ 32 Figure 53 : Allongement des notes MIDI et augmentation des harmoniques (CÉ). .......................................... 32 Figure 54 : 15A WL (CÉ). ................................................................................................................................ 33 Figure 55 : 15B WL. Les crêtes sont similaires et la sonie a augmenté (CÉ). .................................................. 33 Figure 56 : Compensation négative du gain, augmentation des harmoniques et allongement des notes MIDI. 33 Figure 57 : Oxford Limiter & Oxford EQ (CÉ). ............................................................................................... 42 Figure 58 : Exemples de courbes en affichage -6 dB à + 6dB (CÉ).................................................................. 42 Figure 59 : Nugen True Peak Meter & Nugen Loudness Meter (Mode EBU + 18FS) (CÉ). ........................... 42 Figure 60 : TT Dynamic Range Meter Offline et Online (CÉ). ........................................................................ 43 Figure 61 : Égaliseur 1A (CÉ). ......................................................................................................................... 47 Figure 62 : Égaliseur 1B (CÉ). .......................................................................................................................... 47 Figure 63 : Égaliseur 2A (CÉ). ......................................................................................................................... 47 Figure 64 : Égaliseur 2B (CÉ). .......................................................................................................................... 47 Figure 65 : Égaliseur 3A (CÉ). ......................................................................................................................... 47 Figure 66 : Égaliseur 3B (CÉ). .......................................................................................................................... 47 Figure 67 : Égaliseur 4A (CÉ). ......................................................................................................................... 47 Figure 68 : Égaliseur 4B (CÉ). .......................................................................................................................... 48 Figure 69 : Égaliseur 5A (CÉ). ......................................................................................................................... 48 Figure 70 : Égaliseur 5B (CÉ). .......................................................................................................................... 48 Figure 71 : Égaliseur 6A (CÉ). ......................................................................................................................... 48 Figure 72 : Égaliseur 6B (CÉ). .......................................................................................................................... 48 Figure 73 : Égaliseur 7A (CÉ). ......................................................................................................................... 48 Figure 74 : Égaliseur 7B (CÉ). .......................................................................................................................... 48 Figure 75 : Égaliseur 8A (CÉ). ......................................................................................................................... 48 Figure 76 : Égaliseur 8B (CÉ). .......................................................................................................................... 49 Figure 77 : Égaliseur 9A (CÉ). ......................................................................................................................... 49 Figure 78 : Égaliseur 9B (CÉ). .......................................................................................................................... 49 Figure 79 : Égaliseur 10A (CÉ). ....................................................................................................................... 49 Figure 80 : Égaliseur 10B (CÉ). ........................................................................................................................ 49 Figure 81 : Égaliseur 10A (CÉ). ....................................................................................................................... 49 Figure 82 : Égaliseur 11B (CÉ). ........................................................................................................................ 49 Figure 83 : Égaliseur 12A (CÉ). ....................................................................................................................... 49 Figure 84 : Égaliseur 12B (CÉ). ........................................................................................................................ 50 Figure 85 : Égaliseur 13A (CÉ). ....................................................................................................................... 50 Figure 86 : Égaliseur 13B (CÉ). ........................................................................................................................ 50 Figure 87 : Égaliseur 14A (CÉ). ....................................................................................................................... 50 Figure 88 : Égaliseur 14B (CÉ). ........................................................................................................................ 50

xiii

Figure 89 : Égaliseur 15A (CÉ). ....................................................................................................................... 50 Figure 90 : Égaliseur 15B (CÉ). ....................................................................................................................... 50 Figure 91 : Filtres communs dans la mesure des dB SPL ................................................................................. 51 Figure 92 : Programmation de boucles standard (CÉ). ..................................................................................... 63 Figure 93 : programmation de boucles aux vélocités variées (CÉ). .................................................................. 63 Figure 94 : Programmation de percussions avec compression latérale (CÉ). ................................................... 64 Figure 95 : Programmation du signal externe pour la compression latérale. .................................................... 64 Figure 96 : Synthétiseur générant le signal externe pour la compression latérale (CÉ). ................................... 65 Figure 97 : Compresseur pour le traitement latéral (CÉ). ................................................................................. 65 Figure 98 : Limiteur Oxford (CÉ). .................................................................................................................... 66 Figure 99 : Oxford EQ, Waves Trans X Wide & Oxford Limiter (CÉ). ........................................................... 67 Figure 100 : Pochette de Something about being a man ................................................................................. 102 Figure 101 : un logo de Careful ...................................................................................................................... 106

xiv

xv

Liste des Tableaux

Tableau 1 : Classification hiérarchique, par dossiers, des fichiers fournis avec le mémoire .......................... xvii Tableau 2 : Mesures dynamiques des pistes au mix à l‘aide du TT-DR VST et du TT-DR Offline ................. 44 Tableau 3 : Mesures soniques (Nugen LM) : Pistes Mix .................................................................................. 45 Tableau 4 : Mesures soniques (Nugen LM & dynamiques (TT-DR) des pistes limitées. ................................. 46 Tableau 5 : Ajustements des fréquences après l‘augmentation de gain du limiteur.......................................... 47 Tableau 6 : Tests de puissance acoustique au LANTISS (ULaval) .................................................................. 51 Tableau 7 : Résultats des tests de puissance acoustique au LANTISS ............................................................. 52 Tableau 8 : Boucles standard sans variation aux vélocités. .............................................................................. 68 Tableau 9 : Boucles avec variation de vélocités. .............................................................................................. 69 Tableau 10 : Boucles avec compression latérale externe (side-chain compression). ........................................ 70 Tableau 11 : [Avant compression] v. (variation) des versions à « groove dynamique » par rapport à la version

originale sans v. de vélocités, où « x » = à la v. de la version aux vélocités variées et « y » =à la v. de la

version latéralement compressée. Les « - » indiquent qu‘il y a eu un changement à la baisse quant à la gamme

dynamique et/ou une augmentation quant à la sonie dans le présent contexte. ................................................ 71 Tableau 12 : [Avant compression] V. (variation) des variations, « y » par rapport à « x ». Les « - » indiquent

qu‘il y a eu un changement à la baisse quant à la gamme dynamique et/ou une augmentation quant à la sonie

dans le présent contexte. ................................................................................................................................... 72 Tableau 13 : Boucles standard sans variations aux vélocités. ........................................................................... 73 Tableau 14 : Boucles avec variation de vélocités ............................................................................................. 75 Tableau 15 : Boucles avec copression latérale externe (side-chain compression) ............................................ 76 Tableau 16 : [Après compression] v. (variation) des versions à « groove dynamique » par rapport à la version

originale sans v. de vélocités, où « x » = à la v. de la version aux vélocités variées et « y » = à la v. de la

version compressée latéralement. Les « - » représentent qu‘il y a eu un changement à la baisse quant à la

gamme dynamique etùou une augmentation quant à la sonie dans le présent contexte. ................................... 77 Tableau 17 : (Après compression) V. (variation) des variations, « y » par rapport à « x ». Les « - » indiquent

qu‘il y a eu un changement à la baisse quant à la gamme dynamique et/ou une augmentation quant à la sonie

dans le présent contexte. ................................................................................................................................... 78 Tableau 18 : dB RMS intégrés selon la fréquence des résultats. ...................................................................... 80 Tableau 19 : dB RMS intégrés, fréquence des résultats (après compression). .................................................. 80 Tableau 20 : Gamme dynamique intégrée en dB FS selon la fréquence des résultats. ..................................... 81 Tableau 21 : Gamme dynamique intégrée en dB FS selon la fréquence des résultats (après compression) ..... 81 Tableau 22 : Sonie intégrée en LUFS (EBU + 18) selon la fréquence des résultats. ........................................ 82 Tableau 23 : Sonie intégrée en LUFS (EBU + 18) selon la fréquence des résultats (après compression) ........ 82 Tableau 24 : dB RMS intégrés selon la fréquence des résultats. ...................................................................... 83 Tableau 25 : dB RMS intégrés selon la fréquence des résultats (après compression) ...................................... 83 Tableau 26 : Gamme dynamique intégrée en dB FS selon la fréquence des résultats. ..................................... 84 Tableau 27 : Gamme dynamique intégrée en dBFS selon la fréquence des résultats (après compression). ..... 84 Tableau 28 : Sonie intégrée LUFS (EBU + 18) selon la fréquence des résultats. ............................................. 85 Tableau 29 : Sonie intégrée LUFS (EBU + 18) selon la fréquence des résultats (après compression) ............. 85 Tableau 30 : dB RMS intégrés selon la fréquence des résultats. ...................................................................... 86 Tableau 31 : dB RMS intégrés selon la fréquence des résultats (Après compression) ..................................... 86 Tableau 32 : Gamme dynamique intégrée en dB FS selon la fréquence des résultats. ..................................... 87 Tableau 33 : Gamme dynamique intégrée en dB FS selon la fréquence des résultats (après compression). .... 87 Tableau 34 : Sonie intégrée en LUFS (EBU + 18) selon la fréquence des résultats. ........................................ 88 Tableau 35 : Sonie intégrée en LUFS (EBU + 18) selon la fréquence des résultats (après compression). ...... 88 Tableau 36 : Comparaisons de gamme dynamique et niveau maximum ........................................................ 108

xvi

xvii

Notes sur l’utilisation des fichiers fournis avec le mémoire

En plus du présent document, le mémoire est accompagné de 311 fichiers audio et

de 3 feuilles de calculs Microsoft Excel réalisés par son auteur. Les fichiers audio fournis

(format wav 16 bits/44,1 kHz pour les chapitres 1 et 2, puis format mp3 320 kb/s pour le

chapitre 3) sont divisés par chapitres. Les dossiers fournis sont nommés sans accents pour

une meilleure compatibilité sur des systèmes de langues différentes. Visuellement, nous

obtenons une classification hiérarchique des dossiers, du plus général au plus spécifique :

Tableau 1 : Classification hiérarchique, par dossiers, des fichiers fournis avec le mémoire

Les noms propres de chaque fichier audio fourni correspondent exactement aux

mêmes noms auxquels nous nous référons tout au long de ce mémoire (figures, texte et

tableaux), afin d‘éviter toute forme d‘équivocité. Par exemple, si nous nous référons au test

audio sans variation de vélocités no 11, après compression, au chapitre 2, le chemin d‘accès

à ce dernier sera « ... Fichiers/Chapitre 2/Audio/Tests apres compression/Tests sans

variation de velocites/11.wav ». En ce qui concerne les trois fichiers Excel fournis dans le

dossier « Calculs Excel », ceux-ci sont tous identiques, mais de formats différents pour une

compatibilité avec divers systèmes (Mac en format csv, MS-DOS en format csv et Excel en

format Feuille de travail Microsoft Excel). Plusieurs tableaux du chapitre 2 de ce document

ont été extraits directement de ces feuilles de calcul. Ces tableaux conservent des titres

Fichiers

Chapitre 1

Tests avant compression

Tests apres compression

Chapitre 2

Calculs Excel Audio

Tests avant compression

Tests avec variation de

velocites

Tests compression

laterale

Tests sans variation de

velocites

Tests apres compression

Tests avec variation de

velocites

Tests compression

laterale

Tests sans variation de

velocites

Chapitre 3

Audio

xviii

identiques d‘un document à un autre, afin que le lecteur puisse consulter les données, ainsi

que les formules de calculs, qui ont permis l‘atteinte de nos résultats. Finalement, l‘écoute

des fichiers et la consultation des feuilles de calculs n‘est pas obligatoire ou nécessaire à la

compréhension des idées avancées dans ce mémoire : les fichiers sont un extra pour les

lecteurs qui souhaitent comparer de manière critique leur écoute à celle de l‘auteur.

xix

Avant-propos

Les groupes qui sont concernés par cette étude sont nombreux, car quiconque

travaille un peu dans le domaine de l‘audionumérique pourra y trouver quelque élément

pertinent; soit dans les étapes de la réalisation par la compréhension de principes soniques

divers ou soit dans le processus de création par l‘élaboration d‘une méthode de travail

harmonique avec, ou facilitant, les processus de réalisation et de postproduction pour de

meilleurs résultats finaux en terme de qualité sonore (en maintenant une sonie élevée tout

en diminuant l‘écrêtage et la perte de gamme dynamique). D‘une manière globale, nous

désirons que les techniques utilisées demeurent assez accessibles pour le compositeur,

souhaitant davantage aborder l‘aspect technique de la composition et non de faire d‘un

réalisateur compositeur un technicien.

1

Introduction

Mise en contexte

Notre première rencontre avec la sonie (loudness) a eu lieu lorsque, en tant que jeune

compositeur/réalisateur de musique électronique, nous avons comparé nos chansons aux

titres commerciaux que nous avions l‘habitude d‘écouter. Comme plusieurs néophytes

avant nous, nous nous sommes senti frustré de réaliser que nos propres créations musicales

n‘étaient pas aussi larges, aussi vivantes et puissantes que les titres commerciaux. Nous

avons compris, avec Rick Snoman, que si le niveau de sonie de nos pièces n‘était pas aussi

élevé que celui des autres enregistrements, nos pièces n‘allaient pas être aussi

impressionnantes1.

La sonie en soi n‘est pas pertinente, mais elle le devient lorsque nous comparons

plusieurs sonies; cela signifie que notre expérience d‘un son ayant une intensité de 60dB

SPL (Sound pressure level), par exemple, peut être influencée par une exposition préalable

à un son de 80dB SPL2. Lorsque nous comparons des albums ou des pièces de musique

d‘artistes différents, certains nous paraissent plus forts du point de vue du niveau sonore, et

ce, sans que nous ayons changé le niveau du « volume » de notre radio, de notre lecteur

DC, de notre lecteur mp3… Jim Johnston, un chercheur en psychoacoustique renommé, a

démontré que l‘effet d‘une augmentation de 3dB, comparativement à une diminution de

3dB (et ce, pour une même source), était perçu comme un plus grand changement

d‘intensité sonore, en comparant les temps d‘attaque et de relâchement des cellules ciliées

excitées (cellules de l‘oreille interne)3. Aussi, une telle comparaison a des conséquences sur

notre perception de certaines fréquences, notamment les très basses (< 100 Hz) et les très

hautes (>10 kHz). Globalement et sommairement, plus la sonie d‘une pièce est élevée, plus

notre perception de ces deux bandes extrêmes de fréquences sera accentuée. Autrement dit,

plus la sonie d‘une pièce est élevée par rapport à d‘autres, plus celle-ci nous paraitra

vivante. Pour des auteurs-compositeurs de musique dansante (comme l‘auteur de ce

mémoire), il est primordial de s‘intéresser à ce phénomène si nous voulons pouvoir fournir

aux auditeurs une musique à la hauteur de son office. Ainsi, ce travail se positionne

1 Rick Soman, The Dance Music Manual, 2

e édition (Oxford: Focal Press, 2009), 399.

2 Thomas D. Rossing, Springer Handbook of Acoustics, (Stanford: Springer, 2007), 468.

3 Bob Katz, « About the loudness war pt.1 », présentation savante AES 2009, 00:02:29, web.

2

parfaitement dans ce contexte très actuel, car la comparaison est omniprésente dans

l‘écoute des amateurs de musique d‘aujourd‘hui, lesquels consomment plus que jamais des

compilations, notamment en raison de la popularisation et de la facilité du partage du léger

format mp34.

Nous nous sommes mis alors à chercher des moyens pour atteindre des niveaux de

sonie plus efficaces pour les appliquer à nos propres pièces musicales avec la conviction

que les gains en sonie aideraient notre musique à se démarquer dans le contexte de

l‘émergence des studios maison et des nouveaux réseaux de distribution sur Internet. Nous

avons découvert qu‘il existait plusieurs moyens d‘atteindre ces niveaux, et que, depuis le

milieu des années 1980, et en particulier depuis 2000, on observe sur le plan dynamique

une recherche constante d‘une sonie de plus en plus élevée, notamment dans le but de se

démarquer de la concurrence5. Avec toute la compétition face à laquelle les musiciens

doivent faire face, il est compréhensible que ces derniers veuillent bénéficier de tous les

outils pouvant les faire ressortir du lot, surtout lorsqu‘il s‘agit de genres musicaux où une

forte sonie est pertinente, comme pour la musique « dance » par exemple.

Généralement parlant, ces outils (compresseurs, limiteurs, exciteurs harmoniques,

modulateurs de transitoires, etc.) fonctionnaient d‘une manière très similaire lorsqu‘ils

étaient employés pour augmenter la sonie d‘une pièce musicale : ils augmentaient les

niveaux moyens des crêtes en dB RMS. En fait, cette description correspond parfaitement à

la définition de la sonie dans le domaine de la psychoacoustique, qui est associée avec la

présence d‘une moyenne élevée des niveaux des crêtes, ou, autrement dit, d‘une densité

importante de l‘aire sous la courbe des crêtes6. Il y a, toutefois, d‘autres facteurs, comme la

durée/maintien d‘un son et son timbre/fréquence qui influencent notre perception de sa

sonie (voir chapitre 1).

4 Il est à noter que nous souhaitons simplement explorer les possibilités et les limites dans les pratiques

audionumériques visant des sonies élevées. Nous prendrons position sur la pertinence de celles-ci, comme l‘a

déjà fait une pléthore d‘auteurs... lors de la conclusion du mémoire. 5 Pour une description de l‘escalade des dernières décennies dans les pratiques réduisant la gamme dynamique

pour obtenir une sonie plus forte, voir Bob Katz, Mastering Audio : The Art and the Science, (New York,

Focal Press, 2002), 271-278. 6 David Howard M. et Jamie Angus, Acoustics and psychoacoustics, 3

e édition (Elsevier, Focal Press, 2006),

15.

3

Une fois que nous avions trouvé les outils qui allaient nous procurer la sonie élevée

désirable pour la musique « dance », nous les avons tous utilisés en même temps, d‘une

manière déraisonnable bien entendu, sur nos mix stéréo. Disons simplement, afin d‘être

poli envers nous-même, que le résultat était affreux. Nous avons alors mis un frein à nos

ardeurs en réduisant la compression globale du bus maitre, mais le résultat ne fut pas

encore tout à fait satisfaisant. En rehaussant les niveaux moyens, l‘harmonie entre les

niveaux des éléments avait été significativement déséquilibrée en envoyant des éléments de

l'arrière-plan vers l'avant plan de la scène virtuelle. Les compresseurs eurent l‘effet fâcheux

d‘augmenter le niveau des sections calmes, diminuant ainsi le contraste normalement

attendu entre ces sections et les plus fortes (comme les refrains par exemple). Nous

souhaitions que nos basses soient plus claires et intenses, mais elles étaient brouillées. Nous

voulions que les éléments harmoniques et les éléments percussifs soient plus percutants,

mais nous avions perdu toutes nos dynamiques; tout semblait agressif et monotone. Nous

voulions que nos voix soient cristallines et mises à l‘avant, mais il n‘y avait que des

distorsions. Afin de corriger ces problèmes, nous avions utilisé des égaliseurs dans le but de

rectifier les hernies sonores rebelles, causées par la compression agressive (régulièrement

autour des graves à < 80 Hz et ses harmoniques, des moyennes-basses fréquences boueuses

à 120 - 150 Hz et leurs harmoniques et des hautes fréquences agressives à 1.2 – 5 kHz)7. Ici

encore nous n‘étions pas satisfait. En corrigeant l‘agressivité des voix, nous avions

également diminué le niveau de nos cymbales-à-pied (hi-hats en anglais) et de nos autres

instruments aigus. En supprimant le surplus de graves de nos basses, nous avions également

atténué l‘aspect percussif de nos grosses caisses. En diminuant les moyennes-basses

boueuses, nous avions perdu la chaleur et le corps de nos chansons. Nous étions alors

directement, quoique maladroitement, en contact avec le travail de l‘ingénieur en pleine

activité de matriçage.

Traditionnellement, le rôle de l‘ingénieur de matriçage est de donner une cohérence à

un ensemble d‘enregistrements (le plus souvent constituant un album), cohérence qui se

manifeste principalement sur les plans spectral (équilibre des fréquences d‘une pièce à

7 Mike Senior, Mixing secrets for the small studio, (Elsevier, Focal Press, 2011), 240.

4

l‘autre)8 et dynamique (uniformité du niveau sonore de l‘ensemble des pièces)

9. Or, pour

obtenir l‘effet désiré, l‘ingénieur doit augmenter le niveau moyen des enregistrements en

utilisant des compresseurs et des limiteurs, lesquels, paradoxalement, génèrent des artéfacts

indésirables comme des distorsions et la perte de nuances dynamiques10

. En rehaussant les

niveaux moyens, l‘équilibre des éléments des mix peuvent aussi être significativement

déséquilibrés : il est fréquent que des éléments destinés à être situés à l‘arrière-plan soient

augmentés de manière disproportionnelle, ce qui les ramène à l‘avant de la scène sonore

virtuelle11

. Comme nous l‘avons déjà évoqué, les compresseurs auront aussi l‘effet fâcheux

d‘augmenter le niveau des sections calmes, diminuant d‘autant le contraste normalement

attendu entre ces sections et les plus fortes (comme les refrains par exemple). L‘ingénieur

de matriçage doit alors travailler en tenant compte des effets pervers de ses outils afin de

minimiser certains artéfacts indésirables. Résultat? Pour que le matriçage génère les

niveaux de sonie souhaités, on accepte de plus en plus de distorsions, une perte croissante

des nuances dynamiques et une altération de l‘équilibre par rapport aux mix d‘origine.

L‘ingénieur tente alors de minimiser ces problèmes par d‘autres effets globaux, qui,

lorsqu‘ils aident, contribuent tout de même à altérer l‘équilibre original des mix. Pour Bob

Katz, la plus célèbre autorité sur le sujet, plusieurs enregistrements qui nous sont

contemporains sonnent moins bien que les enregistrements des années 197012

.

État de la recherche

Au début de l‘année 2013, nous avons adressé une question aux techniciens animateurs

du HomeRecordingShow, une très populaire émission audio spécialisée sur la réalisation

audionumérique dans les studios maison : « would you be willing to have a show on

loudness and the problems related to dynamic reduction… and how it is possible to avoid

them and still obtaining a loud mix ? ». À notre avis, la réponse reçue reflète bien

l‘approche habituelle des ingénieurs envers la résolution des problèmes causés par la

réduction de la marge dynamique au matriçage : « Is that a recording riddle ?... We

definitely talked about the negative aspects of loudness, but not how to overcome it, other

8 David Moulton, Total recording : The complete guide to audio production and engineering, (Etats-Unis,

Kendall Printing, 2000), 402. 9 Katz, Mastering Audio, 11-12 et 87-88.

10 Thomas Lund, « Loudness Wars pt. 1 », présentation savante à Rome Calling, 2011, web.

11 Roey Izhaki, Mixing audio, Concepts, Practices and Tools, (Burlington, Focal Press, 2008), 327.

12 Katz, Mastering Audio, 271-278

5

than ‗don‘t make it loud‘, ‗make it dynamic‘ ». Cet avis de type « condamnant » envers la

compression est également partagé par les autorités les plus réputées actuellement sur la

question de la sonie, de la réduction de la marge dynamique et de leurs inconvénients

(Katz, Lund, Tischmeyer). « The problem is that dynamic range in pop music has become

an increasingly rare phenomenon, due to the fruitless volume wars and pressure from A&R

to make a record that can get through the noise », déplore Katz13

. Tischmeyer, lui, suggère

de préserver des niveaux de gamme dynamique qui nous semblent assez atteignables et

réalisables. Toutefois, ses suggestions de dynamique en fonction des styles musicaux

consistent à tenter d‘éviter la compression, sans proposer de solutions pour minimiser les

effets de la compression14

. Lund, l‘autorité la plus importante en matière de mesure de la

sonie et de la gamme dynamique (il a notamment collaboré avec TC Electronics à

l‘élaboration des documents techniques EBU R 128 dont nous expliquons au premier

chapitre), quant à lui, propose de préserver la dynamique d‘une pièce musicale à un niveau

encore plus élevé que Tischmeyer, soit à un niveau de -23 LUKFS de gamme de sonie.

Bien qu‘il apporte des points extrêmement pertinents sur la compression des formats audio

(mp3 par exemple) et sur la préservation d‘un seuil entre le signal sonore et la limite de

0 dB FS (headroom) plus grand que la moyenne, son approche consiste essentiellement à

ne pas diminuer la gamme dynamique (autant que possible), pour se rapprocher d‘un

niveau semblable à celui du milieu des années 198015

. Sans une législation pénalisante pour

les pièces musicales ayant une sonie élevée, une solution populaire que nous ne jugeons pas

idéale (voir la conclusion), il nous semble qu‘une gamme de sonie de -23 LUKFS n‘est ni

réalisable (compte tenu du contexte compétitif actuel), ni idéale à l‘application musicale (le

public visé par les normes du EBU R 128 est surtout celui de la télévision), ni souhaitable,

car un niveau élevé de sonie nous apparait pertinent dans des genres comme la musique

dansante. Ainsi, et malgré l‘expérience et le grand esprit de synthèse des autorités que nous

venons de nommer, ces derniers n‘explorent pas les possibilités de réaliser des pièces

musicales compressées ayant une sonie élevée, tout en évitant le plus possible les

problèmes reliés à l‘utilisation « agressive » de compresseurs et de limiteurs. Bref, plutôt

13

Katz, Mastering Audio, 265. 14

Pleasurize Music Foundation, web. 15

Thomas Lund, « Loudness : The Quest for the Holy Grail », présentation savante, Audio Engineering

Society, 121e convention, 5 oct. 2006, 7, web.

6

que de tenter de contrôler la compression et ses effets pervers, les autorités dans le domaine

de la réalisation audionumérique et du matriçage préfèrent l‘éviter, lorsque leurs clients

sont enclins à écouter leurs bons conseils.

Un autre aspect essentiel de l‘état de la recherche sur la compression à l‘étape du

matriçage est que les standards et les outils (décrits en détail au premier chapitre) pour

mesurer d‘une manière quantitative les mesures de psychoacoustique que sont la gamme

sonique et la sonie sont très récents et pas tout à fait destinés à être appliqués à la mesure de

pièces musicales. Nous utilisons plusieurs de ces outils et standards au long des trois

chapitres du mémoire et nous arrivons à la conclusion qu‘ils ne sont pas assez précis et que,

dans bien des cas, l‘observation subjective semble plus appropriée pour décrire la sonie

d‘une pièce. Lors de notre conclusion, nous avançons l‘hypothèse selon laquelle il existe un

problème structurel dans le fait de chercher à exprimer des expériences subjectives comme

la sonie en termes quantitatifs. Cela peut expliquer l‘état embryonnaire des standards et des

outils de mesure actuels (formulés à partir de 2006 avec le document technique ITU BS

1770-1, que nous expliquons au premier chapitre). D‘ailleurs, l‘auteur de Acoustics and

hearing, Peter Damaske, nous semble très pertinent à ce propos :

The history of science shows that the investigation of an acoustical phenomenon usually

begins with purely physical methods. Later on, when sufficient amounts of knowledge

have been acquired, properties of the auditory system may be more and more taken into

account. The slow scientific acquisition of the term loudness is a good example of this

process. Its present precision could be achieved only over a period of more than 100

years.16

Ainsi, lorsque nous nous intéressons à la recherche sur la compression au matriçage dans le

but d‘obtenir des mix aux niveaux de sonie élevés, en plus de n‘avoir de solutions pratiques

pour limiter les effets indésirables de la réduction de la marge dynamique, il faut garder à

l‘esprit que la recherche pour la mesure de la sonie demeure très nouvelle, assez mal

comprise et, la plupart du temps, non destinée à mesurer la sonie des pièces musicales (on

vise davantage la télévision). Il est sans doute essentiel de garder un esprit critique et de

faire confiance à sa propre écoute subjective, tout en cherchant à confirmer nos propres

observations à l‘aide de données empiriques, puisque la recherche sur la mesure de la sonie

16

Peter Damaske, Acoustics and Hearing, (Berlin, Springer, 2008), 70.

7

et des moyens à prendre pour éviter ses effets désavantageux dans des pièces musicales

n‘est pas encore mature.

À propos des problèmes relatifs à la mesure de la sonie et de la gamme de sonie,

nous consacrons également quelques pages à la critique de plusieurs conclusions de

monsieur Emmanuel Deruty, auteur de l‘article « Dynamic Range » & The Loudness War

paru en 2011 dans la revue SoundOnSound, dans lequel, à l‘aide d‘une application douteuse

des nouveaux standards de mesure de la sonie des documents EBU et ITU, il parvient à la

conclusion (peu partagée) selon laquelle les pistes de musique qui nous sont

contemporaines ont une marge dynamique supérieure à celle des pistes des années 1960-

199017

. Deruty condamne également les pratiques de compression en vue d‘un niveau de

sonie élevé pour les distorsions engendrées (il donne Metallica en exemple), mais, à la

lumière de sa recherche en laquelle nous n‘avons pas confiance, il ne les condamne pas

pour leur réduction de la gamme dynamique, mais pour les distorsions qu‘elle peut

engendrer. En somme, il n‘y a actuellement pas de recherches, dans le « jeune » domaine

de la mesure de la sonie des pièces musicales audionumérique, visant à éviter les effets

pervers de la compression tout en tentant d‘obtenir des mix ayant une sonie élevée. La

littérature sur le sujet associe plutôt la réduction de la marge dynamique et une sonie élevée

à la perte de qualité d‘un signal audio.

Problématique

Comme le suggère l‘état général de la recherche qui précède, lorsqu‘on aborde les

problèmes reliés à la compression, les auteurs se contentent presque toujours de déplorer la

situation actuelle en condamnant, à des degrés différents, les pratiques de réduction de la

gamme dynamique. En fait, plutôt que d‘envisager ce phénomène comme une lacune ou un

problème, nous souhaitons apporter un savoir positif en proposant une approche

intégrée/organique des processus de réalisation audionumérique de la conception sonore, du

mixage et du matriçage : à la lumière d‘expériences décrites aux chapitres 1 à 3 et de la

littérature scientifique qui traite séparément de chaque étape du processus de création d‘une

œuvre musicale (la maison d‘édition Focal propose de nombreux ouvrages auxquels nous

nous rapportons tout au long de notre mémoire), nous croyons qu‘il est possible de

17

Emmanuel Deruty, « ‗Dynamic Range‘ & The Loudness War », SoundOnSpund, septembre 2011, web.

8

remédier de manière significative à plusieurs des désavantages de la compression audio lors

du matriçage, et ce, sans devoir se soustraire au contexte des attentes actuelles de la

réception plus haut. Nous abordons ainsi toutes nos expériences de la conception sonore

(chapitre 1), de programmation de percussions (chapitre 2) et du mixage/matriçage

(chapitre 3) avec la question suivante en esprit : Dans quelle mesure est-il possible de

minimiser significativement les désavantages liés à la compression du matriçage? Plus

précisément, il s‘agira de voir comment un travail de sculpture du son dès les étapes

préliminaires de réalisation peut contribuer à obtenir une sonie élevée sans avoir à passer

par une compression élevée au moment du matriçage et il s‘agira de voir, lorsqu‘il y aura

compression au matriçage, de voir de quelle manière on peut réduire les effets indésirables

de la réduction de la gamme dynamique tout en maintenant une sonie élevée.

Méthodologie

De manière générale, nous utilisons des outils assez accessibles et génériques, afin

que les résultats de l‘étude puisse, autant que possible, être indépendants des outils dont

nous nous sommes servis : il s‘agit de plug-ins numériques classiques (compresseurs,

limiteurs, égaliseurs...) et non d‘effets ésotériques rares limités à une seule compagnie

d‘outils audionumériques. Le même principe est appliqué lorsqu‘il s‘agit des synthétiseurs

et des autres instruments virtuels programmés en MIDI dans les logiciels que nous utilisons

(Ableton Live 8 et Propellerhead Reason 5). La nature exacte des effets et des instruments

est expliquée au cours des chapitres qui suivent.

Le corpus de la recherche est composé de nos propres pièces, ce qui nous permet de

distribuer la recherche pour une sonie élevée sur l‘ensemble des grandes étapes de la

production phonographique. Au premier chapitre, nous tentons d‘augmenter la sonie de 15

extraits de musique dansante réalisés à l‘aide du logiciel Propellerheads Reason 5 en

altérant un à la fois les paramètres d‘un synthétiseur. La nature de ces altérations est

expliquée en détail pour chacun des exemples. Nous comparons alors la sonie de ces 15

extraits de musique électronique réalisés dans notre studio maison à leurs doubles originaux

non altérés pour terminer avec un corpus de 30 extraits au premier chapitre. Au deuxième

chapitre, nous comparons un corpus de 240 extraits audio de percussions de musique

dansante, programmées par nous-mêmes et réalisées dans notre studio maison avec le

9

logiciel Ableton Live 8, avant et après la compression. Nous comparons particulièrement

40 programmations standard sans variations de vélocité18

avec 40 programmations avec

variations de vélocité pour générer un effet de « groove dynamique » et 40 programmations

avec une variation dynamique fabriquée à l‘aide d‘une compression latérale externe (side-

chain compression en anglais) pour accentuer les contretemps, le tout, avant et après

l‘application d‘une réduction de la marge dynamique sur chaque type de programmation

pour une augmentation de la sonie. La nature exacte de chaque programmation et de chaque

compression est expliquée en détail au cours de ce chapitre. Au troisième et dernier

chapitre, nous travaillons avec un corpus de 11 chansons réalisées par nous-mêmes dans

une régie du LARC (Laboratoire audionumérique de recherche et de création, Université

Laval) en les mixant et matriçant en même temps, dont 8 sont des chansons complètes de

musique dansante (parues sur l‘album Sometthing about being a man en 2013) et dont 3

sont des chansons de musque hip-hop (chansons seules pour notre projet hip-hop nommé

Careful). Ces chansons sont toutes réalisées, mixées et matricées avec le logiciel Ableton

Live 8. Au total, on compte 281 échantillons audio décrits en détail au fur et à mesure du

mémoire. Tous nos exercices sont abordés avec une approche psychoacoustique. La sonie,

la perception subjective du niveau de puissance sonore d‘une chanson, d‘un film, d‘une

publicité, etc., est notamment un concept fondamental de notre recherche. L‘aspect spectral

de la sonie est abordé selon l‘héritage des premières recherches psychoacoustiques de

Fletcher-Munson alors que les aspects de dynamique et de mesure de la sonie sont abordés

selon les récents documents techniques ITU 1770, EBU Tech 3341 et EBU R 128 : il d‘agit

présentement des autorités les plus sérieuses dont nous disposons. Nous entamons

d‘ailleurs le premier chapitre en abordant la littérature psychoacoustique, puis nous

expliquons en détail le contenu des théories sur la mesure quantitative de la sonie au fur et à

mesure du mémoire, lorsque l‘utilisation de ces dernières est utile ou nécessaire.

En somme, nous distribuons le travail lié au matriçage sur l‘ensemble de quelques

grandes étapes de production phonographique pour minimiser les inconvénients reliés à une

pratique visant une forte sonie. Le format qui en résulte a les allures d‘un rapport de

laboratoire commenté axé sur une méthodologie permettant de trouver des moyens de 18

La plupart du temps, pour les stations de travail numériques, le contrôle de vélocité est divisée en 127

incréments.

10

mesurer et de confirmer nos observations. Nous fournissons, en plus de ce texte, autour de

281 extraits audio en format. wav et mp3, puis deux feuilles de calculs Excel pour

permettre au lecteur, s‘il le désire, de vérifier nos calculs.

11

Chapitre 1 : Sur l’application de théories de la sonie lors de la conception sonore

Introduction

Notre perception de la sonie

La sonie est perçue d‘une manière très particulière qui consiste à faire un mélange

subjectifs de plusieurs facteurs audibles : la pression sonore (dB SPL), la fréquence des

éléments (Hz) et la durée des éléments19

. On le constate que notre perception de la sonie est

non linéaire lorsqu‘on examine une illustration des courbes Fletcher-Munson corrigées (ou

courbes isosoniques), lesquelles expriment de manière approximative des relations entre la

pression sonore (dB SPL au point de référence de 20 µPa) et notre perception du niveau

sonore, la sonie (exprimée en Phon – unité de mesure de la sonie pour les tons purs/ondes

sinusoïdales en cycles par secondes [c/s ou Hz]) selon les fréquences des stimulus sonores

(Hz) 20

Figure 1 : Courbes isosoniques en fonction de la fréquence (Hz)21

Il s‘agit simplement d‘exprimer la compensation nécessaire en dB à une fréquence

pour une pression donnée par rapport à une autre fréquence pour que les deux soient

perçues au même niveau ou, si nous le reformulons à l‘envers, il s‘agit d‘exprimer la

différence en dB pour deux fréquences différentes perçues au même niveau sonore (ou

ayant la même sonie). Par exemple, 1 kHz à 80 dB aura la même sonie que 50 Hz à 92 dB,

19

Thomas Lund, Loudness : The Quest for the Holy Grail, 8, web. 20

Bogh Brixen, Eddy, Audio Metering, Measurements, standards and practice, 2e édition, (Oxford, Focal

Press, 2011), 51. 21

Lindosland, Equal loudness contours, Wikimedia Commons.

12

et le rapport entre les deux puissances est de type logarithmique, ce qui signifie que l‘écart

entre les deux valeurs est très élevé selon le point de vue des instruments de mesure. Il est

possible de démontrer la même relation, entre la perception de la puissance sonore d‘une

source en fonction de la fréquence de celle-ci, en procédant par la méthode de Zwicker.

Toutefois, ce dernier prend en compte des facteurs plus pointus en précision : le son frontal

direct par rapport au son dans un champ diffus et sa fréquence (1/3 d‘octave par Phon

lorsque le rapport entre deux fréquences est de X<Y, sinon les valeurs sont reliées par des

traits parallèles aux courbes logarithmiques inverses lorsque le rapport entre deux

fréquences est de X>Y22

). Par exemple, et pour comprendre facilement cette méthode, si

nous traçons une ligne à 60 Phon pour toutes les fréquences, nous obtenons une courbe

presque identique à celle du tableau corrigé de Fletcher-Munson. Bref, notre audition est

non linéaire. Nous est-il alors possible de bénéficier des particularités de notre système

auditif pour favoriser notre capacité à percevoir nos propres pièces musicales? Est-ce que

de telles considérations pourraient nous permettre d‘éviter ou de diminuer notre recours à

l‘augmentation du niveau moyen des crêtes?

Méthode de recherche et hypothèses

Notre méthode de recherche consiste à transposer certains principes théoriques tirés

d‘ouvrages sur l‘acoustique et de la psychoacoustique pour les appliquer dans un contexte

pratique de composition audionumérique, afin de voir quelles sont les limites et les

possibilités de leurs applications pour éviter le recours à la compression pour augmenter le

niveau de sonie d‘une pièce. Concrètement, nous voulons exploiter le fonctionnement de

notre système d‘audition, qui est, pour des raisons physiques et psychologiques,

discriminatoire envers certains types de sons (notamment les sons d‘une durée de moins de

200 ms, qui sont perçus plus faiblement que les sons soutenus)23

et envers certaines

fréquences (notre sensibilité est particulièrement efficace entre 1 kHz et 3 kHz alors qu‘elle

l‘est moins dans les extrêmes du spectre sonore). Pour cela, nous réaliserons plusieurs petits

extraits avec différentes combinaisons instrumentales afin de les soumettre à une analyse.

22

Bogh Brixen, Eddy, Audio Metering, Measurements, standards and practice, 2e édition, (Oxford, Focal

Press, 2011), 51. 23

Orban Loudness Meter for Windows v. 2.0.8, 2012, 15, web.

13

Nous savons que notre canal d‘audition agit en guise de résonateur et qu‘en raison

de sa forme, notre sensibilité est accrue dans la région spectrale des 1 kHz à 3 kHz. Avec

une onde de type sinusoïdale, des expériences ont démontré une augmentation de 200 %

des activités neuronales (en impulsions [spikes] par 10s) 24 en passant d‘un stimulus de

1000 Hz à 70dB SPL à 3000Hz pour la même pression, soit une augmentation sur à peine

une octave et demie. Devant ces faits physiques et psychologiques, notre raisonnement est

le suivant : nous pourrions en partie compenser pour l‘écrêtage d‘une chanson en

rééquilibrant des éléments dominants du mix autour de ces valeurs harmoniques.

Concrètement, les crêtes de cette région spectrale ne seraient pas plus élevées à l‘échelle

FS, l‘échelle numérique de graduation d‘un signal audio, mais la sonie serait plus élevée, de

de manière à gagner peut-être gagner quelques phones (unité de mesure approximative de

la perception d‘une pression acoustique à une fréquence donnée) sans avoir à augmenter

significativement la moyenne des dB RMS. Par exemple, nous pourrions créer des

mélodies aux fondamentales se situant autour du registre d‘octave C7 et C8 théoriques25

, ou

bien utiliser des instruments aux sons riches en harmoniques de type C7 et C8, par exemple

des sons aux cycles irréguliers comme les ondes en dents de scie ou de type « bruit » plutôt

que des ondes de type sinusoïdales, ondes plus faibles en harmoniques. Il s‘agit de tenter

d‘établir un équilibre entre des sons complexes sur les plans des harmoniques et des

éléments plus purs (sinusoïdales). Ce faisant, nous intègrerons au principe de sensibilité des

fréquences le principe de sommation sonique (loudness summation) : plus la puissance du

son (SPL) est étendue sur un nombre élevé d‘octaves, ou plus la largeur de la bande

harmonique est importante, plus grande est alors la sonie26

. De plus, et en ce qui concerne

les sons courts inférieurs à 200 ms (plus faiblement perçus par rapport aux sons soutenus),

il nous faut vérifier si nous pouvons composer des morceaux rythmiquement intéressants

avec des notes aussi longues que 200 ms à différents BPM. De cette manière, nous

exploitons notre perception pour obtenir un mix avec une sonie plus élevée, sans pour

autant réellement augmenter les crêtes en amplitude, en espérant que cela n‘augmente pas

trop leur étendue ou leur densité. Nous tentons donc de préserver la hauteur des crêtes,

24

J. L Goldstein, « Phase effects in two-tone suppression investigated with a binaural lateralisation

paradigm », Psychophysics and Physiology of Hearing, (New York, Academin Press, 1977), 177. 25

Roey Izhaki, Mixing audio, Concepts, Practices and Tools, 540. 26

B. B. Bauer et E. L. Torick, « Researches in Loudness Measurement», IEE Transactions on Audio and

Electroacoustics, Vol. AU-14, No 3, (septembre 1966), 149.

14

selon le point de vue de l‘ordinateur, tout en augmentant la qualité sonique, de notre point

de vue, des extraits musicaux. Notre constat préliminaire basé uniquement sur nos écoutes

– c‘est le même pour tous les tests à suivre – est un constat de réussite, comme les tests qui

suivent l‘illustrent, nous sommes parvenus à obtenir des versions modifiées

significativement plus audibles par rapport à leurs homologues originaux, et ce, sans

utiliser des fonctions relatives au gain.

Tests, choix et justifications au stade de la conception sonore

Tous les tests sont divisés et effectués sur deux parties audio distinctes : la partie A

est une composition originale (c.-à-d. en ne tenant pas compte des éléments soniques) et la

partie B est une version différente de l‘originale, qui prend en considération les éléments

théoriques relatifs à la sonie, en ne modifiant qu‘un seul instrument du mix à la fois

(souvent composé de plusieurs modules). Il est à noter que la partie B ne comporte aucun

ajout (d‘instruments ou d‘effets sonores additionnels par rapport à la partie A), car nous ne

voulons pas augmenter l‘amplitude des signaux. Pour modifier la version initiale en vue

d‘obtenir une sonie élevée, nous jouons avec la synthèse et l‘enveloppe des modules de

manière à augmenter les harmoniques (particulièrement autour de 2kHz et de 3kHz) en

gardant le même nombre d‘oscillateurs, puis, dans certains cas, nous allongeons légèrement

les notes MIDI (pour atteindre les 200ms), dans la mesure où la longueur de celles-ci ne

nuit pas à l‘esprit initial des compositions. Ci-dessous, voici les trois modules dont nous

nous servons, pour leur flexibilité au chapitre de la conception sonore :

Figure 2 : Subtraktor, synthétiseur FM polyphonique additif (capture d‘écran27

)

27

Nous utilisons l‘abréviation « CÉ » pour captures d‘écran suivantes.

15

Figure 3 : Thor, synthétiseur polyphonique à trois oscillateurs (CÉ)

Figure 4 : Malström, synthétiseur granulaire à deux oscillateurs (CÉ)

Nous avons choisi d‘illustrer ces trois modules par un souci d‘ergonomie : dans la

suite des tests qui vont suivre, nous n‘avons qu‘à illustrer des sections isolées de chaque

module, soit les sections concernées par les changements entre les versions A et B (le plus

souvent des oscillateurs ou des réglages d‘enveloppe), au lieu de devoir illustrer les

modules entiers pour chaque exemple. Aussi, il est pertinent, voire essentiel, de souligner le

fait que des petits changements d‘enveloppe peuvent modifier considérablement le timbre

d‘un instrument; il ne faut donc pas s‘étonner si une comparaison des timbres de A à B peut

sembler radicale, notre but étant d‘explorer les possibilités de compositions qui sont

optimisées pour une sonie élevée pour et non de produire des versions totalement

identiques d‘une même composition. Lorsque ces changements occasionnent une

16

augmentation du niveau de sortie (en VU/RMS et en Peak), nous compensons la hausse en

diminuant le niveau du gain, de façon à obtenir des niveaux, autant que possible, identiques

aux originaux.

Figure 5 : Big Meter de Reason en action, modes VU et Peak (CÉ)

Pour les niveaux de type Peak (crêtes), cela est facile, mais pour les niveaux RMS

(niveaux moyens établis sur un laps de temps), il nous faut faire des approximations en

observant visuellement de manière honnête les fluctuations des niveaux. Il y a donc un

risque ici relatif à la marge d‘erreur humaine, quoique notre recherche porte

fondamentalement sur des éléments relatifs à des aspects subjectifs de l‘expérience

d‘écoute des phénomènes audio et quoique les crêtes soient demeurées assez stables d‘une

version à une autre (voir les illustrations Wavelab [abréviation choisie : « WL »] dans la

suite des tests). Finalement, nous tentons, dans nos choix de conception sonore, de parvenir

à des résultats conformes aux attentes du style pour les parties A et B (tant du point de vue

du style, que du point de vue sonore), afin de véritablement être en mesure de les comparer,

ne cherchant pas à prouver certaines hypothèses en faisant une conception sonore

désagréable à dessein – ce serait là faire un sabotage de notre recherche de vérité ou de

recherche-création.

17

Test no1 (extrait de BWV 883)

Le premier test est un réchauffement efficace pour plonger le lecteur dans la logique

de tous les autres qui le suivent, car les changements de A à B sont pleinement expliqués,

alors que les exemples qui suivent découleront des prémisses élaborées du premier test. En

ce qui concerne le présent test, il s‘agit d‘un extrait d‘un Prélude du Clavier bien tempéré

de Bach programmé à l‘aide du séquenceur de Propellerhead Reason5.

Figure 6 : 1A WL (A = crêtes de la version originale) (CÉ)

Figure 7 : 1B WL (B = crêtes de la version modifiée) (CÉ).

Ici, les crêtes semblent demeurer relativement semblables d‘une version à une autre.

L‘amplitude de l‘ensemble est plus faible que le reste des expériences puisque la piste, un

Prélude d‘un seul synthétiseur, n‘est pas composée d‘éléments percussifs, qui contribuent à

augmenter les amplitudes.

Les images des figures 8 à 11 illustrent les changements qui ont été faits; la partie

de gauche représente la configuration initiale (A), alors que la partie de droite représente la

18

configuration changée en vue d‘obtenir une sonie élevée (B), la même logique est appliquée

pour les illustrations qui suivent.

Figure 8 : Changement d‘index (accentuant les harmoniques de l‘oscillateur en changeant le point de départ

de l‘échantillon du grain) (CÉ)28

.

Figure 9 : Utilisation d‘une onde en dents de scie plutôt qu‘une onde de type sinusoïdale (moins riche en

harmoniques) (CÉ)29

.

Figure 10 : Allongement léger de la durée des notes MIDI, de manière à augmenter leur perception (CÉ).

Figure 11 : Ajustement du gain à la baisse via une programmation automatisant en même temps le volume de

tous les synthétiseurs de la piste (CÉ)30

.

Avant de poursuivre vers les autres tests, nous souhaitons nous montrer rassurants :

ces détails techniques sont décrits pour la forme et par souci de rigueur. Toutefois, le

lecteur peut se fier simplement à ses oreilles en écoutant les extraits fournis avec le

28

Simon Price, « Using the Malström synth in Reason », Sound on Sound, (aout 2005), web. 29

Hollin Jones, « Sound design using Thor », MusiTech Focus, Synthesis : The in-depth guide for the creative

musician, treisième édition, (2011), 22. 30

Les contrôleurs gris correspondent à une fonction offerte par le module Combinator, qui est un appareil ne

produisant pas de son lui-même, mais qui peut servir à regrouper plusieurs modules et synthétiseurs, qui, eux

produisent et affectent le son, en les programmant tous ensemble. Bref, parfois il est plus simple d‘assigner un

seul contrôle, plutôt que d‘automatiser chaque module (Thor, Subtractor et Malström) individuellement.

19

mémoire, l‘essentiel étant de parvenir à un résultat satisfaisant appuyé par des données.

Comme nous l‘avons déjà indiqué, les expériences à suivre ont mené aux mêmes résultats :

les crêtes demeurent très semblables d‘une version à une autre, alors que le niveau de sonie

des exemples B semble être supérieur aux versions non modifiées A.

Test no2 (Danse percussive 1)

Dans ce test, nous modifions le synthétiseur percussif.

Figure 12 : 2A WL. Amplitude des crêtes élevée, mais densité moindre que la version modifiée (CÉ).

Figure 13 : 2B WL. Diminution de l‘amplitude des crêtes et augmentation de la densité (aire totale sous la

courbe) des amplitudes (CÉ).

Figure 14 : Augmentation du temps de déclin et légère compensation négative du gain (CÉ).

20

Test no3 (Danse percussive 2)

Dans ce test, nous modifions l‘élément percussif présent.

Figure 15 : 3A WL (CÉ)

Figure 16 : 3B WL. Maintien de l‘amplitude des crêtes, mais augmentation de leur densité (CÉ).

Figure 17 : Léger ajustement du gain de sortie des modules à la baisse pour rester au même niveau RMS,

augmentation de la fréquence du filtre d‘enveloppe et augmentation du temps de relâchement (CÉ).

Figure 18 : Rallongement des notes MIDI.

21

Test no4 (Danse percussive 3)

Au cours de ce test, nous modifions la synthèse de la basse.

Figure 19 : 4A WL (CÉ).

Figure 20 : 4B WL. La densité et l‘amplitude des nouvelles courbes similaires (CÉ).

Figure 21 : Compensation négative du gain et augmentation du temps de relâchement (CÉ).

Figure 22 : Changement de modulation pour plus d‘harmoniques (CÉ).

22

Test no5 (House 90’ #1)

Dans ce test, nous changeons l‘instrument mélodique qui commence à partir de 9 secondes.

Figure 23 : 5A WL (CÉ).

Figure 24 : 5B WL, la densité et les crêtes sont similaires (CÉ).

23

Figure 25 : Augmentation du temps de déclin, de la fréquence du filtre d‘enveloppe, du nombre de cycles de

l‘onde modulée FM et compensation négative du gain (CÉ).

Test no6 (Sax Trip-Hop 90’)

Dans ce test, c‘est la basse que nous changeons pour qu‘elle active des harmoniques autour

de 1kHz.

Figure 26 : 6A WL (CÉ).

Figure 27 : 6B WL (CÉ).

Ce cas est assez particulier, car en augmentant légèrement la sonie, nous avons réussi à

maintenir, et parfois à diminuer, la densité des amplitudes. De plus, le changement du

timbre de la basse a eu pour conséquence de laisser augmenter les amplitudes des

24

percussions, ce qui nous fait penser que la basse originale engendrait un effet de masque,

c.-à-d. qu‘elle rendait des éléments percussifs inaudibles. Le fait d‘éliminer cet effet de

masque sera sans doute désirable lors de l‘étape de la compression, où nous perdons

habituellement de la clarté.

Figure 28 : Changement d‘onde de l‘oscillateur et compensation négative du gain (CÉ).

Test no7 (House 90’ # 2)

Dans ce test, nous modifions l‘instrument percussif en arpège des 15 premières secondes.

Figure 29 : 7A WL (CÉ).

Figure 30 : 7B WL (CÉ).

25

Bien que la sonie ait augmenté considérablement, les amplitudes rapides des crêtes ont-

elles aussi augmenté, alors qu‘elles représentent les percussions, en principe intouchées.

Cela est peut-être dû à un masquage non détecté lors de la version originale…

Figure 31 : Changement de type d‘oscillateur (CÉ).

Test no8 (Filter French House 1)

Pour ce test, nous avons modifié l‘instrument mélodique principal.

Figure 32 : 8A WL (CÉ).

26

Figure 33 : 8B WL. Les amplitudes sont similaires (CÉ).

Figure 34 : Les oscillateurs sont automatisés pour plus d‘harmoniques (CÉ).

27

Test no9 (Filter French House 2)

Pour ce test, nous avons modifié les accords du synthétiseur d‘accompagnement.

Figure 35 : 9A WL (CÉ).

Figure 36 : 9B WL. Les amplitudes semblent légèrement moins denses (CÉ).

Figure 37 : Augmentation des harmoniques (CÉ).

Nous avons changé l‘onde en dents de scie pour une synthèse additive de type FM, qui,

avec la même puissance en dB RMS, concentre plutôt le spectre autour de 1kHz-2kHz au

lieu de couvrir une plus grande étendue. Cependant, nous avons perdu du corps, ce qui a

quelque peu changé le caractère planant d‘origine, de sorte que l‘accompagnement, un peu

vide, mais prégnant, semble avoir un effet de « outro ». Cet aspect stylistique sera à traiter

cas par cas, tout dépendamment du seuil de tolérance du réalisateur audionumérique. Il

reste que la perte de corps (diminution des moyennes graves) est régulièrement une étape

préliminaire à la compression pour des résultats plus efficaces.

28

Test no10 (Filter French House 3)

Pour ce test, nous avons modifié la basse, qui sonne nasillarde.

Figure 38 : 10A WL (CÉ).

Figure 39 : 10B WL. Les crêtes des amplitudes sont similaires (CÉ).

Figure 40 : Notes MIDI allongées (CÉ).

Figure 41 : augmentation des harmoniques (CÉ).

29

Test no11 (House percussif)

Au cours de ce test, nous modifions la basse.

Figure 42 : 11A WL (CÉ).

Figure 43 : 11B WL. Légère augmentation de la densité des amplitudes (CÉ).

Gain substantiel en sonie, par la mise à l‘avant d‘harmoniques tels que 400Hz, 800 Hz et

1.6kHz (dans une mesure moindre), des fréquences moins énergivores et plus perceptibles

que les 120 Hz de la version A.

Figure 44 : Compensation négative du gain, augmentation du temps de relâchement et augmentation des

harmoniques (CÉ).

30

Test no12 (Dubstep)

Pour ce test, nous avons modifié le seul instrument de l‘extrait.

Figure 45: 12A WL (CÉ).

Figure 46: 12B WL. Les courbes demeurent stables alors que la sonie augmente (CÉ).

Figure 47 : Augmentation de la fréquence du filtre et changement d‘onde pour plus d‘harmoniques (CÉ).

31

Test no13 (Danse Voix)

Au cours de ce test, nous avons modifié le synthétiseur à accords.

Figure 48 : 13A WL (CÉ).

Figure 49 : 13B WL. Gain de sonie, conservation du niveau des amplitudes (CÉ).

Figure 50 : Augmentation des harmoniques (CÉ).

32

Test no14 (House 90’ #3)

Au cours de ce test, nous modifions la synthèse de l‘instrument mélodique percussif.

Figure 51 : 14A WL (CÉ).

Figure 52 : 14B WL. Les amplitudes sont semblables et la sonie a augmenté (CÉ).

Figure 53 : Allongement des notes MIDI et augmentation des harmoniques (CÉ).

33

Test no15 (Filter French House #4)

Pour ce test, nous avons modifié le synthétiseur virtuel qui fait des arpèges.

Figure 54 : 15A WL (CÉ).

Figure 55 : 15B WL. Les crêtes sont similaires et la sonie a augmenté (CÉ).

Figure 56 : Compensation négative du gain, augmentation des harmoniques et allongement des notes MIDI.

34

Informations préliminaires à l’analyse des données

Constats

À ce stade, soit après avoir allongé les notes MIDI, après avoir augmenté les temps

de relâchement et de déclin et après avoir enrichi les harmoniques des instruments à

modifier des versions B, nous pouvons tenter de déduire des constats à partir des écoutes et

des graphiques à crêtes. Premièrement, l‘augmentation des harmoniques et du temps de

relâchement ont donné un timbre particulier de « cloche » à quelques versions B de nos

tests : c‘est le cas pour 1B, 2B, 3B, 4B, 5B, 7B, 9B, 11B et 14B. Ànotre avis, cela découle en

partie du fait que l‘auteur a un penchant pour les sons aux attaques prononcées et aux

déclins rapides, de sorte qu‘une fois aigus et avec un relâchement lent, nous obtenons des

sons similaires à des sons de cloches. En ce qui concerne ce dernier constat, nous n‘y

voyons pas d‘inconvénients ou d‘avantages particuliers.

Le deuxième constat nous parrait moins positif : après avoir comparé les versions A

et B, nous avons l‘impression générale que les versions B sont plus agressives ou qu‘elles

ont la caractéristique d‘être plus irritantes à l‘écoute. Aussi, nous avons constaté, dans le

même ordre d‘idées, que la littérature savante sur l‘acoustique et l‘audionumérique tiennent

en proximité les termes loudness et annoyance31

: plus un son est long (jusqu‘à 200 ms) et

plus il a une forte sonie (Torick et Bauer, 1966)32

alors que plus un son est long, plus il est

irritant (Raichel, 2006)33

. Toutefois, l‘agressivité d‘un son n‘est pas uniquement due à sa

longueur, mais également (entre autres) à sa composition harmonique. Par exemple, en

regardant un tableau des termes subjectifs pour décrire les régions spectrales, nous pouvons

voir que les régions des 800 Hz à 5kHz, lorsque trop présentes dans un mix, correspondent

à des caractéristiques désagréables comme un son de « boite » autour de 500-800Hz, un son

nasal autour de 1-2kHz ou sibilant et agressif autour de 2 à 9 kHz34

. Pour l‘instant, cela ne

nous semble pas inquiétant suite à l‘écoute des versions B sur lesquelles nous venons de

travailler. Ce qui nous préoccupe est plutôt de voir si ces caractéristiques sonores

31

Eddy Bogh Brixen, Audio Metering, Measurements, standards and practice, 79. 32

Orban Loudness Meter for Windows v. 2.0.8, 15, web. 33

Daniel R. Raichel, The science and applications of acoustics, 2e édition, (New York, New York, 2006),

324. 34

Roey Izhaki, Mixing Audio, 213.

35

(maintenant présentes) ressortent de manière exacerbée une fois que nous aurons augmenté

les amplitudes des pistes à l‘aide d‘un limiteur pour obtenir des versions « prototype »35

de

matriçage, soit l‘étape technique/artistique36

ultime avant la distribution d‘une œuvre.

Il y a un risque en ce qui concerne les fréquences agressives : si nous devons trop

diminuer les fréquences qui nous ont donné notre sonie lors de la réduction de dynamique

au premier test de mise en place pour le matriçage, nous pourrions alors perdre ce pour quoi

nous avons travaillé, ou, du moins, maintenir un niveau de sonie équivalent à la version

originale, sans obtenir d‘avantages pour le travail supplémentaire. Ainsi, il est possible que

nous perdions l‘avantage sonique des versions B par rapport aux versions A, si nous avons

moins de marge de manœuvre lors de la réduction de la gamme dynamique au

« prototype » de matriçage. Ce cas advenant, notre utilisation créative des principes

soniques lors du processus de réalisation aura été vaine, et si l‘avantage sonique est

complètement déclassé par une perte préalable de marge dynamique importante, il se peut

alors que les versions B soient moins puissantes du point de vue de la sonie que leurs

homologues originales. Quoi qu'il en soit, nous irons là où les résultats nous mèneront.

Quelles sont les données pertinentes à l’analyse de nos tests?

Avant de nous lancer dans des essais de réduction de dynamique, il nous faut

recueillir des données chiffrées et des standards dynamiques et soniques recommandés par

des professionnels sur les pistes que nous avons réalisées jusqu‘à présent, afin d‘être en

mesure de les comparer entre elles-mêmes et par rapport à ce que les plus compétents que

nous-mêmes jugent être un standard de qualité : cela est un impératif logique. Pour la

collecte de données sur nos tests, afin de pouvoir en faire une interprétation « éclairée »,

nous avons recherché parmi les dernières publications sérieuses (le savoir en matière de

sonie et de dynamique évolue à une vitesse fulgurante). Pour faire court, les termes « EBU

35

Voir l‘Annexe 2. Nous employons le mot « prototype », car nous n‘utilisons qu‘un limiteur et un égaliseur

afin de mieux permettre l‘universalisation de nos expériences, alors que la chaine d‘outils du matriçage peut

être plus complexe, ce qui augmente l‘apport de la qualité des outils de réduction de la gamme dynamique

dans l‘équation de la qualité globale du résultat obtenu. 36

Bob Katz, Mastering Audio, 11.

36

R 128 », « ITU-R BS.1770 [1, 2 et 3] » et « EBU – TECH 3341-2 » sont très discutés

actuellement dans le monde de l‘audionumérique.

EBU R 128, ITU-R BS. 1770 (v. 1, 2 et 3) et EBU – Tech 3341-2 présentés en rafale

Ces trois termes font référence à trois séries de recommandations par des

organismes internationaux en télécommunications sur la dynamique et la normalisation des

signaux audio. Dans le cas qui nous concerne, cellux-ci émettent des constats à propos des

technologies, mais aussi à propos des méthodes de mesure, de méthodes de traitements

dynamiques et de méthodes de normalisation qui nous sont contemporaines.

Ces organismes arrivent à différents constats. La normalisation par les crêtes (peak

normalisation), la méthode de normalisation la plus repandue, est incapable de régulariser

les sonies de différents programmes37

(on appelle programme: une publicité, une chanson,

un film, bref, toute œuvre ou tout élément audio pour sa durée entière) de manière à ce

qu‘un enchaînement de programmes ne soit pas accompagné d‘un changement de sonie

perceptible par l‘auditeur. L‘incapacité de la normalisation à régulariser les sonies découle

du fait que la sonie ne se mesure pas et ne se contrôle pas par le niveau des crêtes d‘un

programme. Fondamentalement, toute la question réside dans notre méthode de mesure par

QPPM ou Quasi-Peak Programme Meter ou Sample Peak Meter (crête-mètre), soit ce que

nous appelons couramment à demi tort le Peak Meter, outil de mesure approximative des

crêtes.

Premièrement, l‘échantillonnage du QPPM (limité par l‘échantillonnage du fichier

audio ou par la limite « logicielle » du plugiciel) est trop faible pour rendre compte des

réelles courbes de signaux, soit les signaux tels que captés par les enceintes à la fin de la

conversion analogique/numérique. Cela signifie que les crêtes détectées par le QPPM ne

sont q‘une approximation arrondie du niveau des crêtes par le bas, car les transitoires

rapides des attaques des signaux peuvent être (et sont très souvent) ignorés par l‘instrument

de mesure. Autrement dit, l‘utilisation d‘un limiteur de type brickwall (qui ne laisse rien

37

Selon l‘orthographe et la définition du document du EBU R 128, cf. EBU R 128, Loudness normalisation

and permitted maximum level of audio signals, 2011, web.

37

passer au-dessus du niveau de sortie indiqué) à un niveau de sortie de -0,3 dBFS n‘est pas

une garantie certaine contre l‘écrêtage et les distorsions (artéfacts audibles) qui en résultent.

Pourtant, -0,3 dBFS est le niveau de sortie recommandé par Friedemann Tischmeyer en

200738

, même si presque tous les limiteurs fonctionnent en QPPM ou sans

suréchantillonnage (oversampling)39

(y compris les modules issus de la suite Oxford par

Sonnox). La figure ci-dessous représente bien cette réalité : nous pouvons voir que l‘onde

analogique atteint à chaque fois un sommet plus élevé que les échantillons qui décrivent la

courbe du son. Si nous nous rapprochons trop du 0 dBFS lors du matriçage (ou même au

mix), nous courrons de grands risques d‘écrêter notre signal (à partir d‘aussi bas que -3

dBFS40

), et ainsi, il se peut que nous obtenions des distorsions, surtout lorsqu‘il y a du

matériel de qualité non professionnel (le matériel typique dans la plupart des maisons) dans

la chaine de lecture. Deuxièmement, la mesure des crêtes/des amplitudes n‘est qu‘un indice

de ce à quoi peut correspondre la perception du niveau sonore chez l‘être humain. Comme

nous l‘avons vu précédemment, il y a une multitude de facteurs psychoacoustiques que

nous devons prendre en considération (nous avons plus spécifiquement travaillé sur les

facteurs de la durée et des fréquences), ne serait-ce que pour avoir une idée du niveau

sonique d‘un programme audio.

Les gens de l‘EBU (European Broadcasting Union) ont alors cherché à établir des

normes soniques (décrites en EBU R 128) pour l‘élaboration d‘instruments de mesure

(ITU-R BS 1770 [1, 2 et 3] et EBU-Tech 3341) permettant facilement aux ingénieurs et aux

réalisateurs audionumériques de contrôler les niveaux réels des crêtes et les niveaux

soniques de leurs programmes de manière à ce qu‘ils répondent à ces dites normes (EBU R

128).

38

Friedemann Tischmeyer, Audio Mastering Tutorial DVD Vol. III, (Santa Cruz, Tischmeyer Publishing,

2007). 39

Note : très peu de limiteurs travaillent en mode suréchantillonnage, comme le Nugen ISL ou le TC LM2, des

modules dispendieux qui s‘affirment attestés ITU-R BS 1770, une norme déjà vieille de 6 ans, encore

inconnue du grand public en 2011, et qui a subi deux changements considérables au chapitre de la

détermination des niveaux soniques dans les derniers mois… La phrase notée expirera donc sans doute en

validité très prochainement. 40

Thomas Lund, Loudness Wars, web.

38

Les méthodes qui en découlent sont les suivantes : le Programme Loudness ou

Integrated Loudness (sonie intégrée) en LKFS (loudness units filtrés « K »,

où -1 LUFS = -1 dBFS et 1 LU = 1 dB), le Momentary Loudness (sonie du moment sur

400ms), le Short Term Loudness (sonie sur 3s), le Loudness Range (gamme sonique) et le

True Peak Level (ou crêtes réelles). Mais comment ces méthodes fonctionnent-elles?

La sonie est évaluée sur des cases de temps de 400 ms, et ce, à tous les 100ms, avec

un chevauchement des cases de 75 % dans le BS. 177041 - 42

. Chaque case de 400ms

constitue une moyenne en dB RMS, et nous avons 10 de ces cases pour 1 seconde, car la

sonie est calculée à chaque 100 ms. Ainsi, lorsque nous désirons connaitre la sonie sur 3 s,

nous faisons une moyenne des dB RMS des cases de 400 ms (30 pour 3s) et nous obtenons

ainsi une moyenne de moyennes que nous exprimons en LUFS43

. Par la suite, nous

appliquons au LUFS un filtre nommé « K ». Le filtre « K » (ou K-weighting) est en fait une

version simplifiée, composé de quelques filtres de base (voir figure 58.1 à la page

suivante), des courbes isosoniques (equal loudness contour) inversées. Nous obtenons alors

des niveaux en LKFS (LUFS + K-weighting). Par la suite, et pour que la moyenne obtenue

ne soit pas altérée par les valeurs trop faibles en dB d‘un programme, on élimine, par une

méthode de porte-de-bruit (gating) (activation et désactivation de l‘effet d‘un module par

un seuil établi), toutes les données des fenêtres de 400 ms en dessous de -70 LKFS. Une

fois ces données rejetées, nous recalculons une moyenne sonique avec les fenêtres de 400

ms restantes. Finalement, et une fois cette dernière calculée, nous éliminons toutes les

fenêtres de 400 ms ayant des valeurs inférieures de 10 LU à cette dernière moyenne

obtenue, puis nous procédons à un nouveau calcul de la moyenne des cases restantes : c‘est

ainsi que nous obtenons numériquement la valeur sonique d‘un signal audio.

41

Cf., EBU R 128 et ITU BS 1770 (1, 2 et 3). 42

Il est possible que le terme overlap ou emboitement ait porté à confusion Emanuel Deruty, auteur de

l‘article « ‗Dynamic Range‘ & The Loudness WarI », dans SoundOnSound, (septembre 2011), web, article

qui porte en fait sur le Loudness Range. L‘‘Annexe 1 commente quelques contradictions relevées dans cet

article. 43

Il y a plusieurs échelles de graduation relatives, mais nous préférons ne nous servir que de l‘échelle Full

Scale pour son « 0 » absolu.

39

La simplicité du filtre « K » 44 était un compromis à faire sur la précision quant à la

traduction inverse des courbes isosoniques, afin de pouvoir permettre une mise en marché

pratique ($) de modules de mesure soniques physiques. Nous avons de solides doutes quant

à la précision et à la pertinence d‘utiliser ce filtre45

, mais c‘est tout ce dont nous disposons

pour le moment.

En ce qui concerne la gamme sonique (Loudness Range), elle est calculée en faisant

la différence entre la moyenne des sonies fortes et la moyenne des sonies faibles. Celle-ci

est une mesure statistique basée sur la répartition des densités des amplitudes, moins les

valeurs extrêmes. Si la gamme sonique est un indice ou un effet de la gamme dynamique

d‘un programme, elle n‘est cependant, pas une mesure de la gamme dynamique! Elle

représente plutôt la variation du niveau sonique telle que théoriquement perçue par l‘être

humain. Autrement dit, elle compare les différentes sonies au sein d‘un même programme.

Nous avons également des doutes quant à la précision d‘un tel standard de mesure sur une

chanson, car ce standard nous semble aller au-delà d‘une simple mesure de la marge

dynamique intégrée et du peak level, deux mesures qui seraient pourtant suffisantes pour

décrire le niveau de sonie d‘une pièce bien mixée et matriçée qui présente une courbe de

fréquences neutre ou équilibrée, en diluant trop les données recueillies pour les adapter à la

mesure de programmes durant plus de 30-40 minutes. Encore une fois, il reste que c‘est

tout ce dont nous disposons, alors il vaut la peine d‘essayer ces méthodes de mesure.

Les True Peak Level (ou les vraies crêtes) représentent les crêtes telles qu‘elles sont

réellement après la conversion des échantillons en ondes analogiques. Pour arriver à une

mesure plus juste, soit une mesure représentative de l‘onde analogique, par les échantillons

numériques (couramment autour de 48 kHz), nous augmentons le nombre des échantillons

pour obtenir plus de données dans la courbe constituée de points d‘échantillons. Comment

44

Emmanuel Deruty, « ‗Dynamic Range‘ & The Loudness War », SoundOnSound, (septembre 2011), web. 45

À notre avis, le filtre « K » est trop gobal et ne peut s‘appliquer à tous les genres musicaux. Par exemple,

pour la musique hip-hop et pour la musique électronique dansante, il faudrait un filtre passe-haut plus

prononcé pour rendre compte des graves plus présentes de ces styles, sans quoi le niveau de sonie obtenu sera

exagéré par rapport à la perception de l‘auditeur, qui évalue la sonie d‘une pièce davantage en proportion aux

hautes fréquences qu‘aux graves fréquences. En ce qui concerne le filtre « K », et la plupart des standards

EBU et ITU, il semble s‘appliquer surtout aux dialogues, qui ont une quantité insignifiante de graves

fréquences et qui sont plus difficilement agressifs, par rapport à des instruments, lorsqu‘on augmente le gain

de leurs hautes fréquences.

40

est-ce alors possible d‘augmenter le nombre d‘échantillons lorsque nous sommes limités

par l‘échantillonnage prédéfini du fichier audio? Un suréchantillonnage (oversampling) est

possible en insérant des échantillons de valeur « 0 » entre les échantillons du fichier audio.

Conformément à la loi de Nyquist-Shannon, nous devons ensuite appliquer un filtre pour

éliminer les hautes fréquences (> 22 kHz) obtenues des suites de la transformation. Ainsi,

un suréchantillonnage de 4X sur un fichier de 48 kHz produira l‘équivalent d‘un fichier de

192 kHz, pas en qualité sonore, mais en capacité de mesurer le signal audio de manière

fine.

Quels sont les standards? -23 LKFS pour la normalisation et -1 dB pour les crêtes

true peak. En ce qui concerne le premier, « -23 » est une valeur non absolue, qui ne fait pas

consensus dans la communauté audionumérique, notamment chez Orban et les Laboratoires

CBS46

, ou chez l‘AES (Audio Engineering Society)47

: il s‘agit de ramener les programmes

à une moyenne de valeurs dynamiques de -23 LKFS (la moyenne de l‘étendue des données

doit être de -23 LKFS). La limite des crêtes à -1 dB est une bonne suggestion, en vue de la

conversion au format mp3 et de la lecture des appareils de qualité consommateur qui

distorsionnent en bas de 0 dBFS, par Thomas Lund, l‘autorité en matière de haute

définition et de perception chez TC. Nous avons testé cette suggestion, plus prudente que la

limite de -0,3 dBFS de Tischmeyer. Un peu incrédules, nous n‘avons, cependant, pas été

prêt à sacrifier 1 dB de marge dynamique pour éviter l‘écrêtage. Même en appliquant une

limite de -0,7 dBFS avec un limiteur brickwall, et après une conversion haute-qualité au

format mp3 320 kb/s, nous avons eu une chanson sur huit dans notre album (voir chapitre

3) qui a écrêté dans une des deux pistes du mix stéréo. Il faut donc être très prudent.

La marge dynamique, une autre mesure avec ses propres standards pertinents pour nous

Jusqu‘à présent, nous n‘avons pas discuté de mesures et de moyens propres à la

détermination de la dynamique de nos extraits à analyser. À notre avis, Tyschmeyer apporte

une contribution fort intéressante dans ce domaine avec la Pleasurize Music Foundation,

une organisation qui prône la protection de la gamme dynamique et des avantages qui lui 46

Orban Loudness Meter for Windows v. 2.0.8, p. 18, web. 47

Luis Miranda, « Multichannel Loudness Listening Test », communication savante, 124e congrès de l‘Audio

Engineering Society, (1er mai 2008), web.

41

sont reliés. Les membres de cette organisation ont mis au point une table de graduation des

gammes dynamiques en fonction des styles musicaux, un standard qu‘ils voudraient voir

devenir celui de l‘industrie de la musique tout entière. Tout comme certains souhaitent que

les aliments trangéniques soient étiquetées, la Pleasurize Music Foundation48 souhaite voir

la gamme dynamique affiché sur les albums de musique, afin que l‘auditeur sache si la

musique respecte les normes. En collaboration avec Algorithmix, ceux-ci ont également

élaboré un plugiciel servant à déterminer la gamme dynamique en ligne (live) par VST ou

hors ligne (calcul d‘ensemble): le TT Dynamic Range Meter.

Quels standards et quelles mesures allons-nous utiliser pour notre cueillette de

données? Pour réponde à cette question, il faut tout d‘abord nous demander quel est le but

de notre cueillette de données. Cela peut se résumer ainsi : nous souhaitons, avec notre petit

échantillon de pièces (60 en tout) constituées de versions A et B au MIX (30) et de versions

A et B une fois limitées (30 aussi), tenter d‘établir des fonctions entre diverses

caractéristiques soniques et dynamiques dans le but de savoir si notre exercice d‘application

créative de principes soniques lors de la composition est pertinent, c.-à-d. de voir si nous

pouvons tirer des avantages quelconques de cette pratique. Ainsi, et puisque la qualité est

également une finalité de notre recherche, nous allons tenter de nous soumettre aux divers

standards dynamiques et soniques des normes décrites dans ce chapitre tout en observant si

certains de nos choix de conception sonore ont été productifs au chapitre de la gamme

dynamique, du niveau sonique et de la qualité en général, et ce, d‘une manière

significativement supérieure à leur version originale.

Concrètement, nous nous servons des mesures suivantes : la gamme dynamique, le

niveau des « vraies crêtes » (true peak), la sonie intégrée, la gamme sonique intégrée et la

puissance sonore en dB SPL (filtres A et B).

Nos outils de travail

Dans cette section, nous prenons quelques pages pour présenter nos outils de travail

ainsi que nos outils de mesure utilisés au cours de ce premier chapitre. Débutons par les

plugiciens utilisés pour traiter nos différents mix.

48

Pleasurize Music Foundation, web: http://www.pleasurizemusic.com & http://www.dynamicrange.de

42

Figure 57 : Oxford Limiter & Oxford EQ (CÉ).

L‘égalisateur de Type-3 (très large) nous a été conseillé par Serges Samson, technicien de

l‘Université Laval pour des résultats plus doux et naturels.

Figure 58 : Exemples de courbes en affichage -6 dB à + 6dB (CÉ).

Figure 59 : Nugen True Peak Meter & Nugen Loudness Meter (Mode EBU + 18FS) (CÉ).

43

Cet outil de Nugen remplit les normes ITU-R BS1770/1, ATSC A/85 et EBU R 128 (nous

avons choisi ce standard, car c‘est celui qui est le plus discuté de tous).

Figure 60 : TT Dynamic Range Meter Offline et Online (CÉ).

Le logo qui apparait en blanc (DR 10) représente la gamme dynamique intégrée d‘un

programme (10 dB dans ce cas).

44

Mesures

Mesures dynamiques des pistes au mix à l’aide du TT-DR VST et du TT-DR Offline

Tableau 2 : Mesures dynamiques des pistes au mix à l‘aide du TT-DR VST et du TT-DR Offline

Pistes

mix Temps

[X à Y[

sec

DR VST

min

dB

DR

VST

max

dB

DR

médiane

dB

DR

Offline

Pk

L

VST

dB

Pk

R

VST

dB

Pk

L

Off

dB

Pk

R

Off

dB

1A 5 à 10 10,8 13,2 11,00 10++ -14 -11 -14,4 -11,3

1B 5 à 10 12,1 13,8 13,95 13+++++ -11 -11 -11,4 -11,2

2A 20 à 25 10,6 12,6 11,60 11+++ -1,1 -1,1 -0,54 -0,12

2B 20 à 25 9,5 13,2 11,35 11+++ -1,6 -1,6 -0,93 -0,93

3A 20 à 25 12,5 15,3 13,90 13+++++ -0,7 -0,3 -0,00 -0,04

3B 20 à 25 11,5 15,0 13,25 13+++++ 0,0 -0,1 -0,04 -0,00

4A 20 à 25 12,8 14,6 13,70 12++++ -0,6 -1,0 -0,44 -0,62

4B 20 à 25 12,5 14,8 13,65 12++++ -1,0 -0,9 -0,67 -0,94

5A 20 à 25 13,4 16,9 15,15 12++++ -1,0 -1,1 -0,54 -1,02

5B 20 à 25 13,6 17,3 15,45 13+++++ -0,7 -1,3 -0,52 -0,95

6A 20 à 25 12,3 17,7 15,00 12 -2,0 -2,5 -0,93 -1,55

6B 20 à 25 13,1 17,6 15,35 11- -1,7 -2,0 -1,26 -1,48

7A 5 à 10 9,9 13,7 11,80 13+++++ -2,4 -2,0 -0,60 -0,66

7B 5 à 10 12,1 15,6 13,85 12++++ -0,1 -1,5 -0,12 -0,79

8A 0 à 5 10,4 13,3 11,85 11+++ -0,7 -0,7 -0,66 -0,55

8B 0 à 5 11,4 13,4 12,40 11+++ -0,7 -0,5 -0,67 -0,53

9A 0 à 5 114 13,8 12,60 11+++ -0,6 -0,7 -0,54 -0,62

9B 0 à 5 10,3 14,0 12,15 11+++ -0,4 -0,6 -0,39 -0,60

10A 5 à 10 10,5 13,1 11,80 12++++ -1 -1 -0,97 -0,98

10B 5 à 10 10,1 13,2 11,65 12++++ -1 -1 -1,00 -0,96

11A 0 à 5 12,1 13,4 12,75 12++++ -3 -3,3 -3,16 -3,47

11B 0 à 5 11,0 13,9 12,45 12++++ -2,5 -2,7 -2,40 -2,29

12A 0 à 5 12,2 16,2 14.20 11+++ -3,3 -3,5 -3,27 -3,55

12B 0 à 5 11,1 16,1 13,60 12++++ -3,5 -4,3 -3,54 -3,83

13A 0 à 5 11,0 14,1 12,55 12++++ -4,0 -3,8 -3,38 -2,97

13B 0 à 5 11,7 14,4 13,05 12++++ -3,8 -3,9 -3,62 -3,14

14A 0 à 5 11,0 12,7 11,85 11+++ -2,4 -2,3 -2,12 -2,02

14B 0 à 5 11,0 13,2 11,60 10++ -2,3 -2,2 -2,33 -2,02

15A 0 à 5 9,3 12,6 10,95 11+++ -2,4 -2,3 -2,35 -2,34

15B 0 à 5 9,8 12,8 11,30 10++ -2,5 -2,5 -2,33 -2,23

Légende :

DR = Dynamic Range (Gamme dynamique)

VST = mesuré avec le TT Dynamic Range Meter en ligne

Offline = mesuré avec le TT Dynamic Range Meter hors ligne

PK L = Peak Left (crête gauche)

PK R = Peak Right (crête droite)

« - » ou « + » pour chaque degré inférieur/supérieur à la norme de Tischmeyer par genre

45

Mesures soniques (Nugen LM) : Pistes Mix

Méthodologie des mesures : comme les mesures soniques sont des indications relatives (il

n‘y a pas de mesures absolues), nous avons comparé les mêmes séquences pour les versions

A et B lors des passages aux instruments concernés par les changements, entre 20 et 30

secondes de longueur ou pour l‘échantillon au complet lorsqu‘il était plus court.

Tableau 3 : Mesures soniques (Nugen LM) : Pistes Mix

Pistes Mix PL

EBU +18 dB

LR

EBU +18 dB

1A -24,7 0.6

1B -24,8 0.6

2A -15,8 2.4

2B -15,7 1.0

3A -14,8 1.3

3B -14.7 1.4

4A -16.2 0.9

4B -16.6 0.8

5A -15.1 1.2

5B -15.5 0.5

6A -16.4 1.7

6B -16.0 3.8

7A -16.8 1.9

7B -15.9 1.2

8A -14.0 0.9

8B -13.9 0.8

9A -14.3 0.8

9B -14.2 0.6

10A -14.6 0.5

10B -14.4 0.5

11A -18.3 0.7

11B -18.1 1.2

12A -17.8 1.5

12B -17.5 0.5

13A -18.8 1.1

13B -18.7 1.5

14A -15.3 0.8

14B -15.3 0.6

15A -16.0 0.7

15B -15.9 0.3

Légende :

PL = Programme Loudnes ou sonie intégrée en mode EBU + 18

LR = Integrated Loudness Range ou gamme sonique intégrée en mode EBU + 18

46

Mesures soniques (Nugen LM) & dynamiques (TT DR) des pistes limitées

Méthodologie des mesures : même que précédente.

Tableau 4 : Mesures soniques (Nugen LM & dynamiques (TT-DR) des pistes limitées.

Légende :

Gain entrée = augmentation de gain appliquée (Oxford Limiter natif)

Gain sortie = limite du brick wall (Oxford Limiter)

DR = Dynamic Range (Gamme dynamique)

Offline = mesuré avec le TT Dynamic Range Meter hors ligne

PL = Programme Loudnes ou sonie intégrée en mode EBU + 18 (Nugen LM)

LR = Integrated Loudness Range ou gamme sonique intégrée en mode EBU + 18

« - » ou « + » pour chaque degré inférieur/supérieur à la norme de Tischmeyer par genre

Pistes

limitées

Gain entrée

dB

(18 max)

Gain sortie

dB

Réduction

gain max

dB

DR

Offline

dB

PL

dB

LR

dB

1A 18.0 -1 3 8 - 10.6 3.3

1B 18.0 -1 3 8 - 9.80 2.0

2A 7.00 -1 5 7- - 11.1 1.8

2B 9.00 -1 6 7- -10.1 1.0

3A 14.6 -1 12 8 -10.3 0.6

3B 13.6 -1 9 7- -10.1 0.3

4A 12.9 -1 12 7- -10.9 16.8

4B 13.0 -1 12 7- -10.0 17.3

5A 7.78 -1 5 8 -10.7 1.9

5B 7.78 -1 5 8 -10.9 3.0

6A 4.14 -1 1 11- -15.0 9.7

6B 4.14 -1 1 10-- -14.7 9.5

7A 7.48 -1 3 8 -11.7 1.5

7B 7.66 -1 4 8 -11.5 2.1

8A 3.65 -1 1.5 9+ -12.1 1.1

8B 3.65 -1 1.5 9+ -12.1 1.0

9A 7.30 -1 5 8 -11.1 0.7

9B 7.03 -1 5 8 -11.1 0.5

10A 6.25 -1 4 8 -10.2 0.5

10B 6.08 -1 4 8 -10.1 0.5

11A 8.03 -1 2 9+ -12.2 0.8

11B 9.24 -1 3 8 -11.5 0.9

12A 9.00 -1 3 8 -10.7 0.7

12B 9.49 -1 3 8 -9.7 0.4

13A 8.51 -1 1 8 -11.7 1.2

13B 8.31 -1 1 8 -11.8 1.0

14A 5.01 -1 1 9+ -11.9 1.3

14B 5.24 -1 1 8 -11.7 1.3

15A 6.03 -1 3 8 -11.3 0.7

15B 6.03 -1 3 10++ -11.2 0.7

47

Ajustements des fréquences après l’augmentation de gain au limiteur

Tableau 5 : Ajustements des fréquences après l‘augmentation de gain du limiteur.

Pistes

compressées

Réduction des fréquences Constats :

compensation nécessaire?

1A

Figure 61 : Égaliseur 1A (CÉ).

ORIGINAL

1B

Figure 62 : Égaliseur 1B (CÉ).

La nature du son a trop changé de la

version A à la version B, de sorte

qu‘une comparaison est difficile.

2A

Figure 63 : Égaliseur 2A (CÉ).

ORIGINAL

2B

Figure 64 : Égaliseur 2B (CÉ).

Légère diminution du facteur

agressif à environ 2 kHz.

3A

Figure 65 : Égaliseur 3A (CÉ).

ORIGINAL

3B

Figure 66 : Égaliseur 3B (CÉ).

Diminution du corps autour de

150 Hz et diminution du facteur

agressif et sibilant entre 2 kHz et

7 kHz.

4A

Figure 67 : Égaliseur 4A (CÉ).

ORIGINAL

48

4B

Figure 68 : Égaliseur 4B (CÉ).

Légère diminution du facteur

agressif autour de 1.5 kHz.

5A

Figure 69 : Égaliseur 5A (CÉ).

ORIGINAL

5B

Figure 70 : Égaliseur 5B (CÉ).

Légère diminution du facteur

sibilant autour de 5 kHz.

6A

Figure 71 : Égaliseur 6A (CÉ).

ORIGINAL

6B

Figure 72 : Égaliseur 6B (CÉ).

Aucun changement jugé nécessaire

par rapport à l‘original.

7A

Figure 73 : Égaliseur 7A (CÉ).

ORIGINAL

7B

Figure 74 : Égaliseur 7B (CÉ).

Légère diminution du facteur

sibilant autour de 5 kHz.

8A

Figure 75 : Égaliseur 8A (CÉ).

ORIGINAL

49

8B

Figure 76 : Égaliseur 8B (CÉ).

Aucun changement jugé nécessaire.

9A

Figure 77 : Égaliseur 9A (CÉ).

ORIGINAL

9B

Figure 78 : Égaliseur 9B (CÉ).

Diminution des moyennes

« boueuses » autour de 250-500 Hz.

Légère diminution du facteur

agressif autour de 2 kHz.

10A

Figure 79 : Égaliseur 10A (CÉ).

ORIGINAL

10B

Figure 80 : Égaliseur 10B (CÉ).

Adoucissement non significatif du

facteur agressif.

11A

Figure 81 : Égaliseur 10A (CÉ).

ORIGINAL

11B

Figure 82 : Égaliseur 11B (CÉ).

Légère diminution du corps autour

de 180 Hz.

12A

Figure 83 : Égaliseur 12A (CÉ).

ORIGINAL

50

12B

Figure 84 : Égaliseur 12B (CÉ).

Légère diminution des moyennes

boueuses autour de 400-500 Hz.

13A

Figure 85 : Égaliseur 13A (CÉ).

ORIGINAL

13B

Figure 86 : Égaliseur 13B (CÉ).

Légère diminution de la sibilance

autour de 8 kHz.

14A

Figure 87 : Égaliseur 14A (CÉ).

ORIGINAL

14B

Figure 88 : Égaliseur 14B (CÉ).

Adoucissement général non

significatif par rapport à l‘original.

15A

Figure 89 : Égaliseur 15A (CÉ).

ORIGINAL

15B

Figure 90 : Égaliseur 15B (CÉ).

Aucun changement jugé nécessaire.

51

Tests de puissance acoustique au LANTISS (ULaval)

Figure 91 : Filtres communs dans la mesure des dB SPL

49

Méthodologie des mesures : même que pour les mesures soniques.

Tableau 6 : Tests de puissance acoustique au LANTISS (ULaval)

Pistes SPL A

max dB

SPL C

max dB

Pistes Limitées SPL A

max dB

SPL C

max dB

1A 69 82.7 1A 88.4 95.6

1B 77.6 80.8 1B 94.8 95.4

2A 81.4 97.2 2A 82.8 96.6

2B 79.3 96.3 2B 83.6 97.0

3A 79.1 93.9 3A 84.1 96.8

3B 80.4 92.4 3B 85.2 97.8

4A 77.0 94.8 4A 84.3 100.8

4B 77.2 94.7 4B 83.7 95.9

5A 78.8 92.8 5A 84.9 95.6

5B 79.3 91.9 5B 85.4 96.3

6A 82.4 93.9 6A 83.2 95.6

6B 81.0 95.1 6B 82.5 95.1

7A 78.8 95.4 7A 84.6 95.9

7B 76.8 93.6 7B 84.4 97.2

8A 82.1 95.9 8A 82.5 95.6

8B 82.6 96.3 8B 82.9 95.4

9A 83.3 95.9 9A 84.6 94.8

9B 83.2 96.1 9B 84.6 96.6

10A 80.7 94.5 10A 84.6 95.6

10B 82.0 95.1 10B 85.0 96.8

11A 78.8 94.8 11A 82.9 95.9

11B 78.6 94.5 11B 81.8 96.8

12A 79.1 92.6 12A 86.0 96.3

12B 78.6 91.2 12B 86.9 95.4

13A 77.8 95.4 13A 83.9 96.1

13B 78.0 95.1 13B 82.6 96.6

14A 80.4 95.1 14A 83.8 96.1

49

Lindosland, A-Weighting, Wikimedia commons, web.

52

14B 78.5 96.3 14B 82.9 96.3

15A 78.4 93.9 15A 82.1 95.6

15B 78.6 95.6 15B 83.2 96.3

Légende :

SPL A = Mesure en dB SPL avec filtre de type A en mode maximum

SPL C = Mesure en dB SPL avec filtre de type C en mode maximum

Tableau 7 : Résultats des tests de puissance acoustique au LANTISS

Rouge = Baisse de niveau par rapport à l‘original

Bleu = Hausse de niveau par rapport à l‘original

Sous-Total :

MIX A : 7 V 8

MIX C : 10 V 5

LIMITÉES A : 8 V 7

LIMTÉES C : 5 V 11

Total :

MIX : 17 VS 13

LIMITÉES : 11 VS 19

53

Conclusion : analyse des résultats

Malgré notre échantillon et nos outils modestes, tentons de voir si nous pouvons

tirer une fonction ou observer une constante à partir de nos données. Allons-y alors en

ordre.

Versions A et B au mix

Pour les mesures dynamiques des pièces au Mix, nous constatons que toutes ont une

gamme dynamique supérieure à la norme de Tischmeyer, à l‘exception des pièces 6A et 6B,

qui entrent dans la catégorie hip-hop, ce qui demande plus de dynamique. Aussi, les

colonnes des crêtes sont toutes rouges, à l‘exception des premières, car toutes affichaient

l‘alerte clip au true peak meter, même si le Big Meter de Reason restait muet à cet égard.

En regardant les options du Nugen LM, nous avons constaté que cette lumière devait

s‘allumer à chaque fois qu'une crête dépassait la barre des -1 dB, ce qui nous fait penser

que cette fonction est plus préventive, qu‘une « réelle » détection d‘un dépassement du

niveau. En ce qui concerne les mesures soniques, nous sommes toujours au-dessus

des -23 LKFS visés par les normes EBU et ITU, de sorte que nous nous rangeons parmi les

réalisateurs audionumériques insatisfaits de cette norme qui, à notre avis, vise trop bas pour

les pièces de musique dansantes ou ne s‘adresse qu‘aux téléspectateurs cherchant à garder

un niveau des dialogues constants pour ne pas qu‘ils aient à ajuster le niveau sonore de leur

télévision. Comme nous, certains réalisateurs semblent être du même avis : « We have

encountered heated complaints by mixers and producers who stated that such material,

when automatically matched to the surrounding program material via the BS 1770 meter,

can air up to 3 dB quieter in subjective terms. In turn this has constrained the ability o

producers to specify the type of audio processing they had previously used to give this

material excitement and punch »50

, affirment les gens de chez Orban concernant la réponse

des réalisateurs aux standards de mesure BS 1770. Par contre et en ce qui concerne les

normes de Tischmeyer (TT DR), nous les avons plutôt trouvées très réalistes, fonctionnelles

et très utiles.

De manière générale, nous n‘avons pas pu mesurer des changements significatifs au

niveau de la sonie et de la dynamique entre les versions A et B, ce qui nous semble assez

50

Orban White Paper Using the ITU BS.1770-2 and CBS Loudness Meters to Measure Loudness Controller

Performance, web.

54

décevant. Nous avons tenté d‘élaborer des tableaux graphiques de type « nuage de points »,

mais aucune tangente intéressante n‘est apparue. Aussi, le fait que nous puissions

apercevoir une distinction sonique entre les versions, sans toutefois pouvoir la mesurer,

nous apprend potentiellement trois choses :

1. Même s‘ils sont perceptibles, les changements soniques et dynamiques entre les

versions A et B au Mix ne sont pas assez significatifs pour pouvoir être mesurés.

2. Les appareils et standards de mesure ne sont pas assez sensibles et développés pour

pouvoir rendre compte de notre perception à la hausse des changements soniques

des versions A aux versions B au Mix.

3. Notre échantillon est peut-être trop petit.

En ce qui concerne les différences de puissance acoustique entre les versions A et B

au Mix, il n‘y a, encore une fois, pas de changements significatifs. Nous avons

généralement observé que les versions B sont acoustiquement moins puissantes que les

versions A, lorsque nous avons utilisé un filtre de type C sur notre dB mètre. Cela nous

indique que les versions A ont sans doute plus de basses fréquences (détectables en mode

C), puisqu‘en mode A (plus près de la perception humaine), cette tendance des versions A à

B est radicalement inversée.

En combinant nos observations subjectives favorables à une hausse de la perception

sonique des versions B par rapport aux versions A, et en combinant celles-ci à nos données

mesurées, nous constatons que nos compositions « averties » dans l‘optique de l‘obtention

d‘une sonie élevée n‘ont pas apporté de changements significativement supérieurs en sonie.

Versions A et B limitées

Nous avons utilisé un limiteur sur les deux versions afin d‘observer s‘il y en a une

qui se travaille mieux par rapport aux autres. Pour des fins de compatibilité des

comparaisons, nous avons décidé de n‘utiliser qu‘un limiteur dans sa forme la plus simple

55

et un égaliseur, afin de pouvoir réellement comparer une pratique de conception sonore par

rapport à une autre51

.

Hélas, si nous voulons encore comparer les versions A aux versions B, nous

constatons, par l‘analyse des données et par des tentatives infructueuses à dresser des

tangentes dans des graphiques à nuages de points, que nous ne pouvons pas tracer une

fonction ou une constante démontrant ou infirmant une tendance sonique ou une tendance

dynamique des versions A par rapport aux versions B. De manière générale, les deux

versions ont le même profil dynamique et sonique (inutile de spécifier que nous étions bien

trop au-dessus de -23 LKFS, même si les pièces obtenues étaient bien moins fortes sur le

lan de la sonie que la plupart des chansons commerciales auxquelles nous pouvons nous

comparer, car les normes de Tischmeyer permettent une grande dynamique). Les hausses

d‘une version à l‘autre sont toujours équilibrées ou égalées par une autre baisse. Lorsque

nous avons mesuré les niveaux SPL des pistes limitées, nous avons pu observer une

tendance générale à la hausse des niveaux des versions A à B par rapport à ceux pour les

versions au Mix. Toutefois, la portée de cette tendance est très limitée, car les hausses

étaient généralement assez minimes (1 ou 2 dB, quoiqu‘il s‘agisse de valeurs

logarithmiques) d‘une version à l‘autre et parce que, comme nous l‘avons affirmé plusieurs

fois, la mesure du niveau sonore en dB est un indice du niveau de la sonie (car il y a

corrélation entre les deux), mais nous ne pouvons pas, pour cela, dresser un lien de cause à

effet et affirmer une hausse de la sonie.

En plus de n‘avoir obtenu aucun avantage sonique aux versions B par rapport aux

versions A, nous n‘avons pas obtenu davantage de dynamiques, car au final, les mesures

demeuraient presque identiques d‘une version à l‘autre. Aussi, nous croyons avoir annulé la

hausse sonique en diminuant les fréquences que nous avions tenté d‘augmenter à l‘étape de

la conception sonore à l‘aide des égaliseurs (13 cas sur 15). Nous avions voulu rester

honnête par rapport à nous-mêmes en apportant les modifications harmoniques qui nous

apparaissaient essentielles, et ce, en ne comptabilisant nos résultats qu‘à la fin. Nous nous

rendons maintenant compte que la plupart des changements que nous avons faits à l‘étape

51

Nous expliquons l‘origine de ce choix à Annexe 2.

56

de la conception sonore étaient trop agressifs à notre gout une fois que le signal audio avait

passé dans le limiteur.

Sommaire

En somme, et en toute conscience de l‘échantillon sonore et des outils modestes

dont nous disposions, les changements soniques obtenus par l‘utilisation créative de

principes soniques à l‘étape de la réalisation audionumérique ne sont pas suffisamment

satisfaisants pour justifier ou rendre pertinents, d‘un point de vue combiné de la perception

et de la mesure des résultats obtenus, l‘effort et les peines encourues par le souci d‘une

conception sonore qui risque d‘aller à l‘encontre des préférences de timbre du compositeur.

Comme notre échantillon était assez restreint, nous décidons d‘accorder encore une chance

aux standards de mesure soniques décevants au cours du prochain chapitre où nous

tournons notre approche organique du matriçage et du processus de réalisation

audionumérique vers une méthode qui, nous le croyons, aura moins d‘impact sur le

processus de création, mais un apport plus positif à la dynamique, et donc aussi à la sonie,

finales. Il s‘agit de travailler directement à partir de l‘élément dynamique le plus influent

d‘un mix de musique « dance » lourdement compressé ; il s‘agit des percussions, puisque

leurs amplitudes sont les premières à être altérées lorsqu‘il y a une forte réduction de la

marge dynamique à la suite de l‘usage d‘outils comme les limiteurs et les compresseurs.

57

Chapitre 2 : Programmation des boucles et paramétrage du traitement de signal en

vue du contrôle de la dynamique des percussions

Introduction

Problématique

Nous nous proposons maintenant d‘orienter notre recherche vers les percussions.

Comme celles-ci sont des éléments dynamiques apériodiques caractérisés par la puissance

de leur spectre52

, qui influencent énormément la constitution des crêtes lors des mix finaux,

nous pensons qu‘il s‘agit ici de phénomènes idéaux pour tester l‘incidence de la variation

des vélocités lors de leur programmation sur la gamme dynamique et les distorsions suite à

l‘écrêtage de l‘étape du matriçage en vue d‘obtenir un mix final à forte sonie. Nous voulons

simplement tester trois types de pratiques de programmation de percussions (notre but n‘est

pas d‘obtenir des résultats très réalistes), pour ensuite les écraser avec un limiteur afin de

voir s‘il nous est possible de dresser une tendance dynamique et/ou de sonie générale pour

chaque pratique de programmation. En faisant cela, nous souhaitons voir si une pratique est

plus avantageuse qu‘une autre pour l‘obtention d‘un résultat final à sonie élevée sans les

désavantages habituels (distorsions et perte de gamme dynamique). Sachant cela, notre

réalisateur hypothétique pourra peut-être mieux orienter ses pratiques de composition dès

l‘étape de la conception sonore et de la programmation en vue de faciliter le travail de

postproduction/matriçage soniquement et dynamiquement « agressifs », une pratique par

laquelle la gamme dynamique est réduite de manière à générer des mix perceptiblement

forts. Rappelons que cela est intrinsèquement lié au fait que nous percevons la sonie par le

niveau moyen d‘une piste et non par le degré d‘amplitude des crêtes (peak level)53

. De plus,

ce désir d‘une dynamique « agressive » s‘inscrit dans le contexte des pratiques

audionumériques et de la musique dance actuelles, quoique nous ne remettions pas en

question la réelle pertinence d‘aller aussi loin dans l‘écrêtage au cours du présent chapitre.

Concernant cette controversée pratique, il est très courant de lire des affirmations qui,

lorsqu‘elles ne considèrent pas la compression comme un élément esthétique désirable chez

les créateurs de musique house, l‘endossent complètement : « Compression plays a major

52

Heinrich Kuttruff, Acoustics – An Introduction, (New York, Taylor & Francis, 2007), 210. 53

Rick Snoman, The Dance Music Manual, 32.

58

part or my sound. I have them patched across every output of the desk », affirme le

compositeur de musique house Armand Van Helden, « Without compression, drums appear

wimpy in comparison to the chest thudding results heard in professionally produced music,

mixes can appear lacking in depth and basses, and vocals and leads can lack any real

presence », affirme Rick Snomann, auteur du Dance music manual54

. « Compression »,

« comparison » et « professionally produced music » sont les termes clés qui résument le

contexte dans lequel s‘inscrit ce chapitre.

Les changements des vélocités ont un certain effet sur les échantillons

déclenchés/générés par les modules de sons virtuels. Si ceux-ci désignent la force de frappe

de la note, nous pouvons nous demander qu‘est-ce que cela signifie concrètement sur le son

lorsqu‘il s‘agit d‘évènements audionumériques. Il y a un terrible manque d‘informations

quant au routage virtuel interne des stations de travail digitales et des instruments virtuels

sur contrôle de la vélocité. Il est très commun que les échantillons contrôlés par les

instruments virtuels soient les mêmes pour plusieurs vélocités. Traditionnellement, pour

une intonation différente, le contrôle de la vélocité est routé à un VCA (Voltage controlled

amplifier, où le voltage est utilisé pour contrôler l‘amplification) et/ou à un VCF, où le

voltage est utilisé pour altérer la fréquence d‘un filtre55

. Il arrive également que des

paramètres tels le vibrato et la hauteur (pitch) soient assignés à un contrôle de vélocité,

mais nous n‘utilisons pas de tels effets pour nos expériences avec les percussions. Ableton

Live, la station de travail digitale dont nous nous servons dans la présente section, utilise

certainement l‘amplification et le filtrage pour le contrôle de la vélocité des notes MIDI.

Cependant, la proportion et le type de l‘amplification contrôlée par la vélocité nous sont

inconnus. En ce qui a trait au filtre, il s‘agit par défaut d‘un passe-bas à 12dB par octave.

Ce dernier est modifiable, mais nous avons choisi d‘utiliser le standard pour ne pas

introduire des facteurs trop marginaux par rapport aux programmations habituelles. Malgré

cela, il nous est tout de même difficile de connaitre la proportion exacte de l‘affectation de

chacun de ces effets sur le son par l‘intermédiaire d‘un contrôle des vélocités. Cela est sans

doute une question d‘algorithmes que seuls les programmeurs du logiciel connaissent :

54

Rick Snoman, The Dance Music Manual, 31. 55

Martin Russ, Sound Synthesis and Sampling, 2e édition, (Elsevier, Focal Press, 2004), 88 et Bruno Lüthi,

Physical acoustics in the solid state, (New York, Springer, 2005), p. 8.

59

« How a device responds to these messages [MIDI channel pressure] will often vary from

manufacturer to manufacturer (or can be assigned by the user) »56

.

Il reste néanmoins que nous entendons des phénomènes constants dans notre

manipulation des vélocités de ce logiciel, de sorte que nous pouvons en tirer une constante

basée sur un raisonnement inductif, ou sur nos observations répétables, que certains

pourraient qualifier d‘empiriques. En effet, nous avons globalement observé que les notes

aux vélocités les plus fortes ont un gain plus élevé et des harmoniques plus riches que leurs

équivalentes à faibles vélocités pour des sons percussifs provenant de la banque de son de

Ableton Live 8. À l‘inverse, les notes à faibles vélocités ont moins d‘harmoniques (leur

enveloppe semble filtrée en passe-bas ou en shelving sur les fréquences élevées) et elles ont

un gain plus faible. Encore une fois, les proportions exactes de ces variations nous sont

inconnues et il se peut qu‘il y ait d‘autres facteurs changeants impliqués dans le contrôle

des vélocités, mais il est indéniable que le contrôle des vélocités affecte la dynamique et le

spectre de l‘échantillon qui lui est désigné. Nous tentons néanmoins d‘utiliser comme guide

ultime nos oreilles.

En prenant compte du déroulement des expérimentations et des résultats obtenus, il

ne sera peut-être pas trop extravagant que de projeter les conclusions obtenues sur des

pratiques similaires, soit des variations des vélocités pour la programmation MIDI d‘autres

instruments.

Méthodologie

Il est étonnamment difficile d‘élaborer une méthode « empirique » pour réaliser

notre entreprise, et il nous faut réfléchir à plusieurs facteurs avant de nous lancer dans la

conception sonore et la programmation. Premièrement, il nous faut évaluer entre eux des

boucles de percussions qui ont un niveau sonique et dynamique similaires dès le départ.

Pour cela, la mesure de niveaux « moyens » comme les dB RMS, la gamme dynamique et

les LUFS sont des candidats de mesure pratique, quoique leurs standards restent à être

éprouvés quant à leur efficacité à mesurer les nuances légères entre les échantillons.

56

David Huber, « MIDI : Handbook for Sound Engineers », Audio Engineering Explained, (Elsevier, Focal

Press, 2010), 463.

60

Comme nous évaluons des « évènements » auditifs très courts (crêtes/transiants) pour leur

sonie (niveaux moyens), il est difficile de savoir si des mesures soniques peuvent être

significatives. Dans un tel contexte, il est sans doute plus approprié d‘évaluer la sonie des

échantillons percussifs en fonction de leur gamme dynamique, où une gamme dynamique

faible est un équivalent corrélationnel à un niveau sonique élevé. Par « corrélationnel »,

nous voulons simplement indiquer qu‘une certaine gamme dynamique ne remplace pas ou

ne cause pas une certaine mesure sonique définie, mais seulement qu‘une mesure de

gamme dynamique est un bon indice de la sonie d‘un échantillon lorsqu‘il s‘agit d‘un

contexte où la pratique musicale vise une forte sonie (lorsque le niveau moyen du signal est

poussé contre un plafond défini près du « 0 » digital). Ainsi, pour qu‘une comparaison soit

possible, et pour qu‘une telle mesure dynamique soit connexe à une mesure de sonie, il

faut, dès le départ, utiliser une sorte de réduction de gain/compression/normalisation,

quoique plus faible que celle de l‘étape du limiteur broyeur de la postproduction, pour que

la gamme dynamique soit calculée à partir d‘un plafond commun (par exemple -3 dB FS),

afin que les échantillons puissent prétendre une quelconque forme de comparaison

quantitative pour appuyer nos observations subjectives. Aussi, lorsque nous parlons de

« comparaison », nous entendons une comparaison entre les différentes pratiques lors de

notre expérimentation, et non une comparaison entre tous les échantillons qui font partie de

notre expérience57

.

Autrement dit, pour qu‘une mesure dynamique ou une mesure moyenne des crêtes

se traduisent en un langage sonique comparatif entre plusieurs éléments auditifs, il faut que

ces éléments aient un même plafond, car un échantillon peu dynamique au plafond de -20

dBFS sera soniquement perçu à un niveau faible alors que le même échantillon peu

dynamique à un plafond de -1 dBFS sera soniquement perçu à un niveau très élevé. Ainsi

donc, dans ce dernier exemple, il est non significatif de comparer la gamme dynamique des

échantillons dans la perspective d‘obtenir un comparatif au niveau de leur sonie. Nous

ferons alors le contraire en mesurant la dynamique moyenne partir d‘un plafond commun

correspondant à un type de quantification se rapprochant du niveau sonique, ce qui est

pratique dans notre cas (car nous souhaitons vérifier des échantillons constitués d‘éléments

auditifs très brefs).

57

Voir chapitre Conclusion.

61

Il reste néanmoins qu‘il est très difficile d‘évaluer d‘une manière « quantitative » et

rigoureuse la question à savoir si les différentes versions des boucles des percussions sont

soniquement comparables entre elles au départ, car comme nous le savons déjà, la sonie ne

se quantifie que d‘une manière très bancale puisqu‘elle est le produit d‘une expérience

subjective, phénomène vécu d‘un domaine qualitatif. Il reste que nous croyons tout de

même qu‘il est pertinent de tenter d‘obtenir des mesures soniques quantitatives lorsqu‘elles

sont accompagnées d‘une écoute attentive et avertie, car cela permet un plus grand niveau

de rigueur dans l‘expérimentation. En somme et pour clore le présent paragraphe, il nous

faut normaliser le plafond des crêtes de nos boucles dès le départ (avant la compression en

vue de l‘obtention de la sonie), une étape qui a également fait partie de la méthodologie de

recherche d‘Emmanuel Deruty dans son enquête sur la dynamique de la musique entre

1969 et 2010, quoiqu‘il n‘explique pas en détails les particularités de son procédé de

normalisation58

. Pour nous, l‘élaboration d‘un plan de normalisation doit passer par les

points suivants :

a. Le niveau maximal atteint des crêtes doit être le même pour toutes les versions.

Nous nous assurons de cela en appliquant un premier limiteur sur chaque mix des

percussions à -3 dBFS, un niveau maximal de crêtes que nous considérons commun/normal

pour les percussions dans la musique « dance » à l‘étape du mixage59

. La réduction de gain

du limiteur devra être la même pour les versions à comparer : soit la réduction la plus basse

possible (< 0.1 dB). L‘action du limiteur (attaque, relâchement, etc.) sera la plus

courte/rapide possible, afin que le caractère des crêtes soit préservé de manière maximale et

puisqu‘il s‘agit d‘éléments percussifs rapides.

b. Pour qu‘il y ait une comparaison possible entre les niveaux RMS et la gamme

dynamique, toutes les programmations des percussions devront être identiques (BPM,

nombre d‘éléments percussifs, programmation MIDI des notes). Nous comprenons que la

moindre variation de ces éléments rendra nos résultats non significatifs : par exemple, si

nous diminuons la vitesse d‘un mix, la gamme dynamique augmentera soudainement, ce

qui nous rappelle encore les failles de la recherche de monsieur Deruty, qui introduit des 58

Emmanuel Deruty, « ‗Dynamic range‘ & the loudness war », web. 59

Il s‘agit bien du niveau maximal des crêtes et non d‘un niveau moyen (dB RMS). Ce niveau a été déterminé

simplement parce qu‘il ne manquait que très peu de puissance aux pistes pour atteindre -3 dB de sorte qu‘elles

n‘ont pas eu besoin d‘une très grande amplification.

62

aspects stylistiques non mesurables dans sa recherche, ce qui n‘est pas « nous renseigner

sur les pratiques soniques d‘une époque par rapport à une autre ». Comme nous focalisons

en particulier sur la musique « dance », nous définissons notre vitesse à 120 BPM. Nos

éléments percussifs seront standards : 1 grosse caisse, 1 caisse claire (ou un « clap ») et 1

type de cymbales-à-pied.

c. Les niveaux RMS et LUFS intégrés (soit les moyennes pour la durée totale des

boucles) des versions à comparer devront être similaires, quoique, en raison des limites des

mesures « quantitatives » de la sonie, ces mesures nous serviront seulement de références

pour avoir le point de vue de la « machine » ou, si vous voulez, connaitre leur importance

dans la bande passante disponible d‘une seule piste stéréo maitresse afin d‘apporter un

complément de rigueur à notre écoute.

Nous varions la programmation des vélocités avec comme but d‘obtenir des

percussions qui ont un effet de « groove dynamique », soit des percussions dansantes. Pour

les cymbales-à-pied, nous mettons l‘accent sur les 1/8 de mesures paires, ou dit en langage

courant, nous mettrons l‘accent sur les contretemps. Pour les coups de grosse caisse, nous

mettons l‘accent sur le deuxième temps, soir sur le temps du coup de la caisse claire.

Nous ajoutons également une troisième version dans laquelle l‘effet de « groove

dynamique » des cymbales-à-pied est fabriqué à l‘aide d‘une compression latérale (side-

chain compression en anglais)60

activée par un signal-fantôme externe déclenché en tout

temps, à l‘exception des contretemps. Pour cette troisième version, les cymbales-à-pied ont

tous une vélocité identique. Nous souhaitons tester ce type de compression afin de

connaître sa valeur de « groove dynamique » et pour tenter de voir si elle aura une

incidence sur la qualité du son.

60

Il s‘agit d‘une compression sur un signal, qui est programmée à agir lorsque le compresseur en reçoit

l‘ordre par un autre signal. Cela est couramment désigné comme une compression en « side-chain », un terme

venant de l‘expression anglaise « side-chain compression », mais que l‘on pourrait traduire par « compression

latérale » ou « compression par contrôle latéral ». Voir Roey Izhaki, Mixing Audio – Concepts, practices and

tools, 283.

63

La programmation de nos percussions en images

Figure 92 : Programmation de boucles standard (CÉ).

Il s‘agit ici de la programmation de nos boucles « standard » ou sans variation des

vélocités pour 4 mesures (nos échantillons audio sont constitués de 8 mesures, soit la durée

pour laquelle nous calculons les niveaux de nos échantillons) sur le « Drum Rack » de

Ableton Live 8. Les grosses caisses et les caisses claires ont la même vélocité. cymbales-à-

pied ont une vélocité légèrement plus basse : cette dernière a été déterminée de manière à

s‘assurer que les niveaux dynamiques et soniques demeurent constants d‘une version à une

autre. Remarquons aussi que les coups de caisses claires sont toujours appuyés par un coup

de grosse caisse, comme il est commun de le faire dans certains types de musique

« dance ».

Figure 93 : programmation de boucles aux vélocités variées (CÉ).

Cette figure illustre notre programmation pour les boucles à vélocités variées. Ici,

les cymbales-à-pied sont programmés de manière à ce que nous obtenions des coups

marqués sur les contretemps afin de donner une sensation de mouvement aux percussions.

Aussi et comparativement à la figure précédente, la vélocité des caisses varie de manière à

64

créer du mouvement entre les coups de grosse caisse et de caisse claire, ce qui a un effet de

« groove dynamique »61

.

Figure 94 : Programmation de percussions avec compression latérale (CÉ).

Cette figure illustre notre programmation pour les boucles au « groove dynamique »

provoqué par une compression latérale sur les cymbales-à-pied. La vélocité de ces derniers

est plus élevée que la vélocité de nos exemples à programmation standard de manière à

obtenir des niveaux soniques et dynamiques comparables. La variation des vélocités des

grosses caisses est la même que pour l‘exemple précédent.

Figure 95 : Programmation du signal externe pour la compression latérale.

Cette figure illustre notre programmation du signal pour la compression latérale

externe. Les espaces entre les carrés rouges MIDI représentent les moments où les

cymbales-à-pied ont la ‗permission‘ d‘atteindre leurs crêtes maximales. Autrement dit, les

espaces blancs sont les moments où le compresseur n‘agit pas sur les cymbales-à-pied,

alors que les carrés rouges MIDI représentent les moments où elles sont affectées par le

compresseur.

Nous avons choisi une onde de type sinusoïdale comme signal fantôme (un signal

que nous n‘entendons pas dans le mix) pour le traitement dynamique latéral externe, mais

61

Dow Rory, « Programming realistic drum parts », Sound on Sound, septembre 2010, web.

65

cela aurait pu être n‘importe quelle sorte d‘onde, étant donné que son effet était appliqué

sur tout le spectre des cymbales-à-pied à être compressées. Les temps de l‘enveloppe sont

les éléments auxquels il a fallu faire attention :

Figure 96 : Synthétiseur générant le signal externe pour la compression latérale (CÉ).

Il fallait une attaque très rapide et un déclin qui demeurait à un niveau audible pour

au moins un quart de mesure. Le temps de relâchement était quasi nul, de sorte qu‘il nous a

fallu simplement couper la note MIDI du signal externe pour la compression latérale au

moment où nous voulions que la compression arrête. Les plus petits ajustements à cet égard

ont été réalisés à l‘aide du temps de relâchement des compresseurs. Pour que l‘effet soit

complet, il nous a donc fallu programmer les compresseurs de la manière suivante :

Figure 97 : Compresseur pour le traitement latéral (CÉ).

Il n‘y a rien de particulier à mentionner sur les caractéristiques de ces réglages, mis

à part qu‘ils sont assez drastiques et agressifs, afin de bien entendre les effets. Ceux-ci

auraient pu être totalement autres si le compresseur avait été combiné avec un signal de

latéral externe différent. Nous nous sommes simplement servi de nos oreilles pour

déterminer si le mouvement dynamique obtenu était intéressant et comparable à celui de

l‘exemple aux vélocités variées. Au final, le processus entourant le la compression latérale

est beaucoup plus long à expliquer qu‘à effectuer : dans ce cas particulier, un évènement

sonore externe gère le gain des cymbales-à-pied afin de créer un mouvement dynamique

intéressant pour la musique électronique dansante.

66

Pour synthétiser cette dernière section, nous souhaitons essayer de simuler une sorte

de performance humaine qui un effet de « groove dynamique » (en ne visant pas un

réalisme absolu). Cela s‘est, en somme, traduit en une production de 240 échantillons :

40 programmations sans varier les vélocités avant compression.

40 programmations sans varier les vélocités après compression.

40 programmations en variant les vélocités avant compression.

40 programmations en variant les vélocités après compression.

40 programmations avec une compression latérale externe activée par les

grosses caisses sur les cymbales-à-pied avant compression.

40 programmations avec une compression latérale externe activée par les

grosses caisses sur les cymbales-à-pied après compression.

Le contrôle des crêtes

Figure 98 : Limiteur Oxford (CÉ).

Limiteur Oxford : pour chaque échantillon d‘avant compression, il ne travaille qu‘au

minimum possible. Nous ajustons les niveaux des échantillons au mixeur de manière à faire

déclencher la première lumière de la graduation de la réduction du gain, afin de s‘assurer

que tous ont un plafond commun (-3.0 dB), sans néanmoins être encore significativement

compressés.

67

Figure 99 : Oxford EQ, Waves Trans X Wide & Oxford Limiter (CÉ).

En ordre, les modules après compression : Égaliseur Oxford (HP12 à 36.5Hz), TransX

Wide de Waves et Oxford Limiter avec un gain de 6.04 dB en entrée et une sortie limitée à

-0.82 dB62

. Nous enlevons légèrement les très basses fréquences, comme cela est très

courant de le faire63

, de manière à ne pas faire trop travailler le limiteur. Nous nous servons

légèrement du module Trans X Wide64

, nous l‘avons mis à 1.0 ce qui est assez faible), de

manière à donner de la largeur aux transients. Cela a pour effet d‘augmenter efficacement

la sonie avant le limiteur, ce qui nous permet d‘éviter une surcompensation au gain d‘entrée

de ce dernier.

62

Il vaudrait la peine d‘effectuer des recherches plus poussées concernant le « headroom » laissé aux pistes

après le matriçage. À la lumière de la présentation Loudness Wars de Thomas Lund (TC Electronics) à Rome

Calling et à la lumière de nos récentes observations, le standard commun de -0,3 dB (Tischmeyer, Audio

Mastering with PC workstations, par exemple) est trop faible pour empêcher l‘écrêtage, car nos mesures des

crêtes sont trop approximatives pour détecter les transitoires très rapides. Cela est encore plus vrai lorsque le

mix est destiné à être converti en un format mp3 léger. Sans entrer dans des détails trop poussés, la règle

générale de la prudence semble nous dicter qu‘il vaut mieux laisser plus de « headroom » que moins, d‘où

notre choix d‘une limite plus prudente que les conventionnelles. 63

Floyd Toole, Sound Reproduction, Loudspeakers and rooms, (Elsevier, Focal Press, 2008), 242. 64

Durant la dernière année, nous avons essayé de nombreux outils pour augmenter le niveau de sonie de nos

mix. La plupart de ces derniers bourrent vraiment sans les élargir le son de sorte qu‘ils compromettent

grandement la qualité du signal audio. Nous ne sommes vraiment pas des amateurs des plug-ins Waves en

général, mais le module Trans X Wide nous semble un choix parmi les moins pires au travers des plus-ins que

nous avons eu la chance d‘essayer… dans la foule d‘outils qu‘il est possible de trouver. Nous avons

également découvert que ce module était aussi utilisé par le producteur JJ Puig, voir Paul Tingen, « Secrets of

the mix engineers : JJ Puig », article paru dans la revue Sound on Sound, novembre 2007, web.

68

Collecte des données

Résultats avant compression :

Tableau 8 : Boucles standard sans variation aux vélocités.

Échantillon dB RMS

intégrés

Gamme

dynamique

intégrée dBFS

Sonie intégrée

LUFS (EBU + 18)

1 -21,9 18 -21,8

2 -23,9 19 -22,5

3 -21,5 17 -22,7

4 -19 15 -20,8

5 -24,2 20 -23,2

6 -17,6 14 -18,8

7 -19,2 16 -20,2

8 -19,5 16 -20,7

9 -20,3 17 -20

10 -20,5 17 -21,9

11 -15,3 12 -17,9

12 -30,3 27 -31,9

13 -12,5 9 -16

14 -21,8 19 -21,6

15 -17,7 14 -18,1

16 -16,7 13 -20,5

17 -21,9 19 -22,5

18 -18,7 15 -19

19 -17,1 13 -17,2

20 -20,2 17 -19,5

21 -20,7 17 -22,7

22 -23,8 20 -23,4

23 -23,8 20 -24

24 -20,8 17 -21,6

25 -22,7 18 -20,2

26 -21,7 18 -21,5

27 -23,4 21 -21,4

28 -20,1 17 -19,1

29 -22,7 19 -22,5

30 -22 18 -20,4

31 -15,1 12 -16,4

32 -13,3 10 -16,2

33 -14,3 11 -18,2

34 -17,9 14 -19,4

35 -16,7 14 -18,6

36 -17 14 -18,5

69

37 -22 18 -22,5

38 -15,7 12 -16,7

39 -15,2 12 -16,5

40 -19,4 16 -21,1

Min -30,3 9 -31,9

Max -12,5 27 -16

Tableau 9 : Boucles avec variation de vélocités.

Échantillon dB RMS

intégrés

Gamme

dynamique intégré

dBFS

Sonie intégrée

LUFS (EBU + 18)

1 -21,7 18 -21

2 -23,4 20 -21,7

3 -21,6 17 -21,8

4 -19,5 16 -20,9

5 -23,3 20 -21,1

6 -18,1 15 -19

7 -19,3 17 -19,9

8 -20 17 -20,4

9 -19,7 16 -19,3

10 -20,8 17 -21,8

11 -16,3 13 -18,6

12 -30,5 27 -32

13 -12,7 9 -16

14 -21,4 19 -20,6

15 -18,9 15 -19,2

16 -17,1 13 -20,3

17 -21,5 19 -21,3

18 -18,2 15 -17,9

19 -17,4 14 -16,7

20 -20,1 17 -19,1

21 -20,8 17 -22,1

22 -23,7 20 -23,2

23 -24,1 21 -24,5

24 -21,6 18 -21,9

25 -22,5 18 -19,7

26 -21,3 18 -20,2

27 -22,8 20 -20,3

28 -19,2 17 -17,2

29 -23 20 -23

30 -21,3 19 -18,6

31 -15,6 12 -16,7

32 -14 11 -17

70

33 -14,6 11 -18,8

34 -18,6 15 -20,3

35 -17,1 14 -18,2

36 -17,5 14 -18,1

37 -22,3 19 -23,5

38 -16,2 13 -17,7

39 -15,7 13 -17,8

40 -20,2 17 -21,7

Min -30,5 9 -32

Max -12,7 27 -16

Tableau 10 : Boucles avec compression latérale externe (side-chain compression).

Échantillon dB RMS

intégrés

Gamme

dynamique

intégrée dBFS

Sonie intégrée

LUFS (EBU + 18)

1 -21,7 18 -20,9

2 -23,4 20 -21,2

3 -21,4 17 -21,3

4 -19,5 16 -20,9

5 -23,2 20 -21

6 -18,1 15 -18,8

7 -19,3 17 -19,7

8 -20,2 17 -20,3

9 -19,6 16 -18,9

10 -20,8 17 -20,5

11 -16,3 13 -18,5

12 -30,4 27 -31,7

13 -12,7 9 -15,9

14 -21,3 18 -20,5

15 -18,9 15 -19,3

16 -17,1 13 -20,3

17 -21,4 18 -21,1

18 -18,1 15 -17,5

19 -17,3 14 -17

20 -20 17 -18,9

21 -20,6 17 -21,6

22 -23,7 20 -23,6

23 -24,1 21 -24,5

24 -21,5 18 -21,6

25 -22,5 18 -19,5

26 -21,2 18 -20

27 -22,6 20 -19,9

28 -18,6 16 -16,3

71

29 -23 20 -22,8

30 -21,2 19 -18,6

31 -15,5 12 -16,6

32 -14 11 -16,9

33 -14,6 12 -18,9

34 -18,5 15 -20,1

35 -17,1 14 -18,9

36 -17,5 14 -18,9

37 -22,2 19 -23,4

38 -16,1 13 -17,6

39 -15,7 13 -17,8

40 -20,2 17 -22,6

Min -30,4 9 -31,7

Max -12,7 27 -15,9

Tableau 11 : [Avant compression] v. (variation) des versions à « groove dynamique » par rapport à la version

originale sans v. de vélocités, où « x » = à la v. de la version aux vélocités variées et « y » =à la v. de la

version latéralement compressée. Les « - » indiquent qu‘il y a eu un changement à la baisse quant à la gamme

dynamique et/ou une augmentation quant à la sonie dans le présent contexte.

Échantillon dB RMS intégrés Gamme dynamique

intégrée dBFS

Sonie intégrée LUFS

(EBU + 18)

x y x y x y

-0,2 -0,2 0 0 -0,8 -0,9

2 -0,5 -0,5 1 1 -0,8 -1,3

3 0,1 -0,1 0 0 -0,9 -1,4

4 -0,5 -0,5 1 1 0,1 0,1

5 -0,9 -1 0 0 -2,1 -2,2

6 0,5 0,5 1 1 0,2 0

7 -0,1 -0,1 1 1 -0,3 -0,5

8 0,5 0,7 1 1 -0,3 -0,4

9 -0,6 -0,7 -1 -1 -0,7 -1,1

10 0,3 0,3 0 0 -0,1 -1,4

11 1 1 1 1 0,7 0,6

12 0,2 0,1 0 0 0,1 -0,2

13 0,2 0,2 0 0 0 -0,1

14 -0,4 -0,5 0 -1 -1 -1,1

15 1,2 1,2 1 1 1,1 1,2

16 0,4 0,4 0 0 -0,2 -0,2

17 -0,4 -0,5 0 -1 -1,2 -1,4

18 -0,5 -0,6 0 0 -1,1 -1,5

19 0,3 0,2 1 1 -0,5 -0,2

20 -0,1 -0,2 0 0 -0,4 -0,6

72

21 0,1 -0,1 0 0 -0,6 -1,1

22 -0,1 -0,1 0 0 -0,2 -0,9

23 0,3 0,3 1 1 0,5 0,5

24 0,8 0,7 1 1 0,3 0

25 -0,2 -0,2 0 0 -0,5 -0,7

26 -0,4 -0,5 0 0 -1,3 -1,5

27 -0,6 -0,8 -1 -1 -1,1 -1,5

28 -0,9 -1,5 0 -1 -1,9 -2,8

29 0,3 0,3 0 -1 0,5 0,3

30 -0,7 -0,8 1 1 -1,8 -1,8

31 0,5 0,4 0 0 0,3 0,2

32 0,7 0,7 1 1 0,8 0,7

33 0,3 0,3 0 1 0,6 0,7

34 0,7 0,6 1 1 0,9 0,7

35 0,4 0,4 0 0 -0,4 0,3

36 0,5 0,5 0 0 -0,4 0,4

37 0,5 0,4 1 1 1 0,9

38 0,5 0,4 1 1 1 0,9

39 0,5 0,5 1 1 1,3 1,3

40 0,8 0,8 1 1 0,6 1,5

Min -0,9 -1,5 -1 -1 -2,1 -2,8

Max 1,2 1,2 1 1 1,3 1,5

Tableau 12 : [Avant compression] V. (variation) des variations, « y » par rapport à « x ». Les « - » indiquent

qu‘il y a eu un changement à la baisse quant à la gamme dynamique et/ou une augmentation quant à la sonie

dans le présent contexte.

Échantillon dB RMS

intégrés

Gamme

dynamique

intégrée

dBFS

Sonie

intégrée

LUFS

(EBU+18)

0 0 -0,1

2 0 0 -0,5

3 0 0 -0,5

4 0 0 0

5 -0,1 0 -0,1

6 0 0 -0,2

7 0 0 -0,2

8 0,2 0 -0,1

9 -0,1 0 -0,4

10 0 0 -1,3

11 0 0 -0,1

12 -0,1 0 -0,3

73

13 0 0 -0,1

14 -0,1 -1 -0,1

15 0 0 0,1

16 0 0 0

17 -0,1 -1 -0,2

18 -0,1 0 -0,4

19 0,1 0 0,3

20 -0,1 0 -0,2

21 0 0 -0,5

22 0 0 -0,7

23 0 0 0

24 -0,1 0 -0,3

25 0 0 -0,2

26 -0,1 0 -0,2

27 -0,2 0 -0,4

28 -0,6 0 -0,9

29 0 -1 -0,2

30 -0,1 0 0

31 -0,1 0 -0,1

32 0 0 -0,1

33 0 1 0,1

34 -0,1 0 -0,2

35 0 0 0,9

36 0 0 1

37 -0,1 0 -0,1

38 -0,1 0 -0,1

39 0 0 0

40 0 0 0,9

Min -0,6 -1 -1,3

Max 0,2 1 1

Résultats après compression :

Tableau 13 : Boucles standard sans variations aux vélocités.

Échantillon dB RMS

intégrés

Gamme

dynamique

intégrée dBFS

Sonie intégrée

LUFS (EBU + 18)

1 -16,7 16 -17,1

2 -18,5 18 -17,3

3 -16,5 15 -17,8

4 -13,1 13 -15

5 -19,1 18 -18

6 -13,4 13 -13,6

74

7 -15,8 15 -15,4

8 -14,4 13 -15,7

9 -16 15 -16

10 -16,7 16 -16,2

11 -10,6 10 -13,3

12 -27 26 -28

13 -8,3 7 -11,7

14 -17 16 -16

15 -11,9 11 -15

16 -12,2 11 -16

17 -16,6 16 -16

18 -14,5 14 -13,9

19 -13,9 13 -13

20 -15,3 15 -14,4

21 -16,1 15 -17,9

22 -21 20 -20,3

23 -19 18 -20,2

24 -15,5 15 -16,3

25 -18,4 16 -15,8

26 -15,9 15 -15,7

27 -17,9 17 -15,6

28 -14,7 14 -13,3

29 -16,8 16 -17,3

30 -17,2 17 -15,2

31 -11,2 10 -12,4

32 -9,3 8 -12,1

33 -11,6 10 -13,5

34 -14,1 12 -15,1

35 -11,6 10 -13,9

36 -12,8 11 -14,3

37 -15,6 14 -17

38 -11,5 10 -13,4

39 -11,6 10 -12,9

40 -14,5 13 -16,1

Min -27 7 -28

Max -8,3 26 -11,7

75

Tableau 14 : Boucles avec variation de vélocités

Échantillon dB RMS

intégrés

Gamme

dynamique

intégrée dBFS

Sonie intégrée

LUFS (EBU + 18)

1 -16,9 16 -16,7

2 -18,9 18 -16,8

3 -16,1 15 -16,4

4 -13,9 13 -15,2

5 -18,7 18 -16,5

6 -14 13 -14,6

7 -16,8 16 -16,7

8 -15,4 14 -16

9 -16,1 15 -15,7

10 -16,4 16 -15,2

11 -11,9 11 -14,2

12 -27 26 -27,1

13 -8,9 8 -11,9

14 -17,1 16 -16,1

15 -13,2 12 -15,9

16 -12,5 11 -15,7

17 -16,2 16 -14,5

18 -13,8 13 -12,1

19 -14,2 14 -12,8

20 -14,6 14 -12,5

21 -16,2 16 -17

22 -20,5 20 -20

23 -19,4 18 -19,7

24 -16,2 16 -16,4

25 -18,4 16 -15,1

26 -16,7 16 -15,8

27 -18,6 18 -16,1

28 -15,5 15 -13,8

29 -17,2 17 -16,8

30 -18,2 18 -15,3

31 -11,5 9 -12,7

32 -9,5 8 -12,4

33 -11,5 10 -13,9

34 -14,7 13 -15,8

35 -12,9 11 -14,8

36 -13,2 11 -14,6

37 -16,2 15 -17,1

38 -12,2 11 -13,6

39 -12,4 11 -14,3

40 -15,3 14 -16,8

76

Min -27 8 -27,1

Max -8,9 26 -11,9

Tableau 15 : Boucles avec copression latérale externe (side-chain compression)

Échantillon dB RMS

intégrés

Gamme

dynamique

intégrée dBFS

Sonie intégrée

LUFS (EBU + 18)

1 -16,9 16 -16,8

2 -18,9 18 -16,8

3 -15,9 15 -15,9

4 -13,8 13 -15,3

5 -18,7 18 -16,5

6 -13,9 13 -14,3

7 -16,7 16 -16,4

8 -15,4 14 -15,6

9 -16 15 -15,8

10 -16,2 16 -14,9

11 -11,9 12 -14,2

12 -26,9 26 -27

13 -8,9 8 -11,8

14 -17 16 -15,9

15 -13,2 12 -15,9

16 -12,5 11 -15,5

17 -16 16 -14,1

18 -13,8 13 -12,1

19 -14,3 14 -13,1

20 -14,5 14 -12,6

21 -16 16 -16,4

22 -20,5 19 -19,7

23 -19,3 18 -19,6

24 -16,1 15 -16,1

25 -18,4 16 -15,1

26 -16,7 16 -15,7

27 -18,5 18 -15,7

28 -15,1 14 -13,2

29 -17,1 17 -16,7

30 -18,2 18 -15,3

31 -11,8 10 -12,7

32 -9,4 8 -12,3

33 -11,6 10 -14,3

34 -14,9 13 -15,3

35 -12,9 11 -14,8

77

36 -13,2 11 -14,6

37 -16,2 15 -17

38 -12,2 11 -13,5

39 -12,5 11 -14,4

40 -15,3 14 -16,8

Min -26,9 8 -27

Max -8,9 26 -11,8

Tableau 16 : [Après compression] v. (variation) des versions à « groove dynamique » par rapport à la version

originale sans v. de vélocités, où « x » = à la v. de la version aux vélocités variées et « y » = à la v. de la

version compressée latéralement. Les « - » représentent qu‘il y a eu un changement à la baisse quant à la

gamme dynamique etùou une augmentation quant à la sonie dans le présent contexte.

Échantillon dB RMS intégrés Gamme dynamique

intégrée dBFS

Sonie intégrée LUFS

(EBU + 18)

x y x y x y

1 0,2 0,2 0 0 -0,4 -0,3

2 0,4 0,4 0 0 -0,5 -0,5

3 -0,4 -0,6 0 0 -1,4 -1,9

4 0,8 0,7 0 0 0,2 0,3

5 0,4 0,4 0 0 -1,5 -1,5

6 0,6 0,5 0 0 1 0,7

7 1 0,9 1 1 1,3 1

8 1 1 1 1 0,3 -0,1

9 0,1 0 0 0 -0,3 -0,2

10 -0,3 -0,5 0 0 1 1,3

11 1,3 1,3 1 2 0,9 0,9

12 0 -0,1 0 0 -0,9 -1

13 0,6 0,6 1 1 0,2 0,1

14 0,1 0 0 0 0,1 -0,1

15 1,3 1,3 1 1 0,9 0,9

16 0,3 0,3 0 0 -0,3 -0,5

17 -0,4 -0,6 0 0 -1,5 -1,9

18 -0,7 -0,7 -1 -1 -1,8 -1,8

19 0,3 0,4 1 1 -0,2 0,1

20 -0,7 -0,8 -1 -1 -1,9 -1,8

21 0,1 -0,1 1 1 -0,9 -1,5

22 -0,5 -0,5 0 -1 -0,3 -0,6

23 0,4 0,3 0 0 -0,5 -0,6

24 0,7 0,6 1 0 0,1 -0,2

25 0 0 0 0 -0,7 -0,7

26 0,8 0,8 1 1 0,1 0

27 0,7 0,6 1 1 0,5 0,1

78

28 0,8 0,4 1 0 0,5 -0,1

29 0,4 0,3 1 1 -0,5 -0,6

30 1 1 1 1 0,1 0,1

31 0,3 0,6 -1 0 0,3 0,3

32 0,2 0,1 0 0 0,3 0,2

33 -0,1 0 0 0 0,4 0,8

34 0,6 0,8 1 1 0,7 0,2

35 1,3 1,3 1 1 0,9 0,9

36 0,4 0,4 0 0 0,3 0,3

37 0,6 0,6 1 1 0,1 0

38 0,7 0,7 1 1 0,2 0,1

39 0,8 0,9 1 1 1,4 1,5

40 0,8 0,8 1 1 0,7 0,7

Min -0,7 -0,8 -1 -1 -1,9 -1,9

Max 1,3 1,3 1 2 1,4 1,5

Tableau 17 : (Après compression) V. (variation) des variations, « y » par rapport à « x ». Les « - » indiquent

qu‘il y a eu un changement à la baisse quant à la gamme dynamique et/ou une augmentation quant à la sonie

dans le présent contexte.

Échantillon dB RMS

intégrés

Gamme

dynamique

intégrée

dBFS

Sonie

intégrée

LUFS

(EBU+18)

1 0 0 0,1

2 0 0 0

3 -0,2 0 -0,5

4 -0,1 0 0,1

5 0 0 0

6 -0,1 0 -0,3

7 -0,1 0 0,3

8 0 0 -0,4

9 0,1 0 0,1

10 -0,2 0 0,3

11 0 1 0

12 -0,1 0 -0,1

13 0 0 -0,1

14 0,1 0 -0,2

15 0 0 0

16 0 0 -0,2

17 -0,2 0 -0,4

18 0 0 0

19 0,1 0 0,3

79

20 -0,1 0 0,1

21 -0,2 0 -0,6

22 0 -1 -0,3

23 -0,1 0 -0,1

24 -0,1 1 -0,3

25 0 0 0

26 0 0 -0,1

27 -0,1 0 -0,4

28 -0,4 1 -0,6

29 -0,1 0 -0,1

30 0 0 0

31 0,3 1 0

32 -0,1 0 -0,1

33 0,1 0 0,4

34 0,2 0 -0,5

35 0 0 0

36 0 0 0

37 0 0 -0,1

38 0 0 -0,1

39 0 0 -0,1

40 0 0 0

Min -0,4 -1 -0,6

Max 0,3 1 0,4

80

Interprétation des résultats : graphiques et commentaires

Résultats primaires

Tableau 18 : dB RMS intégrés selon la fréquence des résultats.

Tableau 19 : dB RMS intégrés, fréquence des résultats (après compression).

Dans les deux cas, les trois types de boucles semblent suivre un patron traditionnel

de loi normale. Nous pouvons également observer que dans ces deux cas, les boucles à

« groove dynamique » (versions aux variations de vélocités et versions à compression

latérale) ont une moyenne RMS intégrée (sur toute la durée des échantillons) légèrement

0

2

4

6

8

10

12

14

Boucles Standard sansvariations aux vélocités

Boucles avec variation develocités

Boucles avec compressionlatérale (side-chain)

0

2

4

6

8

10

12

14

16

Boucles Standard sansvariations aux vélocités

Boucles avec variation develocités

Boucles avec compressionlatérale (side-chain)

81

plus élevée dans les trois régions les plus peuplées, alors que les boucles à variation

standard semblent légèrement se distribuer plus doucement à partir du centre de la cloche

vers les extrémités. Aussi, globalement, les deux régions aux niveaux extrêmes sont

légèrement plus peuplées par les boucles aux programmations standard. Compte tenu du

fait que ces variations sont très faibles et très régulières, il semble préliminairement que ces

trois pratiques occupent une bande passante relativement similaire dans la dynamique

digitale.

Tableau 20 : Gamme dynamique intégrée en dB FS selon la fréquence des résultats.

Tableau 21 : Gamme dynamique intégrée en dB FS selon la fréquence des résultats (après compression)

0

2

4

6

8

10

12

14

Boucles Standard sansvariations aux vélocités

Boucles avec variation develocités

Boucles aveccompression latérale(side-chain)

0

2

4

6

8

10

12

14

Boucles Standard sansvariations aux vélocités

Boucles avec variation develocités

Boucles aveccompression latérale(side-chain)

82

Ici, le patron de la loi normale traditionnelle est moins évident à observer. La

population des échantillons augmente de manière linéaire, puis elle descend

exponentiellement à partir de son point maximal. Dans les deux cas, pour la gamme

dynamique intégrée, les deux régions présentant des dynamiques les plus faibles sont

légèrement plus occupées par les boucles standard. Globalement, les boucles à « groove »

semblent légèrement plus dynamiques que celles sans « groove », quoiqu‘il soit difficile de

clairement démarquer avantageusement une pratique d‘une autre pour sa marge dynamique.

Tableau 22 : Sonie intégrée en LUFS (EBU + 18) selon la fréquence des résultats.

Tableau 23 : Sonie intégrée en LUFS (EBU + 18) selon la fréquence des résultats (après compression)

0

2

4

6

8

10

12

14

16

18

Boucles Standard sansvariations aux vélocités

Boucles avec variation develocités

Boucles avec compressionlatérale (side-chain)

0

2

4

6

8

10

12

14

16

18

20

Boucles Standard sansvariations aux vélocités

Boucles avec variation develocités

Boucles avec compressionlatérale (side-chain)

83

Ici, les mêmes observations précédentes s‘appliquent. Avant la compression, les

boucles standard semblent distribuées de manière plus égale que celles avec un effet de

« groove dynamique ». La sonie intégrée des dernières semble légèrement plus élevée après

et avant la compression, si nous observons les trois régions les plus peuplées, ce qui

correspond aussi à ce que nous percevons, mais il est difficile de clairement contraster une

pratique d‘une autre, car leurs distributions demeurent relativement égales.

Les différentes variations : comparaison des versions à « groove » versus les versions avec

une programmation standard par la mesure de leur écart.

Tableau 24 : dB RMS intégrés selon la fréquence des résultats.

Tableau 25 : dB RMS intégrés selon la fréquence des résultats (après compression)

0

5

10

15

20

-1,5 -1 -0,5 0 0,5 1 1,5

Légende : « x » = v. de la version aux vélocités variées

« y » = v. de la version compressée latéralement

x

y

0

2

4

6

8

10

12

14

16

-1,5 -1 -0,5 0 0,5 1 1,5

Légende : « x » = v. de la version aux vélocités variées

« y » = v. de la version copressée latéralement

x

y

84

Après la compression, la version variée par la programmation des vélocités occupe

légèrement une plus grande place dans la bande passante numérique que la version à

compression latérale par rapport à leur version standard initiale. Avant la compression,

leurs écarts sont plus égalitairement distribués. La différence entre ces deux pratiques

demeure assez légère, mais une telle tendance signifierait que la version compressée

latéralement pourrait être un peu plus écrasée dynamiquement (pour obtenir une sonie

élevée), car elle occupe une place plus faible dans la bande passante.

Tableau 26 : Gamme dynamique intégrée en dB FS selon la fréquence des résultats.

Tableau 27 : Gamme dynamique intégrée en dBFS selon la fréquence des résultats (après compression).

Avant la compression, il semble que la gamme dynamique de la version à

compression latérale était plus faible par rapport à la version standard que la version aux

0

5

10

15

20

25

-1 0 1

Légende : « x » = v. de la version aux vélocités variées

« y » = v. de la version latéralement compressée

x

y

0

5

10

15

20

25

-1 0 1

Légende : « x » = v. de la version aux vélocités variées

« y » = v. de la version compressée latéralement

x

y

85

vélocités programmées. Après la compression, il semble que ce soit la version aux

programmations des vélocités qui est plus dynamique par rapport à la version originale que

la version ayant été compressée latéralement. Encore une fois, les chiffres sont assez

constants d‘une version à une autre, de sorte qu‘il est difficile de tirer une conclusion claire.

Tableau 28 : Sonie intégrée LUFS (EBU + 18) selon la fréquence des résultats.

Tableau 29 : Sonie intégrée LUFS (EBU + 18) selon la fréquence des résultats (après compression)

Il semble qu‘après et avant la compression, les versions à « groove » avaient un

niveau de sonie plus élevé que la version standard. Dans les deux cas, il semble que c‘est la

version aux variations des vélocités qui ait le niveau de sonie le plus élevé, ce qui est assez

surprenant.

0

2

4

6

8

10

12

14

16

18

-3 -2 -1 0 1 2

Légende : « x » = v. de la version aux vélocités variées

« y » = v. de la version compressée latéralement.

x

y

0

5

10

15

20

25

-3 -2 -1 0 1 2

Légende : « x » = v. de la version aux vélocités variées

« y » = v. de la version compressée latéralement.

x

y

86

Écarts entre les Variations (« y » par rapport à « x ») : comparaison de la version

compressée latéralement par rapport à la version aux variations de vélocité

Tableau 30 : dB RMS intégrés selon la fréquence des résultats.

Tableau 31 : dB RMS intégrés selon la fréquence des résultats (Après compression)

En ce qui concerne le niveau des dB RMS intégré, les mesures indiquent que les

deux versions à « groove dynamique » occupent une place quasi-identique dans la bande-

passante digitale.

0

5

10

15

20

25

30

35

40

-0,6 -0,4 -0,2 0 0,2 0,4

0

5

10

15

20

25

30

35

-0,6 -0,4 -0,2 0 0,2 0,4

87

Tableau 32 : Gamme dynamique intégrée en dB FS selon la fréquence des résultats.

Tableau 33 : Gamme dynamique intégrée en dB FS selon la fréquence des résultats (après compression).

Pour la gamme dynamique intégrée, les deux versions à « groove » sont égales

entre-elles selon les mesures obtenues.

0

5

10

15

20

25

30

35

40

-1 0 1

0

5

10

15

20

25

30

35

40

-1 0 1

88

Tableau 34 : Sonie intégrée en LUFS (EBU + 18) selon la fréquence des résultats.

Tableau 35 : Sonie intégrée en LUFS (EBU + 18) selon la fréquence des résultats (après compression).

Encore une fois, les deux versions semblent presque égales entre-elles pour leur

niveau de sonie.

0

5

10

15

20

25

-1,3 -1 -0,7 -0,4 -0,1 0,2 0,5 0,8 1,2

0

2

4

6

8

10

12

14

16

-1,3 -1 -0,7 -0,4 -0,1 0,2 0,5 0,8 1,2

89

Conclusion

Portée des résultats

D‘abord, il nous faut mentionner que nous fournissons, en annexe, notre feuille de

calcul en format Excel, afin que le lecteur puisse vérifier nos affirmations. Ensuite et afin

d‘obtenir des résultats quantitatifs selon une méthodologie éclairée, nous avons

constamment eu recours à l‘aide critique d‘une étudiante en Actuariat pour répondre à nos

lacunes dans le domaine austère des nombres et des chiffres.

La compatibilité initiale des échantillons

La moyenne des écarts de nos mesures d‘avant-compression entre les différentes

versions et les différents types de mesures nous apprend qu‘il y a eu un écart moyen de :

0,1125 dB RMS pour les dB RMS intégrés, 0,375 dB pour la gamme dynamique intégrée et

-0,289 LUFS pour la Sonie intégrée. En moyenne absolue, cela équivaut respectivement à

des écarts de 0,481 dB, 0,538 dB et 0,796 LU. Il est à noter que l‘écart le plus grand, celui

de la mesure sonique, correspond à l‘outil de mesure le plus limité (car la sonie relève

d‘une expérience vécue). À notre avis, ces chiffres, combinés à notre écoute critique

démontrent la compatibilité à comparer initialement nos échantillons dans l‘optique

d‘obtenir une tendance sonique et dynamique générale entre les trois.

Représentativité de notre échantillon statistique et efficacité des mesures

Malgré ce que nous pouvions penser à l‘époque de notre cours collégial de

Méthodes quantitatives, nous nous rappelons que, afin d‘obtenir un échantillon significatif

statistiquement en sciences humaines représentatif de la population, il était demandé de

recueillir aléatoirement un échantillon d‘au moins 271 instances individuelles afin de

parvenir à une loi normale et à un écart-type qui avait théoriquement 95 % de chances de

représenter la population réelle avec un résultat près de ± 5 % du « vrai » résultat. Quoi

qu‘il en soit réellement du chiffre arbitraire « 271 », une valeur humaine loin d‘être

absolue, la plupart d‘entre nous concèdent l‘affirmation suivante : plus l‘échantillon

statistique est grand, plus l‘étude statistique est rigoureuse, pourvu que la méthodologie (la

90

méthode d‘échantillonnage, la neutralité des questions, etc.) soit sérieuse. Notre échantillon

est donc assez minime.

Toutefois, nous croyons qu‘il ne faut pas seulement considérer la grandeur de notre

échantillon selon une optique absolue où la quantité des données soutient notre savoir sur le

sujet étudié. Si nous regardons nos 40 échantillons selon leur structure (mesurés 240 fois

avec trois standards de mesure connexes différents et trois programmations différentes),

c‘est plutôt la logique interne et l‘angle d‘attaque de la question qui soutiennent notre

étude, quoiqu‘une plus grande quantité d‘échantillons à étudier n‘aurait certainement pas

nui.

En parlant de nuire, nous constatons de plus en plus des lacunes quant aux

nouveaux standards de mesure poussés par l‘AES et l‘EBU. Bien qu‘il s‘agisse de

standards industriels établis pour des fonctions particulières (notamment la normalisation

de la sonie des programmes télévisés) ne s‘appliquant peut-être pas à une pratique créative

se situant par essence en dehors des normes, nous avons observé que ces derniers ne

décrivent pas rigoureusement l‘expérience vécue de la sonie. Du moins, il est possible que

les outils que nous avons utilisés ne rendent pas justice à ces standards qu‘ils clament

pourtant respecter. Est-ce une simple stratégie de markéting pour pousser de nouveaux

produits « à avoir absolument » sur le marché? Il est possible que la réponse soit un

mélange de ces deux hypothèses.

Pourtant et selon notre écoute, les programmations aux « grooves dynamiques »

sont définitivement plus dynamiques que les programmations standard avant et après la

compression. Aussi, après la compression, les programmations aux « grooves » nous

semblent avoir un niveau de sonie aussi élevé (si non un peu plus) que les programmations

standard. Il s‘agit pour nous, à la lumière de notre écoute, de deux avantages sur une

programmation standard. La différence entre notre perception et le constat de nos mesures

s‘explique peut-être par le fait que l‘homme peut percevoir une incroyable variété de

timbres et de puissances sonores (de l‘ordre d‘un ratio de douze puissances de dix pour

un)65

, et ce, sans avoir à effectuer un quelconque changement physiologique entre les

différents degrés de puissances, comme cela est souvent le cas avec les appareils de mesure

65

Thomas D. Rossing, Springer Handbook of acoustics, 468.

91

électriques66

. De plus, et en ce qui concerne la différence de sonie perçue entre les versions,

cela est attribuable selon nous à la fluctuation des niveaux des cymbales-à-pied, qui ont une

forte présence dans des fréquences « facilement audibles », un fait décrit par les courbes

isosoniques traditionnelles67

. Si cette hypothèse est vraie, la programmation à effet de

« groove dynamique » sur les hautes percussions aurait un double avantage : une meilleure

dynamique et une sonie plus forte par rapport à une programmation standard.

Si nous comparons les deux programmations aux « grooves dynamiques », toujours

selon notre propre écoute, les deux nous paraissent stylistiquement différentes : celle

compressée latéralement nous semble avoir plus dansante pour son effet de « pompage » dû

à la compression latérale alors que celle aux vélocités programmées nous semble plus

naturelle sans l‘être entièrement. Malgré cela, nous sommes convaincus qu‘il est possible

de faire des compromis ou des mélanges entre ces deux pratiques pour obtenir le meilleur

des deux.

Quant aux chiffres et aux standards de mesure utilisés, c‘est là la partie décevante,

nous ne pouvons pas nous avancer sur aucune conclusion, car les données ne tendent pas

vers des différences significatives entre les pratiques. Il nous faudrait donc choisir une ou

plusieurs avenues, la plupart insatisfaisantes, parmi les suivantes :

a) Écraser moins les chansons pour les garder musicales.

b) Refaire une étude avec un échantillon plus étendu malgré le risque d‘utiliser de

nouveau les standards de mesures qui nous inquiètent.

c) Effectuer une étude subjective avec plusieurs personnes afin de déterminer si les

différences perçues dans notre recherche sont significatives, une démarche qui a ses

propres problèmes, comme le décrit très bien Kuttruff dans son ouvrage sur

l‘acoustique :

The only way to do this is by performing numerous time-consuming and delicate

experiments with test persons who are supposed to be cooperative and unbiased.

These persons are exposed to different acoustical stimuli which they are asked to

assess according to certain prescribed criteria. It is self-evident that results of such

tests are afflicted with strong fluctuations, and that only averaging over many single

66

Heinrich Kuttruff, Acoustics – An Introduction, 233. 67

David Howard et Jamie Angus, Acoustics and psychoacoustics, 92.

92

assessments leads to reliable results.68

d) Réaliser de la bonne musique et arrêter de perdre du temps avec le reste.

Sommaire

En somme, nous avons testé trois pratiques de programmation des percussions, afin

de tenter d‘observer une tendance quant à l‘avantage/l‘utilité d‘une pratique par rapport aux

autres. En faisant cela, nous souhaitons observer phénoménalement et quantitativement si

une pratique est meilleure pour conserver une gamme dynamique intéressante, tout en ayant

un niveau de sonie élevé, suite à un écrêtage agressif par un limiteur de manière à simuler

une des étapes de la pratique contemporaine du matriçage. Les trois pratiques que nous

avons mises à l‘épreuve sont les suivantes :

- Programmation « standard » sans variation de vélocités.

- Programmation avec variation de vélocités.

- Programmation avec variation dynamique par compression latérale.

Nous avons été en mesure d‘observer subjectivement des avantages dynamiques et

de niveau de sonie pour les versions ayant un effet de « groove dynamique » (variation des

vélocités et par compression latérale) par rapport aux versions « standard », mais il nous a

été impossible de confirmer nos observations par les données obtenues grâce aux

instruments de mesure disponibles. Nous décidons maintenant d‘arrêter d‘accorder de

l‘attention aux standards de mesure de la sonie de l‘AES et du EBU pour décrire la sonie

d‘une pièce de musique, car les résultats que nous obtenons ne sont ni cohérents avec notre

écoute ni linéaires entre eux. Nous allons adopter les pratiques aux effets de « groove

dynamique », mais nous comprenons qu‘il nous manque d‘appuis par des instruments de

mesure pour confirmer scientifiquement nos observations.

Nous pensons que, peu importe les conclusions de nos propres observations,

d‘espérer des changements mesurables à l‘étape du matriçage à la suite d‘opérations

subtiles aux étapes de la programmation des percussions et du design sonore est peut-être

une trop grande demande à faire à la technologie de mesure de la sonie. Par considération

pour cette pensée, nous continuons à notre dernier chapitre avec des mesures dynamiques

très globales et avec des analyses qualitatives (oui subjectives) avec l‘aide de notre mentor

audio Serges Samson dans l‘environnement contrôlé du LARC, le nouveau studio de

l‘Université Laval. Ces mesures et analyses porteront sur une méthode plus drastique et

significative pour l‘étape du matriçage : le mixage et le matriçage simultanés.

68

Heinrich Kuttruff, Acoustics – An Introduction, 239.

93

Chapitre 3 : Mixage et matriçage simultanés

Introduction

Pour parvenir à l‘idée de matricer et de mixer en même temps, il nous a fallu trois

années de tests sur nos propres réalisations musicales, dont plusieurs essais qui ont été plus

ou moins fructueux (les chapitres 1 et 2, par exemple). Nous croyons qu‘il y a assurément

des gens très compétents disposant de meilleurs outils que nous qui sont capables de

réaliser de très bons matriçages sur des pistes stéréo déjà mixées, mais il s‘agit de cas très

rares pour nous : avec de bonnes enceintes de travail, un endroit traité acoustiquement et un

amplificateur de classe « A », il n‘y a qu‘un seul album sur 50 qui nous semble

personnellement écoutable pour ses qualités techniques. Nous devons alors absolument ne

plus penser au mixage et au matriçage pour être en mesure d‘apprécier la musique; nous

sommes difficiles, nous en convenons. Nous croyons néanmoins que le matriçage, au sens

traditionnel du terme69

, n‘est pas le moyen le plus optimal pour obtenir un maximum de

contrôle sur la profondeur d‘un mix, arriver à un maximum de respect de l‘équilibre du mix

initial et parvenir à un maximum de dynamique (perçue et factuelle). À notre avis, le niveau

nécessaire de compression pour satisfaire les standards de la musique commerciale

« dance » est simplement trop élevé, et nous avons déjà énoncé plus haut les raisons de la

pertinence de la compression et le fait de tenter de minimiser ses inconvénients sans s‘y

soustraire. Il reste que matricer avec une compression agressive sur une piste stéréo pour

atteindre des niveaux élevés de sonie (nous avons observé 8 dB et moins de gamme

dynamique pour la majorité des nouvelles pistes de musique « dance ») altère

inévitablement d‘une manière ou d‘une autre le mix initial tel qu‘il est présenté à

l‘ingénieur avant le matriçage. Ces altérations incluent les suivantes :

1. La cohérence sonique. Il y a inévitablement des distorsions isolées qui ne sont

corrigibles que par un traitement global sur un mix stéréo tout entier. En écrasant les ondes

sonores (analogiques et numériques) contre la limite du « 0 » digital ou la limite du circuit

analogique, certaines ondes sont aplaties. Nous obtenons alors des ondes carrées,

harmoniquement plus riches et plus agressives, que celles du mix initial. Cela a pour effet 69

Dans ce dernier chapitre, nous examinons le matriçage comme une étape/moyen de parvenir à un résultat

musical ayant une forte sonie. Nous souhaitons simplement mentionner que nous sommes conscients que le

rôle de cette étape de postproduction peut être plus varié, comme de donner de la cohérence à un ensemble

d‘enregistrements (le plus souvent un album).

94

de causer des distorsions, d‘aplanir les transitoires et de créer un effet de « pompage » 70

.

Au fur et à mesure que les années passent, notre tolérance à ces artéfacts, de plus en plus

réguliers dans la musique que nous écoutons, est augmentée.

2. L’image du mix. Les niveaux des éléments de l‘« arrière-scène virtuelle »,

naturellement moins élevés, sont augmentés avec la compression. Ainsi, l‘équilibre des

niveaux des mix originels est altéré lorsqu‘une piste est agressivement compressée pour

satisfaire les standards commerciaux actuels. L‘augmentation des niveaux moyens des

crêtes a l‘effet fâcheux d‘exagérer la présence d‘éléments destinés à avoir des niveaux

faibles dans le mix initial. Concrètement, ce phénomène peut s‘observer lorsque le niveau

des réverbérations, des cymbales à pied, et des nappes est exagéré par la compression dans

la musique « dance ». En plus d‘altérer l‘équilibre d‘un mix, la compression sur une piste

stéréo aura pour conséquence d‘éliminer toute profondeur, ou du moins de l‘atténuer

considérablement.

3. La cohérence dynamique. Compresser un mix stéréo affecte la dynamique du mix

original. À moins d‘augmenter de manière significative le niveau des percussions, à des

niveaux exagérés dans le mix original, la compression d‘un mix stéréo a de grandes

chances de réduire l‘aspect percutant (punch) des percussions et d‘affecter l‘équilibre de

celles-ci sur le mix matricé. En augmentant le niveau moyen des crêtes, les mix ont

tendance à être moins percutants, car ils perdent la quantité de temps de silence entre

chaque coup de grosse caisse et de caisse claire. Parfois, et particulièrement lorsqu‘un

niveau élevé de sonie est requis, les sections instrumentales finissent par avoir un niveau de

sonie exagéré par rapport aux percussions. Lorsque cela se produit, l‘auditeur entend à

peine les percussions s‘il écoute la chanson très compressée à un niveau normal71

.

Finalement, en augmentant le niveau moyen des crêtes, une chanson perd sa gamme

dynamique, une fâcheuse conséquence qu‘il est possible d‘observer dans certains mix dont

les niveaux sont aussi élevés que les refrains. Ce problème peut être évité en utilisant des

quantités différentes de compression sur chaque partie d‘une chanson, même s‘il arrive très

souvent que les ingénieurs en matriçage ne se donnent pas cette peine (cela est également le

cas pour les artistes à grand succès). Enfin, même si nous compressons une chanson à

70

Izhaki Roey, Mixing audio, Concepts, Practices and Tools, 16. 71

Mike Senior, Mixing secrets for the small studio, p. 279.

95

différents niveaux pour chacune de ses parties, il n‘en demeure pas moins que l‘équilibre

du mix final par rapport au mix d‘origine sera altéré à l‘intérieur du mix.

Certains réagiront en argumentant que ce sont les mauvaises habitudes actuelles de

surcompression qui sont en cause. Nous pensons que ce contre argument est en partie vrai.

Cependant, avant de prendre une décision définitive sur le sujet, il faudrait considérer

l‘argument suivant. Il est vrai qu‘en ne recherchant pas des niveaux élevés de compression,

nous évitons la plupart des distorsions (à l‘exception de celles lors de la prise de son). Il est

également vrai qu‘une forte compression pour des niveaux de sonie élevés est certainement

responsable du dommage causé à la cohérence sonique, à l‘image à la dynamique d‘un mix.

Cependant, nous croyons, avec Tischmeyer, qui définit des gammes dynamiques à viser en

fonction des styles musicaux72, que la compression demeure pertinente dans certains genres

de musique, comme la musique électronique « dance », puisque ce sont des genres qui

fonctionnent bien avec des niveaux élevés de sonie. Nous voulons simplement atteindre la

sonie souhaitée sans les distorsions et sans la destruction de la dynamique et de l‘équilibre

du mix initial ou idéal de l‘artiste. Nous croyons être en mesure de parvenir à des résultats

intéressants en ne considérant pas le matriçage (en tant qu‘étape où nous obtenons un

niveau de sonie élevé) comme une étape séparée du reste du processus de réalisation.

Mixer et matricer en même temps

Cette méthode s‘appuie sur l‘idée de travailler avec la compression au lieu de

travailler contre elle. Le but de cette pratique est d‘avoir un maximum de contrôle sur la

manière dont le compresseur affecte inévitablement le mix. Hepworth-Sawyer (From Demo

to Delivery : The process of production, 2009) ouvre déjà la porte à un chevauchement

important entre les étapes traditionnelles de production. Toutefois, l‘auteur continue de

séparer complétement le matriçage des étapes précédentes, lesquelles peuvent aisément se

chevaucher. Comme nous l‘avons déjà mentionné, notre méthode consiste à intégrer et à

distribuer le matriçage, en tant que une étape permettant l‘obtention d‘une sonie élevée, sur

l‘ensemble des grandes étapes de la production phonographique. Pour un mixage-

matriçage, il s‘agit d‘avoir un maximum de contrôle sur les distorsions et la balance qu‘il y

72

Pleasurize Music Foundation, web.

96

a dans un mix. Nous ne souhaitons pas abolir le matriçage traditionnel ou voler le travail de

qui que ce soit; de toute façon, nous n‘avons pas un tel pouvoir. Nous croyons toutefois

qu‘il est impossible de maintenir l‘équilibre initial d‘un mix lorsqu‘il y a un matriçage

traditionnel avec une forte compression, même si le matriçage traditionnel sur une piste

stéréo a toujours fonctionné et qu‘il est habituellement agréable à entendre dans des

occasions d‘écoute normales ou non-audiophiles. Il reste néanmoins qu‘un changement

dans la dynamique d‘un mix résultera toujours à un changement de son équilibre. Lorsque

les dynamiques d‘un mix sont affectées d‘une manière légère au matriçage (c‘est le cas

traditionnellement avec la musique classique, où on tente de reproduire un événement

acoustique le plus fidèlement possible73

), le changement peut être très subtil et même

indétectable. Nous maintenons seulement que le matriçage traditionnel est loin d‘être la

solution optimale pour maintenir la balance d‘un mix lourdement compressé, comme cela

est souvent le cas avec la musique électronique « dance », qui peut subir de lourdes

réductions de gain allant jusqu‘à 13 dB, et nous proposons d‘examiner cette hypothèse en

faisant deux études de cas, soit l‘analyse de pièces de notre projet de musique électronique

dansante (8 pièces de notre album Dragos-Something about being a man [2013]) et

l‘analyse de pièces de notre projet de musique hip-hop nommé Careful (2013). Ces pièces

sont fournies avec le mémoire.

Premièrement, nous suggérons d‘utiliser une réduction dynamique légère sur le bus

maitre avec une légère augmentation du gain (3-4 dB) et un limiteur visant à prévenir le

« clipping ». La compression sur le bus maitre n‘est pas nécessaire, mais elle permet de

fixer/donner une cohésion au mix tout entier; notre méthode consiste surtout à appliquer la

compression sur chaque piste séparément. Nous suggérons de laisser de l‘espace entre le

seuil du limiteur et le 0 dBFS (pour notre album Something about being a man [2013] nous

avons fixé une limite entre -0,7 et -0,8 dB FS), car une faible marge entre le signal et la

limite de la bande passante digitale est presque toujours corrélative à une présence de

distorsions74

. En prévision de la conversion mp3, qui diminue inévitablement cet espace, il

est également souhaitable et prudent de laisser plus de headroom que les formats non

compressés en requièrent (< 0 dB FS) pour éviter l‘effet que Thomas Lund nomme « space 73

David Moulton, Total recording, 403. 74

Ibid., 146.

97

monkeys », un artéfact indésirable qui ressemble à l‘émission d‘un son sous l‘eau (surtout

avec les formats de diffusion internet : autour de 128 kb/s)75

. La faible fraction de

dynamique et de sonie qui est perdue en retranchant presque 1 dB est assez négligeable,

lorsque comparée avec la qualité gagnée après la compression au format mp3. En d‘autres

mots, l‘important à retenir est qu‘un type de réduction dynamique est nécessaire avant de

commencer le mix et avant de commencer à traiter individuellement chaque piste avec des

effets. En faisant cela, l‘ingénieur audio sera en mesure d‘entendre les artéfacts indésirables

de la compression dès le début du processus du mixage. Une fois que les artéfacts (comme

la « boue » et les distorsions) sont audibles, il est possible de les éliminer localement avec

des égaliseurs ou tout autre outil de son choix, tout en étant capable de garder l‘équilibre

désiré du mix. Après avoir traité les hernies sonores et avoir équilibré tous les niveaux,

incluant ceux des envois auxiliaires, il sera possible da parvenir à un résultat ayant de la

profondeur en laissant certains éléments dans l‘arrière-scène virtuelle (par une diminution

de leur gain) tout en ayant des pistes extrêmement compressées. Ceci devrait régler les

questions de l‘équilibre dynamique et sonique entre les éléments instrumentaux et l‘atteinte

de l‘image visée pour le mix. Pour régler le problème de l‘équilibre entre les différentes

parties de la chanson, il y a plusieurs solutions. Nous pouvons soit programmer des

automatisations pour les niveaux de gain des pistes de chaque instrument76

ou programmer

des automatisations sur un contrôle de gain global (le niveau d‘entrée du limiteur sur le bus

maitre, par exemple). Écrire des automatisations peut, toutefois, générer de la confusion

(spécialement s‘il y en a beaucoup et si on prévoit changer les niveaux par la suite). Une

autre solution consiste à dupliquer les pistes instrumentales afin d‘avoir, par exemple, une

piste instrumentale pour l‘introduction et d‘autres pour la conclusion et les refrains. De

cette manière, on peut simplement assigner un contrôle de gain de piste différent pour

chacune d‘entre elles. Avec les nouveaux ordinateurs, le souci pour la limite des ressources

en CPU tend de plus en plus à être une chose du passé.

75

Thomas Lund, Loudness wars, web. 76

Bob Katz, Mastering Audio; 114.

98

Analyse critique de cette méthode

Certains ont critiqué cette manière de faire, notamment lors de notre présentation de

cette méthode au Art of record production de l‘année 2013. Un premier argument peut être

formulé comme suit :

Argument 1 : L‘étape du matriçage doit être séparée de l‘étape du mixage. Nous

engageons un ingénieur en matriçage afin d‘obtenir une deuxième perspective sur

nos propres mix. L‘ingénieur en matriçage, avec son expérience et sa vue

d‘ensemble, saura mieux ce qui est bon pour notre propre musique : le point de vue

orienté de l‘artiste ne permet pas de faire les deux.

Nous croyons que cet argument est en partie fondé, quoiqu‘il soit, selon nous,

coupable du sophisme du « faux dilemme ». Bien sûr, le fait d‘avoir une deuxième

perspective sur tout ce que nous entreprenons dans la vie peut être bénéfique. Nous ne

pensons pas, toutefois, qu‘il est absolument nécessaire de séparer le mixage du matriçage

pour être en mesure de se permettre le luxe d‘avoir de bons conseils. Autrement dit, tant

qu‘à pouvoir obtenir un second avis, pourquoi pas sur tous les aspects de la production?

Ainsi, le travail en équipe n‘est pas obligatoirement exclu par cette méthode.

Argument 2 : Le mélange de l‘aspect créatif avec l‘aspect technique aura

probablement une incidence négative sur un des aspects, voire même sur les deux.

Pour avoir du succès dans ces deux domaines, il faut probablement être très discipliné et

expérimenté. Cependant, nous ne croyons pas que la difficulté d‘une quête est une

condition nécessaire et suffisante pour nous empêcher d‘y aspirer. Par analogie, nous ne

croyons pas que la difficulté (peut-être même l‘impossibilité) de parvenir à la paix dans le

monde est une raison suffisante pour ne pas y aspirer. Il s‘agit également d‘une question de

préférences et d‘aptitudes pour le musicien réalisateur : il peut choisir s‘il aime

suffisamment ou non les aspects techniques du son pour s‘y essayer. En ce qui nous

concerne, la réponse est « oui ».

Argument 3 : En mixant et en matriçant simultanément une chanson, il sera très

difficile de donner une cohérence sonique et dynamique à un groupe de chansons à

paraitre sur un seul et même album.

Pour nous, la cohérence d‘un album est presque entièrement un facteur relatif à la

composition des pièces musicales et moins un facteur relatif au travail de l‘ingénieur en

matriçage (même si ce dernier est extraordinaire). Si nous ne parlons que pour nous-

99

mêmes, nous affirmons que la cohérence (ou la non-cohérence) de nos propres réalisations

musicales dépend de notre propre processus de réalisation et du style de nos pièces (qui

sont habituellement assez uniforme pour un même album). Pour nous, ce fait règle la

question de la cohérence sonique de l‘album, quoique cela ne s‘applique pas à un album

réalisé par plusieurs personnes, telles des compilations, qui ne sont pas inclus dans la portée

de la présente recherche, davantage destinée aux compositeurs réalisateurs qu‘aux

techniciens en mixage qui ont des clients divers. En ce qui concerne la cohérence

dynamique et du niveau de sonie d‘un album, nous considérons la question assez simple.

Nous nous fixons une limite de référence en prenant une chanson de qualité moyenne de

l‘album pour la compresser jusqu‘au seuil de perte de la qualité sonore. Nous visons alors

le niveau de sonie obtenu pour les autres pièces de l‘album. Il est également important

d‘utiliser un bon outil de mesure comme un VU mètre analogique. Nous utilisons

personnellement le TT Dynamic Range Meter, que nous avons également utilisé aux

chapitres 1 et 2 et qui nous permet de garder des niveaux constants pour la réalisation de

notre album. Bien qu‘il ne s‘agisse pas d‘un outil de mesure de la sonie, celui-ci peut

parfaitement remplir cet office en raison du fait que la plupart des bons albums ont déjà une

cohérence stylistique et que le processus de mixage est, la plupart du temps, réalisé par une

même personne, qui utilise des techniques similaires au cours du même album. Comparer

des chansons aux mix et à la réalisation similaires en termes de marge dynamique pour

avoir une bonne approximation du niveau de sonie des pièces est alors tout à fait logique et

cohérent. Finalement, il reste qu‘en fin de compte nous faisons confiance à notre écoute

pour nos décisions finales.

Argument 4 : Vous affirmez que votre méthode est avantageuse puisqu‘elle vous

permet de parvenir à un mix au niveau de sonie élevée qui est fidèle à la balance

initiale du mix original. Il n‘y a, toutefois, aucun mix initial dans la méthode du

mixage-matriçage. Comment pouvez-vous alors comparer et évaluer la qualité de

votre mix final par rapport à un mix initial?

Cette objection présuppose une séparation entre les étapes du matriçage et du mixage.

Comme nous l‘avons déjà vu, notre méthode aborde le processus de réalisation comme un

tout organique. Cette objection est donc de forme sémantique, puisqu‘elle joue avec la

définition des mots et pose la mauvaise question. Lorsqu‘un musicien réalisateur fait un

mix, nous ne lui demandons pas de le comparer concrètement à son idéal d‘un mix bien

100

équilibré (l‘objectif qu‘il vise). Nous présupposons qu‘il a essayé de son mieux d‘atteindre

le meilleur avec les possibilités offertes par ses outils, ses capacités et ses goûts personnels.

Une personne qui adopte la méthode proposée tentera de parvenir à sa conception d‘un bon

mix (idéal). Il obtiendra alors un mix au niveau de sonie élevée fidèle à ce dernier. Nous

obtenons alors un mix au niveau de sonie élevé fidèle à ce que nous croyons (à tort ou à

raison) être le meilleur que nous pouvons faire dans le cadre de nos objectifs. À notre avis,

le recours au matriçage traditionnel ne permet pas d‘atteindre d‘aussi bons résultats,

puisque la méthode préconisée dans ce mémoire permet d‘avoir plus de contrôle sur chaque

instrument, chacun faisant l‘objet d‘une lourde compression. Pour nous, le recours à la

méthode traditionnelle ouvre la voie à plus d‘éléments non intentionnels et au hasard en

réalisation audionumérique (dépendant, par exemple, de qui fera le matriçage), alors que

nous cherchons plutôt un maximum du contrôle, sans pour autant se fermer au travail en

équipe ou à la réception de bons conseils.

Écoute critique des pistes ayant été mixées/matricées

Cette section est consacrée à l‘écoute critique des pièces que nous avons

mixées/matricées au cours de l‘été-automne 2013. L‘écoute a été réalisée au LARC,

l‘endroit où les pièces ont été également réalisées, un studio professionnellement traité,

avec un amplificateur de classe « A » et différents types d‘enceintes acoustiques

professionnelles avec l‘expérimenté ingénieur de son Serges Samson. Le format d‘écoute

de nos pistes et de celles auxquelles nous nous comparons est le mp3 320 kb/s, pour

simuler le résultat final et compressé tel qu‘écouté par la plupart des auditeurs. Le mot

d‘ordre a été de trouver des défauts aux pièces au point de vue des mix et du matriçage, et

nous avons été très sévères, car le système et la salle utilisés nous l‘ont permis. En somme,

moins il y a de commentaires sur une chanson, mieux c‘est. Nous n‘avons pas spécifié à

monsieur Samson que nous souhaitions particulièrement éprouver notre méthode de

mixage/matriçage, pour ne pas orienter son écoute.

Si nous synthétisons l‘ensemble des constats, nous avons surtout repéré des défauts

attribuables aux prises de son et à notre manque d‘expérience dans le mixage de certaines

101

pièces, sans parvenir à un constat qui pourrait réfuter la pertinence d‘avoir mixé et matricé

les pièces musicales en même temps. Le niveau de sonie est demeuré très constant pour nos

deux projets de styles différents. Notre plus récent album de musique électronique,

Something about being a man, qui a été mixé et matricé lentement dans une régie du LARC

durant l‘automne 2013, est comparable en qualité, et parfois supérieur, à des productions

ayant une qualité élevée (un tableau de mesures comparatives est donné quelques pages

plus loin). Les pièces de notre projet hip-hop nommé Careful, qui ont été réalisées dans

notre studio maison durant l‘automne 2013, sont comparables à des productions de bonne

qualité dans le style hip-hop sombre et planant, où une clarté de l‘image stéréophonique et

une présence profondeur n‘étaient pas visées. En ce qui concerne les résultats de l‘écoute

critique de notre album de musique électronique dansante, ce dernier dépasse tous les

albums de musique électronique en termes de dynamique et de profondeur, et nous avons

choisi de nous comparer aux productions que nous jugeons être de la meilleure qualité et du

meilleur professionnalisme, comme celles de Daft Punk (matricés par la légende Bob

Ludwig et Antoine Chabert en 2013), de James Blake (BBC sound of 2011) et de

Disclosure (Billboard UK no 2 en 2013), des groupes de musique électronique dansante qui

ont figuré au sommet des palmarès de popularité des dernières années et qui font partie du

Tableau 35 : Comparaisons de gamme dynamique et niveau maximum, quelques pages plus

loin. De plus, lorsque nous avons comparé notre album en termes de niveau de sonie à

d‘autres pièces relativement dynamiques de styles similaires, notre album égalait ou

dépassait en niveau de sonie ses compétiteurs. Nous pouvons affirmer que la qualité de

Something about being a man est supérieure en termes de définition, de dynamique et de

profondeur à la plupart de ses compétiteurs. En ce qui concerne, nous croyons être parvenus

à ce résultat grâce au contrôle maximal des artéfacts de la compression que la méthode du

mixage/matriçage nous a permis et grâce à la précision d‘écoute rendue possible par notre

passage au LARC (Laboratoire audionumérique de recherche et de création), équipé d‘une

console de mixage SSL 4000 et de moniteurs Adam S7K MK II, et à l‘avis professionnel et

académique de son ingénieur, Serges Samson77

.

77

Idéalement, il faudrait procéder à des tests de perception avec un public, afin de soutenir nos observations.

Toutefois et comme il s‘agit d‘un projet de recherche-création visant d‘abord notre propre satisfaction, un tel

test serait en-dehors des limites de ce mémoire.

102

Plongeons maintenant dans le vif du sujet en procédant à une écoute subjective et

critique de nos propres pièces, pour ensuite les mesurer et les comparer à d‘autres pièces

leur étant stylistiquement comparables.

Dragos, Something about being a man

Figure 100 : Pochette de Something about being a man

Cet album a été entièrement réalisé numériquement avec des plugiciels (plug-ins)

répliquant des sons de synthétiseurs analogiques classiques des années 1970-1980, comme

les populaires Jupiter, Juno, Prophet, Moog et Korg. Nous voulions que l‘album soit

agréable à entendre, autant comme un arrière-plan auditif pour une soirée entre amis que

pour une écoute attentive et analytique des instruments et des paroles. Le titre vient du fait

que nous avons tenté de dépeindre diverses facettes de l‘affect et de la raison chez l‘homme

(un exemple d‘hommerie), mais il s‘agit également d‘une instance d‘un homme (nous-

mêmes), d‘où le fait que le mot « being » soit estompé sur la pochette, suggérant ainsi cet

autre titre, Something about a man – Dragos. L‘un des objectifs était d‘obtenir un album

qui sonne bien tant dans des systèmes de très haute qualité que de très basse qualité. Sur le

plan de la sonie et de la dynamique, nous visions une performance équivalente à celle de

l‘album Discovery des Daft Punk (2001) (que nous avons bien dépassée). À notre avis, ces

objectifs ont été atteints ainsi que les objectifs faisant partie du cadre de notre maitrise, et

103

plus particulièrement de ce chapitre (surtout en tenant compte des très rapides progrès que

nous avons faits dans l‘année 2013).

Nous croyons toutefois que l‘album a manqué cruellement d‘un bon microphone et

d‘un bon préamplificateur pour les voix. Nous n‘avons travaillé qu‘avec des Sure SM57 et

SM58 directement dans les préamplificateurs de nos convertisseurs, ce qui a fonctionné

relativement bien pour des instruments, mais moins bien pour des voix. Il s‘agit d‘un

minimum extrêmement bas pour bien fonctionner, car en plus de travailler avec une basse

qualité à la source, nous devons inévitablement en perdre davantage avec la compression.

Très honnêtement, nous ne nous servons pas de l‘excuse classique selon laquelle il nous

aurait absolument fallu travailler avec des préamplificateurs Neve et des microphones U87

pour parvenir aux mêmes résultats que les groupes que nous aimons, car nous croyons qu‘il

est possible d‘arriver à d‘excellentes productions avec de l‘équipement d‘entrée de gamme.

Nous sommes néanmoins d‘avis que cela nous aurait grandement facilité la tâche que de

pouvoir enregistrer avec un bon microphone. Notre équipement d‘écoute était constitué

d‘un convertisseur Apogee Duet, d‘un amplificateur Bryston 2B (100W de classe AB) et de

moniteurs JBL L150. Le petit amplificateur n‘était peut-être pas optimal pour faire

fonctionner les massives JBL : après notre écoute au LARC nous avons constaté que nous

aurions pu sacrifier 2 dB dans les graves en échange d‘un peu plus de sonie, ce qui nous fait

croire que le Bryston avait peut-être de la difficulté à rendre toutes les graves réelles de nos

chansons. Au final, pour certains critiques, il s‘agit tout de même de « l‘un des albums

électro les mieux produits de toute l‘histoire du genre à Québec »78

. Voyons maintenant de

plus près chacune des pièces de l‘album, qui sont fournies avec le mémoire.

1. « Elegance and grace », ft. Rémi (coréalisé avec Jessy Caron)

Les synthétiseurs sont d‘une meilleure qualité que la voix, laquelle sonne comme

ayant été enregistrée avec un préamplificateur de piètre qualité. La voix prend une place

très carrée dans l‘image stéréophonique et dans la profondeur. Il y aurait fallu un meilleur

microphone pour la voix; il croit que nous n‘aurions pas pu faire mieux avec le SM58. Les

78

Genest Catherine, « Bye Bye 2013, version locale et sans Véronique Cloutier », Journal Voir, 11 décembre

2013, web.

104

guitares sonnent mieux que la quatrième chanson de l‘album (« Guest »), en raison de la

plus courte durée des notes. La dynamique est bien travaillée et le niveau de sonie est bon.

2. « Caring sphere » ft. Amélie et Thierry

La dynamique et le niveau de sonie entrent les standards habituels pour la musique

de ce genre (voir le Tableau 35 des mesures comparatives quelques pages plus loin). Les

voix sonnent mieux que la moyenne des autres chansons sur le reste de l‘album. L‘équilibre

des mix est bon et il y a de la profondeur.

3. « Sea people »

Le mix est super large, tant en hauteur qu‘en largeur; bon mélange de fréquences,

bonne profondeur pour un plugiciel. La prise de son du violoncelle sonne bien, la sonie de

la chanson est cohérente avec celle des autres et les différentes sections présentent des

variations dynamiques intéressantes.

4. « Guest » ft. Odile (coréalisé avec Jessy Caron)

La voix n‘est pas autant à la hauteur que le reste. Il y a trop d‘information pour la

quantité de compression appliquée à la chanson, un compromis sur la qualité que nous

avons dû faire pour que la chanson soit au même niveau de sonie que le reste de l‘album. Il

n‘y a pas suffisamment d‘espace entre les instruments. Le son n‘est pas assez découpé en

petits ilots dans l‘image stéréophonique. La basse prend beaucoup de place (toute la place).

Il y a matière à enlever des moyennes basses sur la guitare. Le niveau de sonie est bon.

5. « Sly Lust fig. 2 » ft. Gabrielle

Il n‘y aurait pas fallu que nous mixions cette basse et cette grosse caisse ensemble

dans le centre. Dès que la basse embarque, on perd la présence de la grosse caisse. Il y a

une fréquence dans les très graves qui flotte et qu‘on n‘entend que sur les gros moniteurs

Adam. La chanson n‘est pas assez large : elle donne l‘impression d‘être monophonique.

Elle est bourrée, mais sonne aussi loud que les autres chansons quoiqu‘elle ait un bon 2 dB

de moins au VU sur la SSL. La basse est beaucoup trop percussive pour l‘ensemble : si

nous voulions une basse aussi percussive, il y aurait fallu que nous composions autour. Le

105

niveau de sonie est bon. La qualité de la voix est basse, car sa hauteur a été diminuée après-

coup de deux tons avec la fonction de hauteur de base de Ableton Live 8.

6. « Friend » ft. Odile

La voix aurait pu être d‘une qualité supérieure. La chanson est beaucoup axée vers

les 400-600 Hz, ce qui comble beaucoup le centre, sans être nécessairement un défaut. La

dynamique et la profondeur sont bonnes. Le niveau de sonie est bon.

7. « A place to be » ft. Thierry

La chanson est large en hauteur et en largeur, partiellement à cause du petit bruit de

vinyle. La voix d‘accompagnement dans la réverbération ajoute énormément à l‘image

stéréophonique. Le mélange d‘effets sur la voix (chorus reverb) camoufle bien ses défauts.

La chanson a le niveau de sonie le plus élevé de l‘album.

8. « Hydrovince »

La qualité sonore est déséquilibrée. On dirait qu‘il y a du MP3 de piètre qualité

mélangé avec du bon mp3. Les hautes sont assez agressives, ce qui enlève de la profondeur.

Le fond est moins transparent, de sorte que même si elle est plus large en réalité que Sea

People, par exemple, elle sonne quand même moins large.

En somme, l‘abum Something about being a man est, pour nous, une réussite en

termes de qualité : de manière absolue et par comparaison à d‘autres albums (dans les pages

qui suivent nous procédons à des mesures comparatives) ainsi que par comparaison à notre

propre progression technique, les résultats liés à l‘utilisation de la technique de mixage-

matriçage sont prometteurs, malgré le fait que nous ayons repéré plusieurs lacunes dans la

profondeur, dans la distribution de l‘image stéréophonique et dans l‘agressivité des voix.

Tentons de voir si des résultats comparables peuvent être obtenus avec un autre style

musical. Dans la section qui suit, nous proposons un exercice identique avec l‘analyse de

trois chansons de musique hip-hop réalisées par nous-mêmes dans le cadre de notre projet

nommé Careful.

106

Careful

Figure 101 : un logo de Careful

Careful est le nom de notre projet hip-hop (coréalisé avec Vincent Laquerre) à partir

d‘échantillons granuleux, similaire aux sons pouvant être entendus sur de vieux vinyles

poussiéreux de Jazz et de Funk, dont certains échantillons sont d‘ailleurs tirés. Les trois

chansons que nous présentons ont été réalisées durant l‘automne 2013 dans notre studio

maison, traité acoustiquement, mais non professionnellement. L‘environnement de

réalisation n‘était donc pas autant optimal que celui du LARC, quoique, comme nous

l‘avons mentionné plus tôt, la clarté et la précision de l‘image stéréo et de la profondeur de

Something about being a man n‘était pas visée. Notre équipement d‘écoute était de

nouveau constitué d‘un convertisseur Apogee Duet, d‘un amplificateur Bryston 2B, un

amplificateur 100W de classe AB et de moniteurs JBL L150. Nous n‘avons, cependant, pas

rencontré le même problème des graves excessives : par prudence et par méfiance envers

notre environnement de travail (celui de notre studio maison), nous avons élevé plus de

graves que pour l‘album de musique électronique. Ainsi, un filtre passe-haut de 24 dB par

octave a été appliqué à 50 Hz pour toutes les pièces du projet « Careful », ce qui nous a

également permis, en libérant la bande passante disponible, d‘obtenir une sonie plus élevée

que Something about being a man.

107

En somme, l‘approche des mix et de la réalisation est très différente de celle de note

projet de musique électronique : nous avons tenté de répliquer les sons sombres des

groupes hip-hop instrumentaux comme Pete Rock et FloFilz, qui semblent être constitués

de vieux échantillons « basse-résolution » des anciens « drum machine » MPC (lesquels

n‘offraient pas encore une résolution minimale de 16 bits à 44.1 kHz).

1. Prism

Le mix est bien rempli dans les fréquences moyennes graves (80-600 Hz) et le

niveau de sonie est élevé. La définition, notamment des percussions, est plus basse que

celle de notre projet de musique électronique.

2. Rien de trop

Idem. La contrebasse et le saxophone (échantillons tirés d‘enregistrements Jazz

effectués au LARC) sonnent bien.

3. Yes ft. Gabrielle

Le mix a été trop travaillé, il n‘y a plus de gras et de chaleur (autour de 200-600 Hz)

et il y a un creux dans la région spectrale des hautes (autour de 1.2 kHz). Le niveau de

sonie bon. La chanson aurait pu être globalement plus sombre (moins de 7 kHz et plus) afin

d‘être plus cohérente, au point de vue spectral, que les deux autres chansons.

Au final, nous avons mixé-matricé trois chansons seules (singles) parues durant

l‘automne 2013, mais qui ne figurent sur aucun album pour le moment, ce qui peut fournir

une excuse (mince) pour le manque de cohérence spectrale pour la chanson « Yes » par

rapport aux deux autres. Le niveau de sonie des mix, qui sont fournis avec le mémoire, est

plus élevé que pour ceux de notre projet de musique électronique. La définition, la

profondeur et la distribution des éléments sur le champ stéréophonique aurait pu être

globalement meilleure, notamment en travaillant avec des échantillons de plus grande

qualité.

108

Mesures comparatives des chansons mixées/matricées

Prenons maintenant le temps d‘effectuer quelques mesures globales de nos

chansons mixées/matricées et comparons-les à un répertoire de quelques chansons

similaires pour avoir une référence. Le terme « clip » dans a colonne « Niveau maximum »

signifie que le signal audio du fichier a été écrêté, soit que l‘amplitude maximale a dépassé

le niveau de 0 dBFS (dans le domaine numérique, il est impossible de connaître de combien

le signal dépasse le 0 dBFS). Encore une fois, nous mesurons les fichiers en format mp3

320 kb/s à l‘aide du TT Dynamic Range Meter Offline, qui permet de mesurer la gamme

dynamique intégrée ainsi que le niveau maximal par piste (gauche/droite) pour une

meilleure précision.

Tableau 36 : Comparaisons de gamme dynamique et niveau maximum

Artiste Titre Année Gamme

dynamique

(dB)

Niveau

maximum

(peak)

gauche/droite

Daft Punk « Human after all » (2005) 2005 6 clip/clip

Daft Punk « One more time » (2001) 2001 9 clip/clip

Daft Punk « Da Funk » (1996) 1996 9 clip/clip

Daft Punk « Veridis Quo » (2001) 2001 11 clip/clip

Daft Punk « Face to Face » (2001) 2001 10 clip/clip

Daft Punk « Too long » (2001) 2001 9 clip/clip

James Blake « Retrograde » (2013) 2013 7 clip/clip

James Blake « Wilhelms Scream » (2012) 2012 5 clip/clip

Hot Chip « Flutes » (2012) 2012 5 clip/clip

Pete Rock « What you wainting for » (2001) 2001 10 clip/clip

Artful Dodger « Please don‘t turn me on » (Disclosure

Remix) (2013)

2013 6 clip/clip

Amirali « Hear Me » (2013) 2013 7 clip/clip

Chris Malinchak « So Good To Me » (2012) 2012 9 clip/clip

Friendly Fires « Paris » (Aeroplane Remix) (2009) 2009 7 clip/clip

Klangkarussel « Sonnentanz » (2012) 2012 6 clip/clip

Moon Boots « No one » (2013) 2013 7 clip/clip

The Jazzual

Suspects

« This beat » (2008) 2008 13 clip/clip

Dragos & Jessy « Elegance and grace » ft. Rémi (2013) 2013 7 clip/clip

Dragos « Caring sphere » ft. Amélie & Thierry

(2013)

2013 7 — 0,32/-0,22

Dragos « Sea people » (2013) 2013 8 clip/-0,51

Dragos & Jessy « Guest » ft. Odile (2013) 2013 6 -0,30/-0,43

Dragos « Sly lust fig. 2 » (2013) 2013 6 -0,20/clip

Dragos « Friend » ft. Odile (2013) 2013 6 -0,01/-0,14

Dragos « A place to be » ft. Thierry (2013) 2013 6 -0,40/-0,07

Dragos « Hydrovince » (2013) 2013 7 -0,18/-0,05

Careful « Prism » (2013) 2013 7 -0,32/-0,26

Careful « Rien de trop » (2013) 2013 7 -0,37/-0,49

Careful « Yes » ft. Gabrielle (2013) 2013 8 -2,21/-1,82

109

Comme ces mesures ont lieu dans le domaine numérique, les conditions d‘écoutes

dans différents environnements d‘écoute ne peuvent avoir d‘incidence sur celles-ci. Il est

intéressant de noter que la plupart de nos chansons n‘écrêtent pas, et que certaines ont un

maximum aussi bas que -2.20 dBFS, des maximums comparables aux chansons des

années 1990. Si nous avions effectué les mêmes mesures avec des fichiers décompressés

wav, nos chansons auraient atteint un maximum de -0,70 dBFS, une limite que nous avons

donnée à tous nos limiteurs sur les bus maitres. Une fois qu‘il y a conversion au

format mp3, nous voyons que cette limite s‘approche dangereusement du 0 dBFS et génère

même de l‘écrêtage, comme cela a été le cas pour tous nos morceaux de référence (et pour

toutes les chansons de format mp3 que nous avons mesurées, à l‘exception des nôtres).

L‘avantage d‘avoir des crêtes maximales à des niveaux aussi faibles est que cela diminue

les distorsions causées l‘équipement de lecture audio, surtout lorsqu‘il s‘agit d‘équipement

de qualité consommateur et de formats compressés comme le mp379

. Les transitoires

rapides et les hautes fréquences de nos chansons sont généralement plus doux et mieux

définis. Un autre élément intéressant à noter est que nos gammes dynamiques sont assez

faibles, même si à l‘écoute nos chansons paraissent très dynamiques par rapport aux

productions commerciales. Il semble que nous ayons réussi à créer une illusion de

profondeur et de dynamique, même si, dans les faits, notre gamme dynamique est toute

aussi étroite que la plupart des enregistrements commerciaux.

Finalement, le style d‘une pièce est un facteur déterminant dans le caractère

dynamique, et donc dans la gamme dynamique, d‘une pièce : par exemple, une pièce plus

lente risque d‘avoir plus de silence entre ses percussions et donc d‘être plus dynamique...

Le fait que nous ayons mixé et matricé en même temps nos chansons n‘a eu que peu d‘effet

sur le caractère (dynamique ou pas) de nos chansons. Il semble que la dynamique des

chansons, autant les nôtres que celles des autres artistes figurant dans le Tableau 35, est un

facteur qui découle surtout des choix esthétiques des artistes, ce qui nous laisse croire qu‘il

nous faudrait avoir une vision encore plus organique et encore plus englobante de tout le

processus de création et de réalisation pour bien décrire la dynamique et le niveau sonique

d‘une pièce musicale.

79

Thomas Lund, « Loudness Wars », web.

110

Sommaire

Dans ce chapitre, nous avons proposé une méthode consistant à mixer et à matricer

en même temps pour conserver un maximum de contrôle sur les aspects de dynamique, de

sonie et d‘image stéréophonique d‘un mix sans trop altérer le résultat créatif. Pour nous, il

s‘agit d‘un grand progrès dans la qualité de ce que nous sommes capables de réaliser,

surtout considérant d‘où nous sommes partis il y a de cela à peine un an. Nous pensons

néanmoins que le nombre de cas d‘utilisation de cette technique est insuffisant pour fonder

une méthode quelconque ou pour extrapoler des résultats généraux pour l‘utilisation de

cette méthode, voire même la recommander (en dehors de nos propres pratiques de création

musicale) à d‘autres réalisateurs. Maintenant que nous avons fait ces réalisations, ces mix et

ces matriçages, nous ne sommes pas totalement satisfaits : nous voulons encore plus de

dynamique, de pureté sonore (lorsque cela s‘applique au style) et surtout une image

cristalline plusieurs fois supérieure à ce que enceintes peuvent même rendre. Nous voulons

pouvoir, en marchant autour de l‘aire de projection des enceintes, avoir l‘impression de

faire le tour d‘un chanteur. Nous ne souhaitons pas fournir une conclusion nuancée,

quoique c‘est le résultat que nous obtenons présentement : le niveau de sonie est

grandement influencé par l‘esthétique des productions, bien plus que par la méthode de

compression qui a été employée au mixage, au matriçage ou au mixage/matriçage. Nous

aurions aimé plutôt avoir une affirmation éclatante où nous affirmerions avoir trouvé une

solution applicable universellement qui fonctionne à tout coup pour un résultat

systématiquement meilleur, mais ce n‘est pas le cas.

111

Conclusion du mémoire

Au début de ce mémoire, nous avons cherché à obtenir des niveaux soniques élevés

en considérant le processus de réalisation musical comme un tout intégré afin de nous

permettre de mieux contrôler les effets indésirables causés par une forte réduction de la

gamme dynamique. Ces derniers apparaissent sous la forme de distorsions, de perte de

nuances dynamiques et entrainent souvent l‘altération, voire la destruction de l‘image du

mix souhaité. Ainsi, nous avons cherché à obtenir les avantages d‘une sonie élevée pour

nos mix finaux (comme une meilleure perception du champ spectral et un mix plus

dynamique) tout en respectant notre idéal de ce qu‘est un bon mix. Nous avons tenté trois

approches pour arriver à nos fins : la conception sonore en vue d‘une sonie plus efficace

(chapitre 1), le travail de programmation de percussions en vue d‘une dynamique plus

efficace (chapitre 2) et le mixage/matriçage simultané pour un contrôle optimal et local des

altérations du son causées par les compresseurs et les limiteurs (chapitre 3). Sans exclure

les deux premières approches et leurs apports à l‘augmentation de la qualité et de la sonie,

la troisième approche nous a semblé la plus prometteuse, car, à notre avis, nous avons été

en mesure d‘augmenter la qualité de nos réalisations musicales, alors qu‘il ne nous avait

pas été possible d‘observer une augmentation de la qualité aussi évidente pour les

premières approches, bien qu‘il nous reste encore énormément de progrès à faire.

Nous mettons ici rapidement en doute la réelle possibilité de rendre compte d‘une

manière quantitative des catégories qualitatives dans le cadre d‘une étude en recherche-

création. Nous nous sommes constamment heurté aux mêmes problèmes lorsque nous

avons essayé de rendre compte d‘une manière quantifiable l‘expérience humaine de la sonie

et de la dynamique. À notre avis, les standards qui ont guidé notre travail doivent

radicalement être revus et, surtout, contextualisés afin qu‘ils permettent de mesurer d‘une

manière plus précise le niveau de sonie d‘une pièce musicale. Encore là, faudrait-il trouver

une manière d‘inclure et de rendre compte de considérations stylistiques et esthétiques

(tempo, instruments, traitement du signal, etc.) dans l‘équation pour le calcul de la sonie, ce

qui est fort probablement irréalisable, ou à tout le moins plutôt subjectif. Même si cela était

possible, nous pouvons certainement nous attendre à devoir faire face aux mêmes

problèmes que nous avons éprouvés en tentant de rendre une description quantifiable d‘une

112

expérience humaine essentiellement qualitative; ultimement, la description quantitative doit

toujours omettre des aspects cruciaux dans notre manière d‘expérimenter notre monde. Nos

propres observations subjectives nous mènent à penser que les méthodes avancées dans

tous les chapitres (design sonore, programmation des percussions et mixage/matriçage) ont

toutes contribué à augmenter le niveau final de sonie de nos exemples à des degrés plus ou

moins significatifs. Sans vouloir dresser un faux dilemme entre le recours aux standards de

production et l‘expérience esthétique subjective, nous pouvons tout de même nous poser la

question suivante : devons-nous rejeter la voix de notre subjectivité, tandis que l‘art est par

définition subjectif, individuellement et socialement, et abandonner notre expérience du

monde qui nous entoure au profit d‘un discours empirique et à ses instruments de mesure?

Est-ce cela ce que nous considérons comme une démarche logique et rigoureuse? Est-ce là

faire preuve d‘un esprit critique? Faut-il absolument que nos expériences subjectives soient

soutenues par des abstractions mesurées (gamme dynamique, sonie intégrée, gamme de

sonie) pour qu‘elles puissent avoir, elle aussi, une voix dans nos jugements finaux de l‘état

des choses? Nous n‘avons pas de réponse décisive à ces questions complexes, mais nous

croyons peut-être avoir donné trop d‘importance aux données quantitatives lors de cette

recherche, et pas assez accordé d‘importance aux processus créatifs tels que la composition

et le processus menant à la composition.

Au cours de nos études à la maitrise, nous avons eu l‘occasion de prendre

conscience de toute l‘exagération qui caractérise les pratiques visant les fortes sonies dans

le domaine de l‘audionumérique. L‘exemple le plus frappant de notre travail réside dans les

exemples 6A et 6B (Hip-Hop avec Saxophone) du premier chapitre sur le design sonore

pour une sonie plus efficace, lors de l‘étape de l‘utilisation du limiteur. Avec des chansons

aussi organiques (ayant des échantillons de vrais instruments et ayant des nuances

dynamiques telles que des crescendos et des décrescendos), le moindre changement, même

ridiculement petit, peut réduire considérablement la gamme dynamique de toute la pièce.

Les tests ont montré qu‘une hausse du gain d‘entrée pour la version 6B de 4,14 dB à

4,88 dB engendrait une diminution de la gamme dynamique de 10 à 8 dB! Cela équivaut à

une perte considérable des nuances dynamiques (quoique 8 dB est tout de même bien de

nos jours) pour un gain infime en sonie; et nous aurions même pu aller jusqu‘à augmenter

le gain de 10 dB.

113

D‘un autre côté, nous avons observé à quel point le fait de libérer les très graves

pouvait favoriser une hausse en gamme dynamique. Par exemple, une diminution de 2,2 dB

des 66,6 Hz pour la version 14A nous a permis, en gardant le même gain d‘entrée au

limiteur, de passer d‘une gamme dynamique de 7 dB à une gamme dynamique de 9 dB.

Dans certains cas, cela peut être désirable, car parfois le punch obtenu est plus avantageux

que la perte des basses très graves, que notre cerveau, de toute façon, fabrique plus souvent

(sans compter les barrières idéologiques, physiologiques et psychologiques de notre

perception) qu‘il ne perçoit80

. Parallèlement, nous pensons aussi que nous aurions pu

diminuer globalement les graves de notre album Peace and Knowledge, présenté au

troisième chapitre, pour obtenir un gain de dynamique ou bien pour investir l‘épargne faite

dans la bande passante de manière à augmenter le capital de sonie. Nous avions déjà pris la

précaution de ne pas utiliser de longues basses soutenues pour favoriser des petits sons

percussifs très rapides (à l‘exception de 3. Sea People), ce qui a été une bonne piste que

nous continuerons d‘explorer et d‘exploiter. Justement, nous croyons que notre approche

intégrée du processus de réalisation audionumérique pour un niveau de sonie optimal avec

le moins d‘artéfacts possible aurait dû inclure aussi les étapes de composition et peut-être

même une étape préliminaire où nous aurions passé beaucoup de temps à écouter et à

analyser les morceaux musicaux qui nous semblent les mieux réussis à ce chapitre pour

développer notre propre esthétique précise et intentionnelle au maximum. Bref, inclure les

catégories du style et de la composition (une idée à garder en tête pour un futur travail) à

notre recherche sur la phonographie aurait sans doute été bénéfique pour de meilleurs

résultats. Néanmoins, notre étude a permis de relever des méthodes qui demeurent très

prometteuses (surtout celle du mixage et du matriçage simultanés) pour la préservation de

la qualité sonore, pour l‘obtention d‘une sonie élevée, pour pouvoir aiguiller le processus

créatif vers un résultat plus fonctionnel, voire efficace, que ce soit au niveau de la

résolution des problèmes ou à l‘exploration ouverte de textures qui interagissent de manière

positive dans le spectre dynamique, et ce, même si les catégories stylistiques et de la

composition n‘ont été que peu exploitées.

Une question subsiste toujours : vaut-il réellement la peine de sacrifier une part de

la qualité audio pour une sonie plus élevée? Nous en avons sacrifié un peu pour notre

80

Daniel R. Raichel, The science and applications of acoustics, 226.

114

album dans les chansons qui étaient le plus chargées d‘éléments instrumentaux. Nous

pouvons également nous demander, compte tenu du fait que la capacité de la bande

passante double aux 20 mois avec les développements technologiques81

, et compte tenu du

fait que certaines sociétés comme Fidelio Technologies82

offrent déjà des services de

matriçage et de rematriçage HD (24Bits/352.8kHz) pour téléchargement, s‘il vaut la peine

de compromettre la qualité des pièces audio aujourd‘hui, en prenant le risque qu‘une

récupération future de la destruction causée par la compression des pièces musicales qui

nous sont contemporaines ne soit pas possible. Les réalisations musicales de notre ère

seraient alors marquées à tout jamais par cette mode. Cela dit, et malgré certains standards

très raisonnables proposés par Tischmeyer83

il n‘est pas certain que les pièces de musique

électronique dansantes puissent se passer de l‘aide d‘un peu de sonie pour obtenir un succès

commercial plus grand.

Ceci étant dit, nous ne pensons pas que les « mauvaises habitudes de compression »

changeront grâce à la bonne volonté des réalisateurs et des « décideurs » dans le domaine

de l‘industrie musicale. Nous ne pensons pas que notre connaissance des faits (comme le

fait de savoir que la lourde compression compromet la qualité audio), à elle seule, soit

suffisamment motivationnelle d‘un point de vue presque éthique pour pousser la

communauté de réalisateurs, par elle-même, à changer nos habitudes. L‘histoire nous

enseigne que nous, les humains, ne fonctionnons pas de cette manière. L‘histoire nous

enseigne que l‘homme ne tire pas des leçons de l‘histoire. Ceci est un phénomène

qu‘Aristote nommait « acrasie », au début du septième livre de l‘Éthique à Nicomaque, et

qui consiste à agir contre les impératifs rationnels de notre connaissance des faits. Pour

atteindre un point où les progrès technologiques, telles que l‘augmentation de la bande

passante, l‘augmentation de l‘espace de stockage, l‘augmentation de la gamme dynamique

de nos médiums musicaux et l‘augmentation considérable de la vitesse de téléchargement,

nous permettraient de changer nos habitudes sans efforts ou pertes face à la compétition

entre artistes, il se pourrait que 20 ans passent, ou même plus. Combien de temps sommes-

nous alors prêts à attendre ? Combien d‘albums de musique seront affectés par les artéfacts

81

Thomas Lund, « Loudness Wars », web. 82

Fidelio Technologies, web. 83

Pleasurize Music Foundation, web.

115

indésirables de la compression en attendant une possibilité très hypothétique (pour ne pas

tomber dans le positivisme technologique et historique) que la technologie apporte des

solutions à ces problèmes ? Jusqu‘à l‘arrivée à ce point, il vaut la peine de dépenser des

efforts pour trouver des solutions aux problèmes actuels générés par la compression, sans

se soustraire au contexte de compétition pour des niveaux élevés de sonie lorsqu‘elle

apporte des effets positifs à des genres musicaux où une telle pratique est avantageuse.

La plupart des auteurs condamnent la compression, sans tenter de trouver des

solutions qui sont applicables et pensées en fonction de notre contexte actuel : il y a des

tonnes d‘artistes et la compétition pour susciter l‘attention est plus grande que jamais. Il y a

probablement des milliers de jeunes adolescents qui réalisent une musique semblable à la

nôtre sur leur ordinateur. Rejeter complétement la compression en raison de ses mauvais

effets sur la qualité du son n‘est pas une solution avantageuse (dans notre contexte) pour les

artistes. Même si la situation peut être agaçante pour certains audiophiles, nous croyons

qu‘il y a tout de même une demande pour du matériel musical ayant des niveaux de sonie

très élevés. Nous n‘avons besoin que de nous remettre à l‘esprit les nombreux discours

passionnés que nous avons eus avec des amis au sujet des mauvais effets de la

compression. Ils partageaient tous le même avis que nous, jusqu‘à ce que nous leur

montrions des exemples de nos mix avant et après la compression. À l‘unisson, ils

affirmaient tous alors que la version compressée était meilleure. Nous réalisions alors que

nos arguments n‘étaient pas autant convaincants que l‘écoute comparative de gens habitués

à un matériel audio compressé, qui à son tour crée des attentes. Ces derniers ne sont pas à

blâmer, car leur réaction était spontanée et sincère.

Pour reformuler l‘argument en d‘autres termes, nous devons offrir une solution

avantageuse aux artistes (comme un processus de réalisation musicale intégré pour une

sonie plus efficace), au lieu de condamner la compression. Nous pouvons comparer cette

impasse à une situation similaire au début du 21e siècle, lorsque le piratage était un

« mauvais » phénomène « hors de contrôle » pour les grandes industries du divertissement

qui essayaient de faire voter des lois (c‘est encore le cas) dans le but de connaître l‘identité

des pirates, et ainsi, pouvoir ensuite les poursuivre en justice. Les clubs de location vidéo

116

faisaient faillite. iTunes et Netflix, au lieu de s‘asseoir sur le pôle de la condamnation de ces

pratiques, ont vu l‘occasion d‘offrir un service à domicile payant et pratique et ils eurent

beaucoup de succès84

. Ils ont compris que les gens ne volaient pas la musique et les films ;

ils étaient plutôt en train de montrer à l‘industrie du divertissement les moyens de se faire

de l‘argent. Bien que le profit monétaire n‘est pas ici notre objectif, nous pouvons tout de

même voir le contexte actuel d‘une manière similaire pour développer de nouvelles

méthodes de compression en minimisant les problèmes habituellement engendrés par celle-

ci au lieu de condamner cette pratique en demande, une critique qui n‘est pas très

constructive et ni avantageuse pour l‘artiste ou l‘auditeur.

Certains souhaitent qu‘il y ait une législation ou une imposition d‘une normalisation

pénalisant les mix musicaux « délinquants » ayant un niveau de sonie élevé par rapport aux

mix dynamiques. Selon certains articles, cela serait en train de se produire en ce moment

même85

. Nous ne sommes vraiment pas certains que la réglementation et la normalisation

sont des bons moyens de favoriser la diversité et l‘expression, il s‘agit justement d‘un

manque à ce niveau que les gens en faveur de ces mesures reprochent à la compression. En

fait, s‘il y a un domaine où nous devrions laisser les gens faire ce qu‘ils veulent faire, c‘est

bien dans le domaine de l‘art (et nous croyons avec le musicologue Juha Markus Mantere86

et plusieurs autres avant lui que la production phonographique est un art), et ce, peut

importe nos partis-pris esthétiques.

Nous croyons que les perspectives d‘avenir pour une méthode de réalisation

audionumérique intégrée sont très prometteuses, si nous continuons à mieux développer

notre écoute, notre esthétique, notre technique de travail et si nous continuons à avoir un

accès régulier à des infrastructures où une écoute de grande qualité est possible. Nous

croyons que plusieurs réalisateurs de musique font déjà certains (ou même la plupart) des

procédés que nous avons décrits dans ce mémoire. Il y a probablement une pléthore de

réalisateurs de musique électronique qui choisissent de travailler avec des matériaux très

84

Anthony Leather, « Online piracy was a missed opportunity », Forbes Magazine, (2013), web. 85

Paul Resnikoff, « How iTunes Radio Is Single-Handedly Ending the ‗Loudness Wars‘ », Digital Music

News, 28 Octobre 2013, web. 86

Juha Markus Mantere, The Gould Variations ; Technology, philosophy and criticism in Glenn Gould’s

Thought and Musical Practice, thèse acceptée à l‘Université de Tampere, (2006), p. 147.

117

larges et lourdement compressés87

, sans qu‘ils ne songent à trouver une méthode pour tirer

partie des avantages d‘une forte sonie tout en limitant ses dégâts inévitables causés par un

contrôle accru de la compression. Malgré cette très forte probabilité, la littérature

scientifique à ce sujet est extrêmement rare. Nous avons grandement besoin d‘une

recherche (impliquant des gens expérimentés et ayant recours à de la technologie de pointe)

sur les moyens d‘obtenir de meilleures réalisations musicales tout en demeurant compétitifs

face aux gabarits commerciaux et aux standards élevés des niveaux de sonie.

87

Nous pensons aux populaires plugiciels Nexus, Gladiator, and Massive, trois synthétiseurs virtuels dont la

sonie nous semble ridiculement élevée.

119

Bibliographie

Bauer, B. B. et Torick, E. L., « Researches in Loudness Measurement », IEE Transactions

on Audio and Electroacoustics, vol. AU-14, no 3, septembre 1966.

Bogh Brixen, Eddy, Audio Metering, Measurements, standards and practice, 2e édition.

Oxford : Focal Press, 2011.

Damaske, Peter, Acoustics and Hearing. Berlin : Springer, 2008.

Deruty, Emmanuel, « ‗Dynamic Range‘ & The Loudness War », Sound on Sound,

septembre 2011, web : http://www.soundonsound.com/sos/sep11/articles/loudness.htm

Deruty, Emmanuel, Elements of Popular Music Analysis, Dynamics: evolution over the

years, distributions, décembre 2012, web: http://1-1-1-1.net/IDS/?p=747

Dow, Rory, « Programming realistic drum parts », Sound on Sound, septembre 2010, web :

http://www.soundonsound.com/sos/sep10/articles/drum-prog.htm

EBU R 128, Loudness normalisation and permitted maximum level of audio signals, 2011,

web: http://tech.ebu.ch/docs/r/r128.pdf

EBU TECH 3342, Loudness Range: A measure to supplement loudness normalisation in

accordance with EBU R 128, 2011, web: http://tech.ebu.ch/docs/tech/tech3342.pdf

Fidelio Technologies, web: http://www.fideliotechnologies.com

Goldstein, J. L., « Phase effects in two-tone suppression investigated with a binaural

lateralisation paradigm », Psychophysics and Physiology of Hearing. New York:

Academin Press, 1977.

Hollin, Jones, « Sound design using Thor », MusiTech Focus, Synthesis : The in-depth

guide for the creative musician, treisième édition. Bath : Anthem Publishing, 2011.

Howard, M. David et Angus Jamie, Acoustics and psychoacoustics, 3e édition. Elsevier:

Focal Press, 2006.

120

Huber, David, « MIDI : Handbook for Sound Engineers », Audio Engineering Explained,

édition par Douglas Self. Elsevier : Focal Press, 2010.

ITU BS 1770-1, Algorithms to measure audio programme loudness and true-peak audio

level, 2006-2007, web: http://webs.uvigo.es/servicios/biblioteca/uit/rec/BS/R-REC-BS.1770-1-200709-

I!!PDF-E.pdf

ITU BS 1770-2, Algorithms to measure audio programme loudness and true-peak audio

level, 2012, web: http://www.itu.int/dms_pubrec/itu-r/rec/bs/R-REC-BS.1770-2-201103-S!!PDF-E.pdf

ITU BS 1770-3, Algorithms to measure audio programme loudness and true-peak audio

level, 2012, web: http://www.itu.int/dms_pubrec/itu-r/rec/bs/R-REC-BS.1770-3-201208-I!!PDF-E.pdf

Izhaki, Roey, Mixing audio, Concepts, Practices and Tools. Burlington: Focal Press, 2008.

Katz, Bob, « About the loudness war pt.1 », AES 2009, web:

http://www.youtube.com/watch?v=XCd6MHlo_iA

Katz, Bob, Mastering Audio; The art and the science. New York: Focal Press, 2002.

Kuttruff, Heinrich, Acoustics; An Introduction. New York: Taylor & Francis, 2007.

Lund, Thomas, « Loudness : The Quest for the Holy Grail », Audio Engineering Society,

121e convention, 5 oct. 2006, 8, web :

http://www.postmodernmastering.com/artigear/technicalpapers/6AES121_2006_Loudness.pdf

Lund, Thomas, Loudness Wars pt. 1, séminaire dans le cadre de Rome Calling, 2011, web:

https://www.youtube.com/watch?v=BhA7Vy3OPbc

Lüthi, Bruno, Physical acoustics in the solid state. New York: Springer, 2005, 426 p.

Mantere, Juha Markus, The Gould Variations ; Technology, philosophy and criticism in

Glenn Gould’s Thought and Musical Practice, thèse acceptée à l‘Université de Tampere,

(2006), web : https://repository.library.brown.edu/fedora/objects/bdr:11271/datastreams/PDF/content

Miranda, Luis, « Multichannel Loudness Listening Test », Audio Engineering Society, 124e

convention, mai 2008, web : http://www.aes.org/events/124/124thWrapUp.pdf

Moulton, David, Total Recording ; The complete guide to audio production and

engineering. États-Unis : Kendall Printing, 2000.

121

Orban, Robert, Orban White Paper, Using the ITU BS. 1770-2 and CBS Loudness Meters

to Measure Loudness Controller Performance, 2012, web:

http://www.orban.com/support/orban/techtopics/White%20Paper-

BS.1770%20vs%20CBS%20meter%20V2.pdf

Orban, Loudness Meter for Windows v. 2.0.8, 2012, web:

http://www.orban.com/meter/Installation.html

Pleasurize Music Foundation, web: http://www.pleasurizemusic.com & http://www.dynamicrange.de

Price, Simon, « Using the Malström synth in Reason », Sound on Sound, aout 2005, web:

http://www.soundonsound.com/sos/aug05/articles/reasontech.htm

Raichel, Daniel R., The science and applications of acoustics 2nd

edition. New York:

Springer, 2006.

Rossing, Thomas D., Springer Handbook of Acoustics. Stanford: Springer, 2007.

Russ, Martin, Sound Synthesis and Sampling, Édition seconde. Elsevier: Focal Press, 2004.

Snoman, Rick, The Dance Music Manual 2nd

edition. Oxford: Focal Press, 2009.

Sreedhar, Suhas, « The Future of Music; Part One: Tearing Down the Wall of Noise »,

IEEE Spectrum, aout 2007, web: http://spectrum.ieee.org/computing/software/the-future-of-music

Tischmeyer, Friedemann, Audio Mastering Tutorial DVD Vol. III. Santa Cruz: Tischmeyer

Publishing, 2007.

Tischmeyer, Friedemann, Audio Mastering with PC workstations, Vol. 1 (DVD). Santa

Cruz: Tischmeyer Publishing, 2007.

Tingen, Paul, « Secrets of the mix engineers : JJ Puig », Sound on Sound, novembre 2007,

web: http://www.soundonsound.com/sos/nov07/articles/insidetrack_1107.htm

Toole, Floyd, Sound Reproduction, Loudspeakers and rooms. Elsevier: Focal Press, 2008.

122

123

Annexes

Annexe 1 : le cas de l’article « ‘Dynamic Range’ & The Loudness War »88

Introduction

Dans l‘article intitulé « ‗Dynamic Range‘ & The Loudness War »89

écrit par

Emmanuel Deruty, plusieurs erreurs logiques fondamentales sont comises, selon nous, dans

la défense d‘une thèse découlant des résultats d‘une impressionnante recherche fondée sur

l‘analyse d‘un échantillon de plus de 4500 titres parus entre 1980 et 2010. Deruty suggère

au lecteur de poser un regard nouveau sur la Loudness War et les croyances « populaires »

lui étant associée qui prétendent que la gamme dynamique est moindre dans les chansons

d‘aujourd‘hui qu‘elle l‘était pour les chansons d‘avant. Ainsi, et à l‘encontre des opinions

émises par les plus grands spécialistes (Katz90

, Tischmeyer, Lund, la revue scientifique

IEEE Spectrum91

, et quantité d‘autres), l‘auteur défend la thèse selon laquelle la gamme

dynamique des chansons d‘aujourd‘hui est supérieure à celle des années 1980; par

exemple :

We all know music is getting louder. But is it less dynamic? Our ground-breaking research proves

beyond any doubt that the answer is no — and that popular beliefs about the ‗loudness war‘ need

a radical rethink92

.

Comment se fait-il alors que Tischmeyer lutte pour « rétablir » (re-establish)93

la gamme

dynamique? Comment se fait-il alors qu‘une autre version de la même recherche de Deruty

n‘aboutit pas aux mêmes conclusions94

, et qu‘elle est citée en plus sur le site web

dynamicrange.de95

, un site associé à Tischmeyer? Y a-t-il une quelconque logique dans

cette confusion? Est-ce qu‘un simple étudiant débutant sa maitrise peut s‘en prendre à une

recherche et un auteur aussi respectés? Globalement, nous ne sommes pas en désaccord

avec les faits individuels présentés dans la recherche de Deruty; ces faits ne nous font

88

Emmanuel Deruty, « ‗Dynamic Range‘ & The Loudness War‘ », web. 89

Idem. 90

Bob Katz, Mastering Audio; The Art and the Science, 271-278. 91

Suhas Sreedhar, « The Future of Music; Part One: Tearing Down the Wall of Noise », IEEE Spectrum,

(aout 2007), web. 92

Emmanuel Deruty, « ‗Dynamic Range‘ & The Loudness War‘ », web. 93

Pleasurize Music Foundation, web. 94

Emmanuel Deruty, Elements of Popular Music Analysis, Dynamics: evolution over the years, distributions,

(décembre 2012), web. 95

Pleasurize Music Foundation, web.

124

toutefois pas aboutir aux mêmes conclusions, de sorte que la présentation ou la forme de sa

présentation nous parait erronée.

Confusion des genres

En lisant l‘article, nous sentons un perpétuel malaise de l‘auteur (sans vouloir entrer

dans des interprétations psychologisantes ou herméneutiques), qui emploie les termes

Dynamic Range et Loudness Range souvent comme des synonymes. Avec comme arme à

la main les fameux EBU 3342 et BS 1770, celui-ci prétend parler de la dynamique des

pièces dans sa conclusion et dans son titre d‘article, alors qu‘il parle en fait de la gamme de

sonie. Parfois, on a l‘impression que l‘auteur sent lui-même ce malaise et tente

maladroitement de joindre son argumentaire en le liant de structures logiques qui laissent à

désirer : « However, we‘ve seen during this article that the loudness war actually didn‘t

result in any reduction in the closest well-defined descriptor there is to ―dynamic range‖,

which is loudness range as defined by the EBU 3342 technical document », dit-il en

contredisant lui-même une de ses premières affirmations : « The term ‗dynamic range‘ will

be reserved for the measure of signal-to-noise ratio of a recording medium.

Mais celui-ci ne se limite pas à se contredire lui-même, car il néglige aussi, très

ironiquement, une mise en garde fondamentale du EBU 334296

: « Loudness Range should

not be confused with other measures of dynamic range or crest factor, etc. ». C‘est entre

autres pour cette raison que nous soulignons le fait que la gamme de sonie n‘est qu‘un

indice/effet de la gamme dynamique, mais que ce n‘est pas une mesure dynamique97

. Ainsi,

lorsque Deruty affirme que les conclusions de sa recherche mettent en doute de manière

« radicale » les croyances populaires, lorsqu‘il affirme que les pièces d‘aujourd‘hui ne sont

pas moins dynamiques que celles d‘avant ou lorsqu‘il reproche à certains auteurs de ne pas

trop savoir de quoi ils parlent en se rapportant à la dynamique98

, nous pensons simplement

qu‘il ne parle pas de la même chose que les autres et que sa conclusion de recherche ne

s‘oppose qu‘en apparence aux « croyances populaires ».

96

EBU TECH 3342, Loudness Range: A measure to supplement loudness normalisation in accordance with

EBU R 128, 2011, web 97

Voir Chapitre 1, p 38-44. 98

Par exemple : « It‘s easy to find people, documents, web pages and so on that unanimously blame the

loudness war for damaging music. Many of them also link the loudness war to a reduction in ―dynamic

range‖, though they usually don‘t explain what dynamic range might be » dans Emmanuel Deruty,

« ‗Dynamic Range‘ & The Loudness War‘ », web.

125

Notre interprétation de la recherche

De quoi parle alors cette recherche? Elle doit bien servir à quelque chose, avec ses

graphiques chics et ses échantillons impressionnants? L‘auteur de l‘article a une manière

très particulière d‘effectuer ses tests pour parvenir à certains résultats. Premièrement, il

examine la gamme sonique sur des fenêtres de temps très brèves (une pratique, en aucun

cas, recommandée en EBU R 128, en EBU 3342 ou en BS 1770). Il compare des musiques

de styles différents et d‘époques différentes : des anciennes chansons qui avaient du bruit

de fond (analogique) versus des nouvelles chansons, percussives et n‘ayant pas de bruit de

fond (virtuellement, nous pouvons avoir du silence entre les attaques). Même si le calcul de

la gamme sonique tel qu‘indiqué en EBU 3342 et en BS 1770 comprend un système de

porte-de-bruit (gating) qui élimine les silences dans la comptabilisation des données

soniques, lorsque les anciennes chansons sont normalisées par les crêtes pour atteindre le

0 dB numérique (c‘est ce qui est fait dans la recherche de Deruty), le niveau du bruit

augmente nécessairement, ce qui fait en sorte qu‘une comparaison entre des genres anciens

et des genres nouveaux ne nous renseignera jamais sur la différence entre leur pratique

sonique, mais uniquement sur la différence entre la particularité sonique des différents

genres en fonction de leur époque. Cela signifie que la recherche publiée dans la revue

Sound on Sound, ne peut avoir une portée universelle en matière de gamme sonique (et non

de gamme dynamique), car elle porte sur des différences de genres particuliers qui sont

eux-mêmes différents et indépendants de la pratique sonique.

Pourquoi utiliser des fenêtres de temps inférieures à 0,18 s dans la détermination de

la gamme sonique (alors que le BS 1770 suggère des fenêtres de temps de 400 ms), si la

gamme sonique est une différence entre des moyennes (niveaux RMS élevés VS niveaux

RMS faibles) de moyennes (moyenne des RMS élevés VS moyenne des RMS faibles)? À

0,18 s, nos moyennes de moyennes seront constituées par une poignée d‘échantillons. Nous

ne pensons pas que cela corresponde à la pensée « populaire » : lorsque les gens affirment

« fallacieusement » que les chansons d‘aujourd‘hui sont moins dynamiques qu‘avant, ils ne

se réfèrent sûrement pas à des échelles de temps qui dépassent leur capacité à percevoir des

subtiles nuances dynamiques; ils ne se réfèrent pas à un fantôme imperceptible à l‘échelle

humaine. Aussi, le calcul de Deruty, avec de telles fenêtres de temps, aboutit à un constat

sur la répartition des moyennes des valeurs RMS : bien sûr, les nouvelles chansons ont

126

peut-être une plus grande répartition de ces valeurs (le bruit de fond a fait diminuer le

plancher des dB et l‘augmentation des BIT a augmenté le plafond FS), mais cela

n‘empêche pas que les moyennes des valeurs RMS obtenues sont toutes concentrées près

du « 0 » numérique. N‘est-ce pas une forme de réduction de la gamme dynamique? Ce fait,

Deruty le sait et il l‘affirme dans son article, ce qui augmente encore plus notre

incompréhension face sa forte conclusion, qui nous parait hâtive. Aussi, ne parvient-il pas à

la même conclusion dans les suites de sa recherche parue trois mois plus tard, en janvier

201299

. De plus, le chercheur mentionne qu‘un de ses collègues, Damien Tardieu, a procédé

à une analyse de la gamme sonique sur un corpus de plus de 20 000 chansons. Celui-ci est

parvenu à la conclusion que la gamme sonique n‘a pas diminué au cours des années, et non

qu‘elle a augmenté (ce n‘est pas la même conclusion!), sans compter que nous parlons

encore de gamme sonique et non de gamme dynamique. Il y a encore ici de la confusion.

Que la gamme sonique soit élevée pour les chansons récentes lorsqu‘on les observe

à des échelles de temps insignifiantes du point de vue de la perception humaine des nuances

soniques (on ne parle même pas des nuances dynamiques), cela est bien, ou la conclusion

semble valide. Bien que la variation de la gamme sonique ait une corrélation avec la

variation de la gamme dynamique, il nous est cependant strictement interdit d‘en tirer un

lien de cause à effet.

99

Emmanuel Deruty, Elements of Popular Music Analysis, Dynamics, web.

127

Annexe 2 : Notre expérience en matriçage avec Serges Samson

Au début du mois d‘octobre 2012, nous avons eu la chance de travailler avec Serges

Samson, technicien en travaux d'enseignement et de recherche à l‘Université Laval qui a

plusieurs centaines de productions à son nom, sur notre premier album de musique

électronique Peace and Knowledge paru le 9 du même mois et de la même année. Nous

jugeons pertinent de partager ici notre expérience de travail, parce qu‘elle a été structurante

pour notre technique de travail et qu‘elle transparait en partie à l‘étape du « prototype » de

matriçage lors de nos tests au limiteur et à l‘égaliseur. La présence de Serges Samson s‘est

faite donc sentir tout au long de cette recherche.

Lorsque nous avons travaillé sur Peace and Knwoledge, M. Samson employait une

méthode de travail par strates, soit une succession répétée de certains modules, afin de faire

ressortir les éléments harmoniques à problèmes pour les corriger doucement, et ce, toujours

en respectant la nature du mix qui lui était remis. Dans le cas de notre album et de notre

style de musique particuliers, nous avions premièrement donné du caractère et de la

cohérence aux mix en faisant passer le signal audio du convertisseur N/A vers un

compresseur subtil au ratio avoisinant les 1 : 1,2 et un préamplificateur de lecteur à ruban.

Par la suite, et c‘est ici que le travail par strates a été appliqué, nous avons successivement

fait passer le signal par des combinaisons de limiteurs et d‘égaliseurs (deux la plupart du

temps, et trois lorsque nécessaire). La logique de ce procédé était la suivante : dans

l‘optique d‘obtenir un niveau sonique intéressant, nous avons augmenté le niveau du gain

d‘entrée du limiteur jusqu‘au seuil où nous avons pu commencer à entendre des distorsions.

Ces distorsions ont été, par la suite, légèrement corrigées à l‘aide de l‘égaliseur à larges

bandes suivant le limiteur, après quoi nous avons redescendu le niveau du gain d‘entrée du

limiteur à un niveau qui n‘altérait pas la qualité du son. Nous avons ensuite répété cette

étape au besoin, le but étant de faire ressortir les hernies sonores des mix afin de les

corriger.

En ce qui concerne le cas particulier de notre style musical, de la combinaison des

jeux de timbres et des sons harmoniques complexes, les nœuds de nos mix se situaient

généralement aux mêmes endroits du champ spectral : lors de la première strate des

limiteurs et égaliseurs, ce sont les 70 Hz, 150 Hz, 250-350 Hz, les 500-600 Hz, 1 kHz et

128

autres harmoniques qui causaient les distorsions. Lorsque nous creusions une de ces

hernies, automatiquement ses harmoniques supérieures et inférieures ressortaient; c‘est ce

principe harmonique que M. Samson appelait pédagogiquement le principe du « ballon

d‘eau ». Lors de l‘application des deuxièmes et troisièmes strates, des hernies moindres

ressortaient là où nous n‘avions pas travaillé les harmoniques à la première étape. Nous

recommencions alors le même procédé. De manière globale, nous avons pu, en conclusion,

expérimenter les choix déchirants entre les basses fréquences et le corps, versus les fortes

sonies qui pouvaient paraitre « fades » ou « minces ».