Ni fiction ni réalité

237

Transcript of Ni fiction ni réalité

! t a b l e ! d e s !ma t i è r e s ! !

1 !

! TABLE!DES!MATIERES

P R E S E N T A T I O N . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

I . E N G A G E M E N T S E T A T T E N T E S . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

A. PETIT TRIP TELEVISUEL .................................................................................................................... 8

B. REALITE OU FICTION? ................................................................................................................. 11

C. LES CARACTERISTIQUES DISTINCTIVES DU VIDEO-CLIP ........................................................... 14 1. La distinction esthétique : l’image stroboscopique ........................................................ 14 2. La distinction textuelle : la liberté d’image et de son .................................................... 16 3. La distinction stratégique : la persuasion cachée .......................................................... 18 4. La distinction médiatique : la figure du chanteur-groupe ............................................. 21

D. UNE INTERFACE COMMUNICATIONNELLE ............................................................................... 23 1. La transposition des genres ............................................................................................... 24 2. Le chantier des genres ....................................................................................................... 25

E. CONCLUSIONS ET POINT DE DEPART ....................................................................................... 26

II. TELEVISION ET GENRE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

A. LE GENRE DANS LA COMMUNICATION TELEVISUELLE ............................................................ 27 1. La généricité: considérations théoriques générales ....................................................... 28

a. Niveau de l’énonciation .............................................................................................. 30 b. Niveau de la destination ............................................................................................. 31 c. Niveau de la fonction .................................................................................................. 31 d. Niveau sémantique ...................................................................................................... 31 e. Niveau syntaxique ........................................................................................................ 31

2. logiques de la généricité télévisuelle ............................................................................... 32 a. Logiques professionnelles: optimiser la production et fidéliser le

téléspectateur .............................................................................................................. 33 i. L’activité de production ....................................................................................... 33 ii. Agir sur le téléspectateur ...................................................................................... 33

b. Logiques de régulation: réglementer ........................................................................ 34 c. Logiques d’archivage : indexer .................................................................................. 34 d. Logiques de la critique spécialisée : informer ........................................................... 35 e. Logiques de recherche : expliquer la communication ........................................... 35

B. LE SPECTRE THEORIQUE DANS LA GENERICITE TELEVISUELLE ................................................. 36 1. Identité langagière ............................................................................................................. 37 2. Identité socio-discursive ..................................................................................................... 38 3. Identité cognitive ................................................................................................................ 40 4. L'énonciation et le téléspectateur .................................................................................... 41

a. Le texte énonciateur .................................................................................................... 42 b. Les dispositifs de l’énonciation .................................................................................... 44 c. La construction spectatorielle de l’énonciation ....................................................... 45 d. Choix théoriques ........................................................................................................... 46

C. LE GENRE COMME OUTIL D’INTERPRETATION SPECTATORIELLE ............................................. 47

D. CONCLUSIONS ET POINTS DE DEPART ...................................................................................... 49

I I I . UNE TYPOLOGIE DES GENRES TELEV ISUELS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

A. LA LOGIQUE DES GENRES LITTERAIRES DE KÄTE HAMBURGER ............................................... 51 1. Réalité versus fiction ........................................................................................................... 51 2. La place de la poésie ........................................................................................................ 55 3. Les formes spéciales ou mixtes .......................................................................................... 58

B. LA THEORIE DES GENRES TELEVISUELS DE JOST ........................................................................ 59 1. Intention, promesse et genre ............................................................................................ 61

a. Présomption d’intentionnalité ..................................................................................... 61 b. La promesse de la chaîne ........................................................................................... 63 c. Le genre comme promesse ........................................................................................ 64

2. Les genres télévisuels de premier degré .......................................................................... 65

n i ! f i c t i on ! n i ! r é a l i t é !

2!

3. La feintise et les modes énonciatifs de deuxième degré .............................................. 67 4. Genre, promesse et figure anthropoïde .......................................................................... 69

C. APPROXIMATIONS ET DISTANCES ............................................................................................. 70 1. Positionnement par rapport à l’objet ............................................................................... 71 2. Statut ontologique du sujet v/s modes d'énonciation ................................................... 73

a. Les Je-Origine de Hamburger ..................................................................................... 74 b. Les modes d'énonciation de Jost ............................................................................... 75

D. CONCLUSIONS ET POINTS DE DEPART ..................................................................................... 77

IV . OUT I LS D 'ANALYSE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79

A. LES FONDEMENTS DE L'ANALYSE ET DEFINITION OPERATOIRE DES TERMES. ......................... 81 1. La sémantisation de l’acte d’énonciation ou méta-énonciation ................................ 82

a. La grille de programmation ........................................................................................ 82 b. La communication de l’émission .............................................................................. 83

2. Diégèse et diégétisation .................................................................................................... 84 a. "Topic" interprétatif ....................................................................................................... 87 b. Le genre du discours .................................................................................................... 89

i. Le discours narratif ................................................................................................. 90 ii. Le discours descriptif .............................................................................................. 91 iii. Le discours monstratif ............................................................................................ 94

c. Le mode d'effectuation matérielle de l'acte d'énonciation. ................................. 96

B. NIVEAUX DE L'ANALYSE ET GRILLE D'OBSERVATION ............................................................... 99

1. Niveau profilmique : l'espace, les sujets et les objets ............................................................ 99 2. Niveau cognitif de la modalité discursive ; qui parle? ................................................. 102 3. Niveau perceptif audiovisuel de la modalité discursive : qui regarde? .................... 104 4. Niveau de la responsabilité énonciative : qui est l'énonciateur ? .............................. 111

C. CONCLUSIONS ET POINTS DE DEPART ................................................................................... 115

V. UN DROLE DE GENRE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117

A. VERITE, FICTION, JEU : PHENOMENOLOGIE D'UN VIDEO-CLIP ............................................. 118 1. Le récital live : construction d'un monde diégétique de réalité (série 1) .................. 120

a. Niveau profilmique ..................................................................................................... 122 b. Niveau perceptif audiovisuel .................................................................................... 124 c. Niveau de la responsabilité énonciative. ................................................................ 129 d. Synthèse ...................................................................................................................... 134

2. Une histoire d'agents secrets et des mafieux : la construction d'un monde diégétique fictionnel (série 2) ................................................................................................ 134

a. Niveau profilmique ..................................................................................................... 136 b. Niveau perceptif audiovisuel .................................................................................... 137 c. Niveau de la responsabilité énonciative. ................................................................ 141 d. Synthèse ...................................................................................................................... 145

3. Danser et s'éclater : la construction d'un monde diégétique ludique ...................... 145 4. Conclusion : de la transposition des modes d'énonciation à la pluralité interprétative 149

B. UN MODE D'ENONCIATION A LA FOIS ................................................................................... 152 1. Le clip documentaire ....................................................................................................... 153 2. Le clip fiction ..................................................................................................................... 154 3. Le clip divertissement ....................................................................................................... 156 4. Le méta-clip ...................................................................................................................... 157

C. UNE ENONCIATION TRANSGENERIQUE? ................................................................................ 158

D. CONCLUSIONS ET POINTS DE DEPART ................................................................................... 160

VI . LE JE LYR IQUE A LA TELEV IS ION . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162

A. STATUT DU JE-ORIGINE DANS LE VIDEO-CLIP ........................................................................ 163 1. La réalité du chanteur-groupe ....................................................................................... 164 2. La désactivation de la fiction ......................................................................................... 166

a. La prééminence de la figure du chanteur-groupe ............................................... 167 b. La transindividualité du réalisateur ........................................................................... 169

B. L'EFFET DE FICTION ................................................................................................................... 170 1. La mimésis esthétique ...................................................................................................... 171 2. L'allusion 172 3. La référence au statut artistique du cinéma ................................................................. 174

C. LE CHANTEUR-GROUPE COMME JE LYRIQUE ........................................................................ 175 1. Le Je lyrique. ...................................................................................................................... 175 2. Le chanteur-groupe ......................................................................................................... 178

D. A LA RECHERCHE DU MODE PERDU ...................................................................................... 190

! p r é s en t a t i on ! !

3 !

E. CONCLUSIONS ET POINTS DE DEPART .................................................................................... 193

VI I . LE MODE POET IQUE DANS LA THEORIE DE GENRES TELEV ISUELS . . . . . . . . . . . . . . . . . . . 194

A. QUELLE EST L’ORIGINE DES TROIS MODES D’ENONCIATION DE JOST? ............................... 195 1. Acte illocutoire, fiction et métaphore ............................................................................ 196 2. Des actes de langage à la typologie de genres télévisuels ....................................... 200 3. Les modes d'énonciation comme intention discursive ................................................ 203

B. PROBLEMES LOGIQUES DU MODELE DE JOST ....................................................................... 204 1. Rire, pleurer et davantage .............................................................................................. 205 2. Cinq actes illocutoires possibles ...................................................................................... 208

a. Le mode authentifiant comme acte illocutoire assertif ........................................ 208 b. Le mode d'énonciation poétique comme acte illocutoire .................................. 211

C. CONDITIONS POUR L'INTEGRATION DU MODE POETIQUE A LA THEORIE DES

GENRES TELEVISUELS ................................................................................................................ 212 1. Redéfinition du mode d'énonciation ludique ............................................................... 213 2. Je-origine et intention énonciative ................................................................................. 215

DIGRESS IONS F INALES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 220

V IDEO-CL IPS C I TES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 223

EMISS IONS DE TELEV IS ION CITEES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 225

F I LMS C ITES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 226

B L I B L I O G R A P H I E . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 227

n i ! f i c t i on ! n i ! r é a l i t é !

4!

! PRESENTATION

Multiforme et hétérogène par nature, la télévision est habituellement décrite comme le lieu

dans lequel la réalité et la fiction se mélangent et se confondent. L’énorme diversité de

programmes qu’elle accueille, combine, entrelace et recycle dans le tourbillon de son flux

perpétuel, a fini par imposer l’image du grand moulin médiatique des genres. Dans ce

manège où, à la suite du Journal Télévisé de midi, nous attend, indéfectible, le Derrick de

chaque après-midi, la notion de « mélange de genres » semble la plus apte à rendre compte

de cette constante transposition qui est devenue un lieu commun de la critique et de la

recherche.

Pourtant, derrière l’idée du « mélange de genres » se cache une généralisation qui devient,

souvent, un obstacle au moment d’aborder toute la complexité de la communication

télévisuelle.

Considérée traditionnellement du point de vue de l’éthique ou de l’esthétique, la question

du statut du discours télévisuel par rapport à la réalité et à la fiction, a conduit, la plupart du

temps, soit au dénigrement, soit à l’exaltation de la télévision. Critiques ou complaisants,

savants ou dogmatiques, ces points de vue contraires s’intéressent peu souvent aux

mécanismes qui permettent au téléspectateur d’accéder à l’expérience de la fiction et de

la « réalité » que lui fournit quotidiennement la communication télévisuelle.

Si réalité et fiction sont deux systèmes de vérité qui s’opposent, il est peut-être nécessaire de

fermer la boucle des « sciences normatives » en ajoutant à l’éthique, qui s’intéresse au

« bien », et à l’esthétique, qui a comme objet le « beau », la logique, qui définit les règles de

la pensée concernant le « vrai ». Une logique des discours télévisuels pourrait rendre compte

de ce qui nous permet de distinguer, en tant que téléspectateurs, les discours qui cherchent

à nous mettre en contact avec la réalité de ceux qui nous offrent la simulation imaginaire de

la fiction.

Ce questionnement par rapport au statut logique de la communication télévisuelle a gagné,

peu à peu, l’intérêt de la recherche dans le domaine de la télévision, comme en témoignent

les nombreux ouvrages qui ont été publié ces cinq dernières années sur le sujet. Parmi ces

ouvrages, les récents travaux de Roger Odin « De la Fiction » (: 2000-b), François Niney

« L'Épreuve du Réel à l'Écran. Essai sur le Principe de Réalité Documentaire » (: 2000), François

Jost « La Télévision du Quotidien : Entre Réalité et Fiction » (: 2001-a) et Muriel Hanot

« Télévision : Réalité ou Réalisme. Introduction à l'Analyse Sémio-pragmatique des Discours

! s e c t i on ! 1 . ! i n t r odu c t i on ! engagemen t s ! e t ! a t t en t e s !

5 !

Télévisuels » (: 2002), dans le domaine de l’analyse strictement audiovisuel et, sur un plan plus

général, l’ouvrage de Jean-Marie Schaeffer « Pourquoi la fiction? » (: 1999).

Mais, ces deux grandes catégories de réalité et de fiction, suffisent-elles à décrire l’ensemble

des phénomènes discursifs qui se produisent à la télévision ?

Affaire relationnelle, la communication télévisuelle est le résultat de l’intersection des

intentions discursives de la chaîne et des attentes du téléspectateur. Entre ces deux extrêmes

de la communication, l’outil qui permet à la chaîne d’agir sur le téléspectateur et à ce

dernier de comprendre le statut du discours véhiculé par une émission en particulier, c’est le

genre.

La théorie des genres télévisuels sera, dès lors, le point de départ et d’arrivée de notre

réflexion théorique sur le statut des discours à la télévision.

L’évanescence des programmes a, sans cesse, brisé le rêve d’établir une généalogie

définitive et exhaustive des émissions télévisuelles. Mais notre intérêt dans ce domaine ne

repose pas sur un but de classement. La théorie des genres est pour nous davantage un outil

pour expliquer les processus de compréhension et d’interprétation des documents de

communication médiatiques qu’un paramètre normatif applicable aux différents

programmes télévisuels.

Les « hauts lieux » de la programmation télévisuelle ayant été déjà étudiés dans leurs

différentes dimensions, le moment est peut-être venu de chercher de nouvelles possibilités

d’explication au phénomène de la compréhension spectatorielle des genres télévisuels

considérés « mineurs » et qui ne constituent pas actuellement un centre d’intérêt particulier

de la recherche.

Parmi ces derniers, on pourrait considérer le vidéo-clip.

Appellation drôle et contradictoire, comme celle d’autres genres télévisuels, car le vidéo-clip

a cessé, depuis longtemps, d’être de la vidéo et d’être un clip.

Pensés au départ comme un petit courtmétrage musical à petit budget pour remplir les

blancs laissés par le hasard de la programmation, ce type d’émission télévisuelle se trouve

aujourd’hui à l’origine de la création des chaînes nationales et transnationales spécialisées1

dans leur diffusion mais constitue également une des branches de la méga-industrie des

1 Parmi les dizaines de chaînes transnationales spécialisées dans la diffusion de vidéo-clips, la chaîne MTV –

dans ses versions USA, Amérique Latine, Europe, Japon, etc. – est, sans aucun doute, la plus importante. MCM en Belgique, M6 en France ou Rock&Pop-Télévision au Chili sont des exemples ponctuels de chaînes spécialisées dans la diffusion de vidéo-clips au niveau national.

n i ! f i c t i on ! n i ! r é a l i t é !

6!

« communications and entertainment »2, qui est parmi les dix activités les plus lucratives de

notre époque.

Depuis plus de vingt ans, le vidéo-clip s’est imposé comme un genre télévisuel perçu, de

manière régulièrement partagée, entre ceux qui le considèrent comme une nouvelle forme

d’aliénation – bâtard ignoble de la publicité et des scopitones, et ceux qui le considèrent

une nouvelle forme d’expression artistique – héritier légitime du ciné-art et de l’opéra

moderne.

Mais en quoi ce genre de programmes intéresse-t-il particulièrement la réflexion sur le statut

des discours télévisuels ?

Une des principales hypothèses de ce travail est que, à la différence des discours factuels et

fictionnels (et de tous les intermédiaires possibles entre les deux), le vidéo-clip ne cherche pas

à construire un autre vraisemblable que celui de la sensibilité du chanteur ou du groupe.

Ceci, qui le distingue de la plupart des autres genres télévisuels, constitue un point de rupture

avec la logique qui divise les discours télévisuels entre les catégories de réalité et de fiction.

S’il était possible de concevoir une poétique télévisuelle, comme le propose Luciano Alvarez

(: 1985), celle-ci devrait considérer le fait qu’un téléfilm, une série ou un feuilleton cherche à

nous procurer une expérience de fiction (ou, comme dit Käte Hamburger [: 1986], de non-

réalité), tandis qu’un vidéo-clip cherche seulement à nous mettre en contact avec une

sensibilité. Et celle-ci ne peut pas être évaluée à partir d’un critère vrai/faux, comme c’est le

cas pour la plupart des discours factuels de la télévision, depuis le Journal Télévisé jusqu’au

documentaire.

Cette caractéristique du vidéo-clip nous conduit tout naturellement à revenir, dans une

perspective réflexive et critique, sur le problème des genres et du statut des discours

télévisuels. Mais nous ne pourrons le faire qu’en considérant cette pratique médiatique dans

sa dimension communicationnelle, c’est-à-dire comme un acte discursif intentionnel

d’origine et à destination humaines : comme une énonciation énoncée.

Notre travail a, donc, deux objets d’analyse, à deux niveaux différents mais

interdépendants : d’une part, un objet empirique, matérialisé dans le vidéo-clip, dont nous

établirons la définition en tant que genre télévisuel et, d’autre part, la théorie des genres

télévisuels, que nous utiliserons aussi bien comme outil d’analyse, que comme objet de

critique, partant de l’analyse phénoménologique du vidéo-clip.

Ce travail comporte quatre étapes principales.

2 Les grands conglomérats trasnationaux des "communications and entertainmen" propriétaires des principales

marques discographiques et des plus grands studios de cinéma et de télévision du monde sont: Disney, Time Warner (propriétaire d’EMI), Bertelsmann, Vaicom, News Corporation, TCI, Sony, General Electric (propriétaire de NBC) et Seagram (propriétaire d’Universal, propriétaire à son tour de Polygram). La quasi totalité des clips diffusés par les chaînes nationales et transnationales de vidéo-musique sont issus de l’une ou l’autre de ces grandes compagnies.

! s e c t i on ! 1 . ! i n t r odu c t i on ! engagemen t s ! e t ! a t t en t e s !

7 !

La première section a pour but de délimiter les marges du problème abordé. Quels sont les

engagements de la chaîne et les attentes que le spectateur construit à partir de la diffusion

d’un programme en particulier ? Qu’attendons-nous des genres télévisuels de fiction et que

nous offrent-ils, les genres qui construisent leur discours sur la réalité ? Entre engagements et

attentes, les caractéristiques distinctives du vidéo-clip semblent le situer au-delà (ou en

deçà) de cette opposition. Comment définir le mode d’énonciation dans le vidéo-clip ?

Contrat de lecture, engagement par rapport à un sens ou promesse de relation à un monde,

le genre est l’outil clé pour la compréhension du statut des discours télévisuels.

Parmi les rares propositions systématisées faites par rapport aux genres télévisuels, la

typologie proposée par François Jost est celle qui s’adapte le mieux à notre problématique.

La théorie des genres télévisuels de l’auteur français se présente comme un système de

classification générique qui a comme point de départ le niveau de la compréhension

spectatorielle et, en même temps, comme une théorie de l’énonciation télévisuelle. Dès lors,

cette proposition devient non seulement notre principal référent théorico-méthodologique,

mais aussi l’objet privilégié de notre analyse et de notre critique théoriques. La deuxième

section de ce travail a comme objet la définition du cadre théorique et des outils qui nous

permettront l’analyse du vidéo-clip.

La troisième section est consacrée à l’analyse concret d'un corpus des vidéo-clips. La

phénoménologie du clip, que nous entendrons ici comme une méthode de description

symptomatique, a le double but de déterminer le mode d’énonciation propre à ce type de

programmes et de déployer l’arsenal conceptuel et méthodologique de la théorie des

genres télévisuels de François Jost. Ceci nous conduira jusqu’aux limites de sa théorie et

quelque peu au-delà.

Objet apparemment paradoxal, le vidéo-clip ne trouve pas, dans la théorie des genres

télévisuels de Jost, une catégorie qui le décrive et qui rende compte du mode d’énonciation

qui lui est propre. C'est seulement en revenant aux sources de la proposition de l’auteur

français, que nous pourrons trouver une issue. Là, dans la Logique des Genres Littéraires de

Käte Hamburger et dans la Théorie des Actes du Langage de John R. Searle, le Je-Lyrique et

le mode d’énonciation poétique nous apparaissent comme la clé pour résoudre le problème

spécifique de la classification du clip. Mais ces éléments exigent, en même temps, de

redéfinir les formes de fonctionnement logique de la Théorie des Genres Télévisuels. La

quatrième section nous permettra de revenir, de manière conclusive, sur la théorie.

Ni fiction, ni réalité, le vidéo-clip va nous permettre de propposer une modeste contribution à

la discussion théorique sur les genres télévisuels.

n i ! f i c t i on ! n i ! r é a l i t é !

8!

I.! ENGAGEMENTS!ET!ATTENTES

A.! PETIT!TRIP!TELEVISUEL!

Ross est éperdument amoureux de Rachel. Nous le savons tous, sauf elle. Dommage, ils

feraient un bien joli couple. La plus affectée par cette situation c’est Monica, la petite sœur

de Ross. Elle est la meilleure amie de Rachel, dont elle connaît tous les rêves et les secrets.

Si les choses semblent de plus en plus compliquées pour Ross et Rachel, elles ne le sont pas

moins pour Chandler, le meilleur ami de Ross. Cela fait des années qu’il est amoureux de

Monica mais, lui, il est plutôt discret et n’a rien dit à personne. Nous sommes les seuls à voir

comment il devient fou lorsqu’il la voit dans les bras de son fiancé, Marc.

Phoebe et Joey sont les éléments les plus imprévisibles du groupe. Elle a décidé d’offrir son

ventre pour porter pendant 9 mois le bébé d’un jeune couple stérile. Joey, de son côté, rêve

sans cesse d’être un acteur de cinéma ou de télévision mais chaque occasion qui se

présente à lui finit par devenir un imbroglio comique insoluble.

Les folies de Phoebe, l’ingénuité infantile de Joey, la pureté de Ross, l’innocente et tendre

beauté de Rachel, la joie contagieuse de Monica et l’esprit critique de Chandler, tous

jeunes, beaux et sympathiques, constituent le meilleur groupe d’amis que l’on puisse

imaginer. Chaque vendredi vers 19h30, le rendez-vous avec la sit’com américaine « Friends »

nous invité à 30 minutes d’humour light avec « les amis les plus fous et les plus sympas de la

télévision » . Chapitre après chapitre, ils nous entraînent dans leurs vies, dans leurs

personnalités et dans leurs projets et, par-là, dans le monde qui les entoure et les façonne.

Nous avons souvent l’impression que la vie dans le monde « Friends » est beaucoup plus

gratifiante que dans le nôtre.

Mais qu’arriverait-il si un jour Chandler, fou de jalousie devant Monica et son petit-ami, sortait

un revolver de sa poche et envoyait trois balles dans la carcasse du rival ? Ou bien si Joey

trouvait un travail comme star gay porno ? Ou si Phoebe préférait avorter du bébé qu’elle

porte dans son ventre ? Qu’arriverait-il si la joie et la légèreté quotidienne du monde de

« Friends » se voyait envahie par le monde sombre et pesant de « X Files » ?

Qu’elles soient ou non plausibles, ces alternatives que nous venons de citer provoqueraient

une profonde rupture avec ce que nous attendons chaque vendredi de la série « Friends » ,

en particulier et d’une sit’com américaine en général, à ce point qu’il ne serait plus possible

de la voir de la même manière qu’auparavant.

! s e c t i on ! 1 . ! i n t r odu c t i on ! engagemen t s ! e t ! a t t en t e s !

9 !

Il est évident que, en tant que téléspectateurs, nous n’attendons pas la même chose de

« Police à New York » que d’« Alerte à Malibu » ou de « Colombo » par rapport à « Ally

MacBeal » . Chaque programme de fiction audiovisuel construit un monde dont la rupture

ou transgression comporte des conséquences pour la communication télévisuelle entre la

chaîne et le téléspectateur.

Étant donné que le monde représenté par « Friends » a la valeur d’un engagement par

rapport au sens du programme, le spectateur pourrait très bien se sentir trahi si cet

engagement n’est pas respecté.

Chaque fois que nous voyons et écoutons un téléfilm, une série, une sit’com et, en général,

un quelconque programme de fiction télévisuelle, nous attendons qu’on nous raconte une

histoire dont la trame, ancrée dans la réalité d’un monde similaire au nôtre ou d’un autre à

cent mille années lumière, s’appuie sur un type de cohérence narrative qui rende

vraisemblable le monde imaginaire créé par le réalisateur.

S’émouvoir, réfléchir ou simplement passer un bon moment, l’engagement par rapport à un

programme de fiction, est celui de donner à voir et à entendre une intrigue soutenue par sa

propre cohérence.

Après « Friends » (et la pub), le moment sera peut-être venu de nous informer des nouvelles

de ce monde. Il est 20h05 et on passe à la dernière édition du JT à la RTBF. Les nouvelles sont,

par définition, une surprise même si notre expérience contredit souvent cette affirmation. Il

est peut-être question de la sécurité alimentaire, d’un nouveau bombardement sur un pays

qui est sorti du rang, de la météo ou des résultats de l’Euro-coupe. Il est probable que nous

apprenions quelque chose de nouveau ou que simplement nous suivions les derniers

rebondissements de la saga du moment. La seule certitude est que nous allons entrer en

contact avec la « réalité des faits » .

Mais, quelle réalité ?

Au-delà de notre sens commun, la plupart d’entre nous n’a pas les moyens de constater

immédiatement si ce que nous raconte chaque soir le présentateur du JT de la RTBF a

réellement eu lieu ou si cela a bien eu lieu tel qu’il nous le raconte. Si rien ni personne ne met

en doute la dernière nouvelle dans l’affaire de la « vache folle » , il n’y a pas de raison pour

changer notre bonne opinion sur le JT et sur la presse en général. Mais si, au contraire, pour

une raison quelconque, nous apprenions que cette information, qui nous a fait changer nos

habitudes et nous a, surtout, fait peur jusqu’à en perdre l’appétit, n’était que le fruit de

l’imagination d’un journaliste surréaliste qui a voulu égaler les effets mythiques de la “ Guerre

des Mondes ” de Wells, alors nous nous sentirions aussi trahis que lorsque la cohérence du

monde fictionnel se brise, même si les enjeux sont différents.

Inattendues ou pas, les nouvelles et la forme dans laquelle elles sont présentées constituent

aussi un engagement basé, contrairement à la fiction, sur la confiance accordée au fait que

n i ! f i c t i on ! n i ! r é a l i t é !

10!

ce qui est raconté est une version de la réalité qui s’appuie sur les faits de notre monde

d’expériences réelles. Lorsque nous regardons un JT nous attendons que l’information soit

véritable et authentique.

Enfin si, déjà informé, le téléspectateur se livre au plaisir du zapping, il est possible qu’il

s’arrête une fois de plus, sur MTV.

Comme chaque jour, à n’importe quelle heure, le chaîne transnationale de vidéomusique,

ne cesse pas de programmer des vidéo-clips. Sur le petit écran, voilà, Gwen Stephani,

chanteuse du groupe pop USA “ No Doubt ”. Elle interprète le thème “ Ex-girlfriend ” (Retourn

of Saturn, 2000), un vidéo-clip parmi les centaines qui défilent chaque semaine sur MTV et

qui, comme des gladiateurs musicaux, luttent pour arracher une bonne place dans le

ranking. Cette fois, la chanteuse et son groupe sont les protagonistes d’une histoire d’agents

secrets et mafieux et, en même temps, ils sont les interprètes de la chanson. C’est-à-dire qu’ils

sont des acteurs interprétant des personnages dans une histoire de fiction et, en même

temps, ils sont eux-mêmes, les membres authentiques du groupe No Doubt chantant sur un

plateau. Pendant la durée du vidéo-clip, les paroles de la chanson, chantées par Gwen

Stephani aussi bien dans le plateau que dans l’intrigue, nous racontent une histoire de

déception amoureuse et de révolte d’une jeune fille abandonnée par son petit-ami et

remplacée par une autre. Les paroles, chantées à la première personne, semblent indiquer

que le récit correspond à une expérience vécue par la chanteuse. Pourtant, la mise en

scène visuelle de l’histoire, qui a comme protagoniste Gwen Stephani elle-même, indique

qu’il s’agit d’une fiction. Loin de la parodie, tous les indices de l'histoire connotent la

tragédie ou le drame, alors que le rythme et les images du public et des membres du groupe

vibrant au son de la musique, incitent à la danse au divertissement1.

Hier, Gwen était une chanteuse de jazz des années 20 dans “ Trapped in a Box ” (No Doubt,

1992), demain elle sera une fiance désespérée qui doit choisir entre trois prétendants dans

“ Simple Kind of Life ” (Retourn of Saturn, 2000), mais en même temps, à chaque fois, elle sera

aussi elle-même : la chanteuse du groupe pop. A chaque fois, la musique nous fera danser à

son rythme et chaque nouveau clip apportera son lot de surprises.

Lorsqu'il s'agit de voir et d'écouter un vidéo-clip, la seule certitude, c'est la musique.

Alors que les haut-parleurs du téléviseur crachent rythmes et accords, sur le petit écran il peut

se passer de tas de choses. Histoires insolites jamais imaginées ou clichés ressassés mille fois.

Le vidéo-clip est le lieu de rencontre de tout le déjà vu et de tout ce qui nous reste à voir.

Tant qu’il y a de la musique, rien de ce qui nous verrons ou comprendrons des paroles d’une

chanson (pour autant qu’il y ait des paroles) n’éveillera en nous le sentiment de trahison.

Pourtant, le clip peut démarrer tout de suite avant la musique ou finir après elle; celle-ci peut

être interrompue à la moitié pour marquer une action dans l’intrigue et continuer ensuite. Le

1 Voir annexes : “ Ex-girlfriend ”

! s e c t i on ! 1 . ! i n t r odu c t i on ! engagemen t s ! e t ! a t t en t e s !

11 !

clip “ Cartoon Heroes ” (Aquarius, 2000) de la bande danoise Aqua, commence 42 secondes

avant la chanson et ce qui y arrive pendant cette période de temps est fondamental pour

comprendre la trame et l’esthétique des images et des paroles de la chanson. Le court

dialogue final entre les deux jeunes protagonistes du clip “ It's my life ” (Crush, 2000) du

chanteur pop/rock Bon Jovi, permettent, enfin, de donner un sens au vertigineux récit

développée en trois minutes que dure la chanson. Enfin, dans le clip “ Bye, bye, bye ” (No

Strings Attached, 2000) de la boys-bande Nsync, la musique est interrompue pendant cinq

secondes, 60 secondes avant la fin, pour mettre en valeur un geste de rupture diégétique

que réalise un des chanteurs-personnages en plein milieu d’une pour-suite en voiture2.

La musique n’est pas non plus une règle rigide et invariable dans le clip.

Ce que nous attendons de la fiction audiovisuelle, c’est la cohérence narrative du monde

inventé, l’engagement du JT concerne l’authenticité de ce qui est donné à voir ou à

entendre…

Quant au vidéo-clip… que pouvons-nous attendre du Vidéo-clip ?

B.! REALITE!OU!FICTION?!

Les discours de réalité et ceux de fiction, bien que difficiles à distinguer parfois,

correspondent à deux systèmes de vérité différents qu’il est impossible de comparer avec les

mêmes paramètres. Tandis qu’un documentaire trouve sa valeur dans l’application d’un

critère de vrai/faux, un film ne peut être évalué qu’à partir de sa cohérence narrative. Rien

n’oblige la réalité à être cohérente ni la fiction à être vraie.

Lorsqu’il s’agit de télévision, la frontière entre fiction et réalité est souvent décrite comme

fragile et incertaine. A la différence des autres médias, comme le cinéma ou la radio qui

privilégient un des deux pôles, la télévision peut passer de la réalité à la fiction à la vitesse du

zapping ou en franchissant la mince barrière de la pub qui sépare le JT d’une série à la

mode.

Une des caractéristiques les plus évidentes de la télévision est la grande diversité de

programmes qu’elle accueille, combine, mélange et recycle, dans le flux perpétuel de son

devenir. Le “ tout fictionnel” de Metz et le “ tout réel ” de Godard3 sont des positions

extrêmes difficiles à soutenir dans un média comme la télévision qui nous offre, aussi bien

l’expérience du contact direct avec la réalité même la plus éloignée, que les mondes

imaginaires du « cinéma à la maison ».

2 Voir annexes : "Cartoon Heroes"; "It's my life"; "Bye, bye, bye". 3 "Si l'on peut soutenir à la fois que tout film est un film de fiction (Christian Metz) et que tout film est un

documentaire (Jean-Luc Godart), c'est bien que l'on n'a pas trouvé le critère qui permettrai de discriminer ce moment où le document bascule dans un autre univers de sens". (Jost, F., 1995).

n i ! f i c t i on ! n i ! r é a l i t é !

12!

Parmi ces produits télévisuels, on trouve, bien entendu, le vidéo-clip

Concernant les programmes télévisuels, l’allusion au « mélange de réalité et de fiction » est

une solution facile mais parfois trompeuse. En général, l’idée de « mélange réalité-fiction »

ne distingue pas entre le niveau de procédés de mise en scène, réalisation et post-

production de chaque système et les engagements et attentes par rapport aux discours de

réalité et de fiction qui fondent la communication télévisuelle et notre connaissance et notre

expérience en tant que téléspectateurs.

D’un point de vue formel, le reality show a recours à l’utilisation des procédés d’usage

régulier et intensif dans la fiction, comme la mise en intrigue, la mise en scène, le raccord, la

participation d’acteurs jouant un rôle, etc. Connoté par son « effet de fiction » , le reality

show est souvent pris comme exemple du mélange réalité-fiction. Or, ce type de

programme, qui ne se basent pas seulement sur les faits de la réalité mais prétendent en être

une version exhaustive – au point de les reconstituer – ne peuvent pas se donner le luxe de

traverser allègrement l’abîme profond qui sépare la réalité de la fiction sans provoquer de

sérieux problèmes éthiques. Acceptés (ou tolérés) comme des versions de la réalité, les reality

shows, à la différence des autres programmes de fiction, sont soumis à la réalité. Au-delà de

l’utilisation des procédés fictionnels dans le reality show, l’engagement de la chaîne par

rapport à ce type de programmes concerne leur ajustement aux limites des faits de la réalité.

Ce n’est pas le cas lorsque la fiction fait appel à des documents historiques, comme le fait le

film “ Forrest Gump ” (Robert Zemeckis, 1993), dans lequel on ré-interprète, en lutte ouverte

avec notre savoir sur la réalité, toute une série d’événements de la seconde moitié du XXe

siècle, sans que ce longmétrage ait subi, pour autant, des censures, déqualifications ou

polémiques éthiques sérieuses.

Suivant ce raisonnement, il serait logique de penser que le vidéo-clip correspond plutôt à un

type d’engagement similaire à celui de la fiction puisqu’il n’y a aucune possibilité de

soumettre ce type d’émissions à un critère vrai/faux. Le clip « Ex-girlfriend » ne prétend pas

que nous croyons que Gwen Stephani est réellement un agent secret qui a pour mission

d’éliminer un mafieux, ni qu’elle tombe, réellement, du haut d’un gratte-ciel dans la scène

finale du clip. Si nous ajoutons à cela la création fréquente de mondes diégétiques

fictionnels dans les clips, la question semble claire et résolue.

Mais, à la différence de la plupart des genres fictionnels, le vidéo-clip se caractérise par la

rupture drastique avec la plupart des conventions de la fiction classique : de l’absence de

cohérence narrative, à l’opacité du dispositif d’enregistrement, en passant par les fréquentes

ruptures dans la diégèse, par les sauts de raccord et surtout, par le regard persistant des

chanteurs à la caméra.

Un exemple clair de la difficulté à pour définir le caractère réel ou fictif du discours dans ce

type de programme, peut être donné par le clip « Maria, Maria » (Supernatural, 2000) du

! s e c t i on ! 1 . ! i n t r odu c t i on ! engagemen t s ! e t ! a t t en t e s !

13 !

légendaire guitariste et compositeur rock Carlos Santana. Partant de l’analyse de la

narration au niveau visuel, nous voyons qu’elle est constituée par deux séries

syntagmatiques4 principales en alternance. La première, divisée en deux sous-séries, nous

montre Santana et son groupe interprétant la chanson sur une scène et aussi à l’intérieur

d’une pièce. La sous-série du jeu sur scène est construite comme dans le registre d’un récital

en direct : nous voyons le groupe sur une scène et le public vibrer et danser au rythme de la

musique interprétée par les composants. La sous-série réalisée à l’intérieur d'une chambre,

est construite de manière plus ambiguë et on ne voit pas clairement s’il s’agit d’une

répétition, d’une interprétation privée, d’un enregistrement destiné à un media ou d’un

fragment d’un autre clip. La deuxième série correspond, elle, à l’histoire fictionnelle. Le

personnage principal, qui s’appelle sans doute Maria, une belle métisse d’origine latino-

américaine, vérifie son maquillage devant un miroir. Elle s’apprête à sortir. Elle quitte sa

maison pour se rendre au concert de Santana. Une fois arrivée, elle se mêle au public qui

chante et qui danse au rythme de la musique. Tandis que tout ceci se passe, la chanson

nous raconte des fragments de l’histoire d’une femme latine – Maria – vivant dans un quartier

pauvre de New York, qui veut devenir une star de cinéma. Les indices diégétiques, filmiques

et profilmiques privilégient une interprétation dans le sens d'une complémentarité entre la

diégèse des paroles de la chanson et celle de la série de la bande-image. Les gestes

relationnels des personnages et l’enchaînement des paroles de la chanson avec les images

induisent à penser que la femme que nous voyons est Maria, protagoniste de la chanson et

du clip.

Tandis que la série un (Santana, le musicien, jouant en direct) nous renvoie à la réalité de

l’interprétation de la chanson, la série deux (Maria, le personnage) nous situe sur le plan de la

création d’un monde diégétique imaginaire. Ces deux séries, prises chacune séparément,

nous posent le problème de la construction d’un système de vérité différent. Le problème se

complique encore davantage lorsque les deux séries se mélangent, c’est-à-dire lorsque le

monde imaginaire entre, à travers l’héroïne (Maria) dans le monde de nos expériences

réelles et authentiques, qui forment le monde que nous partageons avec Carlos Santana, le

chanteur qui existe et qui chante avec son groupe. Des actants fictifs et des actants réels se

mêlent pour construire la narration audiovisuelle. Ni la fiction, ni l’authenticité ne parviennent

à constituer vraiment un tout et, dès lors, l’énonciation devient un voyage constant entre le

réel et l’imaginaire et finit par con-fondre la réalité et la fiction.

Ce problème, qui touche le statut de la réalité du discours dans le clip et qui est au centre du processus de compréhension de ce type de programmes, est justement la matière principale de ce travail.

4 Niveau propre à l’analyse sémiologique proposé par Metz dans la "Grande Syntagmatique". Voir chapitre

V.A.

n i ! f i c t i on ! n i ! r é a l i t é !

14!

C.! LES!CARACTERISTIQUES!DISTINCTIVES!DU!VIDEO=CLIP!

Toute tentative de définition d’un type de programme a comme point de départ obligé

l’établissement des traits qui permettent de le distinguer des autres dans une même sphère

médiatique. Ces caractéristiques distinctives correspondent à la promesse de sens

particulière d’un programme.

Parmi l’ensemble des critères utilisés pour la description des documents audiovisuels, les

aspects esthétiques, textuels, stratégiques et médiatiques, constituent traditionnellement les

principaux référents de la critique, de la sémiologie, de l’analyse de discours et de la

médiologie.

Nous allons voir maintenant si ces aspects sont suffisants pour définir la manière dont le

téléspectateur comprend le vidéo-clip.

1.! LA!DISTINCTION!ESTHETIQUE!: !L ’IMAGE!STROBOSCOPIQUE!

La plupart du temps, voir et entendre un clip consiste surtout à être bombardé d’images et

de rythme. D’une façon qui pourrait nous sembler paradoxale, le dispositif audiovisuel du

vidéo-clip, qui a comme but principal la musique est, en même temps, le point de départ

d’un éclatement d’images qui finissent par s’imposer par rapport au thème musical :

“ (…) le clip vise à rompre le flux banalisé des programmes par l'injection d'une overdose

d'images, une mise en scène intensive. Le ravissement du téléspectateur par une image

captivante. ” (Vernier, J-M, 1986, p, 130).

Ces brefs programmes audiovisuels, qui peuvent compter jusqu’à une moyenne de 0,6 plans

par seconde ! (comme le vidéo-clip “ Sex bomb ”5) , agissent sur la perception du

téléspectateur de manière similaire aux pulsations d’une lumière stroboscopique. Cette

surcharge de stimuli qui comblent l’espace et les haut-parleurs dans une juxtaposition

frénétique et obsessionnelle, constitue la caractéristique esthétique la plus représentative du

vidéo-clip.

Un clip peut condenser, en trois minutes d’édition, une variété d’effets spéciaux et des

techniques audiovisuelles supérieure à celle utilisée par des films à grand budget :

“ (...) dans ce qu'on nomme clips, c’est-à-dire n'importe quoi de visuel mis sur une chanson,

on trouve certes de tout, de tous les budgets et de toutes les qualités, mais parfois des

choses superbes de vie et d'invention, dans lesquelles la verve du dessin animé se combine

avec la présence charnelle de la prise de vue. Tout un arsenal de procédés s'invente ou se

retrouve là, une joyeuse rhétorique de l'image ” (Chion, M. 1990).

5 Voir annexes : Tom Jones, Reload, 2000.

! s e c t i on ! 1 . ! i n t r odu c t i on ! engagemen t s ! e t ! a t t en t e s !

15 !

Tout ce dont est capable l’industrie du cinéma et de la télévision, nous pouvons le trouver, le

voir et l’entendre dans les vidéo-clips. Tout ce qu’il y a de plus génial et de plus lamentable.

Ce constat ne se limite pas à l’usage de la technologie digitale et aux effets spéciaux de la

dernière génération, qui constituent d’ores et déjà un aspect hyper-développé dans le clip

mais s’étend aussi à l’ensemble de techniques analogues, traditionnelles ou non, de

tournage, d’édition et de post-production et, de manière plus particulière, aux thématiques

et formes de construction du récit et de la narration audiovisuelle. Tout ce que l’on peut

imaginer et ce que l’on n’oserait pas imaginer, tout cela se trouve déjà dans le clip.

Rien ne contraint le clip à la construction d’un récit clôturé (“ Cartoon Heroes ”)6 ou ouvert

(“ Rise ”)7 ni au développement d’une narration linéaire (“ Take a look Around ”)8 ou

fragmentée (“ Californication ”)9. Il n’est pas soumis non plus à une quelconque règle qui

régule le rapport image-son dans la construction de la narration. L’histoire que nous

racontent les paroles de la chanson peut ou non avoir relation avec ce que nous racontent

les images (“ Free Styler ”)10. Mieux encore, rien n’oblige un vidéo-clip à raconter (“ Sex

Bomb ”), bien que la plupart des clips produits par l’industrie de la vidéo-musique manifestent

une tendance narrative. Enfin, la construction de l’enchaînement des images peut respecter

ou non les règles du raccord et de la continuité caractéristiques de la plupart des genres du

cinéma et de la télévision : la continuité et le raccord en “ Caught Out There ”11 de Kelis, sont

constamment transgressés au point que l’on peut affirmer que cette production est

construite à partir de cette transgression; par ailleurs, “ Thriler ”12 de Michael Jackson respecte

les normes traditionnelles du CRNI13 en ce qui concerne l’effacement de la production et de

la continuité).

Bien plus qu’une traduction en images des contenus des paroles d’une chanson, le vidéo-

clip semble chercher l’interprétation visuelle des caractéristiques propres à la musique

moderne :

6 Voir annexes : Aqua, Aquarium, 2000 7 Voir annexes : Gabriel, Rise, 2000. 8 Voir annexes : Limp Bizkit, Chocolate starfish and the hot dog flayvoured, 2000. 9 Voir annexes : Red Hot Chili Peppers, Californication, 2000. 10 Voir annexes : Bomfunk MC's, In Stereo, 2000. 11 Voir annexes : Kelis, Kaleidoscope, 2000. 12 Voir annexes : Michael Jackson, Thriller, 1983. 13 CNRI : ce sont les sigles du Cinéma Narratif, Représentatif, Industriel. Ce fut l’objet d’étude de Christian

Metz autour duquel il a développé la “Grande Syntagmatique du cinéma” (Metz Ch., 1968/1973).

n i ! f i c t i on ! n i ! r é a l i t é !

16!

“ (...) si el telediario pretende hacer partícipe al lector del acontecimiento, si el fútbol

pretende hacer vivir al televidente el partido, el video-clip le proporciona el sentir la

música ”14. (Del Villar, R. 1997, p, 93).

La succession vertigineuse des images, l’obsession du mouvement perpétuel, la décharge

frénétique de couleurs, la rupture et la discontinuité, enfin l'esthétique du clip, cherchent à

reproduire, dans l’image, la sensation que produit la musique moderne commerciale dans

nos sens.

Cette traduction en images du rythme de la chanson implique que l’action discursive du

montage visuel ne se limite pas seulement au contenu sémantique des paroles de la

chanson mais qu’elle incorpore les caractéristiques pulsionnelles et énergétiques du texte

musical, ce qui constitue un des principaux traits esthétiques du clip.

2.! LA!DISTINCTION!TEXTUELLE!: !LA!LIBERTE!D’IMAGE!ET!DE!SON!

Il semble évident qu’un vidéo-clip est la mise en images d’une chanson. Pourtant cela ne

suffit pas à expliquer ses caractéristiques distinctives au niveau textuel.

Que ce soit l’opéra, dans toutes ses versions, ou les variétés télévisées, l’objet est le même

que dans les clips : mettre en image un texte musical. Pourtant, les unes et les outres doivent

toutes deux respecter certaines conventions auxquelles échappe, en règle générale, le clip.

Dans l’opéra, le texte de la chanson, ainsi que l'œuvre musicale elle-même, sont inscrits dans

l’intrigue, c’est-à-dire, qu’ils remplissent une fonction dans la construction du récit. Ici, c'est

l'histoire, ses personnages et l'univers créé – la diégèse –qui organisent la musique et les

paroles de la chanson. Qu’il s’agisse d’un opéra baroque ou d'un musical hollywoodien, les

pièces musicales sont le fil conducteur du récit, mais uniquement si elles sont intégrées dans

la diégèse. A l’autre extrême, les variétés télévisées n’ont pas d’autre prétention que celle

de montrer le chanteur “ comme si ” nous étions dans les gradins ou dans un de ses récitals.

Nous le voyons chanter face au micro et jouer les instruments (même lorsque le play-back est

évident). Il n’y a pas d’histoire, pas de récit autre que celui que peut véhiculer le texte de la

chanson. Comme « au début du cinéma » , la caméra ne joue pas d’autre rôle que celui de

nous décrire ce que fait le chanteur ou la bande pendant qu’ils jouent le morceau.

Ce qui se passe dans le vidéo-clip est très différent. A la différence de l’opéra, la musique ne

s’adapte pas à la diégèse mais, au contraire, elle la précède. Y compris pour des raisons de

production, la chanson existe avant sa version audiovisuelle15. L’audiovisuel est construit

14 "(...) si le journal télévisé prétend faire participer le lecteur à l’événement, si le football prétend faire vivre le

match au téléspectateur, le vidéo-clip lui permet de sentir la musique". Notre traduction. 15 La division du travail dans l’industrie discographique non seulement sépare les tâches du chanteur et sa

production discographique de celles du réalisateur audiovisuel mais établit, en outre, un ordre temporel et une séquentialité entre elles, puisque la tâche du réalisateur a comme matière première la chanson ou le thème musical.

! s e c t i on ! 1 . ! i n t r odu c t i on ! engagemen t s ! e t ! a t t en t e s !

17 !

autour de la musique et non pas à partir de l’intrigue comme dans l’opéra ou dans le music-

hall. Cette construction sera libre ou bien liée aux contenus diégétiques des paroles de la

chanson, cela dépendra du but du réalisateur, non pas d’une loi propre au genre. Par

ailleurs, la caméra et le montage ont, dans le vidéo-clip, une vocation énonciative. Tandis

que dans les variétés télévisées toute la musique est là pour être décrite dans son exécution,

dans le clip, elle est productive, elle est toujours le point de départ d’un discours.

Dès lors, la musique est une condition dans le vidéo-clip, mais ce n’est pas cela qui le définit

ni le caractérise du point de vue textuel.

Ce qui caractérise la textualité du vidéo-clip, c’est le rôle que joue la musique dans

l’organisation textuelle. Dans ce même sens, et si nous élargissons le champ de la

comparaison, nous pouvons affirmer que cette caractéristique textuelle de la médiation

audiovisuelle, non seulement distingue le clip de l’opéra et des variétés, mais aussi de la

plupart des pratiques médiatiques audiovisuelles.

Dans le vidéo-clip, la musique semble libérer l’image.

Cette qualité textuelle propre au vidéo-clip est justement un des éléments qui permettent

son énorme champ de possibilités expressives par rapport aux autres types de production.

Dans l’audiovisuel narratif le processus de diégétisation (construction de l’espace comme un

monde16) établit l’existence d’une relation de dépendance mutuelle entre la bande de son

et l’enchaînement des images, indépendamment du fait qu’il s’agit de fiction ou de

documentaire, ce qui est raconté par les images doit établir, à travers la diégèse, une

relation – soit de complémentarité ou de contradiction - avec ce que nous raconte la voix

“ over ” ou “ in ” du narrateur ou des personnages. Dans ce cas, la musique, comme les

couleurs ou la textures de l’images, sont des attributs du monde construit et correspondent à

des qualités spécifiques de la diégèse qui ne trouvent leurs sens qu’en son sein. En général, la

musique joue un rôle de ponctuation de l’intrigue.

Dans le vidéo-clip, par contre, du fait que c’est la musique et non pas l’intrigue qui en est

l’élément structurateur, le processus de diégétisation peut établir divers types de relation

entre le récit des images et celui des paroles de la chanson. Ainsi, loin de restreindre le

rapport à une dépendance, dans le vidéo-clip celui-ci peut être complémentaire,

contradictoire ou juxtaposé, raison pour laquelle les façons de construire l’énonciation

audiovisuelle dans le vidéo-clip, au niveau de la médiation audiovisuelle, sont beaucoup plus

“ libres ” que dans les productions qui doivent se plier, de manière plus ou moins stricte, à des

normes de relation entre l’image et le son pour être comprises.

Un exemple clair de ce que nous venons de signaler, peut être constaté lorsqu’il existe deux

ou plusieurs versions audiovisuelles du même thème musical. Les deux versions du vidéo-clip

“ Natural Blues ” (Play, 1999) du DJ. Moby, sont complètement différentes en ce qui

16 Voir chapitre IV, A, 2 : "Diégèse et diégétisation"

n i ! f i c t i on ! n i ! r é a l i t é !

18!

concerne l’intrigue proposée dans les différentes bandes-image tandis que le thème musical

– paroles et musique – ne connaît aucune variation17.

Cette “ liberté ” du clip, au niveau de la construction textuelle, permet au réalisateur de

disposer d’une grande marge d’expression, ce qui se concrétise aussi bien dans les contenus

thématiques que dans la variété des techniques et d’esthétiques auxquelles on fait appel

dans ce type de productions.

3.! LA!DISTINCTION!STRATEGIQUE!: !LA!PERSUASION!CACHEE!

Le but dernier de toute stratégie de marketing est d’influer sur la volonté d’achat du

consommateur potentiel, c’est-à-dire, de le persuader d’acheter un bien, un service et/ou

une idée déterminés. Un des instruments par excellence de cette stratégie est la publicité. La

publicité est l’outil à travers lequel on cherche à placer un produit, c’est-à-dire lui faire

occuper une place spéciale dans le marché, lui apporter une reconnaissance – le doter

d’une identité – et lui assigner une personnalité spécifique et distinctive – l’associer à une

qualité.

“ La identidad reenvía a la marca y la cualidad a atribuirle un valor al producto (...) serán

dicho atributo y la identificación las que determinen la opción de compra. ”18 (Del Villar, R.

1997).

Mais c’est avec la publicité télévisuelle proprement dite, qui se développe de manière

distinctive à partir des années 70, que la communication médiatique persuasive connaît un

saut qualitatif qui la situe dans la place qu’elle occupe aujourd’hui19.

“ Elle [la publicité télévisuelle moderne] se caractérise 'par la tendance á délier le spot du

produit' : désormais, 'on part du principe que le produit se vendra si l'enchaînement des

images qui lui sont associées parvient á séduire l'imaginaire du consommateur'. On met en

scène des 'concepts' (la jeunesse, le naturel...) auxquels les produits (une boisson, un

produit de beauté...) vont être judicieusement associés, les rendant ainsi désirables pour le

(télé)spectateur-consommateur. (...) c'est que la 'réclame' a su se transformer : le spot, tout

au moins durant une longue période, a su imposer l'idée qu'il n'était pas que stratégie mais

aussi - et surtout - création. ” (Lochard, G. et Boyer, H.1995, pp. 139 et 147).

Dans la même ligne que le vidéo-clip, le spot publicitaire échappe aux restrictions

esthétiques et textuelles dans la construction du message persuasif télévisuel par la voie de la

créativité qui, en d’autres mots, n’est autre chose que la liberté de sélection et combinaison,

17 Voir annexes : Moby, Natural Blues, 2000, 1 et 2. 18 "L’identité renvoie à la marque et la qualité attribue une valeur au produit (…) cet attribut et l’identification

déterminent l’option d’achat". Notre traduction. 19 Le lecteur pourra trouver une bonne bibliographie à ce sujet dans : Hennion, A., et Meadel, C., "La question

sans réponse : un parcours bibliographique de l'enjeu publicitaire", Réseaux, n° 42, juillet-août 1990.

! s e c t i on ! 1 . ! i n t r odu c t i on ! engagemen t s ! e t ! a t t en t e s !

19 !

sans restrictions, des possibilités de médiation audiovisuelle et générique. Au royaume de la

créativité télévisuelle, le vidéo-clip et le spot sont, aujourd’hui, les protagonistes indiscutés.

Ainsi posé en termes fonctionnels, le clip musical et la publicité télévisuelle ne semblent pas

se différencier beaucoup. Depuis ses origines, le vidéo-clip a eu un rôle important dans le

cadre des stratégies de marketing de l’industrie discographique. Son origine même est liée

au besoin de diffuser et de promouvoir les produits de l'industrie musicale à travers la

télévision. De même que la publicité, une des fonctions les plus importantes du vidéo-clip, du

point de vue de la production, est celle de placer les produits discographiques dans le

marché de la musique. Le clip, en tant qu’instrument de promotion, cherche à placer la

chanson et/ou l’album, à travers sa diffusion et la construction d’une identité de l’interprète

(personnification d’un stéréotype socio-relationnel précis) et la réitération de ses qualités

distinctives. Dans ce sens, nous verrons que c’est le chanteur (ou le groupe) qui remplit la

fonction d’interface dans le processus de positionnement, entre le niveau à court terme,

celui du disque ou album, et celui à long terme, qui est celui de la production et

reproduction du mode de consommation des produits de l’industrie musicale.

Si nous suivons la performance de groupes apparemment opposés, comme les Destin Child

et Blink-182, par exemple, nous voyons que chacun de ces groupes est constitué à partir de

la construction de personnages stéréotypés, avec un mythe d’origine, une personnalité et

une proposition relationnelle avec un public donné. Minutieusement travaillés par le

marketing, chaque nouveau clip est l’occasion de réitérer et de renforcer cette construction

qui met en marche tout un potentiel imaginaire de l’industrie de fabrication d'“ idoles ”. La

relation entre le chanteur (ou le groupe) et le public se constitue dans le clip de manière

beaucoup plus importante que dans les autres moyens et techniques de diffusion de produits

discographiques, c’est-à-dire qu'ici se produit un processus d’identification du

consommateur avec les deux facettes du produit musical (chanteur et discographie).

Chaque groupe va occuper une place dans le marché de la musique et/ou concurrencer

d’autres pour se placer au plus haut niveau. Pour réaliser cette tâche, le vidéo-clip va jouer

un rôle central. C’est-à-dire que, dans le contexte de la communication persuasive

télévisuelle, le vidéo-clip, tout comme la publicité, est l’instrument avec lequel on construit

l’identité d’un produit musical (du chanteur ou du groupe et du disque ou de l'album) et qui

permet de lui associer une valeur, dans le but d’influencer la volonté du consommateur et,

principalement, sur ses habitudes de consommation.

Pourtant, cette fonction de promotion, propre à la communication persuasive, prend dans le

clip un caractère particulier qui le distingue et l’éloigne définitivement du spot télévisé.

Dans une perspective pragmatique il y a, au moins, deux éléments qui interviennent de

manière décisive dans la distinction sémantique entre le clip musical et le clip publicitaire.

D’une part, tandis que la publicité occupe un espace et un temps extra-programmatiques

en marge de la grille de programmation, le Vidéo-clip a le statut de programme. Cette

n i ! f i c t i on ! n i ! r é a l i t é !

20!

catégorisation différentielle de la publicité par rapport à l’ensemble des productions qui

constituent la grille programmatique d’une chaîne (très fortement sujette dans certains pays

à des normes de contrôle légal) empêchent qu’elle puisse effacer les traces de son action

persuasive. C’est-à-dire, le contexte de la communication qu’établit la publicité télévisuelle

rend explicites ses intentions commerciales ou utilitaires et la condamne à être perçue

comme telle. Ce composant contextuel de la rhétorique publicitaire conditionne la relation

et l’action établies par les stratégies de promotion et marketing par rapport au

téléspectateur et de celui-ci par rapport à la communication persuasive20.

Deuxièmement, l’effacement de la condition persuasive dans le clip opère aussi à partir du

caractère de réalisation artistico-expressive qui lui est associé. Comme nous le verrons de

manière plus détaillée dans le chapitre VI, un des éléments discursifs les plus caractéristiques

du clip est la condition artistique attribuée aux composants musicaux, poétiques et

audiovisuels de l’énoncé. La construction discursive du clip comme œuvre ou énoncé

artistiques, au-delà du concept de créativité associé également à la publicité, se réalise à

partir d’un processus inférentiel complexe, que nous développerons dans le chapitre

correspondant, mais qui se rapporte, essentiellement, à l’utilisation d’indices culturellement

associés à l’art ou à la pratique artistique, tels que la signature du réalisateur21; la promotion

du ou des interprète(s) à la qualité d’acteur(s) à partir de l’attribution d’un rôle qu’ils doivent

jouer dans la diégèse du clip; l’utilisation fréquente de références à des productions

cinématographiques connotées22; l’utilisation du montage hors raccord23 et autres éléments

d’opacité énonciative qui renvoient au registre du discours par delà celui du récit, l’utilisation

fréquente de métaphores poétiques, parmi tant d’autres possibilités.

Le spot, fréquemment auto-défini comme “créatif”, n'atteint pas la qualification “artistique”,

bien que les éléments plastiques et esthétiques mis en jeu soient très similaires à ceux de l'art

audiovisuel. La prééminence du produit comme objet de désir et l’opacité de l’énoncé

séducteur, empêchent le spot d'appartenir au domaine de “ l’artistique ”, malgré l'existence

de nombreux festivals de spot.

20 Dans les programmes d’achat par télévision cette situation n’est pas différente puisque les chaînes qui les

émettent ont l’obligation et la précaution de méta-communiquer leur caractère persuasif. 21 Il s’agit souvent de directeurs de cinéma : Julien Temple, directeur anglais de Débutants (1986) et

Pandemonium (1999), entre autres. Il a travaillé avec David Bowie, Billy Idol et Culture Club. - John Sayles, réalisateur indépendant, avec des films comme Baby It 's You (1983) et Lone Star (1996). Il a dirigé de nombreux vidéos pour Bruce Springsteen. - Spike Lee, directeur de Fait ce qu’il faut et Malcolm X, parmi tant d’autres. Il a dirigé Eros Ramazotti dans "Les choses de la vie" et la chanteuse Chaka Kan. - Alex Proyas, directeur de "Le Corbeau" et "Une ville dans les ténèbres". Il a travaillé en Australie avec Crowded House. - Russell Mulcahy, directeur de Highlander Il a réalisé la plupart des vidéos d’Elton John. - Paul Thomas Anderson, réalisateur de Magnolia et Boogie Nights Il a dirigé des clips pour Fiona Apple et Aimee Mann.

22 Voir chapitre VI, B : "L'effet de fiction". 23 "Raccord" : lien ou continuité d’un plan à un autre sans qu'il y ait un saut. Il y a des raccords de mouvement,

de regard, de couleur, de lumière, de son, etc., il y en a aussi qui combinent quelques-uns de ces éléments.

! s e c t i on ! 1 . ! i n t r odu c t i on ! engagemen t s ! e t ! a t t en t e s !

21 !

Vu sous l’angle de la perspective stratégique, le vidéo-clip se distingue de la publicité par le

fait de masquer son intention persuasive tout en réalisant les objectifs de promotion et de

positionnement des produits musicaux.

A la distinction éthique et à la distinction textuelle du vidéo-clip, nous devons ajouter

l’effacement des traces de sa condition rhétorique.

4.! LA!DISTINCTION!MEDIATIQUE!: !LA!FIGURE!DU!CHANTEUR=GROUPE!

Tout ce que nous avons vu jusqu’ici tend à confirmer ce que nous avancions au début de ce

chapitre et qui, d’une certaine façon, appartient au sens commun de tout téléspectateur :

la musique est un des éléments principaux dans le dispositif d’énonciation médiatico-

audiovisuelle du vidéo-clip. Pourtant, si la promesse du clip se limitait à la musique, il n’y

aurait aucune différence entre écouter une chanson et la voir ou l’entendre à la télévision.

Or, tout au contraire, un changement fondamental s’opère dans la métamorphose que subit

la chanson lorsqu’elle passe de l’audible à l’audiovisuel et du radiophonique au télévisuel.

Tout comme l’adaptation d’un roman au cinéma produit une restriction de l’imaginaire

associé à l’acte de la lecture (restriction due essentiellement au caractère analogique du

récit filmique), l’adaptation d’une chanson au vidéo-clip semble opérer une réduction de

l’imaginaire de l’individu par rapport à l’expérience musicale. Mais, malgré cette similitude

superficielle entre ces deux processus d’adaptation, il y a une différence fondamentale qui

constitue la promesse la plus importante du clip.

L’adaptation d’un roman au cinéma est, généralement, un processus de traduction des

contenus narratifs et diégétiques du langage écrit à l'audiovisuel. Par ce processus, la phrase

se dilue dans la séquence, la lettre dans l’image et le son; le roman doit cesser d’exister en

tant que tel pour laisser place au film. Par contre, l’adaptation d’une chanson au vidéo-clip

n’efface pas les traces de la musique mais la conserve, la met en exergue et lui apporte des

images. La transformation médiatique de l’audible en audiovisuel, qui a lieu dans le vidéo-

clip, n’est pas excluante mais additive : la chanson et le film, la radio et la télévision, la vue,

l’ouïe, tout cela s’additionne pour créer l’illusion d’être « corps et âme » avec le chanteur.

A la différence des autres émissions télévisuelles dont la matière est la musique moderne,

dans le clip, le chanteur constitue une figure humaine et relationnelle complète et

consistante. Nous pouvons non seulement voir son visage, son corps et ses mouvements

lorsqu’il interprète la chanson, mais aussi l’associer à un imaginaire qui nous permet de

connaître sa façon d’être, ses goûts et sa sensibilité.

Le clip permet de construire cet imaginaire d’un monde beaucoup plus spécifique, subtil et

complet que celui qui se constitue à partir d’une émission radiophonique de la chanson ou

de celui qui se dégage de l’enregistrement télévisuel d’une présentation du chanteur ou du

groupe. Chacun des mondes créés d’un clip à l’autre du même groupe ou chanteur, est en

n i ! f i c t i on ! n i ! r é a l i t é !

22!

fonction de la construction d’une relation spécifique entre la figure du chanteur-groupe et le

téléspectateur, laquelle se voit renforcée par la répétition, plusieurs fois par jour, du même

clip.

A la radio, la chanson est la seule porteuse d’information pour la construction d’un

imaginaire. Les mondes dont sont issus la chanson et le chanteur sont flous. Le corps,

l’apparence et la manière d’être du chanteur ou du groupe peut être que faiblement

inférée à travers le contenu des paroles des chansons et des différents stéréotypes

relationnels entre la manière d’être d’un chanteur et le genre musical dans lequel on peut le

classer. Le fan ne peut « connaître » le chanteur qu’à travers les indices rapportés par la

presse et les présentations live.

La promesse du clip ne se limite pas à la musique, au rythme ou à la pulsion des images. La

centralité de la figure chanteur-groupe est sans doute une condition fondamentale pour la

compréhension du clip en tant que tel.

La “ forme clip ”, esthétique assumée depuis ses débuts par la publicité, fait partie

actuellement d’une infinité de genres authentifiants et fictionnels, y compris le cinéma

narratif24. Cette « forme clip » ne se confond pas avec le clip lui-même, fondamentalement

parce que, dans les cas signalés, la présence du chanteur ou du groupe est secondaire,

soumise à d’autres objectifs communicationnelles ou, tout simplement, elle n’existe pas.

Du point de vue de la structure textuelle, l’apparente liberté des images sera toujours

dépendante du besoin de construire une figure relationnelle et soumise, donc, à cet objectif.

L’image n’est libre que pour construire et renforcer la relation entre le chanteur-groupe et

« son » public particulier.

Enfin, du point de vue stratégique, si la musique est le principal produit de l’industrie musicale

et discographique et si ce produit atteint des niveaux de commercialisation jamais connus

auparavant, c’est grâce à la construction de la figure du chanteur-groupe médiatisée par la

télévision. Il serait inconcevable, aujourd’hui, de produire un disque (dans un circuit

commercial national ou international) sans la réalisation d’un ou plusieurs vidéo-clip(s) qui

permettent sa promotion. Dans ce travail de marketing, la figure du chanteur-groupe joue le

rôle fondamental d’être l’interface entre un disque en particulier et la production et

reproduction d’un mode de consommation.

Contrairement à la plupart des discours de réalité télévisuels, la chanson ne semble chercher

autre chose que d’être l’expression subjective du chanteur. A la différence de la fiction, dans

le clip, le chanteur ne cesse jamais d’être réel, il ne se dilue jamais complètement dans le

personnage qu’il interprète.

24 Un des exemples les plus évidents de l'esthétique clip portée au cinéma, est le film Natural Born Killers

(Oliver Stone, 1994).

! s e c t i on ! 1 . ! i n t r odu c t i on ! engagemen t s ! e t ! a t t en t e s !

23 !

« Il est là, je le vois, il me chante… » , voilà la principale promesse de sens ce type de

productions qui définit, en même temps, la télévisualité25 du vidéo-clip.

D.! UNE!INTERFACE!COMMUNICATIONNELLE!

Art ou pastiche, drame ou comédie, fiction ou réalité. ¿Comment définir le vidéo-clip?

Si, séparément, chacune des caractéristiques esthétiques, textuelles, stratégiques et

médiatiques du clip, permettent d’établir sa distinction par rapport à d’autres types

d’émissions télévisuelles, elles ne suffisent pas à expliquer le processus qui permet la

construction de sens à partir de ce type de productions. La seule possibilité d’expliquer

comment on comprend le clip est de le considérer dans sa dimension communicationnelle,

condition qui fonde et justifie son existence en tant que document télévisuel. Dans notre cas,

cette question impliquera de considérer le clip comme un objet de relation entre la chaîne

télévisuelle et le téléspectateur.

Mais, qu’est-ce qui permet à la chaîne de fixer le sens d’un programme et, par ailleurs, au

téléspectateur de savoir comment il doit interpréter la succession de séquences sonores et

visuelles ?

L’élément qui régule les engagements de la chaîne et les attentes des téléspectateurs par

rapport à ce type d’émissions en particulier, est le genre.

“ L'instrument qui permet d'agir sur le téléspectateur est le genre. Le genre est, en effet, ce

qui nous permet d'identifier ce que nous voyons. Il y a genre à partir du moment où, pour

interpréter un programme, le téléspectateur ramène ce qu'il n'a pas encore vu à une classe

d'émission déjà identifiée ”. (Jost, F, 1999, p. 19)

Si le genre permet à la chaîne d’agir sur le téléspectateur et à ce dernier de comprendre un

programme en particulier, c’est uniquement parce qu’il y a une convention, un protocole ou

accord mutuel entre les deux pôles de la communication télévisuelle par rapport aux genres,

ces « artefacts sémiotiques complexes » comme les appelle Noël Nel.

Cette convention a été décrite comme un « contrat de communication » , un « engagement

de sens », ou une « promesse de relation au monde » 26.

Chacune de ces définitions du genre télévisuel, pourtant proches, est le résultat de différents

positionnements théoriques par rapport à l’analyse de la télévision, comme nous le verrons

dans les chapitres qui vont suivre. Mais elles mettent toutes en évidence le fait que la

25 Nous entendons par "télévisualité" à l'instar de Guy Lochard et Jean-Claude Soulages (: 1998, p. 25): "la

dimension spécifiquement communicationnelle et discursive du média" dans laquelle s'insère le vidéo-clip. 26 Voir chapitre III.

n i ! f i c t i on ! n i ! r é a l i t é !

24!

dénomination générique est fondamentale aussi bien pour la production de documents

télévisuels que pour leur compréhension.

Dans ce sens, attribuer un nom de genre à un programme pourrait sembler, plus qu’un acte

de langage, un acte de création omnisciente similaire à celui d’un Dieu créateur qui dit

« que la lumière soit » et la lumière fut. Mais penser que la désignation générique d’un

programme par la chaîne suffit à donner un sens à l’émission, équivaudrait à mépriser le rôle

fondamental du téléspectateur dans la communication télévisuelle et penser que sa seule

tâche consiste à suivre fidèlement, aveuglement, les désirs du média. Au contraire, le savoir

du téléspectateur par rapport aux genres, non seulement dépasse largement le fait de

connoter les programmes mais il constitue le référent obligé du travail de production des

audiovisuels à la télévision et de la construction des grilles de programmation des chaînes.

Ce savoir du téléspectateur par rapport aux genres, est historique, c’est-à-dire qu’il suppose,

comme le dit Hans Robert Jauss (: 1978, pp. 49 à 55), un contexte d’expérience antérieure

dans lequel s’inscrit une nouvelle expérience du téléspectateur par rapport à un genre.

Aucun genre n’émerge du néant, le savoir du téléspectateur par rapport aux genres ne se

limite pas non plus à la communication télévisuelle, il est le résultat de deux dynamiques

opposées qui font partie d’une dialectique propre à la télévision : la persistance des genres

extra et pré-médiatiques et leur transformation au sein de la télévision.

1.! LA!TRANSPOSITION!DES!GENRES!

Pour Oscar Steinberg (: 1997, p. 49), la notion de « transposition des genres » désigne la

persistance et la stabilité des traits qui définissent une pratique communicationnelle, dans son

passage d’un langage à un autre ou d’un support médiatique à un autre27.

Un nombre important de genres télévisuels ont des précédents directs dans d’autres

pratiques culturelles et médiatiques auxquelles ils peuvent être associés dans la mesure où

leurs traits caractéristiques ont persisté depuis leur appropriation par la télévision.

Dans le premier des cas, c’est-à-dire dans ce que Jost (: 1999, p. 25) appelle genres extra-

médiatiques, nous pouvons classer les concours ou les programmes de conversation tous

dérivés des genres populaires comme la « devinette » , les jeux de salon ou les causeries.

Par ailleurs, les genres pré-télévisuels (Jost, F, 1999, p. 26) qui ont une continuité à la télévision,

ils viennent, principalement, de la radio, du cinéma et du théâtre, précédents médiatiques

de la télévision. Parmi ces programmes, le JT et, en général, la transmission en direct, est sans

doute un type de genre développé à partir des formes radiophoniques similaires et qui ont

27 Il est important de signaler que l’acception utilisée par Steimberg pour la notion de "transposition" diffère de

celle de Genette (: 1982). Cette dernière la considère comme "la transformation sérieuse" d’un texte, "sans nul doute la plus importante de toutes les pratiques hypertextuelles" (Op. cit., p. 291), par opposition à la pratique de la parodie ou de l’imitation.

! s e c t i on ! 1 . ! i n t r odu c t i on ! engagemen t s ! e t ! a t t en t e s !

25 !

trouvé un terrain particulièrement fertile dans la télévision. Il en va de même avec les genres

cinématographiques comme le film de fiction, le documentaire ou la caméra cachée, ou

avec le genre théâtral du sketch ou de la comédie, qui ont leurs équivalents télévisuels dans

les sketchs comiques et dans la sit’com.

Il est évident que l’incorporation de ces genres à la télévision suppose une transformation

qualitative importante, surtout en ce qui concerne la position relationnelle du récepteur

(impossibilité d’interlocution du téléspectateur et soumission de celui-ci aux choix de la

caméra) dans la médiation ou dans les aspects cognitifs et perceptuels qui permettent la

simultanéité de l’image, des mots et du son. Mais le fait d’identifier dans un genre les traits

principaux qui le relient à celui qui est à son origine, permet d'effectuer facilement son

incorporation, sa lecture et sa compréhension au niveau de la réception.

2.! LE!CHANTIER!DES!GENRES!

Les qualités médiatiques de la télévision ne se limitent pas à l’incorporation, transformation et

recyclage des genres extra ou pré-télévisuels. Comme dans un creuset, la télévision est le lieu

dans lequel la fusion des différentes pratiques médiatiques et sociales peut donner naissance

à divers nouveaux genres.

La télévisualité de certains genres n’est autre chose que le résultat et l’expression de la forme

particulière qu’adopte l’énonciation dans ce média et qui permet la juxtaposition du « dire »

et du « montrer » en temps réel et en direct. Cela va de la triple médiation verbale, visuelle

et sonore à la possibilité d’accéder aux lieux et aux circonstances les plus impensables, des

images de la surface de mars dans le JT du soir à l’endoscopie introspective du

documentaire de santé et des images d’enfants qui meurent de faim dans un coin d’Afrique

au glamour des stars de Hollywood dans le magasine rose.

« Par rapport à la conscience typographique du lecteur ou de l'auditeur de radio, notre

conscience téléspectatrice s'est dépolarisée : la parole, sa pointe ou son fil logique tiennent

à la TV moins de place dès lorsque le sens afflue par d'autres canaux. Ce qui n'est pas

forcément une perte » . (Bougnoux, D, 1996).

Presque comme la concrétisation du rêve panoptique de Borges, la télévision nous permet

une expérience médiatique qui ne peut se comparer à aucune autre forme de

médiatisation. Il n’y a donc rien d’étrange à ce que ce média soit devenu un véritable

chantier des genres que nous ne pourrions trouver nulle part ailleurs.

Le vidéo-clip est un exemple clair d’un genre né au sein de la télévision. Nous pouvons

trouver ses précédents aussi bien dans les pratiques médiatiques du cinéma (musical

hollywoodien, opéra rock), à la radio (chansons ou hit-parade) et à la télévision (variétés,

présentations en live ou le vidéo-art), mais aussi dans la pratique sociale de la fête, dans le

n i ! f i c t i on ! n i ! r é a l i t é !

26!

carnaval ou dans le récital. Pourtant, ce type de programmes ne correspond pas à une

continuité de l'un ou l'autre de ces genres séparément, ni à l'évolution linéaire d’un genre

télévisuel vers un autre, comme celle qui s'est opérée entre les débats et les talk shows.

Il en va de même avec les programmes comme le reality show, dont la caractéristique est

de combiner le plateau, les documents d’archives, le reportage et la reconstitution mais

dont on trouverait difficilement un précédent unique.

« La télévision, 'médium impur par excellence', remarquait-on hier. Et l'on n'a pas beaucoup

de raisons de penser qu'elle ne serait pas un objet pluriel, hétérogène, hypercomplexe, une

sorte de labyrinthe de l'intermédialité qui réalise 'l'intégration des concepts esthétiques des

différents médias dans un autre contexte » . (Nel, N, 1998, p. 59).

Où et comment concevoir un genre comme celui de la vidéo-cabine, dans lequel les

passants sont invités à entrer dans une petite cabine où se trouve installée une caméra

devant laquelle ils peuvent dire tout ce qui leur passe par la tête, sur le thème qu’ils veulent,

si ce n’est à la télévision ? Comment concevoir, ailleurs que dans le domaine médiatique de

la télévision, des programmes comme les Vidéo-Gag?

E.! CONCLUSIONS!ET!POINT!DE!DEPART!

Le genre télévisuel est un élément clé pour la relation entre la télévision et le téléspectateur

car il est l’instrument qui permet de négocier entre les engagements du média et les attentes

en réception.

Mais, qu’est-ce qu’un genre télévisuel ? Quel est le rapport qui relie les programmes de

télévision aux genres ?

Comme nous le verrons, le questionnement de la recherche sur les genres télévisuels dépasse

largement la simple classification des émissions. Parmi les raisons qui ont conduit la sémiologie

à s’intéresser aux genres télévisuels, la plus importante est celle qui considère le genre

comme un des éléments qui permettent d’expliquer la façon dont on peut comprendre la

communication télévisuelle. C’est, précisément, dans cette optique que nous allons

entreprendre la caractérisation du vidéo-clip comme genre télévisuel.

Le prochain chapitre a pour but de faire une première approche de la notion de genre et

de ses applications dans la recherche de la communication télévisuelle.

! s e c t i on ! 1 . ! i n t r odu c t i on ! t é l é v i s i on ! e t ! g en r e !

27 !

II.! TELEVISION!ET!GENRE

A.! LE!GENRE!DANS!LA!COMMUNICATION!TELEVISUELLE!

La plupart des théories de l’énonciation télévisuelle s’accordent à dire que le genre est un

outil fondamental dans la relation entre la chaîne et le téléspectateur et dans le processus

de construction de sens des programmes.

A travers le genre, la chaîne régule les attentes que construit le téléspectateur par rapport au

type d’acte communicationnel qui est réalisé dans un programme en particulier. Dans le

sens inverse, le genre est ce qui permet au téléspectateur d’évaluer la cohérence et le statut

de l’énonciation dans un programme spécifique. Le genre est, donc, un critère fondamental,

aussi bien pour la production des programmes télévisuels que pour leur interprétation.

« Un genre est à la télévision, comme dans d'autres pratiques culturelles, un moyen

d'établissement avec le destinataire d'un contrat de lecture qui encadre son attitude de

réception mais aussi, rétroactivement, le travail de production des messages émis. Même s'il

n'en a pas conscience, un téléspectateur adopte donc, après un prélèvement d'indices dans

le péri-texte (annonces, le générique...) ou le texte (verbal, visuel) de l'émission, une position

de lecture qui oriente, en vertu d'un accord implicite, ses attentes et ses attitudes » .

(Lochard, G. et Boyer, H., 1995, p. 100).

En tant qu’outil d’interprétation de l’acte communicationnel que représente un document

donné, le genre permet de distinguer l’intention énonciative de l’énoncé et, par-là même,

de définir, au premier chef, ce que nous pouvons ou ne pouvons pas attendre de lui. En tant

que téléspectateurs, nos attentes ne seront pas les mêmes face à un documentaire que

face à un film de fiction et, dans chaque cas, le genre sera le premier principe de lecture et

de compréhension pour éviter la confusion entre un discours de réalité et un discours

fictionnel, bien que il n’y ait souvent guère de possibilité de les différencier au niveau textuel.

Un nouveau programme n’apparaît jamais de manière isolée par rapport à l’influx

sémantique qu’imposent les genres télévisuels. A partir de références explicites (bandes-

annonces, publicité) ou implicites (place dans la grille de programmation, ressemblance

avec d’autres programmes, forme de présentation, etc.) la chaîne et le programme lui-

même, permettent et stimulent les attentes spécifiques auprès des téléspectateurs.

« Le texte nouveau évoque pour le lecteur (ou l'auditeur) tout un ensemble d'attentes et de

règles du jeu avec lesquelles les textes antérieurs l'ont familiarisé et qui, au fil de la lecture,

peuvent être modulées, corrigées, modifiées ou simplement reproduites. La modulation et la

n i ! f i c t i on ! n i ! r é a l i t é !

28!

correction s'inscrivent dans le champ à l’intérieur duquel évolue la structure d'un genre, la

modification et la reproduction en marquent les frontières » . (Jauss, H-R, 1978, p. 51).

Le genre nous intéresse, dès lors, dans la mesure où il représente la convention de base pour

la lecture d’un document (dans notre cas, télévisuel) qui permet au téléspectateur de

réguler ses attentes en fonction du statut de réalité ou de fiction du discours, dans un

programme donné.

Cet assemble d’assertions par rapport au genre constitue la matière qui est développée

dans ce chapitre. Dans ce but, nous réaliserons un bref parcours des principaux systèmes

taxinomiques qui ont été construits pour le classement générique des programmes télévisuels.

Mais, auparavant, dans le but de fixer un cadre général dans lequel ces systèmes de

classement des programmes pourront prendre leurs sens, il nous faudra considérer,

auparavant, un aspect central dans la construction de toute théorie des genres : le

problème de la généricité.

1.! LA!GENERICITE: !CONSIDERATIONS!THEORIQUES!GENERALES!

De prime abord, toute typologie générique se présente comme une simple activité de

classification logique des objets spécifiques, qu’il s’agisse de textes, de documents, d’actes

de discours ou d’œuvres.

Dans ce cas, une théorie des genres se limiterait à l’établissement des critères d’identification

univoques entre les objets et leurs genres. Ainsi, la formule logique X ∈ G, dans laquelle ‘X’

représente un document déterminé et ‘G’ un genre, serait suffisante pour représenter la

relation d’appartenance qui relie un texte à “sa” classe générique.

Pourtant, cette relation d’appartenance du texte à une classe est beaucoup plus complexe

que ne le laisse croire une conception aussi générale des systèmes de classification

générique.

Il suffit de questionner le statut des noms des genres, c’est-à-dire, le caractère des classes

génériques ou le type de relation qui relie les textes aux genres, pour que la complexité

émerge de manière nette.

D'une part, si bien les noms génériques sont la seule réalité tangible qui peut servir de base à

une taxinomie des documents de communication, cela ne veut pas dire pour autant que

cette taxinomie doit se limiter aux noms qui ont, historiquement, défini l’appartenance d’un

texte à un genre. A côté des dénominations “historiques” – celles que l’usage habituel a

consacrées comme catégories plus ou moins régulières (et qui, de ce fait-là, répondent à

des critères d’identité confus ou, du moins, diffus) – il y a d’autres catégorisations

“théoriques” qui ont pour but d’établir de catégories analytiques. Tandis que les premières

(historiques) correspondent à la tradition de production et consommation des textes, les

! s e c t i on ! 1 . ! i n t r odu c t i on ! t é l é v i s i on ! e t ! g en r e !

29 !

deuxièmes (théoriques) cherchent à introduire un ordre dans les dénominations, dans le but

de les rendre compréhensibles à l’analyse.

D'autre part, à la différence de ce qui se passe dans les systèmes de classification

biologiques, dans lesquels les individus ont certaines caractéristiques communes par leur

appartenance à une classe, dans le cas des textes et des actes de discours en général (et

de manière encore plus nette dans le cas de tout artefact culturel), les individus

appartiennent à une classe parce qu’ils ont certaines caractéristiques communes. C’est-à-

dire que, tandis que la relation entre les textes et les genres dans une conception biologiciste

va de la classe à l’individu et suppose, donc, une relation d’appartenance globale

(l’individu appartient à une classe spécifique), la relation générique effective des textes à

leurs genres va des individus à la classe, c’est-à-dire qu’elle dépend d’une causalité externe

et, dès lors, les formes d’appartenance d’un texte à un genre sont ouvertes et

multidimensionnelles. Cela est valable aussi bien pour la littérature que pour tous les

documents de communication médiatique en général.

« Une œuvre littéraire, comme tout acte discursif, est une réalité sémiotique complexe et

pluridimensionnelle ; de ce fait, la question de son identité ne saurait avoir de réponse

unique, l'identité étant au contraire toujours relative à la dimension à travers laquelle on

l'appréhende. Une œuvre n'est jamais uniquement un texte, c'est-à-dire une chaîne

syntaxique et sémantique, mais elle est aussi, et en premier lieu, l'accomplissement d'un

acte de communication interhumaine, un message émis par une personne donnée dans des

circonstances et avec un but spécifiques, reçu par une autre personne dans des

circonstances et avec un but non moins spécifiques. Dès qu'on se concentre sur la globalité

de l'acte discursif, plutôt que sur sa simple réalisation textuelle (...), l'hétérogénéité des

phénomènes auxquels se réfèrent les différents noms de genres cesse d'être scandaleuse :

l'acte discursif étant pluri-aspectuel, il est tout à fait normal qu'il admette plusieurs

descriptions différentes et néanmoins adéquates » . (Shaeffer, J-M., 1989, p. 80).

Cette relation multidimensionnelle qui désigne le ou les référent(s) des noms génériques et les

formes d’appartenance d’un texte à un genre, constitue ce que Jean-Marie Schaeffer (Op.

cit., p. 75) appelle généricité.

Prenant comme point de départ le fait que tout document est un acte discursif complexe

qui correspond, de manière simultanée, à une réalité textuelle et à une réalité

communicationnelle, Schaeffer (Op. cit., p. 79 à 82) établit que la généricité d’un document

peut nous renvoyer à cinq critères d’identité différents, selon que l’on considère : le niveau

de l’énonciation, le niveau de la destination, le niveau de la fonction ou leurs aspects

sémantiques ou syntaxiques (voir Tableau N°1)

Nous nous limiterons, ici, à faire une brève description de ces cinq niveaux qui concernent le

cadre communicationnel (énonciation, destination, fonction) et le message réalisé

n i ! f i c t i on ! n i ! r é a l i t é !

30!

(sémantique et syntaxique). Nous aurons l’occasion, dans les chapitres III et VII de revenir de

manière plus approfondie sur les niveaux qui s’avèrent pertinents pour notre analyse.

ENONCIATION :

énonciateur : réel/fictif/feint

énonciation : sérieuse/fictive orale/écrite

modalité : narration/représentation/ mixte

DESTINATION :

CADRE COMMUNICATIONNEL

destinataire : réel/fictif déterminé/indéterminé

destination : réflexive/transitive

FONCTION :

ACTE DISCURSIF

fonctions : illocutoires et perlocutoires sérieuse/ludique

SEMANTIQUE :

traits thématiques, "modes", opposition littéral/figural

RÉALISATION

SYNTAXIQUE :

contraintes grammaticales, traits phonétiques, prosodiques et métriques, caractéristiques stylistiques, organisation macrodiscursive.

T A B L E A U N ° 1 1

a. ! Niveau!de!l ’énonciation!

Au niveau de l’énonciation, trois phénomènes nous permettent d’établir l’identité et la

différenciation génériques des documents :

- le statut ontologique de l’énonciateur, c’est-à-dire: l’énonciateur est-il réel, fictif ou feint?2.

Comme nous le verrons plus loin, tout discours peut être renvoyé, soit à un sujet

d’énonciation réel, soit à un narrateur fictif, soit à un sujet de réalité feint, ce dernier

correspond à un narrateur fictif qui “fait semblant” d’être un sujet d’énonciation réel

(Hamburger, K, 1986) ;

- le statut logique de l’acte d’énonciation, c’est-à-dire: s’agit-il d’une “énonciation de

réalité” ou d’une “énonciation fictionnelle”? Tandis que le critère précédent faisait

référence au statut de réalité de l’énonciateur, ce critère vise à distinguer la réalité de

l’énonciation énoncée;

1 Source : Schaeffer, J-M., 1989, p. 116. 2 Ces concepts d’énonciateur réel, fictif ou feint seront abordés, plus en profondeur, dans le chapitre suivant.

! s e c t i on ! 1 . ! i n t r odu c t i on ! t é l é v i s i on ! e t ! g en r e !

31 !

- le mode d’énonciation, défini par l’opposition platonicienne entre mimésis et diégèse ou

entre représentation et narration. Ce critère cherche à établir l’identité à partir de la

forme de présentation de l’énonciation, c’est à dire, la manière dans laquelle

l’énonciation est énoncée.

b. ! Niveau!de!la !destination!

Le niveau de la destination correspond à la direction vers laquelle l’acte discursif est orienté,

c’est-à-dire, il se réfère au type de récepteur que suppose le document. A ce niveau, nous

pouvons distinguer :

- le caractère du destinataire, plus concrètement, s’il s’agit d’un destinataire déterminé ou

indéterminé, réel ou fictif;

- le caractère de la destination : destination réflexive (l’énonciateur s’adresse à lui-même)

ou transitive (l’énonciateur s’adresse à un tiers).

c. ! Niveau!de!la !fonction!

Ce niveau correspond à l’intention de l’acte communicationnel d’un document. Schaeffer

établit deux grands types de fonction :

- le but communicationnel que remplit un énoncé, qui comprend aussi bien les actes

illocutoires que les actes perlocutoires3 qui définissent les noms et l’identité d’une classe

de documents;

- la distinction entre fonction sérieuse et fonction ludique.

d. ! Niveau!sémantique!

Au niveau sémantique de la généricité, les éléments identitaires sont :

- les traits de contenu: les éléments relatifs au sujet, au motif ou au thème;

- le statut de la structure sémantique : l’opposition entre le sens littéral et le sens figural d’un

texte.

e. ! Niveau!syntaxique!

Ce niveau correspond à l’ensemble des éléments formels de réalisation de l’acte discursif et

qui ont pour but d’encoder le message, tels que les facteurs grammaticaux, phonétiques,

prosodiques, métriques, stylistiques, etc.

3 Les notions d’actes locutoires, illocutoires et perlocutoires de la Théorie des Actes de Langage, seront

traitées de manière détaillée dans le chapitre VII.

n i ! f i c t i on ! n i ! r é a l i t é !

32!

Parmi ces cinq niveaux, dans lesquels se joue la généricité d’un document, nous allons

privilégier les trois premiers qui concernent le “cadre communicationnel” (voir Tableau N° 1).

En ce qui concerne les deux autres, relatifs à la réalisation de l’acte discursif (sémantique et

syntaxique), seul le niveau sémantique nous semble pertinent par rapport à ce travail. Étant

donné que notre intérêt se centre surtout dans les aspects communicationnels qui

permettent de classer le vidéo-clip et non pas dans les aspects concernant le support de la

communication, le niveau syntaxique ne jouera par un rôle important dans notre analyse. Par

ailleurs, cet aspect, tout en étant pertinent pour la définition générique des actes de discours

verbaux, une fois transféré dans la dimension audiovisuelle, il pose des problèmes théoriques

et méthodologiques très importants, qui dépassent les limites de ce travail.

Il est évident que la complexité sémiotique d’un document de communication ne peut pas

être réduite à une dénomination générique. L’utilisation d’un critère d'identité est toujours un

choix qui représente seulement une ou quelques-unes des nombreuses formes de relation

qu’un texte peut avoir avec un genre. La généricité sera donc toujours relative aux niveaux à

partir desquels on définit la taxinomie. Il n’y a pas d’identité générique absolue.

« Ce n'est jamais le texte total qui est identifié par un nom de genre, mais tout au plus un

acte communicationnel global » . (: p. 130).

Dans ce contexte, notre tâche sera d’établir, avec netteté, le niveau de généricité pertinent

pour les objectifs d’analyse du vidéo-clip.

2.! LOGIQUES!DE!LA!GENERICITE!TELEVISUELLE!

La diversité de critères qui interviennent dans la classification d’un programme télévisuel,

peut être observée, par exemple, dans les différentes dénominations génériques que peut

avoir un même programme. L’émission Música Si4 (TVE) peut être classée comme un

“magasine d’information” (prenant en compte son intention communicationnelle), comme

une émission de “variétés” (en raison de ses contenus) ou, même, comme un talk show (qui a

comme critère la situation de parole des participants).

Par ailleurs, les objectifs à partir desquels on établit les taxinomies génériques des

programmes de télévision, répondent à des intérêts classificatoires totalement différents. Par

exemple, un système de classification développé par les entreprises de marketing pour

mesurer l’audience - appuyé sur des critères de consommation par groupes sociaux, par

condition sexuelle, etc. – sera très différent d’un autre utilisé pour optimiser la production

4 Programme de la Télévision espagnole (TVE) transmis le samedi et qui mélange reportage d’information,

débat, vidéo-clips et intervention de groupes musicaux sur le plateau, tout cela ayant comme thématique principale la musique à la mode.

! s e c t i on ! 1 . ! i n t r odu c t i on ! t é l é v i s i on ! e t ! g en r e !

33 !

sérialisée des programmes télévisuels - basé sur la division du travail nécessaire pour la

réalisation des différents programmes – ou d’un troisième destiné à rendre compte des

processus de compréhension des téléspectateurs.

Il y a, au moins, cinq logiques taxinomiques différentes pour la classification des programmes

télévisuels, qui sont associées à des buts spécifiques : les logiques professionnelles, les

logiques de régulation, les logiques d’archivage, les logiques de critique et les logiques

d’investigation.

a. ! Logiques! professionnelles: ! optimiser! la ! production! et ! f idéliser! le !téléspectateur! !

Les systèmes de classification génériques qui émanent du milieu professionnel télévisuel ont le

double objectif, d’une part, de réguler et de rendre plus efficace l’activité de production et,

d’autre part, d 'agir sur les téléspectateurs créant des attentes spécifiques, à travers une

proposition de sens déterminée qui permette leur fidélisation.

i . ! L ’activité !de !production!

En tant qu’industrie culturelle5, la télévision doit réguler et standardiser sa production dans un

but d’efficacité. Les ensembles et sous-ensembles technico-professionnels qui correspondent

à la division du travail dans l’industrie télévisuelle sont fortement orientés par ceux du type de

programme qu’ils produisent. Par exemple, la création de départements de presse,

pratiquement autonomes des autres équipes de production; l’existence d'« aires

dramatiques » chargées de la production de téléfilms ou d’autres types de programmes

fictionnels; les “aires culturelles” consacrées à la production de programmes à contenu

artistique et/ou pédagogico-culturel; les équipes de production de programmes pour

enfants, etc.

Dans ce cas, le genre (information, culture, téléfilm,…) opère comme une segmentation

technique et professionnelle, entre les différentes équipes de travail, qui a comme but

l’organisation et l’efficacité de la production sérialisée. Cette division du travail en fonction

du type de production, se traduit aussi bien dans une spécialisation des équipes humaines et

professionnelles, que dans la mise à disposition des équipes techniques qui correspondent à

chaque type d’activité.

i i . ! Agir !sur ! le ! téléspectateur !

Par ailleurs, la dénomination générique est un moyen, tout particulièrement dans la

construction de sens des programmes télévisuels, avec lequel comptent les programmateurs

5 "Industrie culturelle", concept que l’on doit à Théodore Adorno et à Max Horkheimer, deux des fondateurs

de la célèbre École de Francfort. Ce terme désigne la dimension économique, sociale et idéologique de la production industrielle et de la circulation commerciale des biens culturels.

n i ! f i c t i on ! n i ! r é a l i t é !

34!

pour orienter et encadrer les attentes du téléspectateur dans le but de le fidéliser, c’est-à-

dire, de créer et de maintenir une relation durable avec lui.

Un nom générique se constitue, ainsi, comme une proposition de sens que fait la chaîne au

téléspectateur, par rapport à un programme particulier: d’un JT, nous attendons qu’il nous

informe des nouvelles et de l’actualité du monde; d’une sit’com nous attendons une

représentation fictionnelle comique et légère; d’un jeu télévisé, nous attendons le respect

des règles et que le meilleur gagne.

La prégnance des catégories génériques institutionnelles est très puissante. La plupart des

noms génériques des programmes télévisuels sont endogènes, c’est-à-dire qu’ils ont leur

origine dans le domaine de l’activité professionnelle.

b. ! Logiques!de!régulation: !réglementer!

Les logiques de régulation ont pour but de réguler et de contrôler, de l’extérieur de ce

média, l’activité communicationnelle de la télévision dans la société. Elles émanent

d’organismes et d’institutions de l'État ou du gouvernement créés, la plupart du temps,

spécialement pour cela. Tel est le cas, par exemple, du Conseil Supérieur de l’Audiovisuel

(CSA) en France ou du Conseil National de la Télévision (CNT) au Chili, qui a pour fonction de

réguler l’activité, aussi bien des chaînes ouvertes et de celles qui émettent par le câble, que

celle du cinéma.

Étant donné que ces instances ont pour but la régulation de la communication télévisuelle

au niveau de la diffusion, les typologies qu’elles développent sont définies par deux critères

principaux : le public cible et les contenus des programmes. C’est ainsi que l’on définit des

typologies comme “programmes jeunesse”, “culture”, information”, divertissement”, etc.

c. ! Logiques!d’archivage!: ! indexer!

Une logique de classification fonctionnelle pour toutes les autres est celle qui a pour but

d’archiver les documents télévisuels. Tel est le cas de l’Institut National de l’Audiovisuel – INA

– en France ou des différentes médiathèques dans le monde entier.

La fonction intermédiaire de ces organismes d’archivage résulte de leur caractère de source

pour l’ensemble des autres activités en rapport, non seulement avec les logiques

communicationnelles, mais aussi avec celles à caractère économique, historiographique ou

artistique.

Le genre est conçu, dans le cadre de cette logique, comme un moyen utile pour la

classification plus générale et ne répond pas, nécessairement, à des critères

communicationnels, comme c’est le cas pour les autres logiques de classification.

! s e c t i on ! 1 . ! i n t r odu c t i on ! t é l é v i s i on ! e t ! g en r e !

35 !

d . ! Logiques!de!la !critique!spécialisée! : ! informer!

La critique télévisuelle est une tâche orientée vers l’information au public (téléspectateur) sur

les différentes émissions de télévision. La classification générique développée par cette

logique sera, donc, généralement basée sur les nomenclatures utilisées par l’industrie

télévisuelle pour la diffusion de ses produits.

Pourtant, dans la mesure où la critique des spectacles ou de la télévision (lorsqu’elle existe de

manière différenciée) s’insère dans une activité journalistique, elle est sujette à de fortes

variations historiques, idéologiques, voire à des variations selon la mode ou le style de

chaque média.

e. ! Logiques!de!recherche!: !expliquer!la !communication!

Les problèmes de classification dans la recherche ne sont pas moins complexes que dans

d’autres domaines. Outre l’exigence de rigueur et de cohérence logique et scientifique, qui

la distingue des autres domaines signalés, la quantité et la diversité des disciplines ayant

comme objet d’étude la télévision, et qui correspondent à une bonne partie des disciplines

et sous-disciplines des sciences sociales, a comme conséquence l’existence de systèmes

taxinomiques basés sur des critères épistémologiques totalement distincts.

Nous devons ajouter encore à cela, l’incessante variété d’objets produits par ce média,

situation qui permet et exige une pluralité de points de vue, y compris à l’intérieur de chaque

domaine disciplinaire.

Parmi les nombreuses logiques de recherche qui ont développé des systèmes de

classification générique des programmes de télévision6, il existe un domaine de la recherche

qui s’est intéressé davantage au problème générique de la télévision : la sémiologie de la

télévision. A la différence des autres logiques de recherche qui considèrent le genre comme

un artefact pour l’indexation des programmes télévisuels, pour la sémiologie, la

problématique taxinomique dans le domaine de la télévision est qualitativement différente,

car elle considère le genre comme outil principal de la relation entre la chaîne et le

téléspectateur.

L’intérêt de cette discipline, dans la recherche par rapport au genre, se concentre surtout

autour du rôle de ce dernier dans le processus de construction de sens des programmes

télévisuels. Ainsi, la plupart des propositions de classification générique des émissions,

définissent le genre dans une perspective pragmatique, dans laquelle le problème de

l’énonciation occupe le centre de la définition des typologies. C’est dans ce domaine de la

recherche sur la communication télévisuelle que l’on propose les systèmes taxinomiques les

plus solides.

n i ! f i c t i on ! n i ! r é a l i t é !

36!

B.! LE!SPECTRE!THEORIQUE!DANS!LA!GENERICITE!TELEVISUELLE!!

La complexité de l’acte de communication que représentent les émissions de télévision

amène à considérer l’existence de logiques taxinomiques aussi diverses et hétérogènes que

les genres télévisuels.

Si tout texte est un « objet sémiotique complexe » , il devient inutile de tenter une

classification universelle et définitive. Plus encore s’il s’agit de documents télévisuels car ils

englobent des matières d’expression de nature hétérogène et polysémique comme l’image,

la voix, l’écriture, la musique, les sons, etc.

On ne peut donc pas espérer que les typologies généalogiques des programmes télévisuels

répondent à un seul et unique critère de classification.

« Toute classification générique est fondée sur des critères de similitude (…) L'identité d'un

genre est fondamentalement celle d'un terme général identique appliqué à un certain

nombre de textes » . (Schaeffer, J-M, 1989, p. 64).

En d’autres mots, toute typologie générique repose sur une théorie de l’identité qui permet

de construire un type déterminé de relations de similitude entre les documents. Par exemple,

en littérature, le huitain correspond à l’application d’un critère d’identité construit à partir des

aspects métriques du texte et non pas de sa fonction discursive, comme dans l’ode ou dans

la prière.

Comme nous l’avons signalé, à l’instar de Schaeffer, un programme télévisuel est une réalité

sémiotique complexe et le problème de son identité ne peut pas être réduit à une seule

dimension.

Lorsqu’il s’agit de systèmes taxinomiques non scientifiques7, ce que Schaeffer (à l'instar de

Todorov) appelle « historiques » (:pp. 64 à 78), les critères d’identité sont très relatifs et

difficiles de penser. Quel critère commun de généricité peut-il y avoir entre la dénomination

“soap-opera” et celle de “téléserie” ou entre une émission de “variétés” et un “magazine”?

Par contre, les taxinomies à prétention scientifique, les taxinomies “théoriques” de Todorov

(voir Schaeffer, op. cit.), ont justement pour but, la construction de systèmes cohérents basés

sur des critères d’identité solides et consistants.

En fonction du critère d’identité utilisé, il est possible de reconnaître, dans le domaine de la

sémiologie de la télévision, trois grands types de propositions par rapport à la généricité,

6 Parmi elles, les approches sociologiques fonctionnalistes d’analyse de contenus et la sociologie critique de

l'École de Francfort, pour ne citer que les plus importantes. 7 Dans les noms génériques utilisés par la pratique professionnelle, par exemple, le critère d’identité peut aller

des aspects absolument techniques – comme dans le cas de la dénomination vidéo-clip qui fait allusion au support matériel du document et en même temps à sa fonction programatique (un vidéo-clip est un programme court qui peut être inséré partout où l’on doit remplir des vides de programmation – à d’autres aspects liés à la fonction ou aux effets communicationnels – comme le sit’com (comédie de situations).

! s e c t i on ! 1 . ! i n t r odu c t i on ! t é l é v i s i on ! e t ! g en r e !

37 !

selon qu’elles se réfèrent à une identité de niveau : langagier (sémio-linguistique) ; socio-

discursif (sémio-sociologique o socio-sémiotique8) ; ou cognitif (sémio-pragmatique ou sémio-

cognitif9).

1.! IDENTITE!LANGAGIERE!

Un premier critère de classification taxinomique des documents télévisuels (le premier aussi à

se manifester dans la discussion sémiologique par rapport à la télévision) a comme point de

départ, le constat d’une identité entre le langage télévisuel et le langage

cinématographique.

Selon Christian Metz (: 1971) :

« Le cinéma et la télévision, au fond ne sont rien d'autre que deux langages voisins, mais qui

poussent le voisinage beaucoup plus loin que ne le font d'ordinaire les langages entre eux.

Au sein de chacun de deux, les traits physiques pertinents et codes spécifiques qui

appartiennent aussi à l'autre son bien plus nombreux et importants que ceux que ne lui

appartiennent pas. (...) Le cinéma et la télévision sont deux versions, technologiquement et

socialement distinctes, d'un même langage qui se définit par un certain type de combinaison

entre des paroles, de la musique, des bruits, des mentions écrites et des images

mouvantes » . (Metz, Ch., 1971, p. 180).

En d’autres mots, cinéma et télévision seraient deux “variantes textuelles” d’une même

classe de langage, ce qui ne veut pas dire que les différences entre ces deux médias soient

ignorées par cette perspective. Au contraire, la distinction est précisément la base à partir de

laquelle cette conception peut construire une typologie générique.

Luciano Alvarez García, dans son ouvrage « Poétique du direct télévisuel » (: 1985),

développe l’idée que la différence essentielle entre la télévision et le cinéma est, justement,

la possibilité d’émettre en direct des images et des sons. Le direct, selon l’auteur est une

« spécificité télévisuelle absolue » , le seul type de textes que le cinéma ne peut pas produire

et qui constitue, en outre, la forme la plus développée du discours télévisuel. Cette

différence fondamentale entre les deux médias est assumée comme une variété

typologique dans un système de référence plus vaste qui englobe le cinéma et la télévision

et qu’Alvarez appelle « audiovisuel-cinétique » .

8 La "sociosémiotique" est définie par Eliseo Verón comme : "une théorie des discours sociaux". (: 1982, p.

100). 9 Si bien on ne peut pas véritablement parler d’une approche sémio-cognitive dans l’analyse télévisuelle, cette

dénomination permet de distinguer la démarche "sémio-pragmatique" de Roger Odin, et celle de François Jost. Cette dernière, qui a comme référent principal la pragmatique anglo-saxonne, introduit un point de vue cognitif à l’analyse à partir du moment où elle s’intéresse aux processus inférentiels d’interprétation spectatorielle.

n i ! f i c t i on ! n i ! r é a l i t é !

38!

« Le cinéma et la télévision doivent ainsi faire appel à des formes parfois différentes dans

l'organisation de leurs matières (expression et contenu), à la suite de contraintes

technologiques, sociales, politiques ou psychologiques. (...) toutes ces différences sont à

l'origine de 'genres', c'est-à-dire de 'systèmes textuels' particuliers. (...) Même dans sa

spécificité, le direct continue à participer aux ressources générales octroyées par

l'audiovisuel-cinétique » (Alvarez, L, 1985, p. 18 - 19).

Ainsi, le critère d’identité langagière permettra de différencier les différentes expressions

possibles à l’intérieur de l’identité typologique qui regroupe le cinéma et la télévision et qui

sont comprises dans l’“audiovisuel-cinétique” en tant que catégorie de référence pour ces

deux expressions médiatiques.

Dans une proposition comme celle-ci, le type de phénomènes auxquels font référence les

catégories génériques correspondra à la distinction de “systèmes textuels particuliers”, c’est-

à-dire qu’il se situera au niveau de la réalisation défini par Schaeffer.

2.! IDENTITE!SOCIO=DISCURSIVE!

Un deuxième type de taxinomie générique qui a été développé, est celui centré sur les traits

de la singularité socio-discursive de la télévision. Ce changement d’axe de pertinence

disciplinaire par rapport au critère de classification précédent, va déterminer que la logique

de classification des documents réponde aux fonctions et aux effets sociaux des discours

télévisuels.

L’élan fondateur de cette tendance de la sémiologie de la télévision a été apporté par

l’article d’Eliseo Verón « Il est là, je le vois, il me parle » , dans lequel l’auteur argentin, à partir

de l’analyse d’un genre télévisuel particulier comme le JT, apporte les bases d’une socio-

sémiotique générale :

« Elle [la théorie des discours sociaux ou socio-sémiotique] part des discours sociaux

(discours politique, publicité, information, littérature, conversations dans des contextes

quotidiens ou institutionnels déterminés, etc.), elle essaie de comprendre leurs propriétés et

leurs modes de fonctionnement au sein d'une société donnée, et elle considère que leur

statut d'objets sociaux surdétermine les autres niveaux du sens » (Verón, E, 1983, p. 102).

A la différence de la typologie construite à partir de l’identité langagière, dans laquelle

cinéma et télévision ne sont que de variantes d’un même langage, la typologie construite à

partir de l’identité socio-discursive définira une grande différence entre les dispositifs du

cinéma et de la télévision. Cette proposition débouche donc sur le développement de

typologies autonomes et singulières pour la télévision.

Ce critère d’identité conçoit les genres télévisuels comme des « interfaces signifiantes » ,

c’est-à-dire comme des dispositifs situés dans un point d’articulation de la production et de

! s e c t i on ! 1 . ! i n t r odu c t i on ! t é l é v i s i on ! e t ! g en r e !

39 !

la réception de textes qui permettent la construction d’un sens social. De là que les systèmes

génériques dérivés de cette approche socio-discursive de la communication télévisuelle

soient si divers et complexes et dépendent de l’importance que chaque auteur donne aux

niveaux d’analyse et de différenciation qui lui sont propres. Témoin de cela, les typologies

génériques de Lochard et Soulages (: 1998); de Patrick Charaudeau (: 1997-a) o de Noël Nel

(: 1997).

« On a souvent remarqué que la télévision est particulièrement apte à ingérer les

caractéristiques formelles, thématiques et génériques de médias qui l'ont précédée (…) ce

qui ne doit pas décourager de chercher la cohérence possible de l'agir télévisuel et des

logiques qu'il développe (…) Par l'expression habermasienne de 'l'agir communicationnel', je

cherche à poser les bases d'une théorie de l'action sociale sous sa forme

communicationnelle, très exactement médiatique, et très précisément télévisuelle. Dans le

champ médiatique, qu'il faudrait envisager au moins du triple point de vue philosophique,

sociologique et historique, se déploient des formes sociales de communication initiées par la

télévision » . (Nel, N, 1997, p. 41).

La complexité disciplinaire que contiennent les modèles de Lochard-Soulages et

Charaudeau, se reflète dans le besoin d’intégration des différents niveaux de pertinence

pour l’analyse et la définition des typologies génériques. Par exemple : le « lieu des

conditions de production » ; le « lieu de construction du discours télévisuel » ; le « lieu

d’interprétation » (Lochard, G, et Soulages, J-C, 1998, p. 89) ou (Charaudeau, P, 1997-b, pp.

15 à 22).

« Le premier de ces sites est pour l'analyste, dans une posture sociologisante, un foyer

d'interrogations sur les pratiques professionnelles et les visées d'influence qui sous-tendent

la mise en œuvre des projets de parole télévisuelle (programmation et programmes). Le

second d'entre eux est, par définition, celui d'une approche sémiolinguistique ou

sémiodiscoursive des produits, appréhendés à leurs différents niveaux d'actualisation

langagière : iconico-visuelle, linguistique, discursif, vocal. Le troisième enfin est celui, encore

plus ouvert, des approches sociologiques, anthropologiques et psychosociologiques des

procès en réception des produits télévisuels » . (Lochard, G, et Soulages, J-C, 1998, p. 90).

Se plaçant de manière privilégiée dans le « lieu de construction du discours télévisuel » ,

entendu comme le carrefour des « projets d'influence » (Charaudeau, P, 1997) et des

différents « contrats et sous-contrats » (Lochard, G, et Soulages, J-C, 1998) qui s’établissent

entre la chaîne et le téléspectateur, cette proposition est le point de rencontre d’une

sémiologie de la production et d’une sémiologie textuelle. La définition des catégories

génériques se développe autour de l’existence de ces grands pactes ou contrats de relation

entre la chaîne (et de manière plus large, la T.V. en tant que média) et le téléspectateur :

information, divertissement, ludique, spectacle, etc.

n i ! f i c t i on ! n i ! r é a l i t é !

40!

Les genres sont, de ce point de vue, des configurations textuelles caractéristiques qui se

construisent à partir du processus de sérialisation de la production télévisuelle et de

ritualisation de la communication médiatique :

« Simples et autonomes pour certaines, ces configurations textuelles donnent lieu parfois,

en s'articulant avec d'autres, à la définition de 'complexes textuelles', élargies et

hétérogènes (le JT ou le magazine pour exemple). Ce sont ces stabilisations formelles,

objets de dénominations, plus ou mois consacrées par les usages sociaux qui peuvent être

considérées, dans cette optique, comme des genres soumis à des actes, toujours

provisoires, de classification » . (Lochard, G, et Soulages, J-C, 1998, p. 103).

Présentées dans ces termes, les catégories issues d’un tel modèle vont se traduire dans des

« dispositifs de médiatisation télévisuelle, mobilisant des procédés langagiers caractéristiques

et révélateurs de stratégies de discours spécifiques » (Op. cit., p. 102).

3.! IDENTITE!COGNITIVE!

Enfin, un troisième type de taxinomie sémiologique des programmes télévisuels est celle qui

a, comme point de départ, les dynamiques cognitives liées à la compréhension d’un

document télévisuel. Les éléments qui définiront les catégories génériques selon un critère

d’identité comme celui-ci, sont les représentations mentales, les processus de la mémoire et,

principalement, les tâches inférentielles d’interprétation à la réception.

« Il n'y a genre, pourrait-on dire, qu'à partir du moment où, pour penser ou interpréter un

programme, on le ramène à une catégorie plus vaste qui facilite l'opération. Cet élan qui

nous projette de l'inconnu vers l'ancien (…) pourrait bien être la loi du genre » . (Jost, F,

1997, p. 13).

Cette tendance, représentée, de manière plus ou moins diffuse, par l’analyse

sémiopragmatique de la “néo-télévison” de Francesco Casetti et Roger Odin (: 1990) et par

les travaux de Dominique Pasquier (: 1994, '98-a, '98-b) sur la série « Hélène et les Garçons » ;

de manière plus consistante, par l’analyse pragmatique de la réception de Dominique

Château (: 1998) mais, surtout, par les propositions théoriques de François Jost (: 1995, '96, '97,

'98-a, '98-b, '99, 2001-a et '01-b), ne constitue pourtant pas un territoire autonome et

différencié dans le domaine de la sémiologie de la télévision et ses frontières se confondent,

souvent, avec celles de l’analyse pragmatique de tendance socio-sémiotique ou sémio-

linguistique, dont elle tributaire.

Dans ce sens, la distinction que nous faisons ici entre cette tendance d’analyse et la

tendance précédente, ne réside pas dans l'opposition, négation ou dépassement de la

pragmatique mais se fonde, au contraire, sur le fait qu’elle incorpore à l’analyse des

processus relationnels et énonciatifs de la communication télévisuelle, une perspective

! s e c t i on ! 1 . ! i n t r odu c t i on ! t é l é v i s i on ! e t ! g en r e !

41 !

focalisée sur les processus inférentiels et cognitifs de compréhension spectatorielle qui

n’existe pas, du moins pas de manière principale, dans les autres perspectives.

Contrairement à une typologie construite à partir d’un critère d’identité socio-discursive,

dans laquelle les catégories répondent aux fonctions et aux effets sociaux des discours

télévisuels et sont, donc, spécifiques à la communication télévisuelle, un modèle de genres

basé sur une identité cognitive aboutit au développement de typologies globalisantes qui ne

se limitent pas à la communication télévisuelle mais sont solidaires d’une perspective

d’explication plus générale de la construction de sens dans les documents de

communication en général.

« Quand on rejette, comme moi, le partage un peu facile entre les bons spectateurs - ceux

qui suivent la loi du narratologue - et les mauvais - tous les autres, il faut admettre que la

compréhension spectatorielle ne peut nullement se penser comme symétrique du modèle

génétique, simple décodage d'un dispositif énonciatif constitutif de l'objet. Il est vrai que les

images projetées sur l'écran ne sont que des ombres et des lumières, que les personnages

du roman ne sont que des êtres de papier, que les personnages de film sont comme des

marionnettes animées par un ventriloque : nous savons tous cela. Il n'en reste pas moins

que, comme le dit Arthur Danto, (…) 'on ne saurait réduire une œuvre d'art à son support

matériel ni l'identifier à lui' : l'œuvre demande à être interprétée » . (Jost, F, 1992, p. 42).

Ce critère d’identité cognitive conçoit les genres télévisuels comme des outils

d’interprétation des programmes, au niveau spectatoriel, en se basant sur l’idée que cette

tâche d’interprétation repose principalement… :

« non sur la ressemblance parfaite du profilmique et de notre monde, mais sur la

reconnaissance d'un univers cognitif commun » . (Jost, F, 1992, p. 43).

De même que dans les typologies construites à partir d’un critère d’identité sociodiscursive,

dans l’approche cognitive, le genre est un des éléments principaux pour l’établissement de

la relation entre la chaîne et le téléspectateur. Mais, en outre, il est l’élément qui permet la

mise en route des processus inférentiels de compréhension spectatorielle, conçus comme la

construction des hypothèses interprétatives pertinentes à partir des indices qu’apporte

l’énonciation télévisuelle.

En d’autres termes, le genre est un outil pour la construction de pertinence interprétative qui

condense les savoirs et les croyances du téléspectateur sur le statut de réalité des émissions

et, dans une dimension plus large, sur la communication télévisuelle en tant que telle.

4.! L'ENONCIATION!ET!LE!TELESPECTATEUR!

De toute évidence, chacune des trois perspectives sur la généricité télévisuelle que nous

venons de citer sont le résultat de trois approches théoriques différentes par rapport au

n i ! f i c t i on ! n i ! r é a l i t é !

42!

problème de la communication médiatique et aucune d’entre elles n’est complètement

réductible aux autres. Cette irréductibilité naît du fait qu’elles partent de supposés

épistémologiques différents et qu’elles appellent à des méthodologies d’analyses, elles aussi,

différentes.

Pourtant, et malgré leurs incompatibilités importantes, ces propositions ne peuvent pas être

considérées pour autant antagoniques, car elles ne se présentent pas comme des “théories

générales de la communication télévisuelle”. C’est-à-dire qu’elles ne prétendent pas être

des modèles explicatifs de l’ensemble du phénomène mais se veulent, plutôt, pertinentes

pour l’analyse d’un domaine spécifique de la complexité sémiologique de ce média : son

aspect langagier, son caractère socio-discursif et sa dimension cognitive. En d’autres mots,

chacune de ces démarches cherche à expliquer un aspect particulier de la communication

et non pas “la” communication télévisuelle en général.

Dans ce contexte, ce qui nous intéresse, en priorité, c’est la pertinence des perspectives

signalées et des modèles de classification générique qui se dégagent de chacune de ces

propositions, par rapport à notre objectif de catégorisation du vidéo-clip. C’est-à-dire, même

si notre positionnement peut avoir des conséquences théoriques importantes, notre option

n’est pas orientée par le besoin de choisir parmi ces trois univers épistémologiques. Elle sera

orientée, principalement, par le niveau d’ajustement de chacune de ces trois propositions

de taxinomie générique des programmes de télévision à notre objectif de caractérisation du

statut de réalité (ou de fiction) de l’énonciation dans le vidéo-clip.

Comme nous l’avons indiqué plus haut, l’attribution (la reconnaissance) du statut de réalité

ou de fiction de l’énonciation à un programme de télévision, sera déterminée par le

positionnement du téléspectateur et par les critères d’appréciation de l’intention

énonciative.

Ce qui va définir, donc, notre choix par rapport à ces propositions, c’est le rôle qu’elles

assignent au téléspectateur et la place qu’elles attribuent au problème de l’intention

énonciative.

a. ! Le!texte!énonciateur!

D’inspiration structuraliste, l’approche langagière du genre télévisuel, situe le problème de

l’énonciation au niveau du texte :

« l'énonciateur s'incarne dans le seul corps qui soit disponible, le corps du texte, c'est-à-dire

une chose (…) L'énonciateur c'est le film, le film en tant que foyer, agissant comme tel,

orienté comme tel, le film comme activité » . (Metz, Ch, 1991, p. 26).

Ainsi :

! s e c t i on ! 1 . ! i n t r odu c t i on ! t é l é v i s i on ! e t ! g en r e !

43 !

« L'énonciation peut être reconstruite selon un simulacre logico-sémantique élaboré à partir

du texte seul » . (Greimas, A-J, et Courtes, J, 1993, p. 171).

Bien que le principe de pertinence défini par cette proposition soit de traiter les textes

comme des unités de discours, sa conception limite la discursivité aux marges du seul texte

(programme) et exclue ou relègue à l’arrière-plan les problèmes relatifs au contexte, à la

production et à la réception.

Le texte (programme) est considéré comme un objet de langage et, dès lors, l’intention

énonciative du réalisateur ou de la chaîne et le sens de l’énoncé se cristallisent et s’incarnent

dans le code. Le texte peut, ainsi, être analysé de manière indépendante des contextes.

Comme conséquence de cela, à l’autre extrême, la tâche du téléspectateur n’est autre

que celle de décoder, correctement, le programme.

« Le foyer, c'est le texte entier vu de son amont vers son aval, dans l'ordre idéal où il se tisse

(…) La destination, c'est le même texte à contre-courant, depuis son aval, imaginairement

en train de se défaire (…) le lecteur ne déchiffre pas autre chose, en principe, que ce qu'a

consigné le scripteur » . (Metz, Ch, 1991, p. 32).

La compréhension et l’interprétation sont supposées être linéaires et cohérentes avec

l’intention énonciative du texte et la signification émerge, donc, de l’acte de codification et

de décodage. La place que ce type de théories assigne au téléspectateur est une place

passive, puisque son rôle est celui de faire une lecture correcte et sa position est déterminée

par la centralité du texte. L’intention énonciative est celle incarnée dans le document

télévisuel.

Dans cette perspective, la réalité ou la fictionnalité d’un programme télévisuel se dégage de

ses caractéristiques textuelles. C’est ce rôle que l’on assigne aux “marques de fictionnalité”

des discours audiovisuels de caractère fictif et aux “marques d’énonciation” dans les

discours de réalité. En cohérence avec cela, Luciano Alvarez, en se référant aux processus

de défictionnalisation et de construction du vraisemblable dans le direct télévisuel, donne

aux aspects textuels-énonciatifs la possibilité de mettre en évidence le statut de réalité ou de

fiction des programmes :

« Chaque système produit des codes (ceux de défictionnalisation entre autres) qui sont

fréquemment opposés dialectiquement à ceux du système précédent (…) La

défictionnalisation peut être considérée comme la somme des opérateurs qui agissent

comme embrayeurs de la vraisemblance nécessaire à l'efficacité du texte » . (Alvarez, L,

1985, p. 110).

Dans la mesure où cette tendance d’analyse est tournée vers les aspects qui concernent les

codes et les textes, les concepts d’énonciation, énonciateur et énonciataire ne sont pas

développés comme ils le sont dans les approches pragmatiques de la télévision.

n i ! f i c t i on ! n i ! r é a l i t é !

44!

b. ! Les!dispositifs !de!l ’énonciation!

L’approche socio-discursive situe la problématique de l’énonciation au niveau de la relation

entre la production et la réception des messages télévisuels. Cela constitue la matière de la

notion de dispositif d’énonciation introduite par Eliseo Verón (: 1983), qui a été approfondie,

réinterprétée ou redéfinie par lui-même et pas beaucoup d’autres chercheurs.

Le terme dispositif d’énonciation cherche à synthétiser tous les éléments discursifs qui jouent

un rôle dans la construction de la relation entre la chaîne de télévision et le téléspectateur,

tels que les caractéristiques de l’image, celles du discours verbal, les aspects analogiques de

la communication humaine (gestes, intonations, regards), les caractéristiques du son, etc.

Il est évident que les portées et les buts de cette relation dépassent de loin le domaine de la

chaîne, en tant qu’instance diffusion, et celui du téléspectateur, en tant qu’individu

récepteur. La catégorie de relation qui se dégage de la notion de dispositif est située au

niveau social et correspond aux processus de négociation (ou confrontation, selon l’optique

particulière de chaque auteur) entre les “stratégies d’influence” de la chaîne et les

“compétences interprétatives” du téléspectateur. Les dispositifs d’énonciation, dès lors, sont

des dispositifs médiatiques spécifiques orientés vers des fins sociaux stratégiques.

Si nous considérons les dispositifs comme des configurations médiatiques stratégiques, c’est-

à-dire comme des projets d’influence spécifiques qui mettent en jeu les compétences

interprétatives du récepteur, l’attention de l’analyse sera focalisée dans les visées

énonciatives que poursuit la production du programme plutôt que dans les objectifs

stratégiques ou interprétatifs du récepteur.

L’instance de réception (le téléspectateur) ne configure pas les dispositifs (éléments centraux

dans l’analyse), elle est appelée plutôt à les interpréter ou à les rendre intelligibles. Son

action, dans ce modèle, n’est donc pas passive comme dans le modèle précédent, mais

elle occupe un deuxième niveau d’importance, après l’instance de production. Son rôle est,

généralement, celui de la reconnaissance de l’intention énonciative de l’énonciateur.

« Le fragment de discours n'est que l'un des deux termes d'un système plus complexe qui

en comporte deux autres : l'instance de production et l'instance de reconnaissance » .

(Verón, E, 1987, p. 207).

L’approche développée par Lochard et Soulages va dans la même direction. D’une part,

elle établit l’existence de trois “régimes canoniques” du dispositif énonciatif de

médiatisation : le dispositif de monstration, le dispositif de fiction et le dispositif de mise en

spectacle (: 1998, p. 102). D’autre part, ils décrivent tous les objectifs énonciatifs de la

production et assignent au spectateur un rôle communicationnel à partir de :

« une théorie de l'intentionnalité qui exige une participation active de reconnaissance de la

part de l'instance d’interprétation » . (Lochard, G, et Soulages, J-C., 1998, p. 86).

! s e c t i on ! 1 . ! i n t r odu c t i on ! t é l é v i s i on ! e t ! g en r e !

45 !

Les propositions de Noël Nel s’engagent encore plus loin dans l’analyse de l’instance de

production par rapport au dispositif télévisuel. Le chercheur identifie le dispositif télévisuel

dans les termes suivants :

« Le concept de dispositif stratégique entendu, à l'instar de Michel Foucault, comme un

réseau d'éléments hétérogènes constituant une formation à un moment historique donné et

répondant à une fonction stratégique dominante » . (Nel, N, 1998, p. 60).

Dans ce contexte, la réalité ou la fictionnalité de l’énonciation sera définie, principalement,

par la référence à l’« institutionnalisation » 10 du discours, c’est-à-dire, par l’ensemble des

contraintes textuelles et contextuelles qui régulent les “modes” d’être des messages11, et qui

correspondent à l’intention énonciative de l’instance de production.

c. ! La!construction!spectatorielle !de!l ’énonciation!

Comme la précédente, la perspective “cognitive” de la généricité télévisuelle, situe la

problématique de l’énonciation dans la relation entre la chaîne (instance médiatique de

production) et le téléspectateur (instance spectatorielle de réception). Mais, à la différence

de l’approche socio-discursive, on privilégie, ici, l’explication des processus d’interprétation,

dans le pôle de la réception, plutôt que des processus stratégiques ou d’influence de la

production.

Le travail d’interprétation des messages télévisuels par le téléspectateur, est conçue comme

une construction inférentielle à partir du relevé des indices textuels et contextuels du

programme télévisuel, à la différence du rôle passif qu’on lui assignait dans la perspective

“langagière” ou le rôle de reconnaissance qu’on lui attribue généralement dans les

approches “socio-discursives”.

Cette perspective ne s’intéresse pas au problème de la détermination de l’intention de

l’énonciateur comme le font l’analyse du discours et l’analyse socio-discursive d’origine

sémiologique. Mais elle ne considère pas pour autant qu’elle doive se cantonner au texte,

comme la conception langagière de la communication télévisuelle. L’intention énonciative

est celle que construit l’énonciataire, qui ne correspond nécessairement pas à l’intention

“réelle” de l’énonciateur.

« Pour qu'un film soit reçu comme une œuvre ou pour qu'un document soit reçu comme un

discours de la réalité (…) il faut minimalement qu'il soit compris comme un artefact d'origine

humaine et à destination humaine (…) Si celle-ci ne requiert pas de la part de son lecteur de

10 En ce qui concerne la notion d’institutionnalisation, voir : Odin, R, "Sémiopragmatique du cinéma et de

l'audiovisuel. Modes et institutions", Mullern, J-E., Towards a pragmatics of the audiovisual, Munster, Nodus Publikationen, 1994.

11 Les modes définis par Odin sont : fictionnalisant, documentaire, énergétique, spectaculaire, privé, esthétique et persuasif. Op. cit.

n i ! f i c t i on ! n i ! r é a l i t é !

46!

trouver l'intention réelle qui a présidé à sa conception et à sa fabrication - conception

solidaire d'une théorie qui voit dans l'œuvre un processus de décodage symétrique de

l'encodage - elle suppose, quoi qu'on en ait, une présomption d'intentionnalité » . (Jost, F,

1998-b, p. 14).

En d’autres termes, le but de l’analyse est la définition des possibilités d’interprétation que

permet un document télévisuel à la réception, plutôt que celle des objectifs stratégiques de

l’énonciateur.

Le statut réel ou fictif d’un programme télévisuel sera déterminé par le type d’inférences que

l’on peut développer à partir des indices textuels et contextuels du programme. Celui-ci est,

dès lors, conçu comme un artefact de communication ostensive-inférentielle12.

d. ! Choix!théoriques!

Chacune de ces trois propositions, qui donnent lieu à des systèmes taxinomiques différents,

fait abstraction ou relègue à l’arrière-plan, des aspects qui sont importants dans les deux

autres. Tandis que les éléments contextuels ne sont pas importants pour la perspective

centrée sur le texte, dans la perspective relationnelle, les codes du langage télévisuel sont

secondaires. De la même manière, tandis que pour l’une, l’énonciation se limite au texte lui-

même, pour l’autre il s’agit d’un dispositif complexe qui considère différentes dimensions du

discours dans leur contexte social et culturel et, pour la troisième, l’énonciation est une

construction du téléspectateur à partir des indices textuels et contextuels d’une émission.

Comme nous avons pu le constater, le but d’“expliquer la communication télévisuelle” qui

fonde l’intérêt de la sémiologie pour les genres, devient trop vaste (voire, trop ambigu et

ambitieux) si nous ne le mettons pas en relation avec les aspects spécifiques de la

communication que chaque approche théorique aborde et si nous n’expliquons pas

clairement les limites de leurs objectifs d’analyse. Dans ce même sens, notre ambition ne

peut pas être d’expliquer “la” communication dans le vidéo-clip, et encore moins de tenter

de répondre au problème de la communication télévisuelle en général.

Il nous semble opportun, dès lors, de revenir sur nos objectifs d’analyse du vidéo-clip et,

partant de là, de définir notre positionnement par rapport aux systèmes taxinomiques

exposés, étant entendu que nous devons chercher une cohérence entre les possibilités

d’analyse que permettent les modèles et les objectifs de notre recherche.

En d’autres termes, la question à laquelle nous nous devons de répondre ici est la suivante :

laquelle de ces perspectives théorico-méthodologiques serait la plus pertinente par rapport

à nos objectifs d’analyse et de catégorisation générique du vidéo-clip?

12 La référence de Jost à la “ Théorie de la Pertinence ” de Sperber et Wilson est explicite, ce qui n’est pas le

cas pour Odin. Comme nous les verrons plus loin, la notion de “ communication ostensive-inférentielle ” est

! s e c t i on ! 1 . ! i n t r odu c t i on ! t é l é v i s i on ! e t ! g en r e !

47 !

Ce qui fonde notre intérêt pour le vidéo-clip est la question du statut de l’énonciation dans

ce type de programmes. Réalité, fiction, mélange des deux ou encore une autre alternative

au-delà de cette opposition? Réalité et fiction étant les deux catégories les plus générales

qui permettent de distinguer les types de documents télévisuels, la question sur la réalité ou la

fictionnalité du vidéo-clip doit être insérée dans un domaine plus spécifique qui questionne

plus particulièrement les genres dans la communication télévisuelle. Ainsi, nous avions fait

une première définition de la notion de genre comme instrument qui permet de réguler les

attentes de construction de sens du téléspectateur par rapport à un programme en

particulier.

Poursuivant dans la voie de cette première définition, ce qui s’établit de manière implicite

c’est notre désir d’expliquer le processus qui a comme résultat la formation des attentes dans

la réception, c’est-à-dire le niveau du téléspectateur :

« La création d'un texte implique déjà des choix : il n'existe pas de texte nu, ni de degré zéro

de l'écriture. Par exemple, écrire un sonnet, c'est du même coup privilégier le régime des

conventions régulatrices. Cela à son tour ne signifie pas qu'un texte ne puisse être abordé

que selon les aspects génériques privilégiés par l'auteur. En effet, la décision d'aborder une

œuvre selon tel régime générique plutôt que tel autre dépend aussi de nos intérêts

cognitifs » . (Schaeffer, J-M, 1989, p. 185).

Dans ce contexte, il semble évident que nos objectifs d’analyse sont beaucoup plus proches

des propositions d’une typologie qui a comme tâche l’explication du processus de

compréhension spectatorielle que d’une autre orientée vers les aspects relationnels du

discours télévisuel ou vers les caractéristiques textuelles du programme.

C.! LE!GENRE!COMME!OUTIL!D’INTERPRETATION!SPECTATORIELLE!

Comme nous l’avons soutenu, le genre est l’instrument qui permet à la chaîne d’agir sur le

téléspectateur, et à ce dernier de construire un cadre de pertinence pour l’interprétation

d’un programme en particulier.

Mais, comment s’articulent-elles, ces deux notions d’interprétation et genre?

Du point de vue que nous avons appelé “sémio-cognitif”, la tâche principale du

téléspectateur, en tant que composant humain essentiel de la communication télévisuelle,

est de savoir interpréter les différents messages et programmes que composent la

communication télévisuelle.

un des piliers sur lesquels Jost bâtit sa perspective de l’énonciation télévisuelle et c’est cela qui nous permet de la qualifier de “ sémiocognitive ”, quand bien même cette dénomination puisse paraître prématurée.

n i ! f i c t i on ! n i ! r é a l i t é !

48!

La condition de base qui permet d’interpréter un document en général et un programme

télévisuel en particulier, est la présomption de l’existence, à l’origine, d’une intentionnalité

communicationnelle.

“Lorsque je considère qu’un bruit ou une inscription sur une feuille de papier constitue, en

tant que message, un exemple de communication linguistique, je dois admettre, entre autres

choses, que ce bruit ou cette inscription ont été produits par un être ou par des êtres qui me

ressemblent plus ou moins, et produits avec certaines intentions. Si je considère le bruit ou

l’inscription comme un phénomène naturel, comme l’est le vent dans les arbres ou une tache

sur le papier, je l’exclus de la classe de communications linguistiques, même si le bruit ou

l’inscription ne peuvent pas se distinguer de mots parlés ou écrits”. (Searle, J, 1972, p. 53).

Attribuer une intention à un document n’est autre chose que construire une figure humaine

dans le lieu de son origine. Ceci est aussi valable pour la communication linguistique que

pour l’audiovisuelle. L’attribution d’une intention, comme la construction d’un responsable

d’une émission télévisuelle, est toujours hypothétique et contextuelle, une possibilité

d’explication et non pas sa démonstration. Il n’y a donc aucune raison de penser que les

hypothèses que l’on peut former doivent toujours correspondre à l’intention “réelle” ou à un

sujet responsable “effectif”.

En d’autres termes, tout processus d’interprétation se référera à la situation concrète dans

laquelle il est réalisé et il n’y a pas de bonnes ou de mauvaises interprétations mais des

interprétations pertinentes ou non pertinentes.

Mais le fait que le processus d’interprétation soit hypothétique et contextuel, ne signifie pas

qu’il soit aléatoire. Il existe, au contraire, un ensemble de mécanismes inférentiels qui

permettent la formation d’hypothèses concrètes par rapport à l’acte de communication.

Ces mécanismes inférentiels correspondent à un processus logique qui, à partir d’un certain

nombre d’informations connues (prémisses) peuvent dériver sur de nouvelles conclusions.

« Les processus inférentiels sont tout à fait différents des processus de décodage. Un

processus inférentiel a pour point de départ un ensemble de prémisses et pour

aboutissement un ensemble de conclusions qui sont logiquement impliquées ou, au moins,

justifiées par les prémisses. Un processus de décodage a pour point de départ un signal et

pour aboutissement la reconstitution du message associé au signal par le code sous-jacent.

En général, les conclusions ne sont pas associées à leurs prémisses par un code, et les

signaux n'ont pas pour conclusion logique les messages qu'ils véhiculent » . (Sperber, D, et

Wilson, D, 1989, p. 27).

Dans la mesure où les êtres humains sont des “dispositifs efficaces de traitement de

l'information” (: p, 76) qui visent à « maximiser l'efficacité de leur traitement de l'information »

(: p. 80), l’acte de communication a pour but de rendre manifeste au récepteur l’intention

! s e c t i on ! 1 . ! i n t r odu c t i on ! t é l é v i s i on ! e t ! g en r e !

49 !

énonciative de l’émetteur comprise dans l’acte communicationnel. Pour qu’une information

puisse être traitée par un individu, celle-ci doit se constituer dans un acte d’ostension.

« Un comportement qui rend manifeste une intention de rendre quelque chose manifeste est

un comportement ostensif ou plus simplement une ostension. Montrer quelque chose à

quelqu'un est un cas d'ostension. Nous soutiendrons que la communication intentionnelle

est aussi un cas d'ostension » . (: p. 81).

Dès lors, si le récepteur peut reconnaître un comportement ou un document comme un acte

communicationnel, c’est parce qu’il peut y voir une intention de rendre manifeste quelque

chose de la part du producteur ou de l’émetteur. Mais qu’est-ce qui permet de déduire

l’intention d’un acte d'ostension?

« Un comportement ostensif permet d’inférer des pensées. Il en va ainsi parce qu'un tel

comportement comporte une garantie de pertinence. Il comporte cette garantie de

pertinence parce que les humains prêtent automatiquement attention à ce qui leur semble le

plus pertinent. [La thèse principale de Sperber et Wilson est (…)] qu'un acte d'ostension

comporte une garantie de pertinence, et que ce fait - que nous appellerons le principe de

pertinence - rend manifeste l'intention qui sous-tend l'ostension » . (: p. 82).

C’est justement dans ce sens qu’un genre peut être considéré comme un outil pour la

construction de la pertinence interprétative des documents télévisuels.

Dans la mesure où la dénomination générique rend manifeste le statut de l’énonciation d’un

programme télévisuel, elle correspond à une ostension du caractère du programme et cela

permet au téléspectateur d’inférer sa qualité de discours de réalité ou de discours de fiction.

Sans l’existence de la dénomination générique ou des marques de genre implicites dans les

documents télévisuels (génériques, titres, régime caractéristique de focalisation et

d’occularisation, etc.13), l’interprétation au niveau spectatoriel serait beaucoup plus

complexe et incertaine. Sans une matrice générique vers laquelle renvoyer les documents

télévisuels, comment tracer la frontière entre un documentaire et un film de fiction, entre une

parodie de JT et un vrai JT, entre un vidéo-clip et un opéra-rock?

D.! CONCLUSIONS!ET!POINTS!DE!DEPART!!

Parmi les rares développements théoriques au sujet de l’énonciation télévisuelle, la

proposition de François Jost est la seule, à notre connaissance, qui se prolonge sur un

système de classification générique des programmes, à partir de sa généricité au niveau de

l’interprétation spectatorielle. Cet espace de la réception est, précisément, l’endroit où nous

plaçons notre intérêt relatif la problématique de la construction de sens dans le vidéo-clip.

n i ! f i c t i on ! n i ! r é a l i t é !

50!

C’est pourquoi, la théorie de l’énonciation télévisuelle de l’auteur français a été le point de

départ théorico-méthodologique principal de notre travail par rapport au statut de

l’énonciation dans le vidéo-clip et de sa catégorisation générique.

Nous pouvons dire que la proposition de Jost s’exprime, de manière évolutive, à partir de son

article « Narration (s) : en deçà et au-delà » publié dans le célèbre n° 38 de la revue

Communications (1983), jusqu’à ses derniers travaux de l’année 2001 : « La télévision du

quotidien » et son apport à l’ouvrage collectif « Télévision : question de formes » (sous la

direction de Gardies, R, et Taranger, M-C.) intitulé “Typologie des jeux télévisés”. La question

spécifique des genres télévisuels commence à émerger dans son ouvrage « La télévision

française au jour le jour » (1994) et se développe plus clairement dans son article publié dans

la revue Semiotica n° 112 1/2 de 1996 intitulé « Propositions pour une typologie des documents

audiovisuels » . Mais c’est dans le numéro 81 de la revue Réseaux consacré au thème du

genre télévisuel (1997) et coordonné par Jost lui-même, que l’auteur développe de manière

plus approfondie sa proposition, par le biais de l'article « La promesse des genres » .

Sans vouloir nier l’influence décisive de Metz, Ducrot et Genette dans la proposition générale

de Jost par rapport à l’énonciation télévisuelle, il faut, toutefois, citer les deux sources

théoriques principales à partir desquelles l’auteur construit la théorie des genres télévisuels: la

« Logique des genres littéraires » de Käte Hamburger et la théorie des actes de langage de

John R. Searle.

Si nous citons ces deux théoriciens ici c’est parce que nous aurons l’occasion, au cours de

notre travail, de revenir sur leurs théories. En effet, pour résoudre les problèmes que va poser

le vidéo-clip à la théorie des genres télévisuels de François Jost, nous devrons contraster et

dialoguer en permanence avec ses “origines”.

Le prochain chapitre aura, ainsi, pour mission d’exposer de manière critique les propositions

de Hamburger et de Jost dans un double mouvement – à la fois explicatif et comparatif –

question qui nous servira pour établir les convergences et les divergences de leurs théories

respectives.

13 Nous pouvons trouver une définition de ces notions dans les chapitres III et IV de ce travail.

s e c t i on ! 2 . ! c a d r e ! t h éo r i c o ?mé thodo l o g i que ! ! u n e ! t ypo l o g i e ! d e s ! g en r e s ! t é l é v i s u e l s !

51 !

III.! UNE!TYPOLOGIE!DES!GENRES!TELEVISUELS

Dans ce chapitre, nous tenterons de décrire les principaux aspects de la théorie des genres littéraires de Käte Hamburger et de la théorie de l’énonciation télévisuelle de François Jost.

Le choix de traiter de manière conjointe ces deux théories, aux origines et aux portées apparemment si différentes, s’explique, en premier lieu, par notre besoin de comprendre le cadre théorique et le sens de la proposition de Jost concernant la théorie des genres télévisuels (principal outil théorico-méthodologique utilisé dans notre travail sur la caractérisation générique du vidéo-clip), dont une des sources est la Logique des genres littéraires (Hamburger K., 1986 [1957])1. Par ailleurs, ce choix se justifie également par le fait que, à partir des problèmes posés par l’analyse du mode d’énonciation dans le vidéo-clip, nous serons obligés de re-visiter la théorie des genres littéraires de l’auteur allemande, pour construire, en partant de là, une proposition complémentaire, et à la fois critique, au modèle de Jost.

A.! LA!LOGIQUE!DES!GENRES!LITTERAIRES!DE!KÄTE!HAMBURGER!

Pour les raisons que nous venons de citer, et bien que cela puisse dérouter ceux qui sont

familiarisés avec la théorie littéraire, nous avons préféré faire un tour commenté de la

Logique des Genres Littéraires de Käte Hamburger et non pas une simple synthèse des

concepts et des idées développés par l’auteur. Dans ce parcours, nous nous intéresserons,

principalement, aux aspects qui nous semblent pertinents pour réaliser une analyse de

l’énonciation à la télévision.

1.! REALITE!VERSUS!FICTION!

Dans le but de dégager de l’esthétique littéraire une logique des genres littéraires, Käte

Hamburger développe une théorie linguistique de la littérature pour le moins provocante.

Celle-ci naît à la suite du constat, en apparence banal, du fait que la langue est à la fois le

matériau plastique de la littérature et le moyen à travers lequel se réalise la spécificité

humaine. Ainsi, sa théorie linguistique de la littérature aura comme objet le rapport de la

littérature à l’ensemble du système de la langue. Cette relation entre la littérature comme

1 Pour notre travail, nous utilisons l’édition de 1986, qui est la traduction de la version originale en allemand

éditée en 1957. Voir références bibliographiques.

n i ! f i c t i on ! n i ! r é a l i t é !

52!

fiction et la langue ordinaire comme “réalité de la vie humaine” est conçue comme une

opposition, opposition qui est le fondement à partir duquel Hamburger construit toute sa

proposition.

« Quel est (...) le sens de cette formation conceptuelle : fiction et réalité? Il est double : on

indique ainsi que la fiction est autre chose que la réalité, mais en même temps, ce qui est

apparemment contradictoire, que la réalité est la matière de la fiction. Cette contradiction

n'est effectivement qu'apparente, car c'est bien seulement dans la mesure où la réalité est la

matière de la fiction que la fiction est d'une autre nature que la réalité". (Hamburger, K, 1986

[1957], p. 39).

Peut-être, un des aspects les plus surprenants de cette phénoménologie de la littérature

réside dans le fait que K. Hamburger vise à expliquer en quoi et pourquoi les récits fictionnels

apportent les critères fondamentaux pour la mise en évidence du phénomène de

l’énonciation. C’est-à-dire qu’elle se donne comme but de construire une théorie qui

permette de décrire un phénomène particulier dans le domaine de la langue – l’énonciation

– et cela à partir de l’analyse des genres littéraires.

Ainsi, les objectifs de son travail la conduiront à établir qu’il n’est pas possible de décrire la

structure énonciative de la langue dans sa totalité, si l’on part d’une définition étroite et

restrictive du concept "énoncé", puisque :

"pour comprendre en quoi la langue de la littérature se distingue de la langue de la réalité, il

faut ne pas se contenter d'examiner les énoncés en tant que tels, mais il est nécessaire

d'aller voir derrière ou au-dessous d'eux". (Op. cit. p. 39).

Par cette attitude l’auteur se situe plus proche de la pragmatique que des théories

immanentistes du texte. Sa recherche sera centrée dans l’examen phénoménologique des

fonctions du langage et, plus précisément, dans l’analyse des caractéristiques du sujet de

l’énonciation qui est à l’origine des énoncés de réalité et de non-réalité (fictionnels), sujet

qu’elle nomme, à l’instar de la théorie de la connaissance, comme Je-Origine :

“Si nous remplaçons le concept logico-linguistique de sujet d'énonciation par celui, cognitif,

de Je-Origine, c'est parce que la mise au clair des relations proprement grammaticales qui

apparaissent à l'insu du narrateur dans la narration fictionnelle nous oblige à dépasser un

point de vue exclusivement grammatical (...) ce concept (Je-Origine) désigne en effet le

point zéro occupé par le Je concret, l'origine du système des coordonnées spatio-

temporelles qui coïncide avec le hic et le nunc". (Op. cit. p. 78).

Par rapport à l’analyse de la relation énoncé/énonciation, Hamburger établit que le

caractère et les fonctions de l’énoncé dépendent exclusivement su sujet de l’énonciation

(Je-Origine), ce qui veut dire que tout énoncé produit à l’intérieur du système énonciatif de

la langue, est un énoncé de réalité. Cette définition acquiert une importance fondamentale

s e c t i on ! 2 . ! c a d r e ! t h éo r i c o ?mé thodo l o g i que ! ! u n e ! t ypo l o g i e ! d e s ! g en r e s ! t é l é v i s u e l s !

53 !

dans la construction théorique de l’auteur, étant donné que la caractérisation d’un énoncé

de réalité n’est pas ici fondée sur la réalité de l’objet énoncé (qui peut être un rêve, un

mensonge ou le résultat des fantasmes du sujet de l’énonciation) mais sur le caractère réel

du Je-Origine.

"C'est bien parce que l’élément décisif n'est pas l'objet énoncé mais le sujet de l’énonciation

que même un "énoncé irréel" est en toutes circonstances un énoncé de réalité (...) la réalité

de l'énoncé tient à son énonciation par un sujet réel, authentique". (Op. cit. pp. 55).

C’est donc le caractère réel du sujet de l’énonciation qui permet d’établir si un énoncé est

“irréel” ou s’il s’agit d’un “mensonge”, de l’expression de sa “subjectivité” émotionnelle ou de

l’“objectif” de compte-rendu d’un événement historique. Cela va rendre possible de

concevoir comme système (dans “un monde de réalité”), l’ensemble illimité des

énonciations qui va des propositions d’assertion jusqu’aux interrogatives, en passant par les

exclamatives et les impératives, dans la mesure où il serait possible d’attribuer leur existence

à l’énonciation venant d’un Je-Origine, car :

“(...) le système d'énonciation de la langue est le pendant linguistique du système de la

réalité lui-même”. (Op. cit. p. 60).

Ce système de l’ensemble illimité d’énonciations, conduit l’auteur à définir trois types de

sujets d’énonciation, à partir du type de corrélation sujet/objet qu’ils établissent avec l’objet

énoncé : historique, théorique et pragmatique.

Le premier type de corrélation – historique – correspond à un sujet d’énonciation déterminé

et individuel. Cette caractéristique d’“individualité” du sujet d’énonciation historique “se

trouve mise en valeur par le fait qu'elle se présente sous la forme d'un Je” (p. 48). On peut

trouver des exemples de sujets d’énonciation historiques dans l’auteur d’une lettre ou d’un

journal intime, c’est-à-dire dans ces récits dans lesquels on utilise la première personne et qui

expriment un vécu personnel.

Le sujet d’énonciation théorique se distingue du précédent dans la mesure où l’individualité

de la personne qui énonce n’est pas en cause. Il s’agit ici de sujets qui énoncent des

propositions de valeur générale “objective”, comme un théorème mathématique ou une

chronique journalistique, "dont le sujet d'énonciation n'a que le caractère d'une généralité

transindividuelle". (Op. cit. p. 209).

Enfin, le sujet d’énonciation pragmatique, quant à lui, produit les modalités propositionnelles

telles que la question, l’ordre ou l’exclamation2. Ce sujet d’énonciation est, donc, celui dont

les énoncés sont délibérément orientés vers l’action.

2 Comme nous le voyons, cette catégorie correspond de manière presque identique à ce que J. L. Austin

appelle des “énoncés performatifs” (Austin, J. L., 1970 [1962]), c’est-à-dire ces énoncés qui ont pour but de

n i ! f i c t i on ! n i ! r é a l i t é !

54!

A partir de cette conceptualisation de l’énonciation de réalité, Hamburger établit le

caractère de la fiction. Pour cela, elle analyse les genres épique et dramatique.

En premier lieu, elle précise le concept de fiction par opposition à celui de feinte3,

fréquemment confondus dans la théorie littéraire. Elle détermine que, tandis que la feinte se

rapporte au Comme Si de la réalité, c’est-à-dire à une structure narrative dans laquelle la

réalité n’est pas la réalité qu’elle prétend être, la fiction, quant à elle, correspond à une

structure Comme, ce qui signifie qu’elle produit l’apparence de la réalité, la mimésis de la

réalité, en partant de la constitution d’un monde fictionnel.

"Car le Comme Si comporte une dimension de tromperie, et, de ce fait, la mise en relation

avec une réalité (...) la réalité en Comme, au contraire, est apparence, illusion de réalité,

c'est-à-dire aussi non-réalité ou fiction". (Op. cit. p. 71).

Partant de ceci, Hamburger établit que c’est seulement dans la fiction que l’objet d’une

narration n’est pas référé à un Je-Origine réel. Dès lors, elle avance une première définition

des conditions d’existence de la fiction :

"1) elle ne comporte pas de Je-Origine réel, 2) elle doit comporter des Je-Origine fictifs,

c'est-à-dire des systèmes de référence cognitivement (et donc aussi dans le domaine de la

temporalité) sans rapport avec un Je réel (...) Seule, en effet, l'entrée en scène - ou l'attente

- de Je-Origine fictifs, des personnages, explique la disparition du Je-Origine réel".(Op. cit.

p. 82).

C’est-à-dire que la disparition d’un Je-Origine réel est la condition et l’élément principal qui

définit le monde fictif.

A la différence de ce qui se produit dans le système énonciatif de la langue, dans lequel la

relation sujet/objet est fixe et déterminée par la réalité du sujet de l’énonciation, dans la

fiction, la chose racontée n’est pas un objet pour la narration, car elle n’existe pas

indépendamment du fait de la narration qui la produit. C’est-à-dire que, dans la fiction, la

narration a le caractère fonctionnel de production du récit. C’est la narration qui produit les

personnages et non l’inverse.

transformer la réalité. Il faut tenir compte du fait que la théoricienne allemande avance ce concept presque en même temps qu’Austin prononce les William James Lectures en 1955.

3 "Le mot fiction est dérivé du latin fingere, qui se prête aux sens les plus divers, de figure à fabulation en passant par invention. (…) Fingere donne en italien fingere, en française feindre, en anglais to feing, en allemand fingieren ; le verbe latin n'a donc conservé dans ses formes modernes que le sens de 'prétendre faussement', 'simuler', 'imiter'… Les substantifs correspondants finta, feinte, feint, Finte sont formés sur ces verbes. Mais il en va autrement du substantif fictio. Certes, il a conservé dans les langues vivantes aussi bien le sens péjoratif que le sens mélioratif de fingere, mais de telle manière ce dernier, qui correspond de fait à l'imagination créatrice, le emporte sur le sens péjoratif. En français au moins, puis en allemand, l'adjectif 'fictif', s'opposant à 'feint', a pris ce sens positif, et est devenu plus habituel encore que le substantif correspondant 'fiction' dans la théorie de l'art". (Hamburger, K, 1986, p. 69).

s e c t i on ! 2 . ! c a d r e ! t h éo r i c o ?mé thodo l o g i que ! ! u n e ! t ypo l o g i e ! d e s ! g en r e s ! t é l é v i s u e l s !

55 !

"Le romancier n'est pas un sujet d'énonciation, il ne raconte pas à propos de personnes et

de choses (il ne parle pas de personnes...), il raconte personnes et choses. Entre ce qui est

l'objet narré et la narration, il n'y a pas un rapport relationnel en l’occurrence énonciatif, mais

une liaison de type fonctionnel". (Op. cit. p. 126).

La fiction est le seul lieu dans lequel la narration peut être caractérisée comme fonction car

elle est apparence et, donc, mise en forme de la réalité. Elle n’est pas énonciation de la

réalité mais sa mimésis.

2.! LA!PLACE!DE!LA!POESIE!

Jusqu’ici, Hamburger a établi uniquement les fondements théoriques de la phénoménologie

de deux genres littéraires parmi les trois reconnus par la théorie littéraire : le genre épique et

le genre dramatique, laissant en suspend, momentanément, le genre lyrique. Comme nous

l’avons vu, dans le cadre de sa proposition, les deux premiers genres seraient les seuls que

l’on pourrait qualifier de fictionnels, étant donné qu’ils sont les seuls dans lesquels se

constituent des Je-Origine fictifs. N’oublions pas que la théorie des genres littéraires a comme

but l’explication de la logique de la littérature et c’est donc dans le domaine des disciplines

telles que la narratologie, la linguistique et la théorie littéraire que se déploie l’analyse.

Pourtant, Hamburger se charge elle-même de projeter sa thèse au-delà des limites de la

théorie littéraire, en mettant le concept de littérature au même niveau que celui de fiction

en général et en signalant que les lois qu’elle énonce par rapport aux genres épiques et

dramatiques se vérifient aussi dans le cinéma narratif de fiction.

Si cette analyse n’a pas pris en compte jusqu’ici le genre lyrique, c’est justement parce que

celui-ci pose un problème particulier dans le cadre théorique de Käte Hamburger. Comme

nous le verrons plus loin, le genre lyrique ne peut pas être défini comme fictionnel, tout en

appartenant incontestablement au domaine de l’art littéraire, et, par ailleurs, bien qu’il soit

classé par l’auteur à l’intérieur du système énonciatif de la langue, ce genre a un

comportement totalement différent de celui des autres énoncés de réalité.

Nous avons signalé que le langage est énonciation de réalité dans tous les cas, sauf lorsqu’il

crée des Je-Origine fictifs. La présence de Je-Origine fictifs se produit, dès lors, lorsqu’il n’est

pas possible de déterminer un Je-Origine réel et aussi en raison du caractère fictionnel de la

narration par opposition au rapport sujet/objet qui définit l’énoncé de réalité. Ainsi, lorsqu’il

s’agit de catégoriser le genre lyrique, on doit procéder en essayant de définir le statut de

réalité ou de non-réalité du Je-Origine qui se trouve à la base de l’énoncé lyrique. En

d’autres termes, il faudrait déterminer tout d’abord s’il est possible d’établir une équivalence

ou une différence entre le sujet d’énonciation lyrique – Je lyrique – comme identité logique,

et le poète, auteur responsable de l’énoncé, comme identité formelle.

n i ! f i c t i on ! n i ! r é a l i t é !

56!

Une même énonciation peut nous sembler incohérente et absurde si nous avançons qu’il

s’agit de l’énonciation d’un sujet d’énonciation historique et nous l’attribuons à un Je-Origine

fictif. Mais si le contexte nous indique qu’il s’agit d’un poème, c’est-à-dire qu’à l’origine de

cette énonciation il y a un Je lyrique, les processus de compréhension – attribution

énonciative – et de lecture seront complètement différents. Plutôt que de comprendre ou

non le contenu de l’énoncé, nous lui attribuerons une qualité sensible, c’est-à-dire, nous le

comprendrons non pas comme objet de la réalité, ni comme sa mimésis, mais comme

l’expression d’une sensibilité subjective, que nous identifions comme étant celle du poète.

Si nous nous plaçons dans une optique phénoménologique, qui est celle de Hamburger, le

problème de la détermination d’une équivalence identitaire entre le sujet d’énonciation

lyrique, le Je lyrique, et l’auteur responsable de l’énoncé n’est pas important pour la

compréhension du phénomène que représente le genre lyrique. Que l’on accepte ou non

que l’énoncé d’un poème corresponde à une expérience vécue par le poète, cela relève

du biographisme et de l’historiographie de l’auteur, point de vue qu’Hamburger considère

illégitime et équivoque appliqué à l’analyse phénoménologique4.

"Le sujet d'énonciation lyrique s'identifie donc avec le poète, exactement comme celui d'une

œuvre historique, philosophique ou scientifique s'identifie avec son auteur, au sens logique

du terme. Mais alors que dans le cas de ces documents de réalité, cette identité n'est pas

problématique puisque, seul l'objet étant visé, le sujet d'énonciation n'a pas de rôle par

rapport au contenu, il en va autrement avec le Je lyrique. L’identité logique ne signifie pas,

dans ce cas, que tous les énoncés de un poème, ou même le poème dans son entier,

doivent correspondre à une expérience réelle de l'auteur (...) il n'y a pas de critère, ni logique

ni esthétique, ni interne ni externe, qui nous autoriserait à dire si le sujet d'énonciation du

poème peut être ou non identifié avec le poète. Nous n'avons pas la possibilité, et donc le

droit, ni de soutenir que le poète présente ce qu'énonce le poème (...) comme étant sa

propre expérience, ni d’affirmer le contraire (...) La forme du poème est celle de

l'énonciation, ce qui signifie que nous le ressentons comme étant le champ de l'expérience

du sujet d'énonciation - c'est qui nous permet de percevoir le poème comme un énoncé de

réalité". (Op. cit. pp. 240 à 241).

Dès lors, cette sensibilité que nous attribuons au poème et que nous reconnaissons comme le

poète, se situe dans le cadre du système énonciatif de la langue. C’est-à-dire que le sujet

d’énonciation dans la poésie – à la différence de ce qui se passe dans les genres épique et

dramatique – ne peut qu’être caractérisé comme une Je-Origine réel. Cette affirmation est

aussi étonnante que controversée car elle situe le problème principal au-delà du cadre de

l’analyse esthétique et strictement linguistique dans lequel se développent la plupart des

recherches autour de la poésie.

4 Comme nous le verrons plus loin, c’est justement par la voie de l’indétermination du sujet de l’énonciation

que l’énoncé de réalité feint - fiction construite dans l’axe du "Comme si" de la réalité – peut fonctionner de manière efficace.

s e c t i on ! 2 . ! c a d r e ! t h éo r i c o ?mé thodo l o g i que ! ! u n e ! t ypo l o g i e ! d e s ! g en r e s ! t é l é v i s u e l s !

57 !

Qu’est-ce, donc, qui nous fait recevoir un poème de manière totalement différente de toute

autre énonciation faite à l’intérieur du système énonciatif de la langue ? On serait tenté

d’expliquer cette différence à partir des caractéristiques esthétiques du poème : le vers en

rime, la rêverie métaphorique, la subjectivité du contenu textuel, la fragmentation du récit…

Pourtant, chacune de ces caractéristiques structurelles peuvent se trouver aussi bien dans

des énoncés de type fictionnel comme dans ceux attribuables à des énoncés de réalité5. Et

au contraire, pour quelle raison percevons-nous une exclamation ou une définition6 comme

étant de la poésie, même lorsqu’elles ne cadrent pas avec le stéréotype esthétique du

poème? Sans doute parce que ce n’est pas dans sa structure formelle ou au niveau

esthétique qu’il faut chercher ce qui définit le genre lyrique.

"Du point de vue de la classification linguistique des genres littéraires, il faut distinguer

nettement le sujet d'énonciation lyrique de la forme qui est celle du genre lyrique en général.

Le genre lyrique étant fixé dans le système énonciatif de la langue, la forme qui lui est

propre peut être transférée à toute énonciation; inversement, là où existe un sujet

d’énonciation lyrique, la forme sous laquelle il s'exprime n'a pas à satisfaire à l'exigence

esthétique d'un poème lyrique". (Op. cit. p. 214).

Si le sujet d’énonciation lyrique – le Je lyrique – est un Je-Origine réel, il devrait satisfaire la

condition d’établir une corrélation sujet/objet correspondant aux types d’énonciation que

nous avons définis plus haut : historique, théorique et pragmatique. Et c’est là, justement dans

la transgression par rapport à ces trois types d’énonciation, que se situe la clé finale pour la

compréhension phénoménologique du genre lyrique comme énoncé de réalité.

Dans chacun des trois types d’énonciation définis, le rapport sujet/objet est orienté vers le

pôle objet car, d’après Hamburger, l’énonciation est “l'énonciation d'un sujet (d'énonciation)

sur un objet énoncé”7. Cela veut dire que l’énonciation exerce toujours une fonction dans la

réalité (dans l’objet). Ainsi, le sujet d’énonciation historique énonce à partir de son

individualité8, le sujet théorique le fait à partir de son interindividualité et le sujet pragmatique

énonce comme forme d’action, mais ils énoncent tous sur un objet de la réalité, ils exercent

5 Les exemples sont nombreux à ce sujet. Parmi eux, les fameux écrits politiques de José Marti, dans lesquels

le leader indépendantiste, poète, journaliste et dirigeant militaire cubain s’exprime en tant que sujet d’énonciation théorique et historique sur les événements politiques, sociaux et culturels de ce Cuba de la fin du XIXe siècle qui était le sien. La beauté de sa prose a inspiré plusieurs compositeurs qui l’ont mise en musique.

6 “Bicyclette : / Véhicule à deux roues / dans lequel la / deuxième / est motrice / et est actionné par pédales. / Si l’on veut / avancer / sans perdre / l’équilibre / il est préférable / de pédaler / en avant.” Nicanor Parra (poète chilien, candidat au Prix Nobel de Littérature en 2001). Notre traduction.

7 Op. cit. p. 46 8 Il faut distinguer les termes d’individualité et d’interindividualité (en tant que type d’ancrages du Je dans le

discours) des concepts “subjectif” et “objectif”. Selon ce qu’établit Hamburger, certains énoncés des sujets d’énonciation théorique peuvent être davantage subjectifs que d’autres émis par des sujets d’énonciation historiques ou pragmatiques. Voir Op. cit. p. 51 et suivants.

n i ! f i c t i on ! n i ! r é a l i t é !

58!

une fonction dans la réalité, indépendamment du fait que l’énoncé soit un rêve, un

mensonge, un ordre, une exclamation, un théorème ou le récit d’un événement historique.

Par contre, dans l’énonciation lyrique, la relation sujet/objet se rapporte au pôle sujet, c’est-

à-dire qu’ici le sujet d’énonciation énonce sur le sujet lui-même à propos de l’objet énoncé.

L’énonciation lyrique ne cherche pas à exercer une fonction dans la réalité (dans l’objet)

mais, au contraire, se concentre dans la subjectivité du sujet d’énonciation, au lieu de le

faire dans l’objectivité ou subjectivité de l’objet énoncé. C’est-à-dire que l’énonciation

quitte le sujet – la réalité – et se tourne vers elle-même, vers le pôle sujet, indépendamment

du fait que le contenu de l’énoncé lyrique soit du type politique, intimiste, naturaliste ou

abstrait. C’est pour cette raison que :

"nous ne trouvons - ni ne nous attendons à trouver - dans le poème aucune vérité ou réalité

objectives. Ce que nous attendons à éprouver et à revivre est d'ordre subjectif, nullement

d'ordre objectif". (Op. cit. p. 237).

Ainsi, la transgression de la corrélation sujet/objet – corrélation caractéristique des énoncés

de réalité – constitue l’élément qui permet de soutenir la nature réelle du sujet d’énonciation

dans le poème. Cet apparent paradoxe s’explique par le fait que l’énonciation, en exerçant

une fonction sur le sujet et non pas sur l’objet, réaffirme l’individualité sensible du poète en

tant que sujet d’énonciation et, donc, en tant qu’entité reconnaissable comme Je-Origine

réel.

La différence cognitive fondamentale entre la fiction et le genre lyrique ne se trouve donc

pas dans le domaine de la réalité ou non-réalité de l’objet mais dans le fait que l’univers créé

par la fiction n’est pas dans le champ de l’expérience de l’auteur (il n’existe aucun élément

phénoménologique qui permette d’identifier le personnage avec l'auteur dans la fiction),

pourtant, la poésie est toujours attribuée, bien qu’à des degrés variables, à une expérience

sensible vécue par le poète.

Comme nous le verrons plus loin, cette caractéristique particulière et distinctive du Je lyrique,

dans sa relation aussi bien à la fiction qu’au système énonciatif de la langue, va constituer

l’élément central autour duquel nous développerons l’hypothèse selon laquelle le sujet

d’énonciation lyrique a aussi une place dans l’énonciation télévisuelle.

3.! LES!FORMES!SPECIALES!OU!MIXTES!

Après avoir établi les fondements logiques de la phénoménologie des deux principaux

genres littéraires - fictionnel et lyrique -, Käte Hamburger se tourne vers deux formes

spécifiques dans le domaine de la littérature.

s e c t i on ! 2 . ! c a d r e ! t h éo r i c o ?mé thodo l o g i que ! ! u n e ! t ypo l o g i e ! d e s ! g en r e s ! t é l é v i s u e l s !

59 !

La première de ces formes est la ballade9, qui correspond à un type fictionnel intégré dans

l’espace du genre lyrique, forme qui ne pose pas de véritables problèmes de compréhension

dans le contexte de l’analyse proposée par l’auteur pour le genre lyrique. Le caractère réel

du Je lyrique qui est à l’origine de la ballade est, en dernier terme, ce qui permet d’affirmer

que la création d’un monde diégétique cohérent à son intérieur dépend de la

reconnaissance de la subjectivité de l’auteur. C’est-à-dire que la fiction ou diégèse est, ici,

l’objet réflexif qui permet le retour à la sensibilité du sujet de l’énonciation.

L’autre forme spéciale-mixte abordée par Hamburger est le récit à la première personne, ce

que l’auteur appelle l’énoncé de réalité feint. Comme nous venons de le dire, tandis que la

fiction correspond à une structure Comme de la réalité, c’est-à-dire qu’elle est mimésis de la

réalité, l’énoncé de réalité feint appartient au Comme Si de la réalité, ce qui signifie qu’il

possède une structure énonciative dans laquelle la réalité n’est pas celle qu’elle prétend

être. Tout comme la ballade incorpore la fiction dans le domaine lyrique, l’énoncé de réalité

feint transporte la forme énonciative (de réalité) dans la fiction.

En construisant le récit comme un témoignage, par l’utilisation de la première personne du

singulier, le narrateur prend l’apparence d’un Je-Origine historique, un sujet d’énonciation

qui raconte son vécu et qui exprime ses sentiments intimes. Du point de vue de l’analyse

phénoménologique, il n’est pas possible d’établir la différence entre ce type de narrateur

fictionnel et un véritable Je-Origine historique. Seul les éléments contextuels nous permettent

d’informer sur la qualité du sujet qui se trouve à l’origine de l’énoncé de réalité feint.

Comme nous le verrons plus loin, les fondements logiques de cette forme fictionnelle mixte

de la littérature, l’énoncé de la réalité feint, permettront à Jost d’avancer une hypothèse sur

l’existence d’un niveau méta-générique ou de second degré, dans l’énonciation télévisuelle.

Nous reviendrons sur ce point, de manière critique, dans le chapitre VII.

!B. ! LA!THEORIE!DES!GENRES!TELEVISUELS!DE!JOST!

L’adaptation de la théorie littéraire et narratologique et à l’analyse du cinéma et de la

télévision a toujours comporté un certain nombre de risques et suscité de nombreuses

polémiques10. Pourtant, ce sont les sciences du langage qui constituent la source principale

de tout le travail théorique réalisé jusqu’ici par rapport à la narration et à l’énonciation

9 Ballade : dérivation verbale de baller - danser – correspond étymologiquement au poème dansé (Dictionnaire

étymologique et historique du français, Larousse, 1993). La structure de la ballade, en rapport avec l’insertion de la fiction dans l’espace lyrique et avec sa qualité de poème musical, est fortement représentée dans la musique contemporaine, spécialement en Europe et en Amérique Latine. Nous pouvons trouver aujourd’hui de nombreux exemples de ballades produites comme vidéo-clips. Parmi elles, la plus grande partie de la production des chantants françaises.

10 La polémique la plus récente est celle soutenue par Jean-Marie Schaeffer et Roger Odin par rapport à l’utilisation, dans l’analyse de l’audiovisuel, des notions, concepts et méthodes d’analyse propres à la linguistique et aux sciences du langage. Voir : Schaeffer, J-M, 1999, pp. 296 à 316 et Odin, R, 2000-b, p. 48.

n i ! f i c t i on ! n i ! r é a l i t é !

60!

filmico-audiovisuelle. Les problèmes et les critiques ont surgi lorsqu’on a tenté d’appliquer les

catégories propres à la linguistique, de manière mécanique, à l’analyse filmico-télévisuelle.

Cela pourrait être le cas de n’importe quelle tentative d’application littérale de la

proposition de Käte Hamburger à l’analyse de l’énonciation télévisuelle. Si nous suivons

scrupuleusement le même chemin logique suivi par la théoricienne, nous nous trouverons, tôt

ou tard, face au besoin d’établir, par exemple, l’équivalent audiovisuel des pronoms ‘moi’ et

‘toi’, ou le temps verbal du récit ou, de manière plus générale, la structure grammaticale de

l’énoncé audiovisuel. L’inexistence d’une grammaire audiovisuelle, du moins dans les termes

traditionnels dans lesquelles celle-ci est conçue pour la langue, c’est-à-dire comme

“l'agencement des mots en phrases”11, constitue une des raisons de l’échec de beaucoup

de propositions dans ce sens.

Comme nous le verrons, cela n’est pas le cas de la proposition de Jost. Ici, nous ne

trouverons pas l’extrapolation d’une théorie d’un champ disciplinaire dans un autre (avec les

conséquences et risques épistémologiques que cela comporte) mais plutôt l’application de

ses aspects spécifiques, en cohérence avec une vaste réflexion qui a pour objet d’expliquer

la communication filmique et audiovisuelle. Dans le cas de l’auteur français, cette réflexion

part des modèles d’analyse narratologiques de Genette, de la théorie énonciative de

Ducrot et de la pragmatique anglo-saxonne, mais son axe de pertinence théorico-

méthodologique est situé dans les sciences de la communication et de l’information. Dans

ce contexte, l’intégration des concepts de la “logique des genres littéraires” implique la mise

en rapport de celle-ci avec les recherches autour de la compréhension spectatorielle, la

polyphonie et la construction de sens et d’affects.

Nous ne pouvons donc pas réduire la théorie de l’énonciation télévisuelle à une simple

“traduction audiovisuelle” de celle de Hamburger, étant donné que les origines et la portée

du travail de Jost dépassent largement la seule application des concepts soutenus par

l’auteur allemande dans le champ audiovisuel. Si nous mettons l’accent sur la relation entre

le travail de Jost et celui de Hamburger c’est parce que cette relation nous permet de

combler les vides que nous trouvons dans la proposition de Jost et qui nous empêchent

d’expliquer, de manière satisfaisante, l’énonciation télévisuelle dans le vidéo-clip.

Afin de comprendre les convergences et les différences entre les modèles proposés par Jost

et Hamburger, nous avons choisi, comme nous l’avons fait par rapport à la “Logique des

genres littéraires”, de réaliser – non pas une synthèse de l’énonciation télévisuelle mais un

parcours commenté des concepts les plus importants en rapport à notre sujet, utilisés par Jost

depuis les années ‘80 jusqu’à nos jours12.

11 Greimas, A, J. et Courtés, J, 1996, p. 167. 12 Idées et hypothèses qui se trouvent exposées dans l’ensemble de la bibliographie, que nous citons, de cet

auteur.

s e c t i on ! 2 . ! c a d r e ! t h éo r i c o ?mé thodo l o g i que ! ! u n e ! t ypo l o g i e ! d e s ! g en r e s ! t é l é v i s u e l s !

61 !

1. ! INTENTION,!PROMESSE!ET!GENRE!

D’après F. Jost, pour comprendre de quelle manière un programme particulier trouve son

sens, dans le cadre de la grille de programmation, il faut connaître le processus d'attribution

énonciative qui se produit chez le téléspectateur, qui peut être défini comme l’action de

reconnaissance du type de vérité que soutient l’énonciateur responsable qui est à l’origine

de l’émission.

Ce processus interprétatif-inférentiel de l’attribution-reconnaissance de la responsabilité

énonciative va déterminer le classement de l’émission dans une catégorie générique

(information, série, divertissement, etc.). Dans le modèle proposé, le genre est l’outil qui

permet au téléspectateur d’identifier et d’interpréter, en dernière instance, ce qu’il voit et

entend à la télévision. De là, sa relation avec la théorie des genres littéraires de Hamburger.

Mais avant d’expliquer le rôle central occupé par le genre dans la théorie de l’énonciation

télévisuelle de Jost, il nous semble nécessaire d’aborder la définition suivante, qui concerne

les conditions du processus d’attribution-reconnaissance des modes énonciatifs, car elle va

nous permettre d’exposer les éléments fondamentaux qui soutiennent l’idée que le genre est

un facteur clé pour expliquer le phénomène de la compréhension spectatorielle dans la

communication télévisuelle. D’après Jost :

"La catégorisation d'une émission dans un genre par le téléspectateur dépend à la fois des

promesses de la chaîne et des médiateurs (presse, radio, etc.) et de sa capacité à

reconstruire une intention qui fonde l'unité de l'émission malgré la diversité des types de

séquences qui la composent". (Jost F, 1999, p. 28).

a. ! Présomption!d’intentionnalité !

En premier lieu, en établissant le binôme chaîne/téléspectateur – la première étant

productrice de messages avec intention informative13 relevante, la deuxième étant capable

d’interpréter de manière pertinente ces messages – l’auteur fixe le point de vue

communicationnel de sa démarche.

L’option qu’il choisit est celle de concentrer l’analyse au niveau du téléspectateur, et plus

précisément dans la construction de la compréhension spectatorielle de l’énonciation14 (“La

catégorisation d'une émission dans un genre par le téléspectateur”), plutôt qu’au niveau de

13 Intention informative : "rendre manifeste ou plus manifeste à l'auditoire un ensemble d'hypothèses". (Sperber

et Willson, 1989, p. 93). 14 Ce point de vue méthodologique est partagé par des chercheurs tels que Roger Odin (Odin, 1983, 1988,

2000-a, 2000-b) et Jean Chatêauvert (Chatêauvert, 1996), entre autres.

n i ! f i c t i on ! n i ! r é a l i t é !

62!

l’auteur15 ou du texte16, comme le font généralement la sémiolinguistique et l’analyse du

discours audiovisuel.

Un des éléments principaux qui ont orienté le travail de Jost autour de l’analyse du film et de

la télévision, est l’idée que la compréhension du téléspectateur n’est possible qu’en vertu de

l’existence de ce qu’il appelle un “anthropomorphisme régulateur”. Son hypothèse, qui a

une solide base pragmatique, avance que pour comprendre un document filmico-

audiovisuel, que ce soit en tant que fiction, discours de la réalité, ou comme œuvre d’art, il

doit être interprété par le récepteur comme un artefact communicationnel d’origine et de

destination humaines. Cela veut dire que, à la base de toute interprétation par le

téléspectateur, se trouve une présomption d’intentionnalité ("capacité à reconstruire une

intention"), qui est l’élément qui la rend possible.

"(...) si nous n'attachons pas le même prix aux images d'une caméra de surveillance et à

celles d'un film ou d'un témoignage, cela tient au fait que nous savons que les unes sont de

simples empreintes, un enregistrement, tandis que les autres sont fabriquées dans l'intention

de nous dire quelque chose". (Jost F, 1992, p. 11).

Cette capacité du téléspectateur de reconstruire l’intention énonciative de l’émission

repose, avant tout, sur ses croyances et ses savoirs. Tandis que les premières s’acquièrent

sans y penser au cours d’une vie de téléspectateur, les deuxièmes relèvent d'une attitude

d'analyse et de réflexion qui requiert une mise à distance particulière et un apprentissage.

Ces croyances et ces savoirs du téléspectateur sont des éléments variables, aussi bien en

termes culturels que psychologiques, cognitifs, affectifs ou historiques . Dès lors, on ne peut

pas espérer qu’il y ait une symétrie exacte entre les objectifs communicationnels du

réalisateur audiovisuel, ou de la chaîne qui diffuse l’émission, et l’idée que se fait le

téléspectateur par rapport à l’intention énonciative d’un programme particulier. Dans ce

contexte, il n’y a pas une base qui permette d’affirmer qu’il y a de “bonnes” et de

“mauvaises” lectures du texte audiovisuel, celles-ci doivent être évaluées à partir de sa

pertinence contextuelle17.

C’est en raison de cela que, pour Jost, les moyens audiovisuels mis en œuvre dans un

programme précis (cadrage, montage, sonorisation…), les médiations verbales et visuelles18

qu’il appelle mode d'effectuation de l'acte d'énonciation, sont perçus à la réception selon les

15 Surtout dans les travaux des analystes du Discours. Par exemple : Charaudeau, P, 1997. 16 Principalement, les travaux de Christian Metz (: 1976 - 77 - 91). 17 Selon Roger Odin, qui a concentré aussi son travail dans l’analyse du pôle de réception de l'énonciation :

"Les questions auxquelles on tente désormais de répondre sont du type : qu'est-ce que lire un film en tant que spectatrice? en tant qu'homosexuel ou lesbienne? en tant que noir? en tant que yuppie? en tant que critique? comment lisait-on les films dans les premiers temps du cinéma, etc.?" (Odin, R, 2000-a)

18 Selon l’auteur, la médiation sonore dépend des médiations verbales ou des médiations visuelles. Nous reviendrons sur cette question lorsque nous analyserons le vidéo clip.

s e c t i on ! 2 . ! c a d r e ! t h éo r i c o ?mé thodo l o g i que ! ! u n e ! t ypo l o g i e ! d e s ! g en r e s ! t é l é v i s u e l s !

63 !

compétences – savoirs et croyances – du téléspectateur. C’est-à-dire que si l’interprétation

du mode d’effectuation de l’acte d’énonciation est régulée par les savoirs et croyances du

téléspectateur, le type de médiation n’est pas l’élément qui décide en dernière instance

l’interprétation spectatorielle19. Ceci est valable même si l’on considère que l’“apprentissage

audiovisuel” du téléspectateur est un processus historique, étant donné qu’il est social et

contextuel avant d’être universel.

b. ! La!promesse!de!la !chaîne!

Le deuxième élément qui nous semble important, c’est l’introduction du terme "promesse" à

la place du concept de "contrat"20, généralement utilisé pour signaler le type de relation qui

s’établit entre la chaîne et le téléspectateur par rapport à une émission donnée.

D’après Jost, le concept de “promesse” désigne mieux le mode de relation

communicationnel établi entre la chaîne et le téléspectateur. Alors que le contrat définit une

relation d’engagement soutenue par deux entités, le terme promesse fait allusion à un acte

unilatéral qui n’oblige que celui qui la prononce. Cette définition ne peut que sembler

provocante et polémique, dès lors que le concept de "contrat" est devenu un lieu commun

dans les approches pragmatiques de signes totalement divers21.

L’idée que le lien entre la chaîne et le téléspectateur est un contrat, se dégage du modèle

langagier de la conversation22. Dans cette forme spécifique d’interaction, le locuteur et le

récepteur changent constamment de rôle; ils sont interlocuteurs. Tous deux fixent les contours

de leu conversation sur la base d’un engagement qui est évalué, corrigé ou renforcé par les

deux pôles, à chaque moment du processus de communication.

La communication télévisuelle contemporaine est loin de pouvoir être représentée comme

un contrat. Le "people meeter" et les enquêtes ne correspondent pas au même type de feed

back qui se produit dans une relation de réciprocité directe. Le téléspectateur ne peut agir

qu’à travers le refus ou l’acceptation et non pas par le biais de la demande, la négociation

ou l’accord. L’hétérogénéité des programmes qui composent la grille d’une chaîne, surtout

celles de type généraliste et la très large offre télévisuelle empêchent la fidélisation de la

réception telle qu’on la connaît au niveau d’un journal, par exemple, par rapport auquel la

métaphore du contrat serait beaucoup plus viable. A la différence de ce qui se produit avec

19 Dans le même sens, Roger Odin soutient que la production de sens et d'affects à partir d’un objet audiovisuel

n’obéit à aucune "prédétermination textuelle" (Odin, R, 1983) 20 Depuis les années '80, la notion de « contrat de lecture » a été abondamment utilisée par les analystes de la

télévision d’orientation pragmatique. Un échantillon partiel, mais peut-être représentatif, peut être trouvé dans : Verón, E (: 1981, 1983) ; Charaudeau, P (: 1997) ; Lochard, G et Soulages, J-C (: 1998).

21 Tel est le cas de la sémio-pragmatique d’Odin, de l’analyse du discours de Charaudeau et de l’analyse de dispositifs de Noël Nel, entre autres.

22 C’est Francisco Cassetti qui introduit ce modèle pour expliquer la communication audiovisuelle (Cassetti, F, 1983)

n i ! f i c t i on ! n i ! r é a l i t é !

64!

d’autres types de médias, la chaîne télévisée est obligée de vendre à l’avance sa

programmation aux entreprises de publicité, elle doit prévoir à l’avance et agir dans des

espaces de plus en plus compétitifs. Elle doit offrir au téléspectateur des avantages

symboliques en regard des options globales proposées par le petit écran. Pour cela, elle

profère une promesse de bénéfice, de bonheur, d’information ou de divertissement.

Dans la mesure où la présomption d’intentionnalité régule la compréhension spectatorielle,

elle fixe et définit les attentes du téléspectateur. Dès lors, la promesse que fait la chaîne

concernant un programme particulier, en tant que déclaration d’intentions, va peser sur

l’interprétation du programme par le téléspectateur23.

Par ailleurs, chaque émission contient en elle-même sa propre promesse. Selon Jost :

"tout document est en lui-même promesse d'une relation à un monde, dont le mode ou le

degré d'existence conditionne la participation du téléspectateur” (Jost, F, 1997, p. 18).

Cela veut dire que les éléments textuels et contextuels de chaque programme indiquent, à

leur tour, les modes de compréhension possibles – ou désirés – du type de vérité qui est à

l’origine de l’émission.

Ainsi, la réception des émissions télévisées se place au carrefour de deux types de promesses

: en premier lieu, la promesse contenue dans la communication de l’émission en particulier –

communication qui se réalise à travers les bandes-annonces, la publicité ou les reportages

sur le programme que la chaîne fait elle-même ou via d’autres médias (presse, radio,

affiches, etc.). Par ces différents moyens, la chaîne cherche à persuader le téléspectateur

de l’intérêt et des émotions que le programme peut lui procurer. L’autre type de promesse

est celle que constitue le genre de l’émission.

c. ! Le!genre!comme!promesse!

Le troisième élément qui nous semble important dans la définition qui nous occupe, est celui

de l’introduction du concept de genre comme élément clé pour la compréhension

spectatorielle.

Comme nous l’avons établi dans le chapitre précédent, penser les genres à la télévision est

une tâche complexe, et cela pour trois raisons.

Premièrement, l’hétérogénéité des objectifs de la télévision, caractéristique qui différencie

fortement la communication télévisuelle de celle des autres formes de médiation et qui

23 Il est important de ne pas confondre les promesses explicites proférées par la chaîne à des fins stratégiques.

Comme n’importe quel locuteur, la chaîne peut promettre quelque chose et réaliser une tout autre. Le point de vue adopté par Jost, centré sur le téléspectateur, ne considère pas les stratégies de la chaîne mais seulement les données qui permettent au téléspectateur de reconstruire son intention.

s e c t i on ! 2 . ! c a d r e ! t h éo r i c o ?mé thodo l o g i que ! ! u n e ! t ypo l o g i e ! d e s ! g en r e s ! t é l é v i s u e l s !

65 !

pourrait nous porter à croire à son autonomie et à ignorer, ainsi, les formes et critères de

classification historiquement utilisés.

Deuxièmement, l’origine pré-médiatique de la plupart des documents diffusés par la

télévision24, qui pourrait nous mener à transposer, directement, à l’analyse du genre

télévisuel, les catégories valables pour la littérature.

Troisièmement, l’ambition d’établir une typologie définitive et universelle, qui nous pousserait

à ignorer la fonction pragmatique d’une typologie générique sur le plan de la

communication télévisuelle.

Face à cette complexité, Jost propose un travail qui intègre et rende compte aussi bien des

bases historiques et théoriques qui fondent la nature pré-médiatique de la plupart des

documents télévisuels (fiction, information, jeu, etc.) que des nouveaux types qu’il appelle

proprement télévisuels (reality show, talk show), qui exigent un effort de catégorisation

spécifique.

Parmi les logiques ou activités auxquelles peut nous renvoyer la catégorisation générique

(voir chapitre précédent - IV), le concept de “promesse du genre” en souligne une en

particulier : celle qui permet l’interprétation spectatorielle d’un programme déterminé.

"Chaque genre est une promesse, au sens où Stendhal disait du Beau qu'il est une

promesse de bonheur, mais au sens aussi où les publicitaires promettent un bénéfice (…)

Certains promesses caractérisent le genre lui-même. Personne ne pense que le

documentaire soit totalement inventé ou que le direct montre des événements passés".

(Jost, F, 1997, p. 13).

Le genre est, pour Jost, l’outil qui permet à la chaîne d’agir sur le téléspectateur et qui

permet à ce dernier d’identifier ce qu’il voit et entend dans une émission en particulier.

Ainsi, l’intégration des deux types de réalité qui coexistent à l’intérieur de la télévision,

l’ancien et le nouveau, n’est possible qu’à partir d’une approche phénoménologique de la

réception des documents télévisuels. C’est-à-dire, à partir d’une démarche qui se propose

d’expliquer en quoi et comment le genre est la "promesse d'une relation à un monde".

C’est justement à ce niveau-là que Jost va intégrer la théorie de Hamburger pour expliquer

l’énonciation télévisuelle.

2.! LES!GENRES!TELEVISUELS!DE!PREMIER!DEGRE!

Prenant comme point de départ la “Logique des genres littéraires” (Hamburger, Käte, 1986),

Jost, à l’instar de Käte Hamburger, fonde son analyse de l’énonciation télévisuelle en

établissant une première ligne de partage : l’opposition entre réalité et fiction. Comme nous

24 Voir chapitre II de ce travail.

n i ! f i c t i on ! n i ! r é a l i t é !

66!

l’avons souligné, ce binôme conceptuel a la vertu d’établir que, d’une part, la réalité est

différente de la fiction et que, en même temps, la réalité est la matière première de la fiction.

En d’autres termes, fiction et réalité se constituent en deux modes de vérité différents,

chacun avec ses logiques propres, et donc excluantes, car elles ne sont différenciables qu’à

partir de l’identification du sujet d’énonciation. C’est-à-dire que Jost établit que la différence

entre réalité et fiction ne se trouve pas dans les caractéristiques structurelles du texte lui-

même mais dans le sujet d’énonciation qui est à l’origine de l’énoncé25.

Une scène qui nous montre les dons télékinésiques d’un enfant peut correspondre, de la

même manière, à un film de fiction, comme dans le cas de “L’exorciste”, à un documentaire

sur les facultés paranormales, reportages habituels à l’horaire de grande audience ou,

même, à un programme de type caméra cachée, aujourd’hui si populaires et qui ont pour

but de se moquer du commun des mortels. Le seul indice qui nous permet d’établir le type

de vérité mise en jeu par les images et le son de la scène est le contexte dans lequel elle est

émise.

Si les discours sur la réalité obéissent, en termes généraux, aux règles déjà établies par Searle

pour les assertions (Searle, J-R, 1979), c’est-à-dire qu’ils peuvent être jugés en termes de vrais

ou faux, la fiction, par contre, ne se soumet pas à ces règles car le locuteur ne lui réclame

que la cohérence et la consistance narrative. Ainsi, on désactive l’analyse de l'opposition

équivoque entre fiction et vérité, le “vrai” correspondant à la réalité et le “faux” à la fiction,

selon la logique de la théorie du jugement. S’il s’agit d’un discours sur la réalité, seul le

mensonge et la falsification peuvent s’opposer à la vérité. S’il s’agit d’un discours fictionnel,

seul l’absence de cohérence de l’univers créé peut s’opposer à la diégèse et donc, à la

vérité soutenue par la fiction.

Ainsi, la dialectique qui s’établit entre ces deux termes – réalité et fiction – permet à Jost de

définir deux grands modes d'énonciation à la télévision : le mode authentifiant, qui renvoie à

l’existence d’un Je-Origine réel26, mode qui regroupe les émissions télévisées qui cherchent à

nous informer ou à nous mettre en contact avec la réalité de notre monde (journaux

télévisés, documentaires, reportages, émissions en direct) et le mode fictif, qui nous renvoie à

un Je-Origine fictif27, mode d'énonciation qui se réfère aux émissions qui ont pour but la

construction d’un monde diégétique imaginaire et cohérent (séries, sit’com, téléfilms, films).

25 L’approfondissement de cette idée aboutit à une première différence entre le modèle de Jost et celui de

Hamburger, ce qui a son explication dans l’impossibilité et l’inutilité de transposer de manière mécanique une théorie destinée à la littérature, comme celle de l’auteur allemande, dans le champ de l’analyse audiovisuelle. Alors que dans la théorie littéraire, les déictiques et la structure verbale sont des éléments essentiels pour déterminer le caractère réel ou non réel du sujet qui est à l’origine de l’énoncé, dans l’analyse narratologique audiovisuelle l’application de ces concepts est impossible.

26 Selon l’auteur, il s’agirait d’un sujet d’énonciation historique. Nous reviendrons sur ce point. 27 Jost définit le Je-Origine fictif comme un narrateur inventé par un Je-Origine réel. Nous reviendrons sur ce

point dans les conclusions.

s e c t i on ! 2 . ! c a d r e ! t h éo r i c o ?mé thodo l o g i que ! ! u n e ! t ypo l o g i e ! d e s ! g en r e s ! t é l é v i s u e l s !

67 !

Pourtant, Jost, s’éloignant de Hamburger (et des critères logico-méthodologiques établis par

son travail), et prenant comme référence les thèses développées par Searle dans “Sens et

expression” (Searle, J-R, 1979), dans lesquelles celui-ci distingue énoncé de réalité (une

assertion littérale sérieuse), énonce fictif (assertion littérale, non sérieuse) et énoncé figural

(assertion sérieuse non littérale), introduit un troisième mode d'énonciation, le mode ludique.

Jost définit ce dernier comme un niveau intermédiaire entre les modes authentifiant et

fictionnel, car il s’agit de programmes qui "parlent à la fois du monde, tout en se conformant

à des règles propres, dont le respect est primordial, comme la fiction" (Jost, F, 1999, p.30).

D’après ceci, il y aurait, dans l’énonciation télévisuelle, des Je-Origine réel qui répondent

eux-mêmes de la véracité des propositions qu’ils expriment et des Je-Origine réel ludiques qui

sont soumis à des règles et à des rites qui régissent leur conduite et dont ils ne sont pas tenus

de répondre (comme un personnage de fiction). On peut inclure ici les programmes tels que

le jeux, les variétés et, même, la publicité.

Fictionnel, authentifiant et ludique, ces trois modes d’énonciation correspondent aux trois

types de promesses de rapport à un monde qui conditionnent la participation du

téléspectateur à la compréhension des programmes de télévision.

Pourtant, l’ensemble des programmes qui peuvent être rangés dans cette typologie

triadique correspond seulement à ceux dont l’origine est au-delà du cadre de la télévision

(fiction : littérature; information : presse; jeux: activité sociale). Notre expérience des

téléspectateurs nous indique que, parallèlement à ce type d’émissions, il y en a d’autres qui

ne peuvent pas être classées dans les catégories “de fiction”, “authentifiante” et “ludique”,

du fait qu’elles combinent et transgressent la logique indiquée. Tel est le cas du reality show

et de toute la gamme des docu-drames.

Si ces programmes échappent à la typologie des genres indiquée, c’est parce que les

différents modes énonciatifs s’y mêlent ou parce qu’ils sont construits sur base de ce que K.

Hamburger appelle le Comme Si de la réalité. C’est pour cela que Jost définit les genres

traditionnels comme modes d’énonciation de premier degré et les autres genres comme

modes d’énonciation de deuxième degré, ceux-ci étant un niveau méta-énonciatif des

premiers.

3.! LA!FEINTISE!ET!LES!MODES!ENONCIATIFS!DE!DEUXIEME!DEGRE!

La définition établie par Hamburger concernant l’énoncé de réalité feint28 est, en dernière

instance, l’insertion de la forme énonciative (de réalité) à l’intérieur de la fiction. C’est-à-dire

que l’énoncé de réalité feint est un simulacre énonciatif : le Comme Si de la réalité.

28 Récit fictionnel à la première personne, selon la caractérisation formelle que fait Hamburger par rapport à ce

genre mixte (Hamburger, K, 1986, p. 274 et suivantes).

n i ! f i c t i on ! n i ! r é a l i t é !

68!

Reprenant ce point de la proposition de Hamburger, Jost avance l’idée que l’on peut aussi

trouver, dans l’énonciation télévisuelle, des genres mixtes dont le comportement est similaire

à celui de l’énoncé de réalité feint. Il va encore plus loin en disant que cette caractéristique

définit les genres proprement télévisuels, qui ont comme origine ce média et que l’on ne

peut trouver que là.

“L'une des caractéristiques de la télévision d'aujourd'hui est, sans doute, d'avoir engendré

des genres qui détournent les modes authentifiant-fictif-ludique : alors que ceux-ci étaient

issus de genres pré-télévisuels - actualités, films, variétés - les dernières années ont vu

apparaître des doubles, des imitations, des versions au second degré de ces genres de

premier niveau, concourant à inventer de véritables genres télévisuels.” (Jost, F, 1999, p.

31).

Les procédés concrets à travers lesquels la feintise29 cherche à simuler une énonciation

authentifiante sont les suivants :

- la feintise profilmique : la feintise est réalisée dans la mise en scène de l’événement. C’est

le cas des émissions qui reconstituent – montent et reproduisent – des événements réels et

les présentent comme si l’on assistait à leur déroulement. Un exemple clair de ce type de

feintise est constitué par la plupart des reality shows, principalement ceux avec des

thématiques policières ou judiciaires.

- la feintise narrative: le simulacre se situe au niveau de la forme du récit de l’événement.

C’est ce que l’on peut observer lorsque dans la fiction filmico-télévisuelle, le récit est

assumé de manière directe par un personnage-locuteur. C’est la modalité audiovisuelle

de ce que dans la théorie de Hamburger serait le récit à la première personne. Un

exemple de ce type de feintise, nous pouvons le trouver dans tous les films et programmes

qui simulent les formes de récit propres au documentaire, au témoignage ou au

reportage30.

29 Il faut signaler que Jost remplace le concept d’énoncé de réalité feint (terme utilisé et défini par Hamburger)

par celui de feintise, sans expliquer les raisons de ce remplacement. Il semble, pourtant, pertinent de supposer que l’auteur français prend la notion de "feintise" de la réflexion théorique de John R Searle sur l’opposition entre acte illocutoire et discours fictionnel. Le problème en est que, dans le cas de la proposition de Searle, la notion de “feintise” se réfère à un niveau logique différent de celui que suppose la notion "énoncé de réalité feint". Searle avance que le discours fictionnel, en tant qu’énonciation “littérale et non sérieuse” correspond à un ensemble d’“assertions feintes”, ce que dans le système théorique de Hamburger équivaut à la “mimésis de la réalité” – le Comme la réalité – et non à un “énoncé de réalité feint” – le Comme Si de l’énoncé de réalité : "l'auteur d'une oeuvre de fiction feint d'accomplir une série d'actes illocutoires, normalement du type assertif". (Searle, J. R., 1982, p. 108). Nous reviendrons sur cette question, de manière plus approfondie, dans le chapitre VII.

30 Selon Roger Odin, la mise en œuvre du mode documentarisant demande au spectateur une lecture documentarisante. Ce mode documentarisant "est constitué par l'ensemble des processus de production de sens et d'affects nécessaires à la production documentarisante (dans l'espace de la réalisation ou de la lecture)". Et, dès lors, "la lecture documentarisante peut être mise en œuvre pour tout film (y compris les films de fiction)" (Odin R, 2000-b, p. 128).

s e c t i on ! 2 . ! c a d r e ! t h éo r i c o ?mé thodo l o g i que ! ! u n e ! t ypo l o g i e ! d e s ! g en r e s ! t é l é v i s u e l s !

69 !

- La feintise énonciative : ici, la structure Comme Si se situe dans le mode de représentation

verbale et visuelle propre du média, par rapport à la réalité de l’événement. Les

tremblements et des mouvements brusques de caméra, une narration verbale

entrecoupée et dubitative, la mauvaise qualité de l’image, etc., tous ces éléments

servent à construire des d’interférences pour créer, à la réception, le sentiment que le

document audiovisuel correspond à une prise circonstancielle, non préparée.

Un autre type d’émission que Jost classe dans les genres télévisuels de deuxième degré sont

ce qu’il appelle les clins d’œil de la fiction et le jeu avec le jeu. Ces deux modalités

génériques de deuxième degré se caractérisent par leur qualité de méta-niveaux énonciatifs

du genre fictif et ludique respectivement et sont construites comme des parodies ou des

allusions qui reposent sur les capacités cinéphiles ou téléphiles du spectateurs. Faisant allusion

aux modèles audiovisuels préexistants, ce type d’émission base son efficacité sur la

reconnaissance, par le téléspectateur, des esthétiques et thématiques générées jusqu’ici par

le cinéma et la télévision.

4.! GENRE, !PROMESSE!ET!FIGURE!ANTHROPOÏDE!

Le genre (télévisuel) est l’instrument qui permet au téléspectateur d’identifier et d’interpréter

ce qu’il voit et entend à la télévision. C’est, en effet, à travers cet élément que le récepteur

peut attribuer un mode d'énonciation spécifique (authentifiant, fiction, ludique ou mixte) au

document télévisé. Chaque mode d'énonciation correspond à un type de vérité soutenue

par l’énonciateur responsable – Je-Origine – d’une émission en particulier. Ce processus

d’attribution énonciative, qui est à la base de la compréhension spectatorielle, n’est possible

que grâce à un anthropomorphisme régulateur de la communication télévisuelle, puisque la

construction de sens à la réception est possible seulement dans la mesure où les programmes

sont considérés comme des messages clairement porteurs d’intention communicative31.

Mais quel est donc l’ancrage concret de cette figure anthropoïde dans les différents

documents télévisuels?

Jost soutient que chaque genre est une promesse. La conséquence logique d’une

affirmation comme celle-ci est l’existence nécessaire d’une figure humaine concrète qui

réalise l’acte de promettre. Un Je qui incarne, dans le document audiovisuel, la promesse en

question. Ainsi, la promesse d’authenticité du journal télévisé, du direct et du documentaire

est incarnée par le conducteur-locuteur, par le témoin et par le narrateur-témoin,

respectivement; la promesse de cohérence narrative du récit filmique, du sit’com ou du

feuilleton est portée par le narrateur (implicite ou explicite); la promesse de divertissement et

le respect des normes dans les concours, est assumée par l’animateur et les joueurs.

31 Voir Sperber et Willson, 1989, pp. 96 à 102.

n i ! f i c t i on ! n i ! r é a l i t é !

70!

La figure anthropoïde comme ancrage du type de vérité d’une émission joue, dès lors, un

rôle essentiel dans le processus d’attribution énonciative car elle devient le garant de la

promesse du genre que l’émission incarne. De là, que la valeur du concept concret Je-

Origine - proposé par Hamburger - se place au-dessus de celui, abstrait, du sujet

d’énonciation.

Pourtant, la compréhension spectatorielle est sujette aux compétences – savoirs et

croyances – du téléspectateur. La figure humaine responsable de l’énonciation d’un

programme donné dans la programmation d’une chaîne ne doit pas coïncider

nécessairement avec celui qui occupe le premier niveau de l’énonciation ni même avec

une personne naturelle. C’est pour cela qu’une série comme Ally MacBeal peut être

interprétée comme une réalisation du directeur et scénariste David E. Kelly, comme la

dernière production des studios Fox, voire même comme la série la plus regardée de la

télévision belge.

C’est justement à ce niveau, où la théorie de l’énonciation télévisuelle de Jost s’ouvre aux

différents niveaux polyphoniques, que se joue l’énonciation : la chaîne, la grille de

programmation, les genres et les programmes. Nous reviendrons sur cette question plus loin.

C.! APPROXIMATIONS!ET!DISTANCES!

Si la littérature et la fiction audiovisuelle représentent de réalités médiatiques et cognitives

tout à fait différentes, elles ont en commun le fait de nous procurer, en utilisant chacune des

procédés qui lui sont propres, une expérience de fiction ou, comme dirait Hamburger, de

mimésis de réalité ou de non-réalité. C’est exactement le contraire, du point de vue de

l'inventio32, qui rapproche l’énonciation proférée dans le système énonciatif de la langue et

le mode d'énonciation authentifiant à la télévision. Ici, l’élément commun est que tous deux

nous permettent une expérience de réalité, plus exactement, d’affirmation d’une réalité

indépendante de sa narration – que ce soit au niveau historique, théorique ou pragmatique

– c’est-à-dire, une expérience d’authenticité et de lisibilité du réel présenté par le réalisateur

ou auteur.

Cette identité phénoménologique commune entre les expériences de la fiction littéraire et

celles de la fiction audiovisuelle, de même qu’entre l’énonciation de réalité dans le système

de la langue et à la télévision, constitue l’élément fondamental qui autorise Jost et, par son

intermédiaire, nous autorise à incorporer la logique des genres littéraires à l’analyse de

l’énonciation télévisuelle.

32 Parmi les trois divisions principales de la rhétorique, inventio (invention), dispositio (composition) et elocutio

(style), l'inventio est la caractéristique la plus décisive, du point de vue des deux théories, pour établir le caractère fictionnel ou réel des énoncés, étant donné qu’aussi bien la dispositio que l'elocutio, peuvent être assumées indistinctement par des énoncés de réalité ou de fiction.

s e c t i on ! 2 . ! c a d r e ! t h éo r i c o ?mé thodo l o g i que ! ! u n e ! t ypo l o g i e ! d e s ! g en r e s ! t é l é v i s u e l s !

71 !

En nous basant sur cette affirmation, soutenue implicitement et explicitement tout au long de

ce chapitre, nous nous attacherons à établir quelques-unes des différences significatives

entre les deux théories.

Il y a deux domaines principaux dans lesquels il nous intéresse de développer un bref

contrepoint entre les deux théories révisées dans les pages qui précèdent. Ces deux

domaines nous semblent importants pour l’analyse que nous essayons de construire, car ils

vont nous servir aussi bien pour fixer nos options sur le plan théorico-méthodologique que

pour opérationnaliser quelques concepts essentiels de notre point de vue. Le premier

domaine de comparaison se situe au niveau du positionnement différent de ces deux

postulats par rapport à leur objet d’étude. Le deuxième domaine dans lequel nous allons

concentrer notre attention est celui que Jean-Marie Schaeffer appelle l’ordre des

phénomènes (: 1989, p. 79 et suivantes.) qui permet à chacune des deux propositions de

définir les catégories génériques qui lui sont propres.

1.! POSITIONNEMENT!PAR!RAPPORT!A!L’OBJET!

S’il y a un domaine dans lequel la différence entre les deux propositions devient plus

évidente, c’est celui qui se rapporte à la définition du concept de “fiction” (littéraire chez

Hamburger, télévisuelle chez Jost). A notre avis, la divergence qui s’exprime ici est un indice

du positionnement théorico-méthodologique de chacun des auteurs par rapport à leurs

objets d’étude.

De l’ensemble des thèses et conclusions avancées par la Logique des Genres littéraires, celle

qui se rapporte à l’inexistence du sujet d’énonciation dans la fiction et, donc, à l’impossibilité

d’énonciation dans ce genre, est sans doute une des plus surprenantes et provocatrices.

D’après les postulats de la théoricienne allemande, le processus de fictionnalisation sépare la

narration fictionnelle de l’énoncé de réalité. Le Je-Origine réel disparaît, ce qui veut dire qu’il

s’efface en tant que sujet d’énonciation pour laisser apparaître les Je-Origine fictifs (les

personnages) qui sont produits par la narration. Ainsi, le statut logique de la fiction empêche

que l’on puisse parler d’énonciation lorsque nous parlons de Je-Origine fictifs, puisqu’ils ne

sont que le résultat de la fonction qui les engendre et non des sujets de l’énonciation.

Poursuivant cette séquence logique, pour Hamburger, l’auteur – plus précisément le

romancier – ne peut pas non plus être défini comme sujet d’énonciation :

"Le romancier n'est pas un sujet d'énonciation, il ne raconte pas à propos de personnes et

de choses (il ne parle pas de personnes...), il raconte personnes et choses." (Hamburger, K,

1986, p. 126).

De son côté, Jost définit la fiction comme :

n i ! f i c t i on ! n i ! r é a l i t é !

72!

"la construction d'un monde possible, cohérent et consistant renvoyant à un Je-Origine fictif

[dans laquelle les Je-Origine fictifs sont :] (...) ceux qui sont inventés par des Je-Origine réels

et qui ne sont donc pas responsables au même titre que les premiers des énoncés qu'ils

prononcent". (Jost, F, 1995, p. 174).

Ainsi, il établit l’existence d’un mode d'énonciation fictif tout comme il y a un mode

d'énonciation authentifiant.

Dans cette proposition, tous deux - le narrateur fictif et l’auteur - énoncent, bien que la

responsabilité du premier sur ses énonciations ne soit pas la même que celle de l’auteur. La

narration, dans les processus de fictionnalisation, est assumée en partant des mêmes

principes logiques que ceux d’un énoncé de réalité, son caractère de mimésis de la réalité

étant la seule différence entre les deux.

La reconnaissance du narrateur comme sujet d’énonciation et de la narration fictionnelle

comme territoire énonciatif (dans lequel son caractère de non-réalité est mis entre

parenthèse, suspendu pour être analysé), permet à Jost de connecter sa théorie de

l’énonciation avec la narratologie de Genette et avec la théorie de l’énonciation

polyphonique de Ducrot.

Ainsi, la Logique des Genres Littéraires de Hamburger nous apparaît davantage comme une

phénoménologie des structures logiques profondes du processus de fictionnalisation que

comme une explication des rapports internes qui résultent de ce processus. La théorie de

l’énonciation télévisuelle de Jost, quant à elle, se situe plus proche de la narratologie, c’est-

à-dire de l’explication des procédés du récit dans les processus de fictionnalisation.

"La thèse de Hamburger sur (entre autres) l'absence de narrateur dans le récit de fiction

devient compatible avec les catégories de la narratologie (qui se fondent presque toujours,

au contraire, sur la considération des diverses positions de ce narrateur, et des divers types

de 'médiation' qui en résultent), à condition de situer chacune de ces démarches au niveau

qui est le sien : celle de la narratologie au niveau des structures narratives de surface (le

'discours du récit'), celles de Hamburger au niveau des structures profondes de la production

d'un univers fictif". (Préface de Genette, G à la "Logique des Genres Littéraires", Hamburger,

K, 1986, p. 13).

Rien ne nous permet de soutenir que la différence de positionnement entre Hamburger et

Jost résulte nécessairement de l’adéquation d’une théorie, venant de l’espace disciplinaire

de la linguistique et de l’analyse littéraire, au domaine de l’analyse de l’énonciation

télévisuelle.

s e c t i on ! 2 . ! c a d r e ! t h éo r i c o ?mé thodo l o g i que ! ! u n e ! t ypo l o g i e ! d e s ! g en r e s ! t é l é v i s u e l s !

73 !

Nous pourrions peut-être trouver une explication possible dans la différence des bases

épistémologiques sur lesquelles repose chacun des points de vue33.

Pourtant, aux effets de l’analyse que nous essayons de faire concernant l’énonciation

télévisuelle dans le vidéo-clip, ce qui nous intéresse de déterminer réellement sont les

conséquences méthodologiques qui se dégagent de cette différence. Conséquences qui

sont, sans doute, liées, entre autres, à l’ordre des phénomènes qui permettent à chacune

des propositions de définir les catégories génériques qui lui sont propres.

2.! STATUT!ONTOLOGIQUE!DU!SUJET!V/S!MODES!D'ENONCIATION!

Comme nous l’avons signalé, tout acte discursif, dans la mesure où il représente non

seulement une chaîne syntaxique et sémantique mais aussi un acte de communication

interhumain, il est un objet sémiotique complexe. De là que les logiques de classification

taxinomique soient aussi des “artefacts sémiotiques complexes”.

Se basant sur cette caractéristique des logiques taxinomiques, Schaeffer établit cinq niveaux

différents de classification générale (voir Tableau 1, chapitre II). Trois de ces niveaux

correspondent à l’acte communicationnel lui-même (niveau de l’énonciation, niveau de la

destination, niveau de la fonction), les deux autres correspondant au message réalisé

(niveau syntaxique et sémantique).

Selon ce que nous avons vu jusqu’ici, aussi bien la logique de classification utilisée par

Hamburger que celle employée par Jost, correspondent à l’"acte communicationnel”.

Mais correspondent-elles, toutes les deux, au niveau de l’énonciation?

Selon Schaeffer :

"Au niveau de l'énonciation, trois phénomènes essentiels semblent jouer un rôle de

différenciation générique : il s'agit du statut ontologique de l'énonciateur, du statut logique et

physique de l'acte énonciatif et du choix des modalités d'énonciation" (Schaeffer, J-M, 1989,

p. 83).

33 Du point de vue de son insertion épistémologique, la théorie des genres littéraires de Hamburger hérite

incontestablement de la tradition philosophique allemande, plus précisément de la pensée de Hegel, espace dans lequel elle développe sa phénoménologie de la littérature. En accord avec cela, Hamburger construit un argument logique basé sur l’opposition dialectique entre les termes réalité et fiction. Ce système bipolaire de contraires permet à la théoricienne allemande d’expliquer aussi bien la structure énonciative du système de la langue que le "langage producteur de formes littéraires". Entre ces opposés il n’y a ni médiation ni graduation. Là où termine le système énonciatif de la langue commence la fiction et vice versa. La théorie de l’énonciation télévisuelle de Jost s’insère, quant à elle, dans la tendance, de plus en plus généralisée, d’encadrement des recherches en communication dans la pragmatique anglo-saxonne – et plus particulièrement – comme dans le cas qui nous occupe, dans celle développée par Peirce. Ainsi, la base de la proposition de Jost est la constitution d’une relation triadique entre les modes d’énonciation authentifiant, fictionnel et ludique, dans laquelle ce dernier terme assume la fonction de médiation entre les deux autres. Bien que la théorie de l’énonciation télévisuelle ait le même point de départ que celle de Hamburger, c’est-à-dire l’opposition entre réalité et fiction, son développement postérieur s’éloigne de la relation dialectique déployée dans la logique des genres littéraires.

n i ! f i c t i on ! n i ! r é a l i t é !

74!

Au premier abord, deux des trois phénomènes auxquels fait allusion Schaeffer, pourraient

être représentés dans les théories qui sont l’objet de notre analyse.

Pour Hamburger, ce qui est déterminant dans la définition des genres littéraires, c'est le

caractère du sujet d'énonciation, c'est-à-dire son "statut ontologique". La typologie de

Hamburger correspondrait clairement au niveau de l’énonciation de l’acte de

communication interhumaine que représente l’œuvre littéraire.

Par ailleurs, dans la mesure où Jost appelle ses catégories “modes d’énonciation”, il

semblerait logique de penser que sa taxinomie correspond au niveau des “modalités

d’énonciation” proposées par Schaeffer.

Pourtant, comme nous le verrons, les caractéristiques des catégories de Jost ne s’identifient

nullement avec celles des “modalités d’énonciation” de Schaeffer mais correspondent,

plutôt, au “statut logique de l’acte énonciatif” ou, comme nous le montrons plus loin

(chapitre VII), à un niveau différent de celui de l’énonciation: celui de la fonction34.

a. ! Les!Je=Origine!de!Hamburger!

Hamburger considère que la différence entre fiction et réalité peut se trouver moins dans les

caractéristiques de l’objet énoncé que dans le Je-Origine qui est à la base de l'énoncé.

Pour Hamburger, l’usage courant (non littéraire) de la langue consiste à produire des

énoncés de réalité dans lesquels on constate une relation de polarité entre le sujet

d’énonciation et l’objet énoncé. En d’autres termes, l’énonciation est "l'énonciation d'un

sujet (d'énonciation) sur un objet énoncé"35. L’objet étant totalement dépendant du sujet

d’énonciation, sa valeur de réalité est donnée, avant tout, par le statut réel du Je-Origine qui

est à la base de l’énoncé.

Par contre, l’usage littéraire de la langue se définit par le fait qu’il ne cherche pas à produire

des énoncés de réalité dont la fonction soit d’intervenir dans le monde. Cet usage littéraire

de la langue peut prendre deux formes différentes :

D’une part, dans le cas du genre lyrique, la relation sujet/objet est orientée vers le pôle-sujet

et non pas vers le pôle-objet, comme dans l’énoncé de réalité. Dans la mesure où le sujet

d’énonciation qui est à la base de la poésie (en vers ou en prose), le Je-Origine lyrique,

profère des énoncés de réalité dont la fonction est de constituer une expérience vécue,

inséparable de son énonciation, celui-ci ne peut pas être classé autrement que comme Je-

Origine réel, même s’il n’exerce pas une fonction dans la réalité, comme dans le cas de

l’ensemble des énoncés attribuables aux autres sujets d’énonciation – historique, théorique

ou pragmatique. Ceci permet à Hamburger de définir le genre lyrique dans le système

34 Le niveau de la "fonction" correspond à l’intention énonciative. Voir chapitre II.A.1. et chapitre VII.A.3. 35 Op. cit. p. 46.

s e c t i on ! 2 . ! c a d r e ! t h éo r i c o ?mé thodo l o g i que ! ! u n e ! t ypo l o g i e ! d e s ! g en r e s ! t é l é v i s u e l s !

75 !

énonciatif de la langue, puisque le Je-Origine lyrique, bien qu’il constitue un mode

d’énonciation différent des précédents, est ontologiquement un Je-Origine réel.

Par ailleurs, dans le cas de la fiction, la relation sujet/objet est remplacée par la fonction

narrative. C’est-à-dire que dans la structure logique de la fiction, la narration remplit la

fonction de création d’un univers spatio-temporel cohérent avec ses lois et ses personnages

propres (diégèse) et, dès lors, l’objet énoncé ne dépend pas d’un sujet d’énonciation mais

de la narration qui le crée :

"la chose racontée n'est pas un objet pour la narration. Sa fictivité, c'est-à-dire sa non-réalité,

signifie qu'elle n'existe pas indépendamment du fait de sa narration". (Hamburger, K., 1986,

p. 126).

La fiction commence là où disparaît le Je-Origine réel et seul en vertu de cette absence la

narration assume un caractère fonctionnel, en permettant l’entrée en scène des Je-Origine

fictifs. Ainsi, c’est le caractère du Je-Origine qui permet, en dernière instance, de différencier

un énoncé de réalité de ce que l’on a catégorisé comme fiction narrative. En même temps,

c’est cet élément qui permet à la théoricienne allemande de définir le genre fictionnel ou

mimétique par opposition au système énonciatif de la langue.

Le rôle central du statut ontologique du sujet d’énonciation dans la théorie de Hamburger

peut être observé aussi dans le cas des genres spéciaux ou mixtes. Ici, l’impossibilité de

déterminer le caractère fictif du Je-Origine qui se trouve à la base du récit à la première

personne, ou énoncé de réalité feint, empêche de le catégoriser dans la fiction. De cette

façon, le récit à la première personne peut être attribué uniquement, du point de vue

phénoménologique, à un sujet d’énonciation, à un Je-Origine réel. Seul les paramètres

contextuels, paratextuels ou épitextuels, comme le nom de l’auteur, le titre, la présentation

physique du texte, etc., nous permettent de déterminer le statut de réalité ou de non-réalité

du Je-Origine de ce type d’énoncés.

Dans chacun des cas cités, le classement en typologies génériques repose sur le caractère

du Je-Origine. Ainsi, c’est le statut de réalité du sujet, et non le mode d’énonciation qui lui est

propre, qui sert en définitive à Hamburger pour définir sa typologie des genres.

b. ! Les!modes!d'énonciation!de!Jost !

Dans la théorie de Jost, comme dans celle de Hamburger, la notion d’énonciation joue un

rôle essentiel :

"L'interprétation d'un programme dépend largement du mode d'énonciation qu'on lui attribue

(authentifiant, fictif, ludique)". (Jost, F, 1998, p. 35).

n i ! f i c t i on ! n i ! r é a l i t é !

76!

A partir de l’opposition entre réalité et fiction Jost établit, tout comme Hamburger, deux

types de Je-Origine, le Je-Origine réel et le Je-Origine fictif. Pourtant, à la différence de

Hamburger, pour la constitution des genres, Jost ne considère pas le statut ontologique du

sujet de l’énonciation mais la catégorie qu’il appelle “mode d’énonciation” – authentifiant,

fictif et ludique – qui se dégage de l’action énonciative de chacune des deux catégories de

“Je” qui émergent de l’opposition.

Dès lors, il semblerait logique de penser que, pour la construction de sa typologie, le

théoricien français considère, parmi les “phénomènes de différenciation générique”, celle

des “modalités énonciatives” définies par Schaeffer36. Pour rappel, celle-ci se réfère à la

différence entre narration et représentation ou, en d’autres termes, à la distinction

platonique entre diégèse et mimésis.

Pourtant, malgré le fait que dans l’ensemble des textes de Jost sur lesquels nous avons

travaillé, l’auteur ne définit pas clairement sa conceptualisation particulière de la notion de

“modes d’énonciation”, son choix de classification en modes authentifiant, fictif et ludique,

nous éloigne de la possibilité de les assimiler aux “modalités énonciatives” puisque, dans la

pratique, ils se réfèrent, soit au statut ontologique de l’acte énonciatif soit à l’intention

discursive de l’énoncé :

"Le mode authentifiant regroupe des émissions qui prétendent nous informer sur notre

monde ou tout simplement nous mettre en contact avec lui. (...) Le mode fictif vise à

construire un monde, quoi qu’il en soit des ressemblances avec le nôtre, comme une

construction autonome. (...) Il existe encore un niveau intermédiaire où les émissions

parlent à la fois du monde, tout en se conformant à des règles propres". (Jost: 1999, p. 29).

Comme nous le voyons, dans ces définitions, il n’y a pas de référence à la forme dans

laquelle est réalisée l’énonciation, c’est-à-dire à sa correspondance avec une modalité

d’énonciation mimétique (représentation) ou diégétique (narration).

Par contre, dans la mesure où l’auteur français utilise les dénominations authentifiant, fictif et

ludique, il semblerait que son choix se rapporte au statut logique de l’acte d’énonciation.

Dans ce cas, le critère de classification serait basé sur la forme adoptée par l’énonciation

elle-même, indépendamment du statut de l’énonciateur, et il aurait comme catégories

générales la distinction entre une énonciation sérieuse ou non-sérieuses (fictionnelle ou

ludique).

Mais Jost n’utilise pas la dénomination ludique pour parler de la mimésis ludique avec

laquelle Platon identifiait la fiction et que la théorie littéraire utilise depuis des siècles. De ce

fait-là, l’incorporation de la notion de “ludique” à la théorie des genres télévisuels peut se

prêter facilement à confusion. La catégorie que le théoricien français définit comme “mode

36 Voir chapitre II de ce travail ou Shaeffer, J-M, 1982, pp. 79 à 130.

s e c t i on ! 2 . ! c a d r e ! t h éo r i c o ?mé thodo l o g i que ! ! u n e ! t ypo l o g i e ! d e s ! g en r e s ! t é l é v i s u e l s !

77 !

ludique” correspond au type d’émissions qui remplissent ces deux conditions : avoir pour but

provoquer le rire et posséder les caractéristiques structurelles aussi bien du mode

authentifiant que du mode fictif.

Par ailleurs, indépendamment des noms donnés à ses catégories, le fait que son intérêt se

concentre dans le but ou le propos des discours télévisuels, semble indiquer que, pour la

construction de sa typologie, Jost privilégie la fonction de l’énonciation par rapport à tout

autre type de phénomènes.

Comme le signale Schaeffer :

"Il faut se rendre à l'évidence que la grammaire de surface des propositions qui ont pour

prédicats des noms de genres est souvent trompeuse" (: 1989, p. 180).

Que Jost construise sa taxinomie à partir du statut logique de l’acte énonciatif ou à partir de

l’intention discursive, ce qui nous intéresse ici c’est le fait que la Théorie des Genres Télévisuels

de l’auteur français n’utilise pas le même critère que celui utilisé par Hamburger pour la

construction de ses typologies. Cela constitue donc un trait différenciateur important entre

les deux modèles.

Par ailleurs, l’utilisation de la notion de "mode d’énonciation", proposée par Jost, nous

intéresse dans la mesure où elle nous permet de réaliser la classification générique et

l’analyse du vidéo-clip, dans les mêmes termes utilisés par l’auteur français pour l’ensemble

de la communication télévisuelle. Nous pourrons ainsi, déterminer les forces et les faiblesses

de ce critère de classification.

Nous reviendrons sur ce sujet, de manière plus approfondie, dans le chapitre VII.

D.! CONCLUSIONS!ET!POINTS!DE!DEPART!

Comme nous l’avons vu, dans la définition des genres littéraires proposée par Hamburger, la

présence d’une catégorie de Je-Origine s’oppose et nie l’autre. Aucun genre n’est constitué

à partir d’une cohabitation ou coopération entre des Je-Origine de diffèrent statut logique.

La frontière qui sépare les catégories est imperméable. La catégorisation repose, donc, sur

une action de sélection dans l’univers des Je-Origine, c’est-à-dire qu’elle peut être conçue

comme une corrélation paradigmatique. La théorie de Hamburger se focalise, non pas tant

sur le processus énonciatif, que sur le système énonciatif.

Le cas de la théorie de Jost est très différent. L’existence d’une catégorie de Je-Origine peut

intégrer l’autre, puisqu’un mode d’énonciation se définit par sa position en rapport aux deux

autres, c’est-à-dire par sa variation et non pas par son opposition. Les genres, dans ce

modèle, se constituent à partir de la relation des Je-Origine, réels ou fictifs. La catégorisation

est basée sur une opération de combinaison des Je-Origine, ce qui reviendrait à dire qu’elle

n i ! f i c t i on ! n i ! r é a l i t é !

78!

établit une relation de type syntagmatique. La théorie de Jost se focalise, plutôt que sur le

système énonciatif, sur le processus énonciatif.

Situées à des niveaux théorico-méthodologiques différents, chacune des théories exposées

ici définit un champ de phénomènes à partir duquel elle peut construire sa typologie

générique propre. Pour Hamburger, c’est le statut ontologique des Je-Origine, pour Jost, les

modes d’énonciation.

Il ne nous semble pas important d’établir, a priori, la validité d’un critère de catégorisation

générique par rapport à l’autre, étant donné que, s’appuyant chacun sur des fondements

logiques et méthodologiques propres, ils sont tous deux parfaitement légitimes.

Par contre, en raison de notre intérêt pour l’analyse de l’énonciation dans un type d’émission

télévisuelle particulière, il nous semble nécessaire et enrichissant de mettre en jeu la capacité

de chaque modèle pour nous expliquer, de manière satisfaisante et cohérente, l’énonciation

télévisuelle dans le vidéo-clip.

Ceci constitue la matière que nous travaillerons tout au long des chapitres suivants.

s e c t i on ! 2 . ! c a d r e ! t h éo r i c o ?mé thodo l o g i que ! ! o u t i l s ! d ' a n a l y s e !

79 !

IV.! OUTILS!D'ANALYSE

L’objectif général de ce travail est de définir le vidéo-clip en tant que genre télévisuel.

Dans ce but, nous allons déterminer, en premier lieu, le mode d’énonciation de cette pratique médiatique. Ceci signifie que nous allons situer notre analyse dans la logique généalogique proposée par François Jost.

Dès lors, en termes méthodologiques, notre problème sera la détermination des outils d’analyse qui nous permettront de reconnaître les indices qui permettent d’inférer, au niveau de la compréhension spectatorielle, le caractère authentifiant, fictionnel et/ou ludique du mode d’énonciation qui caractérise le vidéo-clip en particulier et un document télévisuel en général.

Ceci constitue le but principal de ce chapitre.

Pour atteindre le but fixé, nous travaillerons en deux sens : d’une part, nous fixerons les termes, notions et concepts qui seront le fondement et la base de notre analyse et, d’autre part, nous établirons les niveaux d’analyse qui conviennent pour atteindre notre objectif de déterminer le mode d’énonciation du vidéo-clip à travers la construction d’une grille d'observation.

D’après Jost, dans la mesure où chaque type d’émission télévisée constitue une promesse de

rapport à un monde donné, c’est à celles-ci que correspond un mode d'énonciation

spécifique, qui peut être situé dans le triangle constitué par les modes authentifiant, fictionnel

et ludique (Tableau n° 2).

Ainsi, tandis que des programmes tels que le journal télévisé, le téléfilm ou le jeu télévisé

correspondent respectivement aux modes authentifiant, fictionnel et ludique, le reality show,

du fait qu’il mélange les modes énonciatifs en juxtaposant les dimensions réelle, fictionnelle

et ludique, peut être situé au centre équidistant des trois angles modaux (voir tableau 2).

Occupant différents lieux de ce schéma, nous pouvons trouver le talk show, le reportage, la

comédie, etc. Chaque programme occupera une place, tenant compte du fait qu’elle peut

être différente pour chaque type de spectateur. C’est-à-dire que chaque émission peut être

placée sous un mode d’énonciation particulier.

n i ! f i c t i on ! n i ! r é a l i t é !

80!

Utilisez Word 6.0c (ou ultŽrieur)

pour afficher une image Macintosh.

T A B L E A U N ° 2 1

Dans ce cas, notre tâche se limiterait à déterminer la place du vidéo-clip dans ce triangle

composé par les trois modes d’énonciation. C’est-à-dire, il s’agirait simplement d’établir le

mode d'énonciation caractéristique du vidéo-clip. Mais, comme nous le verrons dans les

pages qui vont suivre, la problématique posée par notre objet d’étude, par rapport aux

catégories génériques proposées par Jost, réside dans le fait que, dans le vidéo-clip,

contrairement à la plupart des émissions télévisées, le mode d’énonciation est une variable

et non une caractéristique distinctive déterminante.

Comme nous le verrons plus loin, la difficulté de classement du vidéo-clip en tant que genre,

dans la typologie proposée par Jost, ne réside pas dans le fait que l’énonciation puisse

juxtaposer différents modes d’énonciation (comme c’est le cas du mode d’énonciation de

second degré) mais dans le fait que celle-ci ne correspond pas, dans le cas du vidéo-clip, à

un modèle unique.

Ludique, authentifiant et fictionnel, séparément, combinés ou juxtaposés ; au premier degré

ou au deuxième degré. Le vidéo-clip semble posséder une énorme variabilité dans

l’utilisation des modes d’énonciation étant donné que, comme nous tenterons de le

démontrer, l’énonciation dans ce type de documents télévisuels peut changer entre celle

caractéristique d’un direct préparé (mode authentifiant), celle propre à l’opéra (mode

fictionnel) et celle du dancing ou des émissions festives dont le but est de danser et de

s’amuser (mode ludique).

1 Source : Jost, F, 2001, p. 22.

s e c t i on ! 2 . ! c a d r e ! t h éo r i c o ?mé thodo l o g i que ! ! o u t i l s ! d ' a n a l y s e !

81 !

A. ! LES!FONDEMENTS!DE!L'ANALYSE!ET!DEFINITION!OPERATOIRE!DES!TERMES.!

Pour Jost, la compréhension spectatorielle a comme base la présomption d’intentionnalité de l’acte communicationnel que comporte l’émission d’un programme. C’est-à-dire que, pour être interprétée, l’énonciation d’une émission télévisuelle doit être attribuée à une figure humaine ou anthropoïde avec intention de communication.

Ce processus d’attribution énonciative est défini comme l’action de reconnaissance du type de vérité soutenue par le sujet énonciateur qui est à l’origine de l’émission.

Le type de vérité correspond à la modalité spécifique qu’acquiert l’énonciation énoncée selon les systèmes de vérité des discours de réalité ou de fiction.

Comme nous allons le voir ci-après, le mode d’énonciation d’un document audiovisuel peut être déterminé aussi bien par la sémantisation de l’acte d’énonciation que fait la chaîne télévisée que par l’opération de diégétisation que permet ou induit le document lui-même à travers la relation entre les médiations verbale, visuelle et sonore.

Néanmoins, comme notre travail a pour but d’établir la place du vidéo-clip dans la typologie des genres télévisuels, nous centrerons notre analyse dans les caractéristiques énonciatives qui se dégagent de ce type de documents télévisuels, en tant que pratique signifiante, et non dans les particularités énonciatives de son émission par l’une ou l’autre chaîne. Dans ce sens, l’opération de sémantisation de l’acte d’énonciation que font les différentes chaînes télévisées par rapport à chaque programme en particulier, ne constituera pas un niveau de sémantisation pour l’ensemble des programmes équivalents mais une variable qui dépend des buts particuliers de la chaîne.

La sémantisation de l’acte d’énonciation est une action de construction de sens réalisée par une chaîne par rapport à un programme en particulier. Cette sémantisation dépasse, donc, les limites de notre analyse. Elle correspond à l’étude d’objets spécifiques, tels qu’un programme en particulier ou un type de programmes à l’intérieur d’une chaîne déterminée, ou à l’analyse des procédés de construction de l’énonciation télévisuelle en général2 et non pas à la classification générique d’un type d’émission en particulier, dans la communication télévisuelle.

Pourtant, dans le but de fixer les limites de notre travail, il nous semble important d’indiquer, du moins dans les grandes lignes, ce que nous entendons par “sémantisation de l’acte énonciatif” dans la construction de l’interprétation spectatorielle.

Par contre, l’opération de diégétisation, du moins dans ce qui concerne les opérations de sémantisation que l’on peut réaliser à partir de l’objet lui-même, sera le point de départ aussi bien pour la définition des concepts que pour la construction de notre grille d’observation.

2 Pour approfondir l’analyse de la sémantisation de l’acte d’énonciation et de l’énonciation télévisuelle, nous

renvoyons le lecteur aux auteurs et ouvrages suivants : Lochard, G, et Boyer, H, Notre écran quotidien, Paris, Dunod, 1995 ; Lochard, G, et Soulages, J-C, La communication télévisuelle, Paris, Armand Colin, 1998 ; Bourdon, J, et Jost F (sous la direction de), Penser la télévision, Paris, INA / Nathan, 1998 ; Soulages, J-C, Les mises en scène visuelles de l'information, Paris, INA / Nathan, 1999 ; Beylot, P, Quand la télévision parle d'elle-même, Paris, INA / L'Harmattan, 2000 ; Jost, F, La télévision du quotidien, Paris, INA / De Boeck Université, 2001.

n i ! f i c t i on ! n i ! r é a l i t é !

82!

Voyons en quoi consistent chacune de ces deux catégories de sémantisation de l’acte d’énonciation et de l’opération de diégétisation :

1.! LA!SEMANTISATION!DE!L’ACTE!D’ENONCIATION!OU!META=ENONCIATION! !

Les processus inférentiels que l’on peut associer à l’interprétation d’un message télévisuel ne

se limitent pas au domaine de la relation entre le document et son lecteur. Aucune émission

télévisuelle ne nous est présentée de manière isolée ou indépendante de l’ensemble

d’informations constitué par la communication télévisuelle en particulier et par la

communication humaine en générale.

De la situation d’une émission dans la grille de programmation, jusqu’à la catégorisation que

la chaîne en fait par le biais de la publicité, toutes les informations constituent des éléments

importants pour l’orientation que peut prendre la compréhension spectatorielle.

a. ! La!gril le !de!programmation!

Toute émission de télévision établit une relation transtextuelle3 avec l’ensemble des émissions

d’une chaîne à travers la grille de programmation. C’est-à-dire que l’émission, en tant

qu’objet communicationnel contextuel, a aussi une fonction discursive dans la stratégie

communicationnelle de la chaîne.

"Comprendre le fonctionnement télévisuel, c'est donc en premier lieu prendre la mesure de

la double fonction stratégique de l'activité de programmation. Méthode d'exposition de

matériaux symboliques, les messages télévisuels, elle est comme l'activité publicitaire un

lieu de construction d'un discours global associant différents composants." (Lochard, G, et

Boyer, H, 1995, p. 95).

Ainsi, l’activité de programmation, n’est pas seulement une activité d’administration du

temps et de l’espace télévisés, elle est surtout une activité discursive. Dans un sens plus

global, la programmation d’une chaîne télévisée est étroitement liée à une intentionnalité

communicationnelle.

En tant qu’activité discursive, cette activité de sélection et combinaison de programmes ne

dépend pas exclusivement de la libre volonté de la chaîne mais elle est plutôt le résultat

d’une “solution de compromis” entre l’existence d’un budget limité, le besoin d’optimaliser

les audiences pour exposer les produits objets de publicité et les obligations légales que la

chaîne doit respecter. Mais elle est fondamentale dans la construction de la relation avec le

téléspectateur.

3 La transtextualité ou “ transcendance textuelle du texte ” est “ tout ce qui le met en relation, manifeste ou

secrète, avec d'autres textes ”. Genette, G, 1982, p. 7.

s e c t i on ! 2 . ! c a d r e ! t h éo r i c o ?mé thodo l o g i que ! ! o u t i l s ! d ' a n a l y s e !

83 !

La programmation prend un sens discursif à partir du moment où elle a un rôle dans la

construction de l’image de marque de la chaîne et de sa “personnalité”, c’est-à-dire, dans

la mesure où elle permet une relation entre la chaîne et le téléspectateur, au-delà d’un

programme en particulier.

"Loin d'être un agrégat de produits autonomes, [la grille de programmation] (...) constitue un

ensemble articulé dans lequel chacune des émissions ne prend sa pleine valeur qu'à travers

les relations établies avec les autres composantes." (Op. cit. p. 97.).

Dans ce sens, la sélection d’une émission dans l’univers des possibles, permet à la chaîne

d’utiliser les contenus d’un programme avec un double objectif d’étendre et de fidéliser

l’audience pour construire un niveau discursif au-delà de l’émission.

Pourtant, la seule présence d’un programme dans la grille n’explique pas toute la dimension

discursive qu’il y peut prendre. La place exacte constituera un indice important du caractère

discursif de la chaîne. L’horaire et sa position relative par rapport aux autres programmes, sa

combinaison interviendra dans l’interprétation par le téléspectateur d’une émission précise.

Par exemple, un programme émis un vendredi entre 20h00 et 23h00 par une chaîne

généraliste sera sémantisé la plupart du temps comme une émission “étoile” (lire “ très

importante”), uniquement par sa situation dans l’horaire de programmation. Si, au contraire,

l’émission se situe dans la grille horaire 15-18h, la méta-lecture suggérée sera celle de

l’“émission jeunesse” (c’est-à-dire programme d’intérêt uniquement pour un public en

particulier).

C’est-à-dire que si la chaîne se sert du programme en question à travers sa sélection

(inclusion dans la grille de programmation) pour construire son image et son discours, la

position spécifique et la combinaison du programme à l’intérieur de cette grille de

programmation, constitueront, à leur tour, une proposition de sens faite par la chaîne au

téléspectateur, en ce qui concerne le programme.

A chacun de ces deux niveaux de construction du discours par une chaîne, le programme

sera méta-énoncé.

b. ! La! !communication!de!l ’émission!

Obligée de vendre à l’avance sa programmation aux entreprises publicitaires, une chaîne

doit assurer le positionnement de chacun des programmes dans le cadre de l’offre globale

de la télévision. La chaîne doit promouvoir sa grille de programmation de la même manière

qu’elle annonce des produits de consommation ou des services, publicité qui sert à financer

la chaîne.

Dans cette activité, la chaîne méta-sémantise l’émission, c’est-à-dire qu’elle propose au

téléspectateur le sens que la chaîne attribue à chaque émission en particulier. En d’autres

n i ! f i c t i on ! n i ! r é a l i t é !

84!

mots, pour persuader le téléspectateur de voir un programme de la grille, la chaîne doit le

convaincre des avantages symboliques comparatifs qu’il obtiendra par rapport à l’offre de

la concurrence. Pour cela, elle émet une promesse de sens sur le sens de l’émission.

Cette communication de l’émission constitue un deuxième niveau méta-énonciatif4 à travers

lequel la chaîne agit sur le processus d’interprétation d’un programme en particulier que

réalise le téléspectateur. A la différence du niveau méta-énonciatif de la programmation, la

communication de l’émission est équivalente à un acte illocutoire assertif qui cherche des

effets perlocutoires concrets: agir sur la décision du téléspectateur dans ses choix et

préférences.

2.! DIEGESE!ET!DIEGETISATION!

En deçà de la sémantisation de l’acte énonciatif opéré par la chaîne, tout document télévisuel – en tant qu’objet communicationnel d’origine et de destination humaine - apporte, que se soit de manière explicite ou implicite, les clés pour son interprétation.

Ces clés peuvent être trouvées dans ce que la narratologie appelle la diégèse.

La diégèse peut être conçue, du point de vue de l’interprétation spectatorielle, comme un système de construction de pertinence dont la réalisation est possible à partir des éléments suivants : l’adhésion à un topic interprétatif ; la mise en discours ; les formes concrètes des médiations verbale, visuelle et sonore (ou mode d'effectuation de l’acte de médiation).

A ses débuts (Platon : Théorie des modes de représentation), le terme “diégèse”, avec celui

de “mimésis”, désignait une des modalités de la “lexis”. C’est-à-dire que c’était une des

manières à travers lesquelles il était possible de présenter la fiction. En d’autres termes, une

modalité ou une technique de narration qui, de manière concrète, prenait la forme d’un

récit sans dialogue, sans représentation dramatique.

Actuellement, la notion de “diégèse” désigne, dans son utilisation courante, le monde dans

lequel se situent les événements d’une histoire.

Pourtant, depuis son introduction par Étienne Souriau5 dans l’analyse narratologique du film,

cette notion a subi d’importantes variantes.

Pour Souriau, le terme “diégèse” désigne :

4 "Le terme 'méta' a plusieurs sens : transgression dépassement, outrance, etc. La méta-physique n'impliquait

pas au début une négation de la physique ou un démenti ; elle ne prit ce sens qu'après un développement déjà long et accidenté de la philosophie. Le méta-langage ne signifie pas l'abolition du langage ; ce mot veut dire 'discours sur le discours', décodage ou second degré du discours". (Lefebvre, H, 1980, p. 89). Dans ce même sens, le terme de "niveau méta-énonciatif' se réfère à l’énonciation de second degré, dans ce cas, à l’énonciation de la chaîne par rapport au mode d’énonciation du programme.

5 "La Structure de l'Univers Filmique et le Vocabulaire de la Filmologie", Revue Internationale de filmologie, 7 - 8, pp. 231 - 240, 1948.

s e c t i on ! 2 . ! c a d r e ! t h éo r i c o ?mé thodo l o g i que ! ! o u t i l s ! d ' a n a l y s e !

85 !

"tout ce qui est censé se passer selon la fiction que présente le film; tout ce que cette fiction

impliquerait si on la supposait vraie". (Souriau, E, 1951, p. 240).

Dans cette définition, encore proche de l’originelle grecque, la notion de diégèse serait,

d’une part, propre et exclusive à la fiction et, d’autre part, elle dépendrait de l’opposition

entre vérité et fiction.

Plus tard, Genette, inversant la tendance historique, introduit cette notion propre à l’analyse

du film, à la narratologie littéraire. Ainsi, Genette, non seulement met en évidence le niveau

de similitude entre les phénomènes narratifs de la littérature et ceux du cinéma mais élargit,

en outre, le sens que lui avait donné jusque là Souriau :

"La diégèse est l'univers spatio-temporel désigné par le récit; donc, dans notre terminologie,

en ce sens général, diégétique = 'qui se rapporte ou appartient à l'histoire'" (Genette, G,

1972, p. 280)

Dans cette définition, la diégèse n’est pas restreinte à la construction d’un monde fictionnel

mais elle est aussi relative au fait plus général d’une mise en récit. Ainsi, bien qu’elle ne se

limite pas à désigner uniquement des univers fictionnels, elle suppose la mise en récit des

univers.

Pourtant, dans la mesure où les univers créés par le récit agissent à leur tour sur le récit lui-

même, c’est-à-dire, étant donné que ces univers sont une référence par laquelle le récit et

l’intrigue elle-même prennent un sens, la conception de “diégèse” ne peut pas se limiter à la

mise en récit.

"Toute histoire particulière crée son propre univers diégetique, mais à l'inverse, l'univers

diégétique (délimité et créé par les histoires antérieures - comme c'est le cas dans un genre)

aide à la constitution et à la compréhension de l'histoire. (...) nous serions pour notre part

tentés d'entendre également par diégèse l'histoire prise dans la dynamique de la lecture du

récit, c'est-à-dire telle qu'elle s'élabore dans l'esprit du spectateur dans la foulée du

déroulement filmique". (Aumont, J, et al, 1983, p. 81).

Cette conception de la diégèse introduit un élément qui nous semble fondamental pour

l'analyse que nous tentons d'élaborer dans ce travail, car elle situe la définition au niveau du

spectateur (téléspectateur) plutôt qu'au niveau du texte. Dans ce sens, la diégèse ne serait

pas le simple résultat d'un texte mais, essentiellement, un outil d'interprétation au niveau du

spectateur : un topic interprétatif. Dans ce même sens, Dominique Château précise :

"La diégèse, en tant que composante interprétative spécifique exigée par la compréhension

de chaque proposition narrative d'un récit et en même temps aussi comme composante

interprétative globale pour le récit considéré dans son entier, est une condition de la lecture

que la lecture construit". (Château, D, 1983, p. 127)

n i ! f i c t i on ! n i ! r é a l i t é !

86!

Pourtant, dans la mesure où la diégèse est un instrument d’interprétation au niveau

spectatoriel plutôt qu’une qualité inhérente au texte, les univers diégétiques ne dépendent

pas nécessairement de leur mise en récit. Dans ce sens, l’acte de construction de la diégèse,

ce que Roger Odin appelle l’”opération de diégétisation”6, peut se constituer parfaitement à

partir de la construction de pertinence des informations mises en œuvre par des genres

discursifs différents de la narration, comme la description ou la monstration (“présentation”),

dont le but ou la conséquence ne sont pas une transformation du réel, et dans lesquels nous

pouvons reconnaître les éléments d’univers diégétiques aussi précis, voire plus précis, que

ceux soutenus par la mise en récit.

Genette souligne cette dissociation entre “diégèse” et récit et revient de manière critique

sur sa première définition de “diégèse” :

"L'emploi du mot diégèse, partiellement proposé comme équivalent d'histoire, n'était pas

exempt d'une confusion que j'ai tenté de corriger depuis. La diégèse, (...) est bien un univers

plutôt qu'un enchaînement d'actions (histoire) : la diégèse, n'est donc pas l'histoire mais

l'univers où elle advient.". (Genette, G, 1983, p. 13).

Ainsi, l’univers de référence de l’histoire nous est présenté, dans la plupart des cas, comme

un ensemble d’informations fragmentées à partir desquelles nous devons construire une

référence contextuelle cohérente. Dans ce sens, l’"opération de diégétisation” serait avant

tout la construction de pertinence de l’univers représenté, à partir des informations plus ou

moins ostensives que l'on peut déduire de la mise en œuvre d’un topic interprétatif et du

genre discursif.

"(...) la question de la diégétisation dépasse de beaucoup le domaine du cinéma : je

diégétise chaque fois que je construis mentalement un monde et ceci quelle que soit la

nature de la stimulation de départ : un roman, un reportage dans mon journal quotidien, un

texte historique, un morceau de musique qui m'évoque tel ou tel espace-temps, etc." (Odin,

R, 2000, p. 18).

La construction d’un monde possible dépendra, donc, autant du caractère et des

indications du document que des capacités du spectateur pour déduire les informations qui

ne sont pas représentées de manière explicite, pour extrapoler les actions des actants et

remplir ainsi les espaces laissés par les ellipses. C’est-à-dire que l’expérience sociale et

individuelle d’un sujet et ses capacités cognitives et mémorielles, avec le caractère de "la

stimulation de départ", seront déterminants dans l’opération de diégétisation réalisée par le

téléspectateur.

En définitive, cette "stimulation" - dans notre cas, le document télévisuel concret qui sert de

point de départ à l'opération de diégétisation - prend forme dans une configuration

6 De la Fiction, Paris, De Boeck Université, 2000, Chapitre Premier, Première Partie.

s e c t i on ! 2 . ! c a d r e ! t h éo r i c o ?mé thodo l o g i que ! ! o u t i l s ! d ' a n a l y s e !

87 !

spécifique des médiations verbale, visuelle et sonore. Cette configuration n'est autre chose

que le mode d'effectuation matérielle de l'acte d'énonciation7.

Ainsi, si la "diégèse" représente un monde possible avec ses événements propres, ses

personnages et ses lois, l’"opération de diégétisation" peut être conçue comme un système

de construction de pertinence, au niveau des spectateurs, des documents audiovisuels

et/ou télévisuels, à travers l'adhésion à un topic interprétatif et la mise en oeuvre d'un genre

de discours et du mode d'effectuation matérielle de l'acte d'énonciation.

Voyons de plus près chacun de ces trois éléments de l'opération de diégétisation.

a. ! "Topic" ! interprétatif !

Nous avons choisi d'utiliser le terme anglais "topic" (= "Subject of any discourse; matter treated

of")8, plutôt que celui français de "topique" (= "Groupe de mots, syntagme, expression, repris

souvent d'un locuteur à l'autre et qui donne de ce fait l'impression d'une grande banalité")9,

en raison de la connotation de "cliché" qui est associée au terme dans sa version française

et qui ne correspond pas au sens que nous voulons lui donner ici.

Le terme "topic" pourrait donc être défini tel que le proposent Ducrot et Schaeffer :

"Le Thème d'un énoncé, c'est ce dont parle le locuteur". (Ducrot, O et Schaeffer, J-M, 1995,

p. 541.

Ici, le concept "topic" serait équivalent à la conception logico-linguistique de "thème" ou

plus précisément à celle d'"interprétation thématique" :

"Lorsqu'on s'attache à relever les relations de ressemblance (et donc aussi d'opposition)

entre des unités souvent très distantes, la perspective est paradigmatique, et on obtient,

comme résultat de l'analyse, des thèmes. (...) La thématique littéraire est traditionnellement

une pratique interprétative". (Op. cit., p. 639).

Mais la définition de "topic" ne désigne pas uniquement le "thème", car ce terme anglais

peut s'approcher aussi de la notion linguistique de "topos" o "topoï" dans la mesure où :

"Les topoï répondent à deux caractéristiques empiriques : ce sont tout d'abord des

'principes généraux qui servent d'appui au raisonnement', comme tels 'ils ne sont jamais

assertés' mais 'utilisés'. D'autre part, 'ils peuvent être créés de toute pièce', sans compter

que la plupart du temps ils sont 'présentés comme allant de soi'." (Sarfati, G-E, 1997, p. 32).

7 Selon Jost, l'interprétation d'un programme dépend, à la fois, du mode d'énonciation qu'on lui attribue et des

moyens audiovisuels mis en œuvre qui "se partage essentiellement entre médiation verbale et médiation visuelle", ce qu'il appelle 'le mode d'effectuation de l'acte d'énonciation'. (: 1998-a, p. 35).

8 Patterson, R. F., The Greenwich English Dictionary, London, Greenwich Editions, 1990, p. 626. 9 Mounin, G, Dictionnaire de la linguistique, Paris, Presses Universitaires de France, 1974, p. 326.

n i ! f i c t i on ! n i ! r é a l i t é !

88!

Mais si la diégèse peut être conçue comme un système de construction de pertinence, c'est

en raison du fait qu'elle s'appuie sur le même type de processus cognitif que nous

développons quotidiennement pour résoudre différentes tâches et pour interpréter la réalité

en général. La conception, donc, de "topic" que nous utilisons dans ce travail peut être

également assimilée à la catégorie de schémas mentaux10 appelée "Thematic Organisation

Packet" (TOP) proposée par Schank (: 1982 - 1989).

"The idea behind TOPs is simple. There is a great deal of planning information that is related

to the interactions between plans and goals. This information cannot be tied to any individual

goal or plan but is instead tied to problems that rise out of their combination. Each TOP

corresponds to a planning problem due to the causal interaction between the steps and the

states of a plan. When a problem arises, a causal analysis of it identifies the TOP and the

hence locates the repair strategies needed to fix the problem". (Schank, R, 1989, p. 190)

Un TOP correspond donc à une structure schématique de traitement de données, au niveau

cognitif, qui permet de regrouper les événements en fonction de leurs objectifs et de leurs

projets. En d'autres termes, un TOP permet d'organiser dans la mémoire les événements

thématiquement similaires en spécifiant les catégories des acteurs, de la (ou les) situation(s)

spécifique(s), des buts généraux et des projets avec les stratégies propres, qui correspondent

aux actions dans lesquelles ils s'insèrent. Dans ce sens, et aux effets de l'analyse que nous

allons développer ici, "topic" et TOP peuvent être considérés comme notions équivalentes.

En accord avec ceci, "topique" pourrait être le référent transtextuel11 qui permet au

téléspectateur de lier l'ensemble des éléments présents dans le discours et les éléments

absents qui lui sont logiquement apparentés, en fonction de mondes possibles préfigurés qui

donnent cohérence et pertinence interprétative au monde représenté dans un document

particulier.

Le "topic" en tant que composant de la diégèse est l'élément qui nous permet de la

concevoir comme un système de construction de pertinence, étant donné qu'il rend possible

l'unité logique des événements et celle des actants à l'intérieur d'un monde représenté.

"La diégèse correspond précisément à un topic interprétatif qui permet au spectateur de

construire un monde à partir des différentes informations visuelles et sonores que lui offre le

film. (...) La diégèse s'avère en ce sens un outil de compréhension qui structure le matériel

présenté et permet d'induire des lieux, des personnages, des actions, etc., absents du texte

ou du film, sur la base d'inférences spectatorielles qui viennent saturer les ellipses du texte".

(Chateauvert, J, 1996, p. 66-67).

10 "Les schémas sont des structures de données destinées à représenter les concepts génériques stockés en

mémoire. (…) Les schémas, en quelque sorte, représentent les stéréotypes de ces concepts, (…) ils sont comme des modèles du monde extérieur". (Rumelhart, D. et Norman, D., "Les Shémas" (1983), in Le Ny, J-F. et Gineste, M-D. (sous la direction de), La Psychologie, Larousse, 1995, p. 310).

s e c t i on ! 2 . ! c a d r e ! t h éo r i c o ?mé thodo l o g i que ! ! o u t i l s ! d ' a n a l y s e !

89 !

Le topic définit le type de monde auquel peut nous renvoyer le document télévisuel, monde

qui donnera cohérence et continuité logique aux événements, aux sujets et aux objets avec

lesquels il est en rapport.

b. ! Le!genre!du!discours!

Depuis ses origines, la sémiologie du film et de l'audiovisuel12 a construit une forte

équivalence entre film, fiction et narration. Cette relation, basée au départ sur un choix

méthodologique13, est devenue rapidement un lieu commun et presque une caractéristique

ontologique de tout film et, par extension, de tout audiovisuel. La prédominance de cette

vision dans l'analyse filmico-audiovisuelle est éloquente dans le paragraphe suivant :

"Toutefois même si un tel film était possible [un film non-narratif], le spectateur, habitué à

la présence de la fiction, aurait encore tendance à la réinjecter là où il n'y en a pas :

n'importe quelle ligne, n'importe quelle couleur peut servir d'embrayeur de fiction". (Aumont,

J, et al, 1983, p. 66).

Comme nous l'avons vu auparavant (chapitre II), ce modèle basé sur les caractéristiques

propres d'un média en particulier (le cinéma narratif, représentatif, industriel) a servi de base

à la plupart des recherches sur l'audiovisuel (y compris la T.V.), qui se sont développées à

partir des années '60 et jusqu'aux années '80.

Ainsi, la question de l'énonciation filmico-audiovisuelle est restée soumise ou réduite, pendant

longtemps, non seulement à la fiction mais aussi, au genre discursif de la narration. Traduit en

termes disciplinaires, le programme sémiologique original dessiné par Metz "Comment

l'image signifie?" (: 1975), a été remplacé par l'hégémonie du programme narratologique de

ses "disciples "Comment l'image raconte?" (Jost, F, 1983).

Pourtant, l'incorporation à l'analyse de nouvelles formes de construction énonciative au

cinéma ("le cinéma de la modernité")14, et surtout le besoin de réponse sémiologique au

phénomène complexe et important de la télévision ("la néo-télévision")15, permettra de

prouver que la narration est loin d'être le seul genre discursif pour la construction énonciative

d'un document audiovisuel, qu'elle n'est en fait qu'un genre discursif parmi d'autres. On a

11 "(...) le texte (ne) m'intéresse (que) par sa transcendance textuelle, savoir tout ce qui le met en relation,

manifeste ou secrète, avec d'autres textes. J'appelle cela la transtextualité". Genette, G, 1986, p. 157. 12 La plupart des théoriciens du cinéma et de la télévision désignent Christian Metz comme l’"initiateur" de la

sémiologie filmique et audiovisuelle. 13 "Il y a une hiérarchie des importances (ou, mieux, des urgences méthodologiques) qui conduit à privilégier -

tout au moins au début - l'étude du film narratif". (Metz, Ch, 1975, p. 96) 14 Voir : Chateau, D., Gardies, A., Jost, F., (sous la direction de), Cinémas de la Modernité : Films, Théories,

Paris, Klincksieck, 1981. 15 Voir : Eco, U., "T.V. : la transparence perdue", in La Guerre du Faux, Paris, Grasset, 1985. Et, Casetti, F., et

Odin, R., "De la néo - à la paléo - télévision" in Communications N° 81, 1990.

n i ! f i c t i on ! n i ! r é a l i t é !

90!

ainsi pu identifier comme genres discursifs, du même niveau d'importance que la narration,

la "monstration", la "démonstration", la "description" et l'"argumentation, entre autres16.

Le genre du discours nous renvoie à l’intentionnalité discursive (raconter, montrer, décrire,

parler, expliquer, etc.) et, donc, à la relation entre le sujet d’énonciation et l’objet énoncé.

Dans notre travail, nous retiendrons essentiellement trois genres discursifs : narration,

monstration et description17.

i . ! Le !discours !narrati f !

Pour fixer les caractéristiques d'un discours narratif, il faut avant tout définir la distinction,

l'unité et la hiérarchie qui existe entre les notions d'histoire et de narration articulées autour de

celle de récit.

Comme Genette l'a établi, le terme récit peut désigner trois notions différentes :

1. "l'énoncé narratif, le discours oral ou écrit qui assume la relation d'un événement ou d'une

série d'événements";

2. "la succession d'événements, réels ou fictif, qui font l'objet du ce discours, et de leurs

diverses relations d'enchaînement, d'opposition, de répétition, etc.";

3. "un événement (...), l'acte de narrer pris en lui-même". (Genette, G, 1974, p. 71).

A partir de ce constat, Genette définit et établit la relation, en termes théoriques, entre

histoire, récit et narration.

Histoire : "le signifié ou contenu narratif (même si ce contenu se trouve être, en

l'occurrence, d'une faible intensité dramatique ou teneur événementielle)".

Récit : "le signifiant, énoncé, discours ou texte narratif lui-même".

Narration : "l'acte narratif producteur et, par extension, l'ensemble de la situation réelle ou

fictive dans la quelle il prend place". (Genette, G, 1974, p. 72).

Si la narration est "l'acte narratif producteur" et la situation dans laquelle cet acte s'inscrit, un

discours narratif - le récit - ne peut être conçu, dans son sens strict, autrement que comme

16 Par rapport à ce sujet, l'ouvrage récent d'André Gardies ("Décrire à l'écran", Québec/Paris, Nota Bene

Éditeur/Méridiens Klincksieck, 1999), représente une tentative intéressante pour sortir de l'hégémonie du film narratif au sein de la théorie fílmico-audiovisuelle.

17 La raison de ce choix est d’ordre uniquement pratique, étant donné que dans l’échantillon qui a servi de base pour notre travail sur le clip il n’a pas été possible de reconnaître la présence d’autre type de discours. Cela ne veut pas dire que leur existence ne soit pas possible dans ce type de documents télévisuels. Mais au-delà de ce choix, qui limite l’univers aux trois types de discours signalés, ce qui nous intéresse au niveau théorique et par rapport à la reconnaissance d’un genre discursif, c’est le fait que chacun d’entre eux permette la construction, à la réception, des différentes intentions et instances énonciatives qui peuvent être configurées dans un document télévisuel.

s e c t i on ! 2 . ! c a d r e ! t h éo r i c o ?mé thodo l o g i que ! ! o u t i l s ! d ' a n a l y s e !

91 !

une suite d'énoncés qui renvoient soit à un sujet d'énonciation, soit à un narrateur fictif mais

dans les deux cas à une intention communicative de raconter.

D'après ceci, la "narration", bien qu'elle puisse être différenciée en tant que catégorie par

rapport au "récit" et à l'"histoire", en termes de phénomène discursif, elle ne peut pas être

considérée de manière isolée par rapport à ces deux termes. Mais ce discours narratif - le

récit - est la seule instance empirique qui permet l'analyse du texte narratif.

"Il est assez évident, je pense, que des trois niveaux distingués à l'instant, celui du discours

narratif est le seul qui s'offre directement à l'analyse textuelle, qui est elle-même le seul

instrument d'étude dont nous disposions dans le champ du récit". (Genette, G, 1974, p. 73).

Dès lors, ce qui doit concentrer notre attention sont les conditions de réalisation et

d'existence d'un récit. Christian Metz (: 1968, pp. 25-35) établit cinq critères pour la

reconnaissance d'un récit : il doit être clôturé (il doit avoir un commencement, un

développement et une fin); il se présente comme une double séquence temporelle

(temporalité de la chose racontée et temporalité de l'acte de narration lui-même; il est

attribuable à une instance énonciative (narrateur et/ou énonciateur); il est opposé à la

réalité (il ne se confond pas avec le monde réel car le récit n'est pas, lui, l'"ici et maintenant");

il est un ensemble d'événements.

Par ailleurs, d'après Marc Lits, J-M Adam propose six critères qui permettent de définir

l'émergence d'un récit18 :

"une succession d'événements, une unité thématique, des prédicats transformés (l'inversion

des contenus posée par la sémiotique greimasienne), un procès (c'est-à-dire une action qui

forme un tout, comprenant un début, un nœud et un dénouement, similaire à la mise en

intrigue de Ricœur), une causalité narrative qui excède l'enchaînement chronologique, une

évaluation finale configurante". (Lits, M, 1997, p. 40-41).

Ce que nous retiendrons du croisement de ces visions relativement complémentaires, c'est le

fait qu'un discours narratif soit caractérisé par la transformation du réel. C'est-à-dire que

l'acte de raconter, qui est le trait spécifiquement définitoire d'un récit, est la transformation

d'une situation initiale, le développement d'une série d'événements et la configuration d'une

situation finale.

i i . ! Le !discours !descripti f !

Un discours descriptif, au contraire, n'a pas pour but la transformation du réel, comme c'est le

cas du discours narratif, même s'il accomplit une fonction à l'intérieur d'un récit.

18 Le texte d'Adam cité par Lits est le suivant : Les textes : types et prototypes. Récit, description,

argumentation, explication et dialogue, Paris, Nathan Université, coll. Fac. Linguistique, p. 8.

n i ! f i c t i on ! n i ! r é a l i t é !

92!

Au-delà des apparences, le problème de la description en littérature, c'est-à-dire celui du

discours descriptif, est un territoire théorique insuffisamment défini, comme nous le montre

l'extrait suivant :

"On appelle aussi description, au niveau de l'organisation discursive, une séquence de

surface que l'on oppose à dialogue, récit, tableau, etc., en postulant implicitement que ses

qualités formelles autorisent à la soumettre à l'analyse qualificative. Dans ce sens,

description doit être considérée comme une dénomination provisoire d'un objet qui reste à

définir." (Greimas, A. J, et Courtés, J, 1993, p. 93)

En règle générale, la description a toujours été traitée comme une action rhétorique à

l'intérieur d'un récit et non pas comme une modalité discursive d'existence indépendante.

C'est pour cela que le trait le plus caractéristique, et le plus fréquemment signalé de la

description, est l'arrêt du temps du récit. Cela ne pouvait pas en être autrement en

narratologie littéraire, discipline qui a comme objet principal d'étude le récit fictionnel.

Dans ce cas-ci, la description a été conçue comme ayant pour but principal de rendre

visible l'objet décrit :

"La Description est une figure de pensée par développement, qui, au lieu d'indiquer

simplement l'objet, le rend en quelque sorte visible, par l'exposition vive et animée des

propriétés et des circonstances les plus intéressantes". (Hamon, Ph, 1981, p.9)

Mais, à la différence de ce qui se produit dans l'analyse littéraire, "rendre visible" dans le

domaine audiovisuel, loin d'être une métaphore, est un besoin inhérent au support

énonciatif. D'où que les caractéristiques iconiques de l'énoncé filmique (et audiovisuel), ont

rapidement conduit à l'intégration de la problématique de la description dans l'analyse

filmique. Parmi les huit types séquentiels que Metz distingue dans la "Grande Syntagmatique"

du film narratif industriel (:1968), le "syntagme chronologique descriptif" occupe le même

niveau que le "syntagme chronologique narratif".

Selon Metz (:1968), un syntagme est chronologique descriptif lorsque les éléments

apparaissent comme simultanés au niveau temporel et coexistent au niveau spatial. Dans ce

sens, il s'oppose au syntagme chronologique narratif étant donné que dans ce dernier (qu'il

soit alterné ou linéaire) la relation temporelle est de consécution.

"Au cinéma comme ailleurs, la description est une modalité du discours, et non point une

propriété substantielle de l'objet de ce discours; le même objet est descriptible ou

racontable, selon la logique propre de ce qu'on nous en dit". (Metz, Ch, 1968, p. 129).

Mais dans la mesure où l'objet de Metz est le cinéma narratif représentatif industriel (CNRI), le

syntagme descriptif, et avec lui le discours descriptif, ne se développe pas, du point de vue

théorique, de manière équivalente à la narration. Dans la Grande Syntagmatique, le

s e c t i on ! 2 . ! c a d r e ! t h éo r i c o ?mé thodo l o g i que ! ! o u t i l s ! d ' a n a l y s e !

93 !

discours descriptif, n'existe que comme élément constitutif du récit et ne possède donc pas

d'indépendance par rapport au discours narratif.

C'est André Gardies qui, dans un ouvrage récent consacré exclusivement à ce sujet, décrit

clairement la singularité et l'autonomie du discours descriptif au cinéma. Parmi les sept traits

d'un discours descriptif, tel que les définit Gardies,19, les trois qui se rapportent à l'image en

mouvement, nous semblent particulièrement éclairants par rapport aux caractéristiques du

discours descriptif :

- la désactivation du hors-champ :

"Un régime de visibilité tout à fait singulier en découle, propre au descriptif et qui privilégie le

plein cadre. Successivement entrent dans le champ les objets proposés (sinon imposés) à

mon regard. En ce sens décrire visuellement c'est donner à voir ce qui est jugé digne d'être

vu; On retrouve alors un double geste constitutif : celui de la fragmentation (on ne peut tout

montrer - ni a fortiori tout voir - en même temps), celui de la sélection (ce qui est digne d'être

vu). (...) on peut dire que le descriptif ignore le hors-champ et ne connaît que le champ. Pour

être plus précis, je dirai que le descriptif au cinéma désactive le hors-champ, le rend

inopérant". (Gardies, A, 1999, p. 61-62).

- le désancrage du regard :

"C'est le propre de la lecture "narrativisante" que de sélectionner parmi toutes les donnés de

l'image celles qui participent du principe de consécution. (...) le regard du spectateur, d'une

part, se fixe préférentiellement sur les composantes jugées nécessaires pour la suite, d'autre

part, s'attache à ne pas les perdre de vue et les suit de l'œil (à l'intérieur du plan et d'un plan

à l'autre) lorsqu'elles sont en mouvement. (...) En ce sens, la vectorisation20 aurait pour effet

d'induire un regard de type linéaire. (...) Qu'en est-il alors du regard induit par le moment

descriptif? Non soumis aux contraintes de la sélection conséquente, il coupe court à

l'induction vectorisante et s'ouvre au balayage de l'espace écranique. Au regard narratif de

type linéaire, répondrait donc un regard descriptif de type tabulaire. (...) le regard 'désancré'

peut tout à loisir parcourir l'ensemble du cadre". (Op. cit. p. 144-145)

- le modèle structurel du "il y a... et aussi" :

"Je propose donc, pour lever toute ambiguïté, de nommer 'disposition descriptive' le modèle

structurel (celui qui fonde le texte descriptif et en gère l'organisation) et 'descriptif' l'ensemble

des manifestations et formes de la descriptivité qui fonde le discours descriptif. (...) Or ce

dernier est de nature structurelle (qu'on se souvienne de sa définition minimale : 'il y a... et

aussi'). Il est donc de même niveau que le narratif défini comme structure du récit (avec sa

19 Les sept traits du discours descriptif selon Gardies sont : la structure arborescente, la suspension de la

temporalité, l'organisation parataxique, la sanction paradigmatique, la désactivation du hors-champ, le désancrage du regard, le modèle structurel du "il y a... et aussi".

20 "Vectorisation : n. f. : mouvement par lequel un récit progresse en maintenant sa continuité". Bessalel, J, et Gardies, A, 1992, p. 207.

n i ! f i c t i on ! n i ! r é a l i t é !

94!

triade fondamentale : 'situation initiale - transformation - situation finale')". (Op. cit. p. 160-

161).

Si nous tentons un croisement entre Hamon, Metz et Gardies, un des traits le plus

caractéristique du discours descriptif est la suspension temporelle : la pause descriptive. A la

différence de la narration, dans laquelle la mise en récit est une conséquence logique des

événements (linéaires ou alternés), dans la description, c'est leur simultanéité et leur

juxtaposition qui s'imposent. Aucun événement ne précède ni est postérieur aux autres. Ils

existent tous simultanément. Seul l'impossibilité de les présenter en même temps régule leur

alternance et non pas le fait que l'un ou l'autre parmi eux existe avant l'autre comme dans

une relation de suivi et de transformation. Dans la mesure où l'objet décrit est fragmenté dans

la description, aucun élément particulier ne transforme les autres par le fait de se situer avant

ou après.

Cette pause descriptive que suppose, donc, l'émergence d'un discours descriptif implique la

non-transformation du réel, puisqu'il n'existe que la temporalité de l'acte descriptif et non pas

la temporalité de la chose décrite.

L'ensemble des éléments de caractérisation du discours descriptif filmique présentés jusqu'ici

nous semble parfaitement applicable à l'analyse de l'énonciation de la télévision. Plus

encore, dans la mesure où la télévision est le lieu de rencontre des différentes formes

d'énonciation audiovisuelle et puisque les logiques communicationnelles proposées par les

différents documents qui s'y articulent ne passent pas, nécessairement, par la mise en récit, la

définition du discours descriptif comme entité énonciative indépendante et du même niveau

que le discours narratif, devient particulièrement intéressante. Surtout si l'analyse vise

particulièrement la détermination du sujet d'énonciation qui se trouve derrière l'énoncé

descriptif.

En tant que sujet d'énonciation du même niveau que le narrateur, le descripteur opère sur

l'objet énoncé de manière ostensive. Cette action permet, au niveau spectatoriel, la

construction de pertinence visuelle et audiovisuelle de ce qui nous est décrit, dans la mesure

où cela suppose une intention énonciative (descriptive) qui nous laisse déduire que ce qui

est présenté est une désignation précise de ce que nous devons voir et entendre, de

manière préférentielle par rapport aux autres éléments du profilmique21.

i i i . ! Le !discours !monstrati f !

Un discours monstratif, à la différence des deux précédents, ne cherche pas seulement la

transformation du réel mais rend aussi indéterminée son intention énonciative, en prétendant

que les événements prennent l'initiative communicationnelle.

21 Sur la définition de la notion de "profilmique" dans ce même chapitre (B. 1).

s e c t i on ! 2 . ! c a d r e ! t h éo r i c o ?mé thodo l o g i que ! ! o u t i l s ! d ' a n a l y s e !

95 !

La monstration, propre à l'énonciation audiovisuelle dans la mesure où montrer est une

caractéristique intrinsèque et une condition matérielle de l'acte de construction de l'énoncé,

est fortement associée, dans les modes fictionnel et authentifiant, aux discours narratifs et

descriptifs et peu souvent observables de manière indépendante. C'est pour cette raison

que, parmi les trois modalités discursives que nous retiendrons dans ce travail, la monstration

est sans doute la plus difficile à définir et à isoler par rapport aux autres.

C'est André Gaudreault qui introduit la notion de "monstration" dans l'analyse audiovisuelle.

Dans son modèle théorique du récit filmique (: 1989, 1990, 1993-b), la monstration désigne

une des activités principales du narrateur ou "grand imaginier" :

"Il y aurait, au départ, un monstrateur et à la fois, un narrateur filmiques. En ce sens, le film

montrerait et narrerait à la fois". (Gaudreault, A, 1993, p. 107).

Dans la fiction filmique, la monstration n'atteint pas la catégorie de discours, étant donné

que le discours narratif y est dominant. Selon les termes de Hamburger, dans la mesure où la

chose racontée n'est pas un objet pour la narration, et dans la mesure donc où elle n'existe

pas de manière indépendante du fait que c'est la narration qui la produit22, la monstration

sera toujours dépendante de la narration.

Ceci conduit André Gardies à classer la monstration de Gaudreault comme un "fait de

langage" plutôt que comme une modalité du discours filmique. C'est-à-dire que, pour lui, la

monstration serait un trait du langage et non pas une forme d'organisation langagière.

"Monstration et narration doivent être clairement dissociées car elles ne sont ni de même

nature, ni de même niveau. La première est un fait de langage, la seconde un fait de

discours". (Gardies, A, 1999, p. 36).

A la différence de la monstration comme fait de langage, la monstration comme discours

peut avoir une existence indépendante et représenter une forme d'organisation langagière.

Mais c'est seulement lorsque nous quittons le domaine de la fiction que nous pouvons trouver

des exemples de la dimension discursive de l'acte monstratif.

La monstration audiovisuelle constitue le degré zéro du discours (malgré sa précarité elle

constitue, donc, un discours), ce que Schaeffer appelle “ présentation ” (Schaeffer, J-M,

1987). C’est le niveau de base d’une opération de sélection, celle dans laquelle la

combinaison est presque inexistante ou aléatoire.

Nous pouvons trouver un exemple extrême de discours monstratif audiovisuel dans les images

obtenues par les caméras de surveillance. Leur objectif communicationnel consiste à

montrer au spectateur (surveillant) les agissements du public d’un établissement ou des

passants et des automobiles qui circulent dans une rue. L’emplacement et la possibilité de

22 Voir Hamburger, K, 1986, pp. 29 - 67.

n i ! f i c t i on ! n i ! r é a l i t é !

96!

couverture visuelle du champ sont des indicateurs d’une intention communicationnelle par

sélection, qui nous renvoie à la figure anthropoïde du propriétaire de l’établissement, de la

police (en tant qu’institution) ou du surveillant lui-même. Ici ce que l’on cherche c’est l’accès

aux actions de tiers pour leur contrôle ou par simple voyeurisme mais il n’y a pas la possibilité

d’une intervention communicationnelle dans la combinaison d’événements. En d’autres

mots, c’est le spectateur unique qui construit le sens communicationnel des actions et des

événements, puisque que ces derniers ont lieu avec une totale indépendance de

l’énonciateur.

Pourtant, ce niveau minimum d’action énonciative constitue un discours dans la mesure où il

correspond à un degré d’organisation langagière (la sélection du cadrage des lieux

prédéfinis comme étant ceux qu’il faut montrer, selon l’énonciateur, et aussi parce qu’il

permet l’attribution d’une intentionnalité communicative (étant donné que l’existence de la

caméra dans ce lieu précis n’est pas fortuite mais correspond à l’intention de montrer

quelque chose au spectateur), fait qui nous renvoie à l’existence d’un énonciateur.

De moins en moins fréquente à la télévision, la monstration est le discours propre à

l’enregistrement avec caméra fixe d’une action non fictionnelle. Nous pouvons encore le

voir, par exemple, dans quelques émissions transmises en directe, pour lesquelles

l’intervention des opérateurs audiovisuels (réalisateur, cameraman) est minime et ne

constitue pas une vectorisation ou la désignation précise de ce que nous devons voir et

entendre.

Autrement dit, la monstration est le mode discursif audiovisuel dans lequel on cherche à ce

que les événements “ se racontent eux-mêmes ”.

c. ! Le!mode!d'effectuation!matérielle !de!l 'acte!d'énonciation. !

Enfin, le caractère du monde créé par la diégèse sera exprimé dans une combinaison

particulière des médiations verbale, visuelle et sonore constitutives d'un document télévisuel

concret.

La dissociation que nous avons faite entre "topique" et "genre du discours", comme s'il

s'agissait de catégories qui peuvent fonctionner de manière indépendante, n'avait pas

d'autre but que celui d'expliquer les particularités de chacune d'elles dans les processus

d'interprétation spectatorielle d'un document télévisuel, étant donné que ces deux

catégories n'existent que comme réalités concrètes, absolument inséparables de la

matérialité de leur médiation.

En d'autres termes, dans la mesure où le document télévisuel concret est le support matériel

qui permet l'opération de diégétisation, celle-ci sera encadrée par la configuration

spécifique de la médiation télévisuelle dans ledit document et, dès lors, la relation entre les

s e c t i on ! 2 . ! c a d r e ! t h éo r i c o ?mé thodo l o g i que ! ! o u t i l s ! d ' a n a l y s e !

97 !

médiations verbale, visuelle et sonore sera aussi déterminante dans le processus

d'interprétation spectatorielle.

La forme concrète que prend la relation entre les trois types de médiation est très importante

dans la construction d’inférences relatives au mode d’énonciation dans lequel on peut

ranger un document télévisuel.

Par exemple, dans la fiction audiovisuelle narrative, représentative et industrielle, les

médiations verbales (les dialogues et/ou le récit du narrateur intradiégétique), visuelles (la

mise en scène, le tournage et le montage) et sonores (musique et bruits) sont, la plupart du

temps, coopératives dans la construction d’un énoncé unique. Par anaphorisation23 et par

co-référence, le discours verbal et le discours visuel constituent un seul récit.

Le fait que, dans la réalisation de la diégèse fictionnelle, la médiation de l’auteur soit

transparente, est une des conditions de lecture de ce type de documents.

A l’autre extrême, dans un document authentifiant tel qu’un journal télévisé, la distance

entre la médiation (le speaker ou le journaliste qui interpelle le téléspectateur avec l'adresse

à la caméra, en tant que sujet d’énonciation historique) et la médiation visuelle (le

réalisateur et/ou cameraman qui combine et sélectionne les images en tant que sujet

d’énonciation théorique24) établissent l’existence de deux instances énonciatives de niveau

différent, l’une verbale et l’autre visuelle.

La présence ostensive et différenciée des deux catégories de sujets d’énonciation est une

condition pour la lecture authentifiante d’un journal télévisé car elle opère comme une

réaffirmation du caractère réel de l’énonciation.

Tandis que la transparence de la médiation de l’énonciateur est une condition inhérente au

genre fictionnel, son opacité est ce qui légitime le caractère réel dans le genre authentifiant.

Ainsi, si le topic permet de déterminer le monde auquel peut renvoyer le document télévisuel

et le genre du discours nous renvoie, lui, à la modalité discursive de l’énonciateur, le mode

d’éffectuation de l’acte énonciatif nous permettra d’établir la pertinence authentifiante,

fictionnelle ou ludique du document télévisuel.

Dès lors, le mode d'effectuation matérielle de l'acte d'énonciation constitue le point de

départ empirique pour notre analyse du mode d’énonciation des documents télévisuels en

général et du vidéo-clip en particulier.

Les niveaux de matérialisation des médiations qui nous intéressent sont les quatre suivants :

23 L’anaphorisation est une procédure à travers laquelle s’établit une relation d’identité partielle entre deux

termes à l’intérieur du discours. Selon Greimas et Courtés, "l'anaphorisation est l'une des procédures principales qui permettent à l'énonciateur d'établir et de maintenir l'isotopie discursive (les relations interphrasistiques)". (Greimas, A-J. et Courtés, J., 1993, p. 15).

n i ! f i c t i on ! n i ! r é a l i t é !

98!

1. Selon Odin (: 2000), la construction de la diégèse a comme condition et point de départ

l’opération de “ figurativisation”, c’est-à-dire la construction d’une relation entre l’image-

son et un référent concret ou, en d’autres termes... :

“ qui a un correspondant au niveau de l’expression de la sémiotique naturelle (ou du monde

naturel) ” (Greimas, A. J, et Courtés, J, 1993, p.146).

C’est-à-dire que le monde construit dans la diégèse est composé de sujets ou de relations

et qualités (indépendamment du fait qu’elles correspondent ou non exactement à ceux

ou celles que nous pouvons trouver dans le nôtre) que l’appareil d’enregistrement

filmique, vidéographique ou phonographique peut enregistrer.

L’ensemble d’objets, sujets, relations ou qualités qu’il est possible d’enregistrer avec les

technologies audiovisuelles correspondent, de manière générale, au niveau

“ profilmique ”.

2. L’ensemble d’objets, sujets, relations ou qualités du monde diégétique construit qu’il est

possible d’enregistrer nous est présenté dans le discours audiovisuel à travers une

configuration spécifique des médiations visuelle et sonore.

Cette configuration n’est autre chose que la construction d’une relation graduelle

d’inégalité ou d’égalité perceptive entre le souteneur du discours et le téléspectateur, par

rapport au monde représenté.

3. De la même manière, la mise en œuvre d’un genre de discours pour représenter le

monde diégétique implique le positionnement du téléspectateur dans un régime

d’égalité ou inégalité cognitive par rapport au souteneur du discours et aux actants du

monde représenté.

4. Enfin, l’existence d’un énoncé implique nécessairement l’existence d’un énonciateur,

d’un responsable de l’énoncé – étant donné que tout énoncé est proféré par quelqu’un

et cela dans un but communicationnel. Le caractère du sujet d’énonciation responsable

de l’énoncé permettra au téléspectateur d’interpréter l’intention dans laquelle l’énoncé

est proféré.

Chacun de ces niveaux nous permet la construction d’hypothèses manifestes par rapport au

mode d’énonciation d’un document télévisuel. D’où l’importance que revêt dans notre

travail le mode d’éffectuation matérielle de l’acte d’énonciation dans la diégèse.

Dans le point suivant, nous allons définir avec plus de précision chacun de ces quatre

niveaux d’analyse, étant donné qu’ils constituent la base sur laquelle s’appuie notre grille

d’observation, laquelle va nous permettre de déterminer le mode d’énonciation du clip.

24 Voir Hamburger, K, 1986, pp. 48 à 51 ou le chapitre V de ce travail. Dans le chapitre suivant (VII) nous

aborderons en détail la constitution des énonciateurs historique et théorique dans le mode télévisuel authentifiant.

s e c t i on ! 2 . ! c a d r e ! t h éo r i c o ?mé thodo l o g i que ! ! o u t i l s ! d ' a n a l y s e !

99 !

B. ! NIVEAUX!DE!L'ANALYSE!ET!GRILLE!D'OBSERVATION!

Si l’opération de diégétisation d’un document télévisuel est celle de la construction d’un monde possible, nous nous intéresserons au caractère de ce monde construit, c’est-à-dire à sa pertinence authentifiante, fictionnelle ou ludique.

Une fois définis les concepts et fondements de l'analyse, il est nécessaire, maintenant, de déterminer les niveaux de l'analyse qui conviennent à notre objectif de classification générique du vidéo-clip. Notre pas suivant sera donc de construire une grille d'observation qui nous permettra de définir le mode d'énonciation du vidéo-clip, dans une perspective généalogique.

Le point de départ empirique de cette analyse est constitué par les indices du mode d'énonciation que l'on peut observer à partir du mode d'éffectuation matérielle de l'acte d'énonciation aux niveaux profilmique, perceptivo-discursif, cognitivo-discursif et de la responsabilité énonciative.

1.! Niveau!profilmique!: !l 'espace,!les!sujets!et!les!objets! ! !

Dans un sens strict, la notion "profilmique" représente tout ce qui a été intentionnellement

organisé et mis en scène pour être filmé. Dans ce sens, "profilmique" s'oppose à "afilmique",

notion qui cherche à indiquer la réalité qui existe indépendamment de sa filmation. Selon

cette conception stricte, l'opposition entre profilmique et afilmique permet de distinguer

deux catégories de films : les films de fiction et les documentaires25.

Pourtant, cette conception de "profilmique" créée dans le contexte de l'analyse filmique

n'est pas opérante dans l'analyse de la communication télévisuelle. Au-delà de l'affirmation

sous-jacente - et discutable - selon laquelle le film documentaire peut représenter la réalité

telle qu'elle existe de manière indépendante à sa filmation, à la télévision, l'énorme variété

de programmes aux origines et aux buts différents, dépasse largement le classement,

l'opposition bipolaire entre documentaire et film de fiction, et rend impossible l'application du

sens strict de "profilmique". Dans un Journal Télévisé, par exemple, aussi bien la scénographie

que la position du présentateur, sont préparées de manière intentionnelle uniquement dans

le but de leur diffusion (le JT n'existe que pour cela), mais cela ne suppose pas qu'il s'agit d'un

genre fictionnel. A l'opposé, un film de fiction comme "Taxi Driver" (Martin Scorsese, 1976),

par exemple, construit la vraisemblance du récit à partir de la localisation de l'intrigue dans

des espaces publics très connus de la ville de New York. De plus, ce film contient une série de

scènes de la vie nocturne de la ville qui ont été enregistrées avec une caméra cachée, sans

autre intervention scénographique que la position de l'appareil d'enregistrement. Ces deux

exemples nous montrent les limites méthodologiques d'une conception étroite.

Dans un sens plus large, la notion de "profilmique" indique tout ce qui est ou peut être objet

d'enregistrement graphique ou filmique, sans que ceci établisse une distinction entre

25 Voir : Souriau, E, L'Univers Filmique, Flammarion, Paris, 1953.

n i ! f i c t i on ! n i ! r é a l i t é !

100!

l'intentionnalité ou la préparation des éléments (objets, actants, espaces, éclairage, etc.) et

sa présence casuelle ou aléatoire. C'est-à-dire que l'objectif désigne tout le monde matériel

qui a été ou peut être filmé. De là, le caractère large que Dominique Château donne à la

définition de "profilmique" :

"Ensemble des données du monde objectif enregistrées ou enregistrables par l'appareil

photographique ou cinématographique". (Château, D, 1983, p. 53)

Aux effets de l'analyse que nous tentons d'effectuer, cette conception large de la notion a

l'avantage de pouvoir être appliquée à tout type de documents dans le cadre de la

communication télévisuelle.

Mais comment peut-on déduire la réalité ou la non-réalité d'un document télévisuel à partir du niveau profilmique?

Aucun indice ne permet à lui seul de construire une hypothèse sur la pertinence

authentifiante, fictionnelle ou ludique d'un document télévisuel. Dans le cas des indices que

nous pouvons repérer au niveau profilmique, cette situation est encore plus évidente.

Étant donné que la fiction est la construction d'un monde possible logiquement analogue à

notre monde "réel", les éléments matériels situés dans ce monde et qui sont en rapport, ne

doivent pas forcément être différents de ceux que nous pouvons trouver dans n'importe

quelle émission de type authentifiant. Par exemple, aucun des éléments profilmiques de la

série "New York Police", dont la trame se développe dans un espace urbain actuel de la ville

de New York, vu de manière isolée par rapport aux autres indices diégétiques, ne permet de

déduire le mode fictionnel dans lequel la série est réalisée.

L'analogie entre les éléments profilmiques et les éléments de la réalité est ce qui permet ce

que Christian Metz (: 1972) et ensuite Dominique Château (: 1986; 1997) appellent "effet de

réel" par opposition à "l’effet de réalité" ou "vraisemblable". Ces notions désignent les aspects

du film qui cherchent, plus qu'à connoter le contenu comme réel, à signifier de manière

connotative, le réel lui-même. Ainsi, tandis que l'"effet de réel" s'appuie sur l'analogie iconique

qui existe entre notre monde et sa représentation médiatico-audiovisuelle, l'"effet de réalité"

est la mimésis relationnelle et qualitative entre les éléments qui se configurent dans la fiction

audiovisuelle. Ceci ne veut pas dire que si l'analogie et la mimésis se brisent, la diégèse est

brisée pour autant. La construction d'un monde diégétique ne s'appuie pas seulement sur la

similitude iconique et relationnelle avec notre monde, mais surtout sur sa cohérence interne

qui le rend crédible comme un monde possible, indépendant et ayant souvent ses propres

règles.

"La croyance en la réalité de l'accomplissement du représenté exige seulement qu'il soit

logiquement possible - non pas qu'il soir attesté comme réel". (Chateau, D, 1997)

s e c t i on ! 2 . ! c a d r e ! t h éo r i c o ?mé thodo l o g i que ! ! o u t i l s ! d ' a n a l y s e !

101 !

C'est pour cette raison que les indices profilmiques ne se réduisent pas à la construction

d'espaces et d'actants26. Sur un même niveau hiérarchique que les différents éléments du

monde qui y sont configurés, il y a les qualités qui leur sont associées et la relation qui s'établit

entre eux.

Ainsi, un indice de fictionnalité du mode d'énonciation peut être établi à partir de la rupture

de l'"effet de réel" et de l'"effet de réalité" : dans un monde diégétique comme celui créé

dans la série "Superman", la plupart des éléments et des actants sont analogues à ceux de

notre monde d'expériences réelles, sauf en ce qui concerne les qualités du personnage :

Superman peut voler, plier l'acier comme si c'était du papier, regarder à travers les murs,

enfin il peut sauver le monde; il a des pouvoirs surnaturels, qui ne correspondent pas à ceux

que les êtres humains peuvent déployer. Par ailleurs, le monde représenté (ses éléments et

ses qualités) dans le film "Tommy" (Ken Roussel, 1975) est similaire au nôtre, à l'exception de la

relation entre les personnages : ils chantent leurs dialogues et dansent leurs actions: il s'agit

d'un opéra-rock.

Dans les deux cas cités, malgré les éléments et les actants homologues de ceux que nous

pourrions trouver dans notre monde d'expériences réelles, leurs qualités permettent la

construction d'une hypothèse, quant au mode d'énonciation, qui pointe davantage une

pertinence fictionnelle plutôt qu'authentifiante.

Encore plus déterminant dans la construction d'hypothèse sur la fictionnalité du mode

d'énonciation à partir du niveau profilmique, notons la constitution, soit d'un monde

fantastique soit d'un monde anachronique par rapport à la possibilité d'être filmé, soit d'un

monde représenté par l'intermédiaire d'une technique différente de la photographie ou du

vidéo.

Un exemple de la constitution d'un monde fantastique nous est proposé par le film "Die

Unendliche Geschichte"27 (Wolfgang Petersen, 1984), dans lequel les éléments et les actants

du monde créé ont non seulement des qualités et des relations différentes de celles de notre

monde mais, de plus, ils sont eux-mêmes totalement irréels (animaux fantastiques, êtres

inconnus, paysages d'autres mondes, etc.).

Par ailleurs, les éléments profilmiques deviennent fondamentaux pour la construction

d'hypothèses inférentielles sur la cohérence entre la localisation référentielle du discours et le

caractère des objets, du temps et de l'espace qui sont configurés dans le document

télévisuel. Dans le cas de la série américaine "La petite maison dans la prairie", par exemple,

leur fonctionnalité peut être déduite, au niveau profilmique (vêtements, technologies,

26 "Le concept d'actant remplace avantageusement (...) le terme de personnage, car il recouvre non seulement

les êtres humains, mais aussi les animaux, les objets ou les concepts". (Greimas, A-J, et Courtés, J, 1993, p. 3). Suivant ce raisonnement, les objets, lorsqu'ils ont une fonction dans la construction du discours, sont des actants au même niveau que les personnages de la diégèse.

27 "L'Histoire sans Fin".

n i ! f i c t i on ! n i ! r é a l i t é !

102!

coutumes) par l'anachronisme entre la localisation historique de l'intrigue (la colonisation de

l'Ouest américain) et la possibilité de sa enregistrement filmique.

Par contre, la cohérence des éléments spatiaux et objectaux et la localisation référentielle

du discours, fonctionne comme un puissant effet de réel.

"L'identification des signes iconiques (propres ou kinésiques) n'est pas différente dans un

film muet et dans un film d'aujourd'hui ; en revanche nous percevons différemment le

profilmique : dans le premier cas, tel vêtement est affecté rétroactivement d'une connotation

"démodé" que l'icône correspondante n'avait pas à l'époque où elle fut produite ; dans le

second, s'agissant même d'un film historique, l'iconique et le profilmique sont perçus en

coïncidence". (Chateau, D, 1983, p. 53)

Enfin, les formes de représentation télévisuelle différentes de celles de la photo et de la

vidéo, telles que les dessins ou la réalité virtuelle, comportent aussi des indices forts de non-

réalité des documents réalisés à partir de ces technologies. De la totalité des séries de dessins

animés28 ou de réalité virtuelle créée par ordinateur, il est possible de déduire une plus

grande probabilité de fiction dans le mode d'énonciation, puisque l'analogie iconique entre

le monde et sa représentation est moins évidente que celle obtenue à partir d'un

enregistrement photographique ou vidéographique.

Ainsi, au niveau profilmique du mode d'effectuation de l'acte d'énonciation, l'effet de réel et

l'analogie qualitative et relationnelle du monde diégétique, nous serviront pour construire des

hypothèses sur la pertinence authentifiante ou fictionnelle du monde représenté.

2.! NIVEAU!COGNITIF !DE!LA!MODALITE!DISCURSIVE!; !QUI !PARLE?! !

Comme nous l’avons vu précédemment (chapitre II), d’après le modèle inférentiel de la

communication29, une information est pertinente pour un individu lorsqu’elle permet à celui-

ci de réorganiser et d’améliorer sa représentation du monde. Communiquer consiste, donc,

à produire et à interpréter des indices clairs qui nous permettent la formation d'hypothèses

concernant l’intentionnalité informative de l'énonciation. Cette interprétation des indices

peut se résumer comme l’action de découvrir (ou plus exactement de construire) la

pertinence de l’information que nous recevons. Pour que cela soit possible, il faut partager

avec l’énonciateur son environnement cognitif.

L’organisation d’images, sons, paroles, rythme, couleurs, moyens techniques, temps verbaux,

modalités discursives, etc., qui se combinent dans un document audiovisuel, constitue une

configuration textuelle spécifique, laquelle, loin d’être réduite à un seul ensemble de

28 Il faudrait y ajouter les mondes fictionnels des programmes tels qu'Ici Blabla, dans lesquels les éléments

scénographiques et de caractérisation du personnage sont (pour un adulte) évidemment non réels. 29 Voir Sperber et Wilson, 1989.

s e c t i on ! 2 . ! c a d r e ! t h éo r i c o ?mé thodo l o g i que ! ! o u t i l s ! d ' a n a l y s e !

103 !

séquences ou à une codification déterminée, situe le téléspectateur dans un régime cognitif

particulier par rapport à l’acte d’énonciation et à l’objet énoncé. Ce régime cognitif

particulier se traduit dans la décision de l’auteur des énoncés, pas nécessairement

consciente, de partager ou non l’environnement cognitif des personnages. C’est ce que

Gérard Genette appelle la focalisation30.

"Pour éviter ce que les termes de vision, de champ et de point de vue ont de trop

spécifiquement visuel, je reprenderai ici le terme un peu plus abstrait de focalisation, qui

répond d'allieurs à l'éxpression de Brooks et Warren : 'focus of narration.'" (Genette, G,

1972, p. 206).

La notion de focalisation définit la perspective, le foyer cognitif à partir duquel une modalité

discursive assume le récit d’un événement. Jost31 et Gaudreault32, d’une part, et Lagny,

Ropars et Sorlin33, d’autre part, adoptent cette catégorie l’appliquant à l’analyse de la

narration audiovisuelle. Dans la proposition de Jost34, les régimes cognitifs qui définissent les

modes de focalisation du récit sont les suivants :

La focalisation zéro ou récit non focalisé, dans lequel l’environnement cognitif35 du

téléspectateur est plus vaste que celui des personnages, c’est-à-dire qu’il sait plus que les

personnages grâce au fait que le narrateur est "omniscient" : il est partout, il sait tout et peut

s’introduire dans toutes les pensées et dans tous les sentiments de chacun des personnages.

La focalisation zéro n’est pas un régime cognitif utilisé exclusivement dans le mode

d'énonciation fictif. En effet, d’une part, la possibilité de rompre les barrières de l’espace

pour être en plusieurs lieux différents en même temps est quelque chose d’habituel et

caractéristique du direct télévisé authentifiant – voir les connexions via satellite. D’autre part,

la possibilité donnée au spectateur d’être mieux informé que les personnages est aussi à la

base de la narration dans la plupart des documentaires historiques.

En deuxième lieu, la focalisation interne, dans laquelle l’environnement cognitif du

téléspectateur est le même que celui des personnages : il connaît les événements de

manière simultanée au personnage étant donné que le narrateur est un des personnages

(focalisation interne fixe) ou plusieurs personnages de façon alternée (focalisation interne

multiple). A titre d’exemple : un témoignage, la chronique d’un correspondant de guerre

30 Genette, G, 1972, pp. 206 à 214. 31 Jost, F, 1983, pp. 192 à 212. 32 Jost, F, et Gaudreault, A,1990. 33 "Analyse d’un ensemble extensible", Théorie du Film, Paris, Albatros, 1980. 34 Jost a été le seul à développer complètement la notion de focalisation dans l’analyse audiovisuelle. 35 "Un environnement cognitif d'un individu est un ensemble des faits qui lui sont manifestes. (..) Un fait est

manifeste à un individu á un moment donné si et seulement si cet individu est capable à ce moment-là de représenter mentalement ce fait et d'accepter sa représentation comme étant vraie ou probablement vraie." Sperber, D et Willson, D, 1989, p. 65.

n i ! f i c t i on ! n i ! r é a l i t é !

104!

dans le lieu des événements ou un récit fictionnel à la première personne (énoncé de réalité

feint, selon la catégorisation proposée par Hamburger), relèvent tous, du point de vue

cognitif de la construction du récit, d’une focalisation interne.

En dernier lieu, la focalisation externe, dans laquelle l’environnement cognitif du

téléspectateur est inférieur à celui des personnages ; ces derniers ont accès à plus de

connaissance que le téléspectateur, du fait que le narrateur est extérieur aux événements

qui sont décrits et le téléspectateur ne peut pas savoir autant que les personnages. Le récit

en focalisation externe, récit objectif ou béhavioriste, d’après Magny36 correspond autant au

documentaire scientifique qu’à la fiction épique historique. C’est uniquement dans la

modalité standardisée d’un journal télévisé ou d’un débat, voire d’un talk show – tous des

programmes où la médiation audiovisuelle est fortement dominée par la composante

verbale – que l’on peut observer que la distance entre l’action et son récit situe le foyer

cognitif à l’extérieur de celui des actants (présentateur, speaker, journaliste). Dans le cas du

reportage journalistique, comme dans celui du direct préparé dans lesquels les composantes

verbale et visuelle sont plus équilibrées, et malgré l’inclusion fréquente de témoignages et

interviews, la garantie d’"objectivité" repose principalement sur la présentation des

événements, non seulement comme ayant lieu indépendamment du récit que l’on en fait

mais aussi comme étant montrés et racontés de l’extérieur.

Aucune caractéristique de la médiation télévisuelle, prise de manière isolée par rapport à

l’ensemble des phénomènes communicationnels qui peuvent être associés à la

compréhension spectatoriele, suffirait à déterminer la réalité ou non-réalité de l’énonciation.

La focalisation de la modalité discursive ne suffirait pas non plus.

Pourtant, dans la mesure où la détermination du régime cognitif permet d’associer une

modalité discursive à une ou plusieurs instances énonciatives, elle est importante à l’heure de

déterminer la responsabilité énonciative. C’est-à-dire qu’à travers l’analyse de la focalisation

du discours, nous pouvons établir les instances énonciatives mises en jeu dans la médiation

verbale et visuelle et ses différents degrés de responsabilités par rapport à l’énonciation

énoncée. La notion de focalisation devient donc cohérente et assimilable dans une

conception polyphonique de l'énonciation dans la mesure où elle permet d'attribuer les

différents niveaux d'un discours audiovisuel à ses énonciateurs.

3.! NIVEAU! PERCEPTIF ! AUDIOVISUEL! DE! LA! MODALITE! DISCURSIVE! : ! QUI !REGARDE?!

La notion de focalisation qui définit le rapport entre l’environnement cognitif du narrateur, les

personnages et le lecteur, permet d’établir aussi bien le foyer cognitif que le foyer perceptuel

36 Magny C-E, 1948.

s e c t i on ! 2 . ! c a d r e ! t h éo r i c o ?mé thodo l o g i que ! ! o u t i l s ! d ' a n a l y s e !

105 !

d’un récit «scriptural »37 ou verbal. Mais, lorsqu’il s’agit d’un récit audiovisuel, le régime de

«focalisation» ne suffit pas à définir les deux à la fois.

La fusion entre le "savoir" et le "voir" que comporte le terme focalisation, est légitime dans le

roman parce que, là, le "point de vue", en termes perceptuels, n'est autre chose qu'une

métaphore. Mais sa validité théorique ne nous semble partielle que si nous tentons de

l'appliquer à l'analyse d'un média dans lequel "voir" est un aspect communicationnel central

et concret.

Parce que dans le cinéma et dans la télévision la médiation est verbale, visuelle et sonore, le

besoin de séparer les catégories cognitive et perceptive, amalgamées dans la notion de

focalisation, s'impose.

Conscient de cette différence entre le voir et le savoir qui se fait évidente dans la

communication audiovisuelle, François Jost a introduit dans l'analyse filmique télévisuelle la

notion d'"occularisation"38.

"Pour caractériser la relation entre ce que la caméra montre et ce que le héros est censé

voir, je propose de parler d'occularisation : ce terme a en effet l'avantage d'évoquer l'oculaire

et l'œil qui y regarde le champ que va 'prendre' la caméra". (Jost, F, 1983, p. 196).

Le terme "occularisation" définit la relation perceptivo-visuelle entre ce que montre la

caméra et ce que perçoit visuellement le personnage. Dans cette relation, il est possible

d'établir deux régimes perceptifs principaux : l'occularisation zéro et l'occularisation interne.

L'occularisation zéro se définit comme le régime perceptivo-visuel dans lequel l'ensemble des

images est perçu de l'extérieur de l'action des actants. A aucun moment, l'image ne

correspond à quelque chose que voit l'un ou l'autre personnage.

"Quand l'image n'est vue par aucune instance intra-diégétique, aucun personnage, quand

elle est un pur 'nobody's shot', comme disent les Américains, on parle d'ocularisation zéro".

(Gaudreault, A, et Jost, F, 1990, p. 133).

Ce régime perceptif de l'image est d'usage généralisé aussi bien dans le genre fictionnel que

dans le genre authentifiant. Dans la plupart des séries télévisées, de "Star Treck" aux

"Chapeau melon et bottes de cuir ", l'image de l'action, que ce soit celle de Mr. Spock ou

celle de Madame Peel est vue, principalement, de manière extérieure à eux et non pas

comme ces personnages pourraient la voir.

Ainsi, la quasi-totalité des genres télévisuels authentifiants, du match de football aux

programmes de cuisine, les joueurs et les assiettes nous sont montrés "objectivement".

37 André Gaudreault (1988) propose le terme "scriptural" pour se référer au texte écrit car on évite ainsi les

connotations inhérentes au deuxième terme. 38 Jost, F, "Narration (s) : en deçà et au-delà", Communications n° 38, Paris, Seuil, 1983, pp. 192 - 212.

n i ! f i c t i on ! n i ! r é a l i t é !

106!

Il est important de considérer qu'un régime perceptif est généralement combiné, à de

degrés variables et selon son genre, avec un autre ou avec d’autres régimes perceptifs.

Pourtant, dans la mesure où l'occularisation zéro nous présente l'image comme étant vue de

l'extérieur des actants, elle constitue une garantie d'objectivité dans beaucoup de genres

authentifiants, comme les directs préparés et non préparés. Dans ces cas, il est possible de la

reconnaître à son état "pur".

Le régime d'occularisation interne, se caractérise, lui, par l'ancrage de son image dans un

regard intra-diégétique. Ce régime peut être divisé en deux sous-catégories : l'occularisation

interne primaire et l'occularisation interne secondaire.

L'occularisation interne primaire correspond au régime perceptif dans lequel l'image se "met"

dans le regard d'un personnage pour le développement de l'intrigue. C'est le procédé du

récit audiovisuel dans lequel le regard qui perçoit correspond au regard subjectif (interne) du

personnage. L'occularisation interne primaire doit donc procurer au téléspectateur les

indices nécessaires pour déduire cette incarnation de la caméra dans un œil diégétique qui

perçoit à partir du monde créé.

La plupart du temps, la construction d'une occularisation interne primaire est réalisée par

l'inclusion, dans le champ de l'image, de fragments corporels de l'individu avec lequel on

veut identifier le regard, tel que mains ou pieds, que nous voyons comme nous pourrions voir

les nôtres à partir de notre regard ou par une analogie spéciale ou physique entre le point

de vue et le personnage auquel on cherche à attribuer le regard. C'est le cas de

l'occularisation interne primaire qui se produit dans la dernière scène du film "Brazil" (Tierry

Gillian, 1986), dans laquelle le protagoniste regarde de bas en haut, du siège de dentiste où

il est assis, comment deux fonctionnaires le torturent.

A d'autres occasions, ce régime perceptuel peut se construire par l'interférence d'objets

dans le champ visuel, tels que serrures, fenêtres ou autres, comme c'est le cas dans le film

"Rear Window" (Alfred Hitchcock, 1954) ou par la déformation de l'image, notamment par

l'utilisation de grands angles extrêmes, ce qui est devenu un véritable cliché qui permet non

seulement la construction d'un regard intradiégétique mais aussi la connotation, souvent,

d'un regard venant de quelqu'un qui a les facultés mentales ou sensorielles perturbées. Un

exemple de cela serait la scène où Jack Torrence (Jack Nicholson), le père psychotique,

poursuit son fils dans un labyrinthe, dans le film "The Shining" (Stanley Kubrick, 1980).

Le cas le plus complexe de construction d'une occularisation interne primaire, est celui qui se

produit par l'interpellation directe d'un autre personnage qui regarde de manière frontale ou

du même personnage se regardant dans un miroir. L'absence d'autres indices intervenant

directement fait nécessaire une pré-construction d'indices profilmiques et diégétiques

ostensifs qui empêchent ou bloquent la possibilité d'interpréter ce regard frontal comme un

regard à la caméra. Tel est le cas d'Alfred, le jeune assistant du professeur Abronsious, qui se

s e c t i on ! 2 . ! c a d r e ! t h éo r i c o ?mé thodo l o g i que ! ! o u t i l s ! d ' a n a l y s e !

107 !

regarde dans le miroir sans voir les vampires qui sont à ses côtés, dans "The Fearless Vampire

Killers" (Roman Polanski, 1967).

Quel que soit le cas, l'occularisation interne primaire sera toujours un régime perceptif qui

nous renvoie à un mode d'énonciation fictionnel.

L'occularisation interne secondaire se constitue à partir des raccords des regards

(principalement à partir du champ-contrechamp). Dans ce cas, la référence à un regard

diégétique ne correspond pas à l'ancrage de l'image dans le regard du personnage mais à

la construction d'une relation entre leurs regards. Les personnages indiquent ce que nous

devons regarder lorsqu'ils dirigent leur regard et bien que nous ne puissions pas voir à partir

de leur corporalité, nous voyons ce qu'ils regardent.

Les exemples d'occularisation interne secondaire sont nombreux dans la fiction comme dans

les programmes de mode authentifiant. La plupart des programmes de conversation, talk

shows et interviews préparées, sont réalisés à partir de l'alternance de champ et

contrechamp, suivant le regard des sujets. Il n'est pas rare que l'on construise une

occularisation interne secondaire à partir de regards qui ne regardent pas réellement ce

qu'ils regardent mais à partir de ce que le réalisateur veut connoter ou manipuler (faux

raccord de regards).

Enfin, faisant extensive cette catégorisation perceptivo-visuelle des documents filmico-

télévisuels à une perception sonore, Jost propose la notion d'auricularisation39, équivalente à

celle de l'occularisation mais référée au régime de perception du son dans un document

audiovisuel. Cette notion est totalement analogue à la précédente et on y distingue aussi

trois niveaux d'auricularisation : les régimes perceptifs de l'auricularisation zéro, de

l'auricularisation primaire et de l'auricularisation interne secondaire.

Une auricularisation interne est le procédé à travers lequel la perception du son est ancrée

dans un sujet diégétique. Nous entendons ce que le personnage entend par opposition à ce

que les autres personnages entendent. Par exemple, lorsque nous pouvons entendre ce que

le personnage entend quand il approche son oreille d’une porte ou quand il parle ou

téléphone.

Dans quelle mesure le régime perceptif peut-il fonctionner comme un indice du caractère authentifiant ou fictionnel d'un document télévisuel?

L'élément principal inhérent à l'image et au son télévisuels qui permet la construction

d'hypothèse sur la réalité ou la non-réalité d'un document, c'est le degré de technicité des

images et du son, c'est-à-dire la variation entre l'opacité et la transparence technique.

Une occularisation interne primaire est un indice puissant de fictionnalité du mode

d'énonciation, car il nous place en situation de percevoir ce que perçoit le personnage dans

39 Jost, F, 1988.

n i ! f i c t i on ! n i ! r é a l i t é !

108!

l'intrigue. Pour que l'image ne nous renvoie pas au dispositif technique de l'enregistrement, il

est indispensable que la caméra, le caméraman et l'ensemble des techniques et techniciens

qui interviennent dans le tournage, dans la production et dans la post-production d'un

document télévisuel, n'existe pas aux effets de la compréhension du récit. En d'autres mots, il

faut que le dispositif technique audiovisuel soit complètement transparent.

La modalité de l’occularisation zéro à "vocation transparente" est celle qui n’est pas

ostensive dans l’utilisation des moyens et techniques d’enregistrement, de montage et de

post-production et qui, au contraire, cherche à effacer les traces énonciatives du réalisateur

du document et de tout le dispositif audiovisuel. La plupart des films narratifs fictionnels

classiques, principalement ceux produits par la grande industrie cinématographique des

États-Unis, fonctionnent dans ce régime perceptif audiovisuel. Au contraire, lorsqu’il s’agit du

mode d’énonciation authentifiant à la télévision, l’occularisation zéro à "vocation

transparente" est très peu fréquente. Sauf à une époque très localisée dans l’histoire de la

T.V. ( la T.V. des premières années qui imitait le cinéma et le théâtre) et dans quelques raretés

télévisées actuelles, la recherche de la transparence du dispositif scénique est pratiquement

nulle dans la production de documents authentifiants à la télévision40.

Au contraire, dans un régime d'occularisation zéro, comme ce serait le cas d'une image ou

reportage de guerre, le caméraman est l'individu qui perçoit en tant que témoin de

l'extérieur des événements. L'identification de l'image avec son instrument, la caméra, et à

travers elle avec tout le dispositif technique télévisuel qu'elle représente, c'est la

reconnaissance implicite de sa fonction technique et sociale de médiation. C'est-à-dire que

dans l'image journalistique ou de reportage, la caméra doit exister pour la compréhension

des images montrées comme étant des images de la réalité. Il est nécessaire que le dispositif

technique soit opaque.

Dans l’occularisation zéro à "vocation opaque" l’utilisation des moyens techniques

audiovisuels est ostensive car ils constituent aussi un moyen d’expression ou

d’authentification de ce qu’il nous est donné à voir. L’utilisation de cette modalité

d’occularisation zéro dans la fiction n’est pas aussi répandue que la précédente. Elle se

limite, en général, à certains films d’auteur, aux sit’com’s et à quelques programmes

humoristiques fonctionnels. Par contre, la plupart des programmes de mode authentifiant de

la télévision actuelle sont réalisés à partir de la mise en évidence du dispositif technique à

travers l’image. Cela va de la mise en évidence des éléments techniques dans le journal

télévisé jusqu’aux tremblements de l’image et légers décalages dans les documentaires

classiques de la BBC.

40 Ver : Eco, U, T.V. ; la transparence perdue, La Guerre du Faux, Paris, Livre de Poche, 1985. Et : Casetti, F,

et Odin, R, « De la paléo à la néo-télévision », Communications n° 51, Télévision, Mutations, Seuil, 1990.

s e c t i on ! 2 . ! c a d r e ! t h éo r i c o ?mé thodo l o g i que ! ! o u t i l s ! d ' a n a l y s e !

109 !

Dans les deux cas, c'est l'ensemble des indices diégétiques qui construisent la transparence

ou l'opacité technique, étant donné que, contextuellement, les deux types d'image peuvent

être impossibles à reconnaître dans leur qualité fictionnelle ou réelle.

Un petit fragment du film "Platoon Leader" (Norris A., 1988) passé à la télévision ne permet

pas l'identification du régime perceptif dans lequel le document est réalisé et encore moins

le mode d'énonciation qui lui est propre : les mouvements brusques et la vibration de l'image,

l'action de se cacher et de regarder/filmer de manière prudente et nerveuse à partir d'une

tranchée, en plein affrontement, peuvent faire penser tout aussi bien à un personnage de

diégèse fictionnelle qu'à un correspondant de guerre.

Au niveau technique et esthétique, les images documentaires ou fictionnelles peuvent être

identiques. Ce qui va les différencier radicalement c'est l'ensemble d'actions d'occultation

ou de monstration, selon les cas, du dispositif technique télévisuel et les indices ostensifs de

fiction ou de réalité qui se construisent sur l'ensemble des niveaux profilmique, cognitif et

perceptif du document.

Tout comme dans le cas de l’occularisation zéro, il y a deux modalités perceptives sonores

de l'auricularisation zero : une qui cherche à rendre transparent l’acte énonciatif, l’autre qui

tend à montrer les moyens techniques. Dans l’auricularisation à "vocation transparente", le

son fait référence au positionnement actantiel de la source qui le produit. C’est-à-dire que,

dans le régime d’auricularisation zéro à "vocation transparente", les sons sont perçus à partir

de la position occupée par l’image (qui n’est pas la même que la position d’un personnage

en particulier, bien qu’elles coïncident souvent) et non pas à partir du lieu où le son est

produit. Ainsi, la petite vibration que nous pouvons entendre lorsque l’image nous montre le

Lt. John Dunbar (Kevin Costner) dans le film "Dances with Wolves" (Kevin Costner, 1990),

correspond au bruit assourdissant que produit une énorme meute de buffles en cavalcade,

comme le montre le plan suivant dans laquelle nous voyons les animaux encore très loin du

lieu où se trouve le protagoniste.

L'opposition opacité/transparence technique dans la communication télévisuelle permet,

dans la plupart des cas, d'établir une plus ou moins grande pertinence interprétative de

réalité ou non-réalité d'un document.

Nous avons déjà dit que la télévision, à la différence du cinéma, qui est identifié

historiquement avec la fiction, doit combiner des documents de types divers. C'est pour

cette raison que la médiation télévisuelle d'un document audiovisuelle est totalement

différente de celle faite par d'autres médias audiovisuels. Tandis qu'au cinéma la

transparence technique est la norme, à la télévision, c'est l'opacité qui est la caractéristique

de représentation qui lui est propre, qui est propre à sa médiativité41.

41 "La médiativité est donc cette capacité propre de représenter - et de placer cette représentation dans une

dynamique communicationnelle - qu'un média possède quasi ontologiquement". (Marion, P, 1997, p. 79)

n i ! f i c t i on ! n i ! r é a l i t é !

110!

Les formes esthétiques développées par la télévision pour les genres authentifiant et ludique

font une monstration massive et ostensive des moyens techniques utilisés dans la médiation.

Ainsi, la monstration par voie directe (caméras, perches, lumières, personnel technique) et la

monstration par voie indirecte (ralenti, intervention de couleur, effets de transition entre

plans, etc.) constituent des procédés absolument quotidiens à la télévision.

Pourtant, du point de vue de la transparence ou de l'opacité technique, ce qui représente

une véritable frontière entre un mode fictionnel et un mode authentifiant, c'est la

démonstration42 du dispositif technique à travers l'adresse à la caméra.

L'adresse à la caméra, ontologiquement différente du regard frontal de la fiction, lorsqu'un

personnage se regarde dans un miroir ou un autre personnage qui le regarde (occularisation

interne primaire), c'est l'évidence la plus radicale de la médiation télévisuelle, car en

appelant le téléspectateur, le sujet (réel ou fictif) qui appelle démontre la double possibilité

de médiation verbale et visuelle de la télévision. Dans ce sens, c'est une affirmation du

caractère réel de l'énonciation. L'adresse à la caméra d'un commentateur, d'un speaker ou

d'un acteur nous renvoie non seulement à ce sujet d'énonciation historique qui nous parle à

la première personne mais, aussi, au Je-Origine réel représenté par le réalisateur ou par le

caméraman (à l'un ou à l'autre selon les savoirs et croyances du téléspectateur), qui construit

son énoncé à travers la sélection et combinaison de plans, cadrages de plans, sons,

transitions ou mouvements de caméra).

Dès lors, l'adresse à la caméra est un procédé spécifiquement authentifiant :

"Il est là, je le vois, il me parle. Le journal télévisé a finalement choisi de se constituer autour

de cette opération fondamentale, qui est ainsi devenue l'une des marques du genre, en tant

qu'indice du régime de réel qui est le sien : les yeux dans les yeux. Appelons cette opération

l'axe Y-Y". (Verón, E, 1983, p. 103).

Par ailleurs, l'utilisation de l'adresse à la caméra représente un fait très isolé dans la fiction qui,

lorsqu'il a lieu, fonctionne comme une rupture dans la diégèse. C'est-à-dire elle est

interprétée comme une erreur ou comme une énonciation de réalité insérée

intentionnellement dans le monde diégétique avec des objectifs communicationnels extra-

diégétiques.

Ainsi, le régime perceptif dans lequel un document télévisuel nous est présenté peut

constituer un indice important de réalité ou de non-réalité du mode d'énonciation dans

lequel il est réalisé.

42 Selon le dictionnaire Robert : "Démontrer : Témoigner par des signes extérieurs de." La démonstration du

dispositif technique à travers l'adresse à caméra, n’est pas réalisée par le fait de sa représentation iconique mais par l’évidence de ses qualités de médiation.

s e c t i on ! 2 . ! c a d r e ! t h éo r i c o ?mé thodo l o g i que ! ! o u t i l s ! d ' a n a l y s e !

111 !

4. ! NIVEAU!DE!LA!RESPONSABILITE!ENONCIATIVE!: !QUI !EST!L'ENONCIATEUR!?!

Comme nous l'avons signalé dans le chapitre II, la condition sine qua non de base pour

qu’un événement soit interprété comme ayant un statut communicationnel est que son

auteur soit un être humain.

“ Parce que ça parle, il faut bien que quelqu’un parle ” (Metz, Ch, 1968, p. 29).

De la même manière, Jost (: 1993; '97; '97-a; '98; '99; 2001), en parlant de l’énonciation

audiovisuelle, signale que tout énoncé, pour être interprété, doit être attribué à une instance

humaine, réelle ou effective : à une figure anthropoïde.

“ L’hypothèse qui conduit mon travail depuis plusieurs années est que la diversité des

images et des documents ne peut s’expliquer que si l’on pose au départ que leur réception

est soustendue par un anthropomorphisme régulateur ”. (Jost, F, 1997-b, p. 14).

Et il ajoute, plus loin :

“Le document audiovisuel comme artefact commence là où le spectateur est capable de

transfigurer la banalité du motif en un objet doté d’un ‘aboutness’ ”. (Op. cit.).

C’est-à-dire que, pour interpréter un document audiovisuel, il ne suffit pas de reconnaître son

origine, la présence d’une figure anthropoïde mais il faut, en outre, supposer à celle-ci une

intention communicationnelle. C’est-à-dire que l’on doit reconnaître l’énoncé comme un

artefact communicationnel d’origine et à destination humaines.

Dans ce sens, l’anthropomorphisme régulateur dont parle Jost ne se limite pas à dire qu’il

faut pouvoir reconnaître l’auteur d’un énonce comme étant une personne en particulier

mais, fondamentalement, il faut pouvoir identifier une intentionnalité de caractère humain

extérieure au document lui-même. Il s’agit de la construction d’une “ personnalité ” qui n’a

pas entièrement besoin d’une forme humaine mais en tout cas d’une intentionnalité

communicative.

Par ailleurs, l’intention communicationnelle du réalisateur d’un document télévisuel ou d’une

chaîne télévisée ne doit pas coïncider obligatoirement avec celle que le téléspectateur lui

attribue à partir des inférences et de la construction d’hypothèses manifestes qu’il considère

pertinentes. Dans l’analyse, nous devons, donc, distinguer l’intention, en tant que stratégie

de l’énonciateur, et la présomption d’intentionnalité, en tant qu’outil de compréhension de

l’énonciataire. C’est ce dernier niveau que notre analyse va prendre en compte

maintenant.

Dans le modèle de Jost, cette présomption d’intentionnalité communicationnelle du

téléspectateur (ou capacité á reconstruire une intention) par rapport à l’énonciation dans

un document télévisuel, dépend étroitement du mode d’énonciation qu’il lui attribue.

n i ! f i c t i on ! n i ! r é a l i t é !

112!

“ Les émissions télévisuelles sont interprétées en fonction de trois grands modes

d’énonciation qui définissent à la fois l’attitude ou l’intention de celui qui adresse le document

et ce que le spectateur peut en attendre ”. (Jost, F, 2001, p. 17).

Ces trois modes d’énonciation sont, évidemment, les modes authentifiant, fictionnel et

ludique.

Selon ce que nous venons d’exposer, nous pourrions configurer le tableau suivant :

Dans le processus d’interprétation spectatorielle, la reconnaissance (attribution) du mode

d’énonciation dans lequel est réalisé un document télévisuel, permet l’identification

(construction) de l’intentionnalité communicative qui préside à sa réalisation. Cette

présomption d’intentionnalité permet, à son tour, de déterminer le caractère de

l’énonciateur de l’énoncé.

Ceci veut dire que les éléments qui constituent le mode d’éffectuation matérielle de l’acte

d’énonciation contiennent des indices pour la construction du Je-Origine responsable de

l’énonciation43.

Pourtant, les éléments profilmiques, cognitifs et perceptifs du discours, ne sont pas suffisants

pour construire le caractère concret que peut assumer le responsable de l’énonciation d’un

document télévisuel.

Prenons, par exemple, le cas d’un film de fiction narratif sur le "cas Watergate", tel que "All

the President's Men" (Alan J. Pakula, 1976) et un documentaire narratif sur le même thème,

réalisé à partir d’interviews. Si nous prenons seulement les trois aspects de l’effectuation de la

médiation télévisuelle que nous avons vu jusqu’ici, nous constaterons que tous deux sont

réalisés en occularisation zéro et focalisation externe ; les deux documents audiovisuels sont

narratifs, c’est-à-dire qu’ils constituent un récit sur un thème indiqué, chacun d’eux nous

permet, au niveau profilmique, la construction d’un effet de réel par l’analogie iconique

entre le monde représenté et le monde réel ; enfin, le topic interprétatif qui permet la

compréhension du monde diégétique créé est similaire dans les deux cas : une intrigue

politique.

La différence fondamentale qui va nous permettre de construire la pertinence d’une

responsabilité fictionnelle pour le premier et réelle pour le deuxième sera l’asymétrie entre les

médiations verbale et audiovisuelle qui constituent la médiation télévisuelle de chacun des

documents.

Comme nous l’avons vu précédemment, la relation entre les médiations verbale et

audiovisuelle, présente en tout document télévisuel, est variable. Tandis que, dans certains

cas, la médiation verbale et la médiation audiovisuelle sont coopératives dans la

43 Selon Jost, “ l'auteur est une réalité construite par le récepteur, qui peut aussi bien désigner un homme 'x'

qu'une institution (le studio, la production) ”.( Jost, F, 1998, p. 30).

s e c t i on ! 2 . ! c a d r e ! t h éo r i c o ?mé thodo l o g i que ! ! o u t i l s ! d ' a n a l y s e !

113 !

construction d’un seul discours, dans certains autres cas, la distance entre l’énonciation

verbale et l’énonciation visuelle constituent deux types de discours à l’intérieur du même

document télévisuel. La reconnaissance de cette variabilité constitue l’élément qui permet

au téléspectateur de distinguer le sujet responsable de l’énonciation.

La variabilité de la médiation prend la forme d’une hiérarchisation entre les médiations du

sujet responsable de la parole et celles du sujet responsable des images et du son. En

d’autres termes, ce que nous devons établir, c’est dans quelle mesure et comment la

médiation visuelle est soumise à la médiation verbale ou dans quelle mesure et comment

c’est le contraire qui se passe.

Pour concrétiser cela, nous prendrons comme exemple l'adresse à la caméra que nous

avons déjà mentionné auparavant.

Comme nous l’avons dit, à la télévision, l'adresse à la caméra correspond à deux actions

discursives différentes selon qu’il s’agisse de fiction ou de document de réalité (authentifiant

ou ludique). Tandis que, dans la fiction, l'adresse à la caméra est une action de rupture de la

diégèse, c’est-à-dire l’intromission de notre monde dans le monde construit pour et par le

récit, dans un document authentifiant télévisuel, l'adresse à la caméra devient totalement

naturelle et même nécessaire dans ce contexte médiatique. Elle est non seulement une

confirmation de la réalité de ce que l’on représente mais aussi une caractéristique

esthétique de la médiativité télévisuelle.

Dès lors, nous pourrions dire que, aussi bien pour la fiction que pour les documents de réalité :

“ La conscience de l’énonciation surgit chez le spectateur, quand la norme perd sa

naturalité, qu’elle apparaît conventionnelle ou arbitraire en raison d’une fracture dans le

‘format’ de l’émission ”. (Jost, F, 1998, p. 36).

Dans ce sens, l'adresse à la caméra est une norme de la médiation télévisuelle dans les

genres authentifiant et ludique et, dès lors, nous ne nous apercevons pas lorsqu’il se produit,

par exemple, un manque de coordination entre le réalisateur (responsable de la médiation

audiovisuelle) et le présentateur d’un JT (responsable de la médiation verbale) qui laisse ce

dernier continuer à parler vers une caméra qui ne le prend pas de face. Dans ce cas, c’est

l’absence de regard à la caméra qui est l’élément qui provoque la rupture.

Jusqu’au moment où le problème de coordination se produit, le seul sujet que nous

reconnaissons comme responsable de l’énonciation est le présentateur. Malgré l’ensemble

de moyens techniques et l’opacité technique générale d’un JT (monstration de caméras, du

personnel technique, du décor, des lumières, etc.), le réalisateur, en tant que sujet

responsable de la médiation visuelle et sonore, est resté transparent. Il semble ne pas avoir

une grande d’incidence dans l’acte énonciatif que comporte la réalisation d’un journal

télévisé. L’instance qui nous semble pertinente en termes de sa responsabilité de la

médiation audiovisuelle, est plutôt la chaîne de télévision.

n i ! f i c t i on ! n i ! r é a l i t é !

114!

Ce paradoxe apparent entre l’opacité technique et la transparence énonciative du

médiateur audiovisuelle est dû à ce que la catégorie du Je-Origine responsable de

l’énonciation audiovisuelle n’est pas la même que celle du responsable de l’énonciation

verbale.

Voyons cela :

D’après Käte Hamburger, la différence entre le sujet d’énonciation historique et le sujet

d’énonciation théorique est que, tandis que le premier met en jeu son individualité en se

présentant “ sous la forme d’un Je ”, le second énonce des propositions de valeur générale

dans lesquelles il ne met pas en jeu son individualité comme personne puis qu’il “ n’a que le

caractère d’une généralité transindividuelle ”.

De nos jours, un présentateur met tellement en jeu son individualité que, dans la plupart des

chaînes, sa figure est un élément clé non seulement pour établir un type de rapport

déterminé avec le téléspectateur mais aussi pour la construction de l’ethos de la chaîne.

Alors que le format, la scénographie et même la musique de certains programmes de

concours tel que “ Qui veut gagner des millions ? ” est similaire dans toutes les chaînes et

pays dans lesquels il est diffusé, la seule présence de Jean-Pierre Foucault comme

présentateur d’un programme à TF-1 marque une profonde différence par rapport à son

équivalent transmis par RTL belge, qui est conduit par Alain Simons.

Nous pourrions dire que le rôle principal d’un meneur ou d’un présentateur est justement

celui de mettre son individualité en jeu pour établir la communication télévisuelle. C’est pour

cette raison que, dans la plupart des cas, un présentateur se constitue en un Je-Origine

historique.

Par contre, le rôle énonciatif que la télévision assigne au médiateur audiovisuel dans un

programme de ce type est tout autre. A quelques exceptions près, le réalisateur d’un

programme de télévision, est loin d’être la vedette de l’émission, il est plutôt anonyme et

reste, dans certains cas, incognito. Qui pourrait dire le nom du réalisateur de “ Qui veut

gagner des millions ? ”

Si le réalisateur de télévision est, par définition, le responsable principal de l’ensemble des

actions qui permettent la construction finale d’un énoncé télévisuel, son action énonciative

ne consiste qu’à mettre en avant l’“ objectivité ” de l’objet énoncé. Pour cela, il ne doit pas

mettre en jeu son individualité mais, au contraire, il doit mettre en action tous les moyens

techniques pour la meilleure et la plus large présentation de l’énonciation du sujet

d’énonciation historique. Dans ce sens, le médiateur audiovisuel n’est autre chose qu’un

sujet d’énonciation théorique.

Dans le cas d’un direct télévisé, la médiation audiovisuelle prend la valeur d’une proposition

générale car il lui revient d’énoncer un fait “ objectif ” dans lequel le sujet responsable de la

médiation audiovisuelle n’est pas protagoniste.

s e c t i on ! 2 . ! c a d r e ! t h éo r i c o ?mé thodo l o g i que ! ! o u t i l s ! d ' a n a l y s e !

115 !

“ [Les sujets d’énonciation théorique] ne sont pas de sujets d’énonciation historique parce

que leurs personnalités individuelles comme telles n’ont pas à être prises en considération;

le lecteur ne s’intéresse qu’au contenu sans le mettre en relation, comme il le fait dans le

cas d’une lettre, avec la personnalité de l’auteur ”. (Hamburger, K, 1986, p. 49).

A la différence de ce qui se produit dans la fiction, dans laquelle l’énonciateur réel et tout le

dispositif technique doivent disparaître pour laisser la place aux Je-Origine fictifs qui

permettent la compréhension de la diégèse, dans les genres authentifiants et ludiques de la

télévision, le sujet d’énonciation théorique, bien qu’il disparaisse comme individu, ne

disparaît pas comme entité énonciative.

La figure du “ réalisateur ” n’assume pas un self particulier comme dans le cas du Je-Origine

historique mais elle se fond dans la figure de la chaîne, en tant que personnalité sans forme

humaine pleine, ou de la télévision en général, en tant qu’entité médiatique sujette à des

buts humains de toute espèce (présomption d’intentionnalité). Dans les deux cas, la figure du

réalisateur devient une entité transindividuelle.

En d’autres termes, le sujet d’énonciation audiovisuelle ne disparaît pas mais assume

l’identité transindividuelle qui permet une lecture objective des événements et l’énonciation

du Je-Origine historique, qui est le présentateur.

Cette transindividualité du sujet responsable de la médiation audiovisuelle, nous pouvons

l’observer aussi dans les standards de médiation audiovisuelle que la télévision a construits.

Par exemple, la médiation d’un récital de musique "live" ou d’un match de football, est régie

par un ensemble de procédés ad hoc qui, même en étant arbitraires, transcendent l’action

d’un médiateur ou d’une chaîne en particulier. Cette standardisation conventionnelle et

transtextuelle qui se répète avec des variations minimes d’un réalisateur à l’autre, ou d’une

émission à une autre, définit les attentes du téléspectateur.

Ainsi, chaque fois qu’il sera possible d’établir une variation dans les médiations verbale et

audiovisuelle à l’intérieur d’un document déterminé, nous serons en présence de deux Je-

Origine réel qui, tout en étant différents, sont tous deux responsables, à titre différent, de

l’existence d’un énoncé de réalité.

C.! CONCLUSIONS!ET!POINTS!DE!DEPART!

Ce chapitre avait deux buts principaux. D’une part, définir les concepts et notions qui nous seront nécessaires pour

l’analyse que nous voulons développer et, d’autre part, déterminer les niveaux d’analyse nécessaires pour construire

une grille d’observation des documents télévisuels en général et du vidéo-clip en particulier.

Pourtant, ni les outils d’analyse, ni la grille d’observation ne pourront être appréciés à leur juste valeur qu’à partir de leur

mise en jeu dans l’analyse.

n i ! f i c t i on ! n i ! r é a l i t é !

116!

Dans le chapitre suivant, nous exposerons l’analyse complète d’un vidéo-clip en particulier, qui nous servira en même

temps pour établir le mode d’énonciation dans lequel nous pouvons le catégoriser et pour mettre en œuvre et

actualiser les concepts et la grille d’observation que nous avons définis dans ce chapitre.

! u n ! d r ô l e ! d e ! g en r e !

117 !

V.!UN!DROLE!DE!GENRE

Le but de ce chapitre sera de déterminer le mode d'énonciation propre au vidéo-clip et d’en considérer les conséquences sur la théorie des genres télévisuels de Jost.

Notre premier pas consistera à analyser le caractère de l’énonciation dans un vidéo-clip en particulier. Cela nous permettra, en même temps, de définir le mode d'énonciation dans lequel on peut le classer et de mettre en jeu les concepts et outils capables d’établir la réalité ou la non-réalité d’un énoncé.

Le deuxième pas consistera à questionner l’apparente capacité de variation énonciative du vidéo-clip à travers l’analyse d’autres vidéo-clips dans lesquels les modalités d'énonciation mises en œuvre ne correspondent pas à celle définie dans le premier vidéo-clip. Ceci nous permettra d’établir que le mode d’énonciation ne suffit pas pour caractériser le clip en tant que genre.

Revenons au clip "Ex-girlfriend" (Retourn of Saturn, 2000) du groupe No Doubt, dont nous

avons ébauché les caractéristiques dans le chapitre I de ce travail. Nous y soutenions alors,

de manière intuitive, que l’énonciation dans ce clip pouvait être renvoyée, de façon

simultanée aux trois modes d’énonciation définis par Jost, puisque nous pouvions y trouver

des Je-Origine réel en même temps que des Je-Origine fictif et des effets performatifs

similaires à ceux définis par le mode ludique.

Mais quels sont les indices concrets qui nous permettent de construire l’hypothèse selon

laquelle l’énonciation dans le clip "Ex-girlfriend" serait la juxtaposition des modes

d’énonciation authentifiant, fictionnel et ludique ?

Comme nous l’avons signalé, le mode d’énonciation d’un document audiovisuel peut être

déduit autant de l’opération de diégétisation1 que de la sémantisation de l’acte

d’énonciation2.

Dans ce chapitre, nous nous intéressons, principalement, à l’analyse de l’opération de

diégétisation impliquée dans le mode de effectuation de la médiation télévisuelle dans le

vidéo-clip "Ex-girlfriend".

1 Construction d’un monde possible pertinent à travers l’adhésion à un topic interprétatif, la mise en œuvre

d’une modalité discursive et du mode d’effectuation matérielle de l’acte d’énonciation (médiation verbale, visuelle et sonore). Voir chapitre IV. A.

2 Construction d’hypothèses manifestes par rapport à la réalité ou non-réalité de l’énonciation à partir de la structure de la grille de programmation et de la communication de l’émission ou méta-énonciation.

n i ! f i c t i on ! n i ! r é a l i t é !

118!

A.! VERITE,!FICTION,!JEU!:!PHENOMENOLOGIE!D'UN!VIDEO=CLIP!

Comme nous l'avons dit, la diégèse peut être considérée comme un système de

construction de pertinence. Dans cette conception de la diégèse, nous chercherons à

établir les indices à travers lesquels il est possible de construire la pertinence authentifiante,

fictionnelle et ludique du monde crée dans le vidéo-clip "Ex-girlfriend".

L’opération de diégétisation, ou construction d’un monde pertinent pour et par le récit, se

réalise à partir de la thématisation de la représentation, de la mise en œuvre d’un genre

discursif et du mode d’effectuation matérielle de l’acte d’énonciation travers les médiations

verbales, visuelles et sonores. C’est à ce dernier niveau que nous allons fixer notre analyse.

Mais, avant de passer à l’analyse elle-même, voyons d’abord une description générale de

ce vidéo-clip :

La structure textuelle du clip "Ex-girlfriend" est constituée par deux séries syntagmatiques3 principales qui s’alternent (voir tableau 3) et que nous appellerons, respectivement, série 1 et série 2 :

La première série (série 1) est le récital "live". Nous y voyons le groupe No-doubt interprétant la chanson "Ex-girlfriend" (Retourn of Saturn, 2000), sur un plateau, face à un vaste public qui vibre et danse au rythme de la musique interprétée par les membres du groupe.

La deuxième série (série 2) est le récit d’une histoire dans le topic “agents secrets et mafieux". Cette série se divise, à son tour, en deux sous-séries. La première sous-série correspond au temps de l’action au présent (linéaire et ellipse), la deuxième correspond à l’action dans le passé (flash back). Dans les deux sous-séries, nous voyons Gwen Stephani et les membres du groupe No Doubt interprétant les personnages d’une histoire.

L’audiovisuel utilise un montage parallèle de la série 1 et de la série 2. Dans ce sens, la structure du vidéo-clip "Ex-girlfriend" serait, dans la nomenclature de Metz4, un syntagme parallèle achronologique constitué par deux séries de syntagmes linéaires et descriptifs. Cette donnée nous intéresse de manière particulière car elle va donner à voir une opposition entre la série 1 et la série 2.

3 "On appelle relation syntagmatique toute relation qui s'établit entre des éléments co-présents de façon

proche à l'intérieur d'un même message ; les relations syntagmatiques se définissent comme des relations 'in praesentia', de proximité". (Odin, R., 1990, p. 103). Selon les propositions de Christian Metz, la structure d’un film correspond, fondamentalement, à l’ensemble des figures de montage situées dans l’axe syntagmatique temporel. C’est pour cette raison que Metz a appelé sa recherche sur le discours filmique la "Grande Syntagmatique du film narratif".

4 Metz, Ch, 1968.

! u n ! d r ô l e ! d e ! g en r e !

119 !

VIDEO CLIP : EX-GIRLFRIEND NO DOUBT - RETOURN OF SATURN 2000 Synthèse narrative : Série 1 : Face à un micro, Gwen Stephani, chanteuse du groupe No Doubt interprète la chanson "Ex-girlfriends". Peu à peu nous voyons les autres membres de groupe : Adrian Samuel Young qui joue la batterie, Tony Kanal, qui se charge de la basse électrique et Tom Dumont, le guitariste du groupe. A leur côté, deux musiciens extérieurs au groupe s’occupent des synthétiseurs. Tout à coup, nous percevons que le groupe joue la chanson sur un plateau. Le public chante, danse et s’amuse avec le spectacle live. Série 2 : Première scène: Un jour d’automne, Gwen Stephani marche dans un grand parc de la ville. Elle est très triste. Pendant ce temps-là, assis sur un banc du parc, Adrian Samuel Young mange des frites. Lorsqu’elle arrive à sa hauteur, Gwen s’assied dos à Adrian du côté opposé du banc. Ils ne se regardent pas ni échangent le moindre mot. Subitement, Adrian se retourne et donne une photo à Gwen. Sur la photo, on voit Tony Kanal. Gwen pleure en regardant la photo qui lui rappelle sa relation avec lui. La furtive réunion clandestine finit lorsqu’Adrian ordonne à Gwen, par un geste impératif, de partir. Elle s’arrête et s’en va en pleurant sans regarder Adrian. Deuxième scène : Gwen vient d’entrer dans son logement, un studio. Elle se souvient tristement de Tony. Les murs de sa chambre sont recouvertes de photos de son ancien amoureux. Elle commence à se changer tout en pleurant. Elle se déguise en homme. Les souvenirs affluent. Gwen, en pleurs face au miroir, finit de mettre une fausse moustache. Troisième scène: Dans les toilettes d’un hôtel ou un autre lieu similaire, Tony est devant un urinoir, sous la protection de trois gardes du corps. Parallèlement, Gwen, déguisée en homme, sort d’un ascenseur et marche dans un couloir. Tony urine et parle avec ses gardes du corps, qui lui tournent le dos. Gwen est arrivée dans les toilettes, ouvre la porte et entre. Elle se dirige vers l’urinoir juste à côté de celui de Tony. Tony, qui continue à uriner, demande d’un geste vague à un de ses gardes du corps de se charger de l’individu qui vient de rentrer. Le garde du corps tire le capuchon qui couvre la tête de Gwen et celle-ci attaque les trois hommes les tuant un après l’autre. Pour finir, elle frappe Tony et le met hors de combat. Quatrième scène: Une fois sa mission accomplie, Gwen se dirige tristement vers la fenêtre des toilettes, elle ne voit pas que Tony est à nouveau sur ses deux jambes. Celui-ci l’attaque par le dos, ils brisent la vitre et tombent tous deux, enlacés, par la fenêtre du gratte-ciel.

T A B L E A U 3

Prises séparément, chacune des deux séries peut fonctionner de manière absolument indépendante au niveau diégético-visuel : l’espace et le temps diégétiques de l’histoire (série 2) peuvent être parfaitement compris sans avoir recours au récital "live" (série 1). D’autre parte, la série 1, dans la mesure où il s’agit de l’enregistrement d’un récital du groupe, se suffit à elle-même pour montrer et décrire les détails de l’interprétation des musiciens sans devoir faire appel à l’histoire racontée (série 2).

Le thème musical, par contre, et particulièrement la composante verbale de la chanson, est commun aux deux séries et constitue le point de rencontre et le lien entre les deux. Aussi bien dans le récital "live" que dans l’histoire, la chanteuse chante : dans la série 1, elle chante comme chante une chanteuse pop dans un récital "live", c’est-à-dire comme une personne réelle ; dans la série 2, elle chante comme le ferait une chanteuse d’opéra, c’est-à-dire, comme personnage inséré dans une intrigue. La continuité de la chanson et de l’acte de réalisation sont les éléments qui fondent les deux séries dans le clip.

n i ! f i c t i on ! n i ! r é a l i t é !

120!

Ex-girlfriend Paroles de la chanson : I kinda always knew I'd end up your ex-girlfriend (2 repeat) I hope I hold a special place with the rest of them (all the

time that we spent) I hope I hold a special place with the rest of them I kinda always knew I'd end up your ex-girl, friend And you know it makes me sick to be on that list But I should have thought of that before we kissed I'm another ex-girlfriend on your list You say you're gonna burn before you mellow But I should have thought of that before we kissed I will be the one to burn you I'm another ex-girlfriend on your list Why'd you have to go and pick me? But I should have thought of that before we kissed When you knew that we were different, completely I'm about to give you away for someone else to take I'm about to give you away for someone else to take I kinda always knew I'd end up your ex-girlfriend (2 repeat) We keep repeating mistakes for souvenirs I hope I hold a special place with the rest of them And we've been in between the days for years I kinda always knew I'd end up your ex-girlfriend And I know that when I see you I'm going to die I know I'm going to want you and you know why I'm another ex-girlfriend on your list It's going to kill me to see you with the next girl But I should have thought of that before we kissed 'Cause I'm the most gorgeously jealous kind of ex-girl Your wildness scares me But I should have thought of that before we kissed... So does your freedom You say you can't stand the restrictions I kinda always knew I'd end up your ex-girlfriend (2 veces) I find myself trying to change you I hope I hold a special place with the rest of them If you were meant to be my lover I wouldn't have to I kinda always knew I'd end up your ex-girlfriend And I feel so mean, I feel in between 'Cause I'm about to give you away I'm another ex-girlfriend on your list But I should have thought of that before we kissed I kinda always knew I'd end up your ex-girlfriend (for someone else to take)

I'm another ex-girlfriend on your list

I kinda always knew I'd end up your ex-girlfriend (am I making a mistake?)

But I should have thought of that before we kissed

T A B L E A U 4

Pour l’analyse que nous allons développer ci-après, cette structure caractérisée par les deux

séries, nous permettra d’approcher, un par un, chacun des modes d’énonciation qui y sont

présents, c’est-à-dire, les indices de réalité, de fiction et de jeu.

Voyons cela :

1.! LE! RECITAL! LIVE!: ! CONSTRUCTION! D'UN! MONDE! DIEGETIQUE! DE! REALITE!(SERIE!1)!

Nous allons établir maintenant le mode d'énonciation dans lequel peut être catégorisée la Série 1 du vidéo-clip "Ex-girlfriend", du point de vue des indices que l'on peut repérer à partir de l'opération de diégétisation que suppose le mode d'effectuation matérielle de la médiation télévisuelle.

La série 1 est constituée par l’interprétation du thème musical "Ex-girlfriend" par les membres

du groupe No Doubt, sur un plateau et face à un public qui chante et qui danse au rythme

de la musique.

Quels sont les indices qui nous permettent de déduire, sur le plan de la médiation

audiovisuelle, le caractère authentifiant du mode d'énonciation propre de la série 1 du

vidéo-clip "Ex-girlfriend" ?

Un premier élément qui permet cette déduction, est celui de la forme concrète que prend la

médiation télévisuelle mise en œuvre dans cette partie du vidéo-clip, à savoir le topic "récital

live".

! u n ! d r ô l e ! d e ! g en r e !

121 !

La médiatisation d’un récital live représente un topic largement utilisé dans la

communication télévisuelle. Il n’est pas nécessaire d’avoir fait l’expérience personnelle d’un

concert de musique pop en direct pour connaître les éléments et les rapports propre à ce

type d’événements.

Depuis les vieux enregistrements des concerts publics d'Elvis Presley dans les années ‘50

jusqu’à la psychodélie visuelle de Woodstock dans les années ‘70 et, plus près de nous, le

déploiement technologique futuriste des récitals de Pink Floyd dans les années ‘90, ils

correspondent tous, non seulement à un même type de relations actantielles et spatio-

temporelles mais aussi à la même logique discursive aussi bien au niveau de la médiation

verbale qu’à celui de la médiation visuelle.

Un récital live correspond à une modalité particulière dans le modèle télévisuel plus général,

celle que nous pouvons appeler "direct préparé extra-télévisuel".

Un direct préparé extra-télévisuel est l’enregistrement d’un événement singulier, public et

massif, programmé à l’avance. Dans ce type de transmissions, on peut prévoir, à des degrés

variables, les actions qui vont avoir lieu, aussi bien ce qui fera l’objet de l’enregistrement que

les procédés techniques et narratifs de l’enregistrement lui-même. Parmi les directs préparés

extra-télévisuels les plus habituels, nous pouvons citer les transmissions et retransmissions des

matchs de football, les cérémonies protocolaires, les récitals de musique live et, même, les

lancements de navettes spatiales, parmi beaucoup d’autres.

A la différence du direct non-préparé dans lequel il n’y a aucun contrôle sur l’objet de

l’enregistrement en dehors de celui exercé par le sens commun et le savoir-faire du directeur

et du cameraman5, dans le direct préparé les aspects diégétiques, discursifs, profilmiques et

filmiques sont prévus à l’avance. Depuis les mouvements de la caméra, jusqu’aux formes

d’enchaînement des images et du son. Aussi bien les actions techniques que les actions

discursives sont planifiées de façon préalable6.

A la différence du direct télévisuel dans lequel toute l’action de l’objet enregistré est en

fonction de la communication télévisuelle7, dans le direct extra-télévisuel, l’action de l’objet

de l’enregistrement dépasse les limites de la communication télévisuelle. C’est-à-dire que les

buts de l’événement ne se limitent pas ni correspondent exactement aux buts télévisuels8.

5 Le direct non préparé est la couverture et enregistrement télévisuel d’un événement inattendu simultané à son

déroulement. 6 Cette planification constitue souvent une véritable esthétique et un référent de lecture. Tel est le cas de la

transmission des matchs de football dont les niveaux de plans et les angles de prise de vues standardisés (similaires dans la plus grande partie du monde), nous permettent de reconnaître le type d’actions qui se déroulent sur le terrain tels qu’un coup libre, l’expulsion d’un joueur, etc.

7 La plupart des programmes enregistrés dans les études de télévision : JT, variétés, talk shows, concours, etc. correspondent à ce type d’émissions,

8 Il serait exagéré d’affirmer, par exemple, que le lancement d’une navette spatiale est conditionné par des buts télévisuels communicationnels.

n i ! f i c t i on ! n i ! r é a l i t é !

122!

De ceci on peut déduire que si le topic "récital live" correspond à un sous-ensemble dans le

topic "direct préparé extra-télévisuel", le monde diégétique qu’il permet de construire inclut,

à un même niveau d’importance, aussi bien l’action qui est objet d’enregistrement que la

médiation télévisuelle elle-même.

Le topic "récital live" est un schéma interprétatif spécifique qui permet la constitution d’un

monde (et des rapports entre les actants à son intérieur), caractérisé par les éléments

suivants :

- l’existence d’un groupe de musique qui interprète ses chansons sur un plateau.

- l’existence d’un public nombreux qui est devant ce plateau pour écouter les interprètes

et reprendre ses chansons et aussi pour danser au rythme de la musique.

- l’existence d’une médiation télévisuelle ostensive qui nous permet d’accéder à

l’interprétation du groupe et aux actions du public.

- la croyance en l’existence indépendante de ce monde par rapport à sa mise en discours.

Un direct préparé extra-télévisuel, et par extension un "récital live", a pour but de nous

représenter un fait réel ; dans ce sens, il est l’affirmation d’une réalité indépendante de la

modalité discursive qui peut être utilisée pour sa représentation (narration, monstration ou

description). Dans la mesure où le monde présenté est le monde en tant qu’il est notre

monde et non pas sa mimésis, à l’origine de l’énoncé de ces caractéristiques nous ne

pouvons que reconnaître un Je-Origine réel9.

Quels sont, dès lors, les indices diégétiques de réalité aux niveaux pro-filmique, perceptif

audiovisuel et de médiation verbale et visuelle, qui justifient l’hypothèse selon laquelle la série

1 du clip "Ex-girlfriend" est un "direct préparé extra-télévisuel"?

a. ! Niveau!profilmique!

Les intégrants du groupe No Doubt, le maquillage de la chanteuse, les micros, les instruments

de musique, un plateau, un public nombreux, des lumières dures. Voilà quelques-uns des

éléments et des espaces que l’on trouve dans la Série 1 de "Ex-girlfriend". Dans quelle mesure

la disposition et la relation qui s’établit entre les objets, les sujets et leur espace-temps, peut-

elle être un indice de la réalité ou non-réalité d’un document audiovisuel ?

Au niveau profilmique, les indices réparables pourraient être rangés sur deux niveaux

différents : d’une part, les caractéristiques de l’espace physique et la disposition des actants

à son intérieur et, d’autre part, les caractéristiques du temps de l’action.

9 Rappelons que, du point de vue phénoménologique, un énoncé de réalité feint a les mêmes caractéristiques

qu’un énoncé de réalité car il est construit à partir du Comme si de la réalité. A la différence de la fiction qui est mimésis de la réalité, l’énoncé de réalité feint est mimésis de l’énoncé de la réalité et, donc, il n’est pas possible de distinguer l’un de l’autre, sauf en partant d’informations extra-phénoménologiques.

! u n ! d r ô l e ! d e ! g en r e !

123 !

En premier lieu, la série 1 du clip "Ex-girlfriend" nous présente un espace physique restreint à

un plateau et aux gradins d’un espace public. Dans cet espace fermé (du point de vue

scénographique), la disposition des actants et des objets est la même que celle que nous

pouvons trouver et reconnaître dans la plupart des récitals live des groupes de musique

moderne : le groupe se place devant le public sur un plateau ; le plateau est plus haut par

rapport à la surface occupée par le public, la chanteuse utilise un micro pour chanter, les

instruments de musique électroniques sont branchés à de grands haut-parleurs ; le lieu est

dans le noir à l’exception du plateau qui est éclairé à l’aide de puissants projecteurs de

lumière directe, le public nombreux est debout, on peut observer la présence d’au moins un

centaine de personnes (le noir ne permet pas de connaître les limites de l’espace et la

quantité de gens rassemblés), évidemment, le public est jeune.

Par rapport à cet espace, aux sujets et aux objets qui s’y trouvent, il n’est pas possible de

dire de manière catégorique s’il s’agit de réalité ou de fiction. Pourtant, dans la mesure où le

niveau profilmique n’inclut pas d’éléments spatiaux ou objectaux fantastiques ou

anachroniques qui constitueraient des indices forts de fiction10, ils sont analogues à l’espace

et aux relations que l’on trouve dans notre réalité.

C’est-à-dire que les éléments spatiaux et scénographiques de la série 1 sont similaires à ceux

que nous pouvons trouver dans un vrai récital live.

Deuxièmement, dans cette série, le temps de l’action et le temps de notre perception nous

sont présentés comme étant identiques. Cette identité temporelle dépend de la continuité

de la chanson et de son interprétation.

La chanson est exécutée de manière complète et sans interruption temporelle, sans coupure

ni ellipse dans la bande son. Les interruptions de l’image de la série 1 par le montage

parallèle avec les images de la série 2 ne jouent pas sur la continuité de l’action d’exécution

de la chanson ni sur la bande son. Ces interruptions fonctionnent comme des inserts d’image

qui sont réalisés pendant que le groupe interprète le thème musical. C’est-à-dire, l’action

d’exécution du thème musical est réalisée dans un temps analogue au nôtre, comme le sont

les 105 minutes que dure un match de football et sa transmission (sans compter les temps

ajouté par l’arbitre) et non comme les 5 minutes qui résument les meilleurs moments du

match. Dans la série 1 d’“Ex-girlfriend", l’action est réalisée pendant le temps de la chanson,

qui est le temps de l’action. Un temps similaire à celui dont nous avons besoin pour l’écouter

entièrement, c’est-à-dire, un temps réel11.

10 Tel est le cas du récital insert dans le film "La guerre des galaxies", où l’ensemble des éléments

scénographiques est celui d’un concert live, à un détail près : les musiciens qui sont sur un plateau sont des êtres extra-terrestres.

11 Une action en temps réel dans un film de fiction nous renvoie à la réalité de l’expérience de l’action, alors que une ellipse à l’intérieur d’un documentaire nous renvoie aux modalités du récit qui sont différentes de notre expérience temporelle.

n i ! f i c t i on ! n i ! r é a l i t é !

124!

Au niveau des grands segments (rapport entre différentes scènes d’un audiovisuel) les

contractions et les dilatations du temps sont un procédé de récit utilisé indistinctement en

fiction ou dans les documentaires authentifiants. Par contre, l’action en temps réel est peu

fréquente dans la fiction classique de grande consommation. De là, le rêve de Julio Cortazar

de voir le film d’un coucher du soleil en temps réel. En ce qui concerne le mode

authentifiant, seul dans les programmes en direct, le temps de l’action et celui de la

réception sont analogues12.

San vouloir être catégoriques, ces deux éléments du niveau profilmique, l’analogie de

l’espace et du temps de la série 1 du vidéo-clip par rapport à notre espace et à notre temps,

nous semblent des indices de réalité13. Par contre, si l’espace était un lieu habité par des

sirènes sensuelles dans les profondeurs de l’océan, comme c’est le cas du clip "She Bangs"

(Sound loaded, 2001) du chanteur portoricain Ricky Martin, ou si le temps était circulaire et

les mêmes événements se répétaient à l’infini et de manière identique, comme dans le clip

"Seven days" (Seven days , 2000) du chanteur anglais Craigt David, les indices seraient

fortement fictionnels, sans pouvoir être pour autant ni fermes ni catégoriques.

Au niveau profilmique de la série 1 du clip "Ex-girlfriend", les éléments spatiaux et temporels

que nous pouvons reconnaître permettent de déduire une plus grande pertinence de réalité

que de fiction. C’est ce que des auteurs comme Metz (: 1972) et Chateau (: 1986) appellent

"effet de réel".

L’"effet de réel" ne s’oppose pas à la fiction mais à l’"effet de réalité". La distinction entre ces

deux termes est donnée par la nature même de l’énonciation audiovisuelle. Étant donné

que l’énonciation audiovisuelle se matérialise dans les médiations verbale, visuelle et sonore,

elle est une imitation iconique fondée sur l’analogie qui existe entre notre monde d’images

et de sons et sa représentation médiatique audiovisuelle. Par ailleurs, l’"effet de réalité" ou

"vraisemblable" se réfère à la construction d’un univers diégétique symbolique, cohérent et

analogue au nôtre.

b. ! Niveau!perceptif !audiovisuel !

Le visage de la chanteuse, le groupe, un survol du public et du plateau, des couleurs

saturées, la régularité du son. Comment percevons-nous l’image et le son dans la série 1

d’"Ex-girlfriend" ?

Les caractéristiques de l’image et du son peuvent contenir aussi des indices du mode

d’énonciation, étant donné que non seulement elles constituent le matériau plastique

12 Cette analogie ne se réfère pas nécessairement à la simultanéité. 13 Cette affirmation ne peut pas être interprétée dans le sens où les indices de réalité supposeraient

nécessairement un Je-Origine réel. Sauf en ce qui concerne les genres fictionnels fantastiques ou ceux qui situent la diégèse dans un espace et un temps différents des nôtres, la plupart des documents de fiction reposent sur la construction d’un monde analogue au nôtre.

! u n ! d r ô l e ! d e ! g en r e !

125 !

fondamental de la communication télévisuelle, mais elles sont aussi à la base de notre

relation, en tant que spectateurs, avec ce qui nous est donné à voir et à entendre à la

télévision.

Les indices au niveau audiovisuel peuvent être rangés en deux catégories : d’une part, le

statut perceptif de l’image et du son (occularisation et auricularisation) et, d’autre part, le

degré d’opacité ou de transparence technique de l’image et du son (voir chapitre IV).

L’ensemble des images de la série 1 du clip étudié est perçu de l’extérieur de l’action des

sujets et des objets. A aucun moment l’image ne correspond à quelque chose qu’un actant

quelconque voit, subjectivement. C’est-à-dire que l’image ne se fixe pas dans le regard des

actants. C’est ce que Jost appelle occularisation zéro.

Rappelons que le régime perceptif visuel de l’occularisation zéro s’oppose à l’occularisation

interne primaire, laquelle, par besoin ou par choix d’une modalité discursive, demande de

« rentrer dans le regard » d’un personnage pour le développement de l’intrigue. C’est le

procédé du récit audiovisuel dans lequel le regard qui perçoit correspond au regard

subjectif (interne) d’un personnage. Lorsque nous sommes en présence d’une occularisation

interne primaire, il ne peut s’agir que de fiction ou d’un mode fictionnel inséré dans un mode

authentifiant. Tel est le cas des reconstitutions des faits divers que l’on voit dans les reality

shows, dans lesquels la caméra assume le regard de l’assassin, de la victime, du témoin ou

de l’enquêteur14. Très différent est le cas, par exemple, d’une image documentaire dont les

tremblements et les mouvements brusques renvoient à la présence du cameraman ; dans ce

cas, l’image ne nous renvoie pas au regard d’un personnage du récit mais au dispositif

technique de médiation que le professionnel utilise pour l’enregistrement et aux conditions

de sa performance. La condition d’une occularisation interne primaire est celle du respect

de la diégèse et de la transparence énonciative.

De manière générale, l’occularisation zéro n’est pas un indice de la réalité de l’énonciation,

étant donné qu’elle peut nous renvoyer aussi bien à la fiction qu’à un document

authentifiant. Pourtant, nous pouvons constater, en approchant le phénomène de plus près,

que dans la série 1 le régime perceptif est celui de l’occularisation zéro à «vocation

opaque », ce qui nous renvoie de préférence à un mode d’énonciation authentifiant.

Dans la série 1 du clip "Ex-girlfriend", la mise en évidence des moyens techniques à travers

l’image et le son peut être appréciée dans le type de prise d’angle et de déplacement de

l’image par rapport aux objets enregistrés, car ceux-ci ne correspondent pas à ceux d’un

observateur neutre qui n’agit pas sur l’objet filmé ni attend que les faits se racontent par eux-

mêmes. Au contraire, en s’approchant à des distances minimes, en se plaçant au-dessus des

14 Chaque fois que l’on inclut ce type de procédés narratifs dans le mode authentifiant, on prend la précaution

de signaler son caractère non-réel à travers l’appellation explicite de “reconstitution”. Au cas contraire, on transgresse la promesse d’authenticité et l’ensemble de l’émission pourrait être questionnée. C’est ainsi que,

n i ! f i c t i on ! n i ! r é a l i t é !

126!

actants, en bougeant dans l’air comme si elle volait, l’image se réaffirme dans sa qualité

expressive. L’image est produite par "quelqu’un"15 qui est indépendant et autonome par

rapport aux actants qui sont objet de l’enregistrement.

Pourtant, l’ostension des moyens techniques soit par leur monstration directe (caméras,

micros, lumières, personnel technique hors champ dans les journaux télévisés), soit par leur

monstration indirecte (angles de prises de vue, mouvements ou emplacements de caméra),

n’est pas la seule forme que peut prendre l’opacité technique dans un régime

d’occularisation zéro. La démonstration du dispositif à travers l'adresse à la caméra du

présentateur, du speaker ou de l’acteur – dans le cas de la fiction – est une forme

d’ostension tout aussi importante, voire encore plus importante, qui nous renvoie non

seulement aux moyens techniques qui interviennent dans la médiation visuelle mais aussi à la

figure énonciative du médiateur verbal.

Comme nous avons vu dans le chapitre antérieur, une des frontières les plus importantes

entre le mode fictionnel et le mode authentifiant est l'adresse à la caméra. A la différence

ce qui se passe avec l’occularisation interne, dans laquelle le regard frontal est un regard

diégétique16, étant donné qu’il ne met pas en évidence le dispositif audiovisuel (c’est le

regard du personnage dans un miroir vu à partir de son regard ou le regard d’un autre

dans la plupart des pays, il y a une régulation légale de l’insertion d’images fictionnelles ou publicitaires à l’intérieur d’un programme authentifiant.

15 Ce “ quelqu’un ” peut être un sujet concret (le réalisateur, le caméraman, etc.) ou une institution (la télévision en général, la chaîne, etc.). Nous reviendrons plus tard sur ce point.

16 Nous verrons les procédés de construction d’une occularisation interne dans le détail lors de l’analyse de la série 2 de ce clip. Voir A.2.

! u n ! d r ô l e ! d e ! g en r e !

127 !

personnage qui fait face au regard du personnage dans l’occularisation interne), le regard

frontal en régime d’occularisation zéro est une adresse à caméra qui fonctionne soit comme

une rupture dans la diégèse par l’intromission de notre monde dans le monde fictionnel, soit

comme une réaffirmation de la réalité de l’émission par la démonstration des moyens

techniques. Le présentateur ou l’acteur nous interpellent et mettent ainsi en évidence le

dispositif de médiation et l’énonciation audiovisuelle elle-même.

Alors que l’opacité de l’acte de médiation fonctionne, dans la fiction, comme une rupture

dans la diégèse, c’est-à-dire comme une incohérence, une erreur ou comme une

énonciation de réalité insérée ex profeso dans le monde créé par et pour le récit – une

intromission d’un Je-Origine réel dans l’intrigue – dans le mode authentifiant, au contraire,

l’opacité de la médiation est une réaffirmation du caractère réel de l’énonciation.

Dans les deux cas, mode fictionnel et mode authentifiant, l'adresse à la caméra fonctionne

comme un important indice de réalité qui nous renvoie, nécessairement, à un sujet

d’énonciation historique qui nous regarde et nous parle à la première personne à partir de sa

condition de Je-Origine réel.

Si l’occularisation interne primaire est un indice important de fiction, le regard à la caméra

dans l’occularisation zéro est un indice fort de réalité de l’énonciation audiovisuelle ou de sa

mimésis, un énoncé de réalité feint.

Suivant ce raisonnement, au niveau de l’image de cette série du clip, le régime perceptif

correspond à une occularisation zéro à "vocation opaque", donnée par l'adresse à la

caméra, comme dans la plupart des programmes de mode authentifiant de la télévision et,

dans ce cas, il y a tout lieu de considérer pertinente, ici, la construction des hypothèses de

réalité de l’acte d’énonciation.

Si les images que nous voyons sont celles du mode authentifiant, le son devrait être perçu de

manière cohérente avec ce mode d’énonciation précis.

Dans la série 1 du clip "Ex-girlfriend", le son (la musique et la voix de la chanteuse) ne subit

aucune variation ni qualitative ni quantitative (volume, qualité acoustique, écho, etc.) selon

que l’image nous montre de loin le plateau sur lequel le son du clip est produit ou le visage

en gros plan de la chanteuse. Cette homogénéité du son écarte, de manière radicale, la

possibilité d’ancrage perceptuel dans un sujet intradiégétique. C’est-à-dire qu’il n’est pas

possible de déduire une auricularisation interne de la bande son de la série 1.

L’homogénéité du son dans la série 1 du clip fait clairement référence à une auricularisation

zéro à "vocation opaque" puisque la perception du son ne varie pas en fonction du

positionnement de l’image (près ou loin de la source du son) mais reste, au contraire,

uniforme. Cette incohérence perceptive entre le positionnement visuel et le positionnement

sonore rend opaque le dispositif audiovisuel d’enregistrement du son, puisque plutôt que

d’ancrer la perception du son dans un personnage ou dans la position de l’image, il le fait

n i ! f i c t i on ! n i ! r é a l i t é !

128!

dans le dispositif d’enregistrement sonore. Cela arrive souvent dans les reportages ou dans

les comptes-rendus journalistiques au cours desquels nous pouvons entendre parfaitement le

récit du journaliste alors que l’image nous montre une panoramique du lieu où il se trouve et

que nous ne pouvons identifier l’image que lorsque la caméra s’approche de lui au moyen

d’un puissant zoom in17.

Comme c’est le cas pour le régime perceptif de l’image, l’auricularisation zéro à "vocation

opaque" n’est pas un indice incontestable de réalité mais marque plutôt une tendance : elle

contribue à la production d’un effet de réalité.

Pourtant, du point de vue des caractéristiques de l’image et du son, il y a un élément qui

peut sembler incohérent dans la construction d’un direct préparé extra-télévisuel "récital

live" : l’absence du son du public.

Cette incohérence de la série 1 de la catégorie direct préparé extra-télévisuel peut avoir, au

moins, deux types de lectures polarisées, qui ne peuvent s’appuyer que sur les savoirs et les

croyances du spectateur. D’une part, elle peut être conçue comme une rupture du

vraisemblable et donc comme une évidence de sa qualité de non réel (fictionnel ou feint)

mais elle peut aussi être considérée comme une volonté technique d’élimination du son du

public. Le choix entre ces deux possibilités est directement lié aux savoirs et aux croyances du

téléspectateur : s’il sait que ce type de procédés techniques (élimination d’un segment

spécifique et délimité du son) est possible, il pourra en déduire que c’est pour cette raison

qu’"on n’entend pas" le public (soit par erreur ou par volonté discursive du réalisateur). Si, par

contre, il n’est pas au courant de cette possibilité technique, il est probable qu’il mettra en

doute la véracité du récital.

Nous laisserons en suspend cette incohérence pour le moment car, comme nous le verrons

plus tard, cet élément ne jouera pas de manière importante dans l’interprétation globale de

l’acte énonciatif du clip "Ex-girlfriend", même en le considérant comme indice de non-réalité.

Ainsi, les deux aspects perceptivo-audiovisuels soulignés pour la série 1 d’"Ex-girlfriend",

l’occularisation-auricularisation zéro et l’opacité technique, sont deux éléments importants

dans la production d’un "effet de réalité" mais ils n’excluent pas, de façon précise, la fiction.

Ce qui opère comme un indice puissant de la réalité de l’énonciation dans la série 1 du clip

"Ex-girlfriend" est l’inclusion du regard vers la caméra dans le régime d’occularisation zéro.

Le regard à la caméra est non seulement un indice de réalité mais il met aussi en évidence

l’opposition entre deux niveaux différents de médiation dans cette série du clip : la médiation

17 Si la voix que nous entendons n’a pas un référent humain dans l’image, elle peut être interprétée comme une

voix over et renvoyée ainsi à un narrateur homo ou hétérodiégétique dont le caractère serait incertain. Dans ce cas, la voix est ancrée dans la figure du speaker et nous renvoie, donc, au dispositif télévisuel et à la figure d’un Je-Origine réel.

! u n ! d r ô l e ! d e ! g en r e !

129 !

visuelle, soulignée par l’opacité technique du dispositif et par sa démonstration, et la

médiation verbale, mise en jeu par la chanteuse qui chante pour nous.

c. ! Niveau!de!la !responsabilité !énonciative. !

La série 1 du clip commence par un plan serré sur le visage de Gwen Stephani qui chante le

thème "Ex-girlfriend" devant un micro en regardant une caméra. Ensuite, peu à peu, à

mesure que le rythme de la musique s’intensifie, la dimension des plans s’élargit : nous voyons

les autres membres du groupe jouant chacun un instrument différent. Par la suite, plusieurs

plans d’ensemble nous informent qu’il s’agit d’un spectacle en direct : nous voyons le public

sauter et danser au rythme de la musique. Après cela, une série de plans des membres du

groupe et du public. Pendant tout ce temps, nous entendons la musique et les paroles de la

chanson chantées par la chanteuse. Elle nous raconte une déception amoureuse. Pour finir,

le plan se serre à nouveau sur le visage de la chanteuse qui regarde la caméra.

Que s’est-il passé ? Que nous a-t-il été donné à connaître?

Une chanson a été interprétée par les membres du groupe No Doubt, sur un plateau, devant

un public nombreux. Cela veut dire que nous avons vu et entendu cette interprétation-là.

Plus précisément : on nous a donné à voir et à entendre l’interprétation.

Toute émission télévisée est concrétisée, au moins, par des images et des mots18 et nous est,

donc, présentée de manière combinée, aussi bien par une médiation visuelle que par une

médiation verbale.

Comme nous l’avons vu dans le point précédent, le rapport que s’établit entre ces deux

types de médiation est clairement perceptible à partir de la mise en évidence du dispositif

scénique de médiation audiovisuel, soit par la monstration des moyens techniques soit par

leur démonstration à travers le regard à la caméra. Au contraire, dans un régime de

transparence du dispositif, la perception de la médiation est minime.

Voyons maintenant les caractéristiques des médiations visuelle et verbale dans la série 1 du

clip :

1) Au niveau visuel de la série 1 du clip, il n’y a pratiquement pas de narration.

L’enchaînement des images ne configure pas autre chose qu’un syntagme descriptif : un

visage, le corps entier, le groupe, un plateau, le public. La chanteuse chante, les

musiciens jouent leurs instruments, le public danse. L’action est la même pendant toute la

série 1. Le début et la fin similaires conduiraient à penser que le seul changement serait

que la chanson a été interprétée et pour cela il n’y a pas besoin d’une mise en intrigue :

le réel n’a pas été transformé.

18 Nous verrons plus loin la place qu’occupe la médiation musicale dans ce clip.

n i ! f i c t i on ! n i ! r é a l i t é !

130!

Du point de vue de la médiation visuelle, l’objectif communicationnel de la série 1 n’est

pas de nous raconter une histoire, étant donné que :

"Toute histoire nécessite au moins l'intervention de deux sujets antagonistes (un sujet et un

anti-sujet) et de deux structures actantielles complètes (l'une pour le sujet, l'autre pour l'anti-

sujet)". (Odin, R, 1988, p. 124).

Pourtant, la série 1 ne se limite pas non plus à nous montrer l’interprétation d’une chanson

par un groupe de musique, comme dans les variétés télévisées. Dans ces émissions, le

chanteur ou le groupe, en jouant en direct ou en faisant du play back sont présentés tels

que nous le verrions si nous étions assis dans les gradins du studio de télévision.

Dans le cas qui nous occupe ici, au contraire, le dispositif technique est au service d’une

intention discursive, sans qu’elle soit nécessairement narrative, puisque la modalité

discursive mise en œuvre n’est pas celle de la narration mais celle de la description.

Faible degré de narrativité, donc, contrairement à une description ostensive, puisqu’elle

nous donne à observer, à entendre et à connaître davantage et mieux que si nous nous

trouvions parmi le public du récital. Dans ce cas, l’acte de décrire ne se limite pas,

comme dans la panoramique, à nous informer sur les aspects généraux d’un événement.

Au contraire, il utilise tous les moyens techniques dont il dispose pour nous donner les

détails des actions d’interprétation de la chanson et du contexte, au point de nous placer

au-dessus, à l’arrière et si près de l’action et des musiciens que nous pouvons voir la petite

larme dessinée avec du rimmel sur la joue de la chanteuse ou les doigts qui font vibrer les

cordes de la basse.

"De même qu'une affirmation comporte une garantie tacite de vérité, une ostension

comporte une garantie tacite de pertinence" (Sperber et Willson, 1989, p. 81).

Cette description ostensive rend opaque l’acte de médiation visuelle et la

communication télévisuelle elle-même, puisque, dans la mesure où elle dépend d’un

savoir technique audiovisuel et d’une opération de sélection et de combinaison

intentionnelle, elle dévoile la figure anthropoïde d’un descripteur : un sujet d’énonciation,

puisqu’il construit des énoncés audiovisuels avec une intention informative qui est, dans

ce cas, celle de décrire.

L’externalité et la distance existante entre l’acte de la description que réalise ce sujet

d’énonciation, caractérisée par une occularisation zéro et une focalisation externe, et

l’action décrite, qui est réalisée par la chanteuse, le groupe et le public, le configurent

comme sujet d’énonciation théorique (Hamburger, K, 1986, p. 209), du fait que, dans

l’action de décrire, il n’engage pas son individualité comme personne.

! u n ! d r ô l e ! d e ! g en r e !

131 !

2) Au niveau verbal : Par ailleurs, la seule narration que l’on puisse extraire de ce segment du

clip est celle contenue dans les paroles de la chanson19 interprétée par la chanteuse.

Pourtant, là aussi le degré de narrativité est minime. Il se limite à la description d’une

situation ponctuelle et à l’expression du désenchantement et de la rage que ressent une

jeune fille abandonnée par son amoureux. La circularité du récit, soulignée par le refrain,

ne permet pas le développement d’une intrigue et encore moins sa clôture.

Du point de vue verbal, le récit dans la série 1 constitue un régime cognitif de focalisation

interne. C’est le sujet d’énonciation lui-même qui nous raconte son expérience de vie et

qui partage avec nous son environnement cognitif, auquel nous accédons dans la

mesure où il nous en fait part à travers son récit.

L’utilisation de la première personne dans la modalité discursive à focalisation interne est

un élément de plus qui conduit à identifier le mode d’énonciation de la série 1 comme un

mode authentifiant puisque, comme nous l’avons vu dans le chapitre précédent, d’après

Käte Hamburger, le récit à la première personne renvoie nécessairement à un Je-Origine

réel20, à un sujet d’énonciation qui, pour le moment, nous appellerons "historique". Le Je

est le moins fictionnel des pronoms puisque :

"Le récit à la première personne prétend raconter non seulement le monde comme

expérience du Je, mais aussi le monde lui-même, comme une réalité indépendante du Je à

laquelle celui-ci est confronté". (Hamburger, K, 1986, p. 289)

Ainsi, ce qui nous est donné à connaître à travers les paroles de la chanson chantée par la

chanteuse nous est présenté comme une expérience vécue par la chanteuse,

expérience subjective que nous reconnaissons, dès lors, comme réelle.

Si le récit (la chanson) à la première personne du genre féminin est suffisante pour constituer

un sujet d’énonciation historique, la présence dans l’image et dans le son de la chanteuse

qui chante les paroles de la chanson en regardant la caméra, est un indice puissant de

son caractère réel.

Ce sujet d’énonciation qui chante représente un pôle d’énonciation différent et opposé au

sujet d’énonciation qui nous décrit en images l’interprétation de la chanson par la

chanteuse et par le groupe sur un plateau.

Deux instances énonciatives qui interagissent ici, dans ce clip, et dans n’importe quel

programme télévisé.

Dans ce segment du clip, ces instances énonciatives correspondent concrètement à :

19 Voir paroles de la chanson, Tableau 4. 20 Hamburger, K, 1986, p. 274 et suivantes.

n i ! f i c t i on ! n i ! r é a l i t é !

132!

- d’une part, la figure anthropoïde que nous appellerons de manière générique

"réalisateur"21 , responsable de l’énonciation audiovisuelle, c’est-à-dire celle qui accomplit

la tâche énonciative de mettre l’action en images et en son, décidant aussi bien des

caractéristiques de l’image et du son que de sa séquentialité et de son enchaînement en

fonction d’une intentionnalité communicative ;

- d’autre part, la figure humaine qui est souvent représentée par le speaker, le

présentateur ou, comme dans ce cas, par la chanteuse22, dont la tâche est de décider la

combinaison et la sélection des mots en fonction d’une intentionnalité communicative ou,

selon les termes de Searle, l’instance capable de produire des actes de langage en

ajustant le monde et les mots23.

Deux instances énonciatives, intimement liées mais inégales, différentes dans leurs buts

communicationnels et dans leur degré de responsabilité énonciative par rapport à

l’énonciation.

Tandis que le sujet d’énonciation historique24 - la chanteuse - nous fait connaître une

expérience du domaine de sa vie subjective (un événement biographique raconté à la

première personne et, donc, en focalisation interne), le sujet d’énonciation théorique25 - le

réalisateur - nous décrit l’action du sujet d’énonciation historique (un événement de valeur

objective décrit en occularisation zéro et en focalisation externe).

Ceci pourrait porter à croire que si le sujet d’énonciation théorique se trouve dans le lieu de

l’événement, c’est seulement pour transmettre ce que le sujet d’énonciation historique a à

nous communiquer. En d’autres mots, que le réalisateur, et avec lui tout le dispositif télévisé,

accomplit seulement la fonction de lien entre l’énonciation de la chanteuse et notre

compréhension télévisuelle.

Pourtant, l’ensemble des opérations de sélection et de combinaison d’images désignent le

réalisateur comme un véritable sujet d’énonciation qui agit en intervenant

intentionnellement.

Même si cela peut sembler paradoxal, l’ostension du dispositif audiovisuel et la présence

incontestable du sujet d’énonciation théorique, représenté par la figure anthropoïde du

21 Bien que le terme “ réalisateur ” ne rend pas compte du degré d’intervention énonciative de l’ensemble des

opérateurs audiovisuels qui participent, à des degrés variables, à l’énonciation télévisuelle (caméramen, techniciens de son, scénographes, éditeurs, etc.) elle nous permet de focaliser l’intention communicative globale de l’acte énonciatif que véhicule un document télévisé particulier.

22 La prédominance de la chanteuse sur l’ensemble du groupe vient déterminée, aussi, par l’utilisation de la première personne du genre féminin.

23 Searle, J.R, Sens et expression, Paris, Les Éditions de Minuit, 1982. 24 Sujet d’énonciation historique: Sujet d’énonciation déterminé et individuel , Hamburger, K, Op. cit. p. 84. 25 Sujet d’énonciation théorique celui qui “ (...) n'a que le caractère de une généralité transindividuelle ” Op.

cit., p. 209.

! u n ! d r ô l e ! d e ! g en r e !

133 !

réalisateur, ne renvoie pas à l’énonciation du réalisateur mais, de manière insistante, à

l’action énonciative de la chanteuse.

Pourquoi les deux énonciations ne se superposent-elles pas ? Pourquoi la médiation visuelle

nous semble-t-elle transparente malgré son ostension ?

Il n’est pas difficile d’établir les énormes similitudes dans la médiation visuelle utilisée par les

journaux télévisés des différents pays à travers le monde : occularisation zéro, focalisation

externe, l'adresse à la caméra du présentateur en plan moyen, monstration des moyens

techniques télévisuels. Ce n’est qu’à partir de la rupture de cette standardisation visuelle que

nous pourrons prendre conscience du fait que la médiation visuelle a une composante

énonciative importante. Tel est le cas du JT de R.T.L. qui, pendant la période de l’année 2001,

a été réalisé en gros plan (et non pas en plan moyen) et, en plus, du point de vue latéral, ce

qui obligeait le présentateur à tourner son visage vers la caméra, c’est-à-dire qu’il n’était pas

placé de manière frontale à la caméra comme la plupart des présentateurs des JT.

Cette caractéristique de transparence énonciative au niveau visuel, malgré l’opacité et la

monstration des moyens techniques, constitue une caractéristique distinctive de la

communication télévisuelle actuelle. A la différence du cinéma, dominé largement par la

fiction classique et donc par la transparence du dispositif technique, la télévision, obligée à

mélanger et à combiner les genres et les modes énonciatives les plus divers, a généré non

seulement une esthétique de l’ostension technique mais, aussi et surtout, une capacité de

représentation propre, différente de celle utilisée par les autres médias (phénomène que

Philippe Marion appelle médiativité26), l’opacité et l’ostension devenant ainsi un élément

central de la communication proprement télévisuelle.

De même que pour le JT, nous attendons d’un direct préparé extra-télévisuel une certaine

mise en scène visuelle caractéristique et des procédés de monstration précis. Par exemple, la

transmission d’un match de football avec une ou deux caméras seulement sans la répétition

des buts ou des échanges polémiques (de préférence au ralenti), serait actuellement

inconcevable. Cette monstration ou description ostensive fait partie des attentes du

téléspectateur et, donc, seul sa transgression, par excès ou par absence, la rend opaques à

la cognition et à la perception au niveau de la réception.

Ainsi, la transmission télévisée d’un concert de musique pop en direct, nous met en situation

d’attendre une certaine configuration visuelle et technique qui se caractérise

principalement par les éléments suivants : variété visuelle obtenue en utilisant des plans, des

angles, des mouvements de caméra peu fréquents (prises de vue aériennes, cadrages

renversés, mouvements brusques, entre autres) ; possibilité de voir et d’entendre mieux que

des gradins (son homogène de haute fidélité, plans de détail et gros plans) ; enchaînement

rythmé des images (montage en rapport avec la pulsionnalité rythmique de la musique

26 Marion, P, 1997, pp. 77 à 87.

n i ! f i c t i on ! n i ! r é a l i t é !

134!

interprétée) ; absence de commentaire in ou over qui puisse interrompre l’audition et la

vision de l’interprétation des thèmes musicaux.

C’est exactement ce que fait le réalisateur de la série 1 du clip "Ex-girlfriend".

C’est ainsi que l’énonciation du sujet d’énonciation historique semble primer sur celle du sujet

d’énonciation théorique et, malgré l’opacité du dispositif, la transparence énonciative du

réalisateur s’impose. Ce serait différent s’il s’agissait d’un montage "stroboscopique" dans

lequel l’image télévisuelle perd son caractère de représentation pour se transformer en

éclats de lumière ou, à l’autre extrême, l’utilisation exclusive d’un seul type de cadrage en

caméra fixe. Ces deux situations, de moins en moins fréquentes à la télévision, sont des excès

ou des insuffisances par rapport à ce que la télévision et ses téléspectateurs ont instauré

comme standard de médiation et de réception pour un direct préparé extra-télévisuel

"récital live".

d. ! Synthèse!

La série 1 nous apparaît, du point de vue phénoménologique, comme un direct préparé

extra-télévisuel. Il est impossible (et inutile) d’élucider si l’interprétation du thème musical par

le groupe que nous voyons et entendons au petit écran, est un enregistrement en direct ou

la mise en scène planifiée de la mimésis de l’enregistrement d’un récital live. Comme pour

l’énoncé de réalité feint, la construction d’un univers diégétique propre à l’énoncé de réalité

nous permet seulement de déduire qu’à l’origine de la série 1 il y a un sujet d’énonciation

réelle.

Aussi bien au niveau profilmique (analogie de l’espace et du temps avec notre espace et

notre temps), qu’au niveau perceptif (regard à la caméra en occularisation zéro), cognitif

(focalisation externe) et de médiation verbale et visuelle (responsabilité énonciative d’un Je-

Origine réel), nous avons pu établir que la série 1 du clip "Ex-girlfriend" correspond non

seulement au mode authentifiant mais, plus spécifiquement, à un direct préparé télévisuel

"récital live".

Voyons maintenant ce qui concerne la série 2 du clip.

2.! UNE! HISTOIRE! D'AGENTS! SECRETS! ET! DES! MAFIEUX!: ! LA! CONSTRUCTION!D'UN!MONDE!DIEGETIQUE!FICTIONNEL!(SERIE!2)!

Nous allons établir maintenant le mode d'énonciation dans lequel peut être catégorisée la Série 2 du vidéo-clip "Ex-girlfriend", du point de vue des indices que l'on peut repérer à partir de l'opération de diégétisation que suppose le mode d'effectuation matérielle de la médiation télévisuelle.

! u n ! d r ô l e ! d e ! g en r e !

135 !

La série 2 du clip "Ex-girlfriend" est celle qui raconte une histoire. L’héroïne, l’antihéros et

l’intrigue qui conduit l’héroïne à réaliser une opération clandestine pour éliminer l’antihéros,

son ex-petite amie.

Mais quels sont les indices qui nous permettent de déduire, sur le plan de la médiation

visuelle, le caractère fictionnel du mode d'énonciation propre à la série 2 du clip "Ex-

girlfriend" ?

Un élément qui conduit à cette déduction est la forme concrète de la médiation télévisuelle

mise en œuvre dans ce segment du clip, qui nous est présenté comme une intrigue qui se

déroule dans le topic fictionnel "agents secrets et mafieux".

Comme nous l’avons dit, un topic fonctionne, au niveau de la réception, comme un outil

interprétatif qui permet au téléspectateur de lier l’ensemble des éléments textuels et des

éléments absents du récit qui peuvent en être déduits, pour construire un monde en se

basant sur la pertinence des informations visuelles, verbales et sonores contenues dans une

émission télévisée.

Le topic "agents secrets et mafieux", utilisé massivement dans la fiction télévisuelle et filmique

(Mission Impossible, Super-agent 86, Miami Vice,…) est un schéma interprétatif spécifique qui

permet la construction d’un monde (et des rapports entre les actants à son intérieur)

caractérisé par les éléments suivants :

- existence d’une organisation criminelle qui développe des actions clandestines illégales.

- existence d’une organisation légale, secrète et hiérarchisée qui réalise des opérations

clandestines légales destinées à démanteler l’organisation criminelle et/ou protéger l'État.

- existence de mafieux avec beaucoup de pouvoir et de protections.

- existence d’agents spécialisés avec capacité opérationnelle dans le domaine de la

défense.

- existence d’un héros avec lequel on cherche à identifier les spectateurs, à travers le récit.

- existence d’un antihéros qui pousse le héros à l’action.

- existence d’une relation antagonique entre le héros et l’antihéros.

Mais bien qu’un monde diégétique érigé à partir de ces éléments incite plutôt à construire

une hypothèse de monde énonciatif fictionnel pour cette série, cela ne doit pas être

nécessairement ainsi. L’existence d’organisations secrètes de sûreté qui développent des

actions clandestines contre le crime organisé est aussi (et avant sa mimésis fictionnelle) une

réalité de notre monde. Bien que cela soit peu habituel, le cinéma de propagande peut

appeler aux mêmes éléments et relations que ceux que nous pouvons trouver ici27.

27 Le cinéma de propagande politique, principalement celui développé pendant la guerre froide, n ‘est pas

construit dans l’axe du comme si de la réalité. C’est-à-dire qu’il n’est pas fictionnel dans la mesure où il

n i ! f i c t i on ! n i ! r é a l i t é !

136!

Il y a, pourtant, un élément diégétique plus général qui est central pour l’interprétation de

cette série comme fiction.

Si bien un topic "agents secrets et mafieux" n’implique pas nécessairement en soi un mode

d’énonciation fictionnel, le fait qu’il nous soit présenté dans la modalité discursive propre à

l’opéra, constitue un indice puissant de fictionnalité du mode d’énonciation dans la série 2.

La différence fondamentale entre l’opéra et toute autre forme de représentation discursive

c’est que la narration et les dialogues y sont présentés sous la forme de chansons chantées

par le ou les personnage(s). Ainsi, les formes de communication et d’énonciation des actants

ne sont pas analogues à celles que nous utilisons dans la réalité.

Un topic "agents secrets et mafieux" présenté sous la forme d’un opéra, ne peut que

constituer un monde diégétique fictionnel, puisque le monde possible représenté, même s’il

est logiquement similaire au nôtre, il ne l’est pas au niveau communicationnel.

Passons maintenant à l’analyse des indices qui nous permettent de déduire la fictionnalité du

récit, correspondant au topic "agents secrets et mafieux", dans la série 2 du clip Ex-girlfriend.

a. ! Niveau!profilmique!

Des feuilles qui tombent des arbres ; un parc public la journée, un appartement, un gratte-

ciel, les toilettes d’un hôtel ou un lieu similaire, une jeune femme habillée style punk, un

homme avec un paquet de chips. Voilà quelques-uns des espaces et des éléments qui se

mettent en rapport dans la série 2 du clip. Rien de ce que nous observons dans ces éléments

ni dans la relation entre eux ne nous permettrait d’affirmer que la série 2 est nécessairement

une fiction.

En termes généraux, l’espace et le temps qui se configurent dans la série 2, sans être

complètement analogues aux nôtres, ne permettent pas, par eux-mêmes, de déduire un

mode fictionnel dans ce document, mais aucun des éléments présents a un caractère

fantastique ou anachronique. Comme nous l’avons dit, la réalité est la matière première de

la fiction, laquelle se construit, la plupart du temps, à partir des mêmes éléments que nous

pouvons trouver dans la réalité.

A la différence de ce qui se passe dans une série de science-fiction futuriste, comme "Start

Treck", dans lequel ni les éléments spatiaux ou objectaux, ni les personnages eux-mêmes, ne

correspondent pas à ce que nous pourrions trouver dans notre réalité, le topic "agents

secrets et mafieux" de ce clip nous propose la construction d’un monde diégétique similaire

au nôtre, non seulement au niveau logique mais aussi au niveau objectal et spatial.

affirme que la réalité représentée existe indépendamment de son récit (c’est la vérité ou une version de la réalité). Cela, indépendamment du fait que les faits représentés correspondent ou non à ceux que nous considérons comme étants les faits réels.

! u n ! d r ô l e ! d e ! g en r e !

137 !

L’évidente dilatation temporelle de la scène finale du clip (voir tableau 2), dans lequel

l’héroïne et l’antihéros tombent dans le vide depuis la fenêtre d’un gratte-ciel, ne nous

permet pas non plus d’affirmer avec certitude la fictionnalité ou la réalité du niveau

profilmique de cette série. Les procédés de dilatation temporelle sont très fréquents dans les

transmissions en direct des événements sportifs. L’utilisation du ralenti et la combinaison de

caméras pour l’enregistrement de l’action sont aussi une garantie de médiation télévisuelle

correcte de l’action dans toutes les transmissions sportives.

Paradoxalement, les éléments du niveau profilmique et temporel de la série 2 sont cohérents

avec un topic non fantastique dans le mode d’énonciation fictionnel, car ils reposent sur

l’analogie du monde diégétique crée à partir du nôtre.

Si l’on se place au niveau de l’analyse profilmique, on peut affirmer seulement que la série 2

n’est pas manifestement fictionnelle.

b. ! Niveau!perceptif !audiovisuel ! !

La série 2 fonctionne, principalement, sous le régime perceptif de l’occularisation zéro, ce

qui ne nous dit pas grand chose non plus sur la réalité ou non-réalité de l’énonciation de ce

segment. Pourtant, l’inclusion de quatre séquences en occularisation interne primaire est

déterminante pour déduire le caractère fictionnel de toute cette série du clip.

Les occularisations internes primaires que nous pouvons observer correspondent à : un plan

dans lequel nous voyons la photo de l'antihéros que la protagoniste regarde ; deux flash

back, presque identiques, d’un raccord de regards entre l’antihéros et l’héroïne ; une

séquence qui contient un plan dans lequel la protagoniste se regarde dans le miroir. Dans

ces différents cas, l’image nous renvoie à une occularisation interne par la voie du raccord

de regard, le raccord de mouvements, la continuité de l’action, le regard frontal et la

transparence du dispositif scénique.

Voyons ce qui se passe lorsque la protagoniste se regarde dans le miroir. Dans cette

séquence, nous pouvons définir clairement les indices évidents qui permettent l’interprétation

d’une occularisation interne primaire.

1 2 3

La séquence se compose de trois plans : nous voyons d’abord l’héroïne, montrée à partir du

côté droit, quand elle commence à fixer une fausse moustache devant le miroir. Elle est

penchée vers le miroir et ses deux mains sont occupées à placer le postiche. Ensuite, nous la

voyons de face, réalisant la même action et dans la position décrite dans le plan précédent.

n i ! f i c t i on ! n i ! r é a l i t é !

138!

Elle a commencé à pleurer. Le raccord de mouvement entre ce plan et le premier renforce

l’impression qu’il s’agit d’une action continue. Pourtant, cette fois nous voyons l’action en

partant du regard de la protagoniste, puisqu’elle regarde en face, comme si elle se

regardait dans un miroir. Ensuite, partant du dos de la protagoniste, nous voyons sa nuque et

son visage reflété dans le miroir situé devant elle. Nous pouvons la voir pleurer tandis qu’elle

continue à placer la fausse moustache penchée sur le miroir. Une fois de plus, le raccord de

mouvement induit à interpréter une continuité dans l’action. Pendant toute la séquence,

comme pendant toute la durée du clip, la chanteuse chante et cette action est continue,

ne subit pas d’interruptions ni de variations. Les éléments profilmiques sont aussi constants

dans ce segment. Finalement, cette continuité de plans établit un raccord consistant de

regards, puisque l’action de se regarder dans le miroir que la protagoniste réalise dans les

plans premier et troisième ne subit pas de variation et permet donc de déduire que le

personnage continue à faire de même pendant le deuxième plan.

L’ensemble des éléments décrits dans cette séquence de trois plans permet la constitution

d’hypothèses puissantes et manifestes dans le sens d’identifier l’image du second plan avec

le regard de la protagoniste : raccord de regard, raccord de mouvement, continuité de

l’action, éléments profilmiques similaires, etc.

La plupart du temps, le regard à la caméra nous renvoie au dispositif technique audiovisuel,

soit parce que, dans la fiction, cela représente une rupture dans la diégèse, une rupture dans

la cohérence du monde créé par l’intromission du nôtre, soit parce que dans le documents

de réalité, le regard du sujet nous interpelle en tant que téléspectateur et renforce ainsi le

statut de réalité de l’acte communicationnel.

Pourtant, cela n’est pas le cas dans le regard au miroir de l’héroïne dans la série 2 du clip "Ex-

girlfriend". Ici son regard n’est pas un regard à la caméra – regard en tant que personne –

mais regard au miroir qui la reflète – regard en tant que personnage – et donc il est cohérent

avec la diégèse fictionnelle. Dans ce cas, le dispositif technique audiovisuel n’existe pas aux

effets de la compréhension de l’histoire racontée puisqu’il n’est pas pertinent avec

l’ensemble des informations que nous recevons. Le sujet qui regarde se regarde ainsi lui-

même, de l’intérieur de la diégèse, il ne nous interpelle pas avec son regard.

Si l’utilisation dans le récit d’une occularisation interne primaire est un indice puissant de

fictionnalité28 (puisque l’image se fixe sur le regard du personnage en nous permettant de

percevoir ce qu’il perçoit et de la manière dont il le perçoit), l’occultation intentionnelle du

dispositif de médiation et des traces de l’énonciation dans la série 2 ne peuvent que

renforcer cette hypothèse.

28 Comme nous l’avons vu précédemment, l’occularisation interne est également utilisée dans un certain type

de documents authentifiants, comme la reconstitution, mais uniquement de manière très ponctuelle et en ayant bien soin de signaler son caractère de fiction par un petit titre sur un des bords de l’image. Cette

! u n ! d r ô l e ! d e ! g en r e !

139 !

La difficulté méthodologique que pose une analyse des traces de l’énonciateur dans un

énoncé transparent, c’est qu’il se situe, apparemment, au-delà de ce qui est possible de

percevoir au niveau de la réception. Pourtant, si nous essayons de rester fidèles à une

démarche phénoménologique qui ne soit pas une simple description des phénomènes tel

qu’ils se présentent à nous mais une conception du phénomène comme symptôme ou

comme indice, nous pouvons tenter d’établir les éléments qui permettent de démontrer une

occultation intentionnelle et efficiente du dispositif télévisuel.

Cette action intentionnelle d’effacement énonciatif, qui peut être établie à partir des indices

perceptivo-audiovisuels dans la série 2, se réfère, principalement, à la construction d’un

univers perceptuel continu dans lequel le dispositif technique audiovisuel n’existe pas aux

effets de l’histoire et du monde diégétique. Ce dispositif technique audiovisuel est

totalement occulté par des procédés discursifs de l’image, tels que celui de l’occularisation

interne primaire que nous venons d’analyser et dans lesquels on cherche la pertinence d’une

interprétation qui exclue la présence du dispositif.

Un exemple d’occultation du dispositif dans la construction de l’univers perceptuel dans la

série 2 du clip, plus spécifique que l’occularisation interne primaire que nous venons de voir,

peut être observé dans les faux raccords en occularisation interne secondaire (raccord de

regards) et dans les faux raccords de mouvements (continuité de l’action). Examinons cela :

L’inclusion d’une occularisation interne secondaire n’est pas, nécessairement, un indice de

fiction en soi. La plupart des programmes de débat et ceux dans lesquels on réalise des

interviews dans le studio de télévision (directs préparés télévisuels), sont construits, au moins

en partie, dans ce régime perceptif. Ceci nous pouvons le vérifier dans les raccords de

regards et de mouvements que le directeur et les cameramen construisent à partir de

schémas plus ou moins standardisés qui ont comme base technique l’emplacement de trois

ou quatre caméras d’enregistrement coordonnées par le directeur à partir d’une table

d’édition. Pourtant, ce qui nous intéresse ce ne sont pas les éléments constitutifs du régime

perceptif de l'occularisation interne secondaire mais les indices de fictionnalité relatifs à

l’occultation du dispositif technique audiovisuel qu’elle permet de mettre en évidence.

Voyons le cas d’une occularisation interne secondaire vers la fin de la série 2 du clip :

1 2 3

indication explicite du caractère non-réel de la reconstitution est une manière de réaffirmer, par opposition, le caractère authentifiant de la totalité du document.

n i ! f i c t i on ! n i ! r é a l i t é !

140!

4 5

Nous allons choisir (arbitrairement et aux effets de notre explication), cinq plans de la

troisième scène (“Dans les toilettes” : voir tableau 3) dans laquelle l’image correspond à une

occularisation interne secondaire qui s’établit par le raccord de regards, le raccord de

mouvements et par le respect à l’axe de l’action. Nous voyons l’antihéros devant un urinoir

sous la protection de trois gardes du corps. Ensuite, nous voyons l’héroïne dans un couloir,

déguisée en homme, qui commence à ouvrir une porte. Ensuite, par un plan moyen mi-

latéral, nous voyons les visages des trois gardes du corps, ils tournent leur visage vers la

caméra et regardent à partir du côté gauche de l’image, vers le côté droit. Ensuite nous

voyons, depuis l’intérieur des toilettes, l’héroïne qui ouvre la porte et rentre; elle regarde du

côté droit vers le côté gauche de l’image. C’est la contiguïté de ces deux plans qui est au

centre de la constitution de l’occularisation interne secondaire car si les gardes du corps

regardent c’est parce que l’héroïne est entrée dans les toilettes et si elle les regarde c’est

parce qu’ils sont là et la regardent. Enfin, par un plan général à partir de la porte des

toilettes, nous voyons l’héroïne qui marche, dos à l’image, vers les urinoirs devant lesquels se

trouvent l’antihéros et les gardes du corps.

Tout cela nous est présenté comme un ensemble d’hypothèses manifestes : la protagoniste,

déguisée en homme, entre dans les toilettes où se trouvent l’antihéros et ses gardes du corps,

mais, en plus, cette action, aux effets du récit est continue. C’est-à-dire que le fait d’ouvrir la

porte, entrer dans les toilettes, être regardée par les gardes du corps et marcher vers l’urinoir,

est en réalité une seule action du point de vue diégétique temporel. C’est pour cela que,

dans le clip qui nous occupe, nous considérons comme une scène, c’est-à-dire comme unité

d’action diégétique et non seulement comme une simple séquence, le segment

syntagmatique dont l’axe thématique à l’intérieur de l’histoire générale se développe dans

les toilettes d’un hôtel ou autre lieu similaire. Indépendamment du fait qu’il y ait ou non des

contractions ou des dilatations temporelles, la continuité de l’action est le support à partir

duquel nous pouvons déduire la trame des événements.

Pourtant, cette continuité diégétique de l’action cache une discontinuité dans les actions

techniques de l’enregistrement qui mettent en évidence une scène fictionnelle. Le raccord

des regards entre les gardes du corps et l’héroïne, tout comme les plans généraux du début

et de la fin, supposent la mise en place d’au moins trois dispositifs techniques

d’enregistrement à l’intérieur des toilettes lesquels, selon les positions des caméras, devraient

être visibles. Or, ils ne se voient pas.

! u n ! d r ô l e ! d e ! g en r e !

141 !

Ces indices, imperceptibles au niveau superficiel de l’énonciation, permettent de conclure

qu’il y a une intention communicative qui cherche la transparence de l’énonciation.

A la différence de la série 1, dans laquelle la présence de l’énonciateur-réalisateur et celle

de l’énonciateur-chanteur étaient toutes deux ostensives et évidentes, dans la série 2 le

réalisateur chercher à cacher, de manière intentionnelle, les traces de sa présence dans la

construction de l’énonciation audiovisuelle.

Par ailleurs, l’absence de regard à la caméra (qui, comme nous l’avons vu, ne peut pas être

confondue avec l’occularisation interne primaire de la séquence du miroir où la femme

regarde de façon frontale) dans une situation perceptive de transparence du dispositif

technique, ne peut que renforcer la construction d’une hypothèse dans le sens de la

fictionnalité de la série, puisque dans un régime de ces caractéristiques la diégèse repose sur

l’inexistence totale, aux effets du récit, de la médiation visuelle.

Dès lors, au niveau perceptif audiovisuel, l’occularisation interne et l’utilisation de procédés

d’occultation intentionnelle du dispositif télévisuel, deviennent des indices forts qui désignent

un mode fictionnel dans la série 2 du clip "Ex-girlfriend", indices renforcés par l’absence totale

de regard à la caméra.

Dans un sens totalement opposé à la série 1, la transparence du dispositif technique dans la

série 2 (dispositif qui n’est ni montré ni démontré) ne configure pas une relation d’opposition

entre les médiations verbale et visuelle, tout au contraire. L’histoire nous est racontée à

travers une seule modalité discursive qui fond la médiation verbale et la médiation visuelle.

c. ! Niveau!de!la !responsabilité !énonciative. !

Comme nous l’avons signalé précédemment, la médiation verbale dans la série 1 nous était

présentée comme un discours faiblement narratif mais émis à la première personne de genre

féminin, ce qui nous avait permis de l’attribuer à la chanteuse, qui soutenait son discours en

chantant en tant que sujet d’énonciation historique (statut que nous lui donnerons de façon

provisoire jusqu’au chapitre suivant). Parallèlement à cela, la médiation visuelle se constituait

à travers un discours descriptif contondant, ostensif en ce qui concerne l’utilisation des

moyens techniques audiovisuels, qui nous renvoyait au réalisateur comme sujet

d’énonciation théorique.

Nous avons vu que, dans ce cas, l’opacité technique de la médiation visuelle devenait

transparence au niveau énonciatif, puisque l’ostension des moyens techniques jouait

comme réaffirmation du caractère réel de l’énonciation du sujet d’énonciation historique (la

chanteuse) et non comme l’énonciation du sujet d’énonciation théorique (le réalisateur)

étant donné que la seule individualité subjective mise en jeu était celle de la chanteuse et

non pas celle du réalisateur.

Dans la série 2, les médiations verbale et visuelle, agissent de façon totalement différente.

n i ! f i c t i on ! n i ! r é a l i t é !

142!

Dans la mesure où, dans la série 2 de ce clip, le réalisateur efface les traces de son

énonciation, il transfère toute la responsabilité du récit à l’héroïne, ce qui ne veut pas dire

que le niveau verbal prime sur le visuel, puisque l’héroïne n’est pas la chanteuse (sujet

d’énonciation historique qui met en jeu sa subjectivité) mais un personnage de la diégèse

qui est au centre du récit. La chanteuse est une personne, tandis que l’héroïne est un

personnage.

Ainsi, l’héroïne se constitue en narrateur intradiégétique, car elle appartient au monde créé

par les opérations de diégétisation et en même temps homodiégétique, car il raconte sa

propre histoire29. Dans la terminologie de K. Hamburger, un narrateur intradiégétique-

homodiégétique ne peut être qu’un sujet d’énonciation historique ou un personnage qui

produit une mimésis de l’énoncé de réalité, un énoncé de réalité feint impossible dont sa

fictionnalité est impossible à déterminer sauf en intégrant dans l’analyse des éléments

contextuels.

Dès lors, quels éléments de la médiation verbale et visuelle nous permettent de déduire le

caractère fictif du Je-Origine (héroïne-narratrice) dans cette série du clip ?

Du point de vue cognitif, le caractère intradiégétique-homodiégétique du narrateur

correspond à une focalisation interne. D’après Genette, la condition d’une focalisation

interne c’est que le narrateur ne soit jamais décrit de l’extérieur, puisque c’est lui le foyer

cognitif à partir duquel on raconte30. Cette condition, nécessaire pour la littérature, ne l’est

pas pour les documents filmico-télévisuels, comme l’a montré Jost31 en introduisant le

concept perceptif d’occularisation (point de vue) par opposition au concept cognitif de

focalisation (foyer cognitif). Aussi bien dans le mode d’énonciation authentifiant que dans le

fictionnel, un récit en focalisation interne peut montrer et décrire le sujet qui soutient le

discours verbal. Le témoignage en est un exemple clair. On trouve peu de films dans lesquels

la focalisation interne coïncide avec une occularisation interne primaire.

Dans le cas que nous analysons, par exemple, la focalisation du discours est interne et le

régime perceptif principal est l’occularisation zéro, ce qui, joint à la transparence

énonciative du réalisateur, permet de présenter ce que nous voyons et entendons comme le

récit unitaire de l’héroïne, et non pas comme un double discours verbal et visuel, de façon

séparée et attribuable à des énonciateurs différents.

Voyons comment se produit-elle, cette fusion du verbal et du visuel :

Le statut de la chanson, dans cette série 2, est totalement différent de celui qu’elle a dans la

série 1. Ici, la chanson n’est pas une action qui est décrite dans son exécution mais un

29 Genette, G, figures III, pp. 238 à 241. 30 Op. cit. pp. 206 à 213 31 Jost, F, L'Œil Caméra. Entre le Film et le Roman, Lyon, Presses universitaires de Lyon, 1987.

! u n ! d r ô l e ! d e ! g en r e !

143 !

monologue de l’héroïne inséré dans l’intrigue, qui nous informe et nous permet de

comprendre le développement des événements de l’histoire.

Par anaphorisation, le discours verbal de l’héroïne se confond avec l’enchaînement des

images parvenant à constituer un seul récit. La réitération ostensive de la co-référence entre

l’information verbale et l’information visuelle, fonctionne comme un indice important pour la

compréhension de ce récit commun et unique. Par exemple, alors que l’image nous montre

l’héroïne qui pleure en regardant la photo d’un homme, les paroles de la chanson nous

disent : "¿Pourquoi tu m’as choisie, alors que tu savais que nous étions tout à fait différents ?”

La simultanéité nous induit à interpréter que celui à qui elle (moi) adresse son discours (toi) est

l’homme de la photo. Lorsque cette situation de s’adresser verbalement à l’autre (de toi à

moi) est réitérée constamment au niveau visuel, par la simultanéité de l’image du même

sujet, soit sur une photo, soit dans un souvenir (flash back) ou devant un urinoir, un puissant

indice de pertinence interprétative émerge qui nous conduit à reconnaître l’individu que

nous voyons comme l’ex-amoureux de la protagoniste.

Cette fonction de co-construction du récit que jouent les paroles de la chanson dans la série

2 n’a rien à avoir avec le faible contenu narratif des paroles de la chanson que nous avons

signalé dans la série 1, contenu qui se limite à l’expression de la désillusion et de la rage

d’une jeune fille abandonnée par son amoureux.

Vue dans son ensemble, par contre, la modalité discursive mise en jeu dans la série 2 est

celle de la narration.

"Une chanson possède une structure continue en boucle de couplets, de refrains et de solos

qui se répètent, grâce à la quelle elle dévoile une trame narrative qui affiche sa citcularité et

sa récurrence énonciative". (Chamberland, R, 2000, p. 363).

Comme nous l’avons dit, la chanson “Ex-girlfriend” ne dépasse pas un niveau très simple de

narration dans lequel l’essentiel n’est pas la transformation du réel mais l’expression de rage

et de désespoir d’une jeune fille. Par contre, sa mise en images dans la série 2 du clip produit

la transformation de cette forme embryonnaire de narration en un mini-récit.

Le récit co-construit par la médiation verbale et la médiation visuelle correspond à la

transformation d’une situation initiale (ordre de réaliser l’opération clandestine), à son

développement (préparation et réalisation de l’opération) et à la configuration d’une

situation finale (chute dans le vide des deux protagonistes antagoniques). Au centre de

cette transformation, la relation antagonique établie par la narration, entre l’héroïne et

l’antihéros, qui représente le principal moteur diégétique de l’histoire.

La construction narrative de la série 2 est plus proche de celle du conte que de celle du

roman. C’est-à-dire que l’action se réduit à ses moments les plus forts du point de vue de son

information diégétique et se trouve, dès lors, obligée soit à contracter fortement le temps soit

à réduire l’intrigue aux aspects élémentaires de l’opposition entre sujet et anti-sujet, soit aux

n i ! f i c t i on ! n i ! r é a l i t é !

144!

deux en même temps. Nous pouvons observer cela dans la relation qu’il y a au cinéma, du

point de vue de la narration, entre le courtmétrage et le longmétrage.

Ainsi, aussi bien le développement de l’action que la diégèse elle-même s’appuient sur une

forte unidirectionnalité inférentielle de la narration, ce qui permet un processus efficace de

construction d’hypothèse pour la compréhension du récit.

La concentration narrative sur un élément diégétique fondamental (dans ce cas le topic

"agents secrets et mafieux") implique que la construction d’indices soit non seulement

ostensive mais aussi univoque, car la limitation temporelle du récit ne permet pas la

réitération.

Dans la série 2, les médiations verbale et visuelle sont coopératives et solidaires dans la

constitution d’hypothèses mutuellement partagées par rapport au sens de la narration des

événements dans cette série du clip.

Sans l’information verbale, nous ne pourrions pas savoir, par exemple, que celui que nous

voyons dans les images (l’antihéros) a abandonné l’héroïne et qu’elle en souffre, dépitée et

jalouse, ce qui est un autre vecteur dramatique important pour la compréhension de l’action

d’anéantissement du héros par l’héroïne. Sans les images, la chanson reste une chanson et

ne constitue pas un monologue pertinent pour remplir les espaces informatifs que laisse le

lacis visuel de l’image télévisuelle.

Pourtant, la transformation qui intervient au niveau de la médiation verbale entre la série

1(chanson interprétée par la chanteuse lors d’un récital) et la série 2 (monologue

intradiégétique-homodiégétique de la narratrice-héroïne) ne comporte aucun changement

dans la façon concrète dans laquelle elle nous est présentée. Aussi bien dans une série que

dans l’autre, la chanson ou le monologue sont chantés. Dans la série 1, en tant que chanson

que la chanteuse chante dans le "récital live", dans la série 2 comme récit de l’héroïne dans

l’histoire d’“agents secrets et mafieux".

La seule modalité discursivo-représentationnelle dans laquelle une histoire nous est présentée

par des acteurs qui chantent, au lieu de construire leurs dialogues de manière analogue à

nous, c’est le genre dramatique musical de l’opéra.

Le vraisemblable fictionnel de l’opéra est construit sur la base d’un monde possible dans

lequel la communication entre les actants est réalisée à travers la musicalisation de leurs

échanges verbaux, c’est-à-dire un monde dans lequel leurs dialogues sont chantés. La

"suspension de l’incrédulité" à l’opéra exige de mettre entre parenthèses la non-réalité non

seulement du monde créé par et pour le récit mais aussi les formes communicationnelles

propres à ce monde.

Cet élément structurel du discours dans la série 2 constitue à lui seul un indice puissant de

fictionnalité du mode d'énonciation. Dès lors, si l’on cherche, comme dans notre cas, à

déterminer le mode d'énonciation de cette série, le fait que la narration nous soit présentée,

! u n ! d r ô l e ! d e ! g en r e !

145 !

au niveau de la médiation verbale et visuelle, sous la forme propre à l’opéra, ne peut que

nous conduire à construire l’hypothèse selon laquelle à la base de l’énoncé de la série 2, il y

a un Je-Origine fictif, responsable d’un mode d’énonciation fictif.

d. ! Synthèse!

La série 2 nous est présentée, au niveau phénoménologique, comme une histoire d’agents

secrets et de mafieux racontée comme un opéra.

A partir des indices profilmiques (analogie de l’espace et du temps avec notre espace et

notre temps), perceptifs (occularisation interne primaire et effacement du dispositif

télévisuel), cognitifs (focalisation interne) et de médiation verbale et visuelle (responsabilité

énonciative d’un Je-Origine fictif représenté par l’héroïne-narratrice), nous avons pu établir

que la série 2 du clip "Ex-girlfriend" correspond à un mode d’énonciation fictionnel.

Voyons maintenant ce qui se passe avec la musique si nous analysons le clip comme une

unité sémantique.

3.! DANSER! ET! S'ECLATER!: ! LA! CONSTRUCTION! D'UN! MONDE! DIEGETIQUE!LUDIQUE!

Tandis que la série 1 (Gwen et son groupe jouant en direct) nous renvoie à la réalité de

l’interprétation de la chanson, c’est-à-dire à un Je-Origine réel "historique" (mode

authentifiant), et que la série 2 (l'histoire) nous situe sur le plan de la création d’un monde

diégétique imaginaire, c’est-à-dire nous renvoie à un Je-Origine fictif (mode fictionnel), le

thème musical interprété par le groupe No Doubt ("Ex-girlfriend") nous renvoie à sa pulsion

rythmique puisque, au-delà du caractère authentifiant ou fictionnel du discours véhiculé par

les médiations verbales et visuelles associées à lui dans le clip, ses effets perlocutoires32

renvoient à la danse et à l’amusement, au monde rythmique créé par les musiciens en tant

que Je-Origine réel (ludique).

Comme nous l’avons vu dans le chapitre I de ce travail, dans la plupart des genres

audiovisuels et cinématographiques, le rôle de la musique dépend de la médiation verbale

et visuelle. C’est-à-dire qu’il dépend, à des degrés variables et, selon le type d’émission, de

l’une ou l’autre médiation.

C’est ce qui arrive si nous prenons séparément la série 1 et la série 2 du clip "Ex-girlfriend" :

dans la série 1, c’est l’action d’interprétation de la chanson par le groupe et par la

32 "Perlocution : un acte qui, en plus de faire tout ce qu'il fait en tant qu'il est aussi une locution (i.e. en tant

qu'il dit quelque chose), produit quelque chose “PAR le fait” de dire (d'où le préfixe per).Ce qui est alors produit n'est pas nécessairement cela même que ce qu'on dit qu'on produit. (“Je t'avertis”, par exemple, est une perlocution si celui à qui je parle est effrayé - et non simplement averti - par mes paroles.)". Austin, J.L, 1970, p. 181.

n i ! f i c t i on ! n i ! r é a l i t é !

146!

chanteuse qui prime sur la chanson elle-même. Dans la série 2, par contre, c’est l’intrigue qui

soumet le musique, étant donné que c’est par son ancrage dans le récit verbal et visuel

qu’elle prend un sens diégétique. Pourtant, si nous considérons le clip "Ex-girlfriend" comme

une unité de sens, et non comme deux séries indépendantes, la musique se place au centre

de la construction de la diégèse, au même niveau que les médiations verbale et visuelle.

Comme nous l’avons établit précédemment, la musique est, avec la construction de la

figure anthropoïde du chanteur-groupe, une condition fondamentale et la caractéristique

distinctive du clip, par opposition aux autres émissions télévisuelles et filmiques, y compris

l’opéra, les variétés et la publicités, genres audiovisuels dans lesquels l’utilisation de la

musique est intensive. Par ailleurs, le dispositif communicationnel du clip, qui peut être

considéré comme un instrument d’adaptation d’un texte musical (radiophonique) en

document audiovisuel (télévisuel) se caractérise par le fait que la transformation d’une

chanson en vidéo-clip est, ici, un processus "conservateur" de la chanson (chapitre I). A la

différence de l’adaptation d’un roman au cinéma, la chanson ne subit aucun changement

et le texte musical, loin d’être dilué dans les médiations visuelle et verbale, se situe au centre

du dispositif communicationnel. C’est cette fonction principale de la musique qui permet son

indépendance par rapport aux médiations verbale et visuelle.

Du point de vue de la compréhension spectatorielle, dans la chanson, sa musique et ses

paroles sont deux composantes inséparables. Pourtant, et malgré les importantes variations

entre les différents genres de chansons, cette unité entre musique et paroles ne repose pas

sur une relation de complémentarité symétrique. Particulièrement en ce qui concerne les

genres pop et rock, les paroles de la chanson sont soumises à une forte structure rythmique

et mélodique qui les caractérise. Alors que, sans les paroles, la musique d’un thème rock

comme "Smoke on the water" du groupe rock progressif Deep Purple, peut être reconnu sans

problème dans la plupart de ses versions, les paroles, sans le rythme et sans la mélodie sont

beaucoup plus difficiles à identifier comme étant celle de la chanson.

A la base de ce phénomène, une importante hiérarchisation perceptuelle qui se produit lors

de l’incorporation d’une médiation verbale dans la médiation musicale. Par exemple,

l’opération mnémotechnique d’apprentissage des tables de multiplication, par

l’incorporation d’un rythme d’une mélodie répétitifs, tel qu’on les enseigne à l’école,

transforment l’expression en litanie. Cette incorporation du verbal dans le rythmico-musical,

bien qu’effective du point de vue du résultat pratique, court le risque de ne produire autre

chose qu’un signifiant pur au niveau verbal, puisque sa compréhension demande qu’on

l’associe toujours à la médiation musicale. C’est pour cette raison que j’ai encore recours à

la litanie pour trouver le résultat de l’opération 6 x 8.

Cette incorporation d’un signifiant verbal dans une structure rythmique répétitive est similaire

à ce qui se produit lors de la musicalisation d’un texte littéraire, surtout si celui-ci est inséré

! u n ! d r ô l e ! d e ! g en r e !

147 !

dans un thème musical à forte structure rythmique comme la plupart des genres musicaux

modernes.

Ainsi, dans la relation du verbal au musical qui s’établit dans la chanson, la médiation qui

structure et organise notre perception et notre compréhension est la médiation musicale.

Tandis que la structure rythmique et mélodique perdure sans les paroles de la chanson,

celles-ci perdent leur sens musical hors de la chanson.

Les processus de perception, cognition et interprétation d’un document musical ne sont pas

radicalement différents de ce que nous mettons en jeu pour la compréhension d’un

document culturel visuel ou verbal. Pour la compréhension et interprétation d’une narration

nous appelons à nos archives symboliques et à nos schémas mentaux qui nous permettent

de la renvoyer à un monde diégétique capable de donner cohérence et de remplir les

espaces vides laissés par le récit. De la même manière, en ce qui concerne la musique,

comme activité symbolico-culturelle, le recours à l’utilisation d’un topic interprétatif permet

de renvoyer ce que nous entendons à une catégorie musicale particulière qui puisse

répondre à nos attentes comme auditeur.

"Son los archivos de mundos posibles musicales los que permiten la tarea interpretativa,

cognoscitiva y perceptiva del texto musical. A su vez, es la ausencia de ellos lo que

explicaría la percepción musical de los no músicos. Los archivos de mundos posibles

musicales de la vida cotidiana, tienden a ser más simples que los del músico : archivos

semánticos respecto a la detección de determinados sintagmas musicales (romanticismo,

suspenso, drama, géneros musicales, semejanzas establecidas culturalmente respecto a

identificar sonidos de la naturaleza, etc.)" 33 (Del Villar, R, 1997, p. 104).

Ces mondes musicaux possibles sont des schémas cognitifs qui nous permettent de classer

l’inconnu (la perception d’un nouvel événement musical) en fonction de sa similitude avec

le connu (nos savoirs et nos croyances culturelles sur la musique), c’est-à-dire qu’ils

fonctionnent comme un topic.

Par exemple, une série d’événements sonores qui ont lieu de façon simultanée, comme la

rythmique syncopée, le timbre et le ton propre aux instruments à vent et à cordes, une

intensité sujette à de fortes variations, peut nous renvoyer, par exemple, au topic "musique

jazz" ou "musique blues" ou "musique R&B", selon le niveau de connaissance et d’expérience

spécifiques du récepteur. Par contre, les événements que nous avons mentionnés nous

renverront difficilement à un topic "musique sacrée", à moins d’inclure dans cette catégorie

le "negro spiritual".

33 "Ce sont les archives de mondes musicaux possibles qui permettent la tâche interprétative, cognitive et

perceptive du texte musical. A son tour, c’est leur absence qui expliquerait la perception musicale des non-musiciens. Les archives de mondes musicaux possibles de la vie quotidienne tendent à être plus simples que ceux du musicien : archives sémantiques par rapport à la détection de syntagmes musicaux donnés

n i ! f i c t i on ! n i ! r é a l i t é !

148!

Les indices qui peuvent nous amener à utiliser un topic "musique classique" pour l’intervention

d’un document musical donné vont se différencier très fortement de ceux qui rendent

pertinente l’utilisation d’un topic "musique rock", non seulement dans le type de rêverie que

nous pourrons lui associer, en termes subjectifs à chaque type de musique mais, aussi, en

fonction des activités et des attitudes culturelles associées à chaque genre musical : si

l’attitude culturelle de réception de la musique classique est celle qui privilégie l’écoute

attentive, de préférence en situation de repos et de concentration silencieuse, la musique

rock-pop est généralement associée à une attitude active en réception qui implique

l’incorporation corporelle dans l’écoute, la danse et le chant.

La formation de ces topics répond à une logique de macropropositions dans lesquelles une

petite variation dans une de ses composantes peut provoquer une interprétation

radicalement opposée puisque :

"la información musical es siempre construida totalizadoramente, pues la música es un

desarrollo, siguiendo a Tarasti, un encadenamiento espacial 'donde unos sintagmas se

relacionan con otros', determinándolos, neutralizándolos"34. (Op. cit., p. 100).

Par exemple, la composition "Tableaux pour une exposition" interprétée dans sa version

électronique (fidèle à la partition originale) par Emerson, Lake and Palmer ( : 1971), ne nous

renvoie pas à un topic "musique classique" mais à celui de "musique rock" du fait de

l’utilisation, dans leur performance, d’instruments musicaux électroniques et, donc, avec un

son analogue à celui de la musique moderne, totalement différente du piano acoustique,

instrument pour lequel Mussorgsky a créé l’œuvre. Lorsque la variation n’est pas

instrumentale mais rythmique, quelque chose de semblable a lieu : la version acoustique "un-

pluged" de la Bourée de Bach, interprétée à la flûte traversière par le musicien rock-

symphonique Jethro Tull ( : 1968), inclut une petite accélération syncopée dans le rythme

original. Malgré qu’elle soit jouée avec des instruments traditionnels, ce fait constitue un

indice important de la pertinence interprétative de cette version comme rock progressif. Non

seulement notre perception mais aussi la construction des univers interprétatifs est différente

dans les deux cas.

La centralité de la musique dans le vidéo-clip permet que ces aspects caractéristiques de la

compréhension musicale se conservent sans que cela nous empêche, par ailleurs, de

considérer la médiation verbale et visuelle. Dans la chanson, comme dans le clip "Ex-

girlfriend", le monde rythmique créé par les musiciens de No Doubt nous renvoie, plutôt qu’au

drame de la fiction ou au factuel du documentaire, à la danse et à la diversion : danser et

(romanticisme, suspense, drame, genres musicaux, similitudes établies culturellement pour identifier des sons de la nature, etc.". Notre traduction.

34 "l’information musicale est toujours construite de façon totalisatrice, car la musique est un développement, suivant Tarasti, un enchaînement spatial “ où certains syntagmes entrent en relation avec d’autres". Notre traduction.

! u n ! d r ô l e ! d e ! g en r e !

149 !

s’éclater, effet propre aux genres musicaux comme la techno, le dancing ou le pop,

typologie à laquelle appartient le thème "Ex-girlfriend".

4.! CONCLUSION!: ! DE! LA! TRANSPOSITION! DES! MODES! D'ENONCIATION! A! LA!PLURALITE!INTERPRETATIVE!

Comme nous l’avons signalé au début de ce chapitre, l’intérêt heuristique que revêt

l’analyse du clip “Ex-girlfriend” repose sur le fait qu’on peut y reconnaître les trois modes

d’énonciation polaires définis par Jost (authentifiant, fictionnel et ludique). Dans ce sens,

l’opération analytique que nous avons réalisée en décomposant le clip en deux séries plus

les effets perlocutoires de la musique - comme s’il s’agissait de documents différents - avait le

double objectif de déterminer le mode d’énonciation dans lequel on peut classer le clip et,

en même temps, d’établir une grille d’analyse qui serve à établir la réalité ou non-réalité de

la modalité énonciative d’un document télévisuel.

Mais ce document audiovisuel, comme toute émission télévisée, ne nous est pas présenté de

manière fragmentée mais comme un ensemble significatif inséré dans le vaste territoire de la

communication télévisuelle. De ce fait, en accord avec les exigences de la logique

analytique, il faut introduire une opération de recomposition qui nous permette de

déterminer le mode d’énonciation du clip “Ex-girlfriend”.

Le clip “Ex-girlfriend” construit-il une diégèse unitaire par la fusion des trois diégèses?

A quel mode d’énonciation pouvons-nous renvoyer l’énonciation de l’ensemble du clip “Ex-

girlfriend”?

L’inclusion d’un fragment fictionnel dans un document authentifiant, sans que ce caractère

de fiction soit pour autant signalé de manière claire et nette, représente une rupture à la

promesse d’authenticité qui est associée à l’interprétation d’un document de réalité et,

donc, cela est perçu, au niveau des spectateurs, comme un mensonge. Cela explique le

scandale produit par la révélation de l’inclusion d’images fictives dans certains

documentaires de Jacques Cousteau sans que cela ait été signalé de manière explicite.

Par ailleurs, l’intromission d’une énonciation de réalité dans un mode d’énonciation fictif -

comme par exemple une rupture dans la diégèse qui n’ait pas une fonction précise dans la

construction de l’intrigue ou la monstration du dispositif scénique dans un régime de

transparence - est interprétée comme une erreur ou comme une incohérence. Tel est le cas,

par exemple, du reflet qui laisse voir les cameramen et les projecteurs de lumière dans le film

“Blade runner”35 (Ridley Scott, 1982) ou la fameuse voiture rouge que l’on voit, de loin et à

peine perceptible, dans une image panoramique de la superproduction “Ben Hur” (William

Wyler, 1959).

35 Il s’agit d’une scène dans laquelle la clone artificielle fuit le protagoniste (Harrison Ford).

n i ! f i c t i on ! n i ! r é a l i t é !

150!

Enfin, l’inclusion, dans un mode d'énonciation ludique, du drame ou d’une assertion sérieuse

sur la réalité qui ne contribue pas à soutenir les effets perlocutoires du discours (soit le rire soit

l’amusement) devient une rupture de la promesse de divertissement ou d’évasion et, dès lors,

elle est interprétée soit comme une manipulation soit comme un échec. Tel est le cas des

excès choquants dans lesquels tombent certains programmes de caméra cachée qui ne

provoquent pas toujours le rire mais plutôt le rejet de la part d’un certain type de

téléspectateurs.

Par contre, si le mélange ou la fusion des modes d’énonciation sont justifiés et contribuent à

la promesse du genre dans lequel l’énonciation se produit, cela ne constituera pas une

grande surprise, à condition que le référent de réalité ou de non-réalité soit clair car “ nous

acceptons différemment la fusion de la fiction et de la réalité selon le mode auquel nous

rattachons l'émission”. (Jost, F, 2001, p. 24). Tel est le cas de l’inclusion de fragments de

documents de réalité, truqués avec la technique digitale, dans le film “Forrest Gump”

(Robert Zemeckis, 1993). Sa justification dans l’intrigue et la clarté référentielle du mode

d’énonciation fictif dans lequel se produit ce mélange de réalité et de non-réalité font que

cela ne soit pas perçu comme un mensonge au niveau de la réception.

Rien de tel dans le cas du clip “Ex-girlfriend”. La co-présence de fiction, réalité et

divertissement, sans qu’elle soit justifiée du point de vue d’une diégèse fictionnelle,

authentifiante ou ludique, ne nous induit pas à interpréter cette situation comme un

mensonge, comme une incohérence ou comme un échec. La raison principale en est,

contrairement à ce qui se passe dans le film “Forrest Gump”, l’inexistence d’un point de

référence explicite vers lequel renvoyer l’énonciation de ce document télévisuel et qui serve

de paramètre pour l’évaluation et l’interprétation globale de sa réalité ou de sa non-réalité. Il

n’y a aucun élément, au niveau du mode d’énonciation, qui nous indique la prééminence

d’un mode sur les deux autres.

Si, comme l’affirme Jost, “l'interprétation d'un programme dépend largement du mode

d'énonciation qu'on lui attribue” (Jost, F, 1998, p. 35), le fait de ne pas avoir de référence

unique pour construire la pertinence d’un monde par l’exclusion des autres, privilégie la

construction d’hypothèses interprétatives plus larges que dans le cas de documents

télévisuels qui nous sont présentés sous le label d’un mode d’énonciation précis. Dans telle

une situation, la transposition des modes d'énonciation va permettre la construction d’une

énonciation polysémique ou, en d’autres mots, va favoriser une interprétation plurielle.

La plupart des procédés de narrativisation et, en termes plus généraux, de mise en discours,

aussi bien de la fiction que des documents de réalité télévisuelle, ont recours à un

investissement indiciel important destiné à la construction d’hypothèses manifestes dans un

sens univoque à la réception. Sauf pour quelques films d’auteur, dans lesquels le discours se

situe aussi bien au niveau de la narration des faits qu’au meta-niveau de l’expression sensible

de l’auteur, ou dans le cas de situations d’incertitude lors des directs non préparés dans

! u n ! d r ô l e ! d e ! g en r e !

151 !

lesquels l’inattendu de l’événement donne lieu à d’interprétations multiples aussi bien par le

téléspectateur que par le présentateur, et même par le directeur, la plupart de la

communication télévisuelle se développe à partir de l’utilisation intensive et directionnelle

des indices cohérents avec la construction d’un sens unique.

De là, les procédés narratifs propres à la fiction audiovisuelle, dans lesquels le nombre limité

d’indices ostensifs appellent à la formation d’hypothèses très dirigées, et donc probables, qui

conduisent et encadrent le travail perceptif et cognitif du spectateur dans le sens d’une

petite quantité d'inférences possibles.

"Parce que le temps de visionnement pose des contraintes à la mémoire, l'habilité du

spectateur à construire une fabula cohérente dépend de références répétées aux

événements de l'histoire. Afin de garder les grandes lignes de l'action claires et afin

d'assurer que les hypothèses appropriées soient émises, la narration doit réitérer les plus

importantes coordonnées causales, temporelles et spatiales de la fabula". (Perron, B, 1994,

p. 96)36

Contrairement à cela, le clip “Ex-girlfriend” nous est présenté comme la juxtaposition et non

comme la fusion des trois modes énonciatifs.

Ceci ne veut pas dire que ce document ne permet pas son interprétation en tant

qu’ensemble. Le seul fait que les deux séries aient été construites à partir d’un montage

parallèle et que la musique soit le point de rencontre des deux, témoignage d’une intention

communicative. Ce qui est en question ici c’est le caractère de la présomption

d’intentionnalité que permet le clip.

L’absence d’indices sur la prééminence d’un mode d’énonciation va déterminer que

l’interprétation du sens du document se réfère au positionnement du téléspectateur par

rapport au clip et non pas à une quelconque indication textuelle : le fan utilisera le clip pour

voir son groupe favori et apprendre des choses sur lui et sur ses membres (mode

authentifiant); le téléspectateur circonstanciel y cherchera à s’amuser avec une histoire

mouvementée racontée d’une manière insolite (mode fictionnel); l’amateur de musique pop

s’en servira pour danser et se laisser aller à la pulsion du son et des images (mode ludique).

Entre ces trois possibilités, il y a toutes les intermédiaires possibles.

D’après ceci, le clip “Ex-girlfriend” correspond nettement, dans la caractérisation de Jost

(Jost, F, 1997, 1999), aux caractéristiques d’un genre mixte ou de deuxième degré. Et cela

non seulement parce qu’il nous est présenté comme la juxtaposition des modes énonciatifs

mais aussi parce que cette configuration privilégie, en outre, la construction d’un sens pluriel.

Pourtant, ce serait erroné de conclure, à partir de cette analyse, que tous ou la plupart des

clips puissent correspondre à cette même formule, comme c’est le cas des téléfilms qui

36 Le paragraphe est une citation de Bordwell, D, 1985, p. 80.

n i ! f i c t i on ! n i ! r é a l i t é !

152!

peuvent tous être classés dans le mode fictionnel, ou les JT qui sont, sans exception, à ranger

sous la catégorie authentifiante ou comme tous les reality shows qui appartiennent à un

mode mixte.

Loin de cela, dans le vidéo-clip, le mode d’énonciation se présente comme une variable et

non comme une caractéristique générique définitoire.

B.! UN!MODE!D'ENONCIATION!A!LA!FOIS!

La juxtaposition des modes d’énonciation qu’il est possible d’établir dans le clip “Ex-

girlfriend37, nous a permis de démontrer que l’énonciation dans ce document télévisuel

transgresse la typologie des genres télévisuels de premier degré proposée par François Jost.

Pourtant, cette caractéristique qui permet au clip de combiner différents modes

d'énonciation n’est pas une qualité exclusive de ce type de productions. A côté du vidéo

clip, il existe toute une série de programmes d'énonciation mixte, tels que le reality shows ou

les programmes de divertissement réalisés sur base de vidéos domestiques ou d'amateur38,

qui ont aussi pour vocation la combinaison des modes énonciatifs. Jost va encore plus loin :

"L'une des caractéristiques de la télévision d'aujourd'hui est, sans doute, d'avoir engendré des

genres qui détournent les modes authentifiant-fictif-ludique" (Jost, F. 1999, p, 31). Les

typologies proposées par Jost acquièrent un niveau proprement télévisuel avec l’existence

de modes d’énonciation que l’auteur appelle “genres de deuxième degré” ou

“métagenres”, c’est-à-dire, des genres qui se constituent à partir et au-delà des genres

authentifiant, fictif et ludique (Jost, F, 1997 / 1999), dans lesquels l’auteur classe tous les

programmes qui combinent, à différents degrés, les trois modes d’énonciation déjà décrits et

qui sont inclassables du point de vue du premier degré. Ainsi, la possibilité de combinaison et

de juxtaposition énonciative, tout en étant un des éléments qui définit le mieux le clip

comme un produit télévisé, constitue aussi une caractéristique que le clip partage avec un

nombre non négligeable de programmes.

Ce qui devient particulièrement distinctif du vidéo-clip, c’est que - à la différence du reality

show et d’autres programmes de mode d'énonciation de second degré qui sont contraints à

une combinaison des modes d'énonciation pour être compris comme tels - le vidéo-clip

n’est pas obligé de respecter cela. C’est-à-dire qu’il est doublement variable car il n’est pas

soumis à la transgression des modes énonciatifs. En d’autres termes, le mode d’énonciation

37 Dans le corpus qui a servi de base empirique à ce travail, de nombreux clips ont un fonctionnement similaire

à “Ex-girlfriend”, c’est-à-dire qu’ils construisent l’énonciation à partir de la juxtaposition des modes d’énonciation. Nous pouvons citer, parmi d’autres les clips Maria, Maria (Carlos Santana, Supernatural, 2000); I'll be There for You (The Rembrands, I'll be There for You, 199x) ou It's my Life (Bon Jovi, Crush, 2000).

38 Par exemple, l’émission française sur TVF 1 “Vidéo Gag”.

! u n ! d r ô l e ! d e ! g en r e !

153 !

mixte que nous pouvons observer dans le clip “Ex-girlfriend” ne représente qu’une des

possibilités à travers lesquelles on peut construire l’énonciation dans le vidéo-clip.

Nous présentons maintenant une synthèse de l’analyse de quatre vidéo-clips dont les modes

d’énonciation ne correspondent pas à celui que nos avons défini pour le clip "Ex-girlfriend",

c’est-à-dire, des vidéo-clips dans lesquels nous ne pouvons pas reconnaître la juxtaposition

des modes énonciatifs authentifiant, fictionnel et ludique. Au contraire, dans chacun des cas

qui seront présentés, sauf dans le dernier, l’énonciation ne peut être dirigée que vers un

mode spécifique à la fois, qui sera différente pour chaque clip. Il est important de retenir que

les clips choisis ne représentent pas des déviations de la norme générale du mode

d'énonciation du clip mais qu’ils sont, au contraire, tout à fait représentatifs de l’échantillon

avec lequel nous travaillons39.

Les outils et la logique d’analyse ayant été déjà développés, nous nous limiterons à présenter

une brève synthèse des conclusions pour ne pas nous perdre dans les détails et rester

davantage concentrés sur ce qui constitue notre but principal : la définition du mode

d'énonciation caractéristique du vidéo-clip.

1.! LE!CLIP !DOCUMENTAIRE!

Le clip ”Nothing Else Matters" (single, 1999) du groupe rock Metallica, est totalement réalisé

dans le mode authentifiant. Aussi bien du point de vue des opérations de diégétisation que

des éléments méta-énonciatifs, tous les indices nous conduisent à interpréter ce qui nous est

présenté comme étant un récital live du groupe. Suivant les concepts d’Odin (Odin, R. 1983 /

2000-b), le clip favorise une lecture documentarisante. Il ne s’agit pas d’un mode

d’énonciation fictif qui simule l’authentifiant, ce que Hamburger et Jost appellent énoncé de

réalité feint40, puisque le clip est construit à partir de une réalité qui peut être faussée et

vérifiable : la production est un extrait filmé lors d’un concert du groupe en 1999. Il n’y a pas

de simulation d’un mode d'énonciation. On n’y trouve ni le comme de la fiction, ni le

Comme Si de la feintise.

Comme dans la série 1 du clip “Ex-girlfriend”, au niveau des médiations verbales et visuelles

de ”Nothing Else Matters”, il n’y a pas d’autre récit que celui qui se dégage des paroles de la

chanson dans laquelle le degré de narrativité est minime41. L’occularisation zéro dans un

régime de focalisation interne permet la constitution de deux référents énonciatifs : un

référent verbal et un référent visuel. L’ostension, aussi bien de la médiation visuelle que de la

médiation verbale, constitue la double condition qui permet en même temps la constitution

39 Voir annexe : Corpus. 40 Voir Chapitre III. 41 Voir annexe : Nothing Else Matters.

n i ! f i c t i on ! n i ! r é a l i t é !

154!

d’un énonciateur verbal – le chanteur et son groupe – sujet d’énonciation “historique” qui

met en jeu sa subjectivité et, parallèlement, la constitution au niveau de la médiation

visuelle, d’un énonciateur visuel – le réalisateur – sujet d’énonciation théorique, qui exprime

une généralité transindividuelle en construisant l’énoncé comme un fait objectif dans lequel

son individualité n’est pas impliquée.

L’ostension du dispositif technique se constitue en transparence énonciative de

l’énonciateur-réalisateur, puisque le topic interprétatif mis en œuvre pour et par la diégèse

est celui d’un direct préparé extra-télévisuel : celui d’un récital live à la T.V..

La musique n’invite pas ici, nécessairement, à la danse. S’agissant d’une ballade (une

curiosité si nous pensons qu’elle est interprétée par un groupe de hard rock), le public qui suit

l’interprétation de la chanson dans le stade ne danse pas, il chante, comme s’il récitait un

poème. Ici, la chanson et la musique renvoient, davantage qu’à sa pulsionnalité rythmique,

à la sensibilité du chanteur-auteur et, donc, à un Je-Origine réel.

Le clip se limite à cela : l’interprétation d’une chanson par ses véritables interprètes

(Metallica), sur un vrai plateau (un stade de football), à une date précise (historiquement),

face à un public réel qui, par ailleurs, n’est pas là pour la réalisation du clip mais pour voir et

entendre son groupe préféré. Il ne s’agit pas de données extra-phénoménologiques. Tout

amateur de musique moderne, moyennement informé, pourrait reconnaître l’année et le lieu

du récital qui sert de base à ce clip, puisqu’il s’agit en fait d’un des derniers récitals

importants du groupe qui a eu comme résultat un LP qui reprend, non seulement la

performance en live mais aussi une sorte de bilan musical des vingt dernières années de ce

groupe hard rock. Ceci constitue une information contextuelle qui ne peut pas être ignorée

en termes d’indices car elle représente un des éléments sémantiques sur lesquels repose la

compréhension de ce clip de Metallica. Cela ne va pas de même dans le clip “Ex-girlfriend”

car on n’y trouve pas d’antécédents qui permettent d’affirmer qu’il s’agit d’un vrai ou d’un

faux récital.

Le sujet d’énonciation, dans ce clip, ne se prête donc pas à controverse. Il s’agit d’un Je-

Origine réel “historique”. Il n’y a pas de fiction, il n’y a pas de Je-Origine fictif.

Le mode d’énonciation est ici, incontestablement, le mode authentifiant42.

2.! LE!CLIP !FICTION!

Autre exemple: "Thriller" (Thriller, 1983) du chantant pop Michael Jackson, un vrai classique du

vidéo-clip, est réalisé complètement dans le mode fictif43.

42 Dans notre corpus, les clips qui ont en commun d’être réalisés dans le mode authentifiant sont, parmi

d’autres : Mariah Carey "Against All Odds" (Rainbow, 1999); The Backstreet boys "The One" (Millenium, 1999).

! u n ! d r ô l e ! d e ! g en r e !

155 !

Construit à partir d’une version light du topic gork “mort vivants”, le monde diégétique et la

forme que prend le récit dans ce clip est une allusion au genre filmique de terreur. Ainsi,

l’inclusion, au niveau profilmique, d’éléments fantastiques (zombies, morts vivants en

décomposition et autres monstres de collection), est un premier indice important de la

fictionnalité du mode d’énonciation.

Pourtant, malgré la thématique et le traitement esthétique associé au topic principal, sa mise

en scène est celle du musical hollywoodien, ce qui fonctionne, au niveau de l’interprétation

du mode d'énonciation, comme un indice fort de fictionnalité. Ici, les monstres reproduisent

des chorégraphies aux côtés du héros/antihéros Jackson/zombie. C’est-à-dire que l’intrigue

n’est pas seulement chantée mais aussi dansée de manière chorégraphique et avec un but

esthétique dans la construction de la diégèse.

L’occularisation zéro et la transparence absolue du dispositif scénique au niveau perceptif

audiovisuel, associées à un régime de focalisation interne du récit au niveau verbal,

permettent l’effacement du Je-Origine réel. On n’y trouve pas de rupture, ni dans la diégèse,

ni dans le raccord. Comme dans la série deux du clip “Ex-girlfriend”, la fusion du verbal et du

visuel permet la coproduction d’un récit audiovisuel unique dans lequel le héros/antihéros

s’assume comme instance narratrice, déplaçant le Je-Origine réel.

Pour garantir que ce que nous avons vu et entendu est le produit d’une mise en scène et

d’un récit fictionnels, l’insertion à la fin du clip des génériques avec les noms des acteurs, du

réalisateur ainsi que du producteur et de l’équipe technique, représente le point d’orgue qui

veut nous indiquer que ce que nous avons vu et entendu correspond à une superproduction

qui n’a rien à envier aux films à grand budget. De fait, ce clip a demandé un investissement

de plus de US$ 1.500.000 en 1983. Ce clip, pastiche d’innombrables films de terreur, cherche

à construire, par la voie de la reproduction des éléments épitextuels propres à la méta-

communicaton de l’industrie cinématographique, les indices pour une lecture

fictionnalisante.

Bien que le caractère fictionnel du mode d’énonciation dans “Thriller” soit évident, nous

voudrions nous arrêter sur un aspect intéressant et récurrent du processus de fictionnalisation

auquel ont recours beaucoup de clips.

A la différence ce qui se passe dans la plupart des genres télévisuels fictionnels, comme le

téléfilm ou le feuilleton télévisé, la constitution d’un mode fictionnel dans le vidéo-clip a

comme but, non seulement la mise en récit d’une histoire mais, surtout, la construction de la

figure anthropoïde du chanteur-groupe, à travers son élévation au statut d’artiste (voir

chapitre I et VI). C’est-à-dire que, bien que cela puisse sembler paradoxal, la construction

d’un monde fictionnel dans le clip a un but authentifiant.

43 Dans notre corpus, les clips réalisés tous dans le mode fictif sont, entre autres, les suivants : Cartoon Heroes

(Aqua, Aquarium, 2000); The Dark (Anuk, Urban Solitude, 2000); Bye, bye, bye (Nsync, No string attached,

n i ! f i c t i on ! n i ! r é a l i t é !

156!

Pour la compréhension du récit et du monde diégétique d’un film comme "Brave Heart"

(James Mackay, 1996), il est nécessaire, non seulement d’avoir recours à la “suspension de

l’incrédulité” par rapport à l’ensemble des éléments diégétiques construits pour le récit, mais

aussi de mettre entre parenthèses le fait que le héros de l’intrigue, William Wallace, soit

incarné par Mel Gibson, le même acteur qui jouait Riggs dans " Lethal Weapon I, II, III et IV".

La disparition de l’acteur dans le personnage est une des conditions qui permettent une

lecture fictionnalisante au cinéma.

Dans le clip qui nous occupe, par contre, le chanteur reste lui-même dans la diégèse non

seulement du fait qu’il chante, mais aussi parce que ses traits de personnalité (construits

ostensivement à travers d’autres clips, par la presse et par une complexe stratégie de

positionnement) restent constants dans chacun de ses clips. Ainsi, il nous sera difficile de voir,

sauf de manière ironique, Madonna interprétant une jeune candide et tendre dans un clip

fictionnel ou Peter Gabriel en dealer ou en sex-symbol entouré de filles provoquantes et à

moitiés nues, comme dans les histoires racontées dans les clips de Sisqo et de la plupart des

chanteurs de RAP.

Cette authentification par la fiction est un des éléments que nous développerons dans le

chapitre VI.

3.! LE!CLIP !DIVERTISSEMENT!

"My Heart Goes Boom" (single, 2000) du groupe techno French Affair, a été réalisé, par

contre, sous l’hégémonie du mode ludique. Réalisé entièrement à partir de la pulsionnalité

du rythme de la musique, le but y est de mettre en images cette pulsionnalité. Il n’y a pas

d’histoire et le récit, aussi ouvert que confus, se limite aux paroles de la chanson et à une

mise en scène dans le style fête techno.

Au niveau profilmique, les éléments témoignent d’une mise en scène pour la production,

c’est-à-dire qu’il ne s’agit pas d’un récital ni d’un enregistrement en direct. Par ailleurs, les

sauts d’axe, les sauts de raccord, les changements de lieu, le mélange d’images

d’animation et d’images réelles, etc. sont des indices d’une intention énonciative au niveau

visuel. Pourtant, cette intention n’est pas clairement exprimée car elle se limite à la

production d’effets rythmico-pulsionnels par la superposition des plans, sans un montage qui

permette la mise en récit. Malgré cette construction d’un monde non-réel, il ne s’agit pas ici

de fiction. Il n’y a pas d’histoire. Les paroles de la chanson se réduisent à quelques verbes et

adjectifs qui constituent un niveau de récit très simpliste: (…) “tu me plais beaucoup, mon

cœur bat quand je suis près de toi ".

2000).

! u n ! d r ô l e ! d e ! g en r e !

157 !

Le regard constant de la chanteuse vers la caméra pendant toute la durée du clip et la

présence d’un récit de niveau élémentaire, fait à la première personne du genre féminin,

constituent les principaux indices de la réalité du Je-Origine dans ce document. Pourtant, le

récit très rudimentaire véhiculé par les paroles de la chanson et par les images ne parvient

pas à se constituer en une assertion sur la réalité.

Les médiations verbale et visuelle se présentent fortement ponctuées par le rythme

typiquement techno de la musique. La pulsion de la musique, qui invite à la danse et à

l’évasion, a un rôle structurateur des images et des paroles de la chanson : celles-ci sont

subordonnées aux effets perlocutoires de la musique.

La seule intention du clip “My Heart Goes Boom” est d’amuser le téléspectateur, de le faire

danser au rythme des images de la musique.

Dans ce clip, le mode d’énonciation est le mode ludique44.

4.! LE!META=CLIP!

Enfin, "All the small things" (Enema of the State, 1999) du groupe pop USA Blink 182, est

entièrement réalisé à un niveau méta-énonciatif, c’est-à-dire que sa compréhension est liée

aux savoirs vidéophiles du téléspectateur plutôt qu’à une trame potentielle. Ce clip peut être

considéré, donc, comme un mode d'énonciation de deuxième degré.

“All the small thinks” est réalisé sur base de citations successives, sur le ton de la parodie, de

quelques fragments-clichés des clips "Sometimes" (Baby One More Time, 1999), de la

chanteuse américaine Brithney Spears, et de "I Want It That Way" (Millennium, 1999), de la

boys-band The Backstreet Boys. Cette production est un véritable clin d’œil à ces clips et au

genre en général.

Les paroles, qui sont d’ailleurs incompréhensibles même pour quelqu’un qui soit familiarisé

avec l’argot de la jeunesse américaine, remplissent la seule fonction de pouvoir être

chantées, puisqu’elles ne parviennent pas à se constituer en un quelconque type de discours

cohérent45. L’ambiguïté absolue de ses paroles permet à la chanson de s’adapter à

n’importe quel récit qui puisse être construit sur base d’images et de la pulsion musicale.

L’appel persistant au téléspectateur par le regard à la caméra des musiciens et le rôle

central de ceux-ci dans la diégèse, les identifie comme sujet d’énonciation historique

puisque ce qui est en jeu dans la parodie est la re-sémantisation des clips originaux : leur

ridiculisation. Le groupe Blink 182 devient ainsi responsable de l’énonciation dans le clip “All

44 Dans notre corpus, les clips réalisés dans le mode ludique sont, entre autres, les suivants : Sha la la la

(Vengaboys, Platinium Album, 2000); Sex Bomb (Tom Johnes, Reload, 2000). 45 Voir annexe : Blink 182 "All the small thinks".

n i ! f i c t i on ! n i ! r é a l i t é !

158!

the small thinks”. Ici, l’origine du discours se situe davantage dans le groupe plutôt que dans

le réalisateur audiovisuel.

Du point de vue de la responsabilité énonciative, la seule possibilité offerte par ce clip est

celle d’un Je-Origine réel représenté par la figure du groupe46.

C.! UNE!ENONCIATION!TRANSGENERIQUE?!

Si nous avons réalisé une analyse du mode d’énonciation dans les différents clips que nous

présentons dans ce chapitre, c’est dans le but de caractériser le processus interprétatif que

le téléspectateur met en route face à ce type de documents et de pouvoir, ainsi, définir

cette pratique signifiante en tant que genre dans la communication télévisuelle.

En d’autres termes, notre but était ici de construire une définition générique du clip à partir

de l’analyse du mode d’énonciation qui lui est propre selon la typologie proposée par

François Jost (Jost, F, 1995; 1997; 1998; 1999; 2001.).

Où en sommes-nous, à ce stade de notre analyse, par rapport à notre objectif ?

Selon l’analyse que nous avons développée jusqu’ici, à la différence des genres télévisuels

analysés par Jost dans ses différents travaux47, le vidéo-clip ne peut pas être classé dans un

seul mode d’énonciation étant donné que, dans ce type de programmes, le mode

d’énonciation est une variable et non une caractéristique définitoire de l’émission. C’est pour

cette raison que nous avons trouvé pertinent de montrer des exemples représentatifs de

cette variation : mode mixte dans “Ex-girlfriend”, mode authentifiant dans “Nothing Else

Matters”, mode fictionnel dans “Thriller”, mode ludique dans “My Heart Goes Boom” et, en

fin, mode meta-énonciatif dans “All the small thinks”.

Lorsqu’il s’agit de genres littéraires, voire même de genres audiovisuels48, cette qualité de

variation d’un mode d’énonciation à un autre, en les combinant indistinctement et en

permettant une pluralité d’interprétations est souvent définie comme "transgénéricité".

Dans le cas du vidéo-clip, cette variabilité générique est double car elle ne se rapporte pas

seulement à la possibilité de changer de mode d’énonciation d’un clip à l’autre mais,

également, à celle de constituer une énonciation polysémique dans un même document.

C’est pour cette raison que le préfixe latin "trans", qui a étymologiquement la double

acception « à travers » (comme dans ‘transpercer’) et «au-delà de » (comme dans

46 Dans notre corpus, les clips qui ont en commun d’être réalisés dans le mode méta-énonciatif sont, entre

autres : 47 Tels que le JT, le téléfilm, les émissions de jeu, les sit’com, les reality show, les talk show, entre autres. Voir

bibliographie. 48 Voir : Chamberland, R., "Le Vidéo-clip : un récit transgénérique" in "De l'Écrit à l'Écran", Québec, Pulim,

2000.

! u n ! d r ô l e ! d e ! g en r e !

159 !

‘transcender’), semble s’ajuster parfaitement au caractère de l’énonciation dans le vidéo-

clip. D’une part, il rend compte de la possibilité de variation d’un clip à l’autre et, d’autre

part, il permet de décrire la qualité métagénérique qui permet au vidéo-clip de combiner les

modes d’énonciation à l’intérieur d’un même document, ce que de nombreux auteurs

appellent le « mélange de genres » 49.

Roger Chamberland fait allusion à cette deuxième acception du préfixe « trans »

(transcendance générique) dans son article "Vidéo-clip : un récit transgénérique" (2000),

lorsqu’il affirme :

"Le vidéo-clip est la somme de multiples mutations génériques irréductibles". (: p. 369).

Considéré dans la perspective des genres télévisuels de Jost, ce caractère transgénérique

du mode d’énonciation est le seul trait identitaire entre tous les clips puisque, comme nous

l’avons indiqué dans le chapitre I, l’utilisation intensive de la musique, le montage

stroboscopique, la rêverie pulsionnelle ou la fragmentation et la compression du récit, tout en

étant des traits que nous pouvons reconnaître dans un nombre important de clips, n’en

constituent pas des caractéristiques distinctives absolues, dans la mesure où nous pouvons

les identifier également dans d’autres types de productions télévisuelles et dans la mesure

aussi où ils ne sont pas une caractéristique sine qua non pour l’interprétation du document

comme vidéo-clip.

S’il est vrai que les caractéristiques esthétiques propres ou recurrentes d’un genre permettent

la construction d’hypothèses pertinentes sur son mode d’énonciation, elles ne représentent

pas des indices univoques, car elle ne sont pas exclusives à un mode d’énonciation en

particulier. L’identité esthétique qui existe entre le clip et les genres télévisuels ne permet pas

d’isoler les traits de sa spécificité générique.

Pouvons-nous définir le vidéo-clip dans la généalogie télévisuelle de Jost à partir de la notion

d’énonciation transgénérique ?

Comme nous l’avons signalé, selon Jost :

"Tout genre, en effet, repose sur la promesse d'une relation à un monde, dont le mode ou le

degré d'existence conditionne la participation du récepteur (...)les émissions télévisuelles

sont interprétées en fonction de trois grands modes d'énonciation qui définissent à la fois

l'attitude ou l'intention de celui qui adresse le document et ce que le spectateur peut en

attendre. (...) En d'autres termes, un document, au sens large, qu'il soit écrit ou audiovisuel,

est produit en fonction d'un type de croyance visé par le destinateur et, il ne peut être

interprété par celui qui le reçoit sans une idée préalable du type de lien qui l'unit à la réalité."

(Jost, F, 2001, p. 17).

49 Voir : Jost, F., 1998; '99 et 2001-a. Lochard, G., et Boyer, H., 1995.

n i ! f i c t i on ! n i ! r é a l i t é !

160!

D’après ce que nous avons analysé précédemment, le type de lien qui relie le clip à la

réalité est variable et, donc, la promesse de relation à un type de vérité (réalité ou non-

réalité) de ce type de documents télévisuels (le clip en tant que genre), serait définie par la

croyance en sa versatilité énonciative et non pas par la croyance en un mode

d’énonciation spécifique.

Mais une telle conclusion serait problématique et ne nous permettrait pas de décrire et

d’expliquer la compréhension spectatorielle du vidéo-clip.

Étant donné que dans le vidéo-clip le mode d’énonciation est une variable, l’interprétation

spectatorielle sera toujours référée à un objet en particulier ("l'interprétation d'un programme

dépend largement du mode d'énonciation qu'on lui attribue" (Jost, F, 1998, p. 35)).

Dès lors, si pour interpréter un clip en particulier le téléspectateur doit se référer toujours à

l’expérience spécifique à laquelle appelle le document, celle-ci peut le renvoyer soit à la

fiction, soit à la réalité, soit au jeu, soit à l’une ou l’autre modalité ou à une quelconque

combinaison de plusieurs d’entre elles. Cela empêcherait sa catégorisation générique

puisque, dans cette situation, il serait impossible de différencier un vidéo-clip d’un musical

holywoodien, de la pub, des variétés, d’un opéra rock, du direct préparé « récital live » ou du

vidéo expérimental.

La transgénéralité de l’énonciation ne constitue donc pas un mode d’énonciation parmi les

trois définis par Jost. Au contraire : l’énonciation transgénérique représente l’absence de

mode dénonciation propre, elle veut tout et rien dire à la fois. Loin de résoudre le problème

de la définition du mode d’énonciation dans le clip, elle rend la tâche encore plus

laborieuse.

Le paradoxe survient lorsque nous constatons que la plupart d’entre nous, et spécialement

les jeunes consommateurs de vidéo-musique, peuvent distinguer facilement un clip des

autres genres télévisuels qui font, comme lui, usage intensif de la musique et/ou qui ont des

caractéristiques esthétiques similaires.

D.! CONCLUSIONS!ET!POINTS!DE!DEPART!

Il y a deux raisons possibles à ce paradoxe :

Une première raison serait que, confrontés à la définition générique du clip, nous devons

constater que le mode d’énonciation qui lui est propre et qui permet la construction du

processus inférentiel d’attribution énonciative ne se situe dans aucune des catégories

définies par Jost et il est donc nécessaire de le déterminer.

La deuxième raison serait que pour définir le clip en tant que genre, la catégorisation à partir

du mode d’énonciation est insuffisante car elle ne nous apprend pas beaucoup sur le

! u n ! d r ô l e ! d e ! g en r e !

161 !

processus de compréhension spectatorielle qui est associé à ce type de documents

audiovisuels.

De notre point de vue, loin d’être antagoniques, ces deux alternatives sont les deux faces

d’une même monnaie.

Nous tenterons de démontrer, dans le chapitre suivant, que les caractéristiques énonciatives

du vidéo-clip reposent sur le statut du Je-Origine qui est à la base de son énoncé et que les

modes d’énonciation télévisuels que l’on trouve dans les programmes sont plus nombreux

que ceux contenus dans la typologie de Jost.

En d’autres termes, pour connaître la manière dont on comprend un clip, il sera nécessaire

de transposer notre analyse, faite jusqu’ici par rapport au mode d’énonciation, dans le

domaine du statut ontologique du Je-Origine, ce qui nous oblige à revisiter la théorie de

Hamburger sur les genres littéraires.

n i ! f i c t i on ! n i ! r é a l i t é !

162!

VI.! LE!JE!LYRIQUE!A!LA!TELEVISION

Le caractère transgénérique que l’on attribue usuellement au vidéo-clip, bien qu'il semble décrire correctement une des principales caractéristiques structurelles de ce type de programmes – à savoir, sa capacité de variation et de combinaison des modes d'énonciation authentifiant, frictionnelle et ludique – ne suffit pas à expliquer le processus d'interprétation qui permet de reconnaître le vidéo-clip et de le distinguer des autres genres télévisuels. La qualité qui est donc représentée et définie par rapport à ce concept, ne permet pas la catégorisation du vidéo-clip dans la typologie proposée par Jost.

Cette impossibilité de classification du vidéo-clip, nous pouvons l'attribuer à deux types de problèmes différents : le premier est l'absence, dans le modèle théorique de Jost, d'autres catégories de modes dénonciation différentes de celles des modes authentifiant, fictionnel ou ludique ; le deuxième problème réside dans l'impossibilité de classification du vidéo-clip à partir du mode d'énonciation.

Tandis que le premier problème appelle à un élargissement de la théorie de Jost, c'est-à-dire, à la possibilité d'ouvrir le cadre théorique à l'existence d'autres modes d'énonciation, le deuxième pointe la nécessité de son abandon.

Mais il existe un troisième aperçu de la question qui contient les deux précédents et que nous allons aborder dans ce chapitre. Pour cela, il est nécessaire d'introduire un changement de niveau logique qui nous oblige à quitter le domaine spécifique de la théorie de Jost mais qui n'implique pas nécessairement son abandon.

Si le mode d'énonciation est une fonction du caractère du Je-Origine, question dans laquelle Hamburger et Jost coïncident, la clé peut se trouver dans la définition du sujet d'énonciation qui se trouve à l'origine de l'énoncé. C'est-à-dire, en orientant notre recherche vers le caractère ontologique du Je-Origine, nous pourrons, en même temps, élargir la théorie de Jost et donner une autre perspective à l'analyse mise en jeu dans le chapitre précédent.

En d'autres termes, nous devrons nous situer à l'intérieur du modèle de Käte Hamburger et, dès lors, notre problème sera de déterminer la catégorie du Je-Origine dans laquelle il est possible de classer le sujet d'énonciation dans le clip.

Ainsi, l'analyse que nous allons développer dans ce chapitre sera articulée autour de l'hypothèse suivante : "la figure du chanteur-groupe est semblable à la catégorie du Je-Origine lyrique et, donc, le mode d'énonciation du clip en est le mode 'poétique'".

! l e ! j e ! l y r i que ! à ! l a ! t é l é v i s i on !

163 !

A. ! STATUT!DU!JE=ORIGINE!DANS!LE!VIDEO=CLIP!

Comme nous l'avons dit, dans tout document télévisuel de réalité1, nous pouvons reconnaître

la présence d'au moins deux instances responsables de l'énonciation : une instance

responsable de la médiation visuelle, représentée par le réalisateur2, et une autre instance

(ou plusieurs s'il s'agit, par exemple, d'un concours avec plusieurs participants) responsable

de la médiation verbale.

D'une part, le Je-Origine réel responsable de la parole peut être défini (dans la plupart des

cas) comme un sujet d'énonciation historique, du fait qu'il assume la parole et nous interpelle

directement en s'adressant à la caméra, séparant son énonciation de celle du réalisateur et

mettant en jeu son individualité dans le processus de communication. D'autre part, le Je-

Origine réel responsable de la médiation visuelle correspond, la plupart du temps, à un sujet

d'énonciation théorique, du fait qu'il n'assume pas une personnalité particulière ni une forme

humaine pleine mais une identité transindividuelle qui n'engage pas sa personnalité dans

l'énonciation énoncée.

Par contre, dans un document fictionnel, il n'y a pas de différenciation entre la responsabilité

énonciative de la médiation verbale et celle de la médiation visuelle, étant donné que toute

la responsabilité de l'énoncé retombe sur le ou les Je-Origine(s) fictif(s) qui assume(ent) le rôle

de narrateur intra ou extra-diégétique, implicite ou explicite. Le réalisateur n'existe pas en vue

de la compréhension de la diégèse, ce qui veut dire qu'il n'existe pas en tant que sujet

d'énonciation.

Comme nous l'avons dit auparavant (chapitre III), ce qui décide le caractère réel ou non-

réel d'un énoncé n'est pas, pour Hamburger, l'objet mais le caractère du sujet d'énonciation :

"Même un 'énoncé irréel' est en toutes circonstances un énoncé de réalité" (Hamburger, K,

1986, p. 55).

Pour que l'énoncé se constitue en tant qu'énoncé fictionnel, le Je-Origine réel doit disparaître

car seul son absence permet la présence des Je-Origines fictifs. L'absence du Je-Origine réel

est, donc, la condition principale pour la réalisation de la fiction.

"La disparition d'un Je-Origine réel, d'un sujet d'énonciation, est l'élément structurel essentiel

qui définit un monde fictif". (Op. cit., p. 126).

1 Un document télévisuel de réalité est celui dont la responsabilité énonciative est attribuable à un Je-Origine

réel. 2 Comme nous l’avons dit, le réalisateur est le responsable de la direction globale de toutes les opérations

techniques et professionnelles qui ont comme résultat un programme de télévision. Sa personne synthétise, pour nous, tous les individus qui interviennent partiellement dans l’énonciation audiovisuelle (caméramen, scénaristes, maquilleurs, photographes, etc.).

n i ! f i c t i on ! n i ! r é a l i t é !

164!

Nous pourrons voir, ci-après, que dans le vidéo-clip aucune des deux catégories de Je-

Origine réel responsable des médiations verbale-musicale (le chanteur-groupe) et visuelle (le

réalisateur) disparaissent comme sujets d'énonciation.

Mais avant de voir comment ces deux instances persistent dans le vidéo-clip, nous devons

nous arrêter brièvement sur la question du statut de réalité ou de non-réalité de la figure du

chanteur-groupe.

1.! LA!REALITE!DU!CHANTEUR=GROUPE!

Si la définition du réalisateur comme une Je-Origine réel ne constitue pas un grand problème

du fait qu'il s'agit d'une figure énonciative d'incontestable caractère réel3, la définition du

chanteur comme Je-Origine réel exige une explication.

Il est commun de voir les chanteurs et musiciens des groupes pop, rock, rap et hip hop,

assumer des rôles fictionnels dans leurs clips. Depuis les astronautes de "Cartoon Heroes"

(Aqua, Aquarius, 2000), jusqu'aux êtres grotesques d'un monde gork fantastique dans "The

Dark" (Anouk, Urban Solitude, 2000), en passant par nos fameux agents secrets et mafieux du

clip "Ex-girlfriend".

Même l'image et la personnalité du chanteur et du groupe nous semblent fictionnels, dans la

mesure où elles sont fortement stéréotypées et unidimensionnelles : Ricky Martin "latin lover";

Blink 182 "les gamins irrévérents"; 2-Pack "le gangster"; Maria Carey "la blonde sexy". D'un clip

à l'autre, cette personnalité est renforcée, perfectionnée.

Pourtant, il y a deux éléments qui constituent de puissants indices de réalité dans la figure du

chanteur-groupe. Le premier est d'ordre logique et structurel et le deuxième est en rapport

avec le statut artistique qui est culturellement associé à l'activité professionnelle du chant et

à l'interprétation musicale.

Comme nous l'avons indiqué, dans la mesure où il est possible de déterminer la constitution

d'un Je-Origine réel, à savoir le réalisateur, il se produit, tout de suite, une rupture entre la

possibilité de réalisation de la fiction et la constitution d'un énoncé de réalité. La

différenciation entre l'instance de médiation verbale et l'instance de médiation visuelle a,

donc, comme conséquence une rupture nécessaire dans le monde diégétique construit

(lorsque le monde diégétique construit est un monde fictionnel). C'est-à-dire que la présence

ostensive du réalisateur dans l'énoncé télévisuel, implique non seulement le caractère de

réalité de l'énoncé mais, aussi, la réalité du responsable de la médiation verbale ou musicale,

dans le cas du vidéo-clip.

Si un des deux pôles de la médiation télévisuelle cesse d'être transparent, son opacité

touche l'ensemble de la médiation. C'est exactement ce qui se passe avec la rupture de la

3 Puisqu’il est le responsable de l’existence et configuration spécifique d’une émission de télévision.

! l e ! j e ! l y r i que ! à ! l a ! t é l é v i s i on !

165 !

diégèse, peu importe si elle est due à une erreur de continuité attribuable au réalisateur ou à

l'adresse à la caméra d'un personnage, le fait est qu'elle représente, en dernière instance,

l'évidence de la réalité des médiations verbale et visuelle.

Mais au-delà de cette explication structurelle, l'autre élément qui joue un rôle essentiel dans

l'attribution du statut de réalité au chanteur-groupe, est le caractère artistique et créatif qui

est associé culturellement à l'activité professionnelle de la musique et du chant, élément qui,

comme nous le verrons plus loin, est mis en évidence dans le clip.

Le chant et la musique professionnelles sont des activités pour lesquelles, dans la culture

occidentale, il faut posséder des qualités ou des talents spéciaux et qui constituent le

paramètre d'évaluation et de distinction entre celui qui les possède – le musicien – et ceux

qui ne les possèdent pas – les non musiciens. C'est pour cette raison que chanter ou jouer

professionnellement d'un instrument exige un long apprentissage et constitue, en raison du

temps très important que l'on doit y consacrer, une activité presque exclusive.

Conséquence de cela, l'œuvre d'art (création concrète) et l'artiste (créateur) sont des

éléments indissociables. Tout comme le peintre ou l'écrivain s'identifient à une sensibilité et à

un style particulier qui définissent son œuvre, le chanteur et le musicien s'identifient à leur

création lorsqu'ils interprètent un thème musical comme solistes ou comme membres d'un

petit ensemble (dans lequel leur interprétation prend un caractère singulier par opposition

aux grands orchestres dans lesquels l'important c'est l'interprétation du groupe, et donc, le

directeur). Cette identification, au singulier, du musicien ou du chanteur avec l'interprétation

ou création le lie fortement à son œuvre. C'est-à-dire que, d'une part, elle le distingue des

autres musiciens et chanteurs (il serait difficile de confondre Sinatra avec Brel, Madonna

avec Allanis Morriset ou Deep Purple avec Metallica) et, d'autre part, elle permet que son

interprétation ou création ne puisse être attribuée à un autre interprète que lui (c'est cela qui

permet l'imitation ludique des styles, du timbre de la voix, etc.)

Ces croyances ou savoirs culturels déterminent une attente au niveau de la réception d'un

clip, définie par la correspondance directe entre l'énonciation de l'artiste et son énoncé.

Un des aspects communicationnels qui définissent la relation entre le téléspectateur et le

vidéo-clip, est le fait qu'à travers le clip le téléspectateur se met en rapport avec l'identité et

la sensibilité artistique du chanteur-groupe. S'agissant d'un clip et non pas d'une série ou

d'une publicité, nos attentes visent que le thème musical soit interprété par ses véritables

interprètes et il importe peu si l'on voit à l'écran des images abstraites ou des dessins animés

Ne pas répondre à cette attente peut conduire à un véritable scandale. Ce fut le cas du

duo pop "Milli Vinilli", qui, au début des années 90' était devenu célèbre du jour au

lendemain. Lorsqu'on apprit que les deux membres du groupe, Pilatus et Morgan, ne

chantaient pas mais bougeaient les lèvres sur un play-back enregistré par d'autres chanteurs,

n i ! f i c t i on ! n i ! r é a l i t é !

166!

non seulement ils furent obligés de rendre le "Grammy" obtenu cette année-là mais, de plus,

obligés de quitter la scène, ils sont tombés dans l'oubli.

Dès lors, la pertinence de l'interprétation de réalité des Je-Origine dans le vidéo-clip s'appuie,

au moins, sur deux éléments principaux : d'une part, sur la relation de différenciation entre la

médiation verbale et la médiation visuelle qui établit le caractère réel du Je-Origine et,

d'autre part, sur la pertinence de l'attribution de l'interprétation du thème musical à la figure

du chanteur-groupe, ce qui veut dire que l'interprétation du thème musical n'est attribuable

qu'à ses véritables interprètes.

Le fait (plus ou moins indiscutable) que l'image et la personnalité de la plupart des chanteurs

et des groupes correspondent à une construction publicitaire orientée par une stratégie de

marketing, ne constitue pas un indice de non-réalité du Je-Origine. Si l'image proposée par le

clip ne correspond pas à la "vérité" de l'image du chanteur, fait qui est, par ailleurs,

impossible à vérifier pour la plupart d'entre nous, elle deviendra "fausse" mais non pas

fictionnelle (pourquoi, sinon, le scandale de Milli Vanilli?).

Étant donné que l'image du chanteur, comme toute autre assertion à l'intérieur de la réalité,

est évaluable à partir d'un critère vrai/faux, le fait d'être considérée comme fausse, ne fait

que confirmer le statut de réalité du chanteur-groupe.

Les deux éléments signalés, la différenciation entre la médiation verbale et la médiation

visuelle et le statut artistique de l'activité professionnelle de la musique, tout en nous servant à

établir la réalité du chanteur-groupe, n'épuisent ni ne contiennent toutes les formes par

lesquelles ce dernier se constitue en sujet d'énonciation réelle. Comme nous allons le voir, il y

a une multitude de facteurs qui permettent l'attribution du statut de réalité à la figure

chanteur-groupe, à la réception. Ces éléments vont jouer un rôle important dans la

désactivation de la fiction dans le vidéo-clip.

2.! LA!DESACTIVATION!DE!LA!FICTION!

Étant donné que seul l'absence du Je-Origine réel permet l'émergence des Je-Origine fictifs

et, par là, l'activation de la fiction, la persistance des sujets d'énonciation verbale et visuelle

dans le clip conduit nécessairement à sa désactivation.

Il y a deux phénomènes propres au clip qui impliquent la persistance des Je-Origine réels

dans ce type de documents télévisuels. Nous appellerons ces phénomènes "prééminence de

la figure du chanteur-groupe" et "transindividualité du réalisateur".

Comme deux faces de la même monnaie, ces deux phénomènes correspondent aux pôles

des médiations verbale et visuelle qui vont fonctionner comme éléments décisifs de réalité,

présents pendant toute la durée du vidéo-clip.

! l e ! j e ! l y r i que ! à ! l a ! t é l é v i s i on !

167 !

a . ! La!prééminence!de!la !f igure!du!chanteur=groupe!

Selon l'analyse faite dans le chapitre précédent, il y a un élément commun à tous les vidéo-

clips étudiés : la position privilégiée et persistante occupée par la figure du chanteur-groupe

dans chacun de ces documents télévisuels, qui ne varie pas, qu'il s'agisse d'un clip

authentifiant comme "Nothing Else Matter", ludique comme "My Heart Goes Boom" ou

fictionnel comme "Thriller". Peu importe le mode d'énonciation choisi pour l'interprétation du

clip, le chanteur-groupe aura toujours le rôle principal de l'énonciation.

Ceci n'a rien de surprenant si nous considérons que tout vidéo-clip commercial (c'est-à-dire

la majorité des clips que nous voyons à la télévision) a pour but la promotion, non seulement

de la chanson mais, surtout, du chanteur-groupe. Tel que nous l'avons vu dans le chapitre I,

la centralité de la personnalité du chanteur s'appuie sur le double objectif stratégique de

promouvoir la vente d'une chanson et d'un disque déterminé et d'assurer, en même temps,

la production et reproduction d'un mode de consommation des produits de l'industrie

musicale.

Pourtant, si nous restons fidèles à la démarche phénoménologique que nous avons

développée tout au long de ce travail, nous devons nous intéresser, plutôt qu'aux fonctions

stratégiques que peut avoir le vidéo-clip dans l'instance de production, au processus de

construction de l'interprétation au niveau de la réception. C'est cela qui va orienter notre

travail de reconnaissance des indices qui permettent la construction de la prééminence du

chanteur-groupe dans l'énonciation du vidéo-clip.

Dans presque tous les vidéo-clips, la présence de la figure du chanteur-groupe se matérialise

dans son protagonisme au niveau de l'image et du son. L'adresse à la caméra et le discours

à la première personne (la chanson) sont la norme, presque invariable, de ce type de

documents télévisuels.

L'adresse à la caméra reprend la norme communicationnelle non médiatique de la

conversation, dans laquelle un sujet nous interpelle avec son discours et avec son regard

frontal (l'axe Y-Y de Verón) et, par ce fait, il s'oppose au personnage fictionnel pour lequel ni

le téléspectateur ni le dispositif technique ne doivent exister. Le régime d'occularisation zéro

à travers lequel nous est présentée l'image du chanteur, placent celui-ci au centre du

discours.

L’utilisation d’un discours à la première personne – le moins fictionnel des pronoms d’après

Hamburger (: 1986, pp. 48 à 54) – évoque un sujet d’énonciation déterminé – historique – ce

qui induit fortement à attribuer le récit au vécut de l’énonciateur et à le doter, ainsi, d’une

existence indépendante de son discours. La focalisation interne place le chanteur qui

chante pour nous comme le foyer du discours et l’axe cognitif qui nous donne accès à ses

contenus.

n i ! f i c t i on ! n i ! r é a l i t é !

168!

Ces deux éléments réunis sous la forme du chanteur qui chante pour nous en nous adressant

son regard, le placent au centre de notre intérêt. C'est lui qui nous raconte, nous décrit ou

simplement exprime, à notre adresse, ses sentiments et ses idées.

Pourtant, même dans le cas des clips dans lesquels la figure du chanteur n'est pas

représentée de manière directe dans l'image – comme dans les clips du groupe anonyme

"Gorillaz", dans lequel les chanteurs sont remplacés par des dessins animés, ou dans ceux du

groupe "Fatboy Slim" où il n'existe pas un référent humain ni virtuel qui représente les

musiciens à l'écran, la présence du chanteur-group est essentielle. Elle est donnée par la

persistance, d'un clip à l'autre, des traits de personnalité spécifiques qui lui sont associés.

A la différence de l'acteur qui dilue sa personnalité dans son personnage et n'en conserve

que son aspect physique, le chanteur qui joue un rôle dans la diégèse dilue le personnage

dans sa personnalité, en conservant non seulement son aspect physique mais aussi ses

caractéristiques les plus distinctives. Tel est le cas de Michael Jackson dans "Thriller", que nous

avons analysé auparavant et, dans d'autres clips réalisés par le chanteur. Dans tous ces clips,

la continuité de la personnalité du chanteur est très nette, non seulement dans le style

général des décors, des vêtements et des chorégraphies mais aussi dans l'esthétique des

images et dans les thèmes de ses chansons.

Dans le cas du "Fatboy Slim", la construction de l'altérité et d'une personnalité propre suit le

même chemin que les clips dans lesquels la figure du chanteur-groupe occupe une place

privilégiée à l'image. Ici, on met en évidence le style propre, reflété dans les thématiques

traitées, dans le son caractéristique et singulier et dans la répétition, d'un clip à l'autre, de

personnages ou situations similaires.

Enfin, la chanson, et plus généralement, le thème musical, constituent l'ancrage

fondamental du chanteur dans le clip. Si le thème musical est là, c'est parce qu'il est chanté

par un chanteur et/ou un groupe déterminé(s). En d'autres mots, dans le clip, la chanson doit

avoir un responsable concret à l'origine : le chanteur-groupe. Ceci, qui est une condition sine

qua non dans le vidéo-clip, ne l'est pas dans d'autres types de productions audiovisuelles.

Dans la plupart des programmes de télévision de fiction et authentifiants, la musique a un

rôle de ponctuation du récit ou du discours et, de ce fait-là, l'identité du chanteur ou des

musiciens n'a pas grand intérêt pour la compréhension globale du document. La relation du

musicien avec son thème musical n'est pas très importante non plus dans le cas de la

publicité, où la chanson ou la musique sont créées en fonction de la construction d'une

image de marque ou des attributs d'un produit. Le vidéo-clip, par contre, ne peut pas être

compris sans l'attribution de la chanson à ses véritables interprètes. La prééminence de la

figure du chanteur-groupe est une condition de lecture indispensable pour le vidéo-clip.

! l e ! j e ! l y r i que ! à ! l a ! t é l é v i s i on !

169 !

b . ! La!transindividualité !du!réalisateur!

L'autre trait commun à tous les clips analysés est la présence, plus ou moins ostensive, des

moyens techniques. Cette opacité technique est aussi bien un corollaire logique de la

prééminence du sujet d'énonciation représenté par le chanteur-groupe (la réalité du

responsable de la médiation verbale détermine la réalité du médiateur visuel et vice versa)

qu'un élément vérifiable de manière indépendante, ce qui s'exprime dans la monstration

mais, surtout, dans la démonstration du dispositif technique télévisuel d'enregistrement,

d'édition et de traitement des images.

La monstration des moyens techniques est, en général, limitée à quelques clips dans lesquels

nous pouvons voir le groupe jouant en direct, sur un plateau ou dans un studio

d'enregistrement. Dans d'autres situations, il est plus difficile de voir à l'écran les éléments

techniques de l'enregistrement.

Au contraire, la démonstration du dispositif technique est une constante esthétique et

communicationnelle présente dans tous les clips. Au même titre que le regard à caméra, la

démonstration des moyens techniques est aussi seulement appréciable à partir des procédés

attribuables uniquement au réalisateur : utilisation intensive des positions, prises d'angles et

mouvements de caméra "non traditionnels" tels que piqués ou contre-piqués extrêmes, très

gros plans, déformation optique de l'image et mises au point avec des lens d'angles

extrêmes, mouvements véloces et erratiques, etc ; en ce qui concerne la mise en scène,

utilisation fréquente d'objets, décors et lieux irréels ou insolites ainsi que ruptures de l'axe de

filmation et de l'action; enfin, utilisation de transitions entre plans fortement démarcatives, tel

que les coupures dans la continuité des mouvements, regards ou gestes ou l'utilisation du

montage rythmique suivant la pulsionnalité de la musique, le tout renforcé par l'utilisation

intensive d'effets spéciaux et d'animation en 3D. Toutes ces actions fortement démonstratives

de la présence du réalisateur au niveau du tournage, de la mise en scène et du montage,

constituent des éléments importants d'opacité du dispositif technique professionnel.

Bien que dans le vidéo-clip cette présence des moyens techniques ne soit pas réalisée de la

même manière que dans la plupart des programmes télévisuels (question que nous traiterons

dans le point suivant), elle est signifiante d'un trait caractéristique de la médiativité

télévisuelle. L'opacité du dispositif technique est une norme de la médiation télévisuelle qui,

sauf dans le cas de la fiction, est respectée par la plupart des programmes, y compris notre

objet d'étude. Ce qui est implicite dans la présence ostensive du dispositif télévisuel dans le

vidéo-clip est, justement, sa "télévisualité".

Puisque la monstration et la démonstration du dispositif technique ne sont autre chose que

les traits que l'énonciateur audiovisuel laisse dans l'énoncé qu'il construit, en tant que

responsable de tous les aspects discursifs de l'image, son action énonciative ne pourrait pas

être moins évidente que celle du sujet d'énonciation responsable de la médiation verbale et

musicale – le chanteur-groupe.

n i ! f i c t i on ! n i ! r é a l i t é !

170!

Pourtant, cette présence des moyens techniques télévisuels ne prend pas la forme d'une

ostension de l'énonciation du réalisateur en tant que sujet responsable de l'ensemble des

opérations techniques et professionnelles destinées à construire l'énoncé audiovisuel. Elle

n'apparaît du moins pas comme une ostension énonciative au même titre que l'énonciation

du chanteur-groupe.

Comme nous l'avons vu dans le chapitre IV, la différence énonciative entre le chanteur-

groupe et le réalisateur réside dans le rôle énonciatif différent que la télévision assigne à

chacun de ces responsables des médiations verbale et visuelle. En d'autres mots, chanteur-

groupe et réalisateur correspondent à des catégories de sujet d'énonciation différentes,

chacune établissant une relation différente avec l'objet énoncé.

Dans la mesure où le chanteur-groupe assume un discours à la première personne et

s'adresse à la caméra, investissant ainsi son individualité dans l'acte d'énonciation, il a pu être

classé (provisoirement) comme un sujet d'énonciation historique.

Par contre, à la télévision, le réalisateur, dans la mesure où il correspond souvent à une entité

transindividuelle qui se confond avec celle de la chaîne et, même, avec celle de la

télévision en tant que média, il a pu être catégorisé comme un sujet d'énonciation

théorique.

C'est justement cette condition médiatique de la transindividualité de l'énonciation

audiovisuelle dans le vidéo-clip, qui lui permet de ne pas se superposer à l'énonciation du

chanteur ou du groupe. Au contraire, l'action énonciative du réalisateur consiste à mettre au

premier plan la réalité de l'énonciation du sujet d'énonciation responsable de la médiation

verbale.

Le fait que d'importants réalisateurs de cinéma soient souvent appelés à réaliser des vidéo-

clips ne change pas cette condition médiatico-télévisuelle, propre à ce type de documents.

Au-delà de leur génie ou de leur savoir-faire, leur présence se justifie davantage comme une

opération de légitimation artistique du chanteur que comme une option créative sur le

produit audiovisuel.

Pourtant, même dans le cas de ces rares clips dans lesquels le style du réalisateur est

perceptible, comme dans "Les choses de la vie" (Eros Ramazotti, Les choses de la vie, 1996)

de Spike Lee, par exemple, la créativité de ce dernier ne concurrence pas le rôle central

d'Eros Ramazotti (le chanteur) comme sujet d'énonciation responsable du clip.

B.! L'EFFET!DE!FICTION!

Comme nous l'avons établi, autant la figure du chanteur-groupe (responsable des

médiations verbale et musicale) que celle du réalisateur (responsable de la médiation

visuelle), correspondent à des Je-Origine réels. Leur persistance, en tant que sujets

! l e ! j e ! l y r i que ! à ! l a ! t é l é v i s i on !

171 !

d'énonciation, implique l'impossibilité d'activation de la fiction, laquelle exige pour sa

réalisation complète que les Je-Origine réels disparaissent pour laisser la place aux Je-

Origine fictifs.

C'est-à-dire que, si le clip n'est pas fictionnel, il doit nécessairement être un document

de réalité.

Pourtant, le vidéo-clip ne correspond – ni au niveau esthétique, ni au niveau structurel –

aux caractéristiques des autres documents télévisuels de réalité que nous avons

évoqués dans ce travail. Tout au contraire, le vidéo-clip nous semble, à première vue,

beaucoup plus proche des programmes de fiction.

Dans le point précédent, nous avons vu comment la monstration et la démonstration

des moyens techniques étaient une caractéristique commune à tous les programmes

télévisuels, à l'exception des programmes fictionnels. Pourtant, nous allons voir que, à la

différence de la plupart des programmes télévisuels, le vidéo-clip réalise sa médiativité

télévisuelle à partir de la mimésis de la médiativité cinématographique. La

conséquence principale de ceci est ce que nous appellerons "effet de fiction".

Si l'"effet de réalité" est la construction d'un univers diégétique symbolique, cohérent et

analogue au nôtre, l'"effet de fiction" correspondra exactement au contraire, c'est-à-

dire à la construction d'un univers diégétique de réalité à partir d'éléments de non-

réalité.

Cet "effet de fiction" se concrétise, dans le clip, à partir de trois opérations

transtextuelles4 qui relient le clip avec le cinéma : l'hypertextualité5 ou mimésis des

procédés discursifs, esthétiques et techniques propres au cinéma ; l'intertextualité6 ou

allusion et citation de films, personnages, acteurs et univers diégétiques

caractéristiques du grand écran ; et, enfin, la paratextualité7 exprimée dans la

récupération du caractère artistico-créatif avec lequel on associe généralement la

fiction filmique.

1.! LA!MIMESIS !ESTHETIQUE!

Dans le clip, l'utilisation des procédés discursifs et esthétiques propres à la fiction, n'est pas

seulement fréquente mais elle constitue une caractéristique propre et une consigne de

lecture inhérente à ce type de documents.

4 Transtextualité : "ou transcendance textuelle du texte (…) Tout ce qui le met en relation, manifeste ou

secrète, avec d'autres textes". (Genette, G, 1982, p. 7). 5 Hypertextualité : "J'entends par là toute relation unissant un texte B (que j'appellerai hypertexte) à un texte

antérieur A (que j'appellerai, bien sûr, hypotexte) sur lequel il se greffe d'une manière qui n'est pas celle du commentaire". (Op. cit. p. 13).

6 Intertextualité : "Je le définis (…) par une relation de coprésence entre deux ou plusieurs textes, c'est-à-dire, eidétiquement et le plus souvent, par la présence effective d'un texte dans un autre. Sous sa forme la plus explicite et la plus littérale, c'est la pratique traditionnelle de la citation". (Op. cit. p. 8)

7 Paratextualité : "l'ensemble des marques (titre, sous-titre, intertitres, dédicaces, préfaces, notes, etc.) à fonction pragmatique qui accompagnent le texte proprement dit, sont indissociablement structurales et historiques". (Ducrot, O, et Shaeffer, J-M, 1995, p. 210).

n i ! f i c t i on ! n i ! r é a l i t é !

172!

La création d'univers diégétiques fantastiques, la présence de personnages fictionnels

représentés par les chanteurs ou par d'autres personnes (y compris des vedettes du grand

écran8), l'utilisation de procédés technico-discursifs plus utilisés au cinéma qu'à la télévision –

tels que le fondu enchaîné, le raccord ( et le faux raccord), la continuité et le respect de

l'axe d'action (et la rupture de l'axe et de la continuité) et, enfin, toute la batterie d'effets

spéciaux du cinéma fantastique de dernière génération – donnent au vidéo-clip un aspect

fictionnel très puissant.

Même l'utilisation, presque exclusive, de pellicule au lieu de vidéo-tape comme support

matériel de l'image, option propre aux genres fictionnels et à quelques documentaires à

grand budget, donne à l'image du vidéo-clip une texture visuelle en tons pastel et une

graduation chromatique que l'on trouve dans les films, téléfilms et séries mais qui sont très

différentes des couleurs saturées et contrastées du régime vidéographique, caractéristique

de la plupart des programmes télévisuels jusqu'au journaux télévisés et aux concours.

L'effet de fiction par l'utilisation de cette esthétique propre à la fiction se voit renforcé par sa

rupture constante. Pour que les procédés techniques et discursifs ne restent pas dans la

transparence avec laquelle ils sont utilisés dans la fiction, ils sont fréquemment, dans le clip,

transgressés et confirmés.

Cette situation permet, par comparaison, de démontrer le procédé technico-discursif ce qui

signifie transformer le signe en chose. En d'autres termes, dans le clip, le procédé technico-

discursif cinématographique perd sa fonction de construction de la diégèse pour se

constituer lui-même en objet, au point de perdre toute fonction narrative. C'est le cas, parmi

tant d'autres, du clip "Ma petite entreprise" (Mes Petites Entreprises, 2001) du chantant

française Alain Bashung, qui est construit, entièrement, sur base de zoom in successifs. Le

zoom in (et son opposé le zoom out) est un procédé de vectorisation par "focalisation" de la

monstration d'un objet particulier parmi plusieurs autres. C'est-à-dire qu’il sert à concentrer

l'attention narrative ou descriptive sur un objet ou un actant en particulier. Pourtant, dans ce

clip, la "focalisation" perd son sens de vectorisation dans la mesure où aucun des cadrages

n'est renforcé par les autres et ils ne correspondent qu'à une multitude obsédante de

"focalisations" sans but précis.

2.! L'ALLUSION!

Mais si l'utilisation des ressources propres à la fiction est, en soi, un élément qui contribue, par

analogie esthétique, à donner à ces documents une forte apparence fictionnelle (situation

8 Le cas du clip "Weapon of Choise" (Halfway between the guter and the star, 2000) du groupe Fatboy Slim,

dans lequel le personnage principal est l’acteur britannique VVVV.

! l e ! j e ! l y r i que ! à ! l a ! t é l é v i s i on !

173 !

qui, de toutes façons, est fréquente dans quelques documentaires9), il y a une figure

discursive qui joue un rôle encore plus décisif dans ce sens : l'allusion à la fiction filmique.

Les dimensions que peut prendre l'allusion vont de la référence directe à certains films – la

citation – à la reproduction d'univers diégétiques caractéristiques d'un film ou d'un genre

cinématographique. Par ailleurs, l'allusion s'étend aussi aux acteurs et actrices connus ou aux

personnages emblématiques du cinéma tels Charlot, Dracula (dans toutes ses versions),

Frankenstein ou King-Kong.

Bien que son utilisation ne soit pas généralisée dans tous les clips, la liste de ceux qui font

référence à des films, personnages ou acteurs, est énorme. Nous en citons quelques-uns : la

citation du film "Gentelmen Prefer Blondes" (Howard Hawks, 1953) dans le clip "Material Girl"

(Like a Virgin, 1985), dans lequel Madonna reproduit le cliché de Marylin Monroe, le cas de

"Seven days" (Seven days, 2001), de David Craight, qui est une allusion à la circularité du

monde représenté dans le film "Groundhog Day", ou le clip "California Love" de 2-Pack,

pastiche musical de "Mad Max" (George Miller, 1979), qui reprend l'univers diégétique

futuriste décadent, d'après-guerre nucléaire, de ce film. Sans parler des innombrables clips

qui font allusion à des films célèbres "The Citizen Kane", "Stars War", "Le cuirassé Potemkin" ou

"Roky". Enfin, nous pourrions dire que chaque film important, que ce soit en raison de sa

qualité artistique ou de son succès, compte avec un pastiche mis en musique sous la forme

d'un vidéo-clip.

Une autre forme que peut prendre l'allusion au cinéma dans le vidéo-clip est la reprise de

certains procédés technico-discursifs spécifiques du cinéma et qui représentent de véritables

points de repère du 7e art, comme le plan-séquence10 (dans le clip Yellow [, Parachutes,

2000) du groupe Coldplay] ou le crossing the sight11 (dans le clip Good Stuff [Kaleidoscope,

2000] de Kelis).

La conséquence directe de l'allusion et de la citation, est la construction d'une proximité

référentielle et esthétique accentuée entre le clip et le cinéma.

"Le clip s'inscrit dans le domaine esthétique du cinéma, affronte la même mémoire des

images, travaille les mêmes présupposés. De fait, il se présente - sans le savoir - comme

une réponse, ou plutôt une adaptation, à la perte d'innocence des images, tant de côté de

ceux qui produisent ces images que de ceux qui les consomment. (...) Dans ce rapport du

clip au cinéma, ce dernier lui sert de modèle, de référence et de recevoir de citation".

(Vernier, J-M, 1986, p. 131).

9 Deux exemples, parmi beaucoup d’autres : la série de documentaires réalisés par Wim Wenders sur la guerre

du Golf ou le documentaire "Baka" sur le peuple pygmée réalisé par P. Agland. 10 Plan Séquence : Séquence tournée en un seul plan, en une seule prise, directement et sans interruption, sans

aucun type de montage et qui conserve, ainsi, les unités spatiale et temporelle. 11 "Crossing the sight" ou "saut d’axe" : effet optique qui se produit lorsque les axes d’action se croissent, ce

qui donne une fausse perspective à la continuité des plans corrélatifs.

n i ! f i c t i on ! n i ! r é a l i t é !

174!

Mais, au-delà de sa fonction de production d'une proximité esthétique, l'allusion a aussi une

fonction narrative et diégétique qui s'appuie sur les savoirs et sur la culture audiovisuelle du

téléspectateur. Cette auto-référence audiovisuelle représente, selon Jost, une économie

dans la forme de construction du récit dans le vidéo-clip :

"La citation intertextuelle est moins un clin d'œil aux cinéphiles qu'un procédé qui assure

deux fonctions : certes, faire avancer vite le récit, mais surtout donner au spectateur, en

quelques secondes, des repères pour construire un monde possible. (...) dans ce monde

possible qui se construit grâce aux scénarios intertextuels, nous reconnaissons aussi un

discours sur le monde réel". (Jost, F, 199X-x, p. 229).

Ainsi, le clip récupère et se sert du patrimoine filmique pour construire l'énonciation du

chanteur. Obligé de raconter une histoire dans le court espace de temps d'une chanson, la

citation et l'allusion opèrent comme des schémas de mémoire qui évitent le long chemin de

la construction narrative.

L'ancrage en images du sentiment de solitude et d'angoisse d'Anouk dans la chanson "The

Dark" (Urban Solitude, 2000), est beaucoup plus rapide et efficace si on fait allusion au

monde fantastique et terrifiant du film "Beetlejuice" (Tim Burton, 1988), expliqué et légitimé par

le cinéma, que si on essaie de construire un monde de solitude et d'angoisse sans référence

allusive.

3.! LA!REFERENCE!AU!STATUT!ARTISTIQUE!DU!CINEMA!!

Enfin, autre conséquence importante de la mimésis de la fiction, qui est implicite aussi bien

dans l'allusion et dans la citation que dans la proximité esthétique du clip avec le cinéma, en

est la récupération du caractère artistico-créatif avec lequel on associe souvent le film (7e

art) par opposition à la télévision (souvent qualifiée de production banale).

Si bien le caractère artistique du chanteur-groupe est une condition de sa sensibilité

expressive, l'association de cette sensibilité au modèle de la créativité artistique audiovisuelle

que représente le cinéma en tant que média, vient renforcer la sensibilité artistique du Je-

Origine réel, le chanteur-groupe.

L'"effet de fiction" joue un rôle de légitimation artistique du chanteur-groupe.

"Par le biais du clip, le chanteur change de statut : il devient personnage, acteur ou artiste.

Tant qu'il est sur la scène, le chanteur peut n'être qu'un interprète de chanson, dès qu'il est

dans un film, il devient l'interprète d'un rôle." (Leblanc, G. et Jost, F, 1994, p. 96).

Chacun des trois aspects que nous avons vus (la mimésis esthétique, l'allusion et la référence

à la dimension artistique) permettent, dans le vidéo-clip, la production d'un puissant effet de

fiction, ce qui nous permet de dire que, si un énoncé de réalité feint se définit comme la

! l e ! j e ! l y r i que ! à ! l a ! t é l é v i s i on !

175 !

mimésis d'un énoncé de réalité, le clip peut constituer un exemple de la mimésis d'un énoncé

fictionnel.

Mais comment expliquer le déséquilibre entre le sujet d'énonciation (un Je-Origine réel) et

l'énoncé (la construction d'un monde imaginaire)?

C.! LE!CHANTEUR=GROUPE!COMME!JE!LYRIQUE!

A ce stade de l’analyse, nous avons pu caractériser le chanteur-groupe comme un Je-

Origine réel et comme étant le responsable de l'énonciation dans le vidéo-clip.

Mais nous avons également établi le fait, apparemment paradoxal, que malgré le

caractère réel du Je-Origine, la forme du clip est celle propre à un mode fictionnel,

qualité qui le distingue des autres documents de réalité que nous avons analysés dans

ce travail.

Cette inégalité entre le sujet d'énonciation (le chanteur-groupe) et l'objet énoncé (le

contenu du clip) nous indique que, dans le clip, la caractérisation du sujet

d'énonciation comme Je-Origine réel ne sera pas complète sans avoir défini,

auparavant, la relation entre le chanteur-groupe en tant que Je-Origine réel et le clip

en tant qu'objet énoncé d'apparence fictionnelle.

1.! LE!JE !LYRIQUE.!

Selon Käte Hamburger :

"La structure énonciative est une relation fixée sujet-objet. Le sujet d'énonciation n'énonce

qu'en relation à l'objet de son énoncé. (...) L'énonciation est l'énonciation d'un sujet

(d'énonciation) sur un objet énoncé". (Hamburger, K, 1986, p. 47).

De là que le caractère et la fonction de l'énoncé dépendent, exclusivement, du sujet

d'énonciation.

L'analyse de la relation entre le sujet d'énonciation et l'objet énoncé va permettre à

Hamburger d'établir l'existence de trois types de sujets d'énonciation réels, pour l'ensemble

des modalités communicationnelles12 possibles dans le système énonciatif de la langue : le

sujet d'énonciation historique, le sujet d'énonciation théorique et le sujet d'énonciation

pragmatique13.

Comme nous l'avons expliqué précédemment, le sujet d'énonciation historique se

caractérise par sa présentation sous la forme d'un "Je" en assumant le caractère d'un sujet

12 Hamburger (: 1986, pp. 42 à 56) définit l’énonciation communicationnelle comme celle à travers laquelle le

sujet d'énonciation fait de vraies assertions sur la réalité ou celle à travers laquelle on cherche à changer la réalité. Dans tous les cas, une énonciation communicationnelle cherche à avoir un effet sur la réalité.

13 Voir : Hamburger, K, 1986, pp. 46 à 62. Aussi chapitre III, p. X, de ce travail.

n i ! f i c t i on ! n i ! r é a l i t é !

176!

d'énonciation déterminé et individuel; le sujet d'énonciation théorique, au contraire, ne met

pas en jeu son "self" dans l'énonciation puisqu'il assume le caractère d'une généralité

transindividuelle, c'est-à-dire celle d'un sujet d'énonciation indéterminé; le sujet d'énonciation

pragmatique, enfin, se différencie des deux précédents par le fait qu'il produit des énoncés

qui ont comme but la transformation de la réalité.

Malgré les différences importantes entre ces trois catégories de sujets d'énonciation, un

élément fondamental les identifie. Dans tous les cas, l'énonciation s'adresse à l'objet énoncé,

c'est-à-dire qu'elle exerce une fonction sur l'objet, sur la réalité.

"Les énonciations des trois types, (...) sont axées sur le pôle-objet. Elles cherchent, pourrait-

on dire également, à exercer une fonction dans un contexte d'objet, qui est toujours

également un contexte de réalité, de quelque type que ce soit. (...) Même une énonciation

marquée au coin d'une forte subjectivité est axée sur son pôle objet ; dans la mesure où elle

est assertive, interrogative, optative ou jussive, elle a une finalité ou une fonction d'être

efficace dans le contexte que spécifie son contenu, l'objet énoncé : elle est assertive pour

informer, interrogative pour obtenir une information, jussive ou optative pour obtenir un

résultat". (Op. cit. p. 210)

C'est cette relation sujet/objet qui va définir l'ensemble des énoncés communicationnels.

Il existe, néanmoins, un type d'énonciation dans lequel l'énoncé n'est pas orienté vers le pôle

objet, comme dans le cas de l'énoncé communicationnel, mais vers le pôle sujet. Il s'agit du

poème, c'est-à-dire l'énoncé propre au Je lyrique.

"La relation lyrique sujet-objet se distingue d'un énoncé de type communicationnel, orienté

vers l'objet. Pour le poème, son objet n'est pas le but, mais l'occasion; autrement dit,

l'énoncé lyrique ne cherche pas à avoir une fonction dans un contexte d'objet ou de réalité".

(Op. cit. p. 234).

Comme nous l'avons vu dans le chapitre III, l'énonciation lyrique ne cherche pas à agir sur

l'objet mais s'adresse à la subjectivité du sujet d'énonciation. C'est-à-dire qu'elle utilise l'objet

comme un instrument qui lui permet de se concentrer dans la subjectivité sensible du poète

(sujet d'énonciation lyrique).

En d'autres mots, l'énonciation lyrique ne nous renvoie ni à la réalité de l'objet ni à sa mimésis

mais à la sensibilité du poète.

"Il cesse (...) d'être possible et légitime de se demander si le contenu d'un énoncé est vrai ou

faux, objectivement attesté ou non - nous ne sommes plus concernés que par le champ

d'expérience du Je s'énonçant lui-même". (Op. cit. p. 242).

Dans ce sens, l'énoncé lyrique, tout en étant réel, ne peut être comparé avec aucune autre

réalité (ni avec aucune autre non-réalité) qui ne soit celle de la réalité existentielle et

subjective du Je lyrique.

! l e ! j e ! l y r i que ! à ! l a ! t é l é v i s i on !

177 !

"Nous ne trouvons - ni n'attendons à trouver - dans le poème aucune vérité ou réalité

objectives. Ce que nous nous attendons à éprouver et à revivre est d'ordre subjectif,

nullement d'ordre objectif". (Op. cit. p. 236).

Un énoncé communicationnel de réalité est évalué toujours en fonction de sa comparaison

avec l'ensemble de la réalité. C'est pour cette raison que nous pouvons affirmer que tel ou

tel énoncé correspond à la vérité, à une fantaisie à un rêve ou à un mensonge.

"Le mensonge ou le rêve racontés à quelqu'un sont le champ d'expérience du Je menteur ou

rêveur, à cette réserve près que quand il ne s'agit pas de littérature (fiction14) nous sommes

en droit, puisque les énoncés en question sont présentés comme valant pour une réalité,

d'en soumettre le contenu à vérification. Or, ce droit, nous ne l'avons plus lorsque le Je

rêveur ou menteur se pose comme Je lyrique". (Op. cit. p. 242)

Par ailleurs, dans la mesure où la non-réalité de la fiction se construit toujours à partir de la

mimésis de la réalité, elle peut aussi être comparée avec la réalité. De là que l'univers créé

par la diégèse doive être cohérent, cohérence qui est toujours en rapport avec notre réalité,

ne soit qu'au niveau logique.

"La littérature fictionnelle est mimésis, parce que la réalité de la vie humaine est sa matière

première. Le remodelage qu'elle opère à partir de cette matière première, même s'il est si

absolu qu'il en devient surréel, est pourtant d'un autre type catégoriel que la transformation

opérée par le sujet lyrique sur l'objet de son énoncé, qui transforme la réalité objective en

une réalité subjective vécue, ce qui fait qu'elle subsiste en tant que réalité". (Op. cit. p. 249).

Ainsi, dans la mesure où l'énoncé lyrique ne peut être attribué qu'à la réalité de la sensibilité

d'un Je lyrique, celui-ci peut prendre les formes les plus variées et les plus extrêmes sans

perdre pour autant son origine sensible.

"Si en effet le Je lyrique a le pouvoir de donner forme à son énoncé en marquant qu'il n'est

pas orienté vers l'objet ou vers la réalité, il n'a pas le pouvoir de s'éliminer lui-même comme

sujet d'énonciation effectif, réel, de l'énoncé. L'objet, la référence réelle possible, peut être

métamorphosé par la saisie qu'en opère le sujet, mais ce même sujet, lui, ne peut pas l'être".

(Op. cit. p. 241).

C'est-à-dire que le Je lyrique est non seulement structurellement différent du Je-Origine fictif

et des autres catégories du Je-Origine réel mais, aussi, existentiellement plus sensible. C'est

justement cette sensibilité existentielle du Je lyrique qui constitue la qualité sur laquelle se

concentre son énonciation et, dès lors, l'objet énoncé n'est qu'une occasion pour l'expression

de cette sensibilité.

14 Comme nous l’avons déjà expliqué, son but étant la construction d’une théorie des genres littéraires,

Hamburger prend comme équivalent les concepts de “littérature” et de “fiction”. Cette équivalence est un des éléments qui nous permettent, à l’instar de Jost, d’utiliser la “Logique des genres littéraires” pour l’étude de l’énonciation télévisuelle et pour la construction d’une théorie des genres télévisuels.

n i ! f i c t i on ! n i ! r é a l i t é !

178!

2. LE!CHANTEUR=GROUPE!

Jusqu'ici, nous avions laissé en suspend la définition provisoire de Je-Origine "historique"

attribuée au sujet d'énonciation dans le clip. Tant que notre analyse se déroulait dans

le cadre de la théorie des genres télévisuels de Jost, nous ne pouvions pas le qualifier

autrement, étant donné que parmi les quatre catégories de sujet d'énonciation de

Hamburger15, celle de "sujet d'énonciation historique" est la seule reprise par le

théoricien français.

Par ailleurs, les caractéristiques générales du sujet d'énonciation historique semblaient

s'ajuster bien à la réalité du Je-Origine dans le clip. Le fait que le chanteur-groupe

mette en jeu son individualité dans l'acte d'énonciation, semble un indice fort dans ce

sens.

Pourtant, le discours à la première personne, l'adresse à la caméra et la prééminence

du chanteur-groupe ne sont que de simples caractéristiques esthétiques si elles ne

mettent pas en relation avec le type de configuration sujet/objet qui se produit dans le

clip.

Notre problème, dès lors, est d'identifier si le contenu du clip correspond à un énoncé

de type "assertif"16 ou à l'expression de la sensibilité du chanteur-groupe.

Pour établir le caractère de la relation sujet/objet dans le clip, nous allons examiner le cas du

vidéo-clip "Otherside" (Californication, 2000), du groupe rock-pop Red Hot Chili Peppers.

Le clip, qui reproduit l'univers onirique-surréaliste caractéristique de la peinture de Dali ou des

films de Buñuel17, est construit sur la base de deux séries intercalées. Une série correspond à

l'histoire et l'autre à l'interprétation de la chanson par le groupe.

Comme dans la plupart des clips, l'histoire construite à partir de l'image n'est ni la traduction

ni la réplique visuelle du contenu des paroles de la chanson. Dans ce sens, la narration

audiovisuelle repose sur la co-référence qui s'établit entre le contenu verbal de la chanson et

la séquentialité des images.

D'une part, le contenu des paroles de la chanson (voir tableau 6) correspond à l'expression

de la douleur et de l'angoisse d'un homme abattu, fatigué de vivre, qui pense au suicide. Il

ne s'agit pas d'une description ni de la narration d'un événement mais de l'expression

sensible et subjective de l'"état d'âme" du sujet qui soutient le discours à la première

personne.

Par ailleurs (voir tableau 5) l'image nous raconte l'histoire d'un jeune qui se réveille de sa mort

pour entrer dans le cauchemar d'un monde incohérent et plein de dangers qui l'agresse

jusqu'à le tuer à nouveau ; on le verra, à la fin du clip, gisant sur le sol dans la même position

qu'au début.

15 Les catégories de sujet d’énonciation proposées par Hamburger sont: historique, théorique, pragmatique et

lyrique. 16 "Énoncés de type communicationnel", selon Hamburger.

! l e ! j e ! l y r i que ! à ! l a ! t é l é v i s i on !

179 !

Tandis que se développe l'intrigue fictionnelle, nous voyons le groupe jouant le thème

musical, qui est la constante qui rallie les deux séries visuelles parallèles.

Otherside Red Hot Chili Pepper Californication 2000 Synthèse narrative des images : Première scène. Un jeune homme, avec deux ailes rouges en forme d'énormes lèvres, gît sur le sol. Deuxième scène. Une étrange ambulance le conduit à travers de chemins ténébreux vers un énorme building: il s'agit d'un hôpital. Troisième scène. Le jeune homme est porté dans une étrange salle d'opération où l'attendent médecins et infirmières. Un d'entre eux place un masque à gaz dans son visage. Aux yeux du jeune homme, la salle d'opération se transforme en dragon qui essaie de le brûler avec ses flammes. Le jeune lutte contre lui et s'échappe par un escalier qui tombe du plafond-ciel. Quatrième scène. Le jeune homme commence à monter d'un escalier à l'autre, puis dans le sens opposé, vers la droite et vers le bas. L'image nous montre un espace remplit d'escaliers. Le protagoniste arrive enfin à un appartement. Sur le mur, un tableau avec la figure de deux énormes lèvres rouges. Le jeune les regarde et soudain sa propre ombre prend vie et l'agresse. Une lutte commence entre le protagoniste et son ombre. Le jeune tombe sur le tableau, les bras ouverts, alors les lèvres se transforment en ailes qui s'accrochent à son dos et à ses bras. Le jeune fuit son ombre en volant dans les airs. Cinquième scène. Le protagoniste vole effrayé sur une étrange ville. Soudain, il est attaqué par un gigantesque corbeau noir. Il tombe, en planant, sur le bord d'un précipice. Le protagoniste, avec les ailes-lèvres cassées, tombe dans l'énorme précipice jusqu'à s'écraser sur le sol, où il reste dans la même position où nous l'avons trouvé au début de l'histoire.

T A B L E A U 5

otherside paroles de la chanson chorus: scarlet starlet and she's in my bed how long how long will i slide a candidate for my soul mate bled separate my side i don't push the trigger and pull the thread i don't believe it's bad i've got to take it on the otherside slit my throat take it on the otherside it's all i ever take it on i heard your voice through a photograph take it on i thought it up it brought up the past once you know you can never go back chorus i've got to take it on the otherside turn me on take me for a hard ride centuries are what it meant to me burn me out leave me on the otherside a cemetery where i marry the sea i yell and tell it that stranger things could never change my mind it's not my friend i've got to take it on the otherside i tear it down i tear it down take it on the otherside and then it's born again take it on take it on chorus chorus how long i don't believe it's bad slit my throat pour my life into a paper cup it's all i ever the ashtray's full and i'm spillin' my guts she wants to know am i still a slut i've got to take it on the otherside

T A B L E A U 6

L'univers diégétique surréaliste est assumé aussi bien par les actants de la "série fictionnelle"

que par les membres du groupe. Il y a non seulement la continuité esthétique de l'univers

mais également la présence, au niveau profilmique, d'objets absurdes ou d'actions

incohérentes des actants des deux séries, ce qui indique que les personnages fictionnels et

17 Univers similaire, aussi, à celui de "Wild Strawberries" d’Ingmar Bergman (: 1957), ou à celui de

"Spellbound" de Hitchock (: 1945).

n i ! f i c t i on ! n i ! r é a l i t é !

180!

les personnages réels partagent le même univers. Par exemple, les membres du groupe ne

jouent pas avec des instruments mais avec des câbles électriques sur les poteaux d'éclairage

(dans le cas de la basse électrique), avec une horloge giratoire fantastique au sommet

d'une étrange cathédrale (la batterie), avec une longue corde dans un corridor infini (la

guitare électrique). Le chanteur chante à l'intérieur d'une tour sombre qui domine une ville

grise, pleine d'énormes et étranges buildings.

Dans les deux séries, l'obscurité et le noir et blanc accentuent l'ambiance sordide, sombre et

menaçante du monde créé. En opposition à cela, la gamme de couleurs qui correspond au

héros de l'intrigue fictionnelle et aux membres du groupe nous indique qu'ils ne font pas

partie de ce monde.

Ce monde surréaliste sombre et menaçant est sans doute "the otherside" des paroles de la

chanson.

Comme nous le voyons, la séquentialité de l'image fonctionne, dans ce clip, comme une

illustration de la chanson mais non pas par la voie de la représentation iconique directe des

contenus verbaux mais par le chemin de la représentation du contenu sensible des paroles

de la chanson : la dépression, l'angoisse, la peur et la douleur.

Par exemple, tandis que les paroles de la chanson font référence au suicide, à travers la

variation sur la métaphore "go to take it on the otherside"18, dans le récit en images il n'y a

aucune allusion au suicide mais, au contraire, le héros fuit constamment le danger de mort.

Pourtant, aussi bien dans l'histoire que dans le monde diégétique construit dans les images

sous le topic "surréaliste-onirique"19, les éléments constitutifs en sont la représentation du

désespoir, de l'angoisse et de la solitude, éléments que l'on trouve aussi dans l'état d'âme qui

peut pousser quelqu'un à l'alternative extrême du suicide.

Ce qui est fortement indiqué à travers la médiation visuelle, c'est la référence à l'état d'âme

du sujet d'énonciation dans l'énoncé et non pas à un événement en particulier de la réalité

objective mentionnée dans les paroles de la chanson.

C'est-à-dire qu'une opération de substitution est réalisée, par équivalence sémantique,

similaire à la métonymie20, entre le contenu des paroles de la chanson et le contenu du récit

et la diégèse de la séquentialité de l'image. Dans les images, on remplace le contenu

"suicide" des paroles de la chanson par l'expression d'un état d'âme équivalent que l'on

dégage du contenu. Cette équivalence portée au niveau des images tourne autour des

différents éléments narratifs et diégétiques qui rendent compte du désespoir, de l'angoisse et

de la douleur du héros de l'histoire.

18 "Prendre de l'autre côté". 19 Il ne faut pas oublier que le surréalisme, en tant que courant artistique, a comme origine une critique sociale,

éthique et esthétique du monde de l’entre-deux-guerres. 20

! l e ! j e ! l y r i que ! à ! l a ! t é l é v i s i on !

181 !

Ainsi, la construction de sens dans le clip "Otherside" apparaît comme évidente. L'expression

de douleur, d'angoisse et d'abattement contenue dans les paroles de la chanson est

concrétisée, au niveau de l'image, par la construction d'un monde diégétique surréaliste et

menaçant, peuplé de fantômes, sorte de clichés psychanalytiques, que le cinéma a porté

souvent à l'écran (l'oiseau, le vol, les rêves obsessionnels,…) par le récit circulaire et

obsessionnel d'un jeune homme piégé dans un monde hostile et par les éléments esthétiques

de la mise en scène (irréalité du monde, obscurité et absence de couleur). Tous ces

éléments sont cohérents avec la visualisation d'un état d'âme de douleur, angoisse et

abattement.

La médiation visuelle correspond à la mise en images de l'état d'âme et de la sensibilité du

chanteur-groupe. Toute l'énonciation visuelle tourne autour de l'expression du responsable

de la parole et de la musique et, donc, la relation anaphorique entre l'objet énoncé dans la

chanson et l'objet énoncé dans les images (dans le récit et dans la diégèse), permet

seulement de déduire que les deux énoncés correspondent à l'expression sensible et

existentielle du chanteur-groupe et non pas à celle du réalisateur.

Aussi bien le contenu de la chanson que celui des images sont orientés vers le sujet

d'énonciation lui-même, vers l'expression de son état d'âme et de sa sensibilité. Tout en étant

un Je-Origine réel, le chanteur-groupe ne cherche pas à faire comprendre son énonciation

comme une assertion de la réalité mais, tout au contraire, comme le Je lyrique, il construit

son énonciation en fonction de sa réalité sensible et subjective.

"L'énoncé lyrique n'a pas de fonction dans la réalité, n'est pas une communication". (Op. cit.

p. 245).

Dans la mesure où le chanteur-groupe assume un discours à la première personne et

s'adresse à la caméra en mettant en jeu son identité et son individualité dans l'énonciation

(tel que la plupart des sujets d'énonciation responsables de la médiation verbale à la

télévision), il semblerait juste de le classer dans la catégorie de sujet d'énonciation "historique"

proposée par Jost à partir de Hamburger.

Pourtant, à la différence de l'énonciation des Je-Origine historiques à la télévision,

l'énonciation dans le clip "Otherside", met en jeu davantage la sensibilité du chanteur-

groupe que son individualité. L'énonciation de ce clip ne peut pas être évaluée à partir de

critères de vérité ou mensonge. Il ne s'agit pas de l'assertion d'un sujet d'énonciation

historique sur la réalité de son état d'âme et de ses sentiments (ou la mimésis de cela). Au

contraire, le contenu du clip, dans son ensemble visuel, verbal et sonore, est l'expression

subjective de la sensibilité du sujet d'énonciation, le chanteur-groupe. Aussi bien le contenu

métaphorique de la chanson que le récit et la diégèse en images, sont l'occasion pour

exprimer la sensibilité du chanteur-groupe.

n i ! f i c t i on ! n i ! r é a l i t é !

182!

Si la relation entre le sujet et l'objet dans le clip "Otherside" est équivalente à celle qui existe

dans l'énonciation lyrique, elle devient un argument de poids pour affirmer que le sujet

d'énonciation dans ce document télévisuel n'est pas un sujet "historique" mais un sujet

"lyrique".

Considérée dans la perspective du caractère ontologique du Je-Origine, notre analyse

de l'énonciation dans le clip va prendre un sens absolument différent de celui que nous

lui avions donné dans le chapitre précédent.

L'incorporation de la catégorie du Je-Origine lyrique à l'analyse va nous permettre

d'expliquer, de manière beaucoup plus complète et plus claire, le processus de

compréhension spectatorielle associé au vidéo-clip et de disposer, ainsi, des éléments

distinctifs qui permettront la classification du clip comme genre télévisuel.

Si le Je lyrique est une constante de l'énonciation dans le clip, cela va nous permettre

de le distinguer nettement de l'énonciation d'un sujet d'énonciation historique et du

discours d'un Je-Origine fictif à la télévision. Mais, en outre, le fait que l'énoncé lyrique

soit toujours une référence à la sensibilité du Je-Origine lyrique, empêche la constitution

des modes d'énonciation authentifiant, fictif et ludique.

Revenons un moment à notre fameux clip "Ex-girlfriend" du groupe No Doubt.

Dans le chapitre précédent, nous avions établi, partant du modèle de Jost, que l'énonciation

dans le clip "Ex-girlfriend" correspondrait à la juxtaposition des trois modes d'énonciation : la

série un ("récital live") réalisée sous un mode d'énonciation "authentifiant", la série deux

("l'histoire d'agents secrets et mafieux") réalisée dans le mode d'énonciation "fictif", la

pulsionnalité rythmique de la musique ("thème musical du genre pop") réalisée dans le mode

d'énonciation "ludique".

Dans la mesure où les catégories des modes d'énonciation de Jost ne sont pas symétriques

de celles de Je-Origine, le fait que ces trois modes d'énonciation différents soient configurés

à l'intérieur du même document télévisuel ne veut pas dire qu'ils puissent être renvoyés à trois

types de Je-Origine.

Bien qu'un mode d'énonciation authentifiant ne puisse correspondre à l'énonciation d'un Je-

Origine réel et qu'un mode d'énonciation fictif nous renvoie seulement à un Je-Origine fictif,

le mode d'énonciation ludique ne correspond pas à une troisième catégorie de Je-Origine,

car il s'agit d'une sous-catégorie du Je-Origine réel :

"Il y a des Je-Origine réels qui répondent eux-mêmes de leurs assertions en vertu des règles

qui les régulent, il y a des Je-Origines réels qui sont soumis à des règles ou à des rites qui

les dépassent". (Jost, F, 1998, p. 36).

! l e ! j e ! l y r i que ! à ! l a ! t é l é v i s i on !

183 !

C'est-à-dire, aussi bien la série 1 du clip (mode authentifiant) que les effets "perlocutoires »21

de la musique (mode ludique) peuvent être attribués seulement à la catégorie des Je-

Origine réels.

Dès lors, dans le clip "Ex-girlfriend" les deux catégories de Je-Origine seraient représentées. Un

Je-Origine fictif, responsable de l'énoncé, dans la série 2, et un Je-Origine réel, responsable

de la série 1 et de la musique, deux types de Je-Origine qui partagent la responsabilité

globale de l'acte énonciatif.

Pourtant, une conclusion comme celle-ci est non seulement logiquement impossible à

l'intérieur du modèle proposé par Hamburger, mais, en outre, elle ne correspond pas à la

réalité phénoménologique qui se dégage de ce document télévisuel.

Cherchant à déterminer le ou les mode(s) d'énonciation dans ce clip et dans les autres clips

analysés, nous n'avions pas eu à approfondir le problème du paradoxe que représente

l'existence de Je-Origine de différent signe comme responsables, en même temps, d'un

même énoncé.

L'impossibilité logique d'attribuer, de façon simultanée, la responsabilité d'un énoncé aux

deux types de "Je" est donnée par l'opposition, dans le modèle de Hamburger, entre les deux

catégories de Je-Origine qu'elle définit comme suit :

"La disparition d'un Je-Origine réel, d'un sujet d'énonciation, est l'élément structurel essentiel

qui définit un monde fictif". (Hamburger, K, 1986, p. 126)

Même dans le cas de la lecture "documentarisante"22 d'une fiction ou de la lecture

"fictionnalisante"23 d'un document authentifiant, pour la compréhension du document, le

téléspectateur le renvoie à un seul type de Je-Origine à la fois.

Si, comme nous l'avons vu, la possibilité de coexistence de différents modes d'énonciation ne

représente pas un problème logique dans le modèle de Jost, leur attribution aux deux Je-

Origine de différent statut est paradoxal, même dans les marges de sa proposition.

Ce paradoxe n'est pas évident lorsqu'on analyse séparément chacune des séries du clip.

Ainsi, le responsable de l'énonciation dans la série 1 est un Je-Origine réel (que nous

qualifions provisoirement d'"historique") représenté par le groupe No Doubt mais, surtout, par

la chanteuse Gwen Stephani du fait que les paroles de la chanson sont dites à la première

personne du féminin et du fait aussi qu'elle chante en regardant la caméra; dans la série 2, le

responsable de l'énonciation est un Je-Origine fictif, représenté par le narrateur

21 Comme nous avons dit dans les chapitres III et IV, d’après Jost le mode d’énonciation ludique se caractérise

par le fait d’être "plutôt tourné vers les effets perlocutoires du discours que sur l'intention qui le sous-tend". (: 1998, p. 34).

22 Voir : Odin, R, "De la Fiction", De Boeck & Larcier s.a., 2000. 23 Op. cit.

n i ! f i c t i on ! n i ! r é a l i t é !

184!

intradiégétique-homodiégétique, l'"héroïne", dont la fonction est, justement, de soutenir le

récit à la première personne (focalisation interne primaire) les actions n'y étant pas soutenues

par un dispositif technique télévisuel; par rapport à la musique, le responsable c'est le groupe

dans son ensemble (non seulement la chanteuse), c'est-à-dire un Je-Origine réel que nous

qualifions provisoirement de "ludique" dans la mesure où la pulsionnalité rythmique de la

musique du thème musical interprété renvoie à la danse et à l'amusement.

Pourtant, à partir du moment où nous considérons le clip "Ex-girlfriend" comme une unité

signifiante, le problème du statut du Je-Origine responsable de l'ensemble de l'énonciation

apparaît clairement.

Dans la série 1 ("le récital live"), nous voyons et nous entendons Gwen Stephani et son groupe

faire ce que nous attendons d'une chanteuse pop avec son groupe : chanter une chanson

pop, cette fois dans un récital live. Dans la série 2, nous voyons et nous entendons Gwen et

son groupe interpréter des personnages d'une intrigue fictionnelle. Pourtant, même dans le

cas où nous voyons les deux séries s'intercaler dans un montage parallèle, ce qui revient à

dire que le monde fictionnel se mêle au réel, le statut réel de l'énonciateur n'est pas mis en

question. Dans la mesure où nous voyons et entendons les musiciens faire ce que nous

attendons d'eux – interpréter une chanson – le fait de les voir jouer dans une intrigue

fictionnelle ne les situe pas en tant que personnages mais en tant qu'acteurs jouant un rôle.

Si les deux séries fonctionnent séparément, chacune dans un mode d'énonciation différent,

la présence ensemble des actants réels et fictionnels et la simultanéité des deux modes

empêche l'activation d'un monde diégétique fictionnel cohérent. Comment construire un

monde diégétique fictionnel si les personnages, parmi lesquels l'héroïne – la chanteuse Gwen

Stephani – et l'antihéros – le bassiste Tony Kanal – nous sont présentés comme les sujets réels

qu'ils sont et dans leur activité réelle, celle de musiciens d'un groupe pop-rock?24

Pourtant, ce même fait, c'est-à-dire la présence simultanée d'actants réels et fictionnels,

empêche aussi la constitution d'un mode authentifiant. Tout comme la présence des Je-

Origine réels désactive le mode fictif, la présence des Je-Origine fictifs désactive le mode

authentifiant, ce qui ne veut pas dire que le Je-Origine réel disparaisse.

24 Ceci ne veut pas dire que le mélange de personnes et de personnages, c’est-à-dire des actants réels et des

actants fictionnels, ait toujours comme résultat la subordination de l’énonciation fictionnelle à celle de la réalité. C’est justement le contraire que nous voyons, par exemple, dans Forrest Gump (Robert Zemeckis, 1993). La différence entre ce film et notre vidéo-clip, c’est que, dans le premier, les personnes que nous voyons (Kennedy, Johnson, Nixon, etc.) ne démentent pas le Je-Origine fictif, puisqu’ils ne sont pas responsables de l’énonciation. Ils sont, au contraire, racontés, objets de l’énonciation et non sujets; ils ne sont pas considérés comme des personnes mais comme des référents qui permettent la construction aussi bien de l’effet de réel que l’effet de réalité. Par contre, dans “Ex-girlfriend”, les sujets d’énonciation réelle, les membres du groupe, nous sont présentés comme responsables de l’énonciation. C’est-à-dire qu’ils sont, en même temps, sujets d’énonciation (Série 1) et objets énoncés (Série 2). Leur qualité de Je-Origine réels se voit ainsi confirmée par la double activité de chanteurs et acteurs.

! l e ! j e ! l y r i que ! à ! l a ! t é l é v i s i on !

185 !

Étant donné que le mode d'énonciation authentifiant correspond aux programmes que

soutiennent de vraies assertions sur notre monde, celles-ci sont sujettes à leur évaluation en

termes de vrai/faux :

"Je parle (...) de mode authentifiant plutôt que de mode informatif car, au-delà des émissions

qui nous donnent des nouvelles du monde, de son actualité, il désigne tous les programmes

qui relèvent d'un discours de vérité et que nous interprétons sur l'axe vrai-faux". (Jost, F,

2001, p. 20).

En d'autres mots, la construction de sens au niveau spectatoriel du clip "Ex-girlfriend" dans son

ensemble, et non comme deux séries séparées, l'intention énonciative ne peut pas être

attribuée aux assertions sur la réalité dans la mesure où on nous présente, dans la série 2,

l'invraisemblable d'une opération secrète réalisée par les musiciens transformés en agents

secrets et mafieux.

C'est justement pour cette raison que le fait que la série 1 soit ou non considérée, à la

réception, comme étant un vrai direct préparé extra-télévisuel25 n'a pas une grande

importance pour la compréhension globale de l'acte d'énonciation.

Enfin, comme nous l'avons dit auparavant, le genre pop dans lequel est réalisée la musique

du thème et du clip "Ex-girlfriend" renvoie au divertissement et à la danse, effets propres au

mode ludique. Pourtant, aussi bien dans la séquentialité de l'image que dans les paroles de

la chanson, les indices qui émergent indiquent ostensivement le drame et la tragédie, c'est-

à-dire à des effets qui sont le contraire de divertir ou de "faire rire" indiqués par Jost pour ce

mode d'énonciation.

Nous ne voyons pas dans l'interprétation du thème (série 1) ni dans celle de l'intrigue (série 2)

des éléments qui permettent de déduire une intention ludique. Pendant presque toute la

durée de l'histoire de la série 2, l'héroïne, de toute évidence, souffre. Elle pleure en regardant

la photo, en se souvenant de son amant, en préparant l'opération d'annihilation et après

l'avoir abattu, elle pleure encore. Dans la série 1, il est possible d’attribuer à la chanteuse, un

sentiment équivalent à celui de l'héroïne dans la série 2, et ce à partir de ses expressions et

de la dramatisation de son interprétation live.

Comme nous voyons, dans "Ex-girlfriend" les trois modes d'énonciation de Jost sont

désactivés. Si les deux séries, séparément, nous renvoient aux trois modes d'énonciation

qu'il propose, cela n’est plus possible lorsque nous nous plaçons dans la perspective de

la responsabilité énonciative de l'ensemble du clip.

Dès lors, si nous situons notre analyse d'"Ex-girlfriend" au niveau du caractère

ontologique du sujet d'énonciation, aussi bien la série 2 que l'ensemble de l'énonciation

25 Nous sommes en mesure d’avouer maintenant que la série 1 du clip "Ex-girlfriend" est un faux "direct

préparé extra-télévisuel". Cette série fut enregistrée dans un set cinématographique avec la participation de nombreux figurants.

n i ! f i c t i on ! n i ! r é a l i t é !

186!

de ce clip, acquièrent un sens absolument différent de celui que nous lui avions

attribué dans le chapitre précédent.

Voyons :

Les paroles de la chanson "Ex-girlfriend" représentent l'expression de dépit et de rage d'une

jeune femme abandonnée par son amoureux, jeune femme que nous identifions avec la

chanteuse que nous voyons chanter en regardant la caméra et soutenant un discours à la

première personne du féminin. Elle se sent jalouse et se reproche le fait d'être tombée

amoureuse, en sachant que tôt ou tard, il l'abandonnerait pour une autre (Voir tableau 3,

chapitre V).

C'est justement l'expression de ce sentiment de rage, de jalousie et de dépit qui est au

centre de l'énoncé construit dans ce vidéo-clip. Ce sentiment, exprimé dans la chanson et

dans la série 1 par la chanteuse qui chante prend la forme d'une opération secrète

d'élimination de son ex-petit-ami dans la série 2 (Voir tableau 3, chapitre V). Ce qui revient à

dire que ce clip prend la forme élémentaire qui est derrière le topic "agents secrets et

mafieux" : "la lutte contre le mal et le châtiment du scélérat."

Mais, en outre, l'axe dramatique dans lequel est réalisée la série 2, est celui de la tragédie. La

chanteuse-héroïne vit l'opération d'élimination de son ex-petit-ami comme une situation

douloureuse. Elle n'est pas heureuse de l'éliminer mais elle doit le faire. Comme nos l'avons

dit, on la voit pleurer pendant presque toute l'intrigue. La fin de l'histoire est éloquente : ils

tombent tous deux dans le vide, par une fenêtre du building, c'est-à-dire que – comme une

métaphore du sentiment de jalousie qui cause de la douleur autant à celui qui est l'objet de

ce sentiment qu'à celui qui le vit – l'élimination de l'ex-amoureux a comme résultat la "mort"

des deux amants. La trahison est ainsi punie mais dans l'acte de châtiment, la douleur est

mutuelle, comme dans la tragédie.

Comme dans "Otherside", la substitution du contenu sensible de la chanson est réalisée dans

"Ex-girlfriend" à travers l'incorporation d'un récit au niveau des images qui est sensiblement

équivalent à celui des paroles de la chanson.

Ainsi, à travers la relation anaphorique entre les deux séries et les paroles de la chanson,

l'ensemble du clip construit la pertinence de l'attribution de l'énoncé à la sensibilité de la

chanteuse. C'est-à-dire à un Je lyrique.

L’opération de substitution, par équivalence, du contenu sensible de la chanson par

son équivalent en images (que nous avons déjà pu voir par rapport au clip "Otherside")

fonctionne, à des degrés variables, dans tous les clips que nous qualifions, dans le

chapitre précédent, de "fictionnels", "ludiques" ou "méta-énonciatifs" mais aussi dans le

cas de ceux qui, comme "Ex-girlfriend", correspondent à une apparente "juxtaposition"

ou "combinaison" des modes d'énonciation de Jost.

La raison de tout cela est que, dans ce type de clips, il y a une mise en scène, plus ou

moins complète, plus ou moins importante, d'une intrigue au niveau de l'image. Soit par

l'introduction de personnages fictionnels ou réels, soit par la création d'un monde

! l e ! j e ! l y r i que ! à ! l a ! t é l é v i s i on !

187 !

diégétique, soit par l'allusion ou la citation, une relation se construit toujours entre le

contenu sensible des paroles de la chanson et la séquentialité des images.

Pourtant, cette opération de substitution n'est pas aussi évidente dans deux variantes

"extrêmes" de vidéo-clips. D'une part, dans les clips que nous avons catégorisés comme

appartenant au mode d'énonciation "authentifiant", dans lequel le chanteur-groupe

occupe tout le protagonisme de l'image, des paroles et de la musique, et d'autre part,

dans ceux qui remplissent la double condition de ne pas avoir de chanson mais un

thème exclusivement instrumental et de ne pas voir figurer le groupe dans l'image.

Dans le premier cas, l'opération de substitution ne se réalise simplement pas car on y

remplace l'opération métonymique de substitution par l'accès direct à la réalité

sensible du chanteur dans l'interprétation du thème musical. Dans la deuxième, par

contre, la substitution du contenu sensible de la chanson par équivalence dans l'image

se fait de manière beaucoup plus complexe mais avec autant de succès.

L'utilisation d'éléments épitextuels, comme les crédits du thème musical qui sont donnés

aussi bien au début qu'à la fin du clip, est un recours qui va, inévitablement, construire

le rapport du thème avec ses interprètes, indépendamment du fait que nous les

voyions ou non à l'écran. Cela fonctionne de manière similaire dans tous les types de

clip. Pourtant, et bien que cette opération de référence aux auteurs soit une norme de

la communication dans le clip, il y a d'autres indices qui vont permettre de construire

l'hypothèse d'un Je lyrique pour les cas dans lesquels la substitution par équivalence

n'existe pas ou devient plus difficile à réaliser.

- Comme nous l'avions indiqué, le clip "Nothing Else Matters", (single, 1999) du groupe

hard rock Metallica, est réalisé entièrement à partir du topic "récital live". Ce fait et l'absence,

dans le modèle de Jost, d'autre possibilité typologique pour un énoncé de réalité non

ludique, nous amène à le considérer comme "authentifiant". Dans ce clip, on n'inclut pas

d'autres images qui ne soient celles du groupe interprétant le thème musical ou celles du

public qui suit l'interprétation.

A la différence des autres clips qu'incluent, à des degrés variables, des mondes diégétiques

créés, dans les clips construits sous le topic "récital live" ou "direct préparé", l'effet de fiction

est minime. C'est la médiativité télévisuelle qui devient ici l'axe de pertinence principale pour

l'interprétation de ces documents.

Dans ce type de clips, dans lesquels on montre le groupe interprétant le thème musical, que

ce soit un récital live ou en studio dans un lieu quelconque, l'énonciation visuelle se

concentre dans l'acte de l'exécution et interprétation du thème musical par le chanteur-

groupe. En d'autres termes, c'est la médiation verbale-musicale qui occupe le centre dans

l'acte de l'énonciation car c'est là que l'image nous montre directement le chanteur-groupe

dans l'acte d'expression de sa sensibilité.

L'abondance de plans américains et moyens (qui nous montrent le groupe de près lors de

l'interprétation), de gros premiers plans, généralement sur le visage du chanteur (que l'on

nous montre jusque dans ses plus petits gestes) et de plans de détail, par exemple, de plans

serrés sur la main qui pousse les touches du synthétiseur (qui nous montrent dans le détail

n i ! f i c t i on ! n i ! r é a l i t é !

188!

l'exécution par le musicien), cherchent à décrire la virtuosité, l'émotion ou les conditions

d'exécution du thème musical par les musiciens. En d'autres termes, ils cherchent à découvrir

l'expression sensible des musiciens dans l'acte d'interprétation du thème musical.

Cette description vient, souvent, accompagnée de la dramatisation de l'acte

d'interprétation de la chanson. Depuis les véritables mises en scène cinématographiques des

thèmes musicaux habituelles dans les "clips-recitals"26 de Pink Floyd ou de Peter Gabriel,

jusqu'aux plus intimes mais éloquentes expressions qui se reflètent dans le visage de XXX, dans

le clip CCCCC (/LIKKJ, 2000).

Cette dramatisation a une fonction similaire à celle de la substitution par équivalence, car le

chanteur interprète l'"émotionnalité" du thème de la chanson.

A la différence de ce qui arrive avec l'interprétation d'un rôle par un acteur, où l'émotion

interprétée ne peut être attribuée qu'au personnage et non à la personne qui l'interprète27,

dans le cas d'un chanteur qui interprète un thème musical, il est impossible (et inutile) de dire

si elle correspond à une émotion authentique du chanteur ou à sa mimésis dramatique. Dans

la mesure où le chanteur est inséparable de la chanson, il ne nous est pas possible de tracer

la frontière entre sa sensibilité et celle exprimée dans l'énoncé de la chanson.

Par la voie de la description de l'acte d'exécution et d'interprétation du thème, ce type de

clips nous permet, non seulement d'accéder directement au contenu sensible de l'énoncé

verbal-musical mais aussi d'être en contact avec l'émotion du chanteur-groupe dans l'acte

d'interprétation du thème musical.

Dans ce sens, la seule différence entre un vidéo-clip réalisé dans le topic "direct préparé

extra-télévisuel" et un direct préparé télévisuel d'un récital live, réside dans le fait que le

premier type d'émission – les vidéo-clips – est programmé de manière habituelle et se limite à

la durée de la chanson, le deuxième concerne les programmes de caractère "spécial", c'est-

à-dire, une émission non habituelle qui occupe, en règle générale, la place d'un ou plusieurs

programmes28 et qui, en outre, ne se limitent pas à la présentation d'un thème mais

présentent un ensemble plus ou moins vaste de thèmes.

Cette différence contextuelle n'est pas sans importance et va au-delà d'une question

formelle. La présence29 et l'action de l'énonciateur audiovisuel dans un direct préparé sur un

récital live est plus grande et plus indépendante que celle qu'il joue dans un clip. S'agissant

d'un programme spécial, l'importance de sa transmission par une chaîne particulière conduit

26 Dans le cas du groupe anglais Pink Floyd, nous pouvons considérer les clips faits à partir des récitals du

groupe. Par exemple "The Wall" (The Wall, 1994). Par rapport à Peter Gabriel, un exemple en serait le clip "Come Talk To Me" (Secret World Live, 1992).

27 Seul un esprit perturbé pourrait attribuer à Anthony Hopkins la sensibilité d’Hannibal Lector dans "The Silence of the Lambs" (Jonathan Demme, 1991).

28 C’est le cas de la plupart des “spéciaux” à la télévision. 29 Présence relative à la présence du chanteur-groupe.

! l e ! j e ! l y r i que ! à ! l a ! t é l é v i s i on !

189 !

celle-ci à un protagonisme énonciatif plus important que dans le clip. Celle qui est

concernée comme responsable d'une transmission de ce genre n'est pas la télévision en

général – "télévision en tant que média" – mais une chaîne en particulier qui, sans ôter le

protagonisme au chanteur-groupe, doit prendre une responsabilité plus grande et cela en

rapport à son "identité" spécifique.

Par contre, dans un clip comme celui que nous avons signalé, la concentration de l'acte

communicationnel dans le chanteur-groupe est totale aussi en raison de la problématique

de restriction du temps audiovisuel à la durée limitée de la chanson.

- Le cas des vidéo-clips dans lesquels l'interprétation du thème musical est exclusivement

instrumentale et dans lesquels les interprètes ne figurent pas dans l'image, la référence à la

sensibilité existentielle du chanteur-groupe est réalisée par la voie de la construction d'une

qualité sensible, à long terme (c'est-à-dire, dans le temps entre l'un clip et le suivant), à

travers la réitération d'éléments narratifs, diégétiques ou esthétiques qui peuvent être

renvoyés à une personnalité dotée d'une sensibilité créative ou artistique déterminée.

Comme nous l'avons vu dans le point A.2.a de ce chapitre, le groupe "Fatboy Slim"

construisait son identité à partir de la réitération d'un style musical particulier au niveau du

son et à partir d'une thématique et une esthétique visuelles constantes, au niveau des

images. Cette constance sonore, visuelle et thématique sont trois éléments importants de

différenciation de ce groupe par rapport aux autres groupes techno.

Par exemple, dans les trois derniers clips de ce groupe, le thème commun qui se dégage de

la séquentialité des images pourrait être défini comme "les effets fantastiques de la musique

de 'Fatboy Slim'". Dans le premier "Right Here, Right now" (You've Come Along Way, Baby,

1998), la musique est la cause de l'évolution des espèces. A partir d'une cellule dansante et

jusqu'à l'homo sapiens, en passant par les grands dinosaures et les singes, tous évoluent

grâce au rythme de la musique du groupe, qui ne cessent de danser. Dans le deuxième clip

"Weapon of Choice" (Halfway Between tha Gutter and the Stars, 2000), nous voyons Un home

taciturne assis sur une chaise avec le regard perdu dans l'infini. Une fois que le thème musical

commence, il se lève peu à peu et se met à danser, jusqu'à s'envoler. Lorsque le thème finit, il

revient à sa position initiale. Dans le clip "Ya Mama" (Halfway Between tha Gutter and the

Stars, 2000), la musique s'introduit dans le corps des personnes et les fait danser, elle va

jusqu'à leur faire perdre le contrôle de leurs mouvements. Les corps bougent au rythme de la

musique, indépendamment de leur volonté. Dans les trois cas, la musique du groupe

provoque, auprès de ceux qui l'écoutent, des effets fantastiques.

Comme nous l'avons dit, dans la mesure où la responsabilité énonciative du clip correspond

à la figure du chanteur-groupe, la réitération thématique dans l'image ne peut qu'être

attribuée à une intention énonciative de ce sujet d'énonciation. S'il n'était pas possible

d'établir une relation entre les trois clips, autre que celle d'avoir un même responsable de

l'énonciation signalé dans le para-texte, la construction d'une intentionnalité narrative serait

n i ! f i c t i on ! n i ! r é a l i t é !

190!

plus difficile, voire impossible. Dans ce sens, la réitération thématique dans les clips du groupe

"Fatboy Slim" correspond à une ostension énonciative qui, nécessairement, doit correspondre

à une intention communicationnelle ou à une intention sensible.

Tandis qu'une intention énonciative communicationnelle cherche à agir sur l'objet, c'est-à-

dire sur la réalité de l'objet énoncé, une intentionnalité énonciative sensible est l'énonciation

d'un sujet à propos de lui-même, c'est-à-dire qu'elle correspond au sujet d'énonciation qui

s'annonce de cette façon.

Le caractère fantastique et volontairement artificiel des éléments qui constituent le discours

dans chacun de ces clips, ne permettent pas de supposer que le chanteur-groupe prétende

faire des "vraies assertions" sur le monde ou construire un monde fictionnel cohérent.

Au contraire, la persistance thématique et celle des aspects stylistiques de l'image et de la

musique dans ce clip, sont une ostension qui permet de construire une intention sensible qui,

tout en étant d'ordre général, correspond à une subjectivité que nous pouvons attribuer au

groupe. Plutôt qu'une intention communicative, ce qui se dégage de l'énoncé dans les trois

clips, c'est l'existence d'une intention sensible dans l'énonciation.

D.! A!LA!RECHERCHE!DU!MODE!PERDU!

Dans le chapitre précédent (V), nous avons défini la caractéristique énonciative plus

particulière du clip, à savoir sa "transgénéricité", ce qui expliquait sa capacité à se

structurer dans n'importe quel mode d'énonciation parmi ceux définis par Jost :

authentifiant, fictionnel, ludique ou combiné.

Pourtant, ce même constat nous a amenés à établir que la " transgénéralité" ne

correspondait pas à un mode d'énonciation mais, bien au contraire, à l'absence de

mode d'énonciation propre.

Cette conclusion représentait un paradoxe, étant donné que sa conséquence directe

était que, même s'il peut prendre la forme énonciative de n'importe quel mode défini,

on ne pouvait pas, dans le modèle de Jost, classer le clip en tant que genre.

Par ailleurs, la "transgénéralité" ne permettait pas non plus d'expliquer comment et

pourquoi, malgré l'absence d'un mode d'énonciation propre, le clip est parfaitement

interprété et compris, au niveau spectatoriel, de manière indubitable comme un clip et

non comme une publicité, un vidéo-art, un opéra rock ou un quelconque autre genre

télévisuel dans lequel la musique est utilisée de manière intensive.

L'incorporation à la théorie des genres télévisuels de Jost, du Je-Origine lyrique incarné

par la figure du chanteur-groupe s'est avéré une solution à ce paradoxe.

S'agissant d'une catégorie très particulière de Je-Origine réel, caractérisée par sa

sensibilité existentielle inséparable de l'objet énoncé, le Je lyrique correspond à un sujet

d'énonciation différent de tous ceux que nous avons mentionnés jusqu'ici.

! l e ! j e ! l y r i que ! à ! l a ! t é l é v i s i on !

191 !

Dans ce cas, il manquait au modèle de Jost non seulement une catégorie de sujet

d'énonciation mais aussi, et comme corollaire à cela, le mode d'énonciation propre au

Je lyrique.

A partir du moment où il est possible de définir un mode d'énonciation propre au Je

lyrique, la " transgénéralité" du mode d'énonciation dans le clip s'efface. C'est-à-dire

que si le mode d'énonciation qui correspond au Je lyrique télévisuel est différent de

ceux proposés par Jost, nous ne pourrions plus envisager l'existence de vidéo-clips dans

un mode d'énonciation authentifiant, fictionnel, ludique, méta-énonciatif ou combiné.

Prisonnier de la trilogie authentifiant-fictionnel-ludique, le modèle de Jost nous avait obligé,

dans le chapitre précédent, à conclure à la " transgénéralité" qui, comme nous venons de le

voir, ne nous permet pas de catégoriser le clip à partir du mode d'énonciation.

Selon Jost (: 1998, p. 42), le mode d'énonciation définit une promesse de rapport avec un

monde. Ainsi, le mode authentifiant correspond à la promesse d'authenticité (direct non

préparé) ou de lisibilité accrue du réel (direct préparé et documentaire); au mode fictif

correspond une promesse de pertinence narrative du visible et de l'audible par rapport à la

compréhension de l'intrigue (film, téléfilm et série); au mode ludique correspond la promesse

de divertissement et de respect des normes :

"Le mode authentifiant regroupe les émissions qui tiennent de vraies assertions sur notre

monde, qui nous donnent des informations pour en améliorer la connaissance et qui

relèvent, en dernière instance, d'un exercice de la preuve (...) Le mode fictif ne s'appuie pas

sur la vérité du discours, mais sur la cohérence de l'univers créé avec les postulats et les

propriétés qui le fondent (...) Il existe, entre les deux, un nouvel intermédiaire, où la réalité

n'est pas tout à fait prise pour ce qu'elle est et où se constitue un monde qui obéit à ses

propres règles et à ses propres codes comme la fiction : je le nome le ludique. (...)Au 'pour

de vrai' du mode authentifiant, au 'pour de faux' du fictif, ce mode oppose un 'pour de rire',

plutôt tourné vers les effets perlocutoires du discours que sur l'intention qui le sous-tend".

(Jost, F, 1998, p. 34).

Pourtant, le mode d'énonciation dans le clip ne peut pas être classé dans aucune de ces

trois catégories modales.

Si nous nous fions aux apparences, le premier réflexe est de catégoriser le clip comme

appartenant au mode ludique. Dans la mesure où une des utilisations sociales les plus

fréquentes de la musique moderne est le divertissement, ce mode d'énonciation semble être

adéquat pour caractériser ce type de productions audiovisuelles. Mais une proposition

comme celle-ci ne peut reposer que sur une approximation esthétique du problème et sur

une conception partielle de ces documents télévisuels, et elle ne peut plus être soutenue

lorsque nous approfondissons l'analyse de l'énonciation.

Comme nous l'avons vu, dans un clip comme "Otherside" (Californication, 2000) du groupe

rock américain Red Hot Chili Peppers, aucun élément du discours ne peut être interprété

comme ayant l'intention de divertir ou de faire rire. Ni la musique (une balade) ni les paroles

n i ! f i c t i on ! n i ! r é a l i t é !

192!

de la chanson, qui correspondent à l'expression d'angoisse et de désespoir, ni les images qui

nous racontent l'histoire surréaliste d'un jeune qui revient de la mort pour mourir à nouveau.

Une autre réaction ensuite, serait de le catégoriser comme mode fictif, puisque dans la

plupart de ces documents, l'univers diégétique construit par le discours ne correspond pas à

notre monde réel. Pourtant, la fictionnalité du monde construit dans le clip est désactivée par

la persistance et la prééminence du Je-Origine réel qui est le chanteur qui, par l'intermédiaire

de sa présence principale, ne permet pas la réalisation complète des Je-Origine fictifs.

Si le vidéo-clip ne peut être rangé dans aucun des modes d'énonciation précédents, une

autre possibilité de le catégoriser est le mode authentifiant. Un élément qui irait dans ce sens

en est son caractère de réel donné par le fait que la figure du chanteur-groupe responsable

de la médiation verbale et musicale de tout le clip correspond à un Je-Origine réel. Pourtant,

loin de soutenir de "vraies assertions sur notre monde, qui nous donnent des informations pour

en améliorer la connaissance et qui relèvent, en dernière instance, d'un exercice de la

preuve", le discours du clip ne représente pas autre chose que la subjectivité du chanteur ou

du groupe. Subjectivité qui n'a pas pour but l'authentification de l'objet communiqué.

Enfin, il n'est pas possible non plus de considérer l'énonciation dans le clip comme similaire à

celle d'un énoncé de "réalité feint". Étant donné qu'un énoncé de réalité feint se définit en

tant que mimésis d'un énoncé de réalité, le clip ne peut pas correspondre à cette catégorie,

puisque la plupart du temps il est la mimésis d'un énoncé fictionnel, comme nous l'avons

montré.

Ni ludique, ni fictionnel, ni authentifiant, ni feint.

Si la figure du chanteur-groupe est similaire au Je lyrique de Hamburger, le seul mode

d'énonciation qui peut lui être attribué est le mode d'énonciation poétique. Absent de la

généalogie de Jost, le mode d'énonciation poétique est la forme appropriée de

l'énonciation lyrique.

Quelle est, dans ce cas, le type de promesse d'un monde qui définit le clip, en tant que

mode d'énonciation poétique à la télévision?

La définition de la "promesse" n'est rien d'autre que la détermination des éléments énonciatifs

distinctifs propre à un type de programmes de télévision par rapport aux autres et qui

définissent les attentes des téléspectateurs. C'est-à-dire la "promesse" est fondamentale dans

la catégorisation générique d'un programme télévisé.

Comme nous avons vu, la différence fondamentale entre l'énonciation lyrique et les autres

énonciations de réalité ou de la narration fictionnelle, c'est qu'elle est inséparable de la

sensibilité existentielle du Je-Origine. Sensibilité dont elle ne peut se dégager et sur laquelle se

concentre l'acte d'énonciation lui-même. C'est-à-dire, tandis que l'énonciation

communicationnelle d'un Je-Origine a pour fonction d'être efficace dans le contexte que

spécifie son contenu et celle d'un Je-Origine fictif celle de créer un monde diégétique

! l e ! j e ! l y r i que ! à ! l a ! t é l é v i s i on !

193 !

cohérent, le but de l'énonciation lyrique est l'expression de la sensibilité subjective du Je-

Origine lyrique.

C'est justement cette caractéristique qui va ajuster notre "horizon d'attente" (Jauss H. R., 1978)

dans le clip. D'un clip, nous attendons qu'il nous mette en contact avec la sensibilité et la

subjectivité du chanteur ou du groupe. Peu importe si cela est fait par le biais de procédés

propres au mode authentifiant, fictionnel ou ludique, ou s'il se traduit par un récit ou par la

simple monstration d'un récital live. Ce qui est fondamental, c'est la possibilité d'accès à

l'expression sensible du chanteur-groupe.

Étant donné que le Je lyrique est un sujet d'énonciation "qui s'énonce lui-même", dans le clip,

aussi bien la séquentialité de l'image que celle la chanson, sont pertinentes dans la mesure

où elles sont le véhicule ou le prétexte pour cette énonciation auto-référente.

En d'autres mots, ce qui définit la promesse du clip est la pertinence des images, des paroles

et de la musique de la chanson, par rapport à la sensibilité du chanteur-groupe.

E.! CONCLUSIONS!ET!POINTS!DE!DEPART!

L'établissement de l'existence du Je lyrique et du mode poétique à la télévision, va nous

permettre, finalement, de catégoriser le vidéo-clip comme genre.

Pourtant, pour atteindre notre objectif, nous avons dû toucher les limites de la théorie des

genres télévisuels de Jost et traverser la frontière entre son modèle théorique et celui de Käte

Hamburger. Nous avons pu trouver là, dans le Je lyrique, la possibilité de résoudre le

paradoxe insoluble posé par le clip à l'intérieur du modèle d'analyse du théoricien français.

Mais l'inclusion de la catégorie du Je-Origine lyrique et du mode poétique d'énonciation à la

télévision, a comme conséquence directe, le besoin d'une reformulation logique de la

théorie des genres télévisuels de Jost.

La portée et les limites de cette nécessaire reformulation constituent l'objet du chapitre

suivant et mènent à la conclusion de ce travail.

n i ! f i c t i on ! n i ! r é a l i t é !

194!

VII.! LE!MODE!POETIQUE!DANS!LA!THEORIE!DE!GENRES!TELEVISUELS

L’analyse phénoménologique que nous avons développée dans les chapitres précédents

nous a permis de montrer que l‘impossibilité de catégoriser le vidéo-clip dans la Théorie des

Genres Télévisuels de Jost n’est pas due au caractère transgénérique supposé de ce type de

documents ni à une impossible absence de mode d’énonciation propre. Comme nous

l’avons établi, le problème a son origine dans le fait que, dans le modèle de l’auteur français,

il n’y a pas une catégorie qui puisse englober ce type de programmes télévisuels (voir

Chapitre V).

Par ailleurs, l’identification de la figure du chanteur-groupe, responsable de l’énonciation

dans le vidéo-clip, comme équivalent de celle du Je lyrique défini par Käte Hamburger, nous

a conduit à déterminer que le mode d’énonciation propre du vidéo-clip est le mode

poétique. Cela implique non seulement la désactivation des modes authentifiant, fictionnel

et ludique dans le vidéo-clip mais aussi le besoin d’incorporer un nouveau mode

d’énonciation à la théorie des genres télévisuels (voir Chapitre VI).

Pourtant, l’incorporation de cette catégorie à la Théorie des Genres Télévisuels de Jost n’est

pas une opération simple.

Fondée sur la tension entre continuité et rupture, la Théorie des Genres Télévisuels de Jost

reconnaît et explique la persistance, les mutations et l’émergence de nouveaux types

génériques dans un média où, comme la télévision, elle a pour vocation la transposition, le

mélange et le recyclage de documents à l’origine et à la finalité les plus divers.

"Si l'on raisonne d'emblée sur l'histoire de la télévision, et non sur cette partie émergée de

l'iceberg qu'est le présent, on doit élaborer des modèles théoriques qui rendent compte

aussi bien du passage du spectateur de cinéma au téléspectateur (et de l'auditeur au

téléspectateur) que de l'avènement de l'ère du téléspectateur triomphant, à l'occasion

spectateur. En d'autres termes, il faut combiner deux logiques : celle du document

audiovisuel, dont la structuration générique est ancienne, et celle de la diffusion télévisuelle,

qui change immanquablement la donne". (Jost, F, 1997, p. 14).

Comme contrepoint à cette compréhension vaste et dynamique de la généricité1

télévisuelle, l’auto-restriction que s’impose le modèle de Jost en considérant uniquement trois

1 La généricité correspond à la qualité de construction des genres. Voir : Schaeffer, J-M, 1986, pp. 68 à 79 et

1989.p. 179 à 205 ou Ducrot, O et Schaeffer, J-M, 1995, pp. 636 à 637 ou chapitre II.A. de notre travail.

! s e c t i on ! 4 . ! c on c l u s i on s ! l e !mode ! poé t i que ! d an s ! l a ! t h éo r i e ! d e ! g en r e s ! t é l é v i s u e l s !

195 !

modes d’énonciation possibles pour la caractérisation générique des documents télévisuels,

empêche l’ouverture de cette proposition à d’autres catégories taxinomiques possibles,

différentes de celles qu’elle inclue : authentifiante, fictionnelle et ludique.

"Toutes les émissions entrent dans trois 'modes' qui structurent aussi bien la programmation

que les croyances du téléspectateur : l'authentifiant, le fictif et le ludique". (Jost, F, 1999,

p. 4).

Dans la mesure où le modèle théorique de Jost nous est présenté comme un outil pour la

compréhension du processus de compréhension spectatorielle télévisuelle, mais aussi

comme un système fermé et limité à trois modes d’énonciation, le fait de concevoir un

quatrième implique, nécessairement, de mettre en question cette théorie.

C’est-à-dire, pour savoir s’il est possible ou non d’inclure dans la taxinomie de Jost la

définition générique que nous avons faite par rapport au vidéo-clip, il faudrait déterminer,

premièrement, quelle est l’origine de la restriction aux trois catégories et, deuxièmement, si le

modèle accepte (ou non) l’introduction d’un critère de flexibilisation qui permette de

considérer d’autres modes d’énonciation.

Ainsi, l’objectif final de ce chapitre est celui de fixer les critères à partir desquels le mode

d’énonciation poétique peut être intégré dans la Théorie des Genres Télévisuels.

A.! QUELLE! EST! L’ORIGINE! DES! TROIS! MODES! D’ENONCIATION! DE!JOST?!

Nous avons établi qu’une des sources principales de la Théorie des Genres Télévisuels de Jost est la “Logique des Genres Littéraires" de Käte Hamburger (: 1957). Mais celle-ci n’est pas la seule référence théorique qui fonde le modèle de l’auteur français.

Une autre source importante pour la conception théorie que nous analysons est celle constituée par les propositions du philosophe d’origine américaine John R. Searle.

Si bien, en grande partie, les propositions théoriques de Jost doivent beaucoup aux travaux de Ducrot, Genette et Metz, elles s’inspirent indiscutablement aussi des postulats de Hamburger et Searle, en ce qui concerne la construction du modèle des genres télévisuels en particulier. Nous pouvons affirmer que le modèle de Jost se sépare de celui de Hamburger à l’endroit même où ses propositions rejoignent celles de Searle.

François Jost fonde sa Théorie des Genres Télévisuels à partir de la Logique des Genres

Littéraires de Käte Hamburger. Par conséquent, le chercheur français établit comme point

de départ de son modèle, à l’instar de l’auteur allemande, l’opposition entre réalité et

fiction, en incorporant à la fois la notion de Je-Origine, dans ses catégories de Je-Origine réel

et Je-Origine fictif comme l’axe central autour duquel se construisent les inférences

spectatorielles sur la réalité ou la non-réalité des documents, dans ce cas, télévisuels.

n i ! f i c t i on ! n i ! r é a l i t é !

196!

Mais, comme nous l’avons vu précédemment (chapitre III), il y a deux différences théorico-

méthodologiques qui séparent le modèle de Hamburger de celui de Jost : la première en est

le positionnement de chacun par rapport à l’objet de leur étude, la deuxième se situant

dans l’ordre des phénomènes qu’ils utilisent pour la construction de leurs respectives

typologies génériques.

C’est sur cette deuxième différence, que nous avons laissée en suspens dans le chapitre III

de ce travail, que nous voudrions concentrer maintenant notre attention.

Dans la théorie de Hamburger, l’ordre des phénomènes qui lui permet de définir les

catégories génériques correspond au statut ontologique du sujet d’énonciation. Par contre,

le type de phénomènes utilisés par Jost pour définir ses typologies génériques est celui du

mode d’énonciation ou, plus précisément (comme nous allons l’établir ci-après), l’intention

énonciative.

C’est sur ce point que la théorie de Jost, s’éloignant de celle de la “Logique des Genres

Littéraires”, s’approche de la “Théorie des Actes de Langage”.

1.! ACTE!ILLOCUTOIRE, !FICTION!ET!METAPHORE!

La Théorie des Actes de Langage (Austin, J. L., 1970 [1962]2) établit qu’en énonçant une

phrase quelconque, on accomplit trois actes simultanés : 1) un acte locutoire, qui

s’accomplit par le simple fait de dire quelque chose3 ; 2) un acte illocutoire, qui s’accomplit

en disant quelque chose ; 3) un acte perlocutoire, qui s’accomplit par le fait de dire quelque

chose.

A partir de ce constant fondationnel de la pragmatique linguistique, John R. Searle (: 1972

[1969]; 1982 [1979]4) s’intéresse, de manière presque exclusive, à l’acte illocutoire, en

approfondissant un aspect particulier qui lui semble fondamental: ses dimensions

intentionnelle et conventionnelle, puisque pour le philosophe américain les actes de langage

sont un moyen conventionnel et normativisé de réaliser des intentions.

Ce qui précède nous conduit à distinguer deux aspects dans le sens d’un énoncé : le

contenu propositionnel, qui correspond au contenu purement objectif de l’acte illocutoire et

la force illocutoire, qui correspond à son intention.

2 L’année d’édition entre guillemets correspond à l’édition originale en anglais. Notre référence est la

traduction en français éditée en 1970. 3 "Locution : un acte de langage qui consiste simplement à produire de sons appartenant à un certain

vocabulaire, organisés selon les prescriptions d'une certaine grammaire, et possédant une certaine signification (c'est-à-dire des sons employés de la façon déjà indiquée, mais auxquels on donne aussi un certain 'sens' et une certaine 'référence'). L'acte de locution n'est donc qu'un aspect de la parole, faisant abstraction de ceux qu'elle présenterait en tant qu'illocution ou perlocution". (Austin, J, 1970, p. 181).

4 L’année d’édition entre guillemets correspond à l’édition originale en anglais. Notre référence est la traduction en français éditée en 1972 et 1982 respectivement.

! s e c t i on ! 4 . ! c on c l u s i on s ! l e !mode ! poé t i que ! d an s ! l a ! t h éo r i e ! d e ! g en r e s ! t é l é v i s u e l s !

197 !

Ce qui est, en dernière instance, fondamental pour la construction du sens d’un énoncé est

l’intentionnalité de l’acte illocutoire, représentée par sa force illocutoire. Pour différencier les

divers types d’intentionnalité des actes illocutoires, Searle établit “douze dimensions de

variation significatives”. Parmi elles, les trois les importantes pour l’auteur sont:

1) Différence de but (ou de propos) de l'acte illocutoire : un acte illocutoire se distingue d’un

autre par le but spécifique de l’énonciation, c’est-à-dire, par le fait que l’on cherche par ce

moyen à faire agir l’auditeur (ordre), à compromettre le locuteur (promesse) ou à

représenter quelque chose (description), ou bien à affirmer quelque chose (assertion), etc.

2) Différence de direction d'ajustement entre les mots et le monde : étant donné que la force

illocutoire d’un énoncé définit la relation entre son contenu propositionnel et le monde, les

énoncés vont se différencier entre eux, selon qu’ils cherchent à ajuster le monde aux mots ou

les mots au monde. C’est-à-dire, selon qu’ils cherchent à rendre compte d’un état des

choses ou à y produire un changement. Par exemple, une affirmation cherche à donner

compte d’une “réalité”, tandis qu’un ordre cherche à changer quelque chose dans la

situation de l’auditeur.

3) Différence d'état psychologique exprimé : en accomplissant un acte illocutoire, le locuteur

exprime une attitude ou un état psychologique par rapport au contenu propositionnel. Cette

attitude ou état psychologique peut s’exprimer comme une “croyance en”, “intention de”,

“désir de”, “ volonté de”, etc.

Ces différences de force illocutoire des énoncés vont permettre à Searle de construire une

taxinomie de cinq catégories d’actes illocutoires :

"Nous disons à autrui comment sont les choses (assertifs) : Le but ou le propos des

membres de la classe assertive est d'engager la responsabilité du locuteur sur l'existence

d'un état de choses; (...) La direction d'ajustement va des mots au monde; l'état

psychologique exprimé est la croyance".

"Nous essayons de faire faire des choses à autrui (directifs) : le but illocutoire (...) consiste

dans le fait qu'ils constituent des tentatives de la part du locuteur de faire faire quelque

chose par l'auditeur; (...) La direction d'ajustement va du monde aux mots; la condition de

sincérité est vouloir (ou souhaiter, ou désirer)".

"Nous nous engageons à faire des choses (promissifs) : le but est d'obliger le locuteur à

adopter une certaine conduite future; (...) la direction d'ajustement va du monde aux mots; la

condition de sincérité est l'intention".

"Nous exprimons nos sentiments et nos attitudes (expressifs) : le but illocutoire de cette

classe est d'exprimer l'état psychologique spécifié dans la condition de sincérité; (...) on

remarquera que les expressifs n'ont pas de direction d'ajustement. (...) Le locuteur n'essaie

pas de faire que le monde se conforme aux mots ni que les mots se conforment au monde ;

mais, en fait, la vérité de la proposition exprimée est présupposée".

n i ! f i c t i on ! n i ! r é a l i t é !

198!

"Nous provoquons des changements dans le monde par nos énonciations (déclaratifs) :

l'accomplissement réussi de l'un de ses membres provoque la mise en correspondance du

contenu propositionnel avec la réalité; l'accomplissement réussi garantit que le contenu

propositionnel correspond au monde; (...) la direction d'ajustement va à la fois des mots au

monde et du monde aux mots, en raison du caractère particulier des déclarations ; il n'y a

pas condition de sincérité". (Searle, J. R., 1982, pp. 32 à 60).

Mais pour qu’un acte illocutoire, puisse être couronné de succès, il doit remplir certaines

conditions, qui se résument dans les règles suivantes :

"1) la règle essentielle : l'auteur d'une assertion répond (commits himself to) de la vérité de

la proposition exprimée; 2) les règles préparatoires : le locuteur doit être en mesure de

fournir des preuves ou des raisons à l'appui de la vérité de la proposition exprimée; 3) [la

règle de contenu propositionnel] : la vérité de la proposition exprimée ne doit paraître

évidente ni au locuteur ni à l'auditeur dans le contexte de l'énonciation; 4) la règle de

sincérité : le locuteur répond de (commits himself to) sa croyance dans la vérité de la

proposition exprimée." (Searle, J, 1982, p. 105).

Ainsi, l’acte illocutoire nous est présenté, dans la typologie de Searle, comme l’ensemble des

types possibles d’énoncés de la réalité qui sont en mesure de répondre aux règles des actes

illocutoires.

Le respect ou non de ces règles permet de distinguer clairement les énoncés qui sont des

actes illocutoires de ceux qui ne le sont pas. Dans le deuxième groupe, c’est-à-dire parmi

ceux qui ne correspondent pas à des illocutions, nous pouvons identifier le mensonge, la

fiction et la métaphore.

Dans le cas du mensonge et de la fiction, les règles de l’acte illocutoire ne sont pas

respectées, bien que ces activités langagières adoptent la forme de l’acte illocutoire assertif.

Par exemple, dans les deux cas, la condition de sincérité est violée car l’auteur d’un

mensonge ou d’un discours fictionnel ne croit pas à la vérité de ce qu’il affirme. Pourtant, et

malgré ce trait identique, le mensonge et la fiction sont deux types d’acte différents.

Lorsqu’on profère un mensonge, l’intention de l’énonciateur est de tromper l’énonciataire,

c’est-à-dire de lui faire croire à la vérité de l’affirmation que l’on soutient. Dans le discours

fictionnel, par contre, l’énonciateur cherche à réaliser un acte illocutoire mais n’a pas pour

autant l’intention de tromper l’énonciataire, c’est-à-dire, il ne cherche pas à lui faire croire à

la vérité de l’affirmation. Ainsi, la fiction feint5 d'accomplir un ensemble d’actes illocutoires.

5 Par rapport à la notion de "feint" Searle précise : "Il est nécessaire de distinguer deux sens très différents du

mot 'feindre'. En un premier sens, feindre qu'on est ou qu'on fait quelque chose qu'on ne fait pas revient à se lancer dans une forme de tromperie ; mais, dans un second sens, feindre de faire ou d'être quelque chose consiste à se lancer dans une activité où l'on joue à faire ou à être ceci ou cela, sans aucune intention de tromper. (...) Or, dans l'usage que les mots ont dans la fiction, c'est feindre au second sens qui est en question". (Op. cit. p. 108).

! s e c t i on ! 4 . ! c on c l u s i on s ! l e !mode ! poé t i que ! d an s ! l a ! t h éo r i e ! d e ! g en r e s ! t é l é v i s u e l s !

199 !

"Les actes d'énonciation de la fiction ne se différencient pas des actes d'énonciation du

discours sérieux, et c'est pour cette raison qu'il n'y a pas de propriété textuelle qui pourra

identifier un champ du discours comme œuvre de fiction. C'est l’accomplissement de l'acte

d'énonciation avec l'intention d'invoquer les conventions horizontales qui constitue

l'accomplissement feint de l'acte illocutoire.". (Op. cit. p. 111).

De son côté, la métaphore (et plus généralement le discours figural qui inclue aussi l’ironie et

l’acte de l’illocution indirecte) correspond à un type singulier de violation des règles de l’acte

illocutoire.

A la différence du mensonge, qui a pour intention de faire croire à la vérité de l’affirmation,

et de la fiction, qui est un acte illocutoire feint, la métaphore est manifestement absurde, en

ce qui concerne la phrase, et viole de façon flagrante les règles de l’acte illocutoire. C’est-à-

dire qu’elle ne cherche pas à tromper (en raison de l’absurde du sens pris littéralement), ni

de faire comme l’illocution (car elle ne cherche pas à ressembler à l’acte illocutoire).

Dans le discours figural, le sens de l’énoncé est différent du sens de la phrase mais, dans la

métaphore, outre cela, l’absurde du sens littéral d’un énoncé correspond à un défaut

radical de l’énonciation qui oblige le récepteur à chercher le sens à partir d’une opération

d’analogie au-delà de l’énonciation elle-même.

Laissant de côté le mensonge6, Searle s’attache à expliquer le discours de la fiction et le

discours figural, car les règles sémantiques y sont suspendues ou modifiées.

Ainsi il établit que, alors qu’un acte illocutoire est une énonciation “sérieuse et littérale”, le

discours de la fiction correspond à des énonciations “non sérieuses7 et littérales" et le discours

figural à des “sérieuses et non littérales”.

"Si je dis maintenant : 'j'écris un article sur le concept de fiction', cette notation est à la fois

sérieuse et littérale. Si je dis 'Hegel est un rossignol sur le marché philosophique', cette

notation est sérieuse non littérale. Si je dis, en commençant un récit : 'Il était une fois un

lointain royaume où vivait un roi sage, qui avait une fille très belle...' cette notation est

littérale non sérieuse". (Op. cit. p. 103).

Cette triade formée par l’acte illocutoire, le discours de la fiction et le discours figural, est le

point de départ de la proposition de Jost par rapport aux modes d’énonciation télévisuels.

6 Selon Reboul et Moeschler (: 1998), les problèmes que pose le mensonge ne sont pas complètement résolus

dans la Théorie des Actes de Langage. Le type de problèmes signalés par les auteurs se rapporte au fait que, dans le cadre logique de la Théorie des Actes de Langage, la description du mensonge conduit à un paradoxe insoluble entre l’acte illocutoire et l’acte perlocutoire. Voir Reboul A, et Moeschler, J, 1998, pp. 25 à 46.

7 Par rapport au caractère « sérieux » de l’acte illocutoire et à celui « non sérieux » de la fiction, Searle précise : « ces termes n'impliquent en aucune manière qu'écrire un roman de fiction ou un poème ne soit pas une activité sérieuse, mais plutôt que si, par exemple, l'auteur d'un roman nous dit qu'il pleut dehors, il n'adhère pas (commited to) sérieusement à l'idée qu'il pleut dehors, au moment où il écrit. C'est en ce sens que la fiction est non sérieuse ». (Searle, J. R., 1982, p. 103).

n i ! f i c t i on ! n i ! r é a l i t é !

200!

2.! DES!ACTES!DE!LANGAGE!A!LA!TYPOLOGIE!DE!GENRES!TELEVISUELS!

Pour accepter que les programmes télévisuels puissent être analysés dans le cadre de la Théorie des Actes de Langage, il faut faire abstraction d’une quantité importante d’aspects propres à la réalité phénoménique de la communication télévisuelle et la réduire, la plupart du temps de façon forcée, à de possibles actes locutoires, illocutoires ou perlocutoires.

Par exemple, il faut faire abstraction des aspects mimétiques et iconiques propres à la communication audiovisuelle ou, du moins, réduire sa complexité, par une opération d’analogie qui n’aide pas toujours à la compréhension du phénomène, à une intentionnalité qui puisse être assimilable dans la Théorie des Actes de Langage8.

Pourtant, les problèmes que pose l’application des concepts de la Théorie des Actes de Langage à l’analyse de la communication télévisuelle ne sont pas beaucoup plus grands que ceux qu’implique l’utilisation courante de catégories théoriques de la narratologie ou de la pragmatique linguistique dans l’analyse du film. A partir des propositions théoriques de Christian Metz (: 1971) un nombre important de méthodes, de concepts et de notions centrales dans la sémiologie du film, de l’audiovisuel et de la télévision, ont leur origine dans une des disciplines de la langue9.

Tout comme d’autres modèles théoriques de la sémiologie de l’audiovisuel, la théorie de Jost repose sur une opération qui cherche à comparer l’intention communicationnelle de l’émission télévisée avec la force illocutoire de l’acte de langage.

Comme nous les verrons plus loin, cette opération implique l’adoption de risques théorico-méthodologiques qui peuvent être à l’origine de la rigidité de la Théorie des Genres Télévisuels de Jost.

Prenant comme base la tripartition en acte illocutoire, discours de la fiction et discours figural, Jost établit sa typologie des modes d’énonciation authentifiant, fictif et ludique.

"Ces trois modes s'inspirent de J. R. Searle. Mais le philosophe du langage distingue entre

énoncé de réalité, énoncé fictif et énoncé figural, les règles sémantiques définissant

l'assertion étant modifiées par l'énonciation fictive et par le discours figural. Alors que le

locuteur de l'énoncé de réalité doit, notamment, répondre de son assertion, l'auteur d'une

fiction n'a pas à le faire. Les métaphores, quant à elles, diffèrent des énoncés de réalité en

ce qu'elles ne sont pas littérales". (Jost, F, 1998, p. 34).

Malgré la distance que Jost tente d’introduire avec la phrase "Mais le philosophe du langage

distingue...", ce qui est implicite, dans la référence de l’auteur à la proposition de Searle et

8 Jost n’est pas le seul à utiliser comme référence la Théorie des Actes de Langage. Roger Odin (: 1996) pose,

lui aussi, mais dans des termes plus précis, la pertinence de l’utilisation des notions et des concepts de la pragmatique linguistique dans l’analyse de l’audiovisuel.

9 Ces transferts entre les sciences et les disciplines de la langue et l’analyse de l’audiovisuel (cinématographique ou télévisuel) comportent souvent des problèmes d’ordre épistémologique difficiles à résoudre et qui sont objet permanent de polémique théorique : les dispositifs cinématographiques et télévisuels peuvent-ils être pensés à partir des catégories développées pour l’analyse du langage ? Est-il légitime de comparer la structure du document audiovisuelle avec celle du discours verbal ? Et enfin, est-il théoriquement pertinent d’adapter les catégories de l’analyse linguistique, sémiologique ou narratologique à l’analyse de l’audiovisuel ou est-il nécessaire de construire des catégories théoriques propres à partir de l’objet d’étude ?

! s e c t i on ! 4 . ! c on c l u s i on s ! l e !mode ! poé t i que ! d an s ! l a ! t h éo r i e ! d e ! g en r e s ! t é l é v i s u e l s !

201 !

dans le fait que ses trois modes d’énonciation “s’en inspirent”, c’est la construction d’une

identité en trois binômes: 1) acte illocutoire assertif et mode authentifiant; 2) discours de la

fiction et mode fictif; 3) discours figural et mode ludique.

Cette observation se confirme si nous analysons de plus près l’équivalence entre les

définitions de Jost par rapport à ses modes d’énonciation authentifiant et fictif et celles faites

par Searle par rapport aux notions d’acte illocutoire assertif et discours de la fiction.

Par rapport au binôme “acte illocutoire assertif et mode d’énonciation authentifiant :

Searle :

"Le but ou le propos des membres de la classe [d'actes illocutoires du type] assertive est

d'engager la responsabilité du locuteur (à des degrés divers) sur l'existence d'un état de

choses, sur la vérité de la proposition exprimée. Tous les membres de la classe assertive

peuvent être jugés selon la dimension évaluative qui comprend le vrai et le faux". (: 1982, p.

52).

Jost :

"Le mode authentifiant regroupe les émissions qui tiennent de vraies assertions sur notre

monde, qui nous donnent des informations pour en améliorer la connaissance et qui

relèvent, en dernière instance, d'un exercice de la preuve". (:2001, p. 19).

Par rapport au binôme "discours de la fiction et mode d’énonciation fictif" :

Searle :

"L'auteur d'une œuvre de fiction feint d'accomplir une série d'actes illocutoires, normalement

du type assertif. (...) Ce qui distingue la fiction du mensonge est l'existence d'un ensemble

distinct de conventions qui permet à l'auteur de faire mine de faire des assertions qu'il sait

ne pas être vraies sans pour autant avoir l'intention de tromper". (: 1982, p. 108 et 111).

Jost :

"Bien que le monde de la fiction ressemble plus ou moins au nôtre, il ne lui doit rien. L'auteur

est libre d'inventer et nous lui reconnaissons cette liberté. (...) La fiction n'a donc rien à voir

avec le mensonge. Nous acceptons que l'auteur sorte des règles de l’assertion ordinaire et

fasse semblant d'asserter". (: 2001, p. 20).

Comme nous pouvons le constater, les définitions sont de toute évidence équivalentes pour

les binômes précédents. Mais cela ne va pas de même avec le binôme “discours figural et

mode d’énonciation ludique”, dans lequel la ressemblance n’est pas claire en ce qui

concerne la définition :

Searle :

"[Dans le cas du discours figural] ce que le locuteur veut dire n'est pas identique à ce que la

phrase veut dire, et pourtant ce qu'il veut dire est lié de plusieurs manières à ce que la

n i ! f i c t i on ! n i ! r é a l i t é !

202!

phrase veut dire. (...) Afin que le locuteur puisse communiquer en employant des

énonciations métaphoriques, des énonciations ironiques et des actes de langage indirects, il

doit y avoir des principes qui lui permettent de vouloir dire plus, ou autre chose, que ce qu'il

dit ; ces principes doivent être connus de l'auditeur, puisque c'est cette connaissance des

principes qui lui permet de comprendre ce que le locuteur a voulu dire". (: 1982, p. 123).

Jost :

"[Le mode ludique] Comme le mode authentifiant, il suppose des discours de vérité (...)

mais, comme le mode fictif, il possède un système de règles autonomes; sa cohérence

s'évalue au respect des règles du jeu, qui ont été données au téléspectateur. L'un des traits

caractéristiques de ce mode est qu'on y admet volontiers des glissements rapides de

l'authentique au faire semblant. (...) Au 'pour de vrai' de l'info, au 'pour de faux' de la fiction, il

faut donc ajouter un 'pour de rire', plutôt tourné vers les effets du discours que vers

l'intention qui le sous-tend". (:2001, p. 21 et 22).

Ces deux définitions ne font pas référence au même type de phénomènes, comme cela

était le cas dans les binômes précédents.

Les trois définitions de Searle, y compris celle du discours figural, font référence à l’acte

illocutoire assertif. La première, en tant que telle (illocution assertive) et les deux autres, par

opposition à l’acte d’illocution : la fiction en tant que feinte10 de l’acte illocutoire – illocution

non sérieuse – et la métaphore, en tant qu’illocution défectueuse – illocution non-littérale.

Cela est le cas aussi des deux premières définitions des modes d’énonciation de Jost. C’est-

à-dire qu’elles ont comme référence l’acte illocutoire, tel que Searle le considère, et se

définissent par leur opposition mutuelle. Par contre, pour caractériser le mode ludique, Jost

prend comme critère, d’une part, son caractère de médiateur entre les deux autres modes

authentifiant et fictif et, d’autre part, l’effet spécifique ("pour de rire") des programmes qu’il

classe dans cette catégorie, plutôt que celui d’une opposition logique à l’acte illocutoire.

"Le mode ludique, où les règles du jeu (...) prescrivent le déroulement du temps et où les

effets perlocutoires guident l'émission". (Jost, F, 1997, p. 23).

Ceci, loin de représenter une incohérence dans la théorie de Jost, va nous permettre de

définir clairement ce que nous avons laissé en suspens dans le chapitre III, à savoir la

détermination précise du type de phénomènes que considère la Théorie des Genres

Télévisuels de Jost, pour construire sa taxinomie.

10 Comme nous l’avons signalé dans le chapitre III, l’utilisation de la notion de « feintise » par Searle est en

relation avec un niveau logique différent de celui que suppose la notion de « énoncé de réalité feint » de Hamburger. Pour Searle, le discours fictionnel correspond à un ensemble « d’assertions feintes ». Cela équivaut, dans le système de Hamburger, à la « mimésis de la réalité » - le Comme la réalité – et non pas à un « énoncé de réalité feint » - le Comme si de l’énoncé de réalité.

! s e c t i on ! 4 . ! c on c l u s i on s ! l e !mode ! poé t i que ! d an s ! l a ! t h éo r i e ! d e ! g en r e s ! t é l é v i s u e l s !

203 !

3. ! LES!MODES!D'ENONCIATION!COMME!INTENTION!DISCURSIVE!

Cette différence apparente de niveau logique dans la caractérisation des modes

authentifiant et fictif, d’un côté, et du mode ludique, de l’autre, n’en est pas une et elle

s’explique du point de vue de la théorie des genres.

Comme nous l’avons signalé, Schaeffer (: 1989, pp. 64 à 130) établit trois niveaux distincts

pour la définition des genres, dans le cadre de l’acte communicationnel: le niveau de

l’énonciation; le niveau de la destination et le niveau de la fonction (voir Tableau 1, chapitre

II).

En règle générale, les actes discursifs sont des actes intentionnels destinés, donc, à remplir

une fonction. Si, lors de la construction d’une typologie, nous tenons compte de cette

intentionnalité, l’ordre des phénomènes représentés correspondra au niveau de la fonction

de l’acte de communication. C’est-à-dire que la taxinomie prendra, comme critère de

classification, le type d’actes illocutoires que représentent les discours (Schaeffer, J-M, 1989,

pp. 101 à 108).

"De nombreux noms génériques semblent liés à des actes illocutoires spécifiques. On sait

que ce dernier terme désigne des attitudes discursives, par exemple décrire, demander,

prier, promettre, c'est-à-dire qu'il se réfère au but communicationnel que remplit un énoncé".

(Schaeffer, J-M., 1989, p. 101).

Malgré la dénomination équivoque “modes d’énonciation” utilisée par Jost, qui nous renvoie

aux modalités de l’énonciation11, dans la mesure où le théoricien français identifie le mode

authentifiant avec l’acte illocutoire assertif et le mode fictif avec son opposé, son choix se

situe, clairement, dans l’espace du but communicationnel, c’est-à-dire, dans la fonction du

discours.

Pourtant, les fonctions d’un discours ne se limitent pas à la réalisation d’actes illocutoires.

Selon la théorie des Actes de Langage, un acte discursif peut avoir l’intention de provoquer,

dans le récepteur, des effets spécifiques qui vont au-delà de la forme ou du contenu de

l’énoncé, comme de les faire rire, les pousser à adhérer à une cause, leur faire peur, etc.

Tandis qu’un acte illocutoire produit en effet en disant, un acte perlocutoire12 produit un effet

par le fait de dire.

11 Les modalités d'énonciation constituent le type de classification qui rend compte de la différence entre

narration et représentation ou, en d’autres termes, de la distinction platonique entre diégèse et mimésis. Voir chapitre II A.1.a. de ce texte ou Schaeffer, J-M, 1989, pp. 79 à 130.

12 Un acte est perlocutoire lorsque : "l'énonciation sert à des fins plus lointaines, et que l'interlocuteur peut très bien ne pas saisir tout en possédant parfaitement la langue. Ainsi, en interrogeant quelqu'un, on peut avoir pour but de lui rendre service, de l’embarrasser, de lui faire croire qu'on estime son opinion, etc. (on notera que l'acte perlocutoire, contrairement à l'illocutoire, peut rester caché : il n'y a pas besoin, pour embarrasser quelqu'un, de lui faire savoir qu'on cherche à l’embarrasser)". (Ducrot, O, et Schaeffer, J-M., 1995, p. 783).

n i ! f i c t i on ! n i ! r é a l i t é !

204!

Ainsi, ces discours qui cherchent intentionnellement la production d’effets perlocutoires dans

le récepteur sont aussi la base de la construction des genres au niveau de la fonction.

"Certains genres sont liés à des fonctions perlocutoires spécifiques : c'est le cas de la

comédie qui se caractérise, entre autres, par le fait qu'elle vise à provoquer le rire; de même,

le récit érotique, ou du moins sa variante pornographique, vise à provoquer l’excitation

sexuelle. Plus globalement, toute œuvre à prétentions moralisantes ou propagandistiques

vise à des effets perlocutoires, puisqu'elle se propose le changer le comportement de ses

récepteurs". (Schaeffer, J-M., 1989, p. 103).

Voici le critère utilisé par Jost pour définir le “mode d’énonciation ludique” :

"(...) 'pour de rire', plutôt tourné vers les effets perlocutoires du discours que sur l'intention

qui le sous-tend". (Jost, F, 1998, p. 34).

C’est-à-dire, malgré les différences entre eux, les modes authentifiant, fictif et ludique

correspondent à la même catégorie de phénomènes généraux : chacun d’eux est défini à

partir de l’intention discursive, soit comme un acte illocutoire assertif, soit comme une feinte

de l’acte illocutoire assertif, soit comme un acte perlocutoire.

En d’autres mots, le cadre qui donne cohérence et unité au type de phénomènes utilisé par

Jost pour définir ses catégories, est la Théorie des Actes de Langage de Searle. Comme nous

l’avons vu, cette adhésion de l’auteur français au modèle “intentionnaliste" de Searle, est

aussi bien implicite qu’explicite.

Ce fait, qui confirme la cohérence logique du choix de Jost par rapport aux catégories qui

servent de base à sa théorie des genres télévisés, est en même temps l’élément qui nous

permet d’établir l’arbitraire de la limitation des catégories aux trois seuls “modes

d’énonciation” ou “intentions discursives”.

B.! PROBLEMES!LOGIQUES!DU!MODELE!DE!JOST!

Le mode de fonctionnement de la taxinomie de Jost repose sur l’existence d’une triade

composée par les modes d’énonciation authentifiant, fictif et ludique. Dans ce système, les

modes authentifiant et fictif sont polaires, c’est-à-dire des opposés logiques. De son côté, le

mode ludique est, d’une part, défini à partir de ses effets perlocutoires en tant que porteur

des mêmes caractéristiques que les deux autres, mais il est considéré aussi comme étant au

niveau intermédiaire.

Ce système peut être représenté comme un triangle ayant à chaque angle un des modes

d’énonciation signalés et dans lequel il est possible de situer tous les types de programmes

télévisés selon leur degré de proximité ou d’opposition aux intentions énonciatives propres à

chacun des trois modes. (voir tableau 7).

! s e c t i on ! 4 . ! c on c l u s i on s ! l e !mode ! poé t i que ! d an s ! l a ! t h éo r i e ! d e ! g en r e s ! t é l é v i s u e l s !

205 !

LUDIQUE

AUTHENTIFIANT FICTIF

reality � � showtalk show

débat direct

magazine

JTtéléfilmsérie

documentaire

jeuxvariétés

comédie

film

T A B L E A U N ° 7

Nous allons analyser, ci-après, deux situations qui créent deux problèmes au niveau du

système logique qui définit le mode de fonctionnement de la Théorie des Genres Télévisuels

de Jost par rapport à la Théorie des Actes de Langage.

La première situation est en rapport à la limitation à un seul mode d’énonciation (ludique)

pour les programmes à intention perlocutoire. La deuxième correspond à la limitation à un

seul mode d’énonciation (authentifiant) pour les programmes qui “nous parlent de la réalité”.

1.! RIRE, !PLEURER!ET!DAVANTAGE!

Comme nous l’avons signalé, Jost n’utilise pas la dénomination “ludique” en référence au jeu

mimétique avec lequel Platon identifiait la fiction (théâtre, poésie épique, peinture) et que la

théorie littéraire a associé pendant des siècles aux discours fictionnels (non sérieux) par

opposition aux discours de réalité (sérieux). Cette utilisation libre de la notion de “ludique”

par l’auteur français, peut prêter à confusion dans la mesure où elle ne correspond pas à la

notion de fiction, dont il faut la distinguer dans son système théorique.

Le mode d’énonciation ludique est intégré à la typologique en raison de deux

caractéristiques qui lui sont attribuées. La première, son rôle intermédiaire entre les modes

d’énonciation authentifiant et fictif, la deuxième en fonction de l’effet perlocutoire

spécifique qu’elle (pour de rire) produit.

Nous allons considérer uniquement la deuxième caractéristique qui définit le mode ludique,

c’est-à-dire l’acte perlocutoire qu’il représente car, au-delà des problèmes que pose une

double définition basée sur des critères totalement différents (à la fois de la fonction et du

statut de l’énonciation), les problèmes qu’elle pose au niveau du fonctionnement logique de

la théorie sont beaucoup plus importants que ceux qui sont issus de sa double condition13.

13 Le premier critère de définition du mode ludique (son rôle intermédiaire) est similaire à celui qu’établit

Hamburger par rapport aux « formes spéciales ou mixtes (: 1986, pp. 259 à 299). C’est-à-dire, que la différence réside dans la forme contradictoire qu’acquiert l’énonciation par rapport au statut ontologique du Je-Origine. Mais ce trait est dépendant, dans la théorie de Jost, de la fonction énonciative et non du caractère du Je-Origine, comme dans la théorie de Hamburger.

n i ! f i c t i on ! n i ! r é a l i t é !

206!

Comme nous l’avons vu, si le but perlocutoire d’un énoncé ne correspond pas au même

type de phénomènes que l’acte illocutoire et sa feinte, le discours fictionnel (catégories qui

s’opposent en fonction de critères logiques similaires), cela ne représente pas une

incohérence au niveau du choix du type de phénomènes que forment la typologie de Jost

car, dans les trois cas, le dénominateur commun en est l’intention énonciative.

En tant qu’acte de langage, tout acte perlocutoire est, avant tout, un acte locutoire et un

acte illocutoire. En d’autres termes, pour réaliser tout acte perlocutoire, il doit être dit et cet

acte doit produire quelque chose en disant. Mais ce qui le distingue au niveau de la

catégorie est qu’un acte perlocutoire est réalisé indirectement par la production d’un

énoncé et non pas directement, comme dans le cas d’un acte illocutoire.

"Dire quelque chose provoquera souvent - le plus souvent - certains effets sur les

sentiments, les pensées, les actes de l'auditoire, ou de celui qui parle, ou d'autres personnes

encore. Et l'on peut parler dans le dessein, l'intention, ou le propos de susciter ces effets.

Compte tenu de cela, nous pouvons dire que celui qui a parlé a produit un acte qui ou bien

ne renvoie qu'indirectement à l'acte locutoire ou illocutoire, ou bien n'y renvoie pas du tout.

Nous appellerons un tel acte un acte perlocutoire, ou une perlocution". (Austin, J, L, 1970, p.

114).

Si la notion d’acte perlocutoire peut être appliquée aux discours télévisuels, comme le fait

Jost, les émissions de "jeux télévisés" ne seraient pas les seules à correspondre au mode

d’énonciation ludique. On pourrait y ranger aussi tous les programmes qui, comme le sit’com

ou la comédie (domaine fictionnel), peuvent être considérés comme appartenant ou étant

proches de l’acte perlocutoire "pour de rire".

C’est justement en partant de ce principe que Jost distribue les différents programmes

télévisuels dans l’espace bidimensionnel de son triangle modal (tableau n° 7) et non pas sur

une ligne unidimensionnelle comme ce serait le cas si l’opposition graduelle avait

uniquement lieu entre fiction et réalité.

Ainsi, la différence entre un "talk show" et un programme d’interviews en studio (tous deux

correspondent à des énoncés de réalité et sont, du point de vue de la mise en scène, très

similaires) n’est pas leur degré d’opposition à la fiction mais leur intention perlocutoire

différente. Dans le premier cas, elle est plus proche du "pour de rire" que dans le deuxième.

Pourtant, et même si ce critère fonctionne comme élément de distinction important entre

différentes émissions très proches au niveau formel, il est difficile d’accepter que le seul acte

perlocutoire retenu par la théorie de Jost, dans les différents types d’émission télévisuelle de

fiction ou de réalité, soit celui qui cherche à produire le rire ou, plus généralement, à divertir

ou à amuser.

La liste de programmes à but perlocutoire différent appartenant au mode ludique n’est pas

négligeable.

! s e c t i on ! 4 . ! c on c l u s i on s ! l e !mode ! poé t i que ! d an s ! l a ! t h éo r i e ! d e ! g en r e s ! t é l é v i s u e l s !

207 !

Partant du champ de la fiction, depuis le genre “terreur” (dans toutes ses variantes), dont

l’intention perlocutoire pourrait être caractérisée comme celle de "pour faire peur", la

"télésérie" traditionnelle14, dont le dénominateur commun est son effet lacrymogène "pour

pleurer" (de là vient que dans plusieurs pays latino-américains on appelle ce genre

“l’oignon”), sans oublier les films pornographiques ou ceux de propagande politico-

idéologique, toute une série de genres télévisuels fictionnels peuvent être définis à partir des

intentions perlocutoires les plus variées et non seulement par celle assignée au mode ludique.

A l’autre extrême, dans les émissions dites de réalité, les exemples sont tout aussi nombreux.

Parmi eux, le cas intéressant des programmes genre "Téléthon" et similaires. Ces programmes,

très diffusés aux USA et en Amérique en général, à partir des années 1980, ont pour but

l’adhésion économique des téléspectateurs (leur apport en argent) à une œuvre charitable

ou de soutien spécifique.

Par le biais de la présentation de témoignages ou des reportages, généralement très

dramatiques, voire déchirants, on appelle à la sensibilité et à la solidarité du téléspectateur

et on l’encourage à déposer son aide sur un compte courant, par exemple. Entre l’un et

l’autre reportage ou interview, différents spectacles de type varié, maintiennent l’attention

du téléspectateur.

Ces programmes, souvent auto-définis comme de solidarité, sont réalisés sous le modèle de

ceux des "variétés". C’est-à-dire qu’ils combinent le direct sur le plateau, les reportages

préenregistrés, les interviews (en direct ou différées), la participation de chanteurs et de

musiciens, des sketchs d’humour, des nouvelles, etc.

Au niveau formel, et partant de critères techniques, un tel programme n’est pas différent

d’une autre émission de "variétés". Ce qui l’en distingue, c’est le but perlocutoire de

l’émission prise comme un acte discursif global.

C’est-à-dire, comme nous l’avons vu dans le cas d’un "talk-show" et d’une "interview en

studio", la différence entre un programme de variétés et un programme genre Téléthon en

est le but perlocutoire spécifique de ce type de programmes “de solidarité”.

L’utilisation d’un critère basé sur le but perlocutoire de "pour de solidarité", devient tout aussi

pertinent pour la différenciation des émissions formellement similaires, que celui qui a comme

point de départ le "pour de rire".

Si nous acceptons une logique de classification à partir de l’intention perlocutoire des

programmes télévisuels, on doit accepter toutes les conséquences logiques qu’impose ce

choix, surtout s’il n’y a pas de raison particulière pour penser que, dans la communication

télévisuelle, le but perlocutoire le plus important soit celui de faire rire.

14 Par "téléserie" traditionnel nous entendons, principalement les productions de l’industrie audiovisuelle

vénézuélienne, mexicaine ou argentine. Le cas des feuilletons chiliens et, surtout, des feuilletons brésiliens est très différent car ils ne sont pas construits dans l’axe du mélodrame mais dans celui de la comédie.

n i ! f i c t i on ! n i ! r é a l i t é !

208!

Comme nous avons vu dans le chapitre précédent, une analyse en profondeur du vidéo-clip

permet de montrer que, contrairement à une opinion superficielle, l’intention énonciative de

ce type d’émission ne peut pas être définie comme ayant un seul but perlocutoire, et il serait

particulièrement infructueux de l’identifier au but perlocutoire du “pour de rire”. Ainsi le

montrent quelques exemples tels que le clip “Otherside” du groupe Red Hot Chili Peppers,

dont la thématique principale en est l’expression de l’angoisse et le désespoir du sujet

d’énonciation qui pense au suicide, ou le clip “Ex-girlfriend” de No Doubt dont le sujet

d’énonciation responsable de l’énonciation exprime la rage et le dépit ressenti après avoir

été abandonnée par son amoureux.

Pour cette raison, la restriction à un seul type d’acte perlocutoire semble une limitation

arbitraire du champ des phénomènes télévisuels qui peuvent être considérés sous l’angle de

la Théorie des Actes de Langage.

2.! CINQ!ACTES!ILLOCUTOIRES!POSSIBLES!

Si la situation par rapport au mode d’énonciation ludique pose un premier problème à la

logique du fonctionnement triadique de la Théorie des Genres Télévisuels de Jost, il y a, à

notre avis, un deuxième type de problématique qui se dégage de la limitation des modes

d’énonciation de “réalité” à un seul type d’actes illocutoires.

Le recours de Jost à la Théorie des Actes de Langage a pour but d’expliquer l’énonciation

télévisuelle dans les mêmes termes logiques que Searle emploie pour la langue naturelle. En

d’autres mots, ce que Jost fait est une analogie entre l’acte illocutoire et l’acte de

communication qui comprend l’émission d’un programme de télévision. Cette opération

d’analogie est évidente dans les définitions que donne l’auteur des trois modes

d’énonciation que nous avons signalés auparavant :

"Le mode authentifiant regroupe les émissions qui tiennent de vraies assertions sur notre

monde (...) [dans le mode fictif] nous acceptons que l'auteur sorte des règles de l'assertion

ordinaire et fasse semblant d'asserter (...)"

a. ! Le!mode!authentifiant !comme!acte!i l locutoire!assertif !

Si nous acceptons l’analogie suggérée par Jost, l’acte discursif global qui correspond à

l‘émission d’un JT peut correspondre à une assertion uniquement à la condition que celui-ci

respecte les règles définies par Searle (: 1982, p. 105) pour l’acte illocutoire assertif. Voyons

cela :

1) Règle Essentielle : l’ensemble des énonciateurs polyphoniques (la chaîne, le département

de presse, l’éditeur du journal, le journaliste et même le témoin) responsables de l’acte

discursif global d’un JT sont appelés à répondre de la vérité des propositions exprimées

! s e c t i on ! 4 . ! c on c l u s i on s ! l e !mode ! poé t i que ! d an s ! l a ! t h éo r i e ! d e ! g en r e s ! t é l é v i s u e l s !

209 !

pendant l’émission. Ces différents niveaux d’énonciateur correspondent à des sujets connus

et reconnaissables qui agissent en tant que tels et qui sont, donc, en condition de répondre

de leurs dires. Le sérieux d’un JT repose, justement, sur le fait que chaque niveau

d’énonciateur peut et doit répondre de la vérité de ses énoncés.

2) Règle Préparatoire : l’énonciateur est tenu non seulement de répondre de la vérité de ses

propositions mais, aussi, de livrer les preuves ou les raisons qui soutiennent la vérité des

propositions exprimées. La construction du vraisemblable dans l’activité journalistique en

général repose sur le travail de construction de la cohérence à partir de la vérification des

affirmations par les preuves annexes qui permettent leur confirmation.

3) Règle de Sincérité : l’énonciateur énonce sincèrement, c’est-à-dire, il est en conditions de

répondre de sa croyance en la vérité de ses propositions. Cette condition correspond, non

seulement à une obligation communicationnelle des responsables de l’énonciation dans un

JT mais elle est, en outre, régulée, dans la plupart des pays, du point de vue légal.

4) Règle de Contenu Propositionnel : le contenu de la proposition exprimée cherche à

atteindre un but communicationnel et la vérité de la proposition ne doit sembler évidente,

dans le contexte de l’énonciation, ni à l’énonciateur ni à l’énonciataire. Le but

communicationnel primordial d’un JT est celui d’améliorer la connaissance du téléspectateur

par rapport au monde (de la réalité), d’où que le rôle des “nouvelles” soit celui de nous

présenter le monde (une version de celui-ci) dans ses aspects inconnus, nouveaux ou

insolites.

Même en considérant cette analogie comme une extrapolation qui tend à forcer la Théorie

des Actes de Langage vers un domaine communicationnel qu’elle ne considère pas elle-

même (et que nous osons seulement aborder sous le couvert des propositions de Jost), dans

la mesure où le JT (et comme lui, la plupart des documentaires et des émissions qui nous

“parlent de la réalité” et que Jost range dans le mode d’énonciation authentifiant), respecte

toutes les règles décrites, il peut être considéré comme appartenant à la catégorie d'“acte

illocutoire assertif”.

Pourtant, comme nous l’avons vu, l’assertion, tout en étant un type important d’acte de

langage, ne correspond en aucun cas à la totalité des actes de langage possibles dans le

système de la langue.

Dès lors, si nous voulons porter l’analogie jusqu’à ses dernières conséquences logiques, le

mode authentifiant de Jost ne peut correspondre qu’aux actes illocutoires de type assertif et

non pas à l’ensemble des actes illocutoires.

Cela voudrait-il dire que, pour les autres catégories d’actes illocutoires définis par Searle, il n’y a pas de possibilité d’analogie avec les discours audiovisuels télévisuels?

Voyons :

n i ! f i c t i on ! n i ! r é a l i t é !

210!

Un spot publicitaire qui nous montre le “Roi du Matelas” (à la fois le magasin de matelas et le

nom commercial de l’entrepreneur qui protagonise le spot) et ses employés nous proposant

leurs produits comme étant les meilleurs et les moins chers du marché mais qui nous assurent

aussi d’être accueillis de manière préférentielle pour passer un bon moment dans leur

boutique, n’émet pas – si nous le “réduisons” à la Théorie des Actes de Langage – une

assertion mais une promesse.

Étant donné que le "Roi du Matelas" s’engage à faire quelque chose dans le futur, qu’il

manifeste son intention de nous faire épargner de l’argent, de gagner en qualité et de

passer un bon moment, on pourrait dire que l’acte discursif global qu’il profère est une

promesse. C’est seulement si nous entrons dans le magasin pour y acheter quelque chose,

que nous pourrons vérifier l’engagement de l’entrepreneur. Avant cela, l’énonciation ne

peut pas être évaluée comme étant vraie ou fausse, puisque la condition de sincérité est

l’intention du locuteur et non pas la croyance, comme dans le cas de l’assertion.

Du point de vue des actes illocutoires, une grande partie de la publicité à la télévision

pourrait correspondre à des promesses proférées par le sujet d’énonciation responsable

(l’entreprise qui veut vendre son produit à travers la médiation communicationnelle de

l’agence de publicité et de la chaîne télévisée), par rapport à un bien ou à des services

déterminés, plutôt qu’à des assertions.

Au-delà de la production de l’effet perlocutoire cherché par tout discours publicitaire

(changer ou renforcer une conduite de consommation), la force illocutoire du spot repose

sur l’acte de promettre, ce qui implique une direction d’ajustement du monde aux mots,

différent de celui de l’assertion.

Si le discours de la publicité peut arriver à être conçu comme un type d’acte illocutoire, au

même niveau mais avec une force illocutoire différente de l’assertion, cela permettrait de

démontrer que l’identification du mode authentifiant avec l’ensemble d’actes illocutoires (à

travers l’assertion), se présente comme une restriction arbitraire, même dans le cadre de la

logique de la Théorie des Actes de Langage.

Il est tout aussi légitime (ou illégitime) d’identifier l’acte discursif global d’un JT avec une

assertion, que d’identifier la publicité avec une promesse. Dès lors, si pour le JT, pour le direct

ou pour le documentaire il y a, dans la taxinomie de Jost, un mode d’énonciation particulier

(le mode authentifiant) qui est défini par le but assertif de ces programmes, il devrait aussi

avoir un équivalent pour le spot publicitaire qui donne compte du but promissif, particulier et

distinct de ce type d’émissions.

Ce constat doit encore être contrasté avec la réalité phénoménique de la communication

télévisuelle. Pourtant, d’un point de vue logique, il est parfaitement possible à partir du

moment où l’on établit l’analogie entre le discours télévisuel de réalité et les actes

illocutoires.

! s e c t i on ! 4 . ! c on c l u s i on s ! l e !mode ! poé t i que ! d an s ! l a ! t h éo r i e ! d e ! g en r e s ! t é l é v i s u e l s !

211 !

Il n’y a aucune raison de penser qu’il ne puisse pas y avoir d’autres modes d’énonciation

différents des trois modes définis par Jost pour la communication télévisuelle (en considérant

chaque type d’émission comme un acte discursif global). Selon les critères logiques de la

Théorie des Actes de Langage, nous pourrions espérer trouver, au moins au niveau théorique,

quatre autres modes d’énonciation qui devraient correspondre aux actes illocutoires

promissifs, expressifs, déclaratifs et directifs.

b. ! Le!mode!d'énonciation!poétique!comme!acte!i l locutoire!

Par prudence, nous avons évité d’affirmer que le spot publicitaire télévisé constitue un mode

d’énonciation différent des trois signalés par Jost, puisque, si cela est possible du point de vue

logique, il faut encore le démontrer en termes phénoménologiques. Il y a, toutefois, un mode

d’énonciation qui n’est pas compris dans la typologie de l’auteur français et dont nous avons

déjà établi le profil phénoménologique : le mode d’énonciation poétique, représenté par le

vidéo-clip, qui était l’objet du chapitre précédent.

Le mode d’énonciation poétique, défini à partir de la “Logique des Genres Littéraires” de

Hamburger, correspond à l’énonciation propre à un Je lyrique. Comme nous l’avons établi

(chapitres III et VI), ce Je lyrique, représenté dans la communication télévisuelle par la figure

du chanteur-groupe, est un sujet d’énonciation réel dans la mesure où l'on ne peut pas le

séparer ou l’éliminer de son énonciation. Pourtant, puisque dans le mode poétique,

l’énonciation ne s’adresse pas à l’objet mais au sujet lui-même, le Je lyrique ne peut pas être

considéré comme un sujet d’énonciation de type communicationnel (historique, théorique

ou pragmatique). C’est-à-dire, tandis que l’énonciation communicationnelle d’un Je-Origine

réel a pour fonction d’être efficace dans le contexte que spécifie son contenu, l’objectif de

l’énonciation lyrique est l’expression de la sensibilité subjective du Je-Origine lyrique. De là, la

dénomination de mode d’énonciation poétique.

Faisant le même transfert conceptuel que fait Jost entre la théorie de Hamburger et celle de

Searle, le vidéo-clip, en tant que mode d’énonciation poétique, pourrait être considéré

comme un acte illocutoire mais, en aucun cas, comme un acte de type assertif.

Deux raisons à cette affirmation :

- D’une part, comme nous l’avons établi dans le chapitre précédent, le vidéo-clip ne

correspond pas aux caractéristiques du mode authentifiant, mode que Jost identifie avec

l’acte illocutoire assertif.

- D’autre part, le vidéo-clip, considéré comme acte discursif global, ne présente aucune

des caractéristiques déterminées par Searle pour définir l’acte illocutoire assertif.

Nous rappelons les caractéristiques distinctes de la force illocutoire d’un acte assertif :

n i ! f i c t i on ! n i ! r é a l i t é !

212!

1) Le but ou le propos de l'assertion est d'engager la responsabilité du locuteur sur l'existence

d'un état de choses, sur la vérité de la proposition exprimée.

2) La direction d'ajustement va des mots au monde;

3) L'état psychologique exprimé est la croyance.

Dans la mesure où la fonction énonciative du mode poétique est l’expression de la sensibilité

du chanteur-groupe et non pas une action sur l’objet (la réalité), le but illocutoire global de

ce type de productions télévisuelles peut être définit comme celui d “exprimer l’état

psychologique spécifié dans la condition de sincérité”, comme dans l’acte illocutoire

expressif et non pas celui de la “croyance” comme dans le cas de l’assertion.

Suivant cette même logique, ce dont le responsable d’un énoncé lyrique, comme XXXX,

chanteur de Red Hot Chili Peppers, doit répondre n’est pas de la vérité de l’énoncé contenu

dans “Otherside” par rapport à la réalité mais la vérité de l’énoncé par rapport à sa

sensibilité. Considéré comme un acte illocutoire du point de vue de la Théorie des Actes de

Langage de Searle, le but du vidéo-clip n’est pas que le monde s’ajuste aux mots (comme le

fait la promesse du spot publicitaire) ou que les mots s’ajustent au monde (comme l’assertion

du JT); la vérité de la proposition est présupposée car la seule référence de l’énoncé est le

sujet d’énonciation (chanteur-groupe), comme la force illocutoire qui définit l’acte discursif

illocutoire expressif.

Ainsi, le mode poétique, pris comme acte discursif global que représente le vidéo-clip, loin

de se tenir aux règles qui définissent l’acte illocutoire assertif, s’ajuste, du moins en partie, au

profil d’un acte illocutoire expressif.

Ce constat, à la fois logique et phénoménologique (voir chapitre VI), a comme

conséquence directe, de même que les problèmes dérivés de la forme d’intégration du

mode ludique, le questionnement des principes de fonctionnement du triangle modal

proposé par l’auteur français.

C.! CONDITIONS! POUR! L'INTEGRATION! DU! MODE! POETIQUE! A! LA!THEORIE!DES!GENRES!TELEVISUELS!

Les deux problèmes que nous venons de citer indiquent le besoin d’élargir le nombre de

catégories dans la taxinomie de la Théorie des Genres Télévisuels.

Pourtant, il n’y pas moyen d’intégrer un nouveau mode d’énonciation sans mettre en

question tout le système de fonctionnement logique du modèle. Dans la mesure où celui-ci

se présente comme un système fermé composé de trois seuls modèles d’énonciation, la

possibilité d’un quatrième empêche la réalisation du jeu de médiations conçu par l’auteur

français dans son triangle modal.

! s e c t i on ! 4 . ! c on c l u s i on s ! l e !mode ! poé t i que ! d an s ! l a ! t h éo r i e ! d e ! g en r e s ! t é l é v i s u e l s !

213 !

Par ailleurs, il n’y a aucune raison d’ordre théorique ou méthodologique qui justifie la

restriction du modèle à trois modes d’énonciation. Cette limitation ne correspond ni à un

principe logique qui puisse être dégagé des propositions de Hamburger ou de Searle

(sources principales de l’auteur français), ni à une caractéristique phénoménologique

particulière de la communication télévisuelle, ni à une conséquence nécessaire de

l’ensemble des propositions de Jost.

C’est-à-dire, que l’existence de trois catégories seulement, tout en étant une caractéristique

du système de fonctionnement de la taxinomie de l’auteur français, n’est pas une base sur

laquelle repose toute sa Théorie des Genres Télévisuels. De fait, c’est la mise en œuvre des

propositions de Jost ( et ses référents théoriques) qui nous a permis d’établir le problème

d’ordre logique que ce modèle porte en son sein et qui s’exprime dans la restriction signalée.

Comme nous l’avons démontré, cette restriction repose sur deux opérations qui se présentent

comme totalement arbitraires :

- la limitation à un seul type de catégories pour les fonctions énonciatives télévisuelles

assimilables à l’ensemble des actes perlocutoires possibles.

- la limitation à un type de catégorie pour les fonctions énonciatives télévisuelles

assimilables à l’ensemble des actes illocutoires possibles

Dès lors, une reformulation au niveau du fonctionnement logique du système devrait

permettre d’intégrer, non seulement le mode d’énonciation poétique mais toutes les

catégories qui peuvent être définies dans le cadre de cette théorie, sans pour autant

provoquer des problèmes à l’ensemble du modèle.

Bien que nous nous trouvions au point où notre analyse commence à toucher des problèmes

qui dépassent les objectifs de notre travail ("comprendre comment on comprend" le vidéo-

clip), nous pensons qu’il est fondamental d’aborder les critères à partir desquels nous

pourrions ouvrir la théorie des genres télévisuels à d’autres modes d’énonciation autres que

l’authentifiant, le fictif et le ludique.

Tenant compte de nos limites, nous nous risquons à avancer les conditions générales

suivantes qui pourraient permettre l’intégration du mode d’énonciation poétique : la

redéfinition du mode ludique et l’abandon du mode de fonctionnement triadique.

1.! REDEFINITION!DU!MODE!D'ENONCIATION!LUDIQUE!

Comme nous l’avons dit précédemment, Jost définit le mode d’énonciation ludique à partir

d’un double critère : le caractère mixte de sa structure et l’effet perlocutoire recherché. A

partir de cette définition, le mode d’énonciation ludique est appelé à jouer un rôle décisif

dans le système de fonctionnement de la Théorie des Genres Télévisuels.

n i ! f i c t i on ! n i ! r é a l i t é !

214!

D’une part, le mode d’énonciation poétique joue le rôle d’intermédiaire entres les modes

authentifiant et fictif et, d’autre part, il permet la distinction des programmes selon qu’ils

soient près ou loin de l’intention perlocutoire qui correspond à sa deuxième condition.

Nous avons vu que la présence du mode ludique dans le système en fonction de son effet

perlocutoire particulier représentait l’absence de tous les autres modes possibles dont le but

perlocutoire était différent. Cela constitue non seulement un problème au niveau logique de

la théorie mais, en outre, ne permet pas de reconnaître l’infinité de buts que peut avoir la

communication télévisuelle, au-delà de celui de divertir et de distraire les téléspectateurs.

D’autre part, et après avoir considéré ce qui précède comme un des problèmes logiques

importants dans le modèle de Jost, le double critère de définition peut être difficilement

acceptable car il permet de grouper des programmes au caractère communicationnelle

totalement différent et ne rend pas compte du processus de compréhension spectatorielle

qui permet de différencier, par exemple, un concours du type “Le Maillon Faible” d’un

programme humoristique comme le “Vidéo-gag”.

Tandis que "Le Maillon Faible" peut être catalogué à partir du caractère mixte de sa structure

énonciative (critère qui répond à la logique du statut de l’acte d’énonciation), le “Vidéo-

gag” peut être catalogué à partir de l’effet perlocutoire (fonction discursive).

Si nous tentons une classification à partir du but perlocutoire du programme “Le Maillon

Faible”, le résultat pourrait difficilement correspondre à une intention similaire au “pour de

rire” du “Vidéo-gag.

"Le Maillon Faible" est un concours dans lequel l’animatrice Laurence Boccolini après une

ronde de questions aux 8 participants, les invite à éliminer celui qui, à leur avis, s’est montré

le plus faible et à en expliquer les raisons. La gravité du ton et la sévérité de l’animatrice et le

dramatisme de la mise en scène constituent deux traits distinctifs de ce programme qui

pousse les participants à se confronter en termes peu amicaux.

Par contre, si nous appliquons au “Vidéo-gag” le même critère appliqué au “Maillon Faible”

pour son intégration dans la typologie du mode ludique, nous pouvons facilement démontrer

qu’il ne s’agit pas d’une émission de type énonciatif mixte : à la différence des programmes

de jeu ou des concours, dont les participants sont soumis à des règles qui leur sont imposées,

“Vidéo-gag” est réalisé à partir de la présentation de vidéos domestiques qui montrent des

scènes comiques, la plupart enregistrées de manière spontanée et qui sont le fruit du hasard.

Dans la plupart des cas ces brefs enregistrements nous montrent des chutes, des erreurs ou

des situations insolites vécues par des personnes comme nous, et c’est ce caractère réel qui

rend le document comique.

Dans la mesure où le jeu n’implique pas nécessairement une dimension comique et vice-

versa, la double condition du mode ludique ne permet pas de distinguer les importantes

différences, au niveau énonciatif, entre programmes qui, selon la définition de Jost,

! s e c t i on ! 4 . ! c on c l u s i on s ! l e !mode ! poé t i que ! d an s ! l a ! t h éo r i e ! d e ! g en r e s ! t é l é v i s u e l s !

215 !

correspondent à la même catégorie. Si ces critères sont pertinents séparément, leur

application conjointe devient problématique et confuse.

Tout semble, ainsi, indiquer que la solution à ce problème serait la séparation des deux

conditions de définition, pour constituer deux typologies séparées, une à partir de l’intention

ludique et une autre à partir de l’intention comique.

Comme nous allons le voir ci-après, cette séparation du mode ludique en deux modes

d’énonciation différents, est une condition préalable et cohérente avec l’abandon du

système triadique.

2.! JE=ORIGINE!ET!INTENTION!ENONCIATIVE!

L’analyse que nous avons réalisée tout au long de ce chapitre, a démontré qu’il est

nécessaire d’abandonner le système de fonctionnement triadique de la théorie de Jost, car

c’est justement là que réside le problème de rigidité du modèle. Pourtant, cela nous oblige à

concevoir des critères et des principes de fonctionnement alternatifs qui, tout en rendant

compte du processus spectatoriel de la communication télévisuelle, permette l’inclusion

d’autres catégories de modes d’énonciation.

La “Logique des Genres Littéraires” nous a servi à déterminer le statut du sujet d’énonciation

dans le vidéo-clip (Je lyrique) et, à partir de cela, le mode d’énonciation propre à ce type

de documents télévisuels (mode d’énonciation poétique). Par ailleurs, la “Théorie des Actes

de Langage” nous a permis d’établir que, dans la mesure où l’acte illocutoire ne se limite pas

à l’assertion et dans la mesure aussi où les actes perlocutoires possibles tendent à l’infini, une

typologie basée sur cette logique “intentionnaliste” ne peut pas se limiter à la triade

“authentifiant, fictif et ludique”.

Pour conclure de manière correcte l’analyse phénoménologique du vidéo-clip dans le

modèle de Jost, nous avons fait appel à ses sources, c’est-à-dire à Hamburger et à Searle.

Dès lors, un dernier regard sur le rapport entre les propositions de ces deux théoriciens

pourrait nous être utile pour construire un critère alternatif de fonctionnement pour la Théorie

des Genres Télévisuels.

Faisant un rapide parcours de ce que nous avons vu dans les chapitres précédents, nous

pourrions dire que Jost extrait de Hamburger la logique de l’opposition réalité/fiction, qui est

à l’origine du concept de “Je-Origine” et de Searle, la notion de fonction discursive, c’est-à-

dire, l’intention énonciative spécifique de l’énoncé, à partir de laquelle il crée ses propres

catégories génériques des modes d’énonciation.

Jost intègre les catégories de Je-Origine de Hamburger avec celles de fonction discursive de

Searle, par le biais de la correspondance entre le niveau de son intention énonciative

spécifique (représenté par les modes d’énonciation). Ainsi, les modes d’énonciation vont

n i ! f i c t i on ! n i ! r é a l i t é !

216!

correspondre à la fonction discursive que peuvent adopter, dans leur énonciation, chacune

des deux catégories de Je-Origine.

C’est seulement après avoir établi cette relation entre le Je-Origine et l’intention énonciative,

que Jost arrive à soutenir qu’un Je-Origine réel peut énoncer en fonction de deux seuls

intentions : l’authentifiante et la ludique, tandis que le Je-Origine fictif le fait en fonction

seulement de la fictionnelle.

Si nous nous limitons au fondement de l’opération d’intégration des Je-Origine et des

fonctions discursives, nous pouvons voir que cette intégration n’implique pas nécessairement

la limitation des catégories à trois, comme le soutient Jost.

Comme nous l’avons expliqué précédemment, les deux grandes catégories de Je-Origine

de Hamburger (réel et fictif) contiennent l’ensemble des “Je” possibles15.

Dans la catégorie des Je-Origine réels, on peut ranger les sujets d’énonciation capables

d’énoncer la totalité des énoncés communicationnels, depuis les assertions jusqu’aux

interrogations, les ordres, les jugements ou les exclamations. Ces énoncés correspondent aux

sujets d’énonciation historique, théorique et pragmatique (Hamburger K, 1986, pp. 46 à 62).

Mais cette catégorie contient, en outre, le Je lyrique qui, bien qu’il ne produise pas

d’énoncés de caractère communicationnel, ne peut pas être dégagé de son caractère réel

(Op. cit. pp. 205 à 255).

Par ailleurs, dans la catégorie des Je-Origine fictif, nous pouvons situer autant le sujet de la

narration fictionnelle (Je fictif) que celui de l’énoncé de réalité feint (Je feint).

La première sous-catégorie correspond à la mimésis de la réalité, ce qui veut dire qu’elle est

une structure narrative qui produit l’apparence de la réalité sans prétendre pour autant être

la réalité (Op. cit., pp. 67 à 203). La deuxième sous-catégorie – l’énoncé de réalité feint – est,

lui, une mimésis de l’énoncé de réalité, c’est-à-dire qu’il correspond à une structure narrative

qui n’est pas la réalité qu’il prétend être (Op. cit., pp. 259 à 299).

Si nous maintenons le critère de ces deux grandes catégories de Je-Origine, nous verrons

qu’elles peuvent englober, à elles deux, l’ensemble des émissions télévisuelles. Cette option

suppose que, par rapport au statut ontologique du Je-Origine, il n’y a pas de graduation

entre la fiction et la réalité. Entre le Je-Origine réel et le Je-Origine fictif, il y a une frontière

infranchissable. C’est-à-dire, en ce qui concerne le statut ontologique du sujet d’énonciation

il n’y a pas de catégories mixtes, comme c’est le cas au niveau du statut de l’acte énonciatif

ou de la fonction discursive.

15 C’est Jost lui-même qui reconnaît que son Je ludique n’est autre chose qu’une variante du Je-Origine réel

soumis à des règles qui déterminent son comportement : "Dans la première catégorie [les Je-Origine réels], j'introduirais volontiers une nouvelle frontière : il y a les Je-Origines réels qui répondent eux-mêmes de leurs assertions en vertu des règles sémantiques qui les régulent, il y a des Je-Origines réels (en l'occurrence des jeux-origines) qui sont soumis à des règles ou à des rites qui les dépassent". (Jost, F, 1998, p. 36).

! s e c t i on ! 4 . ! c on c l u s i on s ! l e !mode ! poé t i que ! d an s ! l a ! t h éo r i e ! d e ! g en r e s ! t é l é v i s u e l s !

217 !

"Nous avons soutenu que la disparition d'un Je-Origine réel, d'un sujet d'énonciation, est

l'élément structurel essentiel qui définit un monde fictif". (Hamburger, K, 1986, p. 126).

Dans la mesure où le Je-Origine réel ne disparaît pas, la présence de personnages ou d’une

diégèse fictionnelle n’implique pas l’entrée automatique des Je-Origine fictif. Seul la

disparition du sujet d’énonciation réel permet l’émergence des Je-Origine fictif.

Cela nous avons pu le voir clairement dans notre analyse du clip “Ex-girlfriend”. Même si une

trame fictionnelle s’y développe (série 2), la présence des Je-Origine réels représentés par le

groupe No Doubt, et principalement par sa chanteuse Gwen Stephani (série 1), empêche la

constitution du monde fictionnel cohérent “agents secrets et mafieux”. Dans la mesure où les

sujets d’énonciation réels et les personnages coexistent, le statut ontologique de

l’énonciation comme acte global, est toujours réel.

A un niveau plus général, le fait que le Je lyrique corresponde, dans le clip, à un sujet

d’énonciation réel, la forme fictionnelle de ce type d’émissions (représentée principalement

par l’inclusion d’une diégèse fictionnelle) ne suffit pas à renvoyer l’énonciation du clip à un

Je-Origine fictif de statut ontologique différent de celui de la figure chanteur-groupe. La

présence du Je-Origine réel désactive le statut fictionnel.

C’est-à-dire, si le statut de l’acte d’énonciation peut prendre la forme de la fiction (comme

dans le clip) ou de réalité (comme dans le faux documentaire ou dans les films

d’énonciation de réalité feint), le statut ontologique du Je-Origine ne dépend pas de cela,

puisque la classification d’un énoncé n’a pas son fondement dans la réalité (ou non-réalité)

de l’objet énoncé mais dans la réalité ou non-réalité du sujet d’énonciation.

Comme nous le voyons, cette catégorisation à partir du statut ontologique du Je-Origine

permet d’accéder à un niveau de distinction fondamental pour la compréhension

spectatorielle des programmes télévisuels : la différence entre les programmes de réalité et

les programmes de fiction.

Pourtant, cela nous permet seulement d’établir une frontière qui, malgré son importance clé

dans le processus de compréhension de la communication télévisuelle, représente

seulement le premier échelon dans la catégorisation des émissions.

Étant donné que le statut ontologique du sujet d’énonciation n’est pas suffisant pour

distinguer entre programmes aussi divers que le jeu télévisé, la publicité ou le JT (émissions,

toutes, de réalité), il devient pertinent et nécessaire d’introduire, comme le fait Jost, le niveau

de l’intention énonciative, comme deuxième critère de classification subordonné au statut

ontologique du sujet d’énonciation.

Ainsi, nous pouvons ranger, dans la catégorie de Je-Origine réel, un premier type d’émissions

réalisées dans le mode d’énonciation authentifiante (dans les mêmes termes définis par Jost).

On peut inclure ici, aussi bien des programmes comme le JT et le documentaire, que des

n i ! f i c t i on ! n i ! r é a l i t é !

218!

programmes comme le talk show ou le reality show, dans la mesure où ces derniers peuvent

aussi être identifiés comme ayant une intention énonciative d’authentification de leurs

discours, ce qui leur permet d’être évalués à partir d’un critère vrai/faux.

Un autre type d’émission qui a comme origine des Je réels, correspondrait aux programmes

de divertissement qui se basent, avant tout, sur les effets de leurs discours. Tel est le cas des

programmes humoristiques et des variétés. Si le critère de vérité n’a ici aucune utilité

évaluative, celui de succès semble être la barre de mesure qui évalue le résultat atteint par

l’intention énonciative de ce type de programmes.

Un troisième type d’émissions qui a aussi comme origine les Je réels, sont les jeux et les

concours. Définis par la condition du respect de certaines règles, leur critère d’évaluation est

la réussite ou l’échec dans l’épreuve à laquelle sont soumis les participants.

Un quatrième type de programmes de réalité sont ceux dont l’intention énonciative n’est

pas de chercher l’authentification de l’énoncé mais qui s’orientent plutôt vers l’expression de

la sensibilité du sujet d'énonciation. Ces émissions correspondent au mode d’énonciation

poétique, représenté, principalement, par le vidéo-clip, mais qui regroupe d’autres

programmes comme le vidéo-art. Ici, le seul critère d’évaluation est la pertinence de

l’énonciation par rapport à l’énonciateur, puisque l’objectif communicationnel de ce type

de programmes est l’expression de la sensibilité du Je-Origine.

A l’autre extrême, le champ de la fiction qui correspond aux Je-Origine fictif, est constitué

par l’ensemble des émissions qui sont des mimésis de la réalité (mode d’énonciation fictif) et

par celles qui, ayant une origine fictive, sont la mimésis de l’énoncé de réalité (mode

d’énonciation feint).

Dans la première sous-catégorie, nous pouvons inclure la plupart de la production filmique et

télévisuelle, depuis les films jusqu’aux sit’com, en passant par la soap-opera ou la série

télévisée. Le seul critère d’évaluation valable en est la cohérence du monde diégétique

créé par et pour la narration.

La deuxième sous-catégorie, par contre, est limitée aux films fictionnels construits comme

documentaires16. Les critères d’évaluation de ce mode d’énonciation sont à la fois la

cohérence du monde et la pertinence authentifiante des affirmations que l’on y fait.

Par ailleurs, sous cette condition de catégorisation, dans laquelle les modes d’énonciation

sont soumis au statut ontologique des Je-Origine, on peut parfaitement accepter des

catégories qui aient comme point de départ le but perlocutoire des émissions télévisuelles.

Cela signifie que la définition d’un mode d’énonciation basé sur l’intention énonciative

ludique d’un programme de réalité, tel que “Qui veut gagner des millions” ou d’un autre

16 Un exemple en serait Zelig (Woody Allen, 1983).

! s e c t i on ! 4 . ! c on c l u s i on s ! l e !mode ! poé t i que ! d an s ! l a ! t h éo r i e ! d e ! g en r e s ! t é l é v i s u e l s !

219 !

fictionnel, comme le “feuilleton T.V.” - aux effets sinon contraires du moins très différents - ne

représente pas maintenant un problème logique.

Dans la mesure où leur origine se situe à l’un ou l’autre pôle de l’opposition réalité/fiction, un

mode d’énonciation défini à partir de l’intention perlocutoire comique peut englober, aussi

bien des programmes de réalité, tel que le “Vidéo-gag”, que des programmes de fiction

comme la sit’com “Friends”.

Nous pouvons, ainsi, configurer un tableau ouvert à l’ensemble des modes d’énonciation

possibles, basés sur l’intention énonciative, émanant aussi bien d’un Je-Origine réel que d’un

Je-Origine fictif.

STATUT DU JE ORIGINE RÉEL FICTIF

Authentifiant Fictif MODES D'ÉNONCIATION Comique Feint (fonction discursive) Ludique (...) Lyrique (...)

T A B L E A U 8

Un critère de fonctionnement logique du système basé sur le statut ontologique du Je-

Origine et sur la fonction discursive, permet l’inclusion de n’importe quel autre mode

d’énonciation qui réponde à la condition de représenter, soit un but perlocutoire, soit une

intention énonciative.

Pour conclure, il est nécessaire de réitérer que les deux conditions que nous venons de

signaler, ne prétendent pas constituer une proposition de fonctionnement alternative. Notre

intention est celle d’établir des conditions cohérentes au niveau théorique et

méthodologique, pour l’inclusion de tous les modes d’énonciation possibles de la

communication télévisuelle, dans la Théorie des Genres Télévisuels de Jost. Comme nous

l’avons signalé auparavant, une proposition dans ce sens doit avoir comme point de départ

obligé le contraste de la théorie avec la réalité empirique des discours télévisuels. Cette

tâche, sans doute nécessaire, dépasse les limites du présent travail.

n i ! f i c t i on ! n i ! r é a l i t é !

220!

! DIGRESSIONS!FINALES

Ni fiction ni réalité, le mode d’énonciation poétique est l’expression de la sensibilité du sujet

d’énonciation. Que ce soit au cinéma, à la télévision ou dans la littérature, la logique des

discours lyriques ne se laisse pas encadrer par les règles de la fiction ni par celles des discours

authentifiants.

Il nous est sans doute arrivé, plus d’une fois, qu’un film de Kieslosky nous laisse une sensation

de lyrisme1, qu’un documentaire de Patricio Guzmán nous évoque un discours épique2 ou

qu’un vidéo-clip comme celui de Kelis à propos de la violence familiale 3, nous renvoie à des

faits réels. Mais il s’agit toujours, respectivement, de fiction, de documentaire et de vidéo-clip

et c’est en tant que tels qu’ils orientent notre compréhension.

Comme c’est le cas pour un poème, un roman ou une chronique journalistique, les différents

programmes télévisuels ne peuvent être compris qu’à partir de l’attribution d’un mode

d’énonciation spécifique, d’une intentionnalité discursive et de la construction d’un Je-

Origine responsable de l’énonciation. Cette activité d’attribution-reconnaissance dirige et

fonde notre expérience de téléspectateurs.

Dans ce sens, affirmer que le mode d’énonciation du vidéo-clip est poétique, ne relève

d’aucun jugement esthétique ou de valeur mais des caractéristiques logiques du discours

dans ce type de productions médiatiques.

Art ou pastiche, la logique du discours dans le vidéo-clip, qui est la même que dans la

poésie, ne lui garantit pas son statut artistique. Au-delà des consensus fédératifs par rapport à

l’art audiovisuel, il n’y a pas un mode d’énonciation audiovisuel spécifiquement artistique.

Sans s’y opposer vraiment, le questionnement sur l’art audiovisuel se situe à un niveau

différent de celui de la logique des discours télévisuels.

Si l’expérience que nous pouvons avoir à partir d’un vidéo-clip est qualitativement différente

de celle que nous permet un film ou un documentaire, cela est dû au fait que le clip

représente un phénomène logico-médiatique qualitativement différent des discours de

fiction et de ceux de réalité. D’où le besoin d’une phénoménologie des discours audiovisuels.

1 En particulier ceux de la célèbre trilogie : Bleu, Rouge et Blanc du réalisateur Krzysztof Kieslosky, (1993, '94

et '94). 2 Nous faisons ici allusion à La Batalla de Chile, documentaire de ce réalisateur chilien. 3 Kellis, Caugth Out There, Kaleidoscope, 2000.

! d i g r e s s i on s ! f i n a l e s !

221 !

Mais, dans la mesure où la phénoménologie n’est pas une simple activité descriptive des

phénomènes en soi mais une « méthode de description symptomatique » (comme nous le

propose Käte Hamburger), elle ne peut pas ignorer ou se détourner des formes qu’adopte

l’expression créative dans la réalisation concrète des programmes de télévision.

La forme poétique n’est pas une caractéristique sine qua non du poème, tout comme la

« forme clip » ne l’est pas par rapport au vidéo-clip. Mais il est indéniable que la

caractéristique formelle la plus distinctive de ce type de programmes s’appuie sur le jeu

permanent de négation et d’affirmation des canons esthétiques du cinéma, de la télévision

et de l’audiovisuel en général. Cela explique, sans doute, que la plupart des approches du

phénomène médiatique du vidéo-clip, lorsqu’elles n’ont pas une dimension éthique, sont

éminemment esthétiques4.

Condamnée ou sauvée par sa condition aporétique, l’expression créative résiste à la

logique. Mais, comme toute restriction, elle devient la force qui empêche la théorie "de

renoncer aux tentations de résoudre l'insoluble", comme le soutenait Adorno.

D’où le besoin persistant de revenir, même de manière fugace et approximative, sur la

relation entre la logique des discours médiatiques et l’esthétique télévisuelle, surtout après

avoir défini le vidéo-clip comme genre, dans une perspective logique.

Il est curieux et significatif à la fois de constater que beaucoup de travaux à vocation

esthétique traitant du vidéo-clip ont, depuis longtemps, comparé cette pratique

audiovisuelle avec la poésie. La brièveté, le récit fragmenté, la substitution métonymique et

métaphorique, le déploiement d’un imaginaire éclaté, le rythme et la sensibilité expressive,

bref, l’esthétique du poème a servi de modèle bien avant la logique du discours, pour

l’analyse de ce type d’émissions.

A partir de maintenant, et bien que ses aspects formels ne suffissent pas à expliquer

comment on comprend un programme de télévision, cela ne nous semblera plus une simple

coïncidence si la structure stéréotypique du clip ressemble à la structure stéréotypique du

poème. La définition logique et esthétique du clip semble similaire à la définition de la

poésie, même en considérant l’énorme distance entre la littérature et les discours télévisuels.

Puisque cette coïncidence (ou conséquence ?) entre le clip et la poésie semble ouvrir la

possibilité de rapprocher la logique et l’esthétique, nous pourrions être tentés d’étendre la

comparaison. Moins pour que cela soit possible et valable, il reste à déterminer le rôle que

peut jouer la logique des discours télévisuels dans la connaissance et la compréhension de

4 L’analyse du vidéo-clip combine souvent les points de vue éthiques et esthétiques. C’est le cas du travail de

Jean-Marc Vernier, "L'image-pulsation" (: 1986), texte que nous pourrions considérer fondationnel par rapport à l’analyse du vidéo-clip car il a servi de matrice au travail d’un nombre important d’auteurs intéressés par ce type de productions télévisuelles tels que Jost, Del Villar, Chion ou Chamberlain, parmi d’autres qui font référence directement ou indirectement au texte mentionné.

n i ! f i c t i on ! n i ! r é a l i t é !

222!

sa dimension esthétique. En d’autres mots, il est encore nécessaire d’établir la relation

concrète qui peut exister entre la logique et l’esthétique des discours médiatiques.

Ceci peut constituer aussi bien une conclusion qu’un point de départ.

! v i d éo ? c l i p s ! c i t é s !

223 !

! VIDEO=CLIPS!CITES

ALAIN BASHUNG – Ma Petite Entreprise, Mes Petites Entreprises, 2001.

ANOUK – The Dark, Urban Solitude, 2000.

AQUA – Cartoon Heroes, Aquarium, 2000.

BACKSTREET BOYS – I Want It That Way, Millennium, 1999. – The One, Millenium, 1999.

BLINK 182 – All the Small Things, Enema of the State, 1999.

BOMFUNK MC'S – Free Styler, In Stereo, 2000.

BON JOVI – It's my Life, Crush, 2000.

BRITHNEY SPEARS – Sometimes, Baby One More Time, 1999.

CARLOS SANTANA – Maria, Maria, Supernatural, 2000.

COLDPLAY – Yellow, Parachutes, 2000.

CRAIGT DAVID – Seven Days, Seven days, 2000.

EROS RAMAZOTTI – Las Cosas de la Vida, Las Cosas de la Vida, 1996.

FATBOY SLIM' – Right Here, Right Now, You've Come Along Way, Baby, 1998. – Weapon of Choice, Halfway Between tha Gutter and the Stars, 2000. – Ya Mama, , Halfway Between tha Gutter and the Stars, 2000.

FRENCH AFFAIR – My Heart Goes Boom, single, 2000.

GABRIEL – Rise, Rise, 2000.

KELIS – Caught Out There, Kaleidoscope, 2000. – Good Stuff, Kaleidoscope, 2000.

LIMP BIZKIT – Take a Look Around, Chocolate Starfish and the Hotdog Flavored Water, 2000.

MADONNA – Material Girl, Like a Virgin, 1985.

n i ! f i c t i on ! n i ! r é a l i t é !

224!

MARIAH CAREY – Against All Odds, Rainbow, 1999.

METALLICA – Nothing Else Matters, single, 1999.

MICHAEL JACKSON – Thriler, Thriller, 1983.

MOBY – Natural Blues, Play, 1999.

NSYNC – Bye, Bye, Bye, No Strings Attached, 2000.

PETER GABRIEL – Come Talk To Me, Secret World Live, 1992.

PINK FLOYD – The Wall, The Wall, 1994.

RED HOT CHILI PEPPERS – Californication, Californication, 2000. – Otherside, Californication, 2000.

REMBRANDS – I'll be There for You, L.P., 1995.

RICKY MARTIN – She Bangs, Sound loaded, 2001.

TOM JONES – Sex Bomb, Reload, 2000.

TUPAC – California Love, All Eyes on Me, 1996.

VENGABOYS – Sha La La La, Platinium Album, 2000.

! ém i s s i on s ! d e ! t é l é v i s i on ! c i t é e s !

225 !

! EMISSIONS!DE!TELEVISION!CITEES

– Alerte à Malibu. 12

– Ally MacBeal. 12, 82

– Colombo. 12

– Chapeau Melon et Bottes de Cuir. 124

– Friends. 11, 12

– Journal Télévisé (RTBF). 12, 13

– La Petite Maison dans la Prairie. 120

– Le Maillon Faible. 249, 250

– Le Millioner. 134

– Miami Vice. 158

– Mission Impossible. 158

– Música Si. 40

– New York Police Departement. 12

– Nulle Part Ailleurs. 31

– Qui veut gagner des millions? 134, 254

– Super-agent 86. 158

– Star Treck. 124

– Vidéo Gag. 32, 249, 250, 255

– X Files. 12

n i ! f i c t i on ! n i ! r é a l i t é !

226!

! F I L M S ! C I T E S

– All the President's Men, Alan J. Pakula, 1976.

– Beetlejuice, Tim Burton, 1988.

– Ben Hur, William Wyler, 1959.

– Blade Runner, Ridley Scott, 1982.

– Brave Heart, James Mackay, 1996.

– Brazil, Tierry Gillian, 1986.

– Dances with Wolves, Kevin Costner, 1990.

– Die Unendliche Geschichte, Wolfgang Petersen, 1984.

– Forrest Gump, Robert Zemeckis, 1993.

– Gentelmen Prefer Blondes, Howard Hawks, 1953.

– Groundhog Day, Harold Ramis, 1993.

– Le cuirassé Potemkin, S. Eisenstein, 1926.

– Mad Max, George Miller, 1979.

– Natural Born Killers, Oliver Stone, 1994.

– Platoon Leader, Norris A., 1988.

– Rear Window, Alfred Hitchcock, 1954.

– Spellbound, Hitchock, 1945.

– Taxi Driver, Martin Scorsese, 1976.

– The Citizen Kane, Welles, 1940

– The Fearless Vampire Killers, Roman Polanski, 1967.

– The Shining, Stanley Kubrick, 1980.

– The Silence of the Lambs, Jonathan Demme, 1991.

– Tommy, Ken Roussel, 1975.

– Wild Strawberries, Ingmar Bergman, 1957.

– Zelig, Woody Allen, 1983.

! b i b l i o g r aph i e !

227!

! B!L!I!B!L!I!O!G!R!A!P!H!I!E

ADORNO, T. W. ET EISLER, H. – Musique de Cinéma, Paris, L'Arche, 1972.

ALVAREZ, L. – Poétique du Direct Télévisuel. Louvain-la-Neuve, Ciaco Éditeur, 1985.

ARISTOTE. – La Poétique, trad. Magnien, M., Paris, Le Livre de Poche, 1990.

AUMONT, J. ET AL. – Esthétique du Film, Paris, Nathan, 1983.

AUMONT, J. ET MARIE, M. – L'Analyse des Films, Paris, Nathan, 1989.

AUSTIN, J. L. – Quand Dire, c'est Faire, Paris, Éditions du Seuil, 1970.

BÄCHLER, O., MURCIA, C. ET VANOYE, F. (SOUS LA DIRECTION DE) – Cinéma et Audiovisuel. Nouvelles Images, Approches Nouvelles, Paris, L'Harmattan,

2000.

BEYLOT, P. – Quand la télévision parle d'elle-même, Paris, INA / L'Harmattan, 2000.

BORDWELL, D. – Narration in the Fiction Film, Madison, The University of Wisconsin Press, 1985.

BOUGNOUX, D. – « Le compromis télévisuel », in Les Cahiers de Médiologie, n° 1, 1996.

BOURDON, J. – « Le direct : une politique de la voix ou la télévision comme promesse inaccomplie »,

in Réseaux n° 81, CNET, 1997. – « L'archäique et la postmoderne : éléments pour l'histoire d'un peu de télévision » in

Penser la télévision, Colloque de Cerisy-la-Salle, Juin 1997, Paris, INA / Nathan, 1998.

BOURDON, J. ET JOST F. (SOUS LA DIRECTION DE). – Penser la télévision, Colloque de Cerisy-la-Salle, Juin 1997, Paris, INA / Nathan, 1998.

CASSETTI, F. – « Les yeux dans les yeux », Communications n° 38, Paris, Seuil, 1983. – D'un Regard à l'Autre. Le Film et son Spectateur, Lyon, P.U.L., 1990.

CASSETTI, F, ET ODIN, R. – « De la paléo à la néo-télévision », in Communications n° 51, Paris, Seuil, 1990.

CASSETTI, F, ET DI CHIO, F. – Cómo Analisar un Film, Barcelona, Paidós, 1996. – Análisis de la Televisión. Instrumentos, Métodos y Prácticas, Barcelona, Paidos, 1999.

CHAMBERLAND, R. – « Le vidéo-clip : un récit transgénérique » in De l'Écrit à l'Écran, Québec, Pulim, 2000.

CHARAUDEAU, P. – « Les conditions d'une typologie des genres télévisuels d'information » in Réseaux n°

81, CNET, 1997 (a).

n i ! f i c t i on ! n i ! r é a l i t é !

228!

– Le Discours de Information Médiatique. La construction du Miroir Social, Paris, Nathan/INA, 1997 (b).

CHARAUDEAU, P. ET AL. – La Télévision et la Guerre. Déformation ou Construction de la Réalité, Bruxelles,

INA/De Boeck Université, 2001.

CHATEAU, D. – « Diégèse et énonciation », Communications n° 38, Paris, Seuil, 1983. – Le Cinéma comme Langage, Paris, AISS-IASPA, 1986. – « Interprétance et activation : deux concepts clés d'une théorie de la réception

télévisuelle comme pratique » in Penser la Télévision, Colloque de Cerisy-la-Salle, Juin 1997, Paris, Nathan Université, 1998.

CHATEAU, D., GARDIES, A., JOST, F., (SOUS LA DIRECTION DE). – Cinémas de la Modernité : Films, Théories, Paris, Klincksieck, 1981.

CHATEAUVERT, J. – Des Mot à l'Image. La Voix Over au Cinéma, Paris/Québec, Méridiens Klincksieck/Nuit

Blanche Éditeur, 1996.

CHION, M. – L'Audio-Vision, Paris, Éditions Nathan, 1990. – La Musique au Cinéma, Paris, Fayard, 1995.

CORNUEJOLS, A. – « », XXXX,

DEL VILLAR, R. – Trayectos en Semiótica Fílmico Televisiva, Santiago, Dolmen Ediciones, 1997.

DUCROT, O. – Dire et ne pas Dire. Principes de Sémantique Linguistique, Paris, Hermann, 1972. – Le Dire et le Dit, Paris, Minuit, 1984.

DUCROT, O, ET AL. – Les Mots du Discours, Paris, Les Éditions de Minuit, 1980.

DUCROT, O, ET SHAEFFER, J-M. – Nouveau Dictionnaire Encyclopédique des Sciences du Langage, Paris, Éditions du

Seuil, 1995.

ECO, U. – « T.V. : la transparence perdue », in La Guerre du Faux, Paris, Livre de Poche, 1985.

ESQUENAZI, J-P. – « Le renouvellement d'un jeu de langage. Genres et canaux », in Réseaux, n° 81,

CENET, 1997.

GARDIES, A. – Décrire à l'Écran, Québec/Paris, Nota Bene Éditeur/Méridiens Klincksieck, 1999.

GARDIES, A, ET BESSALEL, J. – 200 Mots-Clés de la Théorie du Cinéma, Paris, Les Éditions du Cerf, 1992.

GARDIES, A, ET TARANGER, M-C., (SOUS LA DIRECTION DE) – Télévision : Questions de Formes, Paris, L'Harmattan, 2001.

GAUDREAULT, A. – Du Littéraire au Filmique. Systeme du Récit, Paris, Méridiens Klincksieck, 1988

GAUDREAULT, A, ET JOST, F. – Le Récit Cinématographique, Paris, Nathan Université, 1990.

GENETTE, G. – Figures III, Paris, Éditions du Seuil, 1972. – Palimpsestes, Paris, Éditions du Seuil, 1982. – Nouveau Discours du Récit, Paris, Éditions du Seuil, 1983.

! b i b l i o g r aph i e !

229!

– « Introduction à l'architexte », in Genette, G. et Todorov, T. (sous la direction de), Théories des Genres, Paris, Éditions du Seuil, 1986.

– Fiction et Diction, Paris, Éditions du Seuil, 1991.

GENETTE, G. ET TODOROV, T. (SOUS LA DIRECTION DE) – Théories des Genres, Paris, Éditions du Seuil, 1986.

GREIMAS, A-J, ET COURTES, J. – Sémiotique. Dictionnaire Raisonné de la Théorie du Langage, Paris, Hachette, 1993.

HAMBURGER, K. – Logique des Genres Littéraires, Paris, Éditions du Seuil, 1986.

HAMON, PH. – Introduction à l'Analyse du Descriptif, Paris, Hachette Université, 1981.

HANOT, M. – Télévision : Réalité ou Réalisme. Introduction à l'Analyse Sémio-pragmatique des

Discours Télévisuels, Bruxelles, INA / De Boeck Université, 2002.

JAUSS, H-R. – Pour une Esthétique de la Réception, Paris, Gallimard, 1978.

JOST, F. – « Narration (s) : en deçà et au-delà », in Communications n° 38, Paris, Seuil, 1983. – L'Œil Caméra. Entre le Film et le Roman, Lyon, Presses universitaires de Lyon, 1987. – Un Monde à Notre Image. Énonciation, Cinéma, Télévision, Méridiens Klincksieck,

1992. – « La feint du monde », in Réseaux n° 74-75, CNET, 1995. – « Propositions pour une typologie des documents audio-visuels », in Semiotica, n° 112

1/2,, 1996. – « La Promesse des Genres », in Réseaux n° 81, CNET, 1997. – « Des images et des hommes » in Recherches en Communication, n° 8, 1997. – « Quand y a-t-il énonciation télévisuelle? » in Penser la Télévision, Colloque de Cerisy-

la-Salle, Juin 1997, Paris, Nathan Université, 1998. – Introduction à l'Analyse de la Télévision, Paris, Ellipses, 1999. – La télévision du quotidien. Entre Réalité et Fiction, Paris, INA / De Boeck Université,

2001 (a). – « Typologie des jeux télévisés » in Gardies, A, et Taranger, M-C. (sous la direction de),

Télévision : Questions de Formes, Paris, L'Harmattan, 2001 (b).

JOST, F. ET LEBLANC, G. – La Télévision Française au Jour le Jour, Paris, INA-Anthropos, 1994.

JOST, F. ET BONNAFOUS, S. – « Analyse de discours, sémiologie et tournant communicationnel », in Réseaux, n°

100, CNET/Hermès Science Publications, 2000.

KERBRAT-ORECCHIONI, C. – La Connotation, Lyon, P.U.L., 1977.

KREMER, J-C. – Esthètique Musicale, Paris, L'Harmattan, 2000.

LAGNY, M., ROPARS, M-C. ET SORLIN, P. – « Analyse d’un ensemble extensible », in Aumont, J. et Leutrat, J-L. (Sous la direction

de), Théorie du Film, Paris, Albatros, 1980.

LAMIZET, B. – Histoire des Médias Audiovisuels, Paris, Ellipses, 1999.

LEFEBVRE, H. – La Présence et l'Absence. Contribution à la Théorie des Représentations, Casterman,

1980.

n i ! f i c t i on ! n i ! r é a l i t é !

230!

LE NY, J-F. ET GINESTE, M-D (SOUS LA DIRECTION DE). – La Psychologie, coll. Textes Essentiels, Paris, Larousse, 1995.

LITS, M. – « Le récit médiatique : un oximore programatique? », in Recherches en

Communication, n° 8, 1997.

LOCHARD, G, ET BOYER, H. – Notre écran quotidien, Paris, Dunod, 1995.

LOCHARD, G, ET SOULAGES, J-C. – La communication télévisuelle, Paris, Armand Colin, 1998.

MAINGUENEAU, D. – Analyser les Textes de Communication, Paris, Dunond, 1998.

MAGNY C-E. – L'Age du Roman Américain, Paris, Editions du Seuil, 1948.

MARION, PH. – « Narratologie médiatique et médiagénie des récits », in , Recherches en

Communication, n° 7, 1997. – « Les images racontent-elles? Variations conclusives sur la narrativité iconique », in

Recherches en Communication, n° 8, 1997.

METZ CH. – « Le cinéma : langue ou langage? », in Communications n° 4, Paris, Seuil, 1964. – Essais sur la Signification au Cinéma, tome 1, Paris, Klincksieck, 1968. – Essais sur la Signification au Cinéma, tome 2, Paris, Klincksieck, 1972. – Langage et Cinéma, Paris, Albatros, 1977. – L'Énonciation impersonnelle ou le site du film, Paris, Méridiens Klincksieck, 1991.

MEUNIER, J-P. – « Connaître par l'image », in Recherches en Communication, n° 10, 1998.

MEUNIER, J-P. ET PERAYA, D. – Introduction aux Théories de la Communication, Paris/Bruxelles, De Boeck Université,

1993.

MOUNIN, G. – Dictionnaire de la linguistique, Paris, Presses Universitaires de France, 1974.

NEL, N. – « Généricité, séquencialité, esthétique télévisuelles », in Réseaux n° 81, CNET, 1997. – « Les dispositif télévisuels », in Penser la Télévision, Colloque de Cerisy-la-Salle, Juin

1997, Paris, Nathan Université, 1998.

NINEY, F. – L'Épreuve du Réel à l'Écran. Essai sur le Principe de réalité Documentaire, De Boeck

Université, 2000.

ODIN, R. – « Pour une sémiopragmatique du cinéma », in Iris, n° 1, 1983. – « Du spectateur fictionnalisant au nouveau spectateur, approche sémio-

pragmatique », in Iris, n° 8, Paris, 1988. – Cinéma et Production de Sens, Paris, Colin, 1990 – « Sémiopragmatique du cinéma et de l'audiovisuel. Modes et institutions », in Mullern,

J-E., Towards a pragmatics of the audiovisual, Munster, Nodus Publikationen, 1994. – « Christian Metz et la Fiction », in Semiotica, n° 112 1/2,, 1996. – « La question du public. Approche sémio-pragmatique », in Réseaux, n° 99,

CNET/Hermès Science Publications, 2000 (a). – De la Fiction, Paris, De Boeck Université, 2000 (b).

PASQUIER, D. – « Chère Hélène, les usages sociaux de séries collège », in Réseaux, n° 70, CENET, 1995.

! b i b l i o g r aph i e !

231!

– « Lectures de personnages de série » in Penser la Télévision, Colloque de Cerisy-la-Salle, Juin 1997, Paris, Nathan Université, 1998.

– « Identification au héros et communautés de téléspectateurs : la réception d'"Hélène et les Garçons" », in Hermès, n° 22, 1998.

PERRON, B. – « La mémoire, c'est ce qu'il me reste à défaut d'une vue », in Cinémas, vol. 5, n° 1-2,

1994.

REBOUL, A. ET MOESCHLER, J. – La Pragmatique Aujourd'hui, Paris, Éditions du Seuil, 1998.

RECANATI, F. – La Transparence et la Énonciation, Paris, Éditions du Seuil, 1979.

RICŒUR, P. – « Pour une théorie du discours narratif », in Tiffeneau, D. (sous la direction de), La

Narrativité, Paris, Éditions du CNRS, 1980. – Temps et Récit, Paris, Éditions du Seuil, 1983.

RUMELHART, D. ET NORMAN, D. – « Les Shémas (1983) », in Le Ny, J-F. et Gineste, M-D. (sous la direction de), La

Psychologie, Larousse, 1995.

SARFATI, G.-E. – Éléments d'Analyse du Discours, Paris, Nathan Université, 1997.

SEARLE, J.R. – Les Actes de Langage. Essais de Philosophie du Langage, Paris, Hermann, 1972. – Sens et expression, Paris, Les Éditions de Minuit, 1982.

SHAEFFER, J-M. – « Du texte au genre », in Genette, G. et Todorov, T. (sous la direction de), Théorie des

Genres Paris, Éditions du Seuil, 1986. – L'Image Précaire, Paris, Éditions du Seuil, 1987. – Qu'est-ce qu'un Genre Littéraire?, Paris, Éditions du Seuil, 1989. – Pourquoi la Fiction?, Paris, Éditions du Seuil, 1999.

SCHANK, R. ET RIESBECK, CH. – Inside Case-Based Reasoning, New Jersey, Lawrence Erlbaum Associates, Publishers,

1989.

SILBERMANN, A. – Les Principes de la Sociologie de la Musique, Genève-Paris, Librarie Droz, 1968.

SOULAGES, J-C. – Les Mises en Scène Visuelles de l'Information, Paris, INA / Nathan, 1999

SOURIAU, E. – « La Structure de l'Univers Filmique et le Vocabulaire de la Filmologie », Revue

Internationale de filmologie, n° 7 - 8, 1951. – (sous la direction de) L'Univers Filmique, Flammarion, Paris, 1953.

SPERBER, D, ET WILSON, D. – La Pertinence. Communication et Cognition, Paris, Éditions de Minuit, 1989.

STEINBERG, O. – « Des genres populaires à la télévision : étude d'une transposition », in Réseaux n° 81,

CNET, 1997.

TODOROV, T. – Introduction à la Littérature Fantastique, Paris, Seuil, 1970.

VAN DIJK, T. A. – La Noticia como Discurso, Barcelona, Paidós, 1990.

n i ! f i c t i on ! n i ! r é a l i t é !

232!

VARELA, F. – Conocer, Barcelona, Gedisa, 1998.

VARELA, F., THOMSOM, E. ET ROSCH, E. – L'Inscription Corporelle de l'Esprit, Paris, Éditions du Seuil, 1993.

VERNET, M. – « Genre », in Lectures du Film, Paris, Albatros, 1977.

VERNIER, J-M. – « L'image-pulsation », Revue d'Esthétique n° 10, Paris, 1986.

VERON, E. – « Dictionnaire des idées non reçues », in Connexions. Psychosociologie, Sciences

Humaines, n° 27, Paris, EPI, 1979. – Construire l'Événement. Les Médias et l'Accident de Three Mile Island, Paris, Éditions

de Minuit, 1981. – « Il est là, je le vois, il me parle », in Communications n° 38, Paris, Éditions du Seuil,

1983. – La Sémiosis Sociale. Fragments d'une Théorie de la Discursivité, Saint-Denis, Presses

Universitaires de Vincennes, 1987.

WATZLAWICK, P. (SOUS LA DIRECTION DE) – L'Invention de la Réalité. Contributions au Constructivisme, Paris, Éditions du Seuil,

1988.