Le périple d’Edward Snowden : analyse quali-quantitative d’un événement médiatique...

32
Le périple d’Edward Snowden : analyse quali- quantitative d’un événement médiatique international Edward Snowden’s journey: quali-quantitative analysis of an international media event TIMOTHÉE GIRAUD 1 , MARTA SEVERO 2 Résumé - Face au déluge de données disponibles sur Internet, une des pistes les plus captivantes qui s’ouvre au chercheur en sciences sociales concerne l’identification et l’analyse des phénomènes sociaux à travers ce nouveau type de données. Parmi ces données, certaines se montrent particulièrement adaptées à l’identification des événements médiatiques internationaux et à l’étude de leur déroulement dans l’espace et dans le temps : nous proposons d’utiliser les flux RSS des journaux quotidiens. Dans cet article, nous présenterons une analyse de l’affaire Edward Snowden qui nous fournit un exemple optimal d’événement médiatique international. A travers la description de cette histoire, les médias ont dessiné différentes géographies autour du personnage en mentionnant les pays qui pouvaient lui offrir l’asile mais également les pays potentiellement touchés par la politique de surveillance des Etats-Unis. Nous conduirons une analyse de cet événement en proposant une méthode quali-quantitative basée sur l’analyse des flux RSS qui permet d’analyser l’événement tout en évitant la dichotomique quantité-fiabilité des données. Mots-clés - Événement, média, RSS, quali-quantitatif, analyse textuelle, Snowden Abstract - Facing the deluge of data available on the Internet, one of the most exciting research directions for the social scientist concerns the identification and analysis of social phenomena through this new data. Among these data, some are particularly suitable for the identification of international media events and the study of their diffusion in space and 1 Ingénieur d’étude à l’UMS RIATE - CNRS, Université Paris 7 - UFR GHSS Case 7001 75205 Paris cedex 13. E-mail : timothee.giraud@ums- riate.fr 2 Maître de Conférence à l’Université Lille 3. Équipe GERiiCO, E-mail : [email protected]

Transcript of Le périple d’Edward Snowden : analyse quali-quantitative d’un événement médiatique...

Le périple d’Edward Snowden : analyse quali-quantitative d’un événement médiatique

international Edward Snowden’s journey: quali-quantitative

analysis of an international media event

TIMOTHÉE GIRAUD1, MARTA SEVERO2

Résumé - Face au déluge de données disponibles sur Internet, une des pistes les plus captivantes qui s’ouvre au chercheur en sciences sociales concerne l’identification et l’analyse des phénomènes sociaux à travers ce nouveau type de données. Parmi ces données, certaines se montrent particulièrement adaptées à l’identification des événements médiatiques internationaux et à l’étude de leur déroulement dans l’espace et dans le temps : nous proposons d’utiliser les flux RSS des journaux quotidiens. Dans cet article, nous présenterons une analyse de l’affaire Edward Snowden qui nous fournit un exemple optimal d’événement médiatique international. A travers la description de cette histoire, les médias ont dessiné différentes géographies autour du personnage en mentionnant les pays qui pouvaient lui offrir l’asile mais également les pays potentiellement touchés par la politique de surveillance des Etats-Unis. Nous conduirons une analyse de cet événement en proposant une méthode quali-quantitative basée sur l’analyse des flux RSS qui permet d’analyser l’événement tout en évitant la dichotomique quantité-fiabilité des données.

Mots-clés - Événement, média, RSS, quali-quantitatif, analyse textuelle, Snowden

Abstract - Facing the deluge of data available on the Internet, one of the most exciting research directions for the social scientist concerns the identification and analysis of social phenomena through this new data. Among these data, some are particularly suitable for the identification of international media events and the study of their diffusion in space and

1 Ingénieur d’étude à l’UMS RIATE - CNRS, Université Paris 7 - UFR GHSS Case 7001 75205 Paris cedex 13. E-mail : [email protected] 2 Maître de Conférence à l’Université Lille 3. Équipe GERiiCO, E-mail : [email protected]

time. We propose to use RSS feeds of daily newspapers. In this paper, we present an analysis of Edward Snowden’s case that provides an optimal example of international media event. Through the description of this story, the media have drawn different geographies mentioning countries that could offer him asylum but also countries potentially affected by the American monitoring policy. We will carry out an analysis of the event by providing a quali-quantitative method based on the analysis of RSS feeds that is expected to solve the dichotomy data quantity-reliability.

Keyword - Event, media, RSS, quali-quantitative, textual analysis, Snowden INTRODUCTION Suite à une interview donnée au Guardian3, le 9 juin 2013 Edward Snowden sort de l’anonymat et devient une star internationale, symbole de la lutte pour le droit à la protection de la vie privée. Ex-technicien de la CIA, Snowden travaillait depuis quatre ans pour l’Agence américaine de Sécurité Nationale (NSA) en tant qu'employé de divers sous-traitants. Cet américain a attiré l’attention des médias du monde entier par ses révélations concernant la politique américaine de surveillance des communications. Ces révélations concernaient notamment deux programmes secrets de la NSA : l'un permettant de récolter (sans les écouter) depuis 2006 des données d'appels téléphoniques aux Etats-Unis via l'opérateur téléphonique Verizon ; l’autre, nommé PRISM, visant à intercepter les communications d'internautes étrangers se situant hors des Etats-Unis et utilisant les services de grandes entreprises américaines, dont AOL, Apple, Facebook, Google, Youtube, Microsoft, Skype, Paltank et Yahoo. La portée de ces fuites laisse entendre que la NSA peut surveiller les données numériques de l'ensemble des internautes à l'étranger, puisqu’ils ne sont pas protégés par la loi américaine (Boulanger, 2014). En sortant de l’anonymat et suite à ses révélations, Snowden se retrouve dans une situation délicate, les réactions des Etats-Unis posent directement la question des différents traités d’extradition existants dans les pays potentiellement visités par le lanceur d’alerte. Dans une interview au Washington Post,4 Snowden annonce qu'il « compte demander l'asile de tous 3http://www.theguardian.com/world/2013/jun/09/edward-snowden-nsa-whistleblower-surveillance (consulté le 21 octobre 2013). 4 « Edward Snowden comes forward as source of NSA leaks », Washington Post, 9 juin 2013, http://www.washingtonpost.com/politics/intelligence-

les pays qui croient en la liberté d'expression et défendent la vie privée ». Selon le New York Times, le 10 juin Snowden quitte son hôtel de Hong Kong. A partir de ce moment, les journalistes se lancent dans une série de prédictions sur ses déplacements potentiels et sur ses possibles demandes d’asile. De la Russie à l’Islande, de l’Equateur à la Bolivie, ces articles sont l’occasion aussi de réfléchir sur les politiques d’asile des différents pays. Le 24 juin on retrouve ses traces à Moscou. Sa présence en Russie et le refus de Poutine d’autoriser son extradition provoque d’importantes tensions entre les gouvernements américain et russe. L’Affaire Snowden arrive à un moment particulièrement critique le 3 juillet lorsque la France, le Portugal, l’Espagne et l’Italie interdisent leurs espaces aériens à l’avion d’Evo Morales suite à une rumeur faisant état de la présence de Snowden à son bord. Cette interdiction suscite une vague de protestation parmi les gouvernements sud-américains (Venezuela, Nicaragua et Bolivie) et une conséquente offre d’asile pour le fugitif. A travers la description de ces faits, les médias ont dessiné différentes géographies autour du personnage en mentionnant les pays qui pouvaient lui offrir l’asile mais également les pays potentiellement touchés par la politique de surveillance des Etats-Unis. Par ces deux dimensions cette histoire nous fournit un exemple optimal d’événement médiatique international. Dans cet article, nous conduirons une analyse de cet événement en proposant une méthode quali-quantitative basée sur l’analyse d’un nouveau type de données adapté à l’étude des événements médiatiques internationaux, les flux RSS des journaux quotidiens. Notre hypothèse est que ces données permettent de combiner une analyse quantitative du corpus global pour identifier les traits spatio-temporels des événements avec des analyses qualitatives ciblées pour vérifier la fiabilité des traces numériques détectées. 1. LA DETECTION DES EVENEMENTS MEDIATIQUES INTERNATIONAUX Face au déluge de données disponibles sur Internet, une des pistes les plus captivantes qui s’ouvre au chercheur en sciences sociales concerne l’identification et l’analyse des phénomènes sociaux à travers ce nouveau type de données (Rogers, 2013a ; Marres et Weltevrede, 2013). Parmi ces leaders-push-back-on-leakers-media/2013/06/09/fff80160-d122-11e2-a73e-826d299ff459_story.html?hpid=z1

données, certaines se montrent particulièrement adaptées à l’identification des événements médiatiques internationaux et à l’étude de leur déroulement dans l’espace et dans le temps. Une fois un événement identifié, il est possible d’en reconstruire le développement spatio-temporel à travers le suivi des traces numériques que les acteurs concernés ou intéressés aux faits laissent sur le Web (Steinberger et al, 2005). Ce type d’étude n’est pas nouveau. Dans les années soixante déjà, Galtung and Ruge (1965) ont travaillé sur un corpus de données médiatiques pour identifier les critères de sélection des événements internationaux par les médias (news values), d’autres ont entrepris des analyses similaires à leur suite (McCombs and Shaw, 1972; Dayan and Katz, 1992 ; Wolton, 2003 ; Koopmaas and Vliegenthart, 2011). On peut distinguer des études plus qualitatives qui se concentrent sur la description d’événements spécifiques et d’autres plus quantitatives qui cherchent à détecter des régularités générales pour l’identification d’événements. Ces deux types d’études sont en partie insatisfaisants. Les premières se basent habituellement sur une analyse manuelle de discours d’un corpus médiatique, généralement des articles de presse. Ces analyses sont très couteuses en temps et concernent, par conséquent, généralement des faits ponctuels et des échantillons de données bien ciblés dans l’espace et dans le temps (un pays, un événement et une période limitée). Les analyses quantitatives quant à elles s’appuient sur de gros corpus de données obtenus par l’accès à des bases payantes qui permettent d’analyser des phénomènes plus étendus du point de vue temporel et géographique (périodes plus longues, plusieurs médias). Cependant, les hypothèses émises par ces études peuvent difficilement être vérifiées à travers des exemples spécifiques. Les données sont traitées massivement à travers l’identification de mots-clés et ne permettent pas vraiment une analyse détaillée du discours. Ce dualisme entre qualitatif et quantitatif, qui s’est renforcé au cours des années, peut être expliqué par les caractéristiques des données disponibles pour ce type d’analyse. Le chercheur a deux possibilités : ou accéder aux archives d’un média spécifique (journal ou autre) et aux textes complets des articles ; ou, s’il veut travailler sur plusieurs médias et sur de gros corpus, accéder à des bases de données payantes comme Lexis-Nexis ou Factiva et s’appuyer sur les catégorisations et indexations des articles faites par ces bases. Avec l’émergence d’Internet, la recherche sur les événements médiatiques internationaux peut désormais profiter de nouveaux types de données qui pourraient remettre en question cette opposition entre qualitatif et quantitatif. Ces données, ont en effet le grand potentiel d’être disponibles

immédiatement, pendant le déroulement de l’événement et en grandes quantités. De plus, elles ont souvent une structure courte, simple et homogène qui s’adapte bien à une analyse massive pour identifier des tendances générales, et elles permettent de redescendre à un niveau détaillé puisque l’analyse s’appuie sur toute la donnée et non sur une indexation faite par un sujet tiers. Les données Twitter ont été jusqu’à maintenant privilégiées pour ce type d’étude (Popescu et al, 2011). Les émeutes et manifestations d’ampleur ou les catastrophes naturelles génèrent aujourd’hui des milliers de messages autour du monde. Facilement identifiables grâce à l’emploi des hashtag, les tweets permettent de suivre la diffusion d’un événement au niveau mondial (Panisson, 2011 ; Bruns et Liang, 2012). Si la quantité et l’accès facile à ce type de données ont enthousiasmé beaucoup de chercheurs qui se sont lancés dans des analyses quantitatives massives de ce flux ininterrompu d’informations, il faut également noter que de nombreuses études ont récemment modéré cet enthousiasme en mettant en évidence la façon dont Twitter peut facilement générer de fausses pistes (Rogers, 2013b). Quand on traite des traces numériques, il est important de rappeler la dichotomie inévitable entre quantité et fiabilité des données sur laquelle se base l’analyse des événements médiatiques internationaux. D’une part, ce type d’analyse nécessite de grandes masses de données facilement analysables et accessibles, qui permettent l’identification d’une fracture du flux normal de l’information qui peut être interprétée comme un événement (Arquembourg, 2006). Mais, d’autre part, ces données doivent être solides pour garantir la qualité et la crédibilité de l’information. Le problème est que pour avoir des « big data » on doit souvent s’appuyer sur des traces numériques, comme les tweets, qui peuvent garantir la quantité mais peuvent difficilement garantir la fiabilité du signal détecté (en proposant généralement un contenu pauvre et provenant de sources hétérogènes). C’est pour cela que la recherche sur les événements médiatiques internationaux a besoin d’identifier de nouvelles sources reconnues et homogènes qui puissent produire des traces fiables pour détecter les signaux de ces événements. 2. LES FLUX RSS : TRACES GEO-MEDIATIQUES DES EVENEMENTS INTERNATIONAUX Dans cet article nous présentons une source d’information originale et une

démarche quali-quantitative innovante qui permet d’identifier un événement médiatique international et ses modalités spatio-temporelles en évitant la dichotomique quantité-fiabilité des données. La source que nous proposons est le flux RSS émis par les journaux quotidiens. Le flux RSS est une liste d’actualités sélectionnées par un journal et offertes sous forme de syndication au lecteur. Généralement, chaque actualité (techniquement appelée « item ») est constituée par un titre, qui coïncide avec le titre de l’article, un résumé, qui peut être rédigé par le journaliste ou correspondre au début de l’article, et le lien hypertexte vers l’article du journal. En général, un item n’est constitué que de deux ou trois lignes de texte. Chaque journal peut proposer plusieurs flux RSS, généralement un par rubrique. Il est par ailleurs impossible, sans consulter directement le site web, de connaitre la position de chacun des articles sur le site (qu’ils soient en « Une » ou dans une sous-rubrique). Dans le cadre du projet ANR Géomédia5 (2013-2016), nous avons construit une archive de flux RSS diffusés par une centaine de titres de presse quotidienne d’actualité générale de différents pays du monde (en français et en anglais). Nous avons privilégié les flux de la rubrique internationale des journaux. Cette archive vise à rendre possible la comparaison de la représentation médiatique de l’actualité internationale en fonction des lieux d’émission et des événements mis en avant. Le passage par le flux RSS est un moyen de comparer la sélection de l’information effectuée par différents titres édités dans des conditions géopolitiques et des formats très différents d’un pays à l’autre (Grasland et al, 2011). Par rapport à d’autre types de données tels que les messages Twitter, ces flux RSS présentent trois avantages: ils sont disponibles en grandes quantités et proviennent de sources connues (et généralement considérées fiables dans le cas de la presse) ; ils proposent une information non seulement courte et facilement accessible, mais aussi bien construite grâce au travail éditorial des journalistes (Severo, 2013) ; et ils permettent de passer de cette information résumée à une information plus riche, l’article complet du journal. Ces caractéristiques des flux RSS sont d’autant plus importantes pour le chercheur en sciences sociales qu’elles permettent la mise en place d’une démarche quali-quantitative pour l’identification et l’analyse des événements médiatiques internationaux. En effet, ces données permettent de combiner une analyse quantitative du corpus global pour identifier les traits spatio-temporels des événements avec des analyses qualitatives ciblées pour vérifier la fiabilité des traces numériques détectées. 5 http://geomedia.hypotheses.org/

Dans cet article, nous présenterons cette méthode à travers l’analyse d’un cas médiatique récent qui se montre particulièrement adapté, l’histoire d’Edward Snowden. 3. ANALYSE QUALI-QUANTITATIVE DU CAS EDWARD SNOWDEN A partir de l’archive Géomédia, nous avons sélectionné quatre journaux : Le Monde, le South China Morning Post, le Washington Post et le New York Times6. Nous avons pris en compte une période de six semaines (du lundi 3 juin au dimanche 14 juillet 2013) ; bien que cette affaire soit toujours en cours nous avons considéré qu’une durée d’un mois et demi était suffisante et plus adaptée pour tester la méthodologie que nous allons proposer. Nous avons ensuite retenu les éléments qui mentionnaient « Snowden » envoyés dans le flux RSS de la rubrique internationale ou world du journal. Pendant cette période nous avons collecté 1655 items pour Le Monde (dont 46 mentionnant Snowden - 2.8%) ; 1182 items pour le New York Times (dont 49 mentionnant Snowden - 4.1%) ; 1284 items pour le South China Morning Post (dont 119 mentionnant Snowden - 9.3%) ; 489 items pour le Washington Post (dont 70 mentionnant Snowden - 14.3%). L’analyse quali-quantitative des flux RSS de cet échantillon de journaux nous permettra d’identifier les pays concernés, de tracer les relations entre ces pays et enfin de qualifier ces relations. Nous commencerons par une analyse quantitative des pics médiatiques, pour ensuite passer à l’analyse des citations et co-citations des noms de pays (pour trouver les relations les plus intéressantes) et enfin à l’analyse textuelle du corpus pour qualifier ces relations. Cela nous permettra de développer certaines hypothèses que l’on pourra vérifier à travers l’analyse manuelle du contenu d’un échantillon d’items identifiés grâce à l’analyse textuelle.

3.1. Couverture temporelle de l’événement A travers l’analyse de la distribution temporelle des articles (figure 1) nous voulions voir s’il était possible d’identifier de manière claire et rapide des pics médiatiques (Giraud et al, 2013 ; Severo et al, 2012) correspondant aux 6 Ces journaux offrent des flux RSS de bonne qualité, sans coupure sur la période, et ont une structure et une distribution temporelle similaire.

moments clés de l’histoire Snowden. La couverture médiatique débute pour tous les journaux le 9 juin, suite à l’interview donnée par Snowden la veille au Guardian7 et par laquelle il sort de l’anonymat. Quelques jours plus tôt, le journal anglais (et son journaliste Glenn Greenwald) et le Washington Post avaient publié le scoop révélant l'ampleur de la surveillance planétaire exercée par la NSA sans dévoiler l’identité de leur informateur. Dans les jours qui suivent plusieurs articles sont publiés8. L’attention se concentre alors sur deux sujets : d’abord, la question politique de la surveillance des communications ; puis les probables déplacements de Snowden et par conséquent les politiques d’asile de différents pays. Après cette première semaine, la couverture des différents journaux se différencie. Pour le Washington Post, on peut identifier trois pics (22-27 juin, 1-5 juillet, 9-13 juillet) entrecoupés de jours sans couverture médiatique. Dans le cas du New York Times et du Monde, on peut identifier deux pics, un vers le 24-26 juin (plus marqué pour le New York Times) et un en fin de période vers 12-13 juillet. Le cas du South China Morning Post est différent dans la mesure où le journal garantit une couverture continue de l’événement. Si le pic du 24-26 juin est également présent dans ce journal, la forte attention médiatique portée à l’affaire Snowden demeure les jours suivants. L’analyse quantitative de la distribution temporelle des articles dans ces quatre journaux ne nous permet d’identifier de manière claire qu’un seul pic, la période du 24-26 juin. C’est le moment où on retrouve les traces de Snowden en Russie et, par conséquent, apparait la controverse sur ses potentielles demandes d’asile. Il n’est en revanche pas possible d’identifier les autres moments clés de l’histoire, la transcription des événements par les quatre journaux n’étant pas du tout homogène dans le temps. La comparaison des lignes temporelles des journaux considérés montre que l’histoire est racontée de manière différente par chaque média et que leur analyse comparative peut donner des résultats intéressants.

7 http://www.theguardian.com/world/2013/jun/09/edward-snowden-nsa-whistleblower-surveillance (consulté le 21 octobre 2013) 8 Excepté sur le New York Time. On peut faire l’hypothèse que cette quantité plus réduite d’items ne correspond pas à une couverture moins importante mais au fait que ce journal a classé d’autres items concernant l’affaire dans le flux RSS « politique intérieure » plutôt que dans le flux « international ».

Figure 1. Couverture temporelle de l’événement

3.2. Les pays évoqués et leurs relations : le réseau spatial

Snowden Quand le 9 juin le Guardian publie son entretien, Snowden a déjà disparu

depuis quelques semaines : sa dernière trace remonte alors au 20 mai lorsqu’il embarque depuis Hawaï dans un vol pour Hong Kong. A partir de ce moment, les journaux décrivent à travers leurs articles tout un réseau de relations entre ce personnage et de nombreux pays du monde.

Figure 2. Citations et co-citations des pays dans le Monde et le New York

Times

L’analyse quantitative des citations des pays9 dans les articles du corpus

9 Pour identifier les pays nous avons pris en compte leurs noms mais aussi leurs adjectifs et gentilés, nous n’avons en revanche pas pris en compte le nom de leur capitale. Bien que Hong Kong ait été rétrocédée à la Chine en 1997 et vus ses systèmes économique, juridique et politique particuliers, il nous a apparu important de considérer la province comme une entité a part

nous permet de comparer les visions du monde liées à l’histoire d’Edward Snowden dans ces quatre journaux et de voir quels sont les pays les plus mentionnés par quel journal. Ensuite, l’analyse des co-citations des noms des pays dans les articles nous permet de reconstruire les relations entre pays telles qu’elles ont été relatées par les différents journaux. Dans les cartes des figures 2 et 3 les sommets sont les pays mentionnés et les arcs représentent les co-citations des noms des pays.

Figure 3. Citations et co-citations des pays dans le South China Morning

Post et le Washington Post Un premier facteur de différenciation des pays mis en avant par cette analyse concerne le nombre des pays mentionnés. Si le New York Times et entière dans nos analyses.

Le Monde mentionnent seulement 13 pays (il faut souligner que ces journaux ont dédié un nombre inferieur d’articles à l’affaire), le Washington Post mentionne 24 pays et le South China Morning Post en cite 27. En général, les pays les plus cités sont les Etats-Unis, la Russie, la Chine et Hong Kong, suivi par la Bolivie et l’Equateur. Cependant, même si les pays les plus mentionnés sont les mêmes pour chaque journal, les co-citations décrivent un système de relations différent dans chaque média. Le Monde pose au centre de son discours les relations Etats-Unis/Hong Kong et Etats-Unis/Chine, mais il mentionne également des pays européens (France, Espagne, Portugal…), et des pays sud américains (Bolivie, Equateur et Venezuela). C’est le seul journal dans lequel émerge clairement un lien France/Bolivie. Pour tous les autres journaux, la relation principale est Etats-Unis/Russie. La structure créée par les co-citations dans les items du New York Times est égocentrée sur les Etats-Unis. Les pays européens et sud américains sont assez peu cités (pas de citation de la Bolivie par exemple), tandis que d’autres ne sont présents que dans ce journal (le Brésil et l’Inde par exemple). La géographie des deux autres journaux est plus diversifiée. Le South China Morning Post élargie sa couverture géographique à plusieurs pays européens, asiatiques, africains et sud américains. Un réseau de connexions entre les Etats-Unis et plusieurs pays du centre et sud de l’Amérique apparait. Enfin, en ce qui concerne le Washington Post on retrouve également un réseau centré sur les Etats-Unis avec de nombreuses co-citations Etats-Unis/Russie et Etats-Unis/Hong Kong. Cette première analyse spatiale nous a permis de centrer notre attention sur un nombre plus réduit de pays (les Etats-Unis, la Russie, la Chine, Hong Kong, la Bolivie et l’Equateur) et de saisir des différences dans la couverture spatiale qui peuvent nous guider dans la suite de notre étude. Nous nous pencherons sur certaines connexions qui ont été privilégiées par les différents journaux : Etats-Unis/Russie, Etats-Unis/Hong Kong, Etats-Unis/Chine, Etats-Unis/Bolivie, Etats-Unis/Equateur, France/Bolivie, Hong Kong/Chine, Russie/Hong Kong. Ces résultats ne sont pas suffisants pour faire des hypothèses sur les différentes visions du monde, mais ils sont utiles pour identifier les pistes les plus intéressantes qui doivent être approfondies par une analyse du contenu des items.

3.3. Le type de relations Les analyses quantitatives précédentes donnent une idée des relations internationales tissées par les citations et les co-citations de pays dans les flux RSS des journaux. Pour préciser la nature de ces relations sans avoir à lire l’ensemble des items des flux RSS, nous avons utilisé une méthode d’analyse textuelle que nous pouvons qualifier de quali-quantitative. L’Analyse Factorielle des Correspondance (AFC) permet de structurer les mots en fonction de leur présence dans les items et les items en fonction de leur vocabulaire. La représentation des résultats sous forme de graphiques (les plans factoriels) permet de visualiser la proximité des mots, les oppositions, les tendances, impossibles à discerner directement dans un grand tableau lexical (Escofier et Pagès, 2008 ; Garnier et Guérin-Pace, 2010). Nous pourrons donc dans un premier temps identifier des groupes de mots en tentant de les qualifier thématiquement et dans un deuxième temps nous pourrons consulter un échantillon d’items liés à ces groupes de mots. L’AFC a donc ici une utilité double : structurer une information massive et permettre l’identification d’articles parangons ou particulièrement représentatifs. Pour l’analyse textuelle l’AFC se base sur les tableaux lexicaux complets des journaux, ces tableaux renseignent sur la présence des termes dans les items et ils sont structurés de la manière suivante : en ligne, les mots présents dans les items et en colonne les items (figure 4).

Figure 4. Extrait du tableau lexical du Monde

La construction de tels tableaux n’est qu’en partie automatisée. Une première étape totalement automatique (conduite avec le logiciel R) permet de construire une première version brute du tableau où tous les termes et tous les items sont présents. Les étapes suivantes visant à réduire le vocabulaire étudié s’appuient sur des dictionnaires et permettent d’une part

de distinguer les formes actives (qui ont du sens) des formes supplémentaires (du type « le », « la », « du », « je ») et d’autre part de lemmatiser le vocabulaire (rattacher les mots à leur racine). En fonction du contexte des analyses menées, les formes actives et la nécessité de lemmatiser le vocabulaire peuvent varier. Ainsi l’utilisation de dictionnaire est complétée par un nécessaire contrôle manuel du vocabulaire. Dans la figure 5, nous avons listé les 10 termes les plus récurrents dans chaque journal. L’analyse de ce tableau nous permet de souligner l’homogénéité du discours dans les quatre médias. Même avec quelques petites différences, les termes les plus présents dans le discours sont toujours « nsa », « usa », « asile », « américain » et « surveillance ».

Figure 5. Termes les plus fréquents

Pour garantir une certaine représentativité des termes analysés nous avons également appliqué des seuils d’occurrences : si un terme est présent dans moins de 3 (pour le Monde et le New York Times) ou 5 (pour le South China Morning Post et le Washington Post) items il n’a pas été pris en compte. Une fois les tableaux construits nous avons mené une première série d’AFC exploratoires qui nous a permis de détecter des items « suspects », c'est-à-dire des items dont la composition lexicale était tellement particulière qu’ils contribuaient à eux seuls à la création d’axes factoriels. Il s’agissait systématiquement d’items au contenu hétérogène mélangeant plusieurs informations internationales, parmi lesquelles des informations sur l’affaire Snowden. Nous avons donc supprimé ces items des analyses finales. Les plans factoriels (les deux premiers axes) des mots et des items des

quatre journaux sont présentés dans les figures 6, 7, 8 et 9. Les termes en gras sont ceux qui contribuent significativement à la création des axes factoriels. Les points rouges représentent les items RSS. Dans la suite de l’analyse l’interprétation de ces plans factoriels s’appuie sur l’observation des termes en gras et la lecture des items contribuant le plus à la formation des axes. Cette méthodologie a permis d’identifier un certain nombre de thématiques transversales à l’affaire Snowden et communes à plusieurs journaux. Chaque thématique nous permet de qualifier une ou plusieurs connexions entre pays que nous avons identifiées à travers l’analyse quantitative des co-citations. Dans les paragraphes suivants nous présenterons dans le détail les thématiques révélées par l’AFC dans chacun des journaux. Nous commencerons par étudier les termes mis en avant puis nous nous intéresserons aux items spécifiques qui nous permettrons de comprendre précisément les informations décrites par ces termes.

3.3.1. Le Monde

Figure 6. Plans factoriels des tableaux lexicaux entiers du Monde

65 termes composent le lexique des 44 items du flux RSS du Monde

International. Le premier plan factoriel de l’AFC menée sur le tableau lexical entier représente 16% de la variance (respectivement 9 et 7 % pour les deux premiers axes). Le premier axe est composé par des termes comme « Evo Morales », « espace », « aérien », « avion », « bolivien », « France » qui nous permettent de faire facilement l’hypothèse que cet axe oppose principalement les items traitant de l’incident impliquant l’avion présidentiel d’Evo Morales aux autres items. Dans cet axe on retrouve clairement la connexion Bolivie/France qui était un des éléments que l’on avait remarqué dans l’analyse spatiale des items de ce journal. Si l’on regarde dans le détail les items qui contribuent le plus à la génération de cet axe (les 5 premiers sont du côté positif de l’axe), cette hypothèse est clairement confirmée. La connexion France/Bolivie mise à jour par les co-citations peut être expliquée par les tensions entre les deux pays suite à la fermeture de l’espace aérien de la France à l’avion bolivien. Date Titre Description Positi

on sur l’axe

3 juillet 16h29

La vie d'un président a été mise en danger dénonce la Bolivie

L'avion du président bolivien, Evo Morales, de retour de Moscou et qui avait été détourné vers l'Autriche parce que soupçonné de transporter le fugitif Snowden est reparti vers La Paz. L'interception de l'avion présidentiel a suscité l'ire des autorités boliviennes.

+

3 juillet 7h59

Une rumeur sur Snowden provoque une crise diplomatique entre Paris et La Paz

En cause, selon les autorités boliviennes : la décision de la France et du Portugal de fermer leur espace aérien à l'appareil du président Morales, de crainte que l'Américain en fuite ne se trouve à bord.

+

5 juillet 10h02

Snowden : les menaces diplomatiques de la gauche sud-américaine

Plusieurs chefs d'Etat réclament des excuses publiques pour l'escale forcée de leur homologue bolivien après la fermeture des espaces aériens de plusieurs pays européens.

+

9 juillet 14h02

Affaire Snowden : les Boliviens manifestent contre la France et les Etats-Unis

Il est notamment reproché à la France d'avoir refusé le survol de son espace aérien par l'avion du président Evo Morales, soupçonné alors d'avoir à son bord Edward Snowden.

+

13 juillet 0h06

Affaire Snowden : le Mercosur engage un bras de

Les pays membres vont rappeler pour consultation leurs ambassadeurs, notamment en France, après le refus d'autoriser le président

+

fer diplomatique bolivien, Evo Morales, à entrer dans leur espace aérien.

Table 1. Les 5 items contribuant le plus au premier axe du plan factoriel du Monde

Ensuite, on peut faire l’hypothèse que le deuxième axe oppose l’histoire personnelle d’Edward Snowden à ses déclarations sur la politique de surveillance : avec d’un côté les items portant sur les révélations et leur contenu (« secret », « source », « surveillance », « Guardian », « fuite », « USA »…), et de l’autre coté les items traitant la question de l’asile (« asile », « demander », « rechercher », « Equateur »…). La thématique des révélations, dans la narration du Monde, ne contribue pas particulièrement à décrire des connexions géographiques, mais reste complètement centrée sur le cadre américain. Au contraire, la question de l’asile désigne sur le plan factoriel un réseau complexe entre des pays comme les Etats-Unis, la Russie et l’Equateur. Ces hypothèses sont bien confirmées par la lecture des items contribuant le plus à la création de l’axe. Date Titre Description Positi

on sur l’axe

11 juin 7h21

Assange s'inquiète de la situation de Snowden

Le cofondateur de WikiLeaks a qualifié de héros l'Américain à l'origine des fuites sur le programme secret américain de surveillance électronique, et indiqué qu'il avait été en contact indirect avec son entourage.

+

11 juin 11h19

Surveillance : le journaliste du Guardian promet de nouvelles révélations

Glenn Greenwald a promis la publication prochaine de nouvelles informations significatives, sur la base des documents fournis par Edward Snowden.

+

24 juin 9h04

L'Equateur examine la demande d'asile d'Edward Snowden

Recherché par les Etats-Unis, l'ex-collaborateur de la NSA est arrivé dimanche à Moscou en provenance de Hongkong.

-

26 juin 19h39

Affaire Snowden : Rafael Correa se défend d'appliquer une morale à deux

Le président d'Equateur, Rafael Correa, a dénoncé un éditorial du Washington Post critiquant l'éventuel octroi par Quito de l'asile politique à Edward Snowden, recherché par les Etats-Unis pour espionnage.

-

vitesses 12 juillet 13h21

Edward Snowden demande un asile politique temporaire à la Russie

Les autorités russes ont réaffirmé que l'ex-consultant de la NSA, dans l'impossibilité de voyager pour des raisons de procédure, pouvait rester en Russie à condition de cesser de faire du tort aux Etats-Unis.

-

Table 2. Les 5 items contribuant le plus au deuxième axe du plan factoriel du Monde

3.3.2. The New York Times

Figure 7. Plans factoriels des tableaux lexicaux entiers du New York Times

37 termes composent le lexique des 43 items du flux RSS du New York Times World. Le premier plan factoriel de l’AFC menée sur le tableau lexical entier représente 18% de la variance (respectivement 9.7 et 8.3 % pour les deux premiers axes). Le premier axe est constitué par des termes comme « publish », « surveillance », « leak », « classify » qui évoquent les révélations et les contenus des révélations de Snowden. Dans le New York Times également cette thématique reste nationale, complètement centrée sur les Etats-Unis. Les termes contribuant à l’axe représentent efficacement les items correspondants (les 5 premiers sont tous à droite de l’axe) :

Date Titre Description Positio

n sur l’axe

9 juillet 6h20

The Lede: Der Spiegel Publishes Portion of Snowden Vetting Interview

When asked by the German magazine Der Spiegel what happens after a computer user becomes the focus of N.S.A. surveillance, Edward J. Snowden said, They're just owned.

+

26 juin 21h28

Under Snowden Screen Name, 2009 Post Berates Leaks

The Web site Ars Technica published logs of online chats in which Edward J. Snowden was believed to have participated, telling a friend that leakers should be shot.

+

22 juin, 2h01

Ex-Contractor Is Charged in Leaks on N.S.A. Surveillance.

Edward J. Snowden, whose release of classified files has sparked a debate over the proper limits of government monitoring, was charged with violating the Espionage Act and theft of government property

+

10 juin, 9h08

The Lede: N.S.A. Whistle-Blower Revealed in Video.

Edward Snowden, who worked until several weeks ago as a private contractor at a National Security Agency facility in Hawaii, explained in a video interview why he had leaked classified information about the scope of America’s surveillance efforts.

+

17 juin, 4h15

New Leak Indicates U.S. and Britain Eavesdropped at '09 World Conferences.

A new set of classified documents disclosed on Sunday suggested that Edward J. Snowden obtained a wider range of materials about government surveillance than had been known.

+

Table 3. Les 5 items contribuant le plus au premier axe du plan factoriel du New York Times

Le deuxième axe concerne les items portant sur la situation personnelle de Snowden en opposant notamment les propositions d’asile politique en Amérique du Sud et surtout en Equateur (« président », « Ecuador », « grant », « asylum »..), aux items traitant plus particulièrement de sa situation à Hong Kong, lorsque qu’il fait ses révélations (« Hong Kong », « légal », « wikileaks », « chinese »). Dans cet axe on retrouve les connexions géographiques que l’on avait identifiées à travers l’analyse spatiale et notamment, la présence de l’Equateur, dans le premier groupe de termes, et Hong Kong/Chine dans le deuxième groupe. Dans cette AFC, il

est intéressant de noter que Russie et USA restent au centre et ne sont pas attirés par un axe en particulier. Cela est dû à leur omniprésence dans les items : ces termes ne sont pas discriminants. A travers l’analyse du contenu des items qui ont contribué le plus à la création de l’axe on arrive facilement à expliquer ces citations géographiques : Date Titre Description Position

sur l’axe

30 juin 20h01

Snowden Revelations Will Continue, Assange Says

Julian Assange, the founder of WikiLeaks, said more secrets from the documents that Edward J. Snowden smuggled from the United States would be published.

+

27 juin, 12h56

Plane Leaves Moscow for Havana Without Snowden

A flight from Moscow to Havana took off on Thursday with no sign of Edward J. Snowden, raising the possibility that his legal limbo in a Moscow airport could continue for weeks.

+

20 juin, 2h16

WikiLeaks Says It Is Working to Negotiate Asylum in Iceland for Snowden

Julian Assange, the founder of WikiLeaks, said the legal and practical obstacles are under review by Edward J. Snowden's lawyers and supporters.

+

24 juin, 3h30

China Said to Have Made Call to Let Leaker Depart

Analysts said the Chinese government allowed Edward J. Snowden to leave Hong Kong to prevent a long legal battle with the United States and to maintain diplomatic ties.

+

24 juin, 4h03

Offering Snowden Aid, WikiLeaks Gets Back in the Game

WikiLeaks assisted Edward J. Snowden in his escape from Hong Kong and is providing legal assistance, placing the organization back in the global spotlight.

+

Table 4. Les 5 items contribuant le plus au deuxième axe du plan factoriel du New York Times

Nous avons fait le choix de ne montrer que 5 items pour chaque axe, les items évoquant l’Equateur et Rafael Correa arrivent un peu plus tard dans les contributions aux axes et ils sont présents sur la gauche du deuxième axe.

3.3.3. South China Morning Post

Figure 8. Plans factoriels des tableaux lexicaux entiers du South China

Morning Post 122 termes composent le lexique des 116 items du flux RSS du South China Morning Post. Le premier plan factoriel de l’AFC menée sur le tableau lexical entier représente 9.5% de la variance (respectivement 5.3 et 4.2% pour les deux premiers axes). Le premier axe de cette AFC oppose principalement les items liés aux révélations et aux contenus des révélations (« guardian », « internet », « attack », « disclosure », « secret »…) aux autres items et surtout ceux évoquant la vie personnelle de Snowden (les questions de l’incident Morales et de l’asile). Cette fois encore cette thématique est centrée sur les Etats-Unis. Dans les items on retrouve des contenus qui confirment cette hypothèse, mais il faut également noter que trois des items contribuant le plus à la création de l’axe (et que l’on retrouve principalement dans le deuxième axe) évoquent plutôt l’incident d’Evo Morales. Cela montre la centralité de cette thématique dans la narration du South China Morning Post. Date Titre Description Positio

n sur l’axe

11 juin, 2h54

NSA leak prompts questions over US reliance

The US government may have to reconsider how much it relies on outside defence contractors who are given top security clearances after an NSA contractor exposed top-secret phone and internet

-

on contractors

surveillance programmes. Edward Snowden, a 29-year-old systems technician at Booz Allen Hamilton, admitted on Sunday that he divulged details of the National Security Agency's programmes to The Guardian and Washington Post. Booz shares fell 2.6 per cent on Monday, and peers such as SAIC and General Dynamics fell as much as 1.7 per cent.

17 juin, 17h39

No chance of fair trial in US, but truth cannot be stopped, says Snowden

Whistle-blower Edward Snowden on Monday accused the US government of destroying any possibility of a fair trial as he took questions in a live webchat organised by the Guardian newspaper. It was only the second time Snowden had spoken since revealing himself as the man behind a series of leaks on US cybersurveillance and hacking operations. He accused the US government of openly declaring me guilty of treason and saying that the disclosure of secret, criminal, and even unconstitutional acts is an unforgivable crime.

-

3 juillet, 1h45

Rumours Edward Snowden on Bolivian president's diverted flight denied

Bolivia's foreign minister on Tuesday denied that fugitive US intelligence leaker Edward Snowden was travelling with President Evo Morales in his plane, which made an unscheduled landing in Austria. The minister, David Choquehuanca, told reporters France and Portugal had closed their airspace to the presidential plane over the huge lie that Snowden was on board. Morales had been on a visit to Moscow, where Snowden who is facing espionage charges in the United States has been holed up in an airport transit area for more than a week.

+

4 juillet, 12h39

Russia condemns France, Spain and Portugal for blocking Morales' flight

Russia on Thursday condemned France, Spain and Portugal for blocking the flight from Moscow to La Paz of Bolivian President Evo Morales, over suspicions that US intelligence leaker Edward Snowden was on board. The action of the French, Spanish and Portuguese authorities can hardly be viewed as a friendly step toward Bolivia or Russia, the Russian foreign ministry said in a statement. The plane carrying Morales was forced to land in Vienna after several European nations denied it overfly rights.

+

5 juillet, 9h18

Bolivia's Morales threatens to close US embassy

Bolivia's president threatened on Thursday to close the US embassy as leftist Latin American leaders joined him in blasting Europe and the United States after his plane was rerouted amid suspicions US fugitive Edward Snowden was aboard. President Evo Morales, who has suggested the United States pressured European nations to deny him their airspace, warned he would study, if necessary,

+

closing the US embassy in Bolivia.� Table 5. Les 5 items contribuant le plus au premier axe du plan du South

China Morning Post Le deuxième axe oppose les items et termes évoquant plus spécifiquement l’incident lié à l’avion présidentiel bolivien (« Bolivia », « Evo morales », « airspace », « european », « america », « latin » ) aux items et termes traitant de la situation personnelle d’asile de Snowden et plus particulièrement de sa rétention dans l’aéroport de Moscou et de son départ potentielle vers l’Amérique Latine (« Russian », « Venezuela », « Nicaragua », « asylum », « request », « zone », « area », « airport », « refuge »). On peut noter de nombreuses citations d’entité supranationale dans les items du journal (« Europe », « European Countries », « Latin America », « South America »…). Date Titre Description Position

sur l’axe

3 juillet, 0h18

Bolivian minister: President Morales' plane rerouted to Austria on suspicion Snowden on board.

LA PAZ, Bolivia (AP) Bolivian minister: President Morales' plane rerouted to Austria on suspicion Snowden on board.

+

4 juillet, 8h11

Bolivia's Morales arrives home after delay due to Snowden affair

Bolivian President Evo Morales called the rerouting of his plane over suspicions that National Security Agency leaker Edward Snowden was aboard a provocation to Latin America and urged European countries to free themselves from the United States. His presidential plane arrived home in Bolivia's capital late on Wednesday night following an unplanned 14-hour layover in Vienna. His government said France, Spain and Portugal all refused to let it through their airspace, forcing it to land in Austria. He had been flying home from a summit in Russia.

+

4 juillet, 18h

Morales gets hero's welcome after US forced plane down in

Bolivian President Evo Morales arrived home to a hero's welcome, saying some European countries' refusal to let his plane enter their airspace because of suspicion it carried fugitive US spy agency contractor Edward Snowden was a provocation aimed at all of

+

Snowden hunt

South America.

5 juillet, 9h18

Bolivia's Morales threatens to close US embassy

Bolivia's president threatened on Thursday to close the US embassy as leftist Latin American leaders joined him in blasting Europe and the United States after his plane was rerouted amid suspicions US fugitive Edward Snowden was aboard. President Evo Morales, who has suggested the United States pressured European nations to deny him their airspace, warned he would study, if necessary, closing the US embassy in Bolivia.�

+

10 juillet, 17h20

Edward Snowden may be one step closer to Venezuela

Edward Snowden was supposedly one step closer to taking refuge in Venezuela on Wednesday and ending his state of limbo in Moscow's Sheremetyevo airport, but hours later confusion reined. It all started with senior Russian politician Aleksey Pushkov saying that Edward Snowden had reportedly accepted an offer of asylum from Venezuela.

-

Table 6. . Les 5 items contribuant le plus au deuxième axe du plan factoriel du South China Morning Post

3.3.4. The Washington Post

Figure 9. Plans factoriels des tableaux lexicaux entiers du Washington Post

81 termes composent le lexique des 68 items du flux RSS du Washington Post. Le premier plan factoriel de l’AFC menée sur le tableau lexical entier représente 14.3% de la variance (respectivement 7.9 et 6.4% pour les deux premiers axes). Dans ce journal aussi, le premier axe oppose principalement les items liés aux révélations et aux contenus des révélations (« leak », « china », « hong kong », « surveillance », « secret », « program ») aux autres items, notamment aux items évoquent l’incident Morales (qui contribuent aussi au deuxième axe). Dans ce journal cependant, la thématique est présentée avec un point de vue international en abordant la question du lieu d’où les révélations ont été faites. Date Titre Description Position

sur l’axe

10 juin, 15h28

Hong Kong hotel says Edward Snowden was there, but checked out Monday

HONG KONG Out of all the places Edward Snowden could have chosen to hide, he selected this city, with its towering buildings, glittering nightscape and reputation for protecting free speech. But some in Hong Kong aren't sure what the man who has admitted leaking information about a top-secret U.S. surveillance program is doing here.

+

10 juin, 20h10

‘This is the definition of heroism’: Snowden lauded in China

Edward Snowden, who outed himself as the source of leaks of top-secret information about U.S. surveillance programs, is being lauded as a hero on Chinese social media, the Wall Street Journal's Josh Chin reports. China's noisy online communities, often a source of criticism against Beijing, seem to be welcoming Snowden, who has been staying in Hong Kong, as a fellow-traveler against government over-reach.

+

13 juin, 15h14

Snowden's U.S. hacking claim captures Chinese attention

HONG KONG For days the reaction in mainland China to the presence in this city of Edward Snowden, who has confessed to leaking information about secret U.S. surveillance programs, was almost total indifference. Now, with his claim that the U.S. government has been hacking Chinese institutions for years, he has the country's attention.

+

3 juillet, 17h12

Bolivian president's plane forced to land in Austria in hunt for Snowden

MOSCOW Bolivian President Evo Morales's plane, forced to land in Austria because of suspicions that American fugitive Edward Snowden was on board, was permitted to fly home Wednesday, Bolivian and European authorities said.

+

9 juillet, 21h38

Snowden's five dubious options for getting to Venezuela

Should NSA leaker Edward Snowden decide to accept Venezuela's offer of asylum, the tricky thing will be figuring how to get there from Moscow's Sheremetyevo Airport. His big problem is that after the strange saga of Bolivian President Evo Morales's flight over Europe, which included an unexpected stopover in Austria where the presidential plane may have been searched, Snowden might want to avoid flying over any countries friendly to the United States.

-

Table 7. Les 5 items contribuant le plus au premier axe du plan du Washington Post

Comme pour le South China Morning Post, le deuxième axe oppose les items et termes évoquant l’incident lié à l’avion présidentiel bolivien (« Morales », « bolivian », « flight »..) aux items et termes traitant de la situation personnelle de Snowden et plus particulièrement de sa rétention dans l’aéroport de Moscou (« russia », « transit », « airport », « activist », « human right »). Dans ce journal, la question de la demande d’asile est centrée principalement sur la Russie. Date Titre Description Position

sur l’axe

3 Juillet, 17h12

Bolivian president's plane forced to land in Austria in hunt for Snowden

MOSCOW Bolivian President Evo Morales's plane, forced to land in Austria because of suspicions that American fugitive Edward Snowden was on board, was permitted to fly home Wednesday, Bolivian and European authorities said.

+

3 juillet, 20h

Evo Morales's controversial flight over Europe, minute by heavily disputed minute

The story of Bolivian Air Force flight FAB-001 is, to put it mildly, in dispute. What we do know is that the plane took off from Moscow late on Tuesday, carrying Bolivian President Evo Morales, who had expressed his support for NSA leaker Edward Snowden. Then, as the plane flew over central Austria, it took a sudden and unexpected 180-degree turn, landing in nearby Vienna. After some time, it left Vienna to resume its journey home to Bolivia. It flew over Italy, France, Spain and Portugal, stopping over in the Canary Islands, where it refueled around noon EST on Wednesday.

+

12 Snowden MOSCOW E-mailed invitations to an afternoon -

juillet, 9h51

wants meeting with human rights activists, lawyers

meeting with fugitive Edward Snowden at Moscow's Sheremetyevo Airport were received Friday morning by human rights activists and lawyers here. The invitation, with his name on it, says he wants to discuss his future status. Several of those invited said they believe he may have decided to seek asylum in Russia.

12 juillet, 17h01

Russia's human rights commissioner: Snowden considers himself a patriot

Vladimir Lukin, a Russian liberal activist serving in the government as human rights commissioner, says that NSA leaker Edward Snowden considers himself an American patriot, according to Moscow-based journalist Olaf Koens. Lukin was one of several attendees at Snowden's meeting Friday at a Moscow airport, where he announced that he will seek asylum in Russia.

-

13 juillet, 12h17

The White House is turning up the pressure on Moscow over Snowden. Will it make any difference?

Within a few hours of Edward Snowden's media-heavy event at the transit zone of Moscow's Sheremetyevo Airport, where he announced he would seek asylum in Russia, the Obama administration appeared to shift strategies. Their public comments toward Moscow seemed to harden from mildly irritated impatience to outraged insistence. That rhetorical stick came with one big carrot: a scheduled phone call between President Obama and Russian President Vladimir Putin. The shift seems to indicate a growing desire to guide Russia's calculus on Snowden although exactly what U.S. officials hope to get, and their odds of getting it, remains unclear.

-

Table 8. Les 5 items contribuant le plus au deuxième axe du plan factoriel du Washington Post

CONCLUSION Cette étude partait de la nécessité de trouver une méthodologie plus efficace que celles employées jusqu’à maintenant pour l’analyse des événements médiatiques internationaux. Le problème qui se pose souvent dans ce type de recherche est l’absence d’une démarche quali-quantitative qui s’appuie sur de grandes quantités de données, mais qui puisse garantir également la qualité du résultat du traitement quantitatif à travers l’emploi de sources fiables et la possibilité de tester les hypothèses par une analyse de détail de la donnée. Dans cet article, nous avons proposé une solution basée sur l’emploi d’un nouveau type de données, les flux RSS des journaux

quotidiens, qui devrait résoudre cette opposition entre qualitatif et quantitatif. Nous avons étudié l’affaire Edward Snowden à travers l’analyse des flux RSS de quatre journaux. Nous avons articulé l’analyse en deux étapes : en premier lieu, à travers une analyse quantitative des citations et des co-co-citations des noms de pays, nous avons identifié les pays concernés par cette histoire et nous avons tracé les connexions entre ces pays telles qu’elles étaient décrites par les différents journaux. Nous ne pouvions alors faire aucune hypothèse sur les événements qui sous-tendent ces relations géographiques. C’est pour cela que nous avons utilisé l’analyse textuelle des items pour identifier le discours de chaque journal. Cela a nous permis de développer des hypothèses sur certaines des relations que nous avions précédemment identifiées et, surtout, cela nous a permis, en retournant au détail de la donnée, d’identifier un nombre restreint d’items qui pouvaient nous aider à valider nos hypothèses. Grace à la lecture de ces items nous avons vérifié nos interprétations de l’analyse textuelle et, par conséquent, nous avons identifié de manière plus fiable les relations internationales les plus importantes générées par l’affaire Snowden. Nous avons retrouvé notamment : la relation entre les Etats-Unis et la Russie, représentative de la crise diplomatique liée au passage de Snowden de l’aéroport de Moscou et le conséquent refus de Poutine de l’extrader vers les Etats-Unis ; la relation entre la Bolivie et les pays européens (notamment la France), représentative des tensions provoquées par l’incident de l’avion d’Evo Morales ; et toute les relations liées aux éventuelles demandes d’asile de Snowden (Equateur, Nicaragua, Venezuela, Hong Kong, Chine..). Par ailleurs, cette histoire n’a pas dessiné de relations internationales entre les Etats-Unis et les pays concernés par les révélations (les pays espionnés ou coopérant avec la NSA), cette thématique reste exclusivement une question nationale américaine (pendant la période analysée). Ce cas d’étude nous permet d’avancer sur deux aspects clés de la recherche sur les événements médiatiques internationaux : la donnée et la méthode. En ce qui concerne la donnée, les résultats de notre étude sont très encourageants sur l’intérêt des flux RSS pour ce type de recherche et sur leur potentialité pour surmonter l’opposition entre quantité et fiabilité des données. En ce qui concerne la méthode, la démarche que nous proposons ici se montre véritablement quali-quantitive en combinant les avantages des deux techniques : la représentativité des résultats garantie par le traitement de grandes quantités de données ; et la fiabilité des résultats garantie par la validation des hypothèses à travers l’analyse manuelle de sources connues.

Evidemment, il faut également mitiger les enthousiasmes. L’analyse de l’affaire Snowden a montré qu’il n’a pas été possible d’approfondir toutes les relations géographiques et d’aller dans le détail de tous les aspects de l’histoire. Cela ne serait possible qu’à travers une méthodologie qualitative classique qui n’aurait pas été envisageable avec la quantité des données que nous avons considérées dans cette étude10. Par ailleurs, les méthodes que nous avons employées pourront être développées plus en profondeur dans de futurs travaux. Dans cette analyse, nous avons travaillé sur une courte période parce que cela nous garantissait d’avoir un corpus simple et de présenter la méthodologie quali-quantitative de manière plus claire, mais la démarche que l’on vient de décrire peut facilement s’adapter à des corpus plus étendus. On peut faire l’hypothèse qu’une analyse sur une plus longue période et, par conséquent avec plus de données, puisse ouvrir d’autres pistes de recherche que nous n’avons pas pu explorer dans cet article. La question de la dimension temporelle du corpus, que nous avons seulement survolée ici, pourrait être intégrée aux analyses présentées (cartographie animée, prise en compte du temps dans les AFC). De plus, dans une étude précédente concernant la révolte de Wukan (Severo et al, 2012), nous avions pu expérimenter, à partir de données sur une plus longue période et adaptées à l’étude des aspects temporels, des méthodes permettant d’identifier des pics médiatiques. Un autre aspect intéressant qui pourrait être approfondi avec un échantillon plus grand est surement celui de l’analyse factorielle de correspondances. Nous nous sommes ici limité à l’analyse des deux premiers axes factoriels, mais dans le cas d’une information plus riche (le flux d’événements fournis par l’affaire Snowden n’est pas tari…) l’étude des axes suivants permettrait sans doute de faire apparaitre toutes les thématiques soulevées. En conclusion, nous pensons que ce type de méthodes quali-quantitatives offre une palette de possibilités adaptées à la recherche en sciences humaines et sociales au-delà de l’étude des événements médiatiques internationaux et nous espérons que les pistes proposées dans cet article pourront être suivies dans d’autres contextes. BIBLIOGRAPHIE 10 Une autre piste intéressant à parcourir pour approfondir ce cas d’étude serait surement l’analyse d’autres types de traces numériques, par exemple de données du dark web. Dans les limites de cet article, on a préféré les exclure parce qu’elles ne répondent pas à notre besoin de fiabilité de données.

ARQUEMBOURG, J. (2006), De l’événement international à l’événement global : émergence et manifestation d’une sensibilité internationale, Hermès, (46), 13–21, <http://documents.irevues.inist.fr/handle/2042/23702>. BOULANGER, P., (2014), De l’impact de l’affaire Snowden sur la surveillance numérique en France : une harmonisation en cours du cadre juridique, la Revue européenne des médias, 29, <http://la-rem.eu/2014/06/04/de-limpact-de-laffaire-snowden-sur-la-surveillance-numerique-en-france-une-harmonisation-en-cours-du-cadre-juridique/>. BRUNS, A., LIANG, Y.E. (2012), Tools and methods for capturing Twitter data during natural disasters, First Monday, 17(4), <http://firstmonday.org/ojs/index.php/fm/article/view/3937/3193>. CASTILLO, C., MENDOZA, M., POBLETE, B. (2011), Information credibility on twitter, Proceeding WWW '11 Proceedings of the 20th international conference on World wide web, p 675-684. DAYAN, D., KATZ, E. (1992), Media Events: The Live Broadcasting of History, Cambridge, Harvard University Press. EARL, J., MARTIN, A., MCCARTHY, J. D., ET SOULE, S. A. (2004), The Use of Newspaper Data in the Study of Collective Action, Annual Review of Sociology, vol. 30, n. 1, 65-80. ESCOFIER, B., PAGES, J. (2008), Analyse factorielles simples et multiples : Objectifs, méthode et interprétation. Paris, 4e Edition. Dunot. GALTUNG, J., RUGE, H.M. (1965), The structure of foreign news, Journal of Peace Research, Vol. 2, n. 1, 64-91. GARNIER, B., GUERIN-PACE, F. (2010), Appliquer les méthodes de la statistique textuelle, Collection du CEPED « les Clefs pour ». GIRAUD, T., GRASLAND, C., LAMARCHE-PERRIN, R., DEMAZEAU Y., VICENT, J-M. (2013), Identification of international media events by spatial and temporal aggregation of newspapers rss flows, Procceding ECTQG 2013, Paris.

GRASLAND C., GIRAUD T., SEVERO M. (2012), Un capteur géomédiatique d'événements internationau, in : BECKOUCHE, P., GRASLAND, C., GUÉRIN-PACE, F., (dir.), Fonder les Sciences du Territoire, Paris, Karthala. KOOPMANS, R., VLIEGENTHART, R. (2011), Media Attention as the Outcome of a Diffusion Process — A Theoretical Framework and Cross-National Evidence on Earthquake Coverag, European Sociological Review, Vol. 27, n. 5, 636-653. MARRES, N., WELTEVREDE, E. (2013), Scraping the Social. Issues in real-time social research, Journal of Cultural Economy, 1-52. MCCOMBS, M.E., SHAW, D.L. (1972), The Agenda-Seting Function of Mass Media, The Public Opinion Qarterly, Vol. 36, n. 2, 176-187. PANISSON, A. (2011), The Egyptian revolution on Twitter, Gephi blog, n° 15, <http://gephi.org/2011/the-egyptian-revolution-on- Twitter/>. POPESCU, A.-M., PENNACCHIOTTI, M., PARANJPE D. (2011), Extracting events and event descriptions from Twitter, Proceeding WWW '11 Proceedings of the 20th international conference companion on World wide web, 105-106. ROGERS, R., (2013a), Digital Methods, MIT Press. ROGERS, R. (2013b), Debanalizing Twitter: The Transformation of an Object of Study, Proceedings of ACM Web Science 2013, Paris, May. SAYYADI, H., HURST, M., MAYKOV, A. (2009), Event Detection and Tracking in Social Streams », Proceedings of ICWSM. SEVERO, M. (2013), L’information quotidienne face au Web 2.0. La stratégie multiplateforme de six quotidiens nationaux français, Etudes de communication, n. 41. SEVERO, M., GIRAUD, T., DOUAY, N. (2012), The Wukan’s protests: just-in-time identification of international media events, Proceeding of

Workshop Just-in-Time Sociology, SocInfo international conference, 4-6 décembre, Lausanne, Suisse, <http://jitso.org/2012/12/02/the-wukans-protests-just-in-time-identification-of-international-media-events-revised/> STEINBERGER, R., POULIQUEN, B. ET IGNATET, C. (2005), NewsExplorer : multilingual news analysis with cross-lingual linking, Proceedings of the 27th International Conference Information Technology Interfaces. WOLTON, D. (2003), L’autre mondialisation, Paris, Flammarion. De même, sur les questions d'espionnage, il aurait été intéressant d'avoir des données issues du "dark web" qui peuvent être révélatrices de l’intensité d'un événement de cet ordre. Là encore j'imagine que techniquement l'analyse se complique grandement ! Mais il faudrait toutefois pouvoir expliquer les raisons pour lesquelles cette dimension n’a pas été observée.