Emploi d'une méthodologie basée sur la connaissance pour classer des publications...

12
UTILISATION D’UNE METHODOLOGIE BASEE SUR LA CONNAISSANCE POUR CLASSER DES PUBLICATIONS TECHNOSCIENTIFIQUES Pino-Díaz, José (*), Chiadmi-García, Laila (**), Bailón-Moreno, Rafael (**), [email protected] , [email protected] , [email protected] (*) Université de Málaga , Departamento de Historia del Arte, Campus de Teatinos, 29.071-Málaga (España), (**) Universidad de Granada , Departamento de Ingeniería Química, Campus de Fuentenueva, 18.071-Málaga (España). Mots clefs : Evaluation scientifique et technologique, Théorie de l’Acteur-Réseau, ingénierie des connaissances, systèmes de connaissances, fouille de textes, analyse des mots associés, réseaux tecno-scientifiques, visualisation de l’information, classement des publications technoscientifiques Keywords : Scientific and Technological Evaluation, Actor-Network Theory, knowledge engineering, knowledge-based system, text mining, co-words analysis, techno-scientific networks, information visualization, ranking of scientific publications Palabras clave : Evaluación Científica y Tecnológica, Teoría Actor-Red, ingeniería del conocimiento, sistemas de conocimiento, minería de textos, análisis de palabras asociadas, redes tecno-científicas, visualización de la información, clasificación de las publicaciones científicas Résumé La finalité de ce document est de présenter un classement, basée sur la connaissance, des revues d’un corpus documentaire multidisciplinaire, scientifique et technologique. On présent l’utilisation d’une méthodologie basée sur la connaissance pour faire classement des publications d’un corpus documentaire multidisciplinaire. On a utilisé des techniques de fouilles de textes (l'analyse des mots associés) et de visualisation de l’information. On applique la méthode du centroide et la centralité des nœuds du réseau technoscientifique (mots-clés, auteurs et publications). On a utilisé la base de connaissance d'une étude antérieure (Pino-Díaz, 2011); menée sur la recherche espagnole dans les zones protégées, selon ICYT et ISOC [bases de données nationales et de l'Institut multidisciplinaire d'études documentaires sur la science et la technologie (IEDCYT); ICYT (Sciences et Technologie) et l'ISOC (Sciences Sociales)].

Transcript of Emploi d'une méthodologie basée sur la connaissance pour classer des publications...

UTILISATION D’UNE METHODOLOGIE BASEE SUR LA CONNAISSANCE POUR CLASSER DES PUBLICATIONS TECHNOSCIENTIFIQUES

Pino-Díaz, José (*), Chiadmi-García, Laila (**), Bailón-Moreno, Rafael (**), [email protected], [email protected], [email protected]

(*) Université de Málaga, Departamento de Historia del Arte, Campus de Teatinos, 29.071-Málaga (España),

(**) Universidad de Granada, Departamento de Ingeniería Química, Campus de Fuentenueva, 18.071-Málaga (España).

Mots clefs :

Evaluation scientifique et technologique, Théorie de l’Acteur-Réseau, ingénierie des connaissances, systèmes de connaissances, fouille de textes, analyse des mots associés, réseaux tecno-scientifiques, visualisation de l’information, classement des publications technoscientifiques Keywords :

Scientific and Technological Evaluation, Actor-Network Theory, knowledge engineering, knowledge-based system, text mining, co-words analysis, techno-scientific networks, information visualization, ranking of scientific publications Palabras clave :

Evaluación Científica y Tecnológica, Teoría Actor-Red, ingeniería del conocimiento, sistemas de conocimiento, minería de textos, análisis de palabras asociadas, redes tecno-científicas, visualización de la información, clasificación de las publicaciones científicas

Résumé La finalité de ce document est de présenter un classement, basée sur la connaissance, des revues d’un corpus documentaire multidisciplinaire, scientifique et technologique. On présent l’utilisation d’une méthodologie basée sur la connaissance pour faire classement des publications d’un corpus documentaire multidisciplinaire. On a utilisé des techniques de fouilles de textes (l'analyse des mots associés) et de visualisation de l’information. On applique la méthode du centroide et la centralité des nœuds du réseau technoscientifique (mots-clés, auteurs et publications). On a utilisé la base de connaissance d'une étude antérieure (Pino-Díaz, 2011); menée sur la recherche espagnole dans les zones protégées, selon ICYT et ISOC [bases de données nationales et de l'Institut multidisciplinaire d'études documentaires sur la science et la technologie (IEDCYT); ICYT (Sciences et Technologie) et l'ISOC (Sciences Sociales)].

1 Introduction Les plus importants classements des revues scientifiques sont faits en fonction de l'analyse des citations. Mesurer l'importance d'une revue scientifique selon les citations tirées, est d'effectuer une analyse quantitative plutôt que qualitative ; cependant, les classements des revues en fonction de leur facteur d'impact, font partie de l'ensemble des instruments utilisés par les organismes nationaux et internationaux pour l'évaluation de l'activité scientifique des chercheurs, des centres de recherche et des universités. L'utilisation de la citation dans l'évaluation scientifique, leurs avantages et inconvénients, a fait l'objet de nombreuses études. Les systèmes, les techniques et méthodes d'analyse basées sur la connaissance permettent une analyse de l'information scientifique dans une perspective sémantique, de l’étude du contenu et des relations conceptuelles. L'analyse des mots associés est une méthode de découverte de connaissances de base de données (He, 1999). La visualisation de l’information en utilisant des diagrammes de dispersion [diagrammes à coordonnées XY (Pino-Díaz, 2009)] facilite la compréhension des variables complexes comme la centralité des nœuds et la proximité par similitude. Les diagrammes à bulles facilitent la visualisation de les corrélations entre des variables numériques et non numériques (la centralité, la catégorie de classement CIRC et le type de éditeur de la publication). On a utilisé la base de connaissance d'une étude antérieure (Pino-Díaz, 2011); menée sur la recherche espagnole dans les zones protégées, selon ICYT et ISOC [bases de données nationales et de l'Institut multidisciplinaire d'études documentaires sur la science et la technologie (IEDCYT); ICYT (Sciences et Technologie) et l'ISOC (Sciences Sociales)].

2 Méthodologie On a utilisé la méthode du centroïde et la centralité des nœuds (Pino-Díaz et al, 2011) pour classer les publications du corpus documentaire. La méthode du centroide est une méthode basée sur la connaissance développée pour cartographier les connaissances stratégiques des réseaux technoscientifiques. La centralité des nœuds est un paramètre qui mesure la position des mots sur l'ensemble du réseau, de sorte que les termes (dans ce cas, les publications) de plus haut valeur de centralité se trouvent plus près du centroide. Pour la visualisation de l’information on a choisis diagrammes de dispersion à bulles, qui peuvent représenter jusqu'à trois variables par couleur, taille et proximité. Pour aider le lecteur dans la perception visuelle des centralités des nœuds sont tirées des cercles concentriques. On a étudié les publications indexées dans les bases de données IEDCYT (ICYT, ISOC), pour une durée de vingt-cinq ans (1981-2005), avec articles sur les aires protégées ; cette base documentaire a été tirée d’une étude précédente. Le corpus documentaire est multidisciplinaire. Les résultats de ICYT et ISOC ont été rejoint en un seul corps par le gestionnaire de référence ProCyte (on a éliminé les items doubles); ensuite a été exporté vers le système de connaissances Copalred (Bailon-Moreno, 2003), pour faire le contrôle des termes (auteurs et titres de revues).

On a développé une nouvelle catégorie d’information, formé par mots-clés, les auteurs et les titres de publications, pour analyser la cooccurrence des mots. Les paramètres de construction du réseau technoscientifique sélectionnés ont été cinq (5), pour le nombre minimal d'occurrences, et trois (3) pour le nombre minimum de cooccurrences. On a construit avec Pajek (Batagelk et Mrvar, 2010) le réseau de plus basse énergie à travers l'algorithme Kamada-Kawai (1989). On a sélectionné, comme les valeurs des liaisons entre les nœuds, les valeurs des indices d’association, ou indices d'équivalence, (Michelet, 1988), de mode que la distance entre deux noeuds reliés par lien est indicative du son degré de similitude. Une fois dessinée le réseau on a séparés ses composants. A la fin, nous avons obtenu les coordonnées des publications du réseau, pour dessiner les diagrammes à dispersion. On a calculé les distances euclidiennes entre chaque nœud et le centroide du rèseau et on a dessiné des courbes de centralité dans les diagrammes à dispersion. On visualise les publications à travers de bulles à couleur, où l’aire de la bulle est proportionnelle a le nombre de occurrences de la publication. Deux zones ont été distinguées dans les diagrammes à dispersion, une zone centrale et une zone périphérique. Dans la zone centrale sont situées des publications avec une centralité entre 80 et 100 ; dans la zone périphérique sont situées les publications à moins de 0,80 de centralité. On a différencié quatre groupes de publications par sa valeur de centralité dans la zone centrale: Groupe I: 95 ≤ C <100 ; Groupe II: 90 ≤ c <95 et ; Groupe III: 85 ≤ C <90 et Groupe IV: 80 ≤ C <85.

3 Résultats La base de connaissances contient 902 enregistrements (3.595 mots-clés, 1542 auteurs et 223 titres de publications). On montre les résultats obtenus pour chaque publication au Tableau 1, qui contient l'identifiant de la publication, son titre, ses coordonnées dans le réseau, le nombre d'occurrences, leur catégorie dans la classification CIRC, la centralité du noeud et le groupe auquel elle appartient à la classification CIRC (Torres-Salinas et al., 2010) [la classification CIRC des revues scientifiques espagnoles en sciences sociales et humaines est une classification qui regroupe les revues en cinq catégories ou groupes (Gex, GA, GB, GC et GD, citées par ordre décroissant de « qualité »). ]Une publication est inclus dans une catégorie ou l'autre on dépendant des différents critères d'évaluation qui dépasse ; ainsi que à la catégorie A sont placés les revues espagnoles internationales qui sont indexés dans des bases de données de Science Citation Index ; Sciences Sociales Citation Index ; Arts & Humanities Citation Index ; ou, l’European Reference Index for the Humanities (avec une classement de INT)]. D'après le tableau 1 ont été dessinées les diagrammes à dispersion 1 et 2 (Fig. 1 et 2). La courbe la plus proche du centroïde correspondant à la valeur centrale de 95, les autres courbes correspondent à des valeurs décroissantes de centralité successivement par 5 unités de mesure.

Tableau 1: Publications du réseau de la recherche espagnole de visibilité nationale sur les aires protégées, par IEDCYT.

Id Publicaciones IEDCYT X coord Y coord Nº ocClasific

CIRCCentralidad nodal

Grupo de

clasificación

37 RETEMA (MADRID) (REVISTA TÉCNICA DE MEDIO AMBIENTE) 0,53 0,59 7 (-) 97,83

13 COLECCIÓN TÉCNICA ICONA 0,54 0,56 12 (-) 97,31

52 CUADERNOS GEOGRÁFICOS DE LA UNIVERSIDAD DE GRANADA 0,47 0,56 5 B 96,51

1 MEDIO AMBIENTE (REVISTA) 0,46 0,59 35 C 96,01

5 MEDIO AMBIENTE CANARIAS 0,55 0,54 18 (-) 94,85

26 MUNIBE. CIENCIAS NATURALES 0,49 0,63 8 B 94,83

18 CUADERNOS DE TURISMO 0,47 0,53 9 B 93,98

59 ÁREA. REVISTA DE DEBATS TERRITORIALS 0,57 0,52 5 C 92,35

32 INVESTIGACIONES GEOGRÁFICAS 0,48 0,50 7 C 92,23

41 BOLETÍN DE LA ASOCIACIÓN HERPETOLÓGICA ESPAÑOLA 0,50 0,66 6 C 92,23

44 ESTUDIOS GEOGRÁFICOS 0,52 0,49 6 B 91,68

6 BOLETÍN DE LA ASOCIACIÓN ESPAÑOLA DE ENTOMOLOGÍA 0,58 0,64 17 (-) 91,26

12 BOLETÍN DE LA SEA 0,59 0,63 12 (-) 91,21

49 SHILAP. REVISTA DE LEPIDOPTEROLOGÍA 0,59 0,61 6 A 91,21

11 BUTLLETÍ DE LA INSTITUCIÓ CATALANA D'HISTORIA NATURAL 0,46 0,67 13 (-) 90,74

20 REVISTA DE OBRAS PÚBLICAS 0,40 0,58 9 C 89,7

54 HETEROPTERUS REVISTA DE ENTOMOLOGÍA 0,60 0,64 5 C 89,55

39 ANALES DE GEOGRAFÍA DE LA UNIVERSIDAD COMPLUTENSE 0,38 0,62 6 B 86,83

27 PH. BOLETÍN DEL INSTITUTO ANDALUZ DEL PATRIMONIO HISTÓRICO 0,37 0,54 8 C 86,17

19 REVISTA CATALANA DE MICOLOGÍA 0,64 0,64 9 (-) 85,74

50 BOLETÍN DE LA ASOCIACIÓN DE GEÓGRAFOS ESPAÑOLES 0,54 0,43 5 A 85,65

35 MONOGRAFÍAS DE FLORA Y VEGETACIÓN BÉTICA 0,66 0,59 7 (-) 85,58

16 ERÍA 0,56 0,44 10 (-) 85,17

57 REVISTA ARAGONESA DE ADMINISTRACIÓN PÚBLICA 0,59 0,45 5 C 85,14

2 BOLETÍN DE LA SOCIEDAD MICOLÓGICA DE MADRID 0,65 0,64 20 (-) 84,71

43 DOCUMENTS D'ANALISI GEOGRAFICA 0,62 0,47 6 B 84,46

8 LIMNETICA 0,37 0,67 15 A 84,36

34 LURRALDE. INVESTIGACIÓN Y ESPACIO 0,37 0,50 7 (-) 84,19

24 BOTANICA COMPLUTENSIS 0,58 0,73 8 (-) 83,61

4 ACTA BOTANICA MALACITANA 0,62 0,70 19 (-) 83,53

3 ECOLOGÍA (REVISTA) 0,77 0,55 20 (-) 83,11

29 ANALES DEL JARDÍN BOTÁNICO DE MADRID 0,38 0,69 7 A 83,11

17 LAGASCALIA 0,54 0,75 10 (-) 83,1

7 GEOGACETA 0,62 0,45 15 (-) 82,94

28 VIERAEA 0,64 0,70 8 C 82,7

47 REVISTA DE LA ACADEMIA CANARIA DE CIENCIAS 0,65 0,69 6 C 82,64

21 ZUBÍA 0,64 0,45 9 C 82,19

36 NACC. BIOLOXÍA 0,68 0,67 7 (-) 80,51

31 GRAELLSIA 0,72 0,64 7 C 78,57

9 MONTES (REVISTA) 0,45 0,36 15 C 77,64

48 SCIENTIA GERUNDENSIS: ANNALS DE LA SECCIO DE CIENCIES DEL COLLEGI UNIVERSITARI DE GIRONA0,34 0,42 6 C 77,24

22 BELARRA (BARAKALDO) 0,73 0,67 8 (-) 76,01

33 INVESTIGACIÓN AGRARIA. SISTEMAS Y RECURSOS FORESTALES 0,46 0,33 7 A 74,58

46 OBSERVATORIO MEDIOAMBIENTAL 0,64 0,35 6 B 73,51

23 BOLETÍN GEOLÓGICO Y MINERO 0,23 0,54 8 C 72,82

40 ANUARI ORNITOLÓGIC DE LES BALEARS 0,27 0,33 6 C 65,95

38 REVISTA DE PASTOS 0,11 0,73 7 C 58,05

25 LAZAROA 0,94 0,95 8 (-) 43,63

Zona núcleo

Grupo I

0'95≤c<100

Zona núcleo

Grupo II

0'90≤c<0'95

Zona núcleo

Grupo III

0'85≤c<0'90

Zona núcleo

Grupo IV

0'80≤c<0'85

Zona periférica

c<0'80

Le classement des publications par sa centralité es la suivante : A) Zone noyau :

- Groupe I ; 95 ≤ C <100 : • RETEMA (MADRID) (REVISTA TÉC'ICA DE MEDIO AMBIE'TE) 97,83 • COLECCIÓ' TÉC'ICA ICO'A 97,31 • CUADER'OS GEOGRÁFICOS DE LA U'IVERSIDAD DE GRA'ADA 96,51 • MEDIO AMBIE'TE (REVISTA) 96,01

- Groupe II ; 90 ≤ c <95 :

• MEDIO AMBIE'TE CA'ARIAS 94,85 • MU'IBE. CIE'CIAS 'ATURALES 94,83 • CUADER'OS DE TURISMO 93,98 • ÁREA. REVISTA DE DEBATS TERRITORIALS 92,35 • I'VESTIGACIO'ES GEOGRÁFICAS 92,23 • BOLETÍ' DE LA ASOCIACIÓ' HERPETOLÓGICA ESPAÑOLA 92,23 • ESTUDIOS GEOGRÁFICOS 91,68 • BOLETÍ' DE LA ASOCIACIÓ' ESPAÑOLA DE E'TOMOLOGÍA 91,26 • BOLETÍ' DE LA SEA 91,21 • SHILAP. REVISTA DE LEPIDOPTEROLOGÍA 91,21 • BUTLLETÍ DE LA I'STITUCIÓ CATALA'A D'HISTORIA 'ATURAL. 90,74

- Groupe III ; 85 ≤ C <90 :

• REVISTA DE OBRAS PÚBLICAS 89,7 • HETEROPTERUS REVISTA DE E'TOMOLOGÍA 89,55 • A'ALES DE GEOGRAFÍA DE LA U'IVERSIDAD COMPLUTE'SE 86,83 • PH. BOLETÍ' DEL I'STITUTO A'DALUZ DEL PATRIMO'IO HISTÓRICO 86,17 • REVISTA CATALA'A DE MICOLOGÍA 85,74 • BOLETÍ' DE LA ASOCIACIÓ' DE GEÓGRAFOS ESPAÑOLES 85,65 • MO'OGRAFÍAS DE FLORA Y VEGETACIÓ' BÉTICA 85,58 • ERÍA 85,17 • REVISTA ARAGO'ESA DE ADMI'ISTRACIÓ' PÚBLICA 85,14

- Groupe IV ; 80 ≤ C <85 :

• BOLETÍ' DE LA SOCIEDAD MICOLÓGICA DE MADRID 84,71

• DOCUME'TS D'A'ALISI GEOGRAFICA 84,46 • LIM'ETICA 84,36 • LURRALDE. I'VESTIGACIÓ' Y ESPACIO 84,19 • BOTA'ICA COMPLUTE'SIS 83,61 • ACTA BOTA'ICA MALACITA'A 83,53 • ECOLOGÍA (REVISTA) 83,11 • A'ALES DEL JARDÍ' BOTÁ'ICO DE MADRID 83,11 • LAGASCALIA 83,10 • GEOGACETA 82,94 • VIERAEA 82,70 • REVISTA DE LA ACADEMIA CA'ARIA DE CIE'CIAS 82,64 • ZUBÍA 82,19 • 'ACC. BIOLOXÍA 80,51

B) Zone peripherique :

- Groupe Peripherique ; C <80 :

• GRAELLSIA 78,57 • MO'TES (REVISTA) 77,64 • SCIE'TIA GERU'DE'SIS: A''ALS DE LA SECCIO DE CIE'CIES … 77,24 • BELARRA (BARAKALDO) 76,01 • I'VESTIGACIÓ' AGRARIA. SISTEMAS Y RECURSOS FORESTALES 74,58 • OBSERVATORIO MEDIOAMBIE'TAL 73,51 • BOLETÍ' GEOLÓGICO Y MI'ERO 72,82 • A'UARI OR'ITOLÓGIC DE LES BALEARS 65,95 • REVISTA DE PASTOS 58,05 • LAZAROA 43,63

12

3

4

5

6

7

8

9

11

12

13

16

17

18

19

20

21

22

23

24

25

26

27

2829

31

32

33

34

35

36

37

38

39

40

41

4344

46

47

48

49

50

52

54

57

59

0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1

0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1

Figure 1: Diagramme à dispersion 1; Centralité des publications sur les aires protégées dans le réseau IEDCYT, pour la période 1981-2005. En rouge les revues CIRC GA; en jaune les revues CIRC GB; en vert les revues CIRC GC; et en bleu les revues et les publications que ne figurent pas dans la classification CIRC. La taille des bulles est

proportionnelle au nombre d'occurrences.

12

3

4

5

6

7

8

9

11

12

13

16

17

18

19

20

21

22

23

24

25

26

27

2829

31

32

33

34

35

36

37

38

39

40

41

4344

46

47

48

49

50

52

54

57

59

0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1

0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1

Figure 2: Diagramme à dispersion 2; Centralité des publications sur les aires protégées dans le réseau IEDCYT, pour la période 1981-2005. En vert, les publications des Universités; en bleu, publications émises par les Académies Scientifiques, les Associations ou Organismes Professionnels; en rose, les publications du Service des Publications de

l'Administration Publique; et, en orange, la publication de l'Édition Privée. La taille des bulles est proportionnelle au nombre d'occurrences.

La classification CIRC inclus des revues scientifiques espagnoles en sciences sociales et humaines et aussi quelques revues espagnoles en sciences expérimentales et technologie (des revues de publication internationale). Si on fait la comparaison entre le group de publications du classement basée sur la connaissance et les revues de la classification CIRC, on peut vérifier :

a) Toutes les publications du réseau technoscientifique « recherche espagnole dans les zones protégées » appartenant aux sciences humaines et sociales sont incluses dans la classification du CIRC, dans différentes catégories. b) Les publications du réseau appartenant aux sciences expérimentales et technologie sont incluses dans CIRC: - revues catégorie A : Limnetica, Anales del Jardin Botánico de Madrid, SHILAP Lepideroptología et Investigación Agraria ; - revue catégorie B : Munibe-Ciencias 'aturales ; et - revues catégorie C : Boletín de la Asociación Herpetológica Española, Heteropterus-Revista de Entomología, Revista Catalana de Micología, Vieraea, Revista de la Academia Canaria de Ciencias, Graellsia, Boletín Geológico y Minero, Revista de Pastos, Scientia Gerundensis, Anuari Ornitologic de les Balears, Montes, et Lazaroa. c) Sauf les publications Medio Ambiente, Revista Aragonesa de Medio Ambiente, (revues catégorie C), et Observatorio Medio Ambiental (revue catégorie B), les autres publications espagnoles sur le management de l'environnement du réseau (Retema-Revista Técnica de Medio Ambiente, Medio Ambiente Canarias et Colección Técnica del ICO'A) ne sont pas inclus dans CIRC. Ces publications sont édités par les Services de Publications des Organismes Publiques et un editeur privé (Retema-Revista Técnica de Medio Ambiente). d) Les publications sur management environmental sont situés près du centroide (centralité > 0,9). e) Les publications sur le tourisme sont situés près du centroide (centralité > 0,9); elles sont publiés par des Universités et elles sont incluses à la classification CIRC (catégories B et C). f) Les publications sur les insectes sont situés entre les courbes de centralité correspondant à 0'95 et 0'9. g) Les publications sur les champignons sont situés entre 0,9 et 0,85 de centralité; elles sont publiées par des Sociétés Scientifiques.

Les diagrammes à dispersion et la Carte CSRT (Carte de Connaissances Strategiques du Réseau Technoscientifique) (Pino-Díaz et al., 2012), sont construits à partir des coordonnées des nœuds, de sorte qu'ils peuvent se chevaucher. La figure 3 montre le diagramme à bulles sur la Carte CSRT.

Figure 3: Une composition faite par la Carte CERT (carte réseau du savoir technoscientifique stratégique) et le diagramme à bulle.

4 Conclusions La théorie de l'acteur-réseau postule que dans la production de connaissances scientifiques sont impliqués des acteurs humains et non-humains et ils forment un réseau de connaissances (Latour, 1983), (Callon, 1989). Ce réseau de mots clés (objet de l'enquête), d’auteurs (chercheurs) et de revues (publication des médias, la diffusion et la vulgarisation de la science) peut être testé avec des techniques KDD (Han et Kamber, 2001) (Fan et al., 2006). La cooccurrence des termes (mots clés, auteurs et revues) dans le corpus terminologique dessine un réseau ; les nœuds sont placés autour de leur centroide en fonction de leur degré d'association avec les autres nœuds ; les noeuds les plus proches du centroide sont les noeuds de plus haute centralité. La classification basée sur la connaissance permet faire des classements des publications d’un réseau en fonction de leur centralité nodal. La centralité des noeuds est une variable continue qui permet faire listes du corpus terminologique du domaine documentaire par la proximité des nœuds au centroide du réseau. La centralité d'une publication, son nombre d'occurrences, sa catégorie dans la classification CIRC (dans le cas des revues CIRC) et le type d'entité qui la édite ne sont pas variables corrélées. C’est vérifié par la visualisation de diagrammes à dispersion qu’il n’existe pas corrélation entre le nombre d'occurrences, la catégorie de classification CIRC et le type d’entité qui édite, et la centralité de la revue ou publication. Cela signifie que la situation de une publication proche du centroide du réseau (haute centralité) est indépendant : a) du nombre de fois où il apparaît dans la base de connaissances ; b) de la catégorie dans laquelle CIRC la classé ; ou, c) le type d'entité qui l’édité. Les publications dans un réseau des connaissances sont placées en fonction de leur affinité conceptuelle avec l'objet d'étude. Il a été demontré que, pour un certain objet d'étude, tel que la recherche sur les aires protégées et, par extension, dans tout autre domaine techno-scientifique, la meilleure classification des revues en fonction de l'objet d'étude est la classification réalisée par similitude thématique. Cette similitude se reflète de manière appropriée selon le degré d'association des mots-clés dans les documents publiés dans ces revues, et à partir de cela, selon sa centralité nodal. Par conséquent, une revue est la plus appropriée pour un objet d'étude si sa centralité nodal par rapport à l'objet d'étude est la plus grande. Selon le même critère, la deuxième revue la plus appropriée sera celle qui possède la centralité nodal suivante, et ainsi succesivement. C'est pourquoi, lorsqu'on utilise d'autres critères de classement, différents de la similitude avec l'objet d'étude, le résultat de la classement situe dans les premières positions les revues qui répondent à d'autres critères [par example, les revues CIRC de la catégorie A sont les "revues internationales les plus prestigieuses qui ont passé des processus d'évaluation très strictes pour être admis dans les différentes bases de données")]. Nous pensons que le classement basé sur le critère de similitude avec l'objet d'étude correspond mieux à la réalité dans un corpus documentaire spécifique.

5 Bibliographie [1] BAILÓN-MORENO, R. (2003). Ingeniería del conocimiento y vigilancia tecnológica aplicada a la investigación en el campo de los tensioactivos. Desarrollo de un modelo

ciencimétrico unificado. Ph. D. thesis, Universidad de Granada, Granada. Spain. [en ligne] http://hdl.handle.net/10481/24728

[2] BATAGELJ, V. & MRVAR, A. (2010). 'etworks/Pajek. Pajek Program for Large 'etwork Analysis. Récupéré 4/avril/2010, [en ligne] http://vlado.fmf.uni-lj.si/pub/networks/pajek/

[3] CALLON, M. (1989). La science et ses réseaux: gènese et circulation des faits scientifiques. Paris: Découverte.

[4] FAN, W., WALLACE, L., RICH, S., et ZHANG, Z. (2006). Tapping into the Power of Text Mining. Comunications of ACM, 49(9), 76-82.

[5] HAN, J. & KAMBER, M. (2001). Data Mining: Concepts and Techniques. (2º ed.) San Francisco; Morgan Kaufmann Publishers, p. 550.

[6] HE, Q., (1999). Knowledge discovery through co-word analysis. Library Trends, 48 (1), 133-159.

[7] KAMADA, K. & KAWAI, S. (1989). An algorithm for drawing general undirected graphs. Information Processing Letters 31(1), 7-15

[8] LATOUR, B. (1983). Give me a Laboratory and I Will Raise the World. En K. Knorr-Cetina, & M. Mulkay, Science observed: Perspectives on the Social Study of Science. Londres: Sage.

[9] MICHELET, B. (1988). L'analyse des associations. PhD Thesis. Paris: Université de Paris 7.

[10] PINO-DÍAZ, J., JIMÉNEZ-CONTRERAS, E., RUIZ-BAÑOS, R. et BAILÓN-MORENO, R. (2009). Visualisation des acteurs-réseaux à travers les cartes SIG. VSST 2009. 1-13.

[11] PINO-DÍAZ, J. (2011). Análisis estratégico de la investigación sobre áreas protegidas en España: ingeniería y cartografía del conocimiento. Ph. D. thesis, Universidad de Granada, Granada. Spain. [en ligne] http://hdl.handle.net/10760/15995

[12] PINO-DÍAZ, J., JIMÉNEZ-CONTRERAS, E., RUÍZ-BAÑOS, R. et BAILÓN-MORENO, R., (2011). Evaluación de redes tecnocientíficas : la red española sobre áreas protegidas, según la Web of Science. Revista Española de Documentación Científica. CSIC. 34 (3), 301-333

[13] PINO-DÍAZ, J., JIMÉNEZ-CONTRERAS, E., RUÍZ-BAÑOS, R. et BAILÓN-MORENO, R., (2012). Strategic knowledge maps of the techno-scientific network (SK maps). J. Am. Soc. Inf. Sci., 63: 796–804. doi: 10.1002/asi.21712

[14] TORRES-SALINAS, D., BORDONS, M., GIMENEZ-TOLEDO, E., DELGADO-LOPEZ-COZAR, E., JIMENEZ-CONTRERAS, E. et SANZ-CASADO, E. (2010). "Clasificación integrada de revistas científicas (CIRC): propuesta de categorización de las revistas en ciencias sociales y humanas". El profesional de la información, 19, 6 : 675-683.