Spécificateurs engendrés par les traits [±ANIMÉ], [±HUMAIN], [±CONCRET] et structures...

32
Travaux CRTT Sous la direction de Henri Béjoint et François Maniez DE LA MESURE DANS LES TERMES Hommage à Philippe Thoiron Presses Universitaires de Lyon 2005

Transcript of Spécificateurs engendrés par les traits [±ANIMÉ], [±HUMAIN], [±CONCRET] et structures...

Travaux CRTT

Sous la direction de

Henri Béjoint et François Maniez

DE LA MESURE

DANS LES TERMES

Hommage à Philippe Thoiron

Presses Universitaires de Lyon 2005

J. DICHY 152

Spécificateurs engendrés par les traits [±ANIMÉ],

[±HUMAIN], [±CONCRET] et structures d’arguments

en arabe et en français

Joseph Dichy

1

Résumé Les relations lexique-grammaire entraînent la nécessité d’associer aux entrées du

lexique des spécificateurs du niveau du mot-forme (M-spécificateurs) ou de la

phrase (P-spécificateurs). Les M-spécificateurs ont été inventoriés en arabe pour

la ressource lexicale DIINAR1. Cet exposé, qui porte sur l’arabe et le français,

propose un sous-ensemble des P-spécificateurs, les catégories engendrées par

l’arbre conceptuel des traits fondamentaux [±CONCRET], [±ANIMÉ] et

[±HUMAIN], envisagés dans le cadre de la structure d’arguments des verbes. Ces

traits peuvent sembler recouvrir l’ensemble des possibles ontologiques, et donc

linguistiques. Au sens strict (arbre « restreint »), les catégories engendrées sont

connues : PERSONNE ; ANIMAL ; CHOSE OU PHÉNOMÈNE PERCEPTIBLE ; IDÉE OU

EXPÉRIENCE NON PHYSIQUE. Or, elles laissent dans l’ombre de nombreuses

données relatives aux relations lexique-grammaire associées à la structure

d’arguments des verbes. Un arbre conceptuel « étendu » permet de décrire trois

catégories sémantiques, qui devront être incluses dans l’inventaire des P-

spécificateurs : COLLECTIVITÉ ; QUASI-ANIMÉ PERCEPTIBLE et QUASI-ANIMÉ

NON PERCEPTIBLE. Le principal domaine lexico-sémantique de l’extension de

l’arbre conceptuel et de l’ontologie qui se dégage des données linguistiques est

donc celui de l’animéité.

Abstract Grammar-lexis relations render it necessary to associate lexical entries with

word-form and sentence-level specifiers (W- and S-specifiers). S-specifiers have

been elaborated in Arabic for the DIINAR.1 lexical resource. This contribution

considers Arabic and French data, and introduces a subset of S-specifiers, the

categories generated by the conceptual tree of three fundamental features:

[±CONCRETE], [±ANIMATE] and [±HUMAN], considered with regards to Verb

argument structures. These features appear at first to cover all possible

ontological, hence linguistic, entities. The categories generated by the

« restricted tree » (features taken in their strict definition), are known: PERSON;

1 ICAR-CNRS/Lyon 2, UMR 5191 et ÉLISA (Épistémologie, Linguistique, Ingénierie et

Sémiologie de l’arabe), Université Lumière - Lyon 2.

Mél : [email protected]

SPECIFICATEURS ET STRUCTURES D’ARGUMENTS

153

ANIMAL; PERCEPTIBLE ENTITY; IDEA OR NON PHYSICAL EXPERIENCE. Noticeably,

many grammar-lexis data related to Verb argument structures are left

unaccounted for. An extended conceptual tree, including extended definition of

the above fundamental features, generates three additional categories:

COLLECTIVITY; PERCEPTIBLE and NON PERCEPTIBLE QUASI-ANIMATE ENTITY.

Main semantic extensions of the conceptual tree stemming from linguistic data

thus appear to occur in the field of animate entities.

Mots clés arabe ; français ; traits lexico-sémantiques ; ontologies linguistiques ; relations

lexique-grammaire ; spécificateurs linguistiques ; bases de données lexicales ;

structures d’arguments des verbes

1 Introduction

Ce travail prend pour objet trois traits sémantico-syntaxiques

fondamentaux, [±CONCRET], [±ANIMÉ] et [±HUMAIN], dont l’articulation

offre pour une analyse linguistique l’intérêt d’englober – du moins à

première vue – l’ensemble des référents possibles, et de permettre en

conséquence un « balayage » de l’ensemble du lexique d’une langue. Ces

traits, et les catégories que leur articulation engendre, constituent de ce

fait de bons candidats à une intégration dans un inventaire de

spécificateurs associés aux unités lexicales (§ 1. 1 ci-dessous) dans le but

de « gérer » les relations lexique-grammaire.

La construction de ces spécificateurs doit toutefois, dès le départ,

surmonter un obstacle épistémologique. Les traits sémantiques associés

aux catégories majeures du lexique présentent en effet la caractéristique

d’être à la fois internes aux systèmes linguistiques et de mettre en jeu la

référence, c’est-à-dire, la représentation des « objets du monde » incluse

dans les manifestations orales et écrites d’une langue donnée : il est de ce

fait impossible d’échapper à l’ontologie, dès lors qu’on s’attelle à

l’inventaire des traits sémantiques nécessaires à la mise en œuvre de la

relation entre les unités lexicales d’une langue et les règles de la syntaxe

et de la morphologie dans lesquelles ces unités s’insèrent.

Le linguiste ne dispose, face à cette difficulté, que d’un seul

moyen de traiter la question de manière interne à son domaine d’étude :

dégager l’ontologie linguistique organisatrice d’un ensemble cohérent de

traits et de catégories lexicales, à partir du fonctionnement d’une ou

plusieurs langues – et non à partir d’une catégorisation a priori. Les

propositions développées ici (sections 2 et 3) s’inscriront dans cette

démarche.

J. DICHY 154

1. 1 Arrière-plan historique et méthodologique du concept

de spécificateur

Les relations lexique-grammaire rendent compte, dans la représentation

d’un système linguistique donné, du fait que les règles des grammaires

sont sensibles à un ensemble de traits associés aux unités du lexique. Cette

question est traitée différemment selon les cadres théoriques de référence.

Citons-en quelques-uns parmi un grand nombre d’autres : en grammaire

générative, les contraintes de sous-catégorisation ont été présentées dans

les « Remarques sur la nominalisation » de Chomsky (1972) ; la théorie

« Sens-Texte » d’Igor Mel’uk associe à la définition saussurienne du

signe linguistique en <signifiant, signifié> un troisième élément, le

syntaxique (selon le schéma : <<signifiant, signifié>, syntaxique>),

élément qui rend compte des phénomènes associés à aux deux premiers,

mais qui ne peuvent être déduits ni de la forme ni du sens du signe, tels

que le genre des noms en français, ou le caractère transitif direct ou

indirect de certains verbes, etc. (Mel’uk, 1982 : 26-28) ; John Sinclair

(1991) montre que de très nombreuses structures syntaxiques de l’anglais,

non observées avant les analyses de corpus réalisées au cours des

décennies écoulées, dépendent de relations lexique-grammaire.

D’importantes recherches ont été menées sur l’arabe par A. Fassi-Fehri

(notamment 1986, 1993), dans un cadre qui s’apparente, en le

prolongeant, à celui de la Grammaire lexicale et fonctionnelle (LFG).

Le concept de spécificateurs associés aux unités lexicales

(Hassoun, 1987 ; Dichy et Hassoun, dirs, 1989) constitue également une

contribution à la théorisation des relations lexique-grammaire. Pour la

clarté de l’exposé, j’en rappellerai ici la définition, en l’inscrivant dans la

perspective des travaux sur lesquelles elle se fonde.

1. 1. 1 Arrière-plan méthodologique

Ces travaux ont porté au départ sur le traitement automatique du niveau

du mot-forme en arabe, considéré dans sa réalisation graphique. La

recherche menée par l’auteur en collaboration avec Richard Bouché, puis

avec Mohamed Hassoun, dans le prolongement du Rapport Desclés

(Desclés, dir., 1983), a pris forme au cours des années 1980 dans ce qui

était connu alors sous le nom de projet SAMIA (« Synthèse et analyse

morphosyntaxiques de l’arabe », Dichy, 1987 ; Dichy et Hassoun, dirs,

1989). Les années 1990 ont vu :

– d’une part la mise en route d’un certain nombre de thèses dirigées en

commun par Mohamed Hassoun et l’auteur, et portant, soit sur des

SPECIFICATEURS ET STRUCTURES D’ARGUMENTS

155

analyses lexicologiques associées à une démarche computationnelle

(Ezzahid, 1996 ; Minko, 2003) ou menées dans un cadre trilingue

(Franjié, 2003), soit sur la conception et la réalisation de logiciels relevant

de l’ingénierie linguistique (Ghenima, 1998 ; Ouersighni, 2002 ; Zaafrani,

2002 ; Abbès, 2004), l’ensemble s’inscrivant dans le domaine du

traitement automatique de l’arabe et de la conception des lexiques

nécessaires à celui-ci ;

– d’autre part, la collaboration avec un centre de recherche tunisien,

l’IRSIT (Institut régional des sciences de l’informatique et des

télécommunications, aujourd’hui IT.COM). Le Bureau d’arabisation de

cet Institut, dirigé par Salem Ghazali, accueillait également Abdelfattah

Braham. La réalisation de la base de connaissances lexicales DIINAR.1

(« DIctionnaire INformatisé de l’ARabe, version 1 » – en arabe Ma‘ālī,

abréviation de mu‘jam al-‘arabiyya l-’ālī, qui correspond à la traduction

de l’expression française) a été effectuée en commun à l’IRSIT

(S. Ghazali, A. Braham), l’École Nationale Supérieure des sciences de

l’information et des bibliothèques (ENSSIB – M. Hassoun) et l’université

Lyon 2 (J. Dichy).2 La principale originalité de DIINAR.1 (Braham et

Ghazali, 1998 ; Dichy, Braham, Ghazali et Hassoun, 2002) réside dans :

1. la présence de spécificateurs morphosyntaxiques nécessaires au

traitement du niveau du mot graphique (mais également

nécessaires, pour bon nombre d’entre eux, avec le traitement de

la phrase – Dichy, 2001a), et 2. la compatibilité des informations qui y sont incluses avec les

deux démarches en synthèse (ou génération) et en analyse (ou

reconnaissance).3

2 Diffusion de DIINAR.1 : via ELDA, European Language Resources Distribution

Agency – Agence Européenne de Distribution des Ressources Linguistiques, 55, rue

Brillat-Savarin, 75013 Paris – www.elda.org. Contact : [email protected] ou

[email protected]. 3 Rappelons que les sorties d’un traitement en génération de l’arabe, telle qu’elles sont

conçues dans la méthodologie du projet SAMIA, sont constituées de mots en graphie

arabe entièrement vocalisée (ce qui permet également des sorties partiellement vocalisées

ou non vocalisées, en fonction des applications envisagées – Ghenima, 1998). Le

traitement en analyse est, quant à lui, contraint de prendre en compte des entrées en

graphie arabe courante, c’est-à-dire, en graphie arabe non vocalisée (Dichy, 1984 ;

Hassoun, 1987 ; Ouersighni, 2002 ; Abbès, 2004). Cette différence entre entrées et

sorties en arabe illustre, au niveau le plus général, l’asymétrie, dans le langage, des

processus de la génération et de la reconnaissance, et des grammaires qui leur sont

associées (Dichy, 1984, 1990, 1997, 2000). D’où la contrainte de compatibilité avec les

deux démarches qui caractérise la méthodologie des spécificateurs morphosyntaxiques

mise en œuvre dans DIINAR.1.

J. DICHY 156

1. 1. 2 Le concept de spécificateur

Les spécificateurs établis pour la constitution de la base de données

lexicales DIINAR.1, et associés à chacune de ses entrées, ont pour objet

de « gérer » l’insertion de ces dernières dans le discours, au moyen de

traits associés à une grammaire formelle, et qui représentent les relations

lexique-grammaire dans les limites du mot graphique (Dichy, Braham,

Ghazali, Hassoun, 2002).

Dans l’approche mise au point pour la réalisation de cette base de

données, les spécificateurs morphosyntaxiques régissent la relation entre

un formant appartenant à une unité syntagmatique donnée (mot-forme,

syntagme nominal, syntagme verbal, phrase, texte...) et les autres éléments

de cette unité. Il s’ensuit qu’il convient d’indiquer, à la suite du terme de

formant l’extension de l’unité prise en compte dans l’écriture d’une

grammaire : formant de mot graphique, formant de syntagme nominal,

formant de phrase, etc. (Dichy, 1987).4

Le concept de spécificateur s’étend donc au-delà des traits du

niveau du mot mis au point pour la constitution de DIINAR.1. Les

relations associées à chaque entrée lexicale « gèrent » (Dichy, 2001a) :

– d’une part, les relations contextuelles de cette entrée avec les autres

morphèmes présents dans l’unité syntagmatique retenue (mot, phrase,

texte). Ces relations, qui sont de la forme « entraîne », « exclut » ou

« admet », sont conçues pour être compatibles avec les deux processus

asymétriques de la génération et de l’analyse. Les frontières de l’unité

syntagmatique considérée constituent le domaine d’extension des relations

prises en compte par les spécificateurs :

1. Les M-spécificateurs (en anglais W-specifiers, pour word-

specifiers) gèrent les relations du niveau du mot-forme, qui est en

arabe une unité complexe, considérée ici dans sa réalisation

graphique (Dichy, 1990).

2. Les P-spécificateurs (S-specifiers, pour sentence-specifiers)

prennent en charge les relations du niveau de la phrase.

3. Les T-spécificateurs (T-specifiers, pour text-specifiers) opèrent

au niveau du texte. Ils sont, pour une part, situés sur un autre plan

4 Cette question est également liée à une représentation de l’ambiguïté, dont j’ai montré

qu’elle dépendait formellement (a) de l’extension de l’unité syntagmatique prise en

compte (mot, syntagme, phrase...), et (b), pour chaque unité syntagmatique, de

l’extension du système de connaissances mis en jeu : plus l’unité syntagmatique est

restreinte, plus le coefficient d’ambiguïté est élevé ; ce coefficient augmente en effet de

plus en plus au fur et à mesure que l’on enrichit le système de connaissances auquel on

demande d’assigner à une séquence donnée de morphèmes, selon la formule consacrée,

« toutes les analyses possibles dans la langue considérées et elles seules » (Dichy, 1993,

2000).

SPECIFICATEURS ET STRUCTURES D’ARGUMENTS

157

que les deux premiers, en raison, notamment, du caractère

indéterminé de la frontière du texte (cf. par exemple les questions

liées à l’anaphore et à l’anaphorisation) ;

– d’autre part, les fléchages dérivationnels entre l’entrée lexicale et les

entrées ou les formes auxquelles elle est rattachée par un lien de

dérivation morphologique, par ex. en arabe : singulier pluriel « brisé »

pour les noms ; verbe nom de procès (madar), ou verbe participe

actif (’ism al-fā‘il), etc. Les fléchages dérivationnels appartiennent à la

catégorie des M-spécificateurs.

Il est essentiel de noter que, d’un point de vue linguistique, les M-

et les P-spécificateurs comportent une zone d’intersection importante. M-,

P- et T-spécificateurs déterminent une approche « en spirale » : nombre de

traits présents dans les M-spécificateurs sont repris en compte dans les P-

puis dans les T- spécificateurs.

Dans le cadre du projet européen DIINAR-MBC5, coordonné de

février 1998 à décembre 2000 par l’auteur, la question s’est posée de

mettre au point des inventaires finis et exhaustifs de S-spécificateurs

(Dichy et Hassoun, 1998).

Les termes d’inventaire fini et exhaustif sont pris au sens de

Mel’uk (1982). L’exhaustivité du traitement des données linguistiques

s’entend ici strictement dans le domaine formel qui est celui des relations

morphosyntaxiques (ce qui inclut les relations morpho- et syntactico-

sémantiques). Le même concept transposé dans l’établissement des

définitions lexicographiques et des relations sémantiques qu’elles mettent

en jeu, devient dans Mel’uk et al. (1984 : 3) « une recherche de

l’exhaustivité », ce qui illustre, me semble-t-il, le fait que l’on n’est plus

dans le même domaine. Il importe, en d’autres termes, pour bien saisir le

concept formel de l’exhaustivité, d’en restreindre la validité aux domaines

de la langue où l’on trouve, de manière systématique, des inventaires

fermés et par conséquent finis de morphèmes (essentiellement, en

morphologie) ou de catégories et de sous-catégories (essentiellement en

syntaxe), morphèmes et catégories dont on analysera les structures et les

relations sémantiques (elles-mêmes d’inventaires fermés). Ces domaines

se distinguent de ceux où l’on est confronté à des inventaires ouverts, qui

reflètent la relation d’une langue à la représentation des « objets du

monde » à l’œuvre dans son lexique. Toute la difficulté du travail sur les

traits [±CONCRET], [±ANIMÉ] ET [±HUMAIN] réside dans la nécessité de

5 « DIctionnaire INformatisé de l’ARabe, Multilingue et Basé sur Corpus » (programme

INCO-DC de la Commission européenne, projet 961791). Voir http://sites.univ-

lyon2.fr/langues_promodiinar/Accueil.htm

J. DICHY 158

déterminer, à partir de ceux-ci, des catégories lexicales soumises au

« rasoir d’Occam » de la finitude des inventaires et de l’exhaustivité du

traitement des données linguistiques dans le domaine qu’elles délimitent

(Dichy, 2001a).

1. 2 Les spécificateurs syntaxiques du niveau de la phrase,

abordés à partir des structures d’arguments des verbes

Le passage des spécificateurs du niveau du mot-forme, ou M-

spécificateurs aux spécificateurs du niveau de la phrase, ou P-

spécificateurs constitue un « saut qualitatif ».6 En arabe, l’inventaire des

formants du niveau du mot-forme est fermé, sauf pour un seul d’entre eux,

le formant-noyau (qui correspond au formant lexical), ce qui a permis de

projeter un ensemble de M-spécificateurs d’inventaire fini sur chaque

entrée de la ressource lexicale (Dichy, 1997), répondant ainsi à la

contrainte d’exhaustivité que l’on vient d’évoquer.7

Les relations qui s’instaurent dans le domaine de la phrase mettent

en jeu : (a) des morphèmes grammaticaux appartenant à des inventaires

fermés, les mots-outils, et (b) des ensembles de morphèmes appartenant à

des inventaires non fermés, et relevant des catégories lexicales majeures :

noms, verbes, adjectifs... D’où la nécessité d’une approche différente,

dans laquelle la recherche d’inventaires finis porte non plus sur les

morphèmes eux-mêmes, mais sur leurs catégories (et sous-catégories). La

composition au sein de la phrase – et a fortiori du texte – des catégories

grammaticales et des unités lexicales est donc soumise à des jeux de

relations entre sens et forme d’une autre complexité que celles, contraintes

par la morphologie, que l’on observe dans le cadre du mot-forme (même

dans une langue comme l’arabe, qui présente une structure du niveau du

mot assez complexe). L’on est donc amené à mettre en œuvre une

approche et des formalismes relevant de l’exploration contextuelle, tels

qu’ils ont été proposés, dans une perspective de reconnaissance, par J.-P.

Desclés (1989, 1997 ; Desclés et al., 1994). Or, pour qu’une telle

approche soit possible, les règles du système d’exploration contextuelle

doivent pouvoir prendre appui, dans une langue donnée, sur un repérage

6 Un autre « saut qualitatif » se rencontre dans la détermination des spécificateurs

susceptibles d’être associés à des unités terminologiques. Voir sur ce point les travaux de

X. Lelubre (notamment, 2001). Dans une autre perspective, voir également Thoiron

(1994). 7 Cette approche est également susceptible d’être représentée dans un formalisme « à

deux niveaux », compatible avec les réseaux de transition automatisés (ATN, automated

transition networks). Voir Beesley et Karttunen, 2003, qui rendent compte, parmi

d’autres langues, de l’expérience menée au Centre de recherche de Xerox à Meylan sur

l’analyse morphologique de l’arabe.

SPECIFICATEURS ET STRUCTURES D’ARGUMENTS

159

de catégories grammaticales et lexicales d’une part, et sur les informations

associées aux morphèmes grammaticaux et lexicaux de l’autre, i.e., sur

des M- et des P-spécificateurs.

Pour traiter l’inventaire des P-spécificateurs de l’arabe, j’ai

proposé, en 1999-2000, de prendre pour point de départ (non exclusif) la

structure d’arguments des verbes,8 considérée à partir de traits syntaxiques

fondamentaux – compte tenu du fait que les structures syntaxiques de

transitivité (« directe » ou prépositionnelle, etc.) ou d’intransitivité avaient

déjà été traitées dans le cadre de du projet SAMIA et de DIINAR.1. Le

schéma de la structure d’arguments des verbes présente en effet certaines

analogies avec celui du mot-forme dans sa réalisation graphique,

particulièrement en arabe (Dichy, 1990). Les deux schémas sont

susceptibles d’une représentation vectorielle, avec cette différence,

cruciale du point de vue de la relation lexique-grammaire, que seul le

premier correspond à un vecteur ordonné. Voici en gros de quelle manière

ces vecteurs se présentent :

Champ des formants en

position de pré-base

Champ de la

base de mot

Champ des formants en

position de post-base

PCL

(proclitique) PRF

(préfixe) BAS

(noyau lexical

ou mot-outil)

SUF

(suffixe) ECL

(enclitique)

fa-sa

ta qūl īna hā

« et donc »,

suivi de la

marque du

futur

« tu »,

pronom sujet

(2e pers.)

verbe « dire »,

forme du

préfixé

(muāri‘)

genre et

nombre (fém.

sing. de la 2e

pers.)

« la »,

pronom

complément

(fém.

singulier)

Traduction : « tu le diras donc »,

mot-à-mot, « et-donc tu [fém. sing.] diras-elle ».

Figure 1 : Vecteur (ordonné) de représentation du mot graphique en arabe

8 La définition de la structure d’arguments associée à un verbe adoptée ici est de nature

lexicographique, ce qui signifie, entre autres choses, que l’analyse linguistique est

soumise à la contrainte consistant à élaborer des représentations explicites et

reproductibles. Elle s’inspire notamment de la définition du schéma de régime de

Mel’uk et al. (1984, p. 5-6). Le lecteur pourra également rapprocher l’analyse

développée dans ce travail de la définition des actants et circonstants de Tesnière

(1959/66 : 102-129), ou encore des travaux de B. Pottier (particulièrement, 1992), et

naturellement, de M. Gross. L’analyse en traits est partiellement issue des contraintes de

sous-catégorisation présentées dans les « Remarques sur la nominalisation » de

Chomsky (1972). Voir aussi J. Picoche (1977 : 58-63). L’approche de J. Sinclair (1991)

inscrit les relations lexique-grammaire dans la conception générale des collocations qui

est la sienne, et notamment dans le « principe d’idiomaticité ».

J. DICHY 160

Cette présentation est simplifiée. La relation d’ordre au sens strict qui

régit les morphèmes entrant en composition au sein du mot graphique

ordonne également les séquences de PCL, de SUF ou d’ECL (Dichy,

1984, 1990). L’ordre des formants de la phrase, dans le cadre de laquelle

la structure d’arguments du verbe s’actualise, n’est pas codé de la même

manière :

Verbe Argument 1 Argument 2 Argument 3 Argu-

ment 4

Forme verbale =

verbe + pronom

sujet (ou sujet

grammatical9)

Cas nominatif,

en identité de

référence avec le

sujet

grammatical

- Soit : cas

accusatif

- soit : prép. +

cas indirect

- Soit : cas

accusatif

- soit : prép. +

cas indirect

- soit :

complétive

Prép. +

cas

indirect

ālaba

« a réclamé

Zaydun

Zayd

‘Amran

[à] Amr

(cas accusatif)

bi-daf‘i l-māli

le paiement de

l’argent

(prép. + cas

indirect)

‘an ’aīhi

de [la part

de] son

frère »

(prép. +

cas

indirect)

Figure 2 : Vecteur (non ordonné) de la structure d’arguments des verbes

Notons au passage que l’exemple ci-dessus supporte deux interprétations,

en fonction de la relation syntaxique de l’argument 4 aux autres formants

de la phrase. Ce dernier est :

1. soit une expansion de « réclamer » : « Zayd a réclamé à Amr, de

la part de son frère, le paiement de l’argent » dû à ce dernier par

Amr (présupposé inclus dans le sens du verbe, tant en arabe

qu’en français) ;

2. soit une expansion de la forme infinitive daf‘, « paiement » :

« Zayd a exigé que Amr paie l’argent pour [de la part de/à la

place de] son frère [à une tierce personne] », ce paiement

correspondant à un dû de Amr. (Il y a en outre dans ce cas une

ambiguïté quant au référent de « son », le frère pouvant être celui

de Z. ou celui de A.)

9 La forme verbale inclut en arabe son pronom sujet (ou sujet grammatical). Cette

représentation est nécessitée dans cette langue par le fait que l’on peut avoir aussi bien

jā’a, « il est venu » que jā’a Zaydun, « Zayd est venu », la forme du verbe jā’a (qui

inclut le pronom sujet) demeurant inchangée : le verbe peut très bien apparaître sans être

suivi d’un nom au cas nominatif, traditionnellement décrit comme « sujet » ou « sujet

sémantique », mais correspondant en fait à une expansion d’identité du pronom sujet

inclus dans la forme verbale.

SPECIFICATEURS ET STRUCTURES D’ARGUMENTS

161

Dans le second cas, ‘an ’aīhi, « pour son frère », cesse d’être un

argument de ālaba. L’exemple donné en figure 2 correspond donc à la

structure syntaxique 1.

L’établissement d’un schéma de structure d’arguments ne va pas

toujours de soi. Celui-ci dépend en effet du scénario associé à la

représentation du verbe par le lexicographe.10

À la différence des formants

du mot (figure 1), dont la forme est codée par la morphologie de la

langue, et qui se présentent dans un ordre ne souffrant aucune

modification, les arguments associés à un verbe (figure 2) sont

susceptibles de se présenter :

– sous des formes syntaxiques différentes : l’argument 3 ci-dessus, qui est

réalisé comme le syntagme complexe bi-daf‘i l-māli, aurait pu être

constitué de la même préposition suivie d’un simple nom (bi-l-māl,

« l’argent »), d’une complétive (’an yadfa‘a l-māl, « qu’il paie l’argent »)

ou d’un nom suivi d’une proposition relative (bi-l-māli llaī..., « l’argent

que... »), etc. ;

– dans un ordre qui peut connaître des variations : dans la phrase ci-

dessus, l’argument 4 pourrait être placé avant l’argument 2 ou 3, ou

encore, en position finale.11

La comparaison des deux figures permet également de noter que le

vecteur de représentation du mot sera plus spécifique à une langue donnée

que celui des structures d’arguments des verbes, ainsi :

Le schéma d’arguments de la figure 2 peut s’appliquer – en tenant compte de

variations « locales », telles que la structure des compléments, « directs » ou

avec préposition, etc. – aussi bien au verbe français réclamer qu’au verbe arabe

ālaba : l’un et l’autre présupposent un objet correspondant à un dû

(argument 3) et une personne à qui ce dû est réclamé (argument 2) ; tous deux

admettent également la possibilité d’une réclamation effectuée par un tiers,

« pour » ou « de la part » la personne à laquelle l’objet de la réclamation est dû

(argument 4).

La structure d’arguments correspond à un sous-ensemble des P-

spécificateurs d’un verbe (ce dernier étant pris comme formant de

phrase). Elle permet en outre d’associer aux noms et adjectifs susceptibles

10

Cf. par exemple Tesnière (1959/1966 : 102-103, 127-129) ; Mel’uk, Clas et Polguère

(1995 : 119 sqq.). 11

Ces variations sont toutefois soumises à des contraintes : l’ordre des trois premiers

arguments paraît, en arabe moderne, malaisément modifiable. Cela se vérifie

particulièrement à l’écrit, où l’on ne dispose ni du jeu des phénomènes intonatifs, ni de la

liberté d’ordonnancement observable dans les échanges oraux.

J. DICHY 162

d’entrer en composition avec ce verbe, les P-spécificateurs nécessaires.

Ainsi :

Le verbe ālaba, « réclamer » qui illustre la figure 2 a nécessairement pour

arguments 1, 2 et 4, des noms affectés du trait [+HUMAIN], et pour argument 3 :

(a) soit un nom affecté a priori du trait [-HUMAIN] 12

, (b) soit une forme infinitive

(madar), comme dans l’exemple ci-dessus (daf‘, « paiement », « fait de

payer »), (c) soit encore, comme on l’a vu, une subordonnée complétive avec la

conjonction ’an suivie d’un verbe au subjonctif :’an yadfa‘a l-māl, « qu’il paie

l’argent ».

Dans un dictionnaire classique, on dirait que « quelqu’un réclame

à quelqu’un quelque chose » ou « qu’il effectue une action », cette

dernière expression reproduisant, dans un langage intuitivement

accessible, les possibilités (b) et (c). Dans une représentation tout aussi

classique en traits, on peut poser, en première approximation, que

« quelqu’un » est [+ANIMÉ], [+HUMAIN], [+CONCRET], et que « quelque

chose » est :

– soit [-ANIMÉ], [-HUMAIN], [-CONCRET] s’il s’agit d’une chose abstraite

(non perceptible – voir § 2.2.1), par exemple, « la vérité sur... », « son

dû » ;

– soit [-ANIMÉ], [-HUMAIN], [+CONCRET] s’il s’agit d’une chose ou d’un

phénomène perceptible.

2 Trois traits fondamentaux pour l’analyse ou la

génération des schémas d’arguments associés à un

verbe

Comme indiqué en introduction, la démarche que l’on vient de présenter

sera illustrée par les trois notions, correspondant à des traits sémantico-

syntaxiques très généraux, de [±CONCRET], [±ANIMÉ] et [±HUMAIN]. Ces

derniers, on vient de le voir, jouent un rôle fondamental dans la relation

entre verbes et noms au sein de la phrase. Bien qu’il s’agisse de notions

fort connues, leur définition va beaucoup moins de soi qu’il n’y paraît à

première vue : « l’évidence » est ici celle de la saisie du monde reflétée

par le langage, mais à laquelle on est aisément tenté de substituer ses

propres conceptions ontologiques intuitives.13

Je m’attacherai dans la suite

12

Trait HUMAIN : je simplifie, à ce stade de l’exposé. Comme on le verra plus loin, il

s’agit en fait du trait de PERSONNE, qui correspond à l’articulation <<[+ANIMÉ],

[+HUMAIN]>, [+CONCRET]>. 13

Lyons (1978/90 : 77 sqq.) souligne le fait que des catégories lexico-sémantiques telles

que « celles des personnes, des choses, des actions (y compris les événements et les

SPECIFICATEURS ET STRUCTURES D’ARGUMENTS

163

de ce travail à éviter cet écueil, et à explorer la manière dont l’articulation

de ces traits produit, en arabe et en français, des catégories sémantico-

syntaxiques pouvant éclairer le fonctionnement des structures

d’arguments des verbes, et conduire à un jeu de spécificateurs associables

aux entrées verbales, nominales et adjectivales d’une base de

connaissances lexicales dans l’une et l’autre langue.

2. 1 Définition « classique » des traits considérés

Reprenons, pour commencer, la définition « classique » des traits

[±CONCRET], [±ANIMÉ] et [±HUMAIN]. Leur articulation sera plus loin

l’objet d’une représentation arborescente (figure 3) dont les « feuilles

terminales » pourront, après discussion, être retenues comme des

spécificateurs associés aux noms et aux verbes, afin de « gérer » les

contraintes de sélection d’arguments.

2. 1. 1 [±CONCRET]

[CONCRET] a pour antonyme [ABSTRAIT] : les noms concrets dénotent

traditionnellement des entités du monde physique en ce qu’ils sont

opposés aux noms abstraits, qui dénotent des entités du monde des idées

(voir Dubois et al., 2001 : 108-9). La distinction recoupe celle, fort

ancienne, entre le monde sensible – i.e. accessible à la perception – et le

monde des idées. Le trait définitoire de perceptibilité, quel que soit le sens

sollicité (vue, ouïe, toucher...), opère en outre comme un test. Ainsi, en se

reportant à la figure 3 ci-dessous :

1. les catégories de PERSONNE, ANIMAL et CHOSE OU PHÉNOMÈNE

PERCEPTIBLE engendrées par l’arbre conceptuel sont toutes les

trois affectées du trait [+CONCRET] ;

2. la catégorie de CHOSE OU PHÉNOMÈNE PERCEPTIBLE inclut des

objets naturels (colline, tall) et des artefacts (chaise, kursiyy),

ainsi que des phénomènes perçus visuellement (lumière, nūr ;

couleur, lawn), auditivement (son, awt ; musique, mūsīqā ;

parole, kalām), olfactivement (odeur, rā’iā), de manière

gustative (goût, awq) ou tactile (tendreté, raāwa ; dureté,

alāba [marbre, acier...]; douceur, nu‘ūma [peau, cuir...] ;

toucher [sensation], lamsa, etc.) ;

processus)... présupposent un certain nombre d’hypothèses ontologiques minimales sur

ce qui existe dans le monde. Les nôtres (que nous tenons pour minimales et généralement

admises) sont celles du réalisme naïf. »

J. DICHY 164

3. la catégorie IDÉE, EXPÉRIENCE NON PHYSIQUE, par contraste,

correspond à des entités non perceptibles (trait [-CONCRET]) ;

4. des verbes de perception, comme voir, toucher, entendre..., ont

pour complément d’objet des noms de la catégorie CHOSE OU

PHÉNOMÈNE PERCEPTIBLE – étant entendu que cette dernière ne

suffit pas à restreindre la sélection, et que des traits propres à

celui des cinq sens qui est en jeu dans un verbe de perception

donné devront être ajoutées.14

2. 1. 2 [±ANIMÉ]

Les noms animés dénotent traditionnellement des êtres vivants relevant du

monde animal, par exemple chat, bœuf, homme, enfant, ou qui sont

considérés comme des êtres vivants, par exemple dragon, ange, déesse,

démon, nymphe, fantôme, djinn... (cf. Dubois et al., 2001 : 36). Ces êtres,

qui relèvent des catégories de PERSONNE et d’ANIMAL engendrées par

l’arbre de la figure 3, sont doués de mouvement motu proprio (i.e. de la

capacité de se mouvoir de soi-même, en propre), ce qui implique pour les

entités relevant de la catégorie ANIMAL une certaine liberté de

déplacement dans l’espace, ainsi qu’un certain degré de volition, i.e., de

capacité à agir selon une volonté propre.15

Ces traits seront désignés ci-

dessous par les conventions [+MVT], et [+« VOL »], avec des guillemets,

pour le second, afin de distinguer la volition de l’animal, qui n’est pas

associée à une intentionnalité, de la volition humaine. Exemples

d’arguments verbaux affectés de ce trait :

des verbes de mouvement tels que marcher, courir, entrer, sortir, etc. ont pour

agent un nom [+ANIMÉ]. Il en va de même de verbes comme manger, boire,

dormir.

2. 1. 3 [±HUMAIN]

Le trait [+HUMAIN], qui relève de la catégorie [+ANIMÉ], affecte des

« noms dénotant des êtres vivants humains ou considérés comme tels, et

14

Cette définition n’intègre pas la restriction du trait [+CONCRET] à des noms « référant à

quelque chose que l’on peut toucher ou voir » (a noun which refers to something which

we can touch or see – Sinclair, 1990 : XIX). La précision consistant, pour les noms

abstraits ([-CONCRET]), à ajouter à la notion d’IDÉE celle d’EXPÉRIENCE NON PHYSIQUE

est en revanche reprise du même ouvrage (XVIII). 15

Ce critère – la liberté de déplacement dans l’espace – conduit le penseur irakien du

VIIIe/III

e siècle, al-Jāi, à poser que les animaux sont supérieurs aux astres, les premiers

disposant d’un choix dans leurs mouvements, alors que la course des seconds dans le

firmament est contrainte (ayawān, vol. I, p. 204).

SPECIFICATEURS ET STRUCTURES D’ARGUMENTS

165

qui se caractérisent par une syntaxe différente des noms animés non

humains » (Dubois et al., 2001 : 235). Ces êtres, qui correspondent à la

catégorie de PERSONNE, sont doués d’intentionnalité et de volition, notés

respectivement [+INT] et [+VOL]. La grammaire arabe médiévale désigne

cette notion du terme de ‘āqil, mot-à-mot « doué de raison », terme qui,

dans le domaine voisin du droit musulman, renvoie également à

l’intentionnalité et à la volition (ainsi, un testament n’est valide que s’il

émane d’une personne « douée de raison »).

On notera par ailleurs que la combinaison de traits [-ANIMÉ],

[+HUMAIN], [+CONCRET] (« feuille terminale » 5 de la figure 3) ne

concorde, en arabe ou en français, avec aucune catégorie ou sous-

catégorie lexicale à laquelle pourraient être associées des contraintes de

sélection (ce qui est noté par le symbole ø).

Le corps d’Alexandre défunt correspond, soit à une présence résiduelle

(catégorie de PERSONNE), soit à un corps sans vie (catégorie de CHOSE

PERCEPTIBLE) : la phrase célèbre, prononcée, rapporte-t-on, devant sa dépouille,

« Mort, il est [encore] plus grand que vivant », réfère, soit à Alexandre comme

« personne » (l’homme, le personnage historique...), soit à la « chose » de son

cadavre étendu.

La combinaison [-ANIMÉ], [+HUMAIN], [-CONCRET] (figure 3,

« feuille terminale » 6) est affectée de même du symbole ø : l’âme d’un

défunt est traitée, dans les langues française et arabe – à tout le moins –,

soit comme une PERSONNE, soit comme une IDÉE. Exemples de structures

recourant au trait [±HUMAIN] et à la catégorie de PERSONNE :

- Les verbes de sentiment, de parole, de pensée, requièrent – hors construction

impersonnelle ou médio-passive – un agent ou un sujet grammatical relevant de

la catégorie de PERSONNE (incluant le trait [+HUMAIN]).

- En français, qui, dans, par exemple, Qui vois-tu ? porte le trait [+HUMAIN], par

opposition à que, ex. : Que vois-tu ?16

- En arabe, les pronoms de la 3e personne du masculin pluriel sont réservés à des

référents portant le trait de PERSONNE (incluant [+HUMAIN]). COMME on le sait,

la 1e et la 2

e personne des pronoms ou de la conjugaison dénotent également des

personnes (sauf usage rhétorique particulier).

16

La portée du trait [±HUMAIN] n’est pas toujours apparente, sans doute en raison du fait

qu’il est « commandé » par [±ANIMÉ]. Dubois et al. (2001 : 36), auxquels la définition ci-

dessus est empruntée, présentent cependant les interrogatifs qui et que comme illustrant

une opposition animé/non animé. Or, si l’on cherche à répondre aux questions prises

comme exemples, on constate que c’est bien le trait [±HUMAIN] qui permet d’opérer la

distinction entre ces deux interrogatifs : dans – Qui vois-tu ? – Pierre et – Que vois-tu ? –

Un gros chien, le trait [+ANIMÉ] est commun à Pierre et au chien, mais non le trait

[+HUMAIN].

J. DICHY 166

2. 2 L’arbre conceptuel des ces trois notions, prises au sens

restreint

Ces définitions posées, le premier problème à résoudre est celui de

l’articulation des traits correspondants. À la surprise de certains linguistes,

le trait [±HUMAIN] est bien plus prégnant en arabe que celui de [±ANIMÉ].

Le premier apparaît dans de nombreux chapitres des livres de grammaire,

et dans beaucoup d’analyses linguistiques ou lexicographiques. On peut

donc très légitimement se demander si le trait [±HUMAIN] n’est pas plus

important que [±ANIMÉ] dans l’analyse de certaines langues. Il reste que,

dans l’ontologie qui émane sur ce point des vocabulaires arabe et français,

tout humain est considéré comme animé, tout animé n’étant pas

nécessairement humain. [±ANIMÉ] « commande » donc dans une

représentation arborescente construite pour ces deux langues le trait

[±HUMAIN].

On peut se demander par ailleurs lequel, des termes de concret ou

d’abstrait doit être retenu pour la désignation du trait. Ces deux notions

étant définies ci-dessus comme antonymes, la décision n’en met pas en

jeu le contenu sémantique. Toutefois, le critère de perceptibilité ou de non

perceptibilité ayant été adopté à la fois comme trait définitoire et comme

test empirique d’application à des entités données, [±CONCRET] apparaît

comme plus transparent que [±ABSTRAIT].

Il demeure à savoir lequel, de [±ANIMÉ] ou de [±CONCRET] est le

plus général, et devrait en conséquent occuper la position de sommet dans

l’arbre conceptuel.17

Ces deux traits ont en commun d’opérer chacun une

partition de l’ensemble des entités dénotées dans les langues par des

noms. À première vue, on pourrait raisonner en observant que les entités

animées sont perceptibles : le trait [±ANIMÉ] serait dès lors une sous-

catégorie de [±CONCRET]. Il n’y a toutefois a priori aucune raison

linguistique de privilégier le choix de l’un ou de l’autre comme sommet

de l’arbre : la comparaison du résultat de ces deux options montre, en tout

état de cause, que les catégories lexicales dégagées au niveau des

« feuilles terminales » de l’arbre sont les mêmes. La question n’est donc

pas cruciale, comme le montrent les figures 3 et 4 ci-dessous :

17

Dans une ontologie de type aristotélicien privilégiant le trait le plus général lorsque

l’on passe de la substance à la forme, le choix se porterait automatiquement sur

[±CONCRET]. Le raisonnement ci-dessus, indépendamment du résultat auquel il parvient,

relève d’une démarche différente.

SPECIFICATEURS ET STRUCTURES D’ARGUMENTS

167

ANIMÉ + —

HUMAIN + — + —

CONCRET + — + — + — + —

1 2 3 4 5 6 7 8

CATÉGORIES LEXICALES ENGENDRÉES PAR LES TRAITS STRICTO SENSU

PERSONNE

[+INT],

[+VOL],

[+MVT]

ø ANIMAL

[+«VOL»]

[+MVT]

ø ø ø CHOSE OU

PHÉNOMÈNE

PERCEPTIBLE

IDÉE OU

EXPÉRIENCE

NON

PHYSIQUE

E x e m p l e s e n l a n g u e f r a n ç a i s e

Marie,

Paul

ange,

fantôme,

déesse,

djinn

ø chien ø ø ø chaise, colline

lumière, goût,

son, parole,

odeur

toucher

existence,

intelligence,

structure,

vérité,

mensonge

apprentissage

oubli

E x e m p l e s e n l a n g u e a r a b e

Hind, Zayd

malāk,

šaba,

’ilāha,

jinniyy

ø kalb ø ø ø kursiyy, tall

nr, awq,

awt, kalām,

rā’ia

lamsa

wujūd,

akā’, binya,

aqīqa, kaib,

ta‘allum,

nisyān

Figure 3 : Arbre conceptuel « restreint » des trois notions et des catégories

engendrées, avec [±ANIMÉ] au sommet

Les exemples inclus dans la partie inférieure de cette figure correspondent

pour la plupart à ceux qui ont été présentés pour la définition des traits.

Les P-spécificateurs pourront correspondre, après analyse, soit aux

catégories lexicales engendrées au niveau des « feuilles terminales », soit

aux grandes sous-catégories d’exemples (marquées ci-dessus par un

« »). Pour faire court, les exemples ont été omis dans l’arbre suivant,

construit avec, au sommet, le trait [±CONCRET] :

J. DICHY 168

CONCRET + —

ANIMÉ + — + —

HUMAIN + — + — + — + —

1 2 3 4 5 6 7 8

CATÉGORIES LEXICALES ENGENDRÉES PAR LES TRAITS STRICTO SENSU

PERSONNE

[+INT],

[+VOL],

[+MVT]

ANIMAL

[+«VOL»]

[+MVT]

ø CHOSE OU

PHENO-

MENE

ERCEP-

TIBLE

ø ø ø IDÉE OU

EXPÉRIENCE

NON PHYSIQUE

Figure 4 : Arbre conceptuel « restreint » des trois notions et des catégories engendrées,

avec [±CONCRET] au sommet

Formellement, si l’on représente les catégories lexicales

correspondant à des « feuilles terminales » au moyen de parenthèses ou de

crochets, on obtient deux résultats identiques. En prenant la même

catégorie pour exemple, on a dans la figure 3 :

ANIMAL <<[+ANIMÉ], [+HUMAIN]>, [+CONCRET]> ,

et dans la figure 4 :

ANIMAL <[+CONCRET], <[+ANIMÉ], [+HUMAIN]>>.

Les catégories engendrées étant en outre les mêmes, on constate donc, à

condition de faire abstraction du « réalisme naïf » de nos « hypothèses

ontologiques minimales sur ce qui existe dans le monde » (Lyons,

1978/90 : 77), que les deux arbres sont conceptuellement équivalents.

Toutefois, arbitrairement, c’est la figure 4 qui sera reprise pour la

présentation de l’arbre « étendu » ci-dessous.

Si l’on considère maintenant les catégories engendrées, le résultat

est attendu : PERSONNE, ANIMAL, CHOSE et IDÉE se déduisent aisément des

traits [+ANIMÉ] et [±HUMAIN] pour les deux premiers, et de [-ANIMÉ] et

[±CONCRET] pour les seconds. Les arbres équivalents ci-dessus (figure 3

ou 4) laissent cependant de côté un nombre important de phénomènes de

sélection qu’il devrait être possible de prendre en compte dans l’inventaire

des relations lexique-grammaire à l’œuvre dans la structure d’arguments

des verbes.

Ainsi, des exemples tels que ālaba, « réclamer » analysé ci-dessus, rafaa,

« refuser », tasā’ala, « s’interroger », ’i‘tabara, « considérer... », etc., peuvent

avoir très régulièrement pour agent non seulement des entités relevant de la

catégorie de PERSONNE, mais encore ce que l’on pourrait appeler des personnes

SPECIFICATEURS ET STRUCTURES D’ARGUMENTS

169

morales ou des COLLECTIVITÉS, comme « La Société X », « le gouvernement »,

« le jury »...

Ces glissements sémantiques ne peuvent être traités comme de

simples phénomènes rhétoriques. Ils ne peuvent non plus être considérés

comme relevant des traits [+HUMAIN] et [+ANIMÉ] sans altérer la

définition de ces derniers.

2. 3 Les données que le premier arbre conceptuel ne peut

traiter

Considérons les exemples suivants (arguments 1 en caractères gras) :

1) Bad’ati l-wada l-’urubbiyya tanuru munu sana ’aw sanatayn fī ’inšā’i

quwwa ‘askariyya. L’UE a commencé depuis un an ou deux à envisager la

création d’une force militaire.

2) Kānati s-sayyāra l-lāiqa binā tuāwilu ’an tujāwizana. La voiture qui nous

suivait essayait de nous doubler.

3) Lā yazālu āsūbu l-marif ya‘malu ‘alā talīli l-mu‘āyāi l-jadīda.

L’ordinateur de la banque travaille toujours (ou encore) à l’analyse des

nouvelles données.

4) ’Ijtāati n-nāru l-āba bi-sur‘atin quswa. Le feu dévasta très rapidement la

forêt.

5) Min al-mutawaqqa‘ ’an yudrika l-’i‘āru l-muttajih nawa jazīrat jamāyikā

šawāi‘ahā masā’a l-ad. Le cyclone qui se dirige vers la Jamaïque devrait

atteindre les rivages de l’île demain soir.

6) Taallaba l-aabu ‘alā taawwufātī. La colère triompha de mes craintes.

7) Kānat ‘awāifī tunājīnī fa-tanaunī bi-’an ’ubādirahā l-adī. Mes

sentiments me conseillaient de lui (fém.) parler le premier. Mot-à-mot : « Mes

sentiments me parlaient en secret et me conseillaient... »

8) Laqad ‘ādat būrat nyū yurk abāa l-yawmi ’ilā l-ittijāhi nawa l-irtifā‘.

La bourse de New York revient ce matin à une orientation à la hausse. Mot-à-

mot : « est revenue ce matin... »

9) Satamīlu al-’azyā’u l-bārisiyya fī r-rabī‘i l-qādim ’ilā l-’alwāni r-raffāfa. La

mode parisienne penchera ce printemps pour des couleurs éclatantes.

10) Wa-lam ja‘ud yušā l-jawma ’an yuhaddida ’influwanzā d-dajaj ufūfa l-

muwāinīna l-miriyyīn. Il n’est plus à craindre aujourd’hui que la grippe

aviaire menace les citoyens égyptiens. Mot-à-mot : « les rangs des citoyens

égyptiens ».

11) Levez-vous vite, orages désirés... (Chateaubriand, René.) ’Ayyatuhā l-

‘awāifu l-mubtaātu ’asri‘ī wa-hubbī... Mot-à-mot de la traduction en arabe :

« Ô-nobles orages désirés, hâtez-vous et soufflez... »

12) Qad yanairuka (yaniruki) l-yawma liqā’un ‘āifiyy. Une rencontre

sentimentale vous attend peut-être aujourd’hui. « Vous » est au masculin ou au

féminin, selon le sexe du lecteur, les deux lectures étant supportées par l’écriture

non vocalisée.

J. DICHY 170

Si l’on se réfère à l’arbre de la figure 3, il est clair que l’on ne peut

rendre compte de tels exemples qu’en postulant un transfert de traits, dû à

des glissements sémantiques inscrits dans le lexique, et que les grandes

figures de la rhétorique permettent de décrire.18

Mais les phénomènes de

glissement sémantique enregistrés par le lexique ne doivent pas être

confondus avec des effets rhétoriques. Les exemples 11 et 12, ajoutés

pour la clarté de l’exposé, contrastent avec les dix autres. Ils relèvent de

processus rhétoriques non lexicalisés :

L’exemple 11 met en jeu la figure de personnification : c’est la construction à

l’impératif qui suppose que l’on s’adresse à un agent doué de volition, et non la

relation entre les traits associés au verbe et à ses arguments, comme dans les

exemples 1 à 10. Il en va de même dans l’exemple 12, emprunté à une rubrique

« horoscope », moins ampoulé, mais plus complexe à analyser. En raison du

double sens du verbe attendre en français comme en arabe moderne (La

directrice/une surprise vous attend ; tanairuka l-mudīra/mufāja’a – cf. anglais

wait for/await), la rencontre sentimentale est à la fois « une surprise » et une

personne : la personnification est ici l’une des deux faces d’une syllepse de sens.

Les autres exemples comportent des changements de catégorie

lexicale qui posent des problèmes à la définition des trois traits

fondamentaux considérés ici. En effet, les verbes naara fī, « examiner »,

« envisager » (ex. 1), ‘amala ‘alā, « travailler à » (ex. 3), ’ittajaha nawa,

« se diriger vers » (ex. 5 et 8), taallaba ‘alā, « triompher de » (ex. 6),

nājā, « parler en secret », naaa, « conseiller » (ex. 7), māla ’ilā,

« pencher pour » (ex. 9), haddada, « menacer » (ex. 10) ont un sens de

base qui suggère a priori un agent humain. Or ce n’est, à strictement

parler, le cas dans aucun de ces exemples. Tajāwaza, « doubler [une

voiture] » (ex. 2) suppose la présence d’un agent humain situé « à

l’intérieur » de celle-ci (symétriquement, à la fin de la phrase, nous

doubler suppose une voiture « englobante »).

2. 3. 1 La catégorie de COLLECTIVITÉ

Le sujet syntaxique du premier verbe de l’exemple 1 ci-dessus comporte

certains éléments définitoires du trait [+HUMAIN], bien qu’il ne réponde

pas entièrement à la description d’une entité humaine : Al-wada l-

’urubbiyya, « l’UE » (ex. 1) correspond à une COLLECTIVITÉ (qui serait

définie, dans un dictionnaire classique, comme « entité politique »), douée

d’intentionnalité [+INT] et de volition [+VOL] – mais non, par exemple,

des caractéristiques physiques et de l’ensemble des traits psychologiques

d’un être humain.

18

Cf. Le Guern (1972), Roman (1999 : 181-192 ; 2001 : 605-671).

SPECIFICATEURS ET STRUCTURES D’ARGUMENTS

171

Les glissements sémantiques lexicalisés de ce type sont

extrêmement fréquents dans la presse. Je prendrai donc un autre exemple,

dans lequel le nom de pays reçoit, parmi plusieurs autres sens possibles,

celui d’entité politique (voir ci-après § 3.1.1) :

13) Laqad ’a‘ādat mir ta’kīda l-tizāmihā bi-l-ifāi ‘alā l-’amni fī l-minaqa.

L’Égypte a réaffirmé son engagement en faveur de la sécurité dans la région.

On observe un héritage partiel des traits de la catégorie de

PERSONNE (qui correspond, dans l’arbre de la figure 3, à <<[+ANIMÉ],

[+HUMAIN]>, [+CONCRET]>) : les traits de volition et d’intentionnalité sont

retenus. Or, en raison de l’altération des traits <[+ANIMÉ], [+HUMAIN]>

dès lors qu’ils se trouvent associés au trait [-CONCRET], la catégorie de

COLLECTIVITÉ ne peut trouver sa place dans le premier arbre conceptuel.19

2. 3. 2 La catégorie de QUASI-ANIMÉ PERCEPTIBLE

L’ordinateur, āsūb (ex. 3), constitue un artefact complexe (§ 3.1.2), sur

lequel on projette, comme pour une voiture, un navire ou un avion, une

volition, projection qui notée conventionnellement par [+« VOL »], entre

guillemets de citation. La voiture (ex. 2) est toutefois un artefact d’un

autre type, doué d’un mouvement traité comme un mouvement propre,

projection qui sera également notée par des guillemets [+« MVT »]. Les

deux noms sont des QUASI-ANIMÉS PERCEPTIBLES, auxquels sont affectés

les traits [+« MVT »] / [+« VOL »], la barre oblique notant le « ou inclusif »

(« et/ou »).

Le feu (au sens d’incendie), nār, et le cyclone, ’i‘ār (ex. 4 et 5),

sont également des QUASI-ANIMÉS PERCEPTIBLES. Ils sont affectés des

traits [+« MVT »] et [+« VOL »], et ne correspondent pas, dans leur

définition, à des artefacts. Ces traits affectent de même les noms foule ou

armée, traités comme « déshumanisés », à la différence d’une équipe,

d’un groupe d’amis ou de l’armée, au sens d’entité politique ou sociale,

qui relèvent des COLLECTIVITÉS. La colère (aab) et les sentiments

(‘awāif – ex. 6 et 7) appartiennent également à la catégorie des QUASI-

ANIMÉS PERCEPTIBLES. Émotions et sentiments ont en effet pour propriété

d’être ressentis par le sujet qui en est le siège, et peuvent de ce fait lui

apparaître comme doués de mouvement (ce qui sera transcrit [+« MVT »],

s’agissant d’une projection), et de volition, notée également [+« VOL »].

Cette catégorie comporte donc un héritage partiel des traits

<<[+ANIMÉ], [-HUMAIN]>, [+CONCRET]>, à cette différence près avec la

19

La notion de COLLECTIVITÉ ne se confond pas avec celle de collectif, cruciale en arabe,

et qui sera envisagée dans un travail ultérieur.

J. DICHY 172

catégorie ANIMAL, qu’il ne s’agit pas d’êtres vivants appartenant au règne

animal, mais d’entités susceptibles d’être assimilées à ces derniers, en

raison d’une projection.

2. 3. 3 La catégorie de QUASI-ANIMÉ NON PERCEPTIBLE

Les exemples 8 (la bourse de New York), 9 (la mode parisienne) et 10 (la

pandémie de la grippe aviaire) portent sur ce que l’on peut appeler des

forces ou des QUASI-ANIMÉS NON PERCEPTIBLES, mais dont les effets

peuvent en contrepartie se faire sentir. Ils correspondent dans « l’arbre

étendu » à une extension de la catégorie <<[+ANIMÉ], [-HUMAIN]>, [-

CONCRET]> (fig. 5). Cette catégorie elle-même (partie supérieure de

l’arbre) ne connaît pas d’exemple : il faudrait imaginer un animal abstrait

– ce qui est virtuellement possible, mais n’a pas de pertinence lexicale

dans les deux langues étudiées (l’entité imaginée entrerait en effet dans la

catégorie des IDÉES OU EXPÉRIENCES NON PERCEPTIBLES).

On observe toutefois la projection sur certaines entités non

perceptibles du trait sémantique [+« MVT »], hérité du trait de base

[+ANIMÉ]. Si les entités de la catégorie ANIMAL sont douées de la capacité

de se mouvoir par elles-mêmes (motu proprio), les QUASI-ANIMÉS NON

PERCEPTIBLES apparaissent, quant à eux, doués de mouvement, mais non

de volition. Il y a donc transfert partiel du trait de mouvement (d’où la

notation [+« MVT »]).

2. 4 L’arbre conceptuel « étendu »

Les exemples 1 à 10 sont repris dans l’arbre « étendu » ci-dessous, dont

ils illustrent les catégories ajoutées à celles de l’arbre « restreint » :

SPECIFICATEURS ET STRUCTURES D’ARGUMENTS

173

CONCRET + —

ANIMÉ + — + —

HUMAIN + — + — + — + —

1 2 3 4 5 6 7 8

CATÉGORIES LEXICALES ENGENDRÉES PAR LES TRAITS STRICTO SENSU

PERSONNE

[+INT],

[+VOL],

[+MVT]

ANIMAL

[+«VOL»],

[+MVT]

ø CHOSE OU

PHÉNOMÈNE

PERCEPTIBLE

ø ø ø IDÉE OU

EXPÉRIENCE NON

PHYSIQUE

E x e m p l e s e n l a n g u e f r a n ç a i s e

• Marie,Paul

• ange,

fantôme,

déesse,

djinn

• chien

ø

• chaise,

colline

• lumière,

goût

son, parole,

odeur

ø ø ø • existence,

intelligence,

vérité

• apprentissage,

oubli

E x e m p l e s e n l a n g u e a r a b e

• Hind, Zayd

• malāk,

šaba,’ilāha

jinniyy

• kalb

ø

• kursiyy, tall

• nr, awq,

awt, kalām,

rā’ia

ø ø ø • wuūd, akā’ binya

aqīqa

• ta‘allum,

nisyān

2’ 5’ 6’

CHANGEMENT DE CATÉGORIE LEXICALE AVEC HÉRITAGE PARTIEL ET TRANSFERT DE TRAITS ø QUASI-ANIMÉ

PERCEPTIBLE

[+«MVT »] /

[+«VOL»]

ø ø COLLEC-

TIVITÉ

[+INT],

[+VOL]

QUASI-ANI-

MÉ NON

PERCEP-

TIBLE

[+«VOL»],

[+«MVT»]

ø ø

E x e m p l e s e n l a n g u e f r a n ç a i s e

ø • voiture, avion

• ordinateur

• feu, cyclone

• foule, armée

• peur, colère

ø

ø • l’UE,

la Syrie,

• l’UNES-

CO

• le jury

• la bourse

de New-

York,

la mode

• épidémie

ø ø

E x e m p l e s e n l a n g u e a r a b e

ø • sayyāra,

ā’ira

• āsūb

• nār, ’i‘ār

• ašd, jayš

• awf, aab

ø

ø • al-wada

l-’ūrub-

biyya

sūriya

• l-yūnīscū

• al-lajna

• būrat

nyū yurk,

al-’azyā’

•al-waba’

ø ø

Figure 5 : Arbre « étendu » des trois notions (au sens large) et des catégories engendrées

J. DICHY 174

3 Catégories lexicales engendrées à partir des trois

traits fondamentaux et schémas d’arguments des

verbes

Il va de soi que d’autres contraintes de sélection et de sous-catégorisation

existent. Sinclair (1991 : 81-91), par exemple, présente les relations

lexique-grammaire à partir de syntagmes nominaux en anglais. La

démarche développée dans ce travail s’inscrit pour bonne part dans le

paradigme de la compositionnalité du sens, illustré par Wierzbicka20

,

auquel on peut également rattacher Mel’uk et le Dictionnaire explicatif

et combinatoire du français. Elle permet, dans le cadre théorique esquissé

ici, de montrer, en écho à la question posée en introduction, comment

l’arbre conceptuel « étendu » des trois notions [±CONCRET], [±ANIMÉ] et

[±HUMAIN] ajoute de nouvelles catégories qui reflètent – dans le domaine

délimité par ces traits fondamentaux – l’ontologie qui se dégage du

lexique du français et de l’arabe. Cette extension débouche sur la

proposition d’un jeu de P-spécificateurs qui sont à la fois :

1. en inventaire fini, correspondant aux « feuilles terminales » des

arbres conceptuels « restreint » et « étendu »), et

2. exhaustifs, l’ontologie ainsi définie recouvrant l’ensemble des

« possibles linguistiques » à ce niveau d’analyse.

Considérons, pour expliciter ces deux points, la manière dont les

catégories de l’arbre « étendu » permettent à la fois de préciser les

analyses lexicales (définitions et relations syntactico-sémantiques

associées), et de soumettre les P-spécificateurs à la contrainte formelle de

la finitude des inventaires (§ 3.1). L’interprétation générale qui peut être

donnée aux phénomènes lexico-sémantiques observés et à l’extension des

traits et des catégories sera présentée en conclusion (§ 3.2).

3. 1 Les spécificateurs de sélection des arguments associés

aux verbes

Pris au sens strict, les traits [±CONCRET], [±ANIMÉ] et [±HUMAIN]

n’engendrent que les catégories de PERSONNE, d’ANIMAL, de CHOSE OU

PHÉNOMÈNE PERCEPTIBLE et d’IDÉE OU EXPÉRIENCE NON PHYSIQUE. Quatre

20

Voir dans Béjoint (2000 : 7.1.1.2) une critique de l’approche, basée sur la collocation,

de J. Sinclair, et, en conclusion, une réflexion sur l’usage que peut faire le lexicographe

de la compositionnalité du sens (cf. également la démarche « relationnelle » en

terminologie présentée dans Béjoint et Thoiron, 1997).

SPECIFICATEURS ET STRUCTURES D’ARGUMENTS

175

des huit « feuilles terminales » de l’arbre construit à partir de ces traits

demeurent sans instanciation correspondant à une catégorie lexico-

sémantique pertinente. Dans l’arbre « étendu », trois catégories viennent

s’ajouter aux quatre premières :

1. la catégorie des QUASI-ANIMÉS PERCEPTIBLES prolonge celle

d’ANIMAL.

2. les catégories de COLLECTIVITÉ et de QUASI-ANIMÉ NON

PERCEPTIBLE actualisent, pour leur part, des « feuilles

terminales » non instanciées de l’arbre contextuel « restreint ».

A chacune des sept catégories obtenues correspondent des P-

spécificateurs qui s’associent aux unités du lexique, en tant que traits

inhérents pour les noms, et de traits de sélection pour les verbes. Ces

spécificateurs permettent de « gérer » les relations lexique-grammaire

entre le verbe et ses arguments, en cohérence avec d’autres traits

purement syntaxiques (intransitivité, transitivité « directe » ou avec

complément prépositionnel, structures syntaxiques des compléments

correspondant à des subordonnées complétives, etc.). Mais ils offrent,

complémentairement, la possibilité de préciser le sens lexical des noms.

Comment dès lors limiter l’inventaire des sous-catégories, correspondant

dans l’arbre « étendu » aux exemples-types précédés d’un « », et dont le

développement paraît devoir se ramifier à l’infini ? Deux exemples

illustreront la démarche qui consiste à enrichir les définitions

lexicographiques en les affinant, et en même temps, à soumettre les

inventaires de P-spécificateurs à la contrainte formelle de finitude.

3. 1. 1 Les noms de pays ou de groupe de pays

Le premier exemple porte sur un domaine d’application de la catégorie de

COLLECTIVITÉ (cf. ex. 1 et 13 ci-dessus) :

Les noms de pays (Syrie, Égypte, France, Allemagne) ou de groupe de pays

(Maghreb, Europe), peuvent notamment désigner, selon le cas :

(1) une entité géographique, ex. : la carte du Maghreb, de l’Allemagne, ou la

population de l’Égypte ;

(2) une population (peuple ou ensemble de peuples) associée à un territoire, ex. :

La France a voté en masse, ou l’Amérique (au sens des États-Unis) fête son

indépendance le 4 juillet ;

(3) une entité politique correspondant à une nation, un peuple, un territoire, un

État, une union d’États, etc.,21

ex. : l’Afrique du Sud, la Grande-Bretagne, mais

21

Cette valeur sémantique mériterait, d’un point de vue lexicographique, d’être affinée et

subdivisée (voir ma contribution à l’étude de ce champ sémantique dans plusieurs

dictionnaires arabes – 2001b). Mais une telle analyse s’écarterait de notre propos.

J. DICHY 176

également l’Union du Maghreb arabe ou l’Afrique, au sens de l’Organisation

de l’Unité africaine ;

(4) une idée politique ou une institution politique en projet, ex. : l’Europe, au

sens de « l’Europe en construction », le Monde arabe, au sens de « l’unité

arabe » ;

(5) une entité historique, exemples récents : l’Empire ottoman, l’Autriche-

Hongrie, la Yougoslavie, l’Union soviétique ; exemples anciens : l’Empire

romain, Akkad, Carthage... Selon le cas, et en fonction de la période considérée,

les entités historiques peuvent correspondre à un ou plusieurs des sens (1) à (4),

et être dénotées par un simple nom de pays.

L’ensemble de ces valeurs sémantiques n’est bien entendu pas nécessairement

réuni pour chaque nom de pays ou de groupe de pays : le Kurdistan correspond,

à la date d’aujourd’hui, soit à (1), soit à (4), mais non par exemple à (3) : Israël

peut prendre, selon le sens sélectionné (en fonction du contexte, de l’époque

historique, etc.) chacune des cinq valeurs ci-dessus ; il en va de même pour la

Palestine.

Le spécificateur de COLLECTIVITÉ ne s’applique, bien évidemment,

qu’à un sous-ensemble des noms de pays ou de groupe de pays : ceux-ci

doivent, pour relever de cette catégorie, correspondre à l’une au moins des

valeurs (2) ou (3) ci-dessus, qui lui confèrent la possibilité d’acquérir en

contexte les traits d’intentionnalité et de volition. La valeur sémantique

(4) relève des IDÉES OU EXPÉRIENCES NON PHYSIQUES. Les sept catégories

engendrées par l’arbre « étendu » de la figure 5 aident ainsi à clarifier les

définitions lexicographiques, sans que l’on se trouve contrait d’ajouter de

nouveaux spécificateurs.

3. 1. 2 Les artefacts

Le deuxième exemple concerne une sous-catégorie de noms relevant des

QUASI-ANIMÉS PERCEPTIBLES, les artefacts. Du point de vue des

collocations, les artefacts présentent une propriété lexicale remarquable :

leur caractère téléologique les conduit à sélectionner, parmi les verbes

dont ils peuvent être l’argument 1, ceux qui correspondent à la fonction

qu’ils ont été construits ou réalisés pour remplir :

14) La voiture démarra, ’intalaqati s-sayyāra.

15) Le poème de Baudelaire nous parle de... Tuaddiunā qaīdatu būdlīr ‘an...

16) Yataarraqu fīlm yūsuf šāhīn ‘ilā mawādī‘ falsafiyya wa-tārīiyya fī ’ānin

ma‘an. Le film de Youssef Chahine traite de sujets à la fois philosophiques et

historiques.

17) Les données confirment que..., tu’akkidu l-mu‘ayāt ’anna...

Les exemples abondent, encore qu’ils ne soient pas toujours de

structure aussi parallèle dans les deux langues que ceux qui viennent

d’être cités – il s’en faut de beaucoup. De tels énoncés sont souvent traités

comme relevant de figures de rhétorique (14 est très fréquemment cité à

SPECIFICATEURS ET STRUCTURES D’ARGUMENTS

177

cet effet). Or cette description n’en reflète que très partiellement la

structure. Ainsi, l’emploi de nous dans La voiture qui nous suivait (ex. 2)

se laisse étiqueter sans grande difficulté comme synecdoque, mais cette

étiquette n’explique pas le caractère extrêmement récurrent de la figure

avec ce nom. La sous-catégorie lexicale d’artefact permet d’aller

nettement plus loin dans l’explication en observant que voiture a pour

fonction de transporter des personnes « à l’intérieur ». De même, dans 15

et 16, les produits de l’expression artistique sont traités comme « faits

pour » traiter des sujets, ou pour parler au lecteur ou au spectateur : il

s’agit dans ce cas d’une téléologie projetée sur le travail de l’artiste.

L’exemple 17, enfin, permet de voir que l’artefact peut être un résultat

que l’on peut lire ou entendre, et non plus seulement un objet ou un outil.

Dans tous les exemples de ce type, le verbe sélectionné décrit la fonction

téléologique de l’artefact : les voitures démarrent ou s’arrêtent, les

marteau-piqueurs défoncent les chaussées, les ordinateurs calculent ou

communiquent, les horloges indiquent l’heure, les stylos écrivent, ou

refusent d’écrire... Il s’agit bien d’une propriété lexicale, et non d’un

usage rhétorique. Or une telle propriété ne peut pas être décrite par des

spécificateurs d’inventaire limité : les objets valeurs et les artefacts qui

nous entourent ont tous des fonctions différentes (comme le groom ou la

clé de Berlin, décrits par Bruno Latour). La difficulté de traduire de

nombreux exemples d’une langue dans l’autre indique en outre qu’il s’agit

bien de collocations linguistiques et non de relations exclusivement

métonymiques. Nous sommes donc ici clairement dans le domaine des

définitions lexicographiques et des collocations, et non des spécificateurs.

On notera en revanche que les verbes associés aux artefacts sont affectés

d’un même P-spécificateur : nous avons vu qu’ils relevaient de

l’inventaire des verbes qui admettent un 1er

argument QUASI-ANIMÉ

PERCEPTIBLE.

Mais le principal intérêt des artefacts, pour notre propos, réside

dans une précision apportée à la définition du P-spécificateur des QUASI-

ANIMÉS PERCEPTIBLES : cette notion permet d’expliquer le fait que les

entités appartenant à cette catégorie peuvent être traités comme s’il étaient

doués de mouvement et/ou d’une volition (dépourvue d’intentionnalité),

ce qui a été noté ci-dessus comme [+« MVT »] / [+« VOL »], exemples :

L’ordinateur (ex. 3) est traité comme doué d’une volition, mais non de

mouvement ([+« VOL »]), [-« MVT »]), alors que la voiture (ex. 2) est considérée

comme douée de l’un et de l’autre ([+« VOL »]), [+« MVT »]). Le poème de

Baudelaire (15), le film de Youssef Chahine (16) et les données (17),

apparaissent, comme l’ordinateur, dénués de mouvement. Or seule la voiture est

un artefact « fait pour » entrer en mouvement, les autres entités n’incluant pas ce

dernier trait dans leurs fonctions.

J. DICHY 178

Comme pour les noms de pays ou de groupes de pays, l’analyse de

la sous-catégorie des artefacts permet à la fois de préciser la définition du

P-spécificateur catégoriel correspondant et d’éclairer le travail

lexicographique, en montrant la différence entre ces deux tâches, qui

passe par le « rasoir d’Occam» de la contrainte formelle de finitude des

inventaires.

3. 2 Le domaine sémantique des catégories engendrées par

l’arbre conceptuel « étendu »

Comment, enfin, s’interprète le développement allant de l’ontologie

« restreinte » du premier arbre conceptuel à celle « étendue », du second ?

Une première catégorie apparaissant dans l’arbre « étendu »

correspond à l’association du trait [-CONCRET] avec la combinaison

<[+ANIMÉ], [+HUMAIN]> : la catégorie de COLLECTIVITÉ ne conserve,

parmi les traits affectant les noms de PERSONNE, que l’intentionnalité et la

volition.

Les deux autres catégories d’extension de l’arbre conceptuel

dérivent, différemment, des traits <[+ANIMÉ], [-HUMAIN]> : ce sont les

QUASI-ANIMÉS PERCEPTIBLES (de trait [+CONCRET]), et NON PERCEPTIBLES

(de trait [-CONCRET]). Aux noms qui les dénotent se trouvent ajoutés des

traits empruntés à la catégorie ANIMAL, mais avec un transfert dont la

nature est métaphorique : le mouvement demeure présent dans les

catégories de QUASI-ANIMÉS engendrées par l’arbre « étendu », mais le

nom inclus dans ces dernières ne désigne plus – à la différence de

l’ANIMAL – qu’une entité dépourvue de capacité de mouvement propre

([+« MVT »]). De même que chez l’ANIMAL, en revanche, le mouvement

est corrélé à une forme de volition ([+« VOL »]) dépourvue

d’intentionnalité.

Ainsi, si la catégorie de COLLECTIVITÉ inclut une réduction des

traits associés aux PERSONNES, celles des QUASI ANIMÉS PERCEPTIBLES et

NON PERCEPTIBLES procédent de la catégorie ANIMAL, dont les traits sont

empruntés, partiellement transférés et étendus. Le domaine sémantique

dans lequel se produit l’extension sémantique de l’arbre conceptuel des

notions de [±CONCRET], [±ANIMÉ] et [±HUMAIN] n’est donc pas celui de la

personnification, comme on s’y serait de prime abord attendu, compte

tenu notamment de la prégnance en arabe du trait [±HUMAIN], mais celui

de l’animéité. Dans les deux langues considérées, l’arabe et le français,

d’importants transferts lexico-sémantiques s’opèrent en attribuant aux

choses ou aux phénomènes une forme de volition et un mouvement

empruntés à l’ANIMAL. Le langage nous propose ainsi une ontologie

SPECIFICATEURS ET STRUCTURES D’ARGUMENTS

179

archaïque, moins sèche et plus vivante que celle que nous aurions

spontanément imaginée.

Références Abbès, R. (2004), La Conception et la réalisation d’un concordancier électronique pour

l’arabe. Thèse de doctorat en sciences de l’information, Lyon, ENSSIB/INSA.

Abbès, R, Dichy, J. et Hassoun, M. (2004), The architecture of a Standard Arabic lexical

database: some figures, ratios and categories from the DIINAR.1 source program,

in Proceedings of the Workshop on Computational Approaches to Arabic Script-

based Languages – COLING 2004, p. 15-22.

Beesley, K. et Karttunen, L. (2003), Finite State Morphology, Stanford (California),

CSLI Publications.

Béjoint, H. (2000), Modern Lexicography: An Introduction, Oxford University Press (1e

éd., 1994).

Béjoint, H. et Thoiron, Ph. (1997), Modèle relationnel, définition et dénomination, in

C. Boisson et Ph. Thoiron (dirs), Autour de la dénomination, Presses Universitaires

de Lyon, p. 187-204.

Braham, A. et Ghazali, S. (1998), Qā‘idatu l-bayānāt al-mu‘jamiyya al-‘arabiyya, ’aw

mašrū‘ Mu‘jam al-‘Arabiyya l-’āliyy, “Ma‘ālī-DIINAR”, aīla wa-’āfāq, Al-

Majalla l-’Arabiyya li-l-’ulūm, n° 32, déc. 1998, p. 14-23.

Chomsky, N. (1972), Studies on Semantics in Generative Grammar, La Haye, Mouton ;

trad. fr. Questions de sémantique, Paris, Le Seuil, 1975.

Desclés, J.-P. (1989), State, event, process and typology, General Linguistics, 29, 3,

p. 159-200.

Desclés, J.-P. (1997), Système d’exploration contextuelle, in Guimier, Cl. (dir.), Co-texte

et calcul du sens, Presses universitaires de Caen, p. 251-232.

Desclés, J.-P. (dir.) (1983), [H. Abaab, J.-P. Desclés, J. Dichy, D.E. Kouloughli, M.S.

Ziadah], Conception d’un synthétiseur et d’un analyseur morphologiques de

l’arabe, en vue d’une utilisation en Enseignement assisté par Ordinateur, Rapport

rédigé à la demande du Ministère des Affaires étrangères.

Desclés, J.-P., Maire-Reppert, D., Oh, H.-G. et Berri, J. (1994), Traitement automatique

des langues (TAL), 35, 1, p. 83-105.

Dichy, J. (1984), Vers un modèle d’analyse automatique du mot graphique non-vocalisé

en arabe, in Dichy et Hassoun (dirs), 1989, p. 92-158.

Dichy, J. (1987), The SAMIA Research Program, Year Four, Progress and Prospects,

Processing Arabic Report 2, T.C.M.O., Nijmegen University, p. 1-26.

Dichy, J. (1990), L’Écriture dans la représentation de la langue : la lettre et le mot en

arabe. Thèse d’État, Université Lumière-Lyon 2.

Dichy, J. (1997), Pour une lexicomatique de l’arabe : l’unité lexicale simple et

l’inventaire fini des spécificateurs du domaine du mot, Meta 42, p. 291-306.

Dichy, J. (2000), Morphosyntactic Specifiers to be associated to Arabic Lexical Entries –

Methodological and Theoretical Aspects, Proceedings of ACIDA’ 2000 (Monastir,

Tunisia, 22-24 March 2000), Corpora and Natural Language Processing volume,

p. 55-60.

Dichy, J. (2001a), Une première classification des verbes arabes en fonction de leurs

traits morphosyntaxiques, dans A. Fassi-Fehri (dir.), Actes du colloque

international Génération, Systématique de la langue et Traduction automatique

J. DICHY 180

(Rabat, 15-17 novembre 1999), n° spécial de Recherches Linguistiques, Rabat :

IERA, mai 2001, 2 tomes. Vol. 2, p. 39-70.

Dichy, J. (2001b), La néologie stratifiée de l’arabe, fidélité contradictoire du lexique à sa

mémoire, à partir du champ sémantique peuple-patrie-nation, in L’Arabisant,

35, numéro spécial en l'honneur d’André Miquel, Paris, Association française

des Arabisants (AFDA), p. 30-41.

Dichy, J., Braham, A., Ghazali, S. et Hassoun, M. (2002), La base de connaissances

linguistiques DIINAR.1 (DIctionnaire INformatisé de l’Arabe, version 1), in A.

Braham, éd., Colloque international sur le traitement automatique de l’arabe –

Proceedings of the International Symposium on The Processing of Arabic (Avril

18-20, 2002). Université de la Manouba, Tunis.

Dichy, J. et Hassoun, M. (dirs) (1989), Simulation de modèles linguistiques et

Enseignement Assisté par Ordinateur de l’arabe - Travaux SAMIA I, Paris,

Conseil International de la Langue Française.

Dichy, J. et Hassoun, M. (1998), Some aspects of the DIINAR-MBC research

programme, in A. Ubaydly, ed., Proceedings of the 6th International

Conference and Exhibition on Multilingual Computing (ICEMCO 98), Centre of

Middle Eastern Studies, University of Cambridge, p. 2.8.1-6.

Dubois, J., Giacomo, M., Guespin, L., Marcellesi, C., Marcellesi, J.-P. et Mével J.-P.

(2001), Dictionnaire de linguistique, Paris, Larousse (1e éd. 1994).

Ezzahid, S. (1996), Méthodologie d’élaboration d’une base de données lexicales de

l’arabe (vocabulaire général) d’après la théorie Sens-Texte d’Igor Mel’uk.

Thèse de doctorat, Université Lyon 2.

Fassi-Fehri, A. (1986), Al-mu‘jam al-‘arabī, Casablanca, éditions Tubqâl.

Fassi-Fehri, A. (1993), Issues in the Structure of Arabic Clauses and Words, Dortrecht

(Pays-Bas), Kluwer Academic Publishers.

Franjié, L. (2003). Étude sémantique et traductologique de verbes arabes dans les

dictionnaires bilingues : le Larousse (arabe-français) et le H. Wehr (arabe-

anglais), Thèse de doctorat, Université Lyon 2.

Ghenima, M. (1998), Analyse morpho-syntaxique en vue de la voyellation assistée par

ordinateur des textes écrits en arabe. Thèse de doctorat, ENSSIB/Université

Lyon 2.

Hassoun, M. (1987), Conception d’un dictionnaire pour le traitement automatique de

l’arabe dans différents contextes d’application. Thèse d’État, Université

Lyon 1.

Le Guern, M. (1972), Sémantique de la métaphore et de la métonymie, Paris, Larousse.

Lelubre, X. (2001), A Scientific Arabic Terms Data Base: Linguistic Approach for a

Representation of Lexical and Terminological Features, in ACL 39th

Annual

Meeting. Workshop on Arabic Language Processing, Status and Prospect,

Toulouse, p. 66-72.

Lyons, J. (1978/90), Semantics II, Cambridge University Press, Traduction française J.

Durand et D. Boulonnais, Sémantique linguistique, Paris, Larousse, 1990.

Mel’uk, I. (1982), Towards a Language of Linguistics, A System of Formal Notions for

Theoretical Morphology, München, Wilhem Fink Verlag.

Mel’uk, I. et al. (1984), Dictionnaire explicatif et combinatoire du français

contemporain. Recherches lexico-sémantiques I, Presses de l’Université de

Montréal.

Mel’uk I., Clas, A. et Polguère, A. (1995), Introduction à la lexicologie explicative et

combinatoire, Louvain-la-Neuve, Duculot.

SPECIFICATEURS ET STRUCTURES D’ARGUMENTS

181

Minko Mi-Nsémé, S.A. (2003), Modélisation des expressions figées en arabe en vue de

la constitution d’une base de données lexicale. Thèse de doctorat, Université

Lyon 2.

Ouersighni, R. (2001), A major offshoot of the DIINAR-MBC project: AraParse, a

morpho-syntactic analyzer of unvowelled Arabic texts, in ACL 39th

Annual

Meeting, Workshop on Arabic Language Processing : Status and Prospect,

Toulouse, p. 66-72.

Ouersighni, R. (2002), La conception et la réalisation d’un système d’analyse morpho-

syntaxique robuste pour l’arabe : utilisation pour la détection et le diagnostic

des fautes d’accord. Thèse de doctorat, ENSSIB/Université Lyon 2.

Picoche, J. (1977), Précis de lexicologie française, Paris, Nathan.

Pottier, B. (1992), Théorie et analyse en linguistique, Paris, Hachette (2e édition).

Roman, A. (1999), La Création lexicale en arabe. Ressources et limites du sytème de

nomination dans une langue humaine naturelle, Lyon, Presses Universitaires de

Lyon (coll. “Etudes arabes”).

Roman, A. (2001), Systématique de la langue arabe, Kaslik (Liban), Université Saint-

Esprit de Kaslik, Liban, 2. vol.

Sinclair, J. (dir.) (1990), COBUILD English Grammar, London, Collins.

Sinclair, J. (1991), Corpus, Concordance, Collocation, Oxford, Oxford University Press.

Tesnière, L. (1959/1966), Éléments de syntaxe structurale, Paris, Klincksieck (1e éd.

1959).

Thoiron, Ph. (1994), La Terminologie multilingue : une aide à la maîtrise des concepts,

in Hommage à Bernard Quémada : Termes et textes, n° spécial de Méta, 39, 4,

p. 765-773.

Zaafrani, R. (2002), Développement d’un environnement interactif d’apprentissage avec

ordinateur de l’arabe langue étrangère. Thèse de doctorat, ENSSIB/Université

Lyon 2.