Download - Nomi Verbi in sincronia e diacronia: multidimensionalità della variazione

G. Policarpi, M. Rombi, M. Voghera, Nomi e verbi in sincronia e diacronia: multidimensionalità della variazione, in A. Ferrari (a c. di), Sintassi storica e sincronica dell'italiano. Subordinazione, coordinazione, giustapposizione. Atti del X Congresso della Società Internazionale di Linguistica e Filologia Italiana (Basilea, 30 giugno - 3 luglio 2008), Firenze, Cesati, 2009, vol. I, pp. 543-560.

Nomi e verbi in sincronia e diacronia:

multidimensionalità della variazione

GIANNA POLICARPI MAGGI ROMBI MIRIAM VOGHERA

Università di Salerno

1. Frequenza e variabilità

Il lavoro che presentiamo illustra il comportamento di nomi e verbi nelle loro dinamiche

reciproche una volta immessi nella tensione del discorso – quindi dell’uso. A tal fine abbiamo

indagato una tipologia di testi molto varia e individuato dove si collocano eventuali picchi di

frequenza e dove, al contrario, contrazioni e cadute. Siamo infatti convinte che regolarità di

tipo quantitativo possano evidenziare proprietà interne alle varie strutture linguistiche, poiché

l’occorrenza o la non occorrenza nei vari contesti di una determinata struttura ne fa emergere

funzionalità sistematiche specifiche (BYBEE/HOPPER 2001; VOGHERA 2008a).

Come cercheremo di mostrare, i dati quantitativi hanno mostrato che la numerosità e la

distribuzione di nomi e verbi sono correlate a variazioni enunciative e/o testuali e che queste

correlazioni dipendono dalla multidimensionalità delle classi lessicali indagate.

1. 1 Il corpus come costruzione di ipotesi di variazione

Gianna Policarpi Maggi Rombi Miriam Voghera

58

Quando cerchiamo di individuare la distribuzione di un dato fenomeno linguistico,

ricorriamo di solito automaticamente a una nota serie di categorie sociolinguistiche messe a

punto ormai da decenni. Ma queste categorie, non dovremmo dimenticarlo, sono pur sempre

“ipotesi” di variazione, dimensioni di variazione potenziale della lingua. Sono state pensate e

messe a punto in base all’ipotesi che la lingua vari nel tempo, nello spazio sociale, geografico,

nel passaggio tra parlato e scritto ecc., e sono probabilmente le più adatte a individuare i

principali usi linguistici che, all’interno delle nostre società, hanno un qualche grado di

diversità.

Tuttavia l’analisi e l’interpretazione degli andamenti di frequenza di un dato fenomeno

all’interno di un corpus presenta molte insidie per ragioni varie. In primo luogo, benché le

campionature siano costruite sulla base di queste ipotesi consolidate, non possiamo mai essere

sicuri di aver considerato tutti i fattori di variazione. In secondo luogo, i diversi fattori di

variazione, com’è ovvio, agiscono simultaneamente dato che ogni testo (ogni enunciato) è

collocato contemporaneamente in un certo tempo, in un certo spazio geografico, sociale, in

una dimensione orale o scritta ecc.. E ciò rende a volte difficile capire quale sia il fattore di

variazione prevalente. In terzo luogo, infine, ogni fenomeno linguistico varia in modo

diverso all’interno di e fra questi spazi. Se per esempio allineassimo le curve di frequenza di

fenomeni fonetici, lessicali e sintattici dello stesso testo troveremmo quasi certamente

andamenti di frequenza fra loro non isomorfi sia nel passaggio da una dimensione all’altra, sia

all’interno della stessa dimensione, poiché l’intensità di variazione può essere diversa tra un

fenomeno e l’altro (POLICARPI/ROMBI 1985b).

Quando ci accingiamo a studiare un certo fenomeno linguistico, quindi, non sappiamo

preliminarmente se l’ordine delle nostre campionature è in grado di comprendere tutte le

variabili specificamente in gioco per quel fenomeno. Sulla base delle esperienze pregresse e

dello studio di fenomeni simili possiamo ipotizzare quali siano i fattori di variazione che

Nomi e verbi in sincronia e diacronia: multidimensionalità della variazione

59

agiscono più potentemente di altri. E’ tuttavia importante la consapevolezza del dato di pura

ipotesi di un certo ordinamento, di una certa tassonomia delle campionature e un

atteggiamento, per dir così flessibile, di ascolto vigile dei dati anche nella fase della loro

raccolta. Fenomeni nuovi possono suggerire nuove dimensioni di variazione impreviste da

esplorare. È proprio quello che è accaduto in questo lavoro in cui i dati hanno suggerito la

pertinenza della dimensione testuale, non prevista nella tassonomia originaria del nostro

corpus Penelope.

Penelope (www.parlaritaliano.it) è un corpus di testi scritti e parlati di italiano

contemporaneo e, in minor misura, antico, di ridotte dimensioni (circa 30000 parole), nato sul

finire degli anni ’70 dall’esigenza di incrociare l’evoluzione storica di alcuni fenomeni

sintattici con la loro distribuzione negli usi contemporanei. A questo scopo, proprio per

garantire la reperibilità massima di tutti i settori d’uso della lingua, si è scelto di adottare, in

sincronia, un criterio di selezione dei campioni il più possibile neutro.

I campioni sono discriminati in base ai centri di produzione: case editrici; centri

commerciali-industriali; istituzioni e centri burocratico-amministrativi, produzione

individuale e di piccoli gruppi. Per lo scritto i testi sono stati catalogati come segue:

Saggistica, Saggistica divulgativa, Narrativa, Gialli, Fumetti, Fotoromanzi, Quotidiani,

Settimanali politici, Settimanali di attualità, Settimanali femminili, Periodici specialistici,

Canzoni, Pubblicità, Scritte sui prodotti commerciali, Istruzioni per l’uso di macchinari,

Didascalie, Testi scolastici, Documenti burocratico-amministrativi, Moduli di uffici, Stampa

religiosa. Cento periodi in tutto, presi, a cinque a cinque, da venti campioni. Si tratta quindi di

piccoli prelievi, allo scopo di neutralizzare l’incidenza degli stili individuali.

Il corpus di italiano parlato è costituito con la medesima tecnica: produzione

cinematografica, televisiva e radiofonica (Film, Sceneggiati, Telegiornali, Talk- show, ecc.),

scelta secondo il criterio della più ampia circolazione; produzione privata individuale o di


60

gruppo (Conversazioni private, Lezioni, Seminari, Conferenze, ecc.).

Per permettere un confronto in diacronia di stati di lingua diversi è stato costituito un

terzo corpus di italiano scritto antico, che comprende testi di teatro, poesia, narrativa,

saggistica, distribuiti in un arco di cinquecento anni. Manca, ovviamente, un corpus di

italiano antico parlato. Ne abbiamo iniziato però a raccogliere dati con l’analisi dei dialoghi e

racconti di inquirenti e inquisiti del Tribunale di Sanità istituito a Firenze durante la peste del

'600, citati in Storie di un anno di peste di Giulia Calvi.

Fanno poi parte di Penelope altri campioni nati nel corso del lungo lavoro di

reperimento dei dati per inseguire correlazioni con aree non previste – o non previste in quella

forma – dalla nostra campionatura originaria, o fra aree che in quella apparivano discontinue,

qualche volta lontane sia in sincronia sia in diacronia.

E’ così nata l’espansione anomala del campione di linguaggio politico: in alcuni settori

contemplati dalle nostre prime campionature (articoli di quotidiani, di alcuni settimanali,

saggistica, interventi d’archivio a Camera e Senato, ecc. ) emergevano alte frequenze nei

processi di nominalizzazione1. Questo ci ha suggerito prima una correlazione fra i dati, quindi

di verificarla estendendo i prelevi in sincronia e in diacronia. Si è così ottenuto di

circoscrivere un’area d’uso, che abbiamo chiamato linguaggio politico, sulla base di dati

linguistici dotati di almeno un carattere sintattico.

1.2 Quali unità di riferimento nel calcolo delle frequenze?

Esistono numerosi studi sulla frequenza di nomi e verbi in varie lingue, e naturalmente

vari sono i criteri usati per il calcolo delle frequenze (MILLER /WEINERT 1998, BIBER et al.

1 Per le caratteristiche di testi fortemente nominalizzati cfr. POLICARPI/ROMBI 1985a.


61

1999, BLANCHE-BENVENISTE 2003, CRESTI/MONEGLIA 2005, VOGHERA/LAUDANNA 2003,

VOGHERA 2005). In questo lavoro le frequenze sono state calcolate sulle occorrenze delle

forme di nomi e verbi e sul sottoinsieme N+V e non, come avviene comunemente, sulle

occorrenze dei lemmi e sul totale delle parole.

La prima scelta deriva dal nostro interesse prevalentemente sintattico. E’ evidente,

infatti, che mentre il conteggio dei lemmi ci dà informazioni sulla ricchezza lessicale di un

testo, il conteggio delle forme ci dice quante volte un nome o un verbo (e non altro materiale

lessicale) occupano un posto nella successione sintagmatica del testo.

La seconda scelta, forse meno ovvia, deriva dal fatto che la presenza variabile di altro

materiale lessicale (compresa nel totale delle parole) avrebbe offuscato il rapporto tra N e V,

importante per testare l’architettura di un testo. Il nostro obiettivo prioritario è infatti indagare

la dinamica reciproca di N e V nella costruzione sintattica di un testo, catturare cioè come

varia l’equilibrio tra due strutture sintattiche centrali. Nella loro qualità di attrattori di

modificazioni, N e V sono infatti elettivamente potenziali nuclei di unità sintagmatiche di

varia estensione e natura (sintagma – clausola), unità sintatticamente centrali nella

costruzione di un testo. Riteniamo, per questo motivo, che il grado della loro alternanza

disegni diverse architetture nel testo. Abbiamo quindi scelto di ignorare tipologia e quantità

del diverso materiale lessicale presente nei testi e di calcolare la frequenza di N e V sul

sottoinsieme N+V. Da questo dato emerge, ci pare, una indicazione immediata sui rapporti di

forza tra N e V e quindi sull’ossatura essenziale del discorso.

2. Dati

Alcuni studi negli ultimi anni hanno indagato la diversa distribuzione di N e V in testi

parlati e scritti, poiché la dimensione diamesica si è rivelata importante nel determinare


62

variazioni della loro frequenza (MILLER /WEINERT 1998, BIBER et al. 1999, BLANCHE-

BENVENISTE 2003, VOGHERA/LAUDANNA 2003, CRESTI/MONEGLIA 2005, VOGHERA 2005,

2008a). Un’occhiata alla tabella che raccoglie una prima, abbastanza grezza, elaborazione

delle frequenze in ordine di rango potrà offrirci l’occasione di saggiare la consistenza di

questa ipotesi, offrendoci contemporaneamente spunti per ipotesi diverse e riflessioni su

argomenti collegati.


63

Tabella 1 Distribuzione percentuale di N in sincronia e diafasia

SCRITTO % % PARLATO

Scritte prodotti commerciali 86,7

Pubblicità 84,1

Didascalie 83,1

Moduli uffici 75,9

Saggistica alta 73,6

Quotidiani 72,6

Discorsi politici 71,6

Linguaggio burocratico 70,8

Settimanali attualità 69,3

Stampa religiosa 68,8

66,4 LIP interventi politici

65,8 Telegiornali

62,8 TV sport

Periodici specialistici 62,6

60,8 LIP lezioni universitarie

Settimanali femminili 60,6

58,6 Pubblicità TV

58,3 LIP televendite

Saggistica divulgativa 57,5

Istruzioni macchinari 57,5

Narrativa alta 56,1

54,0 Domenica in

52,5 Harem

52,2 Porta a porta

51,2 Sceneggiato TV La squadra

51,1 Film TV

50,9 Costanzo show

Narrativa bassa 47,3

Canzoni 43,4

Fumetti, fotoromanzi 41,5

36,0 Carramba

Dialoghi narrativa 33,0

31,9 Dialoghi LIP


64

In questa tabella sono stati riuniti tutti i dati sincronici di cui disponiamo attualmente.

Al corpus Penelope sono stati aggiunti alcuni testi tratti dal Corpus LIP (DE MAURO et al.

1993).

In prima battuta, questa tabella mostra che effettivamente la distribuzione di N e V è

diversa tra parlato e scritto. Lo scritto presenta infatti una maggiore frequenza di N:

banalmente, i numeri più alti compaiono nello scritto. Inoltre, così come è organizzato il

campione attualmente, l’ordine di rango prevede una lunga lista di campionature dello scritto

prima che compaiano campionature del parlato. Ciò può essere attribuito a una non corretta, o

insufficiente, sgranatura dei campioni in uno dei due domini, o in entrambi (e vedremo che in

parte è così).

Ma la differenza di frequenza dei nomi, e di riflesso dei verbi, fra scritto e parlato si

evidenzia se consideriamo aree diafasicamente omogenee, ma diamesicamente diverse come

pubblicità scritta e parlata (84,1% vs. 58,6%); quotidiani e telegiornali (72,6% vs. 65,8%);

saggistica ‘alta’ e lezioni universitarie (73,6% vs. 60,8%); linguaggio politico scritto e parlato

(71,6% vs. 66,4%). La differenza di frequenza fra scritto e parlato è quindi +25,5 a favore

dello scritto per la pubblicità ; +12.8 per la saggistica; +6,8 per i quotidiani; +5,2 per il

linguaggio politico.

Un’altra cosa che si può notare subito è che man mano che si scende verso zone a

minore densità di nomi le differenze fra scritto e parlato si assottigliano. Agli estremi inferiori

dell’ordine di rango abbiamo quella davvero piccola fra dialoghi simulati della narrativa e

dialoghi spontanei del LIP (+1,1: oscillazione del resto fisiologica in campionature non estese

fino alla stabilizzazione del dato).

Salta subito agli occhi che, come già per altre caratteristiche sintattiche, i dialoghi

presentano una stabilità di dati che sembra poco esposta a pur importanti linee di variazione,

come, in questo caso, il passaggio fra scritto e parlato. Lo vediamo meglio nella tabella


65

seguente.

Tabella 2 Distribuzione percentuale di N in dialoghi scritti e parlati

Sempre guardando la Tabella 1, che è, ricordiamolo, riassuntiva di quasi tutti i dati

sincronici, vediamo ora se esistono, e quanto sono grandi, altre differenze di frequenza tra

nomi e verbi all’interno di ognuno dei due domini, parlato e scritto, in una dimensione di

variazione che potremmo chiamare latamente diafasica.

Tralasciamo per ora la prima fascia in ordine di rango – le frequenze più alte - dello

scritto, e cioè Scritte sui prodotti commerciali, Pubblicità, Didascalie, tutti testi accomunati da

uno specifico rapporto con l’immagine, e di cui non abbiamo equivalenti parlati nel nostro

corpus2. Ma testi che, non va dimenticato, occupano, quanto a peso statistico, uno spazio

enorme nella effettiva fruizione dello scritto da parte dell’utente medio. L’utente medio è

infatti scarsissimamente esposto a letture di testi di saggistica, poco di quotidiani, di narrativa

e persino di fumetti e fotoromanzi, ma moltissimo alla pubblicità scritta, alle scritte sui

prodotti commerciali, alle didascalie. Mentre per il parlato è esattamente il contrario e la

maggior esposizione riguarda proprio la fascia bassa in ordine di rango e soprattutto i

dialoghi. Il che indicherebbe un peso ben più grande da attribuire alle differenze fra scritto e

2 Non abbiamo, per esempio, campionature di discorsi di guide turistiche che da un pullman illustrino la

successione dei monumenti in una città, o di agenti immobiliari che indichino la successione delle stanze in una

casa, in vendita o in affitto, occasioni in cui il testo parlato si articola in un preciso rapporto con l’immagine.

Dialoghi parlati e scritti

Narrativa contemporanea

3,3

LIP

1,9


66

parlato (molto piccole nei nostri dati) se, come riteniamo, quantitativamente è il dialogo a

dominare la dimensione orale nell’economia complessiva della lingua.

Non considerando quindi questi testi, tra la frequenza dei nomi nella saggistica ‘alta’

(cioè non divulgativa), la prima in ordine di rango, e quella dei dialoghi simulati della

narrativa, ultima in ordine di rango, c’è uno scarto di oltre il 40% (73,6% saggistica; 33%

dialoghi narrativa). All’interno di questi estremi, c’è una distribuzione di frequenze che

delinea una curva estremamente articolata di possibilità.

Più concentrato, certo, ma comunque molto divaricato il ventaglio di frequenze offerto

dal parlato, dove si va dalla frequenza dei nomi negli interventi politici (66,4%) a quella nei

dialoghi spontanei (31,9%), con una differenza che supera il 35%.

Dunque differenze molto forti sia all’interno del parlato che dello scritto. Questi dati

fanno pensare che non solo la dimensione diamesica intervenga e condizioni la diversa

emergenza dei nomi e dei verbi, ma che agiscano potentemente, anzi più potentemente stando

alle differenze finora individuate, anche altri fattori di variazione. Ma esattamente, quali?

Analizzando i dati all’interno di ciascuno dei due domini, parlato e scritto, abbiamo

attribuito le variazioni ad una dimensione latamente diafasica. In realtà, l’organizzazione delle

campionature obbediva, all’origine, quando è nato Penelope, a criteri totalmente

extralinguistici, dovendo garantire l’estensione più ampia possibile dei tipi di testo cui

l’utente è esposto, in produzione e, soprattutto per lo scritto, in ricezione. Per questo motivo,

le campionature sono state effettuate sui testi così come si presentavano, con l’unico

accorgimento di scegliere quelli a più alta circolazione e di isolare le parti che più

palesemente rispondevano a funzioni testuali specifiche, come titoli, didascalie, dialoghi. Ma

che succede se, all’interno di campionature che si offrono per dir così nella loro oggettività,

tentiamo di individuare criteri di variazione più strettamente linguistici? Qualche indizio lo

abbiamo.


67

Prendiamo lo scritto. In testa all’ordine di rango troviamo una fascia di alte frequenze

espresse da campionature con grande evidenza accomunate da una funzione indicativa –

descrittiva. In coda, i dialoghi simulati della narrativa, con un crollo della frequenza dei nomi.

Campionature che, in base a un criterio di tipologia testuale, appaiono molto pulite.

In mezzo, diversamente articolate sotto il profilo della frequenza, troviamo

campionature spesso miste quanto a dispositivi di enunciazione. Ad esempio, per quanto dai

quotidiani siano stati eliminati già nella prima composizione del campione titoli, didascalie

ecc. e siano stati privilegiati gli articoli, è ovvio che al loro interno ci siano cronache in cui si

raccontano eventi, ci siano commenti politici e di costume in cui si argomenta di posizioni

proprie o altrui, ci siano interviste con porzioni di dialogo, anche a turni brevi.

Così nei campioni parlati, dove già durante l’analisi appariva percepibile, in

campionature miste dal punto di vista testuale (Telegiornali, Costanzo Show, Harem ecc.

dove convivono interviste – e quindi dialoghi anche a turni brevi -, commenti e racconti) che

l’incidenza dei nomi cominciava a crescere non appena il locutore di turno cominciava a

raccontare, ad argomentare o a descrivere qualcosa. Si delinea quindi la rilevanza dei diversi

tipi testuali che, originariamente, non erano stati considerati. La tassonomia usata in

precedenza, che si è rivelata ripetutamente buona per rilevare numerosi fenomeni sintattici

(POLICARPI/ROMBI 1985a) si può dimostrare poco precisa per cogliere altri fenomeni e

individuare quali dimensioni di variazione li governino. Dobbiamo allora chiederci come si

distribuirebbero i dati se riformulassimo l’ordine delle campionature seguendo altri criteri.

Abbiamo visto che in base ai dati e alla loro collocazione sembra delinearsi l’ipotesi

che un’altra dimensione di variazione regoli l’emergenza dei nomi e dei verbi, e che questa

dimensione riguardi le strategie di enunciazione e/o la funzione testuale.

Per verificare questa ipotesi, abbiamo costruito una nuova campionatura di narrativa

contemporanea, isolando questa volta non solo le parti dialogiche, ma anche quelle narrative e


68

quelle descrittive.

Ne è emerso il quadro illustrato nella Tabella 3.

Tabella 3 Distribuzione percentuale di N in blocchi testuali di narrativa 3

Narrativa contemporanea Dialoghi Narrazioni descrizioni

Il filo dell’orizzonte 30 48,7 76,3

Va’ dove ti porta il cuore 34,4 48,1 68,5

Canone inverso 36,3 57,5 70,7

In una campionatura di questo tipo, praticamente ideale, dove vengono neutralizzate

tutte le altre dimensioni di variazione, le differenze nella frequenza dei nomi, e quindi dei

verbi, andranno attribuite esclusivamente a fattori testuali. Ora, queste differenze, scopriamo,

sono molto forti. Pur con oscillazioni dovute allo stile individuale, in tutti gli autori si delinea

una curva di frequenza che cresce costantemente dalle parti dialogiche alle parti narrative,

impennandosi ulteriormente nelle parti descrittive. Anche nella traduzione italiana del

romanzo di Steinbeck Furore di oltre sessanta anni fa troviamo lo stesso andamento:

Tabella 4 Distribuzione percentuale di N in blocchi testuali di narrativa in Furore4

Dialoghi Narrazioni Descrizioni

Furore 38,8 54,5 75,1

La differenza fra parti dialogiche e parti descrittive, agli estremi della curva, è

tendenzialmente intorno al 35% e sfiora il 40% nel romanzo di Tabucchi. Sono grosso modo

3 Paolo Maurensig, Canone inverso, Milano, Mondadori, 1986; Antonio Tabucchi, Il filo dell’orizzonte, Milano,

Feltrinelli, 1986; Susanna Tamaro, Va’ dove ti porta il cuore, Milano, Baldini Castoldi, 1994.


69

gli ordini di grandezza delle differenze che abbiamo individuato agli estremi dell’ordine di

rango di ognuno dei due domini, parlato e scritto. E sono considerevolmente più alti delle

differenze fra aree omogenee dello scritto e del parlato, che, con l’eccezione della pubblicità,

non superano il 12 %.

Un’ulteriore conferma dell’incidenza della dimensione testuale sulla variazione della

distribuzione dei nomi e dei verbi ci viene dalla Tabella 4 che riporta i dati di una

campionatura di verbali di interrogatori del Tribunale di Sanità istituito a Firenze durante la

peste del ‘6005:

Tabella 5 Distribuzione percentuale di N nei verbali di interrogatori

del Tribunale di Sanità6

Dialoghi a turni brevi 25 Dialoghi con narrazioni 59

Media dei due tipi di dialogo 46

Narrazioni 48

Relazioni funzionari 59

Descrizioni 91

Anche in questa Tabella le parti dialogiche sono state divise da quelle descrittive e narrative

e, anche in questo caso, nei dialoghi la frequenza dei nomi rispetto a quella dei verbi registra

4 John Steinbeck, Furore, Milano, Bompiani, 1940.

5 Giulia Calvi, Storie di un anno di peste, Milano, Bompiani, 1984.

6 Per dialoghi con narrazioni si indica l’intera risposta dell’inquisito, che con narrazioni e argomentazioni

spiega, anche sotto tortura, il suo comportamento. Per dialoghi con turni brevi si indicano gli incipit delle


70

una sensibile caduta. Questi dati rafforzano l’idea che la variabilità più grande nella

distribuzione dei nomi e dei verbi si verifichi sotto la spinta di fattori diafasici e/o testuali, e

suggerisce che sia scarsa l’influenza dei fattori diacronici. Naturalmente, per una conferma

definitiva avremmo bisogno di riformulare l’ordine delle campionature, anche parlate,

orientandolo su blocchi testuali.

Accontentiamoci per ora di procedere per esclusione, e scorriamo la tabella che illustra

le variazioni diacroniche all’interno di alcune aree dell’italiano.

Tabella 6 Distribuzione percentuale di N in diacronia

Vediamo che, pur nel passaggio da un secolo all’altro, per esempio nel linguaggio politico, o,

in alcuni casi, a svariati secoli di distanza, ci sono sì variazioni di frequenza nella

distribuzione dei nomi, ma non sono così grandi come ci si potrebbe aspettare.

Nel linguaggio politico, a partire dagli anni ’60, si è verificato un forte rialzo nella

frequenza dei nomi: sappiamo che questo fenomeno si accompagna a un deciso cambiamento

nell’assetto del periodo, che vede l’articolazione sintattica affidata in larga parte a sintagmi

nominali piuttosto che a sintagmi verbali. Nonostante questo ultimo, forte rialzo, la differenza

risposte prima delle spiegazioni o le risposte brevi.

Diacronia Saggistica Narrativa Poesia Politica Teatro

‘200-‘300 52,0 51,9 54,3

‘400-‘500 51,7 64,2 50,2

‘600 62,6 51,8 58,8 46,8

‘700 65,8 54,3 60,4 48,5

‘800 61,5 54,5 64,5 59,7 45,2

‘900 77,2 56,0 69,8 66,9 37,3


71

fra i dati dell’800 e quelli del ‘900 non supera il 7%. Qualcosa di simile si verifica nella

saggistica. Anche qui forte rialzo dei nomi nella saggistica contemporanea, ma la differenza

fra i dati del ‘600 e quelli del ’900 non supera, a distanza di quattro secoli, il 15%. Per non

parlare della narrativa, della poesia, e del teatro dove, pur a distanza di secoli, la differenza

sembra davvero minima.

Notiamo che, alle origini della lingua (‘200, ‘300), le varietà di cui abbiamo i dati non

presentano quasi variazioni di frequenza e questa tendenza dura addirittura fino all’800.

Questo confermerebbe una nostra vecchia idea: che proprio l’italiano contemporaneo,

modulandosi sulle esigenze comunicative più diverse di una enorme (rispetto alle origini)

massa di utenti, abbia conosciuto una forte differenziazione in varietà d’uso. Un’idea che,

specie nella sua prima formulazione, derogava decisamente dall’opinione più diffusa secondo

cui l’italiano, a partire dall’Unità d’Italia, fosse sempre più coinvolto in un processo di

omologazione e di appiattimento. I dati su nomi e verbi rendono più consistente l’ipotesi che

l’unificazione degli italiani sotto una sola lingua si accompagni al fenomeno inverso di una

forte differenziazione interna alla lingua, che ormai ricalca la complessa articolazione del

tessuto sociale e delle sue diverse e complesse esigenze comunicative.

3. Variazioni di frequenza e proprietà delle classi lessicali

Se riflettiamo ora sul complesso dei dati che abbiamo esaminato fin qui, possiamo

avanzare alcune conclusioni su quali siano le situazioni e/o condizioni che ci permettono di,

ci inducono a produrre più o meno nomi.

Come già osservato in VOGHERA 2005 e 2008a, la variabile che più fortemente incide

nella frequenza dei nomi è la presenza di turni di parola, ovvero l’opposizione dialogo vs. non

dialogo. Questo dato è già evidente nella Tabella 1, dove la differenza di frequenza più forte è

fra aree diafasicamente omogenee e non tra aree diamesicamente omogenee. Ma è ancor più


72

chiaro nelle Tabelle 3 e 4 dove un diverso ordinamento delle campionature ci restituisce in

modo del tutto pulito la frequenza dei nomi nelle parti dialogiche rispetto a quelle narrative e

a quelle descrittive.

Questo andamento, notato anche in altre lingue (CRESTI/MONEGLIA 2005, VOGHERA

2005) è, a nostro parere, fortemente dipendente dalle condizioni enunciative in cui avvengono

di norma i dialoghi. I fattori che costituiscono le condizioni enunciative del dialogo sono

molteplici (VOGHERA 2008b), è tuttavia possibile indicare i principali elementi che entrano in

gioco nell’uso (o non uso) dei nomi. Come vedremo, si tratta di fattori connessi a proprietà

semantiche, pragmatiche e sintattiche dei nomi che variamente emergono come rilevanti nella

costruzione e gestione del rapporto tra enunciazione e testo.

Un primo elemento che può determinare la bassa frequenza dei nomi nel dialogo è la

condivisione da parte dei parlanti del contesto e dell’universo di riferimento (LAMBRECHT

1994). Normalmente nei dialoghi c’è un continuo riferimento ad elementi contestuali, molto

più frequente che in altri tipi di testo. Le ragioni sono note: gli interlocutori trovano infatti

molto più naturale e facile “usare” gli elementi del contesto anziché le parole. Sappiamo

infatti che a parità di condizioni la brevità o, come vedremo, l’economia è premiata nella

comunicazione dialogica. Ciò comporta la sostituzione dei nomi con elementi deittici e

anaforici come pronomi personali e possessivi, dimostrativi (GIVON 1995).

L’uso dei deittici al posto di nomi è in qualche modo obbligatorio nei dialoghi

spontanei al punto che se gli elementi deittici e/o anaforici fossero sostituiti da nomi

otterremmo testi parlati inaccettabili7. Poiché una delle principali funzioni semantico-

discorsive dei nomi è quella di introdurre i referenti del discorso e di richiamarli

7 E’ interessante notare che il ricorso a forme di referenza più pesanti ed esplicite del necessario è stato

riscontrato come tratto delle interlingue di apprendenti di livello non avanzato, (CHINI et al. 2003).


73

nell’articolazione del discorso, è naturale che il dialogo presenti pochi nomi. La frequenza dei

nomi sembra infatti aumentare parallelamente all’esigenza di creare un universo di

riferimento condiviso fra gli interlocutori, quando cioè aumenta la necessità di usare termini a

referenza piena, tipicamente espressa da nomi. Questa stessa esigenza spiega tra l’altro l’alta

frequenza dei nomi nei testi descrittivi.

Un altro fattore che condiziona la frequenza dei nomi è la gestione dell’articolazione

dell’informazione. L’uso dei N è infatti spesso legato all’espressione del Topic:

Data la sua specifica natura semantico-referenziale, il Topic trova nel sintagma nominale

la sua categoria espressiva più naturale, in quanto, com’è noto, quest’ultimo è connesso a

tratti semantici quali l’esistenza, la permanenza , l’atemporalità ecc. (FERRARI et al.

2008: 84).

Naturalmente ciò che differenzia il dialogo da altre situazioni enunciative è nuovamente la

possibilità di introdurre un Topic anche in assenza di un’espressione referenziale piena o

pronominale. E’ ciò che viene comunemente chiamata deissi contestuale: la possibilità di

introdurre e/o di topicalizzare elementi che sono riconoscibili ai parlanti per la loro salienza

nella situazione comunicativa data (BERRETTA 1994, VANELLI 1995).

La conversazione seguente, tratta dal Corpus LIP, esemplifica molto bene tanto la

deissi contestuale quanto la possibilità di topicalizzare elementi contestualmente dati e

salienti senza mai nominarli:

(1) 1A: chiedo scusa

1B: prego

2A: ma sotto c'era così tanta gente per riaprire per per cancellazione di iscrizione mi han detto

che bisogna fare certe cose


74

2B: sì

3A: ma la domanda va fatta su carta libera normale dichiaro di non avere # ah non ho non ho

messo (??) dunque marca da bollo quattromilalire ah questa qui sarebbe

3B: sì però la domanda questa qua deve farla vistare di là all'ufficio prestiti sì però

4A: si però mio figlio non ha mai neanche un esame perché è un laureato alla Bocconi credeva

di riuscire a fare qui invece si è messo a lavorare allora ha detto primo passo siccome il lavoro

offerto è a Mosca io non ho tanto tempo allora sono venuta io e allora

4B: dichiaro (??)

5A: dichiaro e gli faccio compilare questo

5B: poi deve intanto si faccia firmare questo che è qua

6A: già che son qui mi faccio firmare questo e poi dopo quando è tutto

6B: consegna giù in segreteria

7A: non devo più tornare qui

7B: no

8A: grazie infinite

8B: niente

9A: però devo in corso Porta Romana dopo

9B: dopo

10A: grazie

10B: prego

In questa conversazione possiamo osservare due fenomeni distinti. In primo luogo, nel

turno 3A viene introdotto un referente apparentemente generico “ah questa qui sarebbe”

(presumibilmente un modulo) che né l’impiegato né la signora nominano mai perché

fisicamente presente durante lo scambiò comunicativo e quindi perfettamente individuabile

attraverso un riferimento deittico. In secondo luogo, questo referente diventa il Topic dei

turni successivi sempre indicato attraverso deittici. Infine nel turno 9A abbiamo un caso di

deissi contestuale. La signora infatti, molto approssimativamente dal punto di vista della

semantica verbale, si riferisce ad una successiva operazione da compiere, mai menzionata

esplicitamente, ma evidentemente perfettamente ricostruibile sulla base delle informazioni


75

contestuali e contestuali.

La bassa frequenza di nomi nel dialogo è attribuibile anche a ragioni sintattiche. Il

dialogo usa sostanzialmente frasi brevi a nodo centrale verbale in cui le valenze del verbo

sono raramente saturate e le posizioni nominali o tendono a essere riempite da pronomi o

sono nulle. Ciò spiega, per esempio, la minore frequenza di nomi nelle parti dialogiche con

turni brevi, rispetto a quelle a turni lunghi, come abbiamo visto nella Tabella 4. A ciò si

aggiunge il fatto che nei dialoghi sono rare le strutture a modificazione multipla, tipicamente

espresse da SP in cui P regge un nome. Sono infatti queste le strutture in cui occorre il

maggior numero di nomi nello scritto (VOGHERA/TURCO 2008).

Complessivamente dunque la basse frequenza dei nomi nei dialoghi sembra rispondere

ad esigenze di economicità semantica, pragmatica e sintattica. E’ ben noto che i dialoghi

spontanei sono normalmente non pianificati poiché la comunicazione avviene in tempo reale

e il destinatario è presente e può interloquire liberamente. Il testo è quindi costituito da turni

di dialogo la cui durata è necessariamente molto variabile e imprevedibile. In queste

condizioni i parlanti devono ottimizzare le risorse verbali e sfruttare quanto è più possibile la

semiosi non verbale o, meglio, la naturale interazione tra condizioni enunciative e

programmazione e costruzione verbale. I testi monologici parlati, al contrario, sono di norma

più pianificati e si rivolgono a destinatari che non hanno, temporaneamente, lo stesso “diritto

di parola”: ne consegue, ovviamente, che in un monologo ci si possa concedere una maggiore

esplicitezza, che si realizza anche attraverso il maggior uso dei nomi.

Ciò non vuol dire che laddove i nomi sono numerosi si debba parlare di ridondanza: la

diversa frequenza dei nomi in tipi di testi diversi non dipende infatti necessariamente dagli

stessi fattori, poiché le proprietà semantiche, pragmatiche e sintattiche dei nomi vengono

sfruttate in misura variabile in base alle esigenze del tipo di testo. Lo dimostra il fatto che la

dimensione di variazione che agisce più decisamente sulla frequenza dei nomi e dei verbi

appare, fuori dal dialogo, quella testuale. Ciò si intravede già nella Tabella 1, dove troviamo


76

una crescita altissima dei nomi nelle campionature che hanno una chiara funzione descrittiva-

indicativa (Scritte sui prodotti commerciali, Pubblicità scritta, Didascalie) o argomentativa

(Saggistica, Discorsi politici ecc.). La Tabella 3 conferma questa ipotesi con la forte

impennata della frequenza dei nomi nel passaggio dalle parti narrative alle parti descrittive.

Nelle descrizioni l’alta frequenza dei nomi sembra dipendere dalle loro proprietà più

propriamente semantiche, dal fatto che le descrizioni sono di norma testi ad alta referenzialità

e bassa temporalità (MORTARA GARAVELLI 1988). Ciò determina un alto numero di nomi e un

relativo basso numero verbi. Descrivere implica infatti costruire una rete di riferimenti intorno

a referenti stabili e i nomi tipicamente indicano un percetto che ha stabilità nel tempo

(HOPPER/THOMPSON 1984). A ciò si aggiunge il fatto che nelle descrizioni si usano

frequentemente strutture a modificazione multipla, tipicamente SP modificati da altri SP che

spesso contengono nomi; si veda un caso estremo nell’esempio seguente nella descrizione

allegata ad un modulo:

(2) Formulario per la presentazione delle domande di contributo, i criteri per la

ripartizione e per la verifica della corretta gestione del medesimo contributo

e le modalità per la sua eventuale revoca.

Più strettamente legata alla loro funzione pragmatico-discorsiva di introduzione dei

partecipanti del discorso (HOPPER/THOMPSON 1984), sembra la presenza dei nomi nelle

narrazioni. E’ evidente inoltre che avendo calcolato la frequenza dei nomi sul sottoinsieme di

N+V il minor numero di nomi corrisponde ad un maggior numero di verbi, i quali nelle

narrazioni tipicamente svolgono il loro ruolo di «assert the occurrence of an event of the

discourse » (HOPPER/THOMPSON 1984: 708).

4. Osservazioni conclusive

Complessivamente l’indagine qui presentata ha confermato che le regolarità di tipo


77

quantitativo non sono un dato parallelo rispetto all’identità delle strutture linguistiche, ma al

contrario, individuano specificità funzionali sistematiche e caratteri interni che concorrono a

delinearne l’identità complessiva.

Le correlazioni tra frequenza di occorrenza di nomi e verbi e variazione diamesica e

testuale chiaramente mostrano che non vi è un unico fattore che condizioni l’andamento delle

frequenze. Nel dialogo ciò che determina un equilibrio a favore dei verbi (o meglio a sfavore

dei nomi) è una spinta verso l’economia. Ciò è connesso ad una spinta generale verso il

risparmio dei mezzi lessicali, confermato anche dal fatto che nei dialoghi l’insieme di N+V è

minore che nei testi non dialogici. Nelle descrizioni le occorrenze dei nomi sono molte

numerose perché la descrizione è un testo di norma ad alta referenzialità e con strutture

sintattiche a modificazione multipla. Nelle narrazioni infine il minor numero dei nomi,

rispetto alle descrizioni, è connesso al maggior numero di verbi cui è affidata la progressione

temporale del discorso: «Se la forma elementare del descrivere è la riproduzione della realtà,

l’analogo nel narrare è la comunicazione di avvenimenti» (MORTARA/GARAVELLI 1988: 161).

La diversa frequenza dei nomi e dei verbi in vari tipi di testi esprime quindi un

andamento che si è rivelato di volta in volta connesso a fattori enunciativi, semantici,

pragmatici e sintattici. E’ evidente che l’analisi di testi diamesicamente e diafasicamente

diversi fa emergere componenti diverse del processo di significazione, di volta in volta

prevalenti a seconda dei diversi vincoli enunciativi e delle diverse esigenze semantiche,

pragmatiche e sintattiche: l’intreccio di questi fattori diversamente graduati regola l’aumento

dei nomi o viceversa la loro diminuzione a favore dei verbi.

La forte interazione tra ragioni di vario livello è un’ulteriore prova della natura

pluridimensionale delle nozioni stesse di nome e verbo che, a seconda delle cornici

enunciative e/o testuali, realizzano prevalentemente tratti semantici, pragmatici e sintattici

(LAUDANNA /VOGHERA 2002).


78

Quanto alle altre dimensioni di variazione qui considerate, la frequenza dei nomi e dei

verbi nei testi italiani non è fortemente correlata a variazioni diacroniche. Contrariamente a

quanto ci si poteva aspettare, le frequenze dei nomi e dei verbi cominciano a varare in modo

più evidente nell’italiano contemporaneo. Ciò rende più consistente l’ipotesi che l’italiano

contemporaneo lungi dall’essere internamente indifferenziato, presenta una differenziazione

che corrisponde alla pluralità delle situazioni d’uso e di utenti all’interno che ricalca la

complessa articolazione del tessuto sociale dei suoi utenti (POLICARPI/ROMBI 2005).

Ci sembra infine utile un’ultima riflessione metodologica. Avere un quadro dei

fenomeni di frequenza dei fatti linguistici può far emergere dimensioni di variazione che

altrimenti non si coglierebbero. Ciò è possibile solo se il corpus di riferimento si concepisce

come un ambito di ricerca flessibile e non definitivo. Ogni corpus costituisce solo un’ipotesi

di quali siano le principali dimensioni di variazione di una lingua: ciò non dovrebbe

precludere correlazioni tra i dati che suggeriscono altre linee di variabilità. Il lavoro

presentato ha infatti fatto emergere la necessità di indagare più approfonditamente le rilevanza

della dimensione testuale come elemento decisivo nella distribuzione di nomi e verbi. In

particolare sarà utile investigare se anche nel parlato la distinzione descrizione/narrazione

comporti le stesse differenze rilevate nello scritto.

Indicazioni bibliografiche

BERRETTA 1994 = MONICA BERRETTA, Il parlato italiano contemporaneo, in MAURIZIO

DARDANO e PAOLO TRIFONE (a c. di), Storia della lingua italiana, vol. II, Torino,

Einaudi, 1994, pp. 239-70.

BIBER et al. 1999 = DOUGLAS BIBER, STIG JOHANSSON, GEOFFREY LEECH, SUSAN CONRAD,

EDWARD FINNEGAN, Longman Grammar of Spoken and Written English, London,

Longman, 1999.


79

BLANCHE-BENVENISTE 2003 = CLAIRE BLANCHE-BENVENISTE, Nom et verbe dans

l’opposition entre oral de conversation et écrit informative, in CECILE BRION e ERIC

CASTAGNE, Verbe et nom. Catégories et références, Reims, Presses Universitaires de

Reims, 2003, pp. 77-101.

BYBEE/HOPPER 2001 = JOAN BYBEE e PAUL J. HOPPER (a c. di), Frequency and the

emergence of linguistic structure, Amsterdam-Philadelphia, Benjamins, 2001.

CHINI/FERRARIS/VALENTINI /BUSINARO 2003= MARINI CHINI , STEFANIA FERRARIS, ADA

VALENTINI E BARBARA BUSINARO, Aspetti della testualità, in ANNA GIACALONE

RAMAT , Verso l’italiano, Roma, Carocci, 2003, pp. 179-219.

CORPUS PENELOPE = www.parlaritaliano.it

CRESTI e MONEGLIA 2005 = EMANUELA CRESTI e MASSIMO MONEGLIA (a c. di), C-Oral-

Rom. Integrated Reference Corpora for Spoken Languages. Amsterdam-Philadelphia,

Benjamins, 2005.

DE MAURO et al. 1993= TULLIO DE MAURO, FEDERICO MANCINI, MASSIMO VEDOVELLI,

MIRIAM VOGHERA, Lessico di frequenza dell’italiano, Milano, ETASLIBRI, 1993.

GIVON 1995= TALMY GIVON , Coherence in Text vs. Coherence in Mind, in MORTON ANN

GERNSBACHER e TALMY GIVON (a c. di), Coherence in Spontaneous Text, Amsterdam-

PHILADELPHIA , BENJAMINS, 1995, PP. 59-115.

HOPPER/THOMPSON 1984 = PAUL J. HOPPER e SANDRA A. THOMPSON, The discourse basis

for Lexical Categories in Universal Grammar, in «Language», 60, (1984), pp.703-752.

LAMBRECHT 1994= KNUD LAMBRECHT, Information Structure and Sentence Form. Topic,

Focus and the Mental representations of Discourse Referents, Cambridge, Cambridge

University Press, 1994.

LAUDANNA 2002 = ALESSANDRO LAUDANNA e MIRIAM VOGHERA, Nouns and verbs as

grammatical categories in the lexicon, in «Italian Journal of Linguistics», 14 (2002), pp

9-26.


80

MILLER /WEINERT 1998= JIM MILLER e REGINA WEINERT, Spontaneous Spoken Language.

Syntax and Discourse, Oxford, Clarendon Press, 1998.

MORTARA GARAVELLI 1988 = BICE MORTARA GARAVELLI , Italienish: Textsorten/Tipologia

dei testi, in GÜNTER HOLTUS, MICHAEL METZELTIN e CHRISTIAN SCHMITT, (a c. di),

Lexikon der romanisteschen Linguistik, Tubingen, Niemeyer, 1988, pp. 157-168.

POLICARPI/ROMBI 1985a = GIANNA POLICARPI e MAGGI ROMBI, Usi dell’italiano. La

nominalizzazione., in ANNALISA FRANCHI DE BELLIS e LEONARDO MARIA SAVOIA,

Sintassi e morfologia della lingua italiana d’uso. Teorie e applicazioni descrittive. Atti

del XVII Congresso della SLI, Roma, Bulzoni, 1985, pp. 396-406.

POLICARPI/ROMBI 1985b = GIANNA POLICARPI e MAGGI ROMBI, De Mita o le varietà

incrociate, in «Linguaggi» 1, (1985), pp. 46-49.

POLICARPI/ROMBI 1998 = GIANNA POLICARPI e MAGGI ROMBI, Storie sul “che”, in

FEDERICO ALBANO LEONI, DANIELE GAMBARARA, FRANCO LO PIPARO e RAFFAELE

SIMONE (a c. di), Ai limiti del linguaggio. Vaghezza, significato, storia., Roma- Bari,

Laterza, 1998, pp. 333-363.

POLICARPI/ROMBI 2005 = GIANNA POLICARPI e MAGGI ROMBI, Tendenze nella sintassi

dell’italiano contemporaneo, in TULLIO DE MAURO e ISABELLA CHIARI , (a c. di),

Parole e numeri. Analisi quantitative dei fatti di lingua., Roma, Aracne, 2005, pp. 139-

156.

ROMBI/POLICARPI 1985= MAGGI ROMBI e GIANNA POLICARPI, Mutamenti sintattici

nell’italiano contemporaneo: il sistema delle congiunzioni, in LUCIANO AGOSTINIANI,

PATRIZIA BELLUCCI MAFFEI, MATILDE PAOLI (a c. di), Linguistica storica e

cambiamento linguistico. Atti del XVI Congresso Internazionale di Studi, Roma,

Bulzoni, 1985, pp. 225-244.

VANELLI 1995= LAURA VANELLI , La deissi, in LORENZO RENZI, GIANPAOLO SALVI e ANNA

CARDINALETTI (a c. di), Grande grammatica italiana di consultazione, Bologna, il


81

Mulino, 1995, pp. 261-350.

VOGHERA/LAUDANNA 2003 = MIRIAM VOGHERA e ALESSANDRO LAUDANNA , Proprietà

categoriali e rappresentazione lessicale del verbo: una prospettiva interdisciplinare, in

MATHÉE GIACOMO-MARCELLESI e ALVARO ROCCHETTI (a c. di), Il verbo italiano. Studi

diacronici, sincronici, contrastivi, didattici., Atti del XXXV Congresso internazionale

della SLI, Roma, Bulzoni, 2003, pp. 293-307.

VOGHERA 2005 = MIRIAM VOGHERA, Nouns and Verbs in Speaking and Writing, in

ELISABETH BURR (a c. di), Tradizione e innovazione. Tradizione e innovazione. Il

parlato: teoria – corpora- linguistica dei corpora, Firenze, Cesati, 2004, pp. 485-498.

VOGHERA 2008a = MIRIAM VOGHERA, La grammatica nei testi, in ADAM LEDGWAY e ANNA

LAURA LEPSCHY (a c. di), Didattica della lingua italiana: testo e contesto, Perugia,

Guerra Edizioni, 2008, pp. 181-195.

VOGHERA 2008b = MIRIAM VOGHERA, The Constants of Spoken Discourse, relazione

presentata al Marie Curie Research Training Network «Sound to Sense» Beyond Short

Units, 16-18 April 2008. http://s2snaples.fisica.unina.it/workshop.

VOGHERA/TURCO 2008= MIRIAM VOGHERA e GIUSEPPINA TURCO, Il peso del parlare e dello

scrivere, in MASSIMO PETTORINO, ANTONELLA GIANNINI , MARIANNA VALLONE ,

RENATA SAVY, (a c. di), La comunicazione parlata, Tomo I, Napoli, Liguori, 2008, pp.

727-760.