G. Policarpi, M. Rombi, M. Voghera, Nomi e verbi in sincronia e diacronia: multidimensionalità della variazione, in A. Ferrari (a c. di), Sintassi storica e sincronica dell'italiano. Subordinazione, coordinazione, giustapposizione. Atti del X Congresso della Società Internazionale di Linguistica e Filologia Italiana (Basilea, 30 giugno - 3 luglio 2008), Firenze, Cesati, 2009, vol. I, pp. 543-560.
Nomi e verbi in sincronia e diacronia:
multidimensionalità della variazione
GIANNA POLICARPI MAGGI ROMBI MIRIAM VOGHERA
Università di Salerno
1. Frequenza e variabilità
Il lavoro che presentiamo illustra il comportamento di nomi e verbi nelle loro dinamiche
reciproche una volta immessi nella tensione del discorso – quindi dell’uso. A tal fine abbiamo
indagato una tipologia di testi molto varia e individuato dove si collocano eventuali picchi di
frequenza e dove, al contrario, contrazioni e cadute. Siamo infatti convinte che regolarità di
tipo quantitativo possano evidenziare proprietà interne alle varie strutture linguistiche, poiché
l’occorrenza o la non occorrenza nei vari contesti di una determinata struttura ne fa emergere
funzionalità sistematiche specifiche (BYBEE/HOPPER 2001; VOGHERA 2008a).
Come cercheremo di mostrare, i dati quantitativi hanno mostrato che la numerosità e la
distribuzione di nomi e verbi sono correlate a variazioni enunciative e/o testuali e che queste
correlazioni dipendono dalla multidimensionalità delle classi lessicali indagate.
1. 1 Il corpus come costruzione di ipotesi di variazione
Gianna Policarpi Maggi Rombi Miriam Voghera
58
Quando cerchiamo di individuare la distribuzione di un dato fenomeno linguistico,
ricorriamo di solito automaticamente a una nota serie di categorie sociolinguistiche messe a
punto ormai da decenni. Ma queste categorie, non dovremmo dimenticarlo, sono pur sempre
“ipotesi” di variazione, dimensioni di variazione potenziale della lingua. Sono state pensate e
messe a punto in base all’ipotesi che la lingua vari nel tempo, nello spazio sociale, geografico,
nel passaggio tra parlato e scritto ecc., e sono probabilmente le più adatte a individuare i
principali usi linguistici che, all’interno delle nostre società, hanno un qualche grado di
diversità.
Tuttavia l’analisi e l’interpretazione degli andamenti di frequenza di un dato fenomeno
all’interno di un corpus presenta molte insidie per ragioni varie. In primo luogo, benché le
campionature siano costruite sulla base di queste ipotesi consolidate, non possiamo mai essere
sicuri di aver considerato tutti i fattori di variazione. In secondo luogo, i diversi fattori di
variazione, com’è ovvio, agiscono simultaneamente dato che ogni testo (ogni enunciato) è
collocato contemporaneamente in un certo tempo, in un certo spazio geografico, sociale, in
una dimensione orale o scritta ecc.. E ciò rende a volte difficile capire quale sia il fattore di
variazione prevalente. In terzo luogo, infine, ogni fenomeno linguistico varia in modo
diverso all’interno di e fra questi spazi. Se per esempio allineassimo le curve di frequenza di
fenomeni fonetici, lessicali e sintattici dello stesso testo troveremmo quasi certamente
andamenti di frequenza fra loro non isomorfi sia nel passaggio da una dimensione all’altra, sia
all’interno della stessa dimensione, poiché l’intensità di variazione può essere diversa tra un
fenomeno e l’altro (POLICARPI/ROMBI 1985b).
Quando ci accingiamo a studiare un certo fenomeno linguistico, quindi, non sappiamo
preliminarmente se l’ordine delle nostre campionature è in grado di comprendere tutte le
variabili specificamente in gioco per quel fenomeno. Sulla base delle esperienze pregresse e
dello studio di fenomeni simili possiamo ipotizzare quali siano i fattori di variazione che
Nomi e verbi in sincronia e diacronia: multidimensionalità della variazione
59
agiscono più potentemente di altri. E’ tuttavia importante la consapevolezza del dato di pura
ipotesi di un certo ordinamento, di una certa tassonomia delle campionature e un
atteggiamento, per dir così flessibile, di ascolto vigile dei dati anche nella fase della loro
raccolta. Fenomeni nuovi possono suggerire nuove dimensioni di variazione impreviste da
esplorare. È proprio quello che è accaduto in questo lavoro in cui i dati hanno suggerito la
pertinenza della dimensione testuale, non prevista nella tassonomia originaria del nostro
corpus Penelope.
Penelope (www.parlaritaliano.it) è un corpus di testi scritti e parlati di italiano
contemporaneo e, in minor misura, antico, di ridotte dimensioni (circa 30000 parole), nato sul
finire degli anni ’70 dall’esigenza di incrociare l’evoluzione storica di alcuni fenomeni
sintattici con la loro distribuzione negli usi contemporanei. A questo scopo, proprio per
garantire la reperibilità massima di tutti i settori d’uso della lingua, si è scelto di adottare, in
sincronia, un criterio di selezione dei campioni il più possibile neutro.
I campioni sono discriminati in base ai centri di produzione: case editrici; centri
commerciali-industriali; istituzioni e centri burocratico-amministrativi, produzione
individuale e di piccoli gruppi. Per lo scritto i testi sono stati catalogati come segue:
Saggistica, Saggistica divulgativa, Narrativa, Gialli, Fumetti, Fotoromanzi, Quotidiani,
Settimanali politici, Settimanali di attualità, Settimanali femminili, Periodici specialistici,
Canzoni, Pubblicità, Scritte sui prodotti commerciali, Istruzioni per l’uso di macchinari,
Didascalie, Testi scolastici, Documenti burocratico-amministrativi, Moduli di uffici, Stampa
religiosa. Cento periodi in tutto, presi, a cinque a cinque, da venti campioni. Si tratta quindi di
piccoli prelievi, allo scopo di neutralizzare l’incidenza degli stili individuali.
Il corpus di italiano parlato è costituito con la medesima tecnica: produzione
cinematografica, televisiva e radiofonica (Film, Sceneggiati, Telegiornali, Talk- show, ecc.),
scelta secondo il criterio della più ampia circolazione; produzione privata individuale o di
Gianna Policarpi Maggi Rombi Miriam Voghera
60
gruppo (Conversazioni private, Lezioni, Seminari, Conferenze, ecc.).
Per permettere un confronto in diacronia di stati di lingua diversi è stato costituito un
terzo corpus di italiano scritto antico, che comprende testi di teatro, poesia, narrativa,
saggistica, distribuiti in un arco di cinquecento anni. Manca, ovviamente, un corpus di
italiano antico parlato. Ne abbiamo iniziato però a raccogliere dati con l’analisi dei dialoghi e
racconti di inquirenti e inquisiti del Tribunale di Sanità istituito a Firenze durante la peste del
'600, citati in Storie di un anno di peste di Giulia Calvi.
Fanno poi parte di Penelope altri campioni nati nel corso del lungo lavoro di
reperimento dei dati per inseguire correlazioni con aree non previste – o non previste in quella
forma – dalla nostra campionatura originaria, o fra aree che in quella apparivano discontinue,
qualche volta lontane sia in sincronia sia in diacronia.
E’ così nata l’espansione anomala del campione di linguaggio politico: in alcuni settori
contemplati dalle nostre prime campionature (articoli di quotidiani, di alcuni settimanali,
saggistica, interventi d’archivio a Camera e Senato, ecc. ) emergevano alte frequenze nei
processi di nominalizzazione1. Questo ci ha suggerito prima una correlazione fra i dati, quindi
di verificarla estendendo i prelevi in sincronia e in diacronia. Si è così ottenuto di
circoscrivere un’area d’uso, che abbiamo chiamato linguaggio politico, sulla base di dati
linguistici dotati di almeno un carattere sintattico.
1.2 Quali unità di riferimento nel calcolo delle frequenze?
Esistono numerosi studi sulla frequenza di nomi e verbi in varie lingue, e naturalmente
vari sono i criteri usati per il calcolo delle frequenze (MILLER /WEINERT 1998, BIBER et al.
1 Per le caratteristiche di testi fortemente nominalizzati cfr. POLICARPI/ROMBI 1985a.
Nomi e verbi in sincronia e diacronia: multidimensionalità della variazione
61
1999, BLANCHE-BENVENISTE 2003, CRESTI/MONEGLIA 2005, VOGHERA/LAUDANNA 2003,
VOGHERA 2005). In questo lavoro le frequenze sono state calcolate sulle occorrenze delle
forme di nomi e verbi e sul sottoinsieme N+V e non, come avviene comunemente, sulle
occorrenze dei lemmi e sul totale delle parole.
La prima scelta deriva dal nostro interesse prevalentemente sintattico. E’ evidente,
infatti, che mentre il conteggio dei lemmi ci dà informazioni sulla ricchezza lessicale di un
testo, il conteggio delle forme ci dice quante volte un nome o un verbo (e non altro materiale
lessicale) occupano un posto nella successione sintagmatica del testo.
La seconda scelta, forse meno ovvia, deriva dal fatto che la presenza variabile di altro
materiale lessicale (compresa nel totale delle parole) avrebbe offuscato il rapporto tra N e V,
importante per testare l’architettura di un testo. Il nostro obiettivo prioritario è infatti indagare
la dinamica reciproca di N e V nella costruzione sintattica di un testo, catturare cioè come
varia l’equilibrio tra due strutture sintattiche centrali. Nella loro qualità di attrattori di
modificazioni, N e V sono infatti elettivamente potenziali nuclei di unità sintagmatiche di
varia estensione e natura (sintagma – clausola), unità sintatticamente centrali nella
costruzione di un testo. Riteniamo, per questo motivo, che il grado della loro alternanza
disegni diverse architetture nel testo. Abbiamo quindi scelto di ignorare tipologia e quantità
del diverso materiale lessicale presente nei testi e di calcolare la frequenza di N e V sul
sottoinsieme N+V. Da questo dato emerge, ci pare, una indicazione immediata sui rapporti di
forza tra N e V e quindi sull’ossatura essenziale del discorso.
2. Dati
Alcuni studi negli ultimi anni hanno indagato la diversa distribuzione di N e V in testi
parlati e scritti, poiché la dimensione diamesica si è rivelata importante nel determinare
Gianna Policarpi Maggi Rombi Miriam Voghera
62
variazioni della loro frequenza (MILLER /WEINERT 1998, BIBER et al. 1999, BLANCHE-
BENVENISTE 2003, VOGHERA/LAUDANNA 2003, CRESTI/MONEGLIA 2005, VOGHERA 2005,
2008a). Un’occhiata alla tabella che raccoglie una prima, abbastanza grezza, elaborazione
delle frequenze in ordine di rango potrà offrirci l’occasione di saggiare la consistenza di
questa ipotesi, offrendoci contemporaneamente spunti per ipotesi diverse e riflessioni su
argomenti collegati.
Nomi e verbi in sincronia e diacronia: multidimensionalità della variazione
63
Tabella 1 Distribuzione percentuale di N in sincronia e diafasia
SCRITTO % % PARLATO
Scritte prodotti commerciali 86,7
Pubblicità 84,1
Didascalie 83,1
Moduli uffici 75,9
Saggistica alta 73,6
Quotidiani 72,6
Discorsi politici 71,6
Linguaggio burocratico 70,8
Settimanali attualità 69,3
Stampa religiosa 68,8
66,4 LIP interventi politici
65,8 Telegiornali
62,8 TV sport
Periodici specialistici 62,6
60,8 LIP lezioni universitarie
Settimanali femminili 60,6
58,6 Pubblicità TV
58,3 LIP televendite
Saggistica divulgativa 57,5
Istruzioni macchinari 57,5
Narrativa alta 56,1
54,0 Domenica in
52,5 Harem
52,2 Porta a porta
51,2 Sceneggiato TV La squadra
51,1 Film TV
50,9 Costanzo show
Narrativa bassa 47,3
Canzoni 43,4
Fumetti, fotoromanzi 41,5
36,0 Carramba
Dialoghi narrativa 33,0
31,9 Dialoghi LIP
Gianna Policarpi Maggi Rombi Miriam Voghera
64
In questa tabella sono stati riuniti tutti i dati sincronici di cui disponiamo attualmente.
Al corpus Penelope sono stati aggiunti alcuni testi tratti dal Corpus LIP (DE MAURO et al.
1993).
In prima battuta, questa tabella mostra che effettivamente la distribuzione di N e V è
diversa tra parlato e scritto. Lo scritto presenta infatti una maggiore frequenza di N:
banalmente, i numeri più alti compaiono nello scritto. Inoltre, così come è organizzato il
campione attualmente, l’ordine di rango prevede una lunga lista di campionature dello scritto
prima che compaiano campionature del parlato. Ciò può essere attribuito a una non corretta, o
insufficiente, sgranatura dei campioni in uno dei due domini, o in entrambi (e vedremo che in
parte è così).
Ma la differenza di frequenza dei nomi, e di riflesso dei verbi, fra scritto e parlato si
evidenzia se consideriamo aree diafasicamente omogenee, ma diamesicamente diverse come
pubblicità scritta e parlata (84,1% vs. 58,6%); quotidiani e telegiornali (72,6% vs. 65,8%);
saggistica ‘alta’ e lezioni universitarie (73,6% vs. 60,8%); linguaggio politico scritto e parlato
(71,6% vs. 66,4%). La differenza di frequenza fra scritto e parlato è quindi +25,5 a favore
dello scritto per la pubblicità ; +12.8 per la saggistica; +6,8 per i quotidiani; +5,2 per il
linguaggio politico.
Un’altra cosa che si può notare subito è che man mano che si scende verso zone a
minore densità di nomi le differenze fra scritto e parlato si assottigliano. Agli estremi inferiori
dell’ordine di rango abbiamo quella davvero piccola fra dialoghi simulati della narrativa e
dialoghi spontanei del LIP (+1,1: oscillazione del resto fisiologica in campionature non estese
fino alla stabilizzazione del dato).
Salta subito agli occhi che, come già per altre caratteristiche sintattiche, i dialoghi
presentano una stabilità di dati che sembra poco esposta a pur importanti linee di variazione,
come, in questo caso, il passaggio fra scritto e parlato. Lo vediamo meglio nella tabella
Nomi e verbi in sincronia e diacronia: multidimensionalità della variazione
65
seguente.
Tabella 2 Distribuzione percentuale di N in dialoghi scritti e parlati
Sempre guardando la Tabella 1, che è, ricordiamolo, riassuntiva di quasi tutti i dati
sincronici, vediamo ora se esistono, e quanto sono grandi, altre differenze di frequenza tra
nomi e verbi all’interno di ognuno dei due domini, parlato e scritto, in una dimensione di
variazione che potremmo chiamare latamente diafasica.
Tralasciamo per ora la prima fascia in ordine di rango – le frequenze più alte - dello
scritto, e cioè Scritte sui prodotti commerciali, Pubblicità, Didascalie, tutti testi accomunati da
uno specifico rapporto con l’immagine, e di cui non abbiamo equivalenti parlati nel nostro
corpus2. Ma testi che, non va dimenticato, occupano, quanto a peso statistico, uno spazio
enorme nella effettiva fruizione dello scritto da parte dell’utente medio. L’utente medio è
infatti scarsissimamente esposto a letture di testi di saggistica, poco di quotidiani, di narrativa
e persino di fumetti e fotoromanzi, ma moltissimo alla pubblicità scritta, alle scritte sui
prodotti commerciali, alle didascalie. Mentre per il parlato è esattamente il contrario e la
maggior esposizione riguarda proprio la fascia bassa in ordine di rango e soprattutto i
dialoghi. Il che indicherebbe un peso ben più grande da attribuire alle differenze fra scritto e
2 Non abbiamo, per esempio, campionature di discorsi di guide turistiche che da un pullman illustrino la
successione dei monumenti in una città, o di agenti immobiliari che indichino la successione delle stanze in una
casa, in vendita o in affitto, occasioni in cui il testo parlato si articola in un preciso rapporto con l’immagine.
Dialoghi parlati e scritti
Narrativa contemporanea
3,3
LIP
1,9
Gianna Policarpi Maggi Rombi Miriam Voghera
66
parlato (molto piccole nei nostri dati) se, come riteniamo, quantitativamente è il dialogo a
dominare la dimensione orale nell’economia complessiva della lingua.
Non considerando quindi questi testi, tra la frequenza dei nomi nella saggistica ‘alta’
(cioè non divulgativa), la prima in ordine di rango, e quella dei dialoghi simulati della
narrativa, ultima in ordine di rango, c’è uno scarto di oltre il 40% (73,6% saggistica; 33%
dialoghi narrativa). All’interno di questi estremi, c’è una distribuzione di frequenze che
delinea una curva estremamente articolata di possibilità.
Più concentrato, certo, ma comunque molto divaricato il ventaglio di frequenze offerto
dal parlato, dove si va dalla frequenza dei nomi negli interventi politici (66,4%) a quella nei
dialoghi spontanei (31,9%), con una differenza che supera il 35%.
Dunque differenze molto forti sia all’interno del parlato che dello scritto. Questi dati
fanno pensare che non solo la dimensione diamesica intervenga e condizioni la diversa
emergenza dei nomi e dei verbi, ma che agiscano potentemente, anzi più potentemente stando
alle differenze finora individuate, anche altri fattori di variazione. Ma esattamente, quali?
Analizzando i dati all’interno di ciascuno dei due domini, parlato e scritto, abbiamo
attribuito le variazioni ad una dimensione latamente diafasica. In realtà, l’organizzazione delle
campionature obbediva, all’origine, quando è nato Penelope, a criteri totalmente
extralinguistici, dovendo garantire l’estensione più ampia possibile dei tipi di testo cui
l’utente è esposto, in produzione e, soprattutto per lo scritto, in ricezione. Per questo motivo,
le campionature sono state effettuate sui testi così come si presentavano, con l’unico
accorgimento di scegliere quelli a più alta circolazione e di isolare le parti che più
palesemente rispondevano a funzioni testuali specifiche, come titoli, didascalie, dialoghi. Ma
che succede se, all’interno di campionature che si offrono per dir così nella loro oggettività,
tentiamo di individuare criteri di variazione più strettamente linguistici? Qualche indizio lo
abbiamo.
Nomi e verbi in sincronia e diacronia: multidimensionalità della variazione
67
Prendiamo lo scritto. In testa all’ordine di rango troviamo una fascia di alte frequenze
espresse da campionature con grande evidenza accomunate da una funzione indicativa –
descrittiva. In coda, i dialoghi simulati della narrativa, con un crollo della frequenza dei nomi.
Campionature che, in base a un criterio di tipologia testuale, appaiono molto pulite.
In mezzo, diversamente articolate sotto il profilo della frequenza, troviamo
campionature spesso miste quanto a dispositivi di enunciazione. Ad esempio, per quanto dai
quotidiani siano stati eliminati già nella prima composizione del campione titoli, didascalie
ecc. e siano stati privilegiati gli articoli, è ovvio che al loro interno ci siano cronache in cui si
raccontano eventi, ci siano commenti politici e di costume in cui si argomenta di posizioni
proprie o altrui, ci siano interviste con porzioni di dialogo, anche a turni brevi.
Così nei campioni parlati, dove già durante l’analisi appariva percepibile, in
campionature miste dal punto di vista testuale (Telegiornali, Costanzo Show, Harem ecc.
dove convivono interviste – e quindi dialoghi anche a turni brevi -, commenti e racconti) che
l’incidenza dei nomi cominciava a crescere non appena il locutore di turno cominciava a
raccontare, ad argomentare o a descrivere qualcosa. Si delinea quindi la rilevanza dei diversi
tipi testuali che, originariamente, non erano stati considerati. La tassonomia usata in
precedenza, che si è rivelata ripetutamente buona per rilevare numerosi fenomeni sintattici
(POLICARPI/ROMBI 1985a) si può dimostrare poco precisa per cogliere altri fenomeni e
individuare quali dimensioni di variazione li governino. Dobbiamo allora chiederci come si
distribuirebbero i dati se riformulassimo l’ordine delle campionature seguendo altri criteri.
Abbiamo visto che in base ai dati e alla loro collocazione sembra delinearsi l’ipotesi
che un’altra dimensione di variazione regoli l’emergenza dei nomi e dei verbi, e che questa
dimensione riguardi le strategie di enunciazione e/o la funzione testuale.
Per verificare questa ipotesi, abbiamo costruito una nuova campionatura di narrativa
contemporanea, isolando questa volta non solo le parti dialogiche, ma anche quelle narrative e
Gianna Policarpi Maggi Rombi Miriam Voghera
68
quelle descrittive.
Ne è emerso il quadro illustrato nella Tabella 3.
Tabella 3 Distribuzione percentuale di N in blocchi testuali di narrativa 3
Narrativa contemporanea Dialoghi Narrazioni descrizioni
Il filo dell’orizzonte 30 48,7 76,3
Va’ dove ti porta il cuore 34,4 48,1 68,5
Canone inverso 36,3 57,5 70,7
In una campionatura di questo tipo, praticamente ideale, dove vengono neutralizzate
tutte le altre dimensioni di variazione, le differenze nella frequenza dei nomi, e quindi dei
verbi, andranno attribuite esclusivamente a fattori testuali. Ora, queste differenze, scopriamo,
sono molto forti. Pur con oscillazioni dovute allo stile individuale, in tutti gli autori si delinea
una curva di frequenza che cresce costantemente dalle parti dialogiche alle parti narrative,
impennandosi ulteriormente nelle parti descrittive. Anche nella traduzione italiana del
romanzo di Steinbeck Furore di oltre sessanta anni fa troviamo lo stesso andamento:
Tabella 4 Distribuzione percentuale di N in blocchi testuali di narrativa in Furore4
Dialoghi Narrazioni Descrizioni
Furore 38,8 54,5 75,1
La differenza fra parti dialogiche e parti descrittive, agli estremi della curva, è
tendenzialmente intorno al 35% e sfiora il 40% nel romanzo di Tabucchi. Sono grosso modo
3 Paolo Maurensig, Canone inverso, Milano, Mondadori, 1986; Antonio Tabucchi, Il filo dell’orizzonte, Milano,
Feltrinelli, 1986; Susanna Tamaro, Va’ dove ti porta il cuore, Milano, Baldini Castoldi, 1994.
Nomi e verbi in sincronia e diacronia: multidimensionalità della variazione
69
gli ordini di grandezza delle differenze che abbiamo individuato agli estremi dell’ordine di
rango di ognuno dei due domini, parlato e scritto. E sono considerevolmente più alti delle
differenze fra aree omogenee dello scritto e del parlato, che, con l’eccezione della pubblicità,
non superano il 12 %.
Un’ulteriore conferma dell’incidenza della dimensione testuale sulla variazione della
distribuzione dei nomi e dei verbi ci viene dalla Tabella 4 che riporta i dati di una
campionatura di verbali di interrogatori del Tribunale di Sanità istituito a Firenze durante la
peste del ‘6005:
Tabella 5 Distribuzione percentuale di N nei verbali di interrogatori
del Tribunale di Sanità6
Dialoghi a turni brevi 25 Dialoghi con narrazioni 59
Media dei due tipi di dialogo 46
Narrazioni 48
Relazioni funzionari 59
Descrizioni 91
Anche in questa Tabella le parti dialogiche sono state divise da quelle descrittive e narrative
e, anche in questo caso, nei dialoghi la frequenza dei nomi rispetto a quella dei verbi registra
4 John Steinbeck, Furore, Milano, Bompiani, 1940.
5 Giulia Calvi, Storie di un anno di peste, Milano, Bompiani, 1984.
6 Per dialoghi con narrazioni si indica l’intera risposta dell’inquisito, che con narrazioni e argomentazioni
spiega, anche sotto tortura, il suo comportamento. Per dialoghi con turni brevi si indicano gli incipit delle
Gianna Policarpi Maggi Rombi Miriam Voghera
70
una sensibile caduta. Questi dati rafforzano l’idea che la variabilità più grande nella
distribuzione dei nomi e dei verbi si verifichi sotto la spinta di fattori diafasici e/o testuali, e
suggerisce che sia scarsa l’influenza dei fattori diacronici. Naturalmente, per una conferma
definitiva avremmo bisogno di riformulare l’ordine delle campionature, anche parlate,
orientandolo su blocchi testuali.
Accontentiamoci per ora di procedere per esclusione, e scorriamo la tabella che illustra
le variazioni diacroniche all’interno di alcune aree dell’italiano.
Tabella 6 Distribuzione percentuale di N in diacronia
Vediamo che, pur nel passaggio da un secolo all’altro, per esempio nel linguaggio politico, o,
in alcuni casi, a svariati secoli di distanza, ci sono sì variazioni di frequenza nella
distribuzione dei nomi, ma non sono così grandi come ci si potrebbe aspettare.
Nel linguaggio politico, a partire dagli anni ’60, si è verificato un forte rialzo nella
frequenza dei nomi: sappiamo che questo fenomeno si accompagna a un deciso cambiamento
nell’assetto del periodo, che vede l’articolazione sintattica affidata in larga parte a sintagmi
nominali piuttosto che a sintagmi verbali. Nonostante questo ultimo, forte rialzo, la differenza
risposte prima delle spiegazioni o le risposte brevi.
Diacronia Saggistica Narrativa Poesia Politica Teatro
‘200-‘300 52,0 51,9 54,3
‘400-‘500 51,7 64,2 50,2
‘600 62,6 51,8 58,8 46,8
‘700 65,8 54,3 60,4 48,5
‘800 61,5 54,5 64,5 59,7 45,2
‘900 77,2 56,0 69,8 66,9 37,3
Nomi e verbi in sincronia e diacronia: multidimensionalità della variazione
71
fra i dati dell’800 e quelli del ‘900 non supera il 7%. Qualcosa di simile si verifica nella
saggistica. Anche qui forte rialzo dei nomi nella saggistica contemporanea, ma la differenza
fra i dati del ‘600 e quelli del ’900 non supera, a distanza di quattro secoli, il 15%. Per non
parlare della narrativa, della poesia, e del teatro dove, pur a distanza di secoli, la differenza
sembra davvero minima.
Notiamo che, alle origini della lingua (‘200, ‘300), le varietà di cui abbiamo i dati non
presentano quasi variazioni di frequenza e questa tendenza dura addirittura fino all’800.
Questo confermerebbe una nostra vecchia idea: che proprio l’italiano contemporaneo,
modulandosi sulle esigenze comunicative più diverse di una enorme (rispetto alle origini)
massa di utenti, abbia conosciuto una forte differenziazione in varietà d’uso. Un’idea che,
specie nella sua prima formulazione, derogava decisamente dall’opinione più diffusa secondo
cui l’italiano, a partire dall’Unità d’Italia, fosse sempre più coinvolto in un processo di
omologazione e di appiattimento. I dati su nomi e verbi rendono più consistente l’ipotesi che
l’unificazione degli italiani sotto una sola lingua si accompagni al fenomeno inverso di una
forte differenziazione interna alla lingua, che ormai ricalca la complessa articolazione del
tessuto sociale e delle sue diverse e complesse esigenze comunicative.
3. Variazioni di frequenza e proprietà delle classi lessicali
Se riflettiamo ora sul complesso dei dati che abbiamo esaminato fin qui, possiamo
avanzare alcune conclusioni su quali siano le situazioni e/o condizioni che ci permettono di,
ci inducono a produrre più o meno nomi.
Come già osservato in VOGHERA 2005 e 2008a, la variabile che più fortemente incide
nella frequenza dei nomi è la presenza di turni di parola, ovvero l’opposizione dialogo vs. non
dialogo. Questo dato è già evidente nella Tabella 1, dove la differenza di frequenza più forte è
fra aree diafasicamente omogenee e non tra aree diamesicamente omogenee. Ma è ancor più
Gianna Policarpi Maggi Rombi Miriam Voghera
72
chiaro nelle Tabelle 3 e 4 dove un diverso ordinamento delle campionature ci restituisce in
modo del tutto pulito la frequenza dei nomi nelle parti dialogiche rispetto a quelle narrative e
a quelle descrittive.
Questo andamento, notato anche in altre lingue (CRESTI/MONEGLIA 2005, VOGHERA
2005) è, a nostro parere, fortemente dipendente dalle condizioni enunciative in cui avvengono
di norma i dialoghi. I fattori che costituiscono le condizioni enunciative del dialogo sono
molteplici (VOGHERA 2008b), è tuttavia possibile indicare i principali elementi che entrano in
gioco nell’uso (o non uso) dei nomi. Come vedremo, si tratta di fattori connessi a proprietà
semantiche, pragmatiche e sintattiche dei nomi che variamente emergono come rilevanti nella
costruzione e gestione del rapporto tra enunciazione e testo.
Un primo elemento che può determinare la bassa frequenza dei nomi nel dialogo è la
condivisione da parte dei parlanti del contesto e dell’universo di riferimento (LAMBRECHT
1994). Normalmente nei dialoghi c’è un continuo riferimento ad elementi contestuali, molto
più frequente che in altri tipi di testo. Le ragioni sono note: gli interlocutori trovano infatti
molto più naturale e facile “usare” gli elementi del contesto anziché le parole. Sappiamo
infatti che a parità di condizioni la brevità o, come vedremo, l’economia è premiata nella
comunicazione dialogica. Ciò comporta la sostituzione dei nomi con elementi deittici e
anaforici come pronomi personali e possessivi, dimostrativi (GIVON 1995).
L’uso dei deittici al posto di nomi è in qualche modo obbligatorio nei dialoghi
spontanei al punto che se gli elementi deittici e/o anaforici fossero sostituiti da nomi
otterremmo testi parlati inaccettabili7. Poiché una delle principali funzioni semantico-
discorsive dei nomi è quella di introdurre i referenti del discorso e di richiamarli
7 E’ interessante notare che il ricorso a forme di referenza più pesanti ed esplicite del necessario è stato
riscontrato come tratto delle interlingue di apprendenti di livello non avanzato, (CHINI et al. 2003).
Nomi e verbi in sincronia e diacronia: multidimensionalità della variazione
73
nell’articolazione del discorso, è naturale che il dialogo presenti pochi nomi. La frequenza dei
nomi sembra infatti aumentare parallelamente all’esigenza di creare un universo di
riferimento condiviso fra gli interlocutori, quando cioè aumenta la necessità di usare termini a
referenza piena, tipicamente espressa da nomi. Questa stessa esigenza spiega tra l’altro l’alta
frequenza dei nomi nei testi descrittivi.
Un altro fattore che condiziona la frequenza dei nomi è la gestione dell’articolazione
dell’informazione. L’uso dei N è infatti spesso legato all’espressione del Topic:
Data la sua specifica natura semantico-referenziale, il Topic trova nel sintagma nominale
la sua categoria espressiva più naturale, in quanto, com’è noto, quest’ultimo è connesso a
tratti semantici quali l’esistenza, la permanenza , l’atemporalità ecc. (FERRARI et al.
2008: 84).
Naturalmente ciò che differenzia il dialogo da altre situazioni enunciative è nuovamente la
possibilità di introdurre un Topic anche in assenza di un’espressione referenziale piena o
pronominale. E’ ciò che viene comunemente chiamata deissi contestuale: la possibilità di
introdurre e/o di topicalizzare elementi che sono riconoscibili ai parlanti per la loro salienza
nella situazione comunicativa data (BERRETTA 1994, VANELLI 1995).
La conversazione seguente, tratta dal Corpus LIP, esemplifica molto bene tanto la
deissi contestuale quanto la possibilità di topicalizzare elementi contestualmente dati e
salienti senza mai nominarli:
(1) 1A: chiedo scusa
1B: prego
2A: ma sotto c'era così tanta gente per riaprire per per cancellazione di iscrizione mi han detto
che bisogna fare certe cose
Gianna Policarpi Maggi Rombi Miriam Voghera
74
2B: sì
3A: ma la domanda va fatta su carta libera normale dichiaro di non avere # ah non ho non ho
messo (??) dunque marca da bollo quattromilalire ah questa qui sarebbe
3B: sì però la domanda questa qua deve farla vistare di là all'ufficio prestiti sì però
4A: si però mio figlio non ha mai neanche un esame perché è un laureato alla Bocconi credeva
di riuscire a fare qui invece si è messo a lavorare allora ha detto primo passo siccome il lavoro
offerto è a Mosca io non ho tanto tempo allora sono venuta io e allora
4B: dichiaro (??)
5A: dichiaro e gli faccio compilare questo
5B: poi deve intanto si faccia firmare questo che è qua
6A: già che son qui mi faccio firmare questo e poi dopo quando è tutto
6B: consegna giù in segreteria
7A: non devo più tornare qui
7B: no
8A: grazie infinite
8B: niente
9A: però devo in corso Porta Romana dopo
9B: dopo
10A: grazie
10B: prego
In questa conversazione possiamo osservare due fenomeni distinti. In primo luogo, nel
turno 3A viene introdotto un referente apparentemente generico “ah questa qui sarebbe”
(presumibilmente un modulo) che né l’impiegato né la signora nominano mai perché
fisicamente presente durante lo scambiò comunicativo e quindi perfettamente individuabile
attraverso un riferimento deittico. In secondo luogo, questo referente diventa il Topic dei
turni successivi sempre indicato attraverso deittici. Infine nel turno 9A abbiamo un caso di
deissi contestuale. La signora infatti, molto approssimativamente dal punto di vista della
semantica verbale, si riferisce ad una successiva operazione da compiere, mai menzionata
esplicitamente, ma evidentemente perfettamente ricostruibile sulla base delle informazioni
Nomi e verbi in sincronia e diacronia: multidimensionalità della variazione
75
contestuali e contestuali.
La bassa frequenza di nomi nel dialogo è attribuibile anche a ragioni sintattiche. Il
dialogo usa sostanzialmente frasi brevi a nodo centrale verbale in cui le valenze del verbo
sono raramente saturate e le posizioni nominali o tendono a essere riempite da pronomi o
sono nulle. Ciò spiega, per esempio, la minore frequenza di nomi nelle parti dialogiche con
turni brevi, rispetto a quelle a turni lunghi, come abbiamo visto nella Tabella 4. A ciò si
aggiunge il fatto che nei dialoghi sono rare le strutture a modificazione multipla, tipicamente
espresse da SP in cui P regge un nome. Sono infatti queste le strutture in cui occorre il
maggior numero di nomi nello scritto (VOGHERA/TURCO 2008).
Complessivamente dunque la basse frequenza dei nomi nei dialoghi sembra rispondere
ad esigenze di economicità semantica, pragmatica e sintattica. E’ ben noto che i dialoghi
spontanei sono normalmente non pianificati poiché la comunicazione avviene in tempo reale
e il destinatario è presente e può interloquire liberamente. Il testo è quindi costituito da turni
di dialogo la cui durata è necessariamente molto variabile e imprevedibile. In queste
condizioni i parlanti devono ottimizzare le risorse verbali e sfruttare quanto è più possibile la
semiosi non verbale o, meglio, la naturale interazione tra condizioni enunciative e
programmazione e costruzione verbale. I testi monologici parlati, al contrario, sono di norma
più pianificati e si rivolgono a destinatari che non hanno, temporaneamente, lo stesso “diritto
di parola”: ne consegue, ovviamente, che in un monologo ci si possa concedere una maggiore
esplicitezza, che si realizza anche attraverso il maggior uso dei nomi.
Ciò non vuol dire che laddove i nomi sono numerosi si debba parlare di ridondanza: la
diversa frequenza dei nomi in tipi di testi diversi non dipende infatti necessariamente dagli
stessi fattori, poiché le proprietà semantiche, pragmatiche e sintattiche dei nomi vengono
sfruttate in misura variabile in base alle esigenze del tipo di testo. Lo dimostra il fatto che la
dimensione di variazione che agisce più decisamente sulla frequenza dei nomi e dei verbi
appare, fuori dal dialogo, quella testuale. Ciò si intravede già nella Tabella 1, dove troviamo
Gianna Policarpi Maggi Rombi Miriam Voghera
76
una crescita altissima dei nomi nelle campionature che hanno una chiara funzione descrittiva-
indicativa (Scritte sui prodotti commerciali, Pubblicità scritta, Didascalie) o argomentativa
(Saggistica, Discorsi politici ecc.). La Tabella 3 conferma questa ipotesi con la forte
impennata della frequenza dei nomi nel passaggio dalle parti narrative alle parti descrittive.
Nelle descrizioni l’alta frequenza dei nomi sembra dipendere dalle loro proprietà più
propriamente semantiche, dal fatto che le descrizioni sono di norma testi ad alta referenzialità
e bassa temporalità (MORTARA GARAVELLI 1988). Ciò determina un alto numero di nomi e un
relativo basso numero verbi. Descrivere implica infatti costruire una rete di riferimenti intorno
a referenti stabili e i nomi tipicamente indicano un percetto che ha stabilità nel tempo
(HOPPER/THOMPSON 1984). A ciò si aggiunge il fatto che nelle descrizioni si usano
frequentemente strutture a modificazione multipla, tipicamente SP modificati da altri SP che
spesso contengono nomi; si veda un caso estremo nell’esempio seguente nella descrizione
allegata ad un modulo:
(2) Formulario per la presentazione delle domande di contributo, i criteri per la
ripartizione e per la verifica della corretta gestione del medesimo contributo
e le modalità per la sua eventuale revoca.
Più strettamente legata alla loro funzione pragmatico-discorsiva di introduzione dei
partecipanti del discorso (HOPPER/THOMPSON 1984), sembra la presenza dei nomi nelle
narrazioni. E’ evidente inoltre che avendo calcolato la frequenza dei nomi sul sottoinsieme di
N+V il minor numero di nomi corrisponde ad un maggior numero di verbi, i quali nelle
narrazioni tipicamente svolgono il loro ruolo di «assert the occurrence of an event of the
discourse » (HOPPER/THOMPSON 1984: 708).
4. Osservazioni conclusive
Complessivamente l’indagine qui presentata ha confermato che le regolarità di tipo
Nomi e verbi in sincronia e diacronia: multidimensionalità della variazione
77
quantitativo non sono un dato parallelo rispetto all’identità delle strutture linguistiche, ma al
contrario, individuano specificità funzionali sistematiche e caratteri interni che concorrono a
delinearne l’identità complessiva.
Le correlazioni tra frequenza di occorrenza di nomi e verbi e variazione diamesica e
testuale chiaramente mostrano che non vi è un unico fattore che condizioni l’andamento delle
frequenze. Nel dialogo ciò che determina un equilibrio a favore dei verbi (o meglio a sfavore
dei nomi) è una spinta verso l’economia. Ciò è connesso ad una spinta generale verso il
risparmio dei mezzi lessicali, confermato anche dal fatto che nei dialoghi l’insieme di N+V è
minore che nei testi non dialogici. Nelle descrizioni le occorrenze dei nomi sono molte
numerose perché la descrizione è un testo di norma ad alta referenzialità e con strutture
sintattiche a modificazione multipla. Nelle narrazioni infine il minor numero dei nomi,
rispetto alle descrizioni, è connesso al maggior numero di verbi cui è affidata la progressione
temporale del discorso: «Se la forma elementare del descrivere è la riproduzione della realtà,
l’analogo nel narrare è la comunicazione di avvenimenti» (MORTARA/GARAVELLI 1988: 161).
La diversa frequenza dei nomi e dei verbi in vari tipi di testi esprime quindi un
andamento che si è rivelato di volta in volta connesso a fattori enunciativi, semantici,
pragmatici e sintattici. E’ evidente che l’analisi di testi diamesicamente e diafasicamente
diversi fa emergere componenti diverse del processo di significazione, di volta in volta
prevalenti a seconda dei diversi vincoli enunciativi e delle diverse esigenze semantiche,
pragmatiche e sintattiche: l’intreccio di questi fattori diversamente graduati regola l’aumento
dei nomi o viceversa la loro diminuzione a favore dei verbi.
La forte interazione tra ragioni di vario livello è un’ulteriore prova della natura
pluridimensionale delle nozioni stesse di nome e verbo che, a seconda delle cornici
enunciative e/o testuali, realizzano prevalentemente tratti semantici, pragmatici e sintattici
(LAUDANNA /VOGHERA 2002).
Gianna Policarpi Maggi Rombi Miriam Voghera
78
Quanto alle altre dimensioni di variazione qui considerate, la frequenza dei nomi e dei
verbi nei testi italiani non è fortemente correlata a variazioni diacroniche. Contrariamente a
quanto ci si poteva aspettare, le frequenze dei nomi e dei verbi cominciano a varare in modo
più evidente nell’italiano contemporaneo. Ciò rende più consistente l’ipotesi che l’italiano
contemporaneo lungi dall’essere internamente indifferenziato, presenta una differenziazione
che corrisponde alla pluralità delle situazioni d’uso e di utenti all’interno che ricalca la
complessa articolazione del tessuto sociale dei suoi utenti (POLICARPI/ROMBI 2005).
Ci sembra infine utile un’ultima riflessione metodologica. Avere un quadro dei
fenomeni di frequenza dei fatti linguistici può far emergere dimensioni di variazione che
altrimenti non si coglierebbero. Ciò è possibile solo se il corpus di riferimento si concepisce
come un ambito di ricerca flessibile e non definitivo. Ogni corpus costituisce solo un’ipotesi
di quali siano le principali dimensioni di variazione di una lingua: ciò non dovrebbe
precludere correlazioni tra i dati che suggeriscono altre linee di variabilità. Il lavoro
presentato ha infatti fatto emergere la necessità di indagare più approfonditamente le rilevanza
della dimensione testuale come elemento decisivo nella distribuzione di nomi e verbi. In
particolare sarà utile investigare se anche nel parlato la distinzione descrizione/narrazione
comporti le stesse differenze rilevate nello scritto.
Indicazioni bibliografiche
BERRETTA 1994 = MONICA BERRETTA, Il parlato italiano contemporaneo, in MAURIZIO
DARDANO e PAOLO TRIFONE (a c. di), Storia della lingua italiana, vol. II, Torino,
Einaudi, 1994, pp. 239-70.
BIBER et al. 1999 = DOUGLAS BIBER, STIG JOHANSSON, GEOFFREY LEECH, SUSAN CONRAD,
EDWARD FINNEGAN, Longman Grammar of Spoken and Written English, London,
Longman, 1999.
Nomi e verbi in sincronia e diacronia: multidimensionalità della variazione
79
BLANCHE-BENVENISTE 2003 = CLAIRE BLANCHE-BENVENISTE, Nom et verbe dans
l’opposition entre oral de conversation et écrit informative, in CECILE BRION e ERIC
CASTAGNE, Verbe et nom. Catégories et références, Reims, Presses Universitaires de
Reims, 2003, pp. 77-101.
BYBEE/HOPPER 2001 = JOAN BYBEE e PAUL J. HOPPER (a c. di), Frequency and the
emergence of linguistic structure, Amsterdam-Philadelphia, Benjamins, 2001.
CHINI/FERRARIS/VALENTINI /BUSINARO 2003= MARINI CHINI , STEFANIA FERRARIS, ADA
VALENTINI E BARBARA BUSINARO, Aspetti della testualità, in ANNA GIACALONE
RAMAT , Verso l’italiano, Roma, Carocci, 2003, pp. 179-219.
CORPUS PENELOPE = www.parlaritaliano.it
CRESTI e MONEGLIA 2005 = EMANUELA CRESTI e MASSIMO MONEGLIA (a c. di), C-Oral-
Rom. Integrated Reference Corpora for Spoken Languages. Amsterdam-Philadelphia,
Benjamins, 2005.
DE MAURO et al. 1993= TULLIO DE MAURO, FEDERICO MANCINI, MASSIMO VEDOVELLI,
MIRIAM VOGHERA, Lessico di frequenza dell’italiano, Milano, ETASLIBRI, 1993.
GIVON 1995= TALMY GIVON , Coherence in Text vs. Coherence in Mind, in MORTON ANN
GERNSBACHER e TALMY GIVON (a c. di), Coherence in Spontaneous Text, Amsterdam-
PHILADELPHIA , BENJAMINS, 1995, PP. 59-115.
HOPPER/THOMPSON 1984 = PAUL J. HOPPER e SANDRA A. THOMPSON, The discourse basis
for Lexical Categories in Universal Grammar, in «Language», 60, (1984), pp.703-752.
LAMBRECHT 1994= KNUD LAMBRECHT, Information Structure and Sentence Form. Topic,
Focus and the Mental representations of Discourse Referents, Cambridge, Cambridge
University Press, 1994.
LAUDANNA 2002 = ALESSANDRO LAUDANNA e MIRIAM VOGHERA, Nouns and verbs as
grammatical categories in the lexicon, in «Italian Journal of Linguistics», 14 (2002), pp
9-26.
Gianna Policarpi Maggi Rombi Miriam Voghera
80
MILLER /WEINERT 1998= JIM MILLER e REGINA WEINERT, Spontaneous Spoken Language.
Syntax and Discourse, Oxford, Clarendon Press, 1998.
MORTARA GARAVELLI 1988 = BICE MORTARA GARAVELLI , Italienish: Textsorten/Tipologia
dei testi, in GÜNTER HOLTUS, MICHAEL METZELTIN e CHRISTIAN SCHMITT, (a c. di),
Lexikon der romanisteschen Linguistik, Tubingen, Niemeyer, 1988, pp. 157-168.
POLICARPI/ROMBI 1985a = GIANNA POLICARPI e MAGGI ROMBI, Usi dell’italiano. La
nominalizzazione., in ANNALISA FRANCHI DE BELLIS e LEONARDO MARIA SAVOIA,
Sintassi e morfologia della lingua italiana d’uso. Teorie e applicazioni descrittive. Atti
del XVII Congresso della SLI, Roma, Bulzoni, 1985, pp. 396-406.
POLICARPI/ROMBI 1985b = GIANNA POLICARPI e MAGGI ROMBI, De Mita o le varietà
incrociate, in «Linguaggi» 1, (1985), pp. 46-49.
POLICARPI/ROMBI 1998 = GIANNA POLICARPI e MAGGI ROMBI, Storie sul “che”, in
FEDERICO ALBANO LEONI, DANIELE GAMBARARA, FRANCO LO PIPARO e RAFFAELE
SIMONE (a c. di), Ai limiti del linguaggio. Vaghezza, significato, storia., Roma- Bari,
Laterza, 1998, pp. 333-363.
POLICARPI/ROMBI 2005 = GIANNA POLICARPI e MAGGI ROMBI, Tendenze nella sintassi
dell’italiano contemporaneo, in TULLIO DE MAURO e ISABELLA CHIARI , (a c. di),
Parole e numeri. Analisi quantitative dei fatti di lingua., Roma, Aracne, 2005, pp. 139-
156.
ROMBI/POLICARPI 1985= MAGGI ROMBI e GIANNA POLICARPI, Mutamenti sintattici
nell’italiano contemporaneo: il sistema delle congiunzioni, in LUCIANO AGOSTINIANI,
PATRIZIA BELLUCCI MAFFEI, MATILDE PAOLI (a c. di), Linguistica storica e
cambiamento linguistico. Atti del XVI Congresso Internazionale di Studi, Roma,
Bulzoni, 1985, pp. 225-244.
VANELLI 1995= LAURA VANELLI , La deissi, in LORENZO RENZI, GIANPAOLO SALVI e ANNA
CARDINALETTI (a c. di), Grande grammatica italiana di consultazione, Bologna, il
Nomi e verbi in sincronia e diacronia: multidimensionalità della variazione
81
Mulino, 1995, pp. 261-350.
VOGHERA/LAUDANNA 2003 = MIRIAM VOGHERA e ALESSANDRO LAUDANNA , Proprietà
categoriali e rappresentazione lessicale del verbo: una prospettiva interdisciplinare, in
MATHÉE GIACOMO-MARCELLESI e ALVARO ROCCHETTI (a c. di), Il verbo italiano. Studi
diacronici, sincronici, contrastivi, didattici., Atti del XXXV Congresso internazionale
della SLI, Roma, Bulzoni, 2003, pp. 293-307.
VOGHERA 2005 = MIRIAM VOGHERA, Nouns and Verbs in Speaking and Writing, in
ELISABETH BURR (a c. di), Tradizione e innovazione. Tradizione e innovazione. Il
parlato: teoria – corpora- linguistica dei corpora, Firenze, Cesati, 2004, pp. 485-498.
VOGHERA 2008a = MIRIAM VOGHERA, La grammatica nei testi, in ADAM LEDGWAY e ANNA
LAURA LEPSCHY (a c. di), Didattica della lingua italiana: testo e contesto, Perugia,
Guerra Edizioni, 2008, pp. 181-195.
VOGHERA 2008b = MIRIAM VOGHERA, The Constants of Spoken Discourse, relazione
presentata al Marie Curie Research Training Network «Sound to Sense» Beyond Short
Units, 16-18 April 2008. http://s2snaples.fisica.unina.it/workshop.
VOGHERA/TURCO 2008= MIRIAM VOGHERA e GIUSEPPINA TURCO, Il peso del parlare e dello
scrivere, in MASSIMO PETTORINO, ANTONELLA GIANNINI , MARIANNA VALLONE ,
RENATA SAVY, (a c. di), La comunicazione parlata, Tomo I, Napoli, Liguori, 2008, pp.
727-760.
Top Related