Linkage tra i microdati dei censimenti 1991 e 2001: una sperimentazione

49
UNIVERSITÀ DEGLI STUDI DI BRESCIA DIPARTIMENTO METODI QUANTITATIVI C.da S.Chiara n°50 - 25122 BRESCIA - ITALY Tel. 39-30-2988.1 - Fax. 39-30-2400925 - E.mail: [email protected] QUADERNO N. 340 UNIVERSITA' DEGLI STUDI DI BRESCIA RAPPORTI DI RICERCA DEL DIPARTIMENTO METODI QUANTITATIVI “Esemplari fuori commercio per il deposito legale agli effetti della Legge 15 Aprile 2004, n.106” Brescia 2010 Dipartimento Metodi Quantitativi - Università degli Studi di Brescia C.da S. Chiara 50, 25122 Brescia - Italia Tel.: 030/29881 - Fax: 030/2400925 - E.mail:[email protected] Linkage tra i microdati dei censimenti 1991 e 2001: una sperimentazione L. Riva – M. Trentini

Transcript of Linkage tra i microdati dei censimenti 1991 e 2001: una sperimentazione

UNIVERSITÀ DEGLI STUDI DI BRESCIA DIPARTIMENTO METODI QUANTITATIVI

C.da S.Chiara n°50 - 25122 BRESCIA - ITALY Tel. 39-30-2988.1 - Fax. 39-30-2400925 - E.mail: [email protected]

QUADERNO N. 340

UNIVERSITA' DEGLI STUDI DI BRESCIA

RAPPORTI DI RICERCA

DEL DIPARTIMENTO METODI QUANTITATIVI

“Esemplari fuori commercio per il deposito legale agli effetti della Legge

15 Aprile 2004, n.106”

Brescia 2010

Dipartimento Metodi Quantitativi - Università degli Studi di Brescia C.da S. Chiara 50, 25122 Brescia - Italia

Tel.: 030/29881 - Fax: 030/2400925 - E.mail:[email protected]

Linkage tra i microdati dei censimenti 1991 e 2001: una sperimentazione

L. Riva – M. Trentini

UNIVERSITÀ DEGLI STUDI DI BRESCIA DIPARTIMENTO METODI QUANTITATIVI

C.da S.Chiara n°48/b - 25122 BRESCIA – ITALY Tel. 39-30-2988.1 - Fax. 39-30-2400925 - E.mail: [email protected]

QUADERNO N. 340

UNIVERSITÀ DEGLI STUDI DI BRESCIA

Linkage tra i microdati dei censimenti 1991 e 2001: una sperimentazione

Luigi Riva, Marco Trentini

RAPPORTI DI RICERCA

DEL DIPARTIMENTO METODI QUANTITATIVI Brescia 2004 Dipartimento Metodi Quantitativi - Università degli Studi di BresciaC.da S. Chiara 48/b,

25122 Brescia – Italia Tel.: 030/29881 - Fax: 030/2400925 - E.mail:[email protected]

La ricerca è stata impostata da Luigi Riva (Dipartimento Metodi Quantitativi - Università degli Studi di Brescia), mentre Marco Trentini (Unità di Staff Statistica - Comune di Brescia) ha curato la realizzazione della stessa nonché la stesura della nota.

Indice

1. Premessa

La nota presenta i risultati di un lavoro di carattere sperimentale volto a verificare l’efficacia del linkage tra i record di archivi censuari contigui. La finalità del lavoro, nonostante i tecnicismi del tema, è di natura eminentemente operativa, vale a dire mettere a disposizione degli utilizzatori pubblici una fonte informativa utile per l’analisi della struttura e soprattutto della dinamica dei fenomeni demografici, sociali ed economici soprattutto a livello locale. Il fatto che il quadro di riferimento del lavoro sia il supporto informativo ai processi decisionali pubblici, ha conseguenze dirette sull’impostazione del lavoro e su molte scelte tecniche; è per tali ragioni che è utile entrare nel dettaglio dell’impostazione del lavoro, prendendo le mosse da tre aspetti rilevanti: i modelli interpretativi, i metodi di analisi e le fonti dei dati. La definizione dei modelli interpretativi costituisce un ambito nel quale è presente un momento di scelta che, pertanto, compete ai decisori. Osserviamo che se i modelli devono essere coerenti con le politiche, pena una bassa efficacia, devono altresì essere coerenti con la natura dei fenomeni osservati, pena una bassa capacità interpretativa. Ciò si traduce a nostro avviso nella richiesta di operare con modelli che forniscano elementi analitici e dinamici dei fenomeni di interesse. L’analiticità dei modelli rimanda a quell’impostazione metodologica secondo cui i fenomeni collettivi, demografici, economici e sociali, possono essere meglio descritti o interpretati partendo dalla considerazione dell’azione di attori individuali (singoli individui, famiglie, imprese o istituzioni, a seconda del problema in esame), cioè di soggetti che hanno capacità di autodeterminazione. A ciò si aggiunga che l’analiticità è legata alla stessa efficacia delle politiche pubbliche, anche e soprattutto locali, che hanno come finalità di modificare comportamenti o situazioni di singoli soggetti. Se l’analiticità dei modelli è associata all’efficacia delle politiche, l’elemento dinamico ha influenza sull’efficienza delle stesse, dal momento che è collegato al tempo di reazione dei singoli attori a fronte di modifiche del contesto nel quale operano, o, in altri termini, al tempo di raggiungimento del nuovo punto di equilibrio a seguito degli interventi pubblici.

Liquidiamo, in modo veloce, il secondo aspetto relativo ai metodi di analisi, per segnalare che il ben noto schema della contabilità demografica fornisce una cornice robusta per le analisi della struttura e della dinamica dei fenomeni di demografici, economici, e sociali e non solo. Rimane la questione della disponibilità di fonti dei dati adeguate sia ai modelli sia ai metodi. È questo, forse, l’aspetto operativo di maggiore difficoltà perché le basi di dati con queste caratteristiche sono scarse, tanto più se si opera a livello locale. Esclusa la disponibilità di indagini locali di tipo longitudinale, costose e difficili da realizzare, rimangono due possibili direzioni. La prima consiste nell’utilizzo di basi di dati amministrativi che sono per natura analitici (anche se i soggetti di riferimento non è detto siano quelli di interesse) e dinamici (quando la sequenza temporale degli atti o eventi è importante). Questa direzione si scontra con varie difficoltà, dalla disponibilità effettiva dei dati, alla loro qualità ed organizzazione e ciò per la ragione evidente che trattandosi di basi di dati costruite per finalità diverse rispetto a quelle statistiche, non sempre l’universo di riferimento, il campo d’osservazione e gli stessi fenomeni considerati coincidono con quelli di interesse statistico. La seconda direzione consiste nell’utilizzo di archivi statistici, e tra questi dei microdati dei censimenti, recuperando l’aspetto dinamico attraverso il linkage dei singoli record di due o più censimenti. È evidente che la realizzazione del linkage permetterebbe di disporre, per ogni individuo censito, delle informazioni di dettaglio contenute nei questionari censuari, e della dimensione dinamica strutturale, vale a dire di quella dinamica che è rilevabile a cadenza decennale. La divagazione precedente ha lo scopo di chiarire il quadro concettuale nel quale va collocato il lavoro della presente nota, e in particolare la sua natura essenzialmente operativa, legata alla analisi di fattibilità della realizzazione di una fonte locale di dati della popolazione funzionale ai processi decisionali pubblici. La scelta dei censimenti, come si accennava, è in un certo senso scontata per almeno tre ordini di ragioni: • l’ampiezza delle informazioni disponibili, che coprono gli ambiti demografico, sociale ed

economico; • la qualità e omogeneità anche temporale delle stesse, garantita dal sistema di controllo di qualità

Istat; • l’analiticità dei dati sia per unità di analisi, il singolo individuo, sia per copertura territoriale, la

sezione di censimento all’interno del comune. A queste ragioni sostanziali aggiungiamo la fattibilità del progetto: ci riferiamo, a tal proposito, ai risultati dei pionieristici lavori di B. Colombo negli anni ’80 frutto della consultazione di archivi cartacei e di tanto lavoro manuale. La disponibilità dei microdati su supporto magnetico, almeno a partire dal censimento del 1971, permette di affrontare a tavolino gli aspetti operativi, utilizzando tecniche automatiche di record

linkage, dopo aver definito i dati, il metodo, e l’algoritmo. Anticipiamo che il lavoro presenta i risultati della sperimentazione di una metodologia che basa su una idea di fondo piuttosto semplice: ogni individuo è identificabile in modo univoco utilizzando un insieme, più o meno esteso, di informazioni che non si modificano nel tempo. Ad esempio possiamo procedere partendo da nome e cognome, sesso, data di nascita, luogo di nascita, aggiungendo via via altre variabili fino a che non otteniamo una identificazione univoca della persona. Ne segue che una persona può essere identificata univocamente in due tempi successivi verificando l’esatta corrispondenza dello stesso insieme di informazioni, nell’ipotesi che altri elementi perturbatori, errori, non possano avere modificato i valori delle variabili considerate. Il problema è quindi, prevalentemente operativo: identificare l’insieme minimo di informazioni che consente di identificare univocamente una persona in momenti diversi.

La soluzione a cui abbiamo pensato consiste nel “ricostruire” in capo ad ogni individuo, tutte le informazioni disponibili, a partire da quelle relative ai familiari, padre, madre, coniuge e via dicendo, e confrontando ordinatamente i dati ricostruiti in due censimenti successivi. Questo approccio è stato testato sui microdati dei quattro censimenti dal 1971 al 2001 per il comune di Brescia relativamente alla popolazione femminile con risultati non positivi per il linkage tra i censimenti fino al 1981, mentre tra i censimenti 1991 e 2001 possiamo ritenere i risultati decisamente promettenti.

La nota presenta nel punto 2 la metodologia utilizzata, che rientra nell’ampia gamma dei metodi cosiddetti ad hoc, e illustra in modo dettagliato i temi della selezione delle variabili chiave, in relazione sia alla loro capacità discriminante sia alla qualità dei dati, e l’algoritmo di abbinamento. Segue al punto 3, l’analisi delle fonti dei dati, i microdati censuari dei censimenti 1991 e 2001; nel capitolo illustriamo le operazioni di normalizzazione e standardizzazione effettuate per poter utilizzare efficacemente i dati. La nota prosegue, punto 4, con l’illustrazione di alcuni risultati con intento essenzialmente sperimentale ottenuti applicando la metodologia proposta ai dati dei censimenti 1991 e 2001 relativamente alla popolazione femminile censita nel Comune di Brescia. Chiude la selezione bibliografica, non esaustiva, ma selettiva, e un’appendice in cui sono presentati tabelle e grafici di dettaglio che nel testo avrebbero interrotto il filo del discorso.

2. Metodologia utilizzata

Il tema del record linkage in ambito statistico è piuttosto vecchio, risale almeno alla fine degli anni ’50 del secolo scorso con i ben noti lavori di Newcombe. È però dagli anni ’80, a seguito delle accresciute esigenze di informazioni decisionali e grazie allo sviluppo dei sistemi informativi informatizzati in ambito amministrativo, che il tema ha preso nuovo vigore e sono stati sviluppati metodi e tecniche specifici. In ambito metodologico si usa distinguere tra metodi euristici, o ad hoc, quindi pensati per risolvere uno specifico problema, e metodi statistici, nei quali si risolve un problema di linkage attingendo ai “modelli” statistici disponibili, ad esempio quello bayesiano. La scelta della metodologia è legata, chiaramente, al problema che si sta affrontando e alle caratteristiche delle fonti da integrare. La soluzione euristica, un merge degli archivi, sarebbe quella più efficace qualora disponessimo, in tutte la basi di dati da integrare, di un insieme sufficiente di variabili chiave identiche e con i dati non affetti da errori di alcun tipo: in questo caso non esisterebbero problemi di falsi positivi o negativi come precisato in seguito. La mancanza o incompletezza delle variabili chiave, oltre che la presenza di errori nei dati, riducono l’efficacia dei metodi ad hoc e spingono verso soluzioni statistiche che mirano a tenere sotto il controllo di un modello gli errori di abbinamento dei record. In questo lavoro abbiamo voluto sperimentare l’efficacia di una metodologia euristica per il linkage dei microdati censuari dei censimenti della popolazione del 1991 e del 2001. Le questioni centrali per la metodologia che intendiamo sviluppare sono almeno quattro: il modello di organizzazione dei dati, la correttezza dei dati, la scelta delle variabili chiave e l’algoritmo di abbinamento dei record.

2.1. Il modello di contabilità

L’obiettivo di ottenere una base di dati dinamica porta, in modo quasi naturale, a organizzare le informazioni del linkage secondo lo schema della contabilità demografica. In altre parole riteniamo che lo schema della contabilità sia sufficientemente generale e robusto per fornire un quadro in cui collocare le differenti situazioni individuali che operativamente potremo incontrare collegando gli archivi. Ogni individuo censito nel 1991 potrà risultare presente nel 2001, sarà un sopravvivente, secondo la terminologia della contabilità, oppure potrà non essere individuato, si tratta di una uscita, per le più varie ragioni: morte, emigrazione fuori dal campo di osservazione, ma anche perché la metodologia non ha fornito un abbinamento valido, si tratta di un mancato abbinamento. Analogamente ogni individuo censito nel 2001 potrà essere un sopravvivente del 1991, ma anche un nuovo ingresso, per nascita o immigrazione, oppure, nuovamente, per un mancato abbinamento. Lo schema della contabilità demografica colloca logicamente in uno schema robusto tute le informazioni ottenute relative sia agli abbinamenti corretti sia alle altre poste, nascite ed immigrazioni, sia ai mancati abbinamenti, come si vedrà nella presentazione dei risultati. Risolta sbrigativamente la parte relativa al modello di organizzazione dei dati, rimangano da sviluppare tre temi intrinsecamente legati: la scelta delle variabili viene fatta anche in relazione alla attendibilità delle stesse, così come l’algoritmo di abbinamento dipende anche dalla scelta delle variabili ed infine l’algoritmo di abbinamento tiene conto anche della correttezza delle variabili. Li esaminiamo separatamente anticipando dove necessario i collegamenti con gli altri punti.

2.2. La presenza di errori nei dati

La presenza di errori nei dati, errori determinati da qualsivoglia ragione come si dirà, è una questione delicata poiché l’algoritmo di abbinamento prevede che vi sia corrispondenza esatta delle variabili chiave; ne segue che dalla correttezza dei dati discende l’affidabilità dell’abbinamento. È bene ricordare che la correttezza dei dati non riguarda solamente la questione della presenza di errori di trascrizione o di registrazione, ma anche la possibilità di modifiche dei dati nel tempo per le più vaie ragioni, vuoi ordinarie, ad esempio nel caso di matrimonio, vuoi straordinarie, come nel caso di cambio di sesso. Una scelta accorta delle variabili chiave, a partire da quelle meno soggette ad errori, può ridurre un problema che è, per sua natura, ineliminabile. Nel nostro caso un valido supporto nella scelta delle variabili ci viene fornito dai documenti, citati in bibliografia, prodotti dall’Istat relativi alla qualità del processo e del prodotto dei censimenti, ed in particolare alla frequenza degli errori sulle singole variabili. Anche da questi elementi deriva l’utilizzo come variabili chiave di informazioni definite a livello di singolo individuo, come il genere, la data di nascita e luogo di nascita, e ciò poiché si tratta di informazioni che risultano meno soggette a modifiche nel tempo, compilate quasi sempre dagli interessati, poco soggette a modificate da parte degli algoritmi di correzione e imputazione dei dati e, presumibilmente, poco soggette ad errori di trascrizione. I dati Istat dell’indagine sulla qualità forniscono vari elementi a supporto di quanto appena visto. A livello nazionale nel 2001 non era indicato il sesso nell’1,3% dei record (760mila su 56,6 milioni), mentre l’analoga percentuale per la data di nascita era lo 0,69%, lo 0,6% per l’anno di nascita da solo e infine l’1,7% per la relazione di parentela l’1,7%.

2.3.

La scelta delle variabili chiave

La seconda questione, relativa alla scelta delle variabili è già stata introdotta: sceglieremo come variabili chiave le variabili anagrafiche di base. La correttezza dei dati non è l’unico elemento che porta a restringere la scelta delle variabili chiave a quelle anagrafiche di base: è ben evidente che genere, data di nascita e luogo di nascita sono requisiti necessari per una identificazione univoca della persona, e sufficienti quando si uniscano al nome e cognome come nel caso del codice fiscale che costituisce una chiave per accedere ai servizi della Pubblica Amministrazione. Un elemento ulteriore è dato dalla pressoché assoluta immodificabilità di queste informazioni nel tempo, se non a fronte di situazioni eccezionali, che, per altro, richiedono procedimenti di variazione complessi: si pensi al cambio di sesso ad esempio. L’assenza del nome e cognome tra le variabili rilevate ai censimenti, certamente complica il problema, nel senso che le tre variabili individuali candidate al ruolo di chiave non sono sufficienti a identificare univocamente una persona. Ciò porta necessariamente a ricercare un modo di allargare l’insieme delle variabili chiave; prima di procedere chiariamo un elemento di tipo metodologico. L’idea di fondo, adattata per analogia dal modello relazionale dei dati, è che ogni individuo sia univocamente identificabile dall’insieme di informazioni che lo caratterizzano. Il nostro problema è quindi identificare l’insieme minimo che garantisce la certezza, o quasi, della univoca identificazione. Una prima soluzione possibile consiste nell’utilizzare esclusivamente le informazioni individuali informazioni più robuste e meno soggette ad errori, come sesso, data di nascita e luogo di nascita: in questo caso la scelta genera situazioni non univoche, o, per dirla in altro modo, le duplicazioni sono troppo frequenti. Alcuni dati relativi al Comune di Brescia possono risultare utili a questo punto per inquadrare il tema. Su 185.163 record di residenti in famiglia censiti nel 2001, di cui 87.513 maschi e 97.650 femmine, i casi identificabili univocamente, quindi con frequenza pari a uno, sulla base delle tre variabili precedenti erano pari a poco più del 51% tra i maschi ed al 54% per le femmine. Situazione pressoché simile anche nel Censimento del 1991 quando su 191.300 record di residenti censiti, di cui 89.962 maschi e 101.319 femmine, i casi identificabili univocamente sulla base delle tre variabili considerate, genere, data di nascita e luogo di nascita, erano pari al 50% per i maschi e al 55% per le femmine. Il 50% degli incroci tra le modalità del genere, della data di nascita e del luogo di nascita, conteneva un solo caso. Il risultato non pare disprezzabile, anzi: il fatto che utilizzando solo tre variabili si identifichi univocamente oltre il 40% dei maschi e femmine è una buona base di partenza, ma non d’arrivo. Proviamo ora a guardare la questione da un altro punto di vista. Incrociando le informazioni descrittive delle persone otteniamo una griglia, un ipercubo, composta da tante righe, colonne, pagine ecc. quante sono le modalità delle variabili considerate. Scegliendo adeguatamente le variabili in base al loro potere discriminante è possibile generare un numero di celle talmente grande che sia realisticamente possibile supporre che in ogni cella possa collocarsi una ed una sola persona, uno ed un solo caso. La strategia ora dovrebbe essere chiara: determinare il più piccolo insieme di informazioni che generi un numero abbastanza grande di celle tale che in ognuna di esse sia contenuto uno ed un solo caso. Se ci limitiamo alle tre variabili considerate in precedenza, possiamo notare che esse generano un ipercubo che teoricamente è costituito di circa 630 milioni di celle (315 milioni per i maschi ed altrettante per le femmine). Questo dato è ottenuto moltiplicando le modalità delle tre variabili nelle

ipotesi che la persona più anziana non abbia più di 106 anni e limitandoci agli 8100 comuni italiani. Un rapporto di 1 a 600 non è tuttavia sufficiente a garantirci dalle celle con frequenze maggiori di uno, anche se la direzione è quella giusta. La soluzione consiste nell’aumentare le dimensioni del cubo, aggiungendo via via nuove variabili, fermandoci quando il cubo è “sufficientemente” grande. L’aggiunta di ulteriori variabili individuali (come il titolo di studio o lo stato civile) potrebbe servire allo scopo, anche se complicherebbe il problema a livello di algoritmo di abbinamento dal momento che si tratta di variabili modificabili nel tempo. La soluzione ipotizzata consiste nell’utilizzare le informazioni anagrafiche di base (sempre genere, data di nascita e luogo di nascita) degli altri componenti coresidenti nella famiglia e la relazione di parentela con la persona di riferimento della famiglia. In effetti i rapporti di parentela (come coniuge-di, figlio-di, ma anche fratello-di) permangono nel tempo; può variare invece la relazione di parentela rispetto alla persona scelta come riferimento dalla famiglia. L’introduzione delle informazioni sui componenti coresidenti nella famiglia ha vantaggi e limiti evidenti. Vediamo i vantaggi. Già abbiamo detto della non modificabilità delle informazioni anagrafiche di base, ma la stessa cosa si può dire dei rapporti di parentela, purché si ricostruiscano sempre in capo al singolo individuo (da qui in avanti Ego). Possiamo ricostruire in capo ad Ego le informazioni di tutti i familiari coresidenti, col che notiamo che ogni familiare agganciato ad Ego amplia l’ipercubo con 300milioni di celle. La situazione peggiore che potremmo incontrare è quella in cui Ego e la persona abbinata appartengano entrambi a celle nelle quali la frequenza di casi è massima; al proposito è utile segnalare che i dati del Censimento 2001 danno sul Comune di Brescia una frequenza massima pari a 12, mentre sulla Provincia di Brescia la frequenza massima arriva a 66. Con questi numeri la strada sembra decisamente promettente, nel senso che possiamo avere la, quasi, certezza che se le informazioni su Ego e un suo familiare coincidono in due censimenti successivi, allora la persona è la stessa; se poi i familiari sono due o più il criterio di decisione appare ancora più robusto. Il criterio utilizzato ci dice che è estremamente improbabile che esistano due persone, a parte i gemelli dello stesso sesso, che abbiano gli stessi identificativi anagrafici, e, per i quali, anche gli identificativi di uno o più familiari siano identici. I limiti sono altrettanto chiari. Uno l’abbiamo appena considerato: i gemelli dello stesso sesso non sono identificabili univocamente; dobbiamo ricordare, tuttavia, che al Censimento 2001 vi erano 1.992 femmine gemelle pari allo 0,8% delle femmine in Provincia di Brescia, e 382 sul comune di Brescia, ugualmente pari allo 0,8%. Un limite più consistente riguarda ovviamente il fatto che il metodo funziona solo se la persona è residente con altri familiari, e pertanto sono esclusi tutti i singoli, per i quali è necessario elaborare altre strategie. Una strategia per affrontare queste situazioni e che potrebbe dare buoni risultati si basa sull’ipotesi che le persone abbiano una scarsa mobilità, ed in particolare che le persone anziane, tra cui molti sono singoli, abbiano una mobilità molto bassa Se introduciamo un’informazione “fine” sul luogo di residenza, ad esempio il comune e la sezione di censimento, allora possiamo anche ipotizzare che l’identità delle informazioni nel tempo corrobori l’ipotesi che la persona sia la stessa, cioè che non si sia spostata. D’altra parte il caso contrario sarebbe estremamente improbabile, dal momento che dovremmo ipotizzare che in dieci anni, nello stesso isolato, vi sia stato uno scambio di persone con le stesse caratteristiche anagrafiche.

2.4. L’algoritmo di abbinamento

L’algoritmo di abbinamento dei record nella metodologia euristica si basa sulla corrispondenza esatta delle medesime variabili, o meglio degli stessi blocchi di variabili, nelle due basi di dati da integrare. La procedura di abbinamento impone che vi sia esatta corrispondenza tra le stesse variabili nelle due basi di dati dei Censimenti adeguatamente normalizzate, o, in altri termini, impone di effettuare un blocco sullo stesso insieme di variabili. Un algoritmo di abbinamento che si basa sulla esatta corrispondenza delle variabili chiave produce buoni risultati se non vi sono errori nei dati, in caso contrario sono possibili due specie di errori determinati dal mancato abbinamento della stessa persona, falso negativo, o dall’abbinamento di persone diverse, falso positivo. Il falso negativo, mancato abbinamento di record della stessa persona a causa degli errori nei dati, ha l’effetto è di ridurre l’efficacia degli abbinamenti e quindi porta ad una sottostima dei sopravviventi, e possiamo ritenere sia dell’ordine di qualche punto percentuale. La probabilità di un falso positivo, abbinamento di record di persone differenti, è legata alla dimensione dell’insieme delle variabili chiave, e quindi decresce al crescere del numero di componenti familiari che abbinati, con una sola, rilevante, eccezione rappresentata dai gemelli dello stesso sesso, che risultano, in questo approccio indistinguibili. La disponibilità di dati su Ego e sui suoi familiari permette di affinare la metodologia utilizzando una tecnica del tipo step wise. Il primo passo consiste nell’accoppiare i record per i quali abbiamo maggiore certezza nell’abbinamento, quindi i record per i quali vi è coincidenza tra le informazioni di Ego e i familiari coresidenti, prendendo le mosse da quelli per i quali le frequenze sono maggiori, ad esempio coniuge, madre, padre, figlie e figli e fratelli e sorelle. I record abbinati al primo step vengono esclusi dall’insieme dei record da abbinare negli step

successivi, di modo che ad ogni passo si restringe l’insieme su cui viene effettuata la ricerca dei record

accoppiabili. È chiaro che più è efficace la metodologia proposta, più piccolo sarà l’insieme dei record non abbinati che residua alla fine del procedimento, e per il quale sarà necessario implementare altre strategie di abbinamento.

3. I dati

I dati utilizzati nel presente lavoro sono i microdati dei censimenti generali del 1991 e del 2001 per il comune di Brescia, messi a disposizione dell’ufficio per tale scopo. Sulle caratteristiche dei dati, compresi gli aspetti rilevanti della qualità, si rinvia alla documentazione prodotta dall’Istat e citata in bibliografia. I dati forniti dall’Istat non sono immediatamente utilizzabili per la bisogna, essendo necessario in primo luogo procedere alla loro standardizzazione ed in secondo luogo alla ricostruzione delle informazioni con riferimento ai vari componenti della famiglia. La standardizzazione è operazione limitata alla relazione di parentela e al luogo di nascita nei due censimenti, e risulta tutto sommato semplice dal momento che si tratta di ricondurre le due variabili alla medesima classificazione. Nel caso del luogo di nascita abbiamo utilizzato la classificazione del 1991, con 95 province, che contiene quella del 2001, con 103 province: la conversione tra le due non comporta problemi particolari, dal momento che disponiamo del comune di nascita. Nel caso della relazione di parentela abbiamo utilizzato la classificazione meno fine, vale a dire quella del 1991, aggregando le modalità del 2001 secondo i criteri previsti nel 1991. È il caso della codifica relativa ai figli, che nel 2001 prevede ben 3 modalità, figli della coppia, figli della sola persona di riferimento e figli del solo convivente o coniuge, mentre ne prevedeva una nel 1991. Una volta effettuata la standardizzazione dei dati, abbiamo proceduto a ricostruire per ogni persona, Ego, le informazioni relative agli altri familiari coresidenti, utilizzando la relazione di parentela ricodificata secondo la classificazione del censimento 1991. La disponibilità della relazione di parentela, unita alle informazioni sullo stato civile e la data di matrimonio, consente di individuare per ogni Ego, il coniuge, i genitori, i figli o le figlie e i fratelli o sorelle. In questo caso ci siamo limitati ai primi due fratelli e sorelle e ai primi due figlie o figlie, in ragione delle frequenze modeste.

La ricostruzione è semplice nel caso delle famiglie nucleari, e più complessa nel caso di famiglie estese o ampie, dal momento che sono necessarie in questo caso informazioni aggiuntive per riuscire a ricostruire in modo affidabile i rapporti di parentela corretti. Un esempio è dato dalle famiglie in cui convivono più figli o figlie della persona di riferimento con una sola nuora o un solo cognato: l’identificazione del coniuge in questo caso è possibile solo disponendo della data di matrimonio, trattandosi comunque di coppie sposate. Un caso più complesso è dato dall’individuazione dei genitori dei nipoti della persona di riferimento, dal momento che la relazione nipote-di, non altrimenti specificata, si può riferire sia a figli-di-figli sia a figli-di-fratelli. Abbiamo proceduto per step, individuando i possibili candidati all’interno della famiglia scelti tra coloro che avevano caratteristiche idonee per relazione di parentela ed età: i candidati al ruolo di genitore dovevano avere almeno 15 anni in più dei figli.

Schema 1: Confronto tra le informazioni anagrafiche individuali registrate nei microdati dei

Censimenti dal 1971 al 2001 Censimento

1971 Censimento

1981 Censimento

1991 Censimento

2001 Relazione di parentela# Rilevato Rilevato Rilevato Rilevato Sesso Rilevato Rilevato Rilevato Rilevato Giorno di nascita Non rilevato Rilevato Rilevato Rilevato Mese di nascita Par. rilevato* Rilevato Rilevato Rilevato Anno di nascita Rilevato Rilevato Rilevato Rilevato Stato estero di nascita Non rilevato Rilevato Rilevato Rilevato Provincia di nascita Non rilevato Rilevato Rilevato Rilevato Comune di nascita Non rilevato Non rilevato Rilevato Rilevato Note: # La relazione di parentela viene rilevata in tutti i censimenti, ma varia il numero di modalità. * Viene registrato un flag se la persona è nata prima della data del censimento

L’analisi delle informazioni disponibili nei vari censimenti relativamente alle variabili chiave, ci ha portato a scegliere di procedere a ritroso partendo dal 2001, e ciò a ragione del grado di confrontabilità dei dati, come evidenziato dallo schema precedente.Questa scelta è determinata dal carattere sperimentale del lavoro, anche se il modello proposto può essere esteso anche al linkage degli altri censimenti della popolazione per cui sono disponibili microdati, quindi almeno dal Censimento del 1971. Chiudiamo il capitolo con alcune considerazioni sugli aspetti di carattere operativo, specificamente mezzi e tempi di elaborazione dei dati. Dal punto di vista operativo le principali fasi del lavoro sono due. La prima ha come risultato la predisposizione delle basi di dati funzionali al trattamento, e prevede una sequenza di operazioni che iniziano con la normalizzazione dei dati, seguono con la predisposizione delle chiavi e si chiudono con la ricostruzione dei blocchi di informazioni relative ai componenti della famiglia. La seconda comprende l’implementazione dell’algoritmo di abbinamento con la specificazione delle procedure informatizzate. Le due fasi sono state interamente realizzate utilizzando un database relazionale per utente finale, nel nostro caso Access

®, con cui sono state gestite sia le operazioni più semplici, come la generazione delle tabelle di conversione per la normalizzazione dei dati, sia l’implementazione dell’algoritmo di abbinamento, che è stata realizzata manualmente con sequenze di query. La realizzazione del lavoro non ha richiesto l’uso degli strumenti di programmazione, al di là di quanto disponibile nello strumento di gestione delle query presente in Access

® e ciò in quanto l’approccio seguito prevede il matching esatto dei record. Quanto ai tempi di realizzazione il lavoro è stato realizzato in modo frammentario, a causa degli altri

impegni degli autori, ma stimiamo che complessivamente per la realizzazione della sperimentazione siano stati necessari tre mesi.

4. Risultati e conclusioni

Presentiamo di seguito, con alcune note a commento, i principali risultati ottenuti dall’applicazione della metodologia di linkage illustrata in precedenza ai microdati dei Censimenti della popolazione del 1991 e del 2001 con riferimento alla sola componente femminile della popolazione e ciò per il carattere sperimentale del progetto. Da qui in avanti a meno che non sia espresso diversamente faremo sempre riferimento alla sola popolazione femminile. Come dicevamo nel punto 3, abbiamo proceduto per passi successivi, il primo dei quali consiste nell’isolare all’interno dell’archivio del 2001 i record delle persone che potevano essere residenti anche nel 1991, escludendo i record delle persone per le quali già sappiamo che non potevano essere presenti nel 1991. Si tratta delle femmine nate dopo la data di riferimento del censimento 1991, quindi dal 20/10/1991 in poi, e delle immigrate dopo il censimento 1991, non già comprese nelle nate dopo quella data. In questo modo l’insieme dei record abbinabili del censimento 2001 passa da 97.650 a 87.172, con 7.608 femmine nate dopo il 19/10/1991 e 2.870 femmine immigrate nate prima del censimento. I record del censimento del 1991 non sono soggetti a restrizioni particolari: è quindi tra i 101.338 record del censimento del 1991 che vanno cercati i possibili abbinamenti. Il secondo passo consiste nel ricostruire in capo ad ogni soggetto abbinabile del censimento 1991 e 2001, Ego, i familiari coresidenti, vale a dire: • coniuge; • padre; • madre; • primo e secondo figlio o figlia; • primo e secondo fratello o sorella. La relazione di parentela con la persona di riferimento consente di individuare direttamente le parentele, anche se Ego non è la persona di riferimento, pur con alcune avvertenze. In effetti esistono

molteplici situazioni in cui la sola relazione di parentela non è sufficiente a ricostruire in modo non ambiguo la parentela, come nel caso della nuora coniugata con uno dei figli, nel caso in cui di figli ne siano coresidenti più di uno. In questi casi si procede aggiungendo via via ulteriori informazioni a quelle già utilizzate, in modo da discriminare le varie situazioni: così, per riprendere l’esempio di prima, useremo lo stato civile e la data di matrimonio per individuare i coniugi. I risultati ottenuti nella ricostruzione delle relazioni sono riportati nelle tabelle seguenti.

Tabella 1: Numero di familiari abbinati per donna censita.

Censimenti 1991 e 20011991 2001 Numero di

familiari v.a. % v.a. % Nessuno 19069 18,8 18970 21,8

1 23191 22,9 33838 38,82 25884 25,5 19439 22,33 28243 27,9 13733 15,84 4944 4,9 1173 1,35 7 0,0 19 0,0

Totale 101338 100,0 87172 100,0

Tabella 2: Parenti abbinati per donna censita.

Censimenti 1991 e 2001 1991 2001 Parenti abbinati

v.a. % v.a. % Nessuno 19069 18,8 18970 21,8

v.a. % sui familiari

% sui casi v.a. % sui familiari

% sui casi

Coniuge 45671 25,4 55,5 43126 36,3 63,2

Madre 28453 15,9 34,6 17688 14,9 25,9

Padre 24265 13,5 29,5 13629 11,5 20,0

I figlio o figlia 39283 21,9 47,7 25575 21,5 37,5

II figlio o figlia 17639 9,8 21,4 8640 7,3 12,7

I fratello o sorella 18827 10,5 22,9 8938 7,5 13,1

II fratello o sorella 5361 3,0 6,5 1106 0,9 1,6

Totale familiari 179499 100,0 218,2 118702 100,0 174,0

Casi abbinabili 82269 68202

I dati riportati nella tabella sono sufficientemente chiari. Il 20% circa di record di Ego è riferito a femmine alle quali non è possibile abbinare altri parenti, limitatamente alle relazioni considerate; per questi casi si dovrà procedere con una differente strategia di linkage. Se isoliamo le situazioni rimanenti notiamo che in media risulta che nel 1991 Ego aveva almeno due altri parenti coresidenti, esattamente 2,2, mentre nel 2001 il numero medio scendeva a 1,7. I dati ci indicano che la combinazione maggiormente frequente è rappresentata dal coniuge, eventualmente con un figlio, e dalla combinazione ad essa “coniugata”, cioè dalla madre o padre e fratelli. Procediamo a questo punto all’abbinamento dei record per step successivi. Il primo passo consiste nell’isolare per ogni Censimento la parte effettivamente abbinabile dei record, costituita dai record per i quali esiste nell’altro Censimento almeno un possibile candidato all’abbinamento, limitandoci alle sole informazioni anagrafiche di base (sesso, data di nascita e luogo di nascita) quali criteri di abbinamento. Il 13,3% dei record del 1991, 11615 in valore assoluto, e il 21,3% dei record del 2001, pari a 21622, non sono abbinabili con i record dell’altro censimento. I risultati, riportati nella figura, sono coerenti con le attese per quanto riguarda il Censimento del 1991. La percentuale di record del Censimento 1991 non abbinabili nel 2001 è molto bassa fino alla maggiore età, età alla quale i figli iniziano ad uscire di casa, e parte anche ad emigrare, si mantiene pressoché costante sotto il 20% fino ai 60 anni di età, per poi crescere raggiungendo il 30% ai 70 anni di età, il 48% ai 75 anni e così via. Diversa è la situazione del censimento 2001, anche se è coerente con le caratteristiche della fonte e con gli eventi accaduti dopo il 1991. La maggior parte delle persone censite nel 2001 erano già residenti nel 1991, mentre la quota di non abbinabili rimane pressoché costante al variare dell’età, con una sola eccezione relativa alle giovani immigrate, non solo extracomunitarie, di età tra 20 e 35 anni al 2001. A conferma dei risultati ottenuti, segnaliamo che il 62,2% dei record del Censimento 1991 non abbinabili riguardava persone per le quali non è stato possibile ricostruire la parentela, contro il 14,1% del censimento 2001.

Figura 1: Record abbinati in modo univoco per anno di nascita di Ego.

Censimento 1991 e Censimento 2001

0,0

10,0

20,0

30,0

40,0

50,0

60,0

70,0

80,0

90,0

100,0

1991 1981 1971 1961 1951 1941 1931 1921 1911

Anno Nascita

%

Cens. 1991 Cens. 2001

Una volta isolati i record abbinabili abbiamo proceduto alla ricerca degli abbinamenti esatti imponendo l’identità delle informazioni dei vari blocchi anagrafici, collegati in sequenza secondo gli step riportati nella tabella seguente.

Tabella 3: Schema di sintesi degli abbinamenti tra i record dei censimenti in ordine di step.

Censimenti 1991 e 2001 Step Tipo di abbinamento Cens. 1991 Cens. 2001

v.a. % v.a. % 1 Non collegabili in origine* 21622 21,3 11615 13,32 Primo collegamento tra record unici 4067 4,0 3369 3,93 Collegamento Ego e coniuge 26076 25,7 26076 29,94 Collegamento Ego e madre 11590 11,4 11590 13,35 Collegamento Ego e padre 1259 1,2 1259 1,46 Collegamento Ego e I figlio di Ego 4958 4,9 4958 5,77 Secondo collegamento tra record unici 12452 12,3 12452 14,38 Non collegabili* 3436 3,4 2054 2,49 Collegato Ego e data di matrimonio unica 1539 1,5 1539 1,8

Totale record trattati 86999 85,9 74912 85,9Record rimanenti con multipli 14339 14,1 12260 14,1

Totale record 101338 100,0 87172 100,0Nota: * manca record corrispondente

Rispetto al numero di record teoricamente abbinabili (101.338 nel caso del censimento 1991 e 87.172 nel Censimento 2001) i record collegati secondo l’algoritmo proposto sono il 61,2% nel 1991 e il 70,2% nel 2001. Come si può notare i blocchi di informazioni che garantiscono una maggiore possibilità di abbinamento sono quelli di Ego e del coniuge, che da soli consentono di collegare oltre 26mila record, in percentuale tra il 25% del Censimento 1991 e il 30% del Censimento 2001. In termini di profilo per anno di nascita di Ego ciò si traduce in una percentuale superiore al 50% di collegamenti per le coppie in cui Ego è nata tra il 1935 ed il 1960. A seguire l’abbinamento con le informazioni sui genitori, distintamente prima la madre e poi il padre, che riguardano più di 12mila record con una percentuale variabile tra 12% del Censimento 1991 e 14% del Censimento 2001.

Figura 2: Record abbinati con il coniuge per anno di nascita di Ego.

Censimento 1991 e Censimento 2001

0,0

10,0

20,0

30,0

40,0

50,0

60,0

70,0

80,0

90,0

100,0

1991 1981 1971 1961 1951 1941 1931 1921 1911

Anno Nascita

%

Cens. 1991 Cens. 2001

Anche in questo caso il profilo dei collegamenti per anno di nascita di Ego rispetta le aspettative, nel senso che troviamo le percentuali più elevate di linkage proprio tra le persone più giovani: in termini numerici risulta che la percentuale di record abbinati utilizzando le informazioni di Ego e della madre o del padre supera il 60% per le persone nate dal 1975 al 1991, mentre la quota di record collegati si annulla al crescere dell’età.

Figura 3:Record abbinati con madre e padre per anno di nascita di Ego. Censimento 1991 e Censimento 2001

0,0

10,0

20,0

30,0

40,0

50,0

60,0

70,0

80,0

90,0

100,0

1991 1981 1971 1961 1951 1941 1931 1921 1911

Anno Nascita

%

Cens. 1991 Cens. 2001

I grafici rendono bene il fatto che ogni combinazione di blocchi informativi utilizzati, Ego più coniuge, Ego più madre e via dicendo, ha una elevata capacità di abbinamento su uno specifico sottogruppo della popolazione. La strategia proposta per il linkage, cioè utilizzare le informazioni dei componenti coresidenti nella famiglia, esaminata alla luce di questi risultati, si rivela piuttosto efficace. Una volta conclusi i nove step residua un 14,1% di record per i quali vi sono più record abbinabili, ma le informazioni disponibili, anche ricorrendo ad informazioni aggiuntive presenti nelle basi di dati censuarie, non consentono di individuare corrispondenze biunivoche. Tuttavia, a ulteriore conferma di quanto appena visto, la quota non abbinabile è costituita da una tipologia omogenea di persone, come si vede dalla figura, tipicamente coppie formatesi nel corso del decennio intercensuario.

Figura 4: Record con abbinamenti multipli per anno di nascita di Ego.

Censimento 1991 e Censimento 2001

0,0

10,0

20,0

30,0

40,0

50,0

60,0

70,0

80,0

90,0

100,0

1991 1981 1971 1961 1951 1941 1931 1921 1911

Anno Nascita

%

Cens. 1991 Cens. 2001

Proprio il tipo di situazione ci suggerisce la strategia per la soluzione del problema, che in questa sede non è stata tentata per ragioni di mancanza di risorse. Il mancato abbinamento dei record dipende essenzialmente dal fatto che nel caso delle famiglie di nuova formazione, si perde l’informazione sui familiari coresidenti, dal momento che la nuova famiglia va a risiedere, solitamente, al di fuori dei nuclei familiari d’origine. La strategia proposta risulta, pertanto, insufficiente in questo caso; tuttavia è possibile superare il problema attingendo ad altri archivi statistici, ad esempio alle statistiche correnti dello stato civile, in particolare alle schede di matrimonio, in cui sono riportate anche informazioni su titolo di studio, professione ecc., che sono utili quanto meno per restringere l’ambito di ricerca dei record abbinabili. Lo schema della contabilità demografica fornisce un quadro robusto per organizzare i dati, come risulta dalla tabella che segue che raccoglie i dati di sintesi che abbiamo già commentato in precedenza.

Tabella 4: Schema della contabilità demografica applicato al linkage dei record censuari delle

femmine.

Censimenti 1991 e 2001 2001 1991

Sopravviventi Usciti 91-01 Non collegati Totale

Sopravviventi 61941 25058 14339 101338

Nati tra 91-01 7608 - - 7608

Immigrati 91-01 2870 - - 2870

Entrati 91-01 13669 - - 13669

Non collegati 11562 - - 11562

Totale 97650 25058 14339 137047

Due battute a commento. I 25.058 record dichiarati come uscite nel decennio riguardano situazioni per le quali al 2001 abbiamo un elevato grado di sicurezza che non vi siano, a meno di errori nei dati, record corrispondenti; mentre i 14.339 record non collegati sono riferiti a situazioni per le quali non era possibile decidere con ragionevole sicurezza sulla base delle informazioni disponibili. Nel 2001 i record non collegati sono pari ad 11.562, in percentuale 11,8%; a questi vanno aggiunti gli entrati, persone per le quali abbiamo un elevato grado di sicurezza nell’affermare che non erano presenti nel 1991, a meno di errori nei dati, e i nati ed immigrati nel decennio. Il modello di contabilità consente di collocare secondo un unico schema informazioni a diversi livelli ricavando altresì elementi descrittivi utili, come quelli riportati nelle tabelle riportate in appendice in cui i flussi in ingresso ed uscita ed i record non collegati sono analizzati per tipologia familiare. I dati mettono in evidenza il grado di successo dell’algoritmo proposto e sono, ovviamente, coerenti con esso, mostrando percentuali di riuscita degli abbinamenti più elevate laddove maggiori sono le informazioni disponibili, ma anche più stabili le relazioni. È coerente con questo quadro ottenere percentuali di abbinamento più elevate sulle coppie sole, rispetto alle coppie con altri e alle coppie con figli, così come ottenere risultati meno convincenti sulle famiglie di altro tipo.

Tabella 5: Record non collegati del Censimento 1991 distinti per tipologia familiare. Record non collegati Totale record Tipologia familiare

v.a. % di colonna

v.a. % non collegati sul

totale

Persona sola 1945 13,6 14074 13,8

Coppia sola 882 6,2 14226 6,2

Coppia con altri 95 0,7 1097 8,7

Coppia con figli 7245 50,5 49810 14,5

Coppia con figli e altri 1306 9,1 7188 18,2

Un genitore con figli 1710 11,9 9295 18,4

Un genitore con figli e altri 404 2,8 2121 19,0

Altro tipo 752 5,2 3527 21,3

Totale 14339 100,0 101338 14,1

Tabella 6: Record non collegati del Censimento 2001 distinti per tipologia familiare. Record non collegati Totale record Tipologia familiare

v.a. % di colonna

v.a. % non collegati sul

totale

Persona sola 3031 26,2 17220 17,6

Coppia sola 2223 19,2 16630 13,4

Coppia con altri 102 0,9 960 10,6

Coppia con figli 3760 32,5 43701 8,6

Coppia con figli e altri 321 2,8 3742 8,6

Un genitore con figli 1069 9,2 10323 10,4

Un genitore con figli e altri 254 2,2 1984 12,8

Altro tipo 798 6,9 3039 26,3

Totale 11558 100,0 97599 11,8

Quanto alle potenzialità di questo metodo nel fornire elementi di analisi (tutto sommato “a basso costo”) della dinamica strutturale della popolazione e delle famiglie riportiamo in appendice, a titolo esemplificativo, alcune matrici di transizioni e tabulazioni differenziali di interesse. Le tabelle sono riferite alle singole persone, le femmine residenti a Brescia, cui abbiamo assegnato la tipologia familiare di appartenenza al Censimento 1991 e 2001, quindi non è corretto interpretare i dati come transizioni tra le famiglie, con alcune evidenti eccezioni. Tuttavia anche con le avvertenze ora esposte i dati consentono di analizzare (con un certo grado di dettaglio) i processi di costruzione e dissoluzione delle famiglie, approfondendo gli aspetti di interesse, selezionando gli incroci che interessano e dettagliando rispetto alle variabili differenziali. Così dalla tabella generale riportata di seguito, abbiamo analizzato con un maggiore grado di dettaglio i 2.184 casi in cui la persona che era componente di una coppia sola al Censimento 1991 risulta da sola nel 2001; la variabile differenziale introdotta è l’età.

Tabella 19: Matrice di transizione delle femmine tra le tipologie familiari dei Censimenti 1991 e 2001.

Valori assoluti. Censimento 2001 Censimento 1991

Perso-na sola

Cop-pia sola

Cop-pia con figli

Geni-tore con

figli

Cop-pia con altri

Cop-pia con figli e altri

Geni-tore con

figli e altri

Altro tipo

Tot.

Persona sola 5517 164 118 142 25 48 33 150 6197

Coppia sola 2189 5224 1539 157 71 101 45 78 9404

Coppia con figli 1209 5094 23423 3016 131 821 266 195 34155

Genitore con figli 1206 146 375 3077 19 32 242 195 5292

Coppia con altri 77 196 55 21 105 29 8 62 553

Coppia con figli e altri 167 364 1695 243 219 998 150 74 3910

Genitore con figli e altri 195 43 124 236 14 46 332 94 1084

Altro tipo 405 65 69 172 6 17 26 570 1330

Tot. 10965 11296 27398 7064 590 2092 1102 1418 61925

La tabella di dettaglio, che è riportata in appendice, indica che più dell’85% delle transizioni tra i due

tipi considerati accade a donne di età superiore a 54 anni di età nel 1991, compatibilmente con l’ipotesi che sia la morte del coniuge a provocare questa transizione. La quota rimanente può essere ricondotta agli elementi sociali di scioglimento della coppia.L’esemplificazione illustrata dovrebbe, nelle nostre intenzioni, avere chiarito un aspetto cruciale del modello dinamico, che consiste nella sua iteratività, procedendo per approfondimenti successivi introducendo via via le variabili differenziali rilevanti per l’analisi. Nell’esempio precedente la transizione tra coppia sola e persona sola, o tra coppia con figli e coppia sola, è stata analizzata introducendo la variabile differenziale età, mentre abbiamo considerato il numero di figli nel caso dell’analisi della permanenza della persona in una famiglia con la medesima tipologia della coppia con figli. Le considerazioni precedenti riteniamo siano sufficienti a commentare le elaborazioni ottenibili da una base di dati come quella illustrata organizzata secondo il modello della contabilità demografica. Non riteniamo esaurite, invece, le riflessioni sulla ricchezza informativa che il modello di contabilità demografica consente una volta che si proceda iterativamente andando via via ad affinare l’analisi differenziale fino ad individuare all’interno della popolazione sotto studio gli eventi accaduti e gli esposti al rischio.

5. Riferimenti bibliografici

Il tema del record linkage in ambito statistico non è sicuramente nuovo; è quindi facile trovare testi che contengono una bibliografia aggiornata e completa come il classico di Newcombe, H. B., Handbook of

Record Linkage: Methods for Health and Statistical Studies, Administration, and Business, Oxford: Oxford University Press, 1988, o il più recente volume Istat, Metodi statistici per il record linkage,

Metodi e norme, n. 16, 2003. Abbiamo ritenuto più proficuo per il lettore riportare di seguito riferimenti bibliografici che illustrano progetti di ricerca ed elaborazioni maturati al di fuori dello stretto ambito statistico, anche per dare concretezza all’idea che l’uso di modelli dinamici di analisi dei vari fenomeni si scontra con la carenza delle fonti più per un certo conservatorismo metodologico che per la effettiva carenza di dati.

Adam M., Wilson H., Casto D., Berg C., McDermott J., Gaudino J, McCarthy B., Constructing reproductive histories by linking vital records, American Journal of Epidemiology, vol. 145, n. 4, 1997, Batimore, Maryland

Andes N., Davis J., Linking public health data usig geographic information system techniques:Alaskan

community characteristics and infant mortality, Statistics in Medicine, vol. 14, n. 5-7, 1995 Augustini M., Tax lists and family records compared: the value of data linkage. An example from a

rural parish in Auvergne, Annales de Demographie Historique, 1990, Paris, France Baldwin J. A., Linked record health data systems, The Statistician, vol. 21, n. 4, 1972 Baras M., Peritz E., Parity progression among Jewish women in Israel: a record linkage study, in

Studies in fertility of Israel, edt. By Peritz E. and Baras M., 1992, Hebrew University of Jerusalem, Jerusalem, Israel

Barbieri M., Toulemon L., The social inequality of children with regard to mortality. Problems of

observation and measurement, Morbidité, Mortalité: Problèmes de Mesure, Facteurs d’Evolution, Essai de Prospective. Colloque international de Sinaia, 1996, AIDELF, Association Internationale des Démographes de Langue Français, Paris, France, Presses Universitaires de France

de Beer J., Kuijper H., Noordam R., Prins K., Sprangers A., Linking of immigrant flow and stock data

in the Netherlands; present and future possibilities, Statistical Journal of the United Nations Economic Commission for Europe, vol. 10, n. 4, 1993 Amsterdam

Belin, T. R., and Rubin, D. B., A Method for Calibrating False-Match Rates in Record Linkage, Journal of the American Statistical Association, 90, 1995

Bengtsson T., Lundh C., Evaluation of a Swedish computer program for automatic family

reconstruction, Lund Paper in Economic History, n. 8, 1991, Lund University, Sweden Bracken I., Martin D., Linkage of the 1981 and 1991 UK censuses using surface modelling concepts,

Environment and Planning A, vol. 27, n. 3, mar. 1995, London Camporese R., Collegamento statistico di dati censuari: aspetti sociali, Tesi di Laurea, Università degli

Studi di Padova, depositata 1/1/1987 Copas, J. R., and F. J. Hilton, Record Linkage: Statistical Models for Matching Computer Records,

Journal of the Royal Statistical Society, A, 153, 1990 Christensen H. T., The method of record linkage applied to family data, Marriage and Family Living,

vol. 20, n. 1, Feb. 1958 Christensen H. T., Child spacing analysis via record linkage: New data plus a summing up from erlier

reports, Marriage and Family Living, vol. 37, n. 2, aug 1963 Debabrata D., Record matching in data warehouse: a decision model for data consolidation,

Operations Research, vol. 51, n. 2, mar-apr 2003Denton F. T., Feaver C. H., Spencer B. G., MEDS – Models of the Economic-Demographic System: a

report on the project and some preliminary analysis, QSEP Research Report, n. 246, McMaster University, Faculty of Social Sciences, Program for Quantitative Studies in Economics and Population, Hamilton, Canada, 1989

Elklit J., Nominal record linkage and the study on non-secret voting: a Danish case, Journal of

Interdisciplinary History, vol. 15, n. 3, Winter 1985 Fair M., Cyr M., The Canadian Birth Data Base: A new research tool to study reproductive outcomes,

Health Reports, vol. 5, n. 3, 1993, Ottawa Fellegi, I. P., and A. B. Sunter, A Theory for Record Linkage, Journal of the American Statistical

Association, 64, 1969 Ferrie J., A new sample of males linked to Public Use Microdata Sample of the 1850 US Federal

Census of Population to the 1860 US Federal Census manuscript schedules, Historical Methods, vol. 29, n. 4, Fall 1996, Washington

Gissler M., Kauppila R., Meriläinen J., Toukomaa H., Hemminki E., Pregnancy-associated death in

Finland 1987-1994. Definition problems and benefit of record linkage, Acta Obstetricia et Gynecologica Scandinavica, vol. 76, n. 7, 1997, Copenhagen

Gover J. C., Ross G. J. Minimum spanning trees and single linkage cluster analysis, Applied Statistics,

vol. 18, n. 1, 1969 Grundy E. M. D., Socio-demographic variations in rates of movement into institutions among elderly

people in England and Wales: An analysis of linked census and mortality data 1971-1985,

Population Studies, vol. 46, n.1, mar. 1992, LondonHaskey J., Identical addresses at marriage and pre-marital cohabitation: results from linking marriage

registration and census records, Populatin Trends, n. 59, Spring 1990, London Hill M. E., Preston S. H., Rosenwaike I., age reporting omong white American aged 85+: results of a

record linkage study, Demography, vol. 37, n. 2, May 2000

Holian J., Orr B., A method for linking live birth and infant death records, in Studies in applied demography: proceedings of the 5th international Conference on Applied Demography, 1994, edt. By Vaninadha Rao K., 1996

Holian J., Client and birth record linkage: a method, biases, and lessons, Evaluation Practice, vol. 17, n. 3, 1996, Greenwich

Huneke C., Ulrich B., The structure of Linkage, The annals of mathematics, Second Series, vol. 126, n. 2, 1987

Istat, Metodi statistici per il record linkage, Metodi e norme, n. 16, 2003 Istat, La progettazione dei censimenti generali 2010-2011. 3- Criticità di processo e di prodotto del 14°

Censimento generale della popolazione e delle abitazioni: aspetti rilevanti per la progettazione

del 15° Censimento, Roma, 2007 Istat, Conoscere il 14° Censimento generale della popolazione e delle abitazioni – La qualità dei dati,

Roma, 2008 Jaro, M. A., Advances in Record-Linkage Methodology as Applied to Matching the 1985 Census of

Tampa, Florida, JASA, Journal of the American Statistical Association, 89, 1989 Kilss, B. and Alvey, W. (eds.), Record Linkage Techniques -- 1985 Statistics of Income Division,

Internal Revenue Service Publication 1299, 1985 Larsen M. D., Rubin D. B., Iterative automated record linkage using mixture models, Journal of the

American Statistical Association, vol. 96, n. 453, mar. 2001 Leibson C., Ballard D., Whisnant J., Melton J., The compression of morbidity hypothesis: promise and

pitfalls of using record-linked data bases to assess secular trends in morbidity and mortality, Milbank Quarterly, vol. 70, n. 1, 1992, New York

MacDorman M., Atkinson J., Infant mortality statistics from the linked birth/infant data set – 1995

period data, NCHS Monthly Vital Statistics Report, vo. 46, n. 6., supp. 2, 1998, NCHS, Hyattsville, Maryland

Martelin T., Differentiol mortality at older ages: sociodemographic mortality differences among the

Finnish elderly, Publication of the Finmnish Demographic Society, n. 16, 1994 Finnish demographic society, Helsinki

Mineau G. P., Bean L. L., Anderton D. L., Description and evaluation of linkage of the 1880 census to

family genealogies: implications for Utah fertility research, Historical Methods, vol. 22, n. 4, fall 1989

Newcombe, H. B., Handbook of Record Linkage: Methods for Health and Statistical Studies,

Administration, and Business, Oxford: Oxford University Press, 1988 Newcombe H. B., Fair M. E., Lalonde P., The use of names for linking personal records, Journal of the

American Statistical Association, vol. 87, n. 420, dec. 1992 Newcombe, H. B., J. M. Kennedy, S. J. Axford, and A. P. James, Automatic Linkage of Vital Records,

Science, 130, 1959 Nicolini A., Collegamento statistico di dati censuari: aspetti demografici, Tesi di Laurea, Università

degli Studi di Padova, depositata 1/1/1987 Pouyez C., Roy R., Martin F., The lonkage of census name data: problems and procedures, Journal of

Interdisciplinary History, vol. 14, n.1, Summer 1983 Riva L., Trentini M., Informazione statistica e processi decisionali pubblici: un quadro di riferimento,

Università degli studi di Brescia, Dipartimento Metodi Quantitativi, Quaderno n. 145, 1998 Rogot, E., P. Sorlie, and N. Johnson, Probabilistic methods of matching Census samples to the National

Death Index, Journal of Chronic Disease, 39, 1986 Rosenwaike I., Hill. M., Preston S., Elo I., Linking death certificates to early census records: The

African American Matched Records Sample, Historical Methods, vol. 31, n. 2, Spring 1998, Washington

Taucher E., Díaz N., Icaza G., Matching data on infant mortality and births in Chile, Notas de Población, Vol. 26, n. 67-68, Jan-Dec 1998, Santiago, Chile

Tepping B. J., A model for optimum linkage of records, Journal of the American Statistical

Association, vol. 63, n. 324, dec. 1968 Schofield R., Automatic family reconstruction: the Cambridge experience, Historical Methods, vol. 25,

n.2, Spring 1992, Washington D.C. Smith C. A. B., The detection of linkage in human genetic, Journal of the Royal Statistical Society,

Series B (Methodological), vol. 15, n. 2, 1953 Steinhoff P. G., Smith R., Palmore J. A., Diamond M., Chung C. S., Women who obtain repeat

abortions: a study based on record linkage, Family Planning Perspectives, vol. 11, n. 1, Jan.-Feb. 1979

Udry R., Gaughan M., Schwingl P., van den Berg B., A medical record linkage analysis of abortion

underreporting, Family Planning Perspectives, vol. 28, n. 5, Sept.-Oct. 1996, New York United State. National Center for Health Statistics NCHS, Linked birth and infant death data set, 1987,

MRDF, Hyattsville, Mariland Welford J. A., Nominal record linkage: the development of computer strategies to schieve the family-

based record linkage of nineteenth century demographic data, University Microfilm International, Ann Arbor, Michigan, 1989

Willekens F., Monitoring international migration flows in Europe. Towards a statistical data base

combining data from different sources, European Journal of Population, vol. 10, n. 1, 1994, Netherlands

Winchester I., The linkage of historical records by man and computer: techniques and problems, Journal of Interdisciplinary History, vol. 1, n. 1, Autumn 1970

Winkler, W. E., Advanced Methods of Record Linkage, American Statistical Association, Proceedings

of the Section of Survey Research Methods, 1994 Winkler, W. E., Matching and Record Linkage, in B. G. Cox et al. (ed.) Business Survey Methods, New

York: J. Wiley, 1995 Wright R. A., Ellis M., Reibel M., The linkage between immigration and internal migration in large

metropolitan areas in the United States, Economic Geography, vol. 73, n. 2, apr. 1997

Appendice statistica

Tabella 10: Numero di duplicazioni dei dati anagrafici per sesso Censimenti 1991 Comune di Brescia Femmine Maschi Numero di

duplica-zioni Frequenza sulle

duplicazioni

Frequenza sulle persone

Frequenza sulle persone

in %

Frequenza sulle

duplicazioni

Frequenza sulle persone

Frequenza sulle persone

in % 1 55684 55684 55,0 45044 45044 50,12 7261 14522 14,3 6511 13022 14,53 4196 12588 12,4 3930 11790 13,14 2180 8720 8,6 2173 8692 9,75 1011 5055 5,0 1059 5295 5,96 428 2568 2,5 556 3336 3,77 179 1253 1,2 201 1407 1,68 74 592 0,6 108 864 1,09 23 207 0,2 31 279 0,3

10 13 130 0,1 21 112 0,1Totale 71049 101319 100,0 59634 89841 100,0

Tabella 11: Numero di duplicazioni dei dati anagrafici per sesso Censimenti 2001 Comune di Brescia Femmine Maschi Numero di

duplica-zioni Frequenza sulle

duplicazioni

Frequenza sulle persone

Frequenza sulle persone

in %

Frequenza sulle

duplicazioni

Frequenza sulle persone

Frequenza sulle persone

in % 1 52515 52515 53,8 44541 44541 50,92 7867 15734 16,1 7333 14666 16,83 4610 13830 14,2 4216 12648 14,54 2136 8544 8,7 2041 8164 9,35 832 4160 4,3 833 4165 4,86 303 1818 1,9 333 1998 2,37 96 672 0,7 117 819 0,98 31 248 0,3 40 320 0,49 11 99 0,1 10 90 0,1

10 3 30 0,0 10 112 0,1Totale 68404 97650 100,0 59474 87513 100,0

Tabella 12: Numero di duplicazioni dei dati anagrafici per sesso Censimento 1991

Provincia di Brescia Femmine Maschi Numero di

duplica-zioni Frequenza sulle

duplicazioni

Frequenza sulle persone

Frequenza sulle persone

in %

Frequenza sulle

duplicazioni

Frequenza sulle persone

Frequenza sulle persone

in % 1 228578 228578 43,2 193040 193040 38,22 18231 36462 6,9 17627 35254 7,03 7205 21615 4,1 7030 21090 4,24 5694 22776 4,3 5201 20804 4,15 4897 24485 4,6 4283 21415 4,26 4527 27162 5,1 3808 22848 4,57 3999 27993 5,3 3343 23401 4,68 3403 27224 5,2 2943 23544 4,79 2885 25965 4,9 2470 22230 4,4

10 2266 22660 4,3 2285 22850 4,511 1700 18700 3,5 1948 21428 4,212 1218 14616 2,8 1561 18732 3,713 898 11674 2,2 1189 15457 3,114 496 6944 1,3 972 13608 2,715 333 4995 0,9 663 9945 2,016 189 3024 0,6 456 7296 1,417 85 1445 0,3 284 4828 1,018 52 936 0,2 171 3078 0,619 32 608 0,1 97 1843 0,4

20 e più 32 1106 0,3 149 4973 1,4Totale 286720 528968 100,1 249520 507664 100,3

Tabella 13: Numero di duplicazioni dei dati anagrafici per sesso Censimento 2001

Provincia di Brescia Femmine Maschi Numero di

duplica-zioni Frequenza sulle

duplicazioni

Frequenza sulle persone

Frequenza sulle persone

in %

Frequenza sulle

duplicazioni

Frequenza sulle persone

Frequenza sulle persone

in % 1 246897 246897 44,1 218253 218253 40,42 22812 45624 8,1 22694 45388 8,43 9221 27663 4,9 9036 27108 5,04 6923 27692 4,9 6501 26004 4,85 6073 30365 5,4 5663 28315 5,26 5148 30888 5,5 4787 28722 5,37 4366 30562 5,5 4000 28000 5,28 3550 28400 5,1 3342 26736 4,99 2730 24570 4,4 2672 24048 4,4

10 2032 20320 3,6 2155 21550 4,011 1414 15554 2,8 1554 17094 3,212 963 11556 2,1 1194 14328 2,613 592 7696 1,4 818 10634 2,014 339 4746 0,8 589 8246 1,515 223 3345 0,6 394 5910 1,116 99 1584 0,3 246 3936 0,717 68 1156 0,2 146 2482 0,518 34 612 0,1 75 1350 0,219 15 285 0,1 40 760 0,1

20 e più 14 386 0,1 76 1887 0,4Totale 313513 559901 100,0 284235 540751 100

Figura 5: Numero di duplicazioni per genere: Censimento 1991.

0,0

5,0

10,0

15,0

20,0

25,0

30,0

35,0

40,0

45,0

50,0

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Numero di duplicazioni

% s

ulle

pe

rso

ne

Femmine Maschi

Tabella 14: Schema della contabilità demografica applicato al linkage dei record censuari delle

femmine del Comune di Brescia.

Censimenti 1991 e 2001 2001 1991

Sopravviventi Usciti 91-01 Non collegati Totale

Sopravviventi 61941 25058 14339 101338

Nati tra 91-01 7608 - - 7608

Immigrati 91-01 2870 - - 2870

Entrati 91-01 13669 - - 13669

Non collegati 11562 - - 11562

Totale 97650 25058 14339 137047

Percentuali di colonna

Sopravviventi Usciti 91-01 Non collegati Totale

Sopravviventi 63,4 100,0 100,0 73,9

Nati tra 91-01 7,8 - - 5,6

Immigrati 91-01 2,9 - - 2,1

Entrati 91-01 14,0 - - 10,0

Non collegati 11,8 - - 8,4

Totale 100,0 100,0 100,0 100,0

Percentuali di riga

Sopravviventi Usciti 91-01 Non collegati Totale

Sopravviventi 61,1 24,7 14,1 100,0

Nati tra 91-01 100,0 - - 100,0

Immigrati 91-01 100,0 - - 100,0

Entrati 91-01 100,0 - - 100,0

Non collegati 100,0 - - 100,0

Totale 71,3 18,3 10,5 100,0

Tabella 15: Record non collegati del Censimento 1991 distinti per tipologia familiare. Record non collegati Totale record Tipologia familiare

v.a. % di colonna v.a. % non collegati sul totale

Persona sola 1945 13,6 14074 13,8

Coppia sola 882 6,2 14226 6,2

Coppia con altri 95 0,7 1097 8,7

Coppia con figli 7245 50,5 49810 14,5

Coppia con figli e altri 1306 9,1 7188 18,2

Un genitore con figli 1710 11,9 9295 18,4

Un genitore con figli e altri 404 2,8 2121 19,0

Altro tipo 752 5,2 3527 21,3

Totale 14339 100,0 101338 14,1

Tabella 16: Record non collegati del Censimento 2001 distinti per tipologia familiare. Record non collegati Totale record Tipologia familiare

v.a. % di colonna v.a. % non collegati sul totale

Persona sola 3031 26,2 17220 17,6

Coppia sola 2223 19,2 16630 13,4

Coppia con altri 102 0,9 960 10,6

Coppia con figli 3760 32,5 43701 8,6

Coppia con figli e altri 321 2,8 3742 8,6

Un genitore con figli 1069 9,2 10323 10,4

Un genitore con figli e altri 254 2,2 1984 12,8

Altro tipo 798 6,9 3039 26,3

Totale 11558 100,0 97599 11,8

Tabella 17: Flussi in uscita dal Censimento 1991 per tipologia familiare. Record non collegati Totale record Tipologia familiare

v.a. % di colonna v.a. % non collegati sul totale

Persona sola 5930 23,7 14074 42,1

Coppia sola 3938 15,7 14226 27,7

Coppia con altri 449 1,8 1097 40,9

Coppia con figli 8406 33,5 49810 16,9

Coppia con figli e altri 1969 7,9 7188 27,4

Un genitore con figli 2288 9,1 9295 24,6

Un genitore con figli e altri 633 2,5 2121 29,8

Altro tipo 1445 5,8 3527 41,0

Totale 25058 100,0 101338 24,7

Tabella 18: Flussi in entrata al Censimento 2001 per tipologia familiare. Record non collegati Totale record Tipologia familiare

v.a. % di colonna v.a. % non collegati sul totale

Persona sola 2818 20,6 17220 16,4

Coppia sola 2685 19,7 16630 16,1

Coppia con altri 159 1,2 960 16,6

Coppia con figli 5055 37,0 43701 11,6

Coppia con figli e altri 593 4,3 3742 15,8

Un genitore con figli 1388 10,2 10323 13,4

Un genitore con figli e altri 313 2,3 1984 15,8

Altro tipo 636 4,7 3039 20,9

Totale 13647 100,0 97599 14,0

Tabella 19: Matrice di transizione delle femmine tra le tipologie familiari dei Censimenti 1991 e 2001.

Valori assoluti. Censimento 2001 Censimento 1991

Perso-na sola

Coppia sola

Coppia con figli

Un genito-re con figli

Coppia con altri

Coppia con figli e altri

Un genito-re con figli e altri

Altro tipo

Totale

Persona sola 5517 164 118 142 25 48 33 150 6197

Coppia sola 2189 5224 1539 157 71 101 45 78 9404

Coppia con figli 1209 5094 23423 3016 131 821 266 195 34155

Un genitore con figli 1206 146 375 3077 19 32 242 195 5292

Coppia con altri 77 196 55 21 105 29 8 62 553

Coppia con figli e altri 167 364 1695 243 219 998 150 74 3910

Un genitore con figli e altri 195 43 124 236 14 46 332 94 1084

Altro tipo 405 65 69 172 6 17 26 570 1330

Totale 10965 11296 27398 7064 590 2092 1102 1418 61925

Tabella 20: Matrice di transizione delle femmine tra le tipologie familiari dei Censimenti 1991 e 2001.

Percentuali di colonna. Censimento 2001

Censimento 1991

Perso-na sola

Coppia sola

Coppia con figli

Un genito-re con figli

Coppia con altri

Coppia con figli e altri

Un genito-re con figli e altri

Altro tipo

Totale

Persona sola 50,3 1,5 0,4 2,0 4,2 2,3 3,0 10,6 10,0

Coppia sola 20,0 46,2 5,6 2,2 12,0 4,8 4,1 5,5 15,2

Coppia con figli 11,0 45,1 85,5 42,7 22,2 39,2 24,1 13,8 55,2

Un genitore con figli 11,0 1,3 1,4 43,6 3,2 1,5 22,0 13,8 8,5

Coppia con altri 0,7 1,7 0,2 0,3 17,8 1,4 0,7 4,4 0,9

Coppia con figli e altri 1,5 3,2 6,2 3,4 37,1 47,7 13,6 5,2 6,3

Un genitore con figli e altri 1,8 0,4 0,5 3,3 2,4 2,2 30,1 6,6 1,8

Altro tipo 3,7 0,6 0,3 2,4 1,0 0,8 2,4 40,2 2,1

Totale 100,0 100,0 100,0 100,0 100,0 100,0 100,0 100,0 100,0

Tabella 21: Matrice di transizione delle femmine tra le tipologie familiari dei Censimenti 1991 e 2001.

Percentuali di riga. Censimento 2001

Censimento 1991

Perso-na sola

Coppia sola

Coppia con figli

Un genito-re con figli

Coppia con altri

Coppia con figli e altri

Un genito-re con figli e altri

Altro tipo

Totale

Persona sola 89,0 2,6 1,9 2,3 0,4 0,8 0,5 2,4 100,0

Coppia sola 23,3 55,6 16,4 1,7 0,8 1,1 0,5 0,8 100,0

Coppia con figli 3,5 14,9 68,6 8,8 0,4 2,4 0,8 0,6 100,0

Un genitore con figli 22,8 2,8 7,1 58,1 0,4 0,6 4,6 3,7 100,0

Coppia con altri 13,9 35,4 9,9 3,8 19,0 5,2 1,4 11,2 100,0

Coppia con figli e altri 4,3 9,3 43,4 6,2 5,6 25,5 3,8 1,9 100,0

Un genitore con figli e altri 18,0 4,0 11,4 21,8 1,3 4,2 30,6 8,7 100,0

Altro tipo 30,5 4,9 5,2 12,9 0,5 1,3 2,0 42,9 100,0

Totale 17,7 18,2 44,2 11,4 1,0 3,4 1,8 2,3 100,0

Tabella 22: Transizioni delle femmine tra le tipologie familiari dei Censimenti 1991 e 2001.

Da coppia sola a persona sola per età della persona al Censimento del 1991. Transizioni da coppia sola a

persona sola Transizioni in totale Classe di età

al 1991 v.a. % v.a. % delle transizioni da

coppia sola a persona sola sulle transizioni in totale

Da 20 a 24 19 0,9 2314 0,8

Da 25 a 29 51 2,4 3676 1,4

Da 30 a 34 52 2,5 4535 1,1

Da 35 a 39 35 1,7 4653 0,8

Da 40 a 44 38 1,8 5464 0,7

Da 45 a 49 52 2,5 5469 1,0

Da 50 a 54 90 4,2 5778 1,6

Da 54 a 59 213 10,1 4959 4,3

Da 60 a 64 439 20,7 4868 9,0

Da 65 a 69 575 27,1 4147 13,9

Da 70 a 74 370 17,5 2472 15,0

Da 75 a 79 204 9,6 1604 12,7

Da 80 a 84 49 2,3 631 7,8

Da 85 a 89 2 0,1 135 1,5

Da 90 a 94 0 0,0 6 0,0

Da 95 a 99 0 0,0 1 0,0

Totale 2119 100,0 61925 3,4

Tabella 23: Transizioni delle femmine tra le tipologie dei Censimenti 1991 e 2001.

Da coppia con figli a coppia sola per età della persona al Censimento del 1991. Transizioni da coppia con figli a

coppia sola Transizioni in totale Classe di età

al 1991 v.a. % v.a. % delle transizioni da

coppia con figli a coppia sola sulle

transizioni in totale

Da 25 a 29 5 0,1 3676 0,1

Da 30 a 34 29 0,6 4535 0,6

Da 35 a 39 115 2,4 4653 2,5

Da 40 a 44 489 10,2 5464 8,9

Da 45 a 49 992 20,7 5469 18,1

Da 50 a 54 1403 29,2 5778 24,3

Da 54 a 59 987 20,6 4959 19,9

Da 60 a 64 572 11,9 4868 11,8

Da 65 a 69 180 3,8 4147 4,3

Da 70 a 74 27 0,6 2472 1,1

Da 75 a 79 1 0,0 1604 0,1

Da 80 a 84 0 0,0 631 0,0

Da 85 a 89 0 0,0 135 0,0

Da 90 a 94 0 0,0 6 0,0

Da 95 a 99 0 0,0 1 0,0

Totale 4800 100 61925 7,8

Tabella 24: Transizioni delle femmine tra le tipologie familiari dei Censimenti 1991 e 2001.

Coppia con figli per numero di figli. Censimento 2001

Numero di figli Censimento

1991 Numero di figli 1 2 3 e più Totale

1 4667 1204 199 6070

2 2288 3909 282 6479

3 e più 400 415 555 1370

Totale 7355 5528 1036 13919

Percentuali di riga

Censimento 2001 Numero di figli

Censimento 1991

Numero di figli 1 2 3 e più Totale

1 76,9 19,8 3,3 100,0

2 35,3 60,3 4,4 100,0

3 e più 29,2 30,3 40,5 100,0

Totale 52,8 39,7 7,4 100,0

Percentuali di colonna

Censimento 2001 Numero di figli

Censimento 1991

Numero di figli 1 2 3 e più Totale

1 63,5 21,8 19,2 43,6

2 31,1 70,7 27,2 46,5

3 e più 5,4 7,5 53,6 9,8

Totale 100,0 100,0 100,0 100,0

QUADERNI DI RICERCA DEL

DIPARTIMENTO METODI QUANTITATIVI

1989 1. G. Gambarelli - Inizia l'età del Software: prospettive positive e negative. 2. R. Colombi - Estimation of stochastic frontiers with censored data. 3. R. Colombi - Un nuovo modello per la distribuzione dei redditi: la distribuzione pareto-lognormale. 4. G. Carcano - Algebras of invariant functions on the silov boundary of generalized half-planes. 5. G. Carcano - Hermetian symmetric spaces and siegel domains. 6. L. Dancelli - Confronti fra le curve di concentrazione Z (P) e L (P) nel modello di Dagum. 7. L. Dancelli - Sulle determinanti dell'andamento della curva di concentrazione Z(P).

19908. L. Riva - Sulle relazioni fra indicatori analitici ed indicatori sintetici di fecondità. 9. L. Riva - L'interpolazione fra quozienti specifici di fecondità. 10. R. Colombi - Il modello parete-lognormale nell'analisi dei dati di durata. 11. R. Colombi - A new model of income distribution: the pareto-lognormale distribution. 12. G. Carcano - Maximal ideal space for classical domains. 13. G. Vittadini - Sull'uso delle componenti principali come imput nella cluster analysis agglomerativa. 14. G. Vittadini - Una approssimazione della variabile casuale G di C. Gini. 15. G. Vittadini - Indici superlativi ed assiomaticamente corretti. 16. F.Maria Paris - Effetti della quotazione sul costo del capitale di rischio. 17. P. Falbo - Credit-scoring by enlarged discriminant models. 18. M.C. Zanarotti - Un breve "excursus" sulle superpopolazioni. 19. G. Vittadini - Un confronto fra un modello di analisi casuale con variabili latenti e metodi alternativi. 20. L. Pogliaghi - Applicazioni dei minimi quadrati e problemi finanziari.

199121. M.G. Speranza, W. Ukovich - Minimizing transportation and inventory costs for several products on a single link. 22. L. Riva - Un modello di stima dei redditi familiari (in Valcamonica nell'81). 23. L. Riva - Sulla classificazione dei comuni in urbani e rurali. 24. P. Serafini, M.G. Speranza - A multistage decomposition approach for a resource constrained scheduling problem. 25. P. Falbo - Capital budgeting under uncertainty. 26. M.G. Speranza, W. Ukovich - A capacitated transportation problem with factoring costs. 27. G. Carcano - Some theoretical remarks as forward prices and futures prices. 28. M.G. Speranza, W. Ukovich - Applying on optimization model to production management and logistics. 29. M.G. Speranza, W. Ukovich - A decision support system for materials management. 30. A. Resti - Una proposta di scomposizione in covarianze delle variazioni del coSto implicito della raccolta da

clientela. 31. M.G. Speranza, J. Blazewicz, P. Dell'Olmo, M. Drozdowski - Scheduling multiprocessor tasks on three dedicated

processors. 32. F.M. Paris - Un modello di valutazione degli swaps in valuta. Implicazioni teoriche.

199233. M.G. Speranza - Distribution free Portfolio Optimization. 34. M.G. Speranza, W.Ukovich - Period job shop problems. 35. E. Sagonti - A Study of monotonicity properties for the lemaire index. 36. M.G. Speranza - Linear Models for Portfolio Optimization. 37. M. Frittelli - Caratterizzazione delle martingale nella classe dei processi limitati inferiormente: applicazione

all'arbitraggio. 38. P. Ferrari - Sul modello Multi-Poisson-Bernoulli. 39. L. Bianco, P. Dell'Olmo, M.G. Speranza - Scheduling indipendent tasks with multiple modes. 40. M.G. Speranza, W. Ukovich - Scheduling periodic job shop. 41. P. Ferrari - Verifica di ipotesi sulla media mediante test bilanciati. 42. P. Dell'Olmo, M.G. Speranza - Graph-Theoretical Models for Scheduling Problems with Dedicated Resources and

Precedence Contraints. 43. M.G. Speranza - A Mixed Integer Linear Programming Model for Portfolio Optimization. 44. L. Riva - In tema di scomposizioni nel confronto tra quozienti. 45. M.G. Speranza, C. Vercellis - Hierarchical models for multi-project planning and scheduling. 46. L. Bianco, P. Dell'Olmo, M.G. Speranza - A Decomposition approach to a scheduling problem with multiple

modes.

47. P. Serafini, M.G. Speranza - A Decomposition approach in a DSS for a resource constrained scheduling problem. 48. M.G. Speranza, W. Ukovich - Models for periodic production. 49. L. Dancelli - Test di adattamento per distribuzioni di cui siano note frequenze e quantità. 50. L. Dancelli - Sul comportamento asintotico della statistica V2 nel caso di ipotesi composita: uno studio empirico su

modelli con parametri stimati con il metodo della massima verosimiglianza da dati individuali. 51. M.G. Speranza - Linear Programming Models for Portfolio Optimization. 52. P. Falbo - The evaluation of natural resource companies: the case of oil.

199353. M. Frittelli - Sull'esistenza di una misura equivalente di martingala. 54. F.M. Paris - A partial view on a mutual deposit guarantees system. 55. F.M. Paris - Alcune puntualizzazioni per una teoria degli interest rate swaps. 56. M.G. Speranza - Un modello lineare a variabili miste intere per la scelta del portafoglio. 57. P. Dell'Olmo, M.G. Speranza, Zs. Tuza - Polynomial instances and approximation results for the scheduling

problem on three dedicated processors. 58. L. Riva - Valori attuariali e indici demografici.

199459. R. Camillo - S-Equivalenza del gioco di sopravvivenza. 60. F. Mecatti - Il bootstrap semi parametrico per lo stimatore rapporto fra medie campionarie. 61. F.M. Paris - Optimizing the required reserve deposit management by the italian banks. 62. S. Camiz, M. Civardi, R. Cremonesi, P. Falbo, S. Stefani, S. Zoppetti - Indagine sulla popolazione studentesca

dell'Università di Brescia, Facoltà di Economia e Commercio (Anno Accademico 1992-93). 63. M. Carpita - Distribuzione asintotica della statistica V2 nel caso di stima dei parametri con il metodo di massima

verosimiglianza. 64. M. Carpita - Distribuzione asintotica della statistica V2 in situazioni non standard. 65. M. Carpita - Sull'utilizzo di tutta l'informazione disponibile per la stima dei parametri nel caso di distribuzioni di

frequenze e quantità. 66. R. Barcellan, T. Di Fonzo - Disaggregazione temporale e modelli ARIMA. 67. F.M. Paris - Ancora sulla teoria degli interest rate swaps. 68. M. Badioli, S. Camiz - L'offerta di servizi alle famiglie della Lombardia Orientale. 69. F. Camillo - La stima dell'offerta comunale per il territorio della Lombardia Orientale: una strategia per la

traslazione di modelli fattoriali e discriminanti dalle Province ai Comuni. 70. P. Dell'Olmo, M.G. Speranza, Zs. Tuza - Efficient approximation for some multiprocessor scheduling problems. 71. F. Mecatti - Sui momenti delle variabili casuali momento campionario. 72. S. Stefani, P. Falbo - The cotton futures market: investment strategies and convenience yield evaluation. 73. M. Zuanon - Opportunità di arbitraggio tra futures su indice e portafoglio di titoli. 74. F.M. Paris - I gruppi industriali italiani alla luce della teoria finanziaria. 75. P. Falbo, S. Stefani, G. Zambruno - Operating strategies in commodity futures markets: the case of cotton. 76. E. Allevi, P.V. Dolci, L. Pappalardo, G.M. Zambruno - Ricerca di dipendenze a lungo termine nei rendimenti di

titoli azionari. 77. M.G. Speranza - A mixed integer linear model for portfolio selection. 78. L. Riva - Sulla tabulazione delle tavole di mortalità. 79. L. Bertazzi, M.G. Speranza, W. Ukovich - Minimization of logistic costs with given frequencies.

199580. S. Camiz, M. Falbo, A. Federici, S. Stefani, E. Torrisi - Il grafo stradale della Lombardia. 81. S. Camiz, O. Tallone, V. Tulli - L’analisi dei Comuni della Lombardia in base ai servizi alle famiglie. 82. M. Badioli, S. Camiz, V. Tulli - I servizi alle famiglie in Lombardia. 83. F. Mecatti - Proposta per un nuovo test di omogeneità delle varianze. 84. G. Carcano - Una proprietà delle funzioni uniformemente continue e a potenza integrabile su gruppi localmente

compatti. 85. G. Carcano - Su un problema di non equivalenza di norme nello spazio dei coefficienti di una rappresentazione. 86. T. Di Fonzo, S. Pisani, G. Savio - Revisions to italian quarterly national accounts aggregates: some empirical

results. 87. T. Di Fonzo - Temporal disaggregation of a system of time series when the aggregate is known: optimal vs. a

djustment methods. 88. M. Bottiroli Civardi - Social accounting matrices and environmental models 89. M. Frittelli - Dominated families of martingale, supermartingale and quasimartingale laws. 90. R. Castellano - Un modello per la determinazione dei tassi di cambio in presenza di inversioni di tendenza. 91. R. Castellano - Applicazione del metodo dei momenti simulati alla stima di un modello per la determinazione dei

tassi di cambio.

92. F. Lagona - Linear structural dependence of degree one among data: a statistical model. 93. G.J. Lasinio, P. Vicard - Graphical gaussian models and regression. 94. P. Falbo, M. Frittelli, S. Stefani - Commodity futures markets and trading strategies opportunities. 95. L. Riva - Sulla relazione tra contributi previdenziali e pensioni. 96. M. Frittelli - Valuation principle in security markets models with frictions. 97. F.M. Paris - An alternative theoretical approach to the regulation of bank capital. 98. F. Coramusi - La diversificazione internazionale dei portafogli azionari in mercati "globali": i criteri cambiano? 99. M. Frittelli - Minimal entropy criterion for pricing in one period incomplete markets.

1996100. F. Mecatti - Unbiasedness of the minimum test for homogeneity of variances. 101. L. Bertazzi, M.G. Speranza - Exact and heuristic solutions for a shipment problem with given frequencies. 102. R. Mansini, M.G. Speranza - Applications of a linear programming model for the household refuse collection. 103. F.M. Paris - Subjective seats' valuation in futures exchanges. Implications for the future market. 104. E. Brentari, M. Carpita, L. Dancelli - Alcune soluzioni del problema di Behrens-Fisher basate sull'impiego della t

di Student. 105. M. Frittelli - Dominated families of martingale, supermartingale and quasimartingale laws. 106. M. Frittelli - Semimartingales and asset pricing under portfolio constraints. 107. F.M. Paris - Modelling alternative approaches to financial regulation. 108. M.G. Speranza, Zs. Tuza - On-line approximation algorithms for partitioning items in extendable bins. 109. H. Kellerer, V. Kotov, M.G. Speranza, Zs. Tuza - Semi on-line algorithms for the partition problem. 110. P. Dell’Olmo, S. Giordani, M.G. Speranza - An approximation result for a duo-processor task scheduling problem. 111. F.M. Paris - A theoretical analysis of alternative approaches to financial regulation. 112. S. Camiz, V. Tulli - Un confronto di algoritmi per il calcolo di autovalori ed autovettori di matrici simmetriche. 113. S. Camiz, P. Falbo - Le elezioni nella provincia di Brescia dal 1948 alle europee del 1994. 114. E. Brentari, M. Carpita, L. Dancelli - Su una classe di soluzioni approssimate di tipo i del problema di Behrens-

Fisher. 115. M. Frittelli, P. Lakner - Counterexamples for the existence of the minimal entropy martingale probability. 116. M. Polisicchio, M. Zenga - Il diagramma di curtosi per variabili continue. 117. G. Ceccarossi - Irreducible matrices and primitivity index. 118. P. Falbo - The option valuation principle and the value of a natural resource producing company. 119. P. Falbo, S. Stefani - Profitable decision rules in mean reverting markets. 120. L. Riva - In tema di probabilità per eventi perturbati. 121. S. Stefani, A. Torriero - A multi-media approach teaching mathematics for finance. 122. L. Bonardi - Avanzamenti nella contabilità nazionale trimestrale: l’adozione dello schema SEC95.

1997 123. S.Camiz - Towards the construction of a Europe of Regions.124. L.Riva, G.Zorzan - Un’analisi funzionale della popolazione in condizione professionale al censimento della

popolazione. 125. R.Mansini, M.G.Speranza - Effective linear programming based heuristics for a portfolio selection problem. 126. R.Mansini, M.G.Speranza -A linear programming model for the separate refuse collection service. 127. L.Bertazzi, M.G.Speranza - Heuristic algorithms for a transportation problem with given frequencies on a sequence

of links. 128. M. Badioli, S. Camiz, S. Stefani - La localizzazione dei servizi alle famiglie nella Lombardia orientale. 129. C. Favuzzi, A. Parzani, S. Stefani - Hpertexts and Multimedia in the Practice of Teaching Business. 130. F. Camillo - Modelli e metodi per la stima indiretta del reddito disponibile per micro-aree: una proposta di uso di matrici di frequenza. 131. L.Bertazzi, M.G.Speranza - Inventory Control on Sequences of Links with Given Transportation Frequencies. 132. L.Bertazzi, M.G.Speranza - Optimal Periodic Shipping Strategies for the Single Link Problem. 133. G. Ceccarossi - Processi mean reverting: premio al rischio e strategie operative. 134. R. Mansini, M.G. Speranza - On selecting a Portfolio with Fixed Costs and Minimum Transaction Lots. 135. E. Brentari, M. Carpita, L. Dancelli - Test approssimati di tipo t per il problema di Behrens-Fisher: l’effetto di

alcuni criteri sulla stima dei gradi di libertà. 136. E. Brentari, M. Carpita, L. Dancelli - On the Behrens-Fisher Problem and the Estimate of Approximate Degrees of

Freedom. 137. L. Dancelli - Sulla valutazione della distanza dell’alternativa in problemi di adattamento. 138. E. Brentari, M. Carpita, M. Civardi, L. Dancelli - I laureati della Facoltà di Economia e Commercio dell’

Università di Brescia nel periodo 1986-1993. 139. M. Frittelli, F. Bellini - Certainty Equivalent and no Arbitrage: a Reconciliaton via Duality Theory. 140. P. Dell’Olmo, M.G. Speranza - Approximation algorithms for partitioning small iterms in unequal bins to minimize

the total size.

141. P. Dell’Olmo, H. Kellerer, M.G. Speranza, Z. Tuza - Partitioning items in a fixed number of bins to minimize the total size.

142. M. Carpita - Proprietà finite di alcuni stimatori dei parametri di modelli per distribuzioni di cui siano note frequenze e quantità.

143. M. Carpita - Test di adattamento nel caso di stima dei parametri per distribuzioni di cui siano note frequenze e quantità.

144. M. Carpita - Modelli di regressione in presenza di problemi di misurazione e di selezione.

1998 145. L. Riva, M. Trentini - Informazione statistica e processi decisionali pubblici: un quadro di riferimento. 146. R. Mansini, M.G. Speranza - Selection of Lease Contracts in an Asset-Backed Securitization: a real Case Anaysis. 147. H Kellerer, R. Mansini, U. Pferschy, M.G. Speranza - An Efficient Fully Polynomial Approximation Scheme for

the Subset-Sum Problem. 148. H Kellerer, R. Mansini, M.G. Speranza - Two Linear Approximation Algorithms for the Subset-Sum Problem. 149. R. Mansini, M.G. Speranza - A Multidimensional Knapsack Model for the Selection of Contracts in an Asset-

Backed Securitization. 150. L. Bertazzi, M.G. Speranza - Models and Algorithms for the Minimization of Inventory and Transportation Costs:

A Survey. 151. E. Angelelli - Minimax principle applied to a semi on-line partition problem. 152. F. M. Paris - Valorizzazione e rischiosità dell’one coupon bond. 153. F. M. Paris - Setting the fair interbank fund’s size in protected banking systems: the case of Italy. 154. R. Camillo - Casi di convergenza del gioco di sopravvivenza.

1999155. L. Riva, M. Trentini - Un’applicazione della contabilità demografica all’anagrafe del Comune di Brescia. 156. E. Angelelli - Routing Periodico Applicato ad un Problema di Raccolta dei Rifiuti. 157. P. Falbo, R. Grassi - Pareto optimal financial trades with risky and not risky assets. 158. F. M. Paris - Do homogeneous interest rates imply homogeneous volatilities across markets? Evidence from the

Italian equity market, looking at the post-euro era. 159. L. Bertazzi, M. G. Speranza - Approximation Algorithms for the Minimization of the Transportation and Inventory

Costs on a Single Link. 160. P. Zuccolotto - Eteroschedasticità autoregressiva e ciclica nelle serie temporali. 161. R. Mansini, M. G. Speranza, Z. Tuza - Scheduling tasks with precedence constraints on three dedicated processors 162. P. Falbo, M. Frittelli, S. Stefani - Profitable Decision Rules in Mean Reverting Markets 163. P. Zuccolotto - La forma canonica a scaglioni per la stima di un modello VARMA: analisi congiunta di due serie

storiche economiche italiane. 164. P. Zuccolotto - Modelli Markoviani a più regimi per la serie dell'indice della produzione industriale italiana:

un'analisi critica. 165. F. M. Paris - Pricing seats as barrier options implications for the futures markets. 166. P. Zuccolotto - Osservazioni sulla previsione lineare per serie storiche multivariate. 167. L. Bertazzi, M. G. Speranza - Optimal and Neuro-Dynamic Programming Solutions for a Stochastic Single Link

Shipping Problem. 168. N. Doninelli - EM Estimation of Partially Observed Diffusion Processes and Bayesian Portfolio Optimization. 169. M. Carpita - Indicatori e modelli statistici per l’analisi delle carriere degli studenti universitari. 170. P. Falbo, R. Grassi - Partial equilibrium prices on a financial graph.171. E. Angelelli, M. G. Speranza - The Periodic Vehicle Routing Problem with Intermediate Facilities. 172. E. Brentari, M. Polisicchio - Sulla distorsione del rapporto campionario di concentrazione di Gini. 173. A. Mazzali - La destagionalizzazione delle serie degli indici della produzione industriale e del fatturato con

TRAMO-SEATS ed X12-ARIMA. 174. E. Brentari, M. Carpita, L. Dancelli - An improvement in the Welch Approximate t Test. 175. E. Brentari, M. Carpita, L. Dancelli - L’orientamento al mercato delle imprese: tecniche statistiche di valutazione.

2000176. L. Riva, M. Trentini - Comunità e Comune. 177. L. Bertazzi, M. G. Speranza - Rounding Procedures for the Discrete Version of the Capacitated EOQ Problem. 178. E. Angelelli, M. G. Speranza, Z. Tuza - Semi on-line scheduling on two parallel processors with upper bound on

the items. 179. L. Bertazzi, D. Bertsekas, M.G. Speranza - Optimal and Neuro Dynamic Programming Solutions for a Stochastic

Inventory Transportation Problem. 180. L. Bertazzi, M. G. Speranza - Frequency-Based Algorithms for the Minimization of the Transportation and

Inventory Costs on a Single Link. 181. F. M. Paris - Monitoring distressed banks and the bank shareholders' incentives under risk-neutral valuation.

182. E. Brentari, A. Zini - The bias of the estimator of Gini's concentration ratio, in sampling from Dagum's model. 183. O. Nicolis - Wavelet Transforms for Long Memory Parameter Estimation. 184. L. Bertazzi - Analysis of Rounding Procedures for a Multi-item Discrete Version of the Economic Lot Size Problem.185. L. Bertazzi, G. Paletta, M. G. Speranza - Deterministic Order-up-to Level Policies in an Inventory Routing

Problem. 186. L. Chiodi, R. Mansini, M.G. Speranza - Semi-absolute deviation rule for mutual funds portfolio selection. 187. P. Zuccolotto - Il progetto “Giovani e Fumo” dell’Università di Verona: alcuni risultati dell’indagine statistica

preliminare.

2001188. E. Angelelli, M. G. Speranza, Z. Tuza - Semi on-line scheduling on two parallel processors with lower and upper

bounds on the tasks. 189. L. Bertazzi, M. G. Speranza - Periodic Strategies for the Single Link Shipping Problem 190. L. Bertazzi, M. G. Speranza - Continuous and Discrete Shipping Strategies for the Single Link Problem. 191. P. Zuccolotto - Autoregressive Conditional Duration models for ultra -high frequency data. 192. L. Riva, M. Trentini - Linee metodologiche per una indagine comunale sui bilanci di tempo. 193. F. M. Paris - A compound-option model for the valuation of the manager’s incentive fee and its impact on the

manager’s adverse incentive. 194. E. Angelelli, M. G. Speranza - The application of a vehicle routing model to a waste collection problem: two case

studies. 195. F. M. Paris - The effect of the nineties’ tax reforms on the shareholders’ remuneration policies implemented by the

Italian unlisted firms. 196. F. M. Paris - A state preference model to select optimal portfolios of consumer loans. 197. A. Mazzali - Verifica empirica ed analisi critica del modello mistura bivariata. 198. C. Pelizzari - Il Mibo 30: verifica di alcune relazioni di arbitraggio e scomposizione del premio. 199. G. Ceccarossi, P. Falbo - Liquidity, Volatility and the Efficency of Italian Stock Market. 200. F. M. Paris - A unified framework to analyse classical risk measures in finance. 201. C. Archetti, R. Mansini, M.G. Speranza - The Split Delivery Vehicle Routing Problem with Small Capacity. 202. A. Mazzali - Volatilità dei rendimenti e variazioni dei volumi degli scambi nei mercati finanziari: un’analisi

empirica. 203. S. Golia - Proprietà statistiche dello stimatore GPH tramite ricampionamento del periodogramma. 204. L. Dancelli, E. Brentari, M. Carpita, E. Poli - On multilevel models for ordered categorical responses.

2002205. C. Archetti, M.G. Speranza - A direct algorithm for the k-split delivery vehicle routing problem. 206. M. Baccaglioni, L. Riva - Un bilancio di tempo di un campione di universitari. 207. M. Carpita - Metodi Quantitativi Web Lab: l’esperienza didattica in rete dei corsi di Statistica I e II. 208. L. Bertazzi, L.M.A. Chan, M.G. Speranza - Worst-Case Analysis of Practical Policies for a Single Link

Distribution System. 209. C. Archetti, M.G. Speranza - The 1-skip collection problem.210. L. Bertazzi, M.G. Speranza - Worst-Case Analysis of the Full Load Policy in the Single Link Shipping Problem. 211. P. Zuccolotto - Quantiles estimation in ACD models: a comparison between parametric and semiparametric

approach. 212. G. De Luca, P. Zuccolotto - Finite and infinite mixtures for financial durations. 213. C. Archetti, L. Bertazzi, M.G. Speranza - Reoptimizing the Traveling Salesman Problem. 214. R. Mansini, W. Ogryczak, M.G. Speranza - On LP Solvable Models for Portaolio Selection. 215. L. Bertazzi, M.G. Speranza - Improved Rounding Procedures for the Discrete Version of the Capacitated EOQ

Problem 216. N. Doninelli, P. Falbo - Mutual Fund Market Timing and Genetic Programming. 217. M. Carpita, L. Dancelli - Gli studenti dell’Università di Brescia tra il 1989 e il 1997 (Un’analisi con indicatori di

successo e di insuccesso).

2003

218. A. Mazzali - Serie storiche a memoria lunga: approssimazione con modelli markoviani in forma canonica bilanciata. 219. L. Riva, M. Trentini - Le reti parentali primarie a Brescia. 220. E. Angelelli, M.G. Speranza, Z. Tuza - Semi on-line scheduling on three processors with known sum of the tasks. 221. L. Bertazzi, G. Paletta, M.G. Speranza - An Improved Heuristic Algorithm for the Period Salesman Problem. 222. P. Falbo, S. Stefani - Speculative Trading in Mean Reverting Markets. 223. E. Angelelli, A.B. Nagy, M.G. Speranza, Z. Tuza - The on-line multiprocessor scheduling problem with known

sum of the tasks. 224. C. Archetti, A. Hertz, M.G. Speranza - A Tabu Search Algorithm for the Split Delivery Vehicle Routing Problem.

225. M.E. De Giuli, M.A. Maggi, F.M. Paris - Pricing mutual bank deposit guarantees. 226. A. Mazzali - Distanza e disordine nell’analisi dei ranghi. 227. R. Barba, L. Bertazzi, M.G. Speranza - Decision rules with guarantee in a B2B marketplace for a logistic service

auction. 228. L. Bertazzi, G. Paletta, M.G. Speranza - Minimizing the Total Cost in an Integrated Vendor-Managed Inventory

System. 229. M. Carpita - Metodi per la costruzione di indicatori della qualità del lavoro: un’applicazione al settore dei servizi

sociali. 230. M. Carpita, L. Dancelli - Su una classe di indici di similarità comprendente indici di similarità modificati.

2004

231. L. Riva, M. Trentini - L’offerta di servizi per anziani a Brescia. 232. M. Carpita - Metodi e modelli per l'analisi della job satisfaction: un'applicazione ai dati dell'indagine FIVOL-FEO

1998. 233. M.E. De Giuli, M.A. Maggi, F.M. Paris - Pricing incentive fee of hedge fund managers: a discussion of moral

hazard. 234. E. Angelelli, M.G. Speranza, Zs. Tuza - New bounds and algorithms for on-line scheduling: two identical

processors, known sum and upper bound on the tasks.235. M. Sandri , P. Zuccolotto - Classification with Random Forests: the theoretical framework. 236. E. Brentari - Sulla caratterizzazione dell’origine dei tartufi. Un’analisi statistica. 237. P. Zuccolotto - Forecasting tick-by-tick price movements. 238. E. Angelelli, R. Mansini, M.G. Speranza - A comparison of Mad and CVaR with side constraints. 239. M. Manisera - Tecniche di scaling per la costruzione di indicatori della qualità del lavoro nel settore dei servizi

sociali 240. C. Archetti, L. Bertazzi, G. Laporte, M.G. Speranza - A Branch-and-Cut Algorithm for a Vendor Managed

Inventory Routing Problem. 241. C. Archetti, M. W. P. Savelsbergh, M.G. Speranza - Worst-Case Analysis for Split Delivery Vehicle Routing

Problems. 242. E. Brentari, E. Poli - Ricerca di soglie critiche per un test su matrici di confusione. 243. S. Golia - Long Memory Processes a resampling method. 244. E. Poli, A. Mazzali - Misure di posizione nelle distribuzioni di ranghi. 245. E. Poli - La struttura retributiva nel settore dei servizi sociali: un’applicazione con i dati dell’indagine FIVOL-FEO

1998 246. M. Carpita, L. Dancelli - Campionamento statistico per la revisione aziendale.

2005

247. M. Palamenghi, L. Riva, M. Trentini - Criteri e metodi di stima del reddito delle famiglie bresciane.248. C. Archetti, A .Hertz, M.G. Speranza - Metaheuristics for the Team Orienteering Problem.249. G. Guastaroba, R. Mansini, M.G. Speranza - On the use of CVaR model in a Rebalancing Portfolio Strategy.250. A. Alberici, E. Brentari, E. Poli - Indicatori di rischio nel trattamento dei dati.251. E. Angelelli, M.W.P. Savelsbergh, M.G. Speranza - A Dynamic Multi-Period Routing Problem.252. L. Bertazzi - Worst-Case Analysis of Direct Shipping in an Inventory Routing Problem with Time Discretization253. M. Manisera, E. Dusseldorp, A.J. van der Kooij - Component structure of job satisfaction based .on Herzberg’s

theory.254. P. Zuccolotto - Missing Values treatment via Symbolic Data Analysis.255. P. Zuccolotto - Principal Components of sample estimates: an approach through Symbolic Data Analysis. 256. E. Poli - Modelli multilivello con interazioni per l’analisi delle politiche retributive nel settore dei servizi sociali in

Italia. 257. E. Brentari, S. Golia - The Rasch Model and the FIVOL-FEO Survey. 258. A. Mazzali, M. Manisera - Stime minimax per serie storiche stazionarie. 259. P. Falbo, C. Pelizzari - Stable classes of technical trading rules. 260. E. Brentari, L. Dancelli - Sull’impiego della media aritmetica nell’analisi sensoriale.

2006

261. L. Riva, M. Trentini - Nascite da extracomunitari a Brescia 1999-2003. 262. L. Riva, M. Trentini - Tavole di mortalità comunali. 263. C. Archetti, M. W. P. Savelsbergh, M. G. Speranza - To Split or Not to Split: That is the Question. 264. C. Archetti, M. W. P. Savelsbergh, M. G. Speranza - An Optimization-Based Heuristic for the Split Delivery

Vehicle Routing Problem

265. L. Bertazzi - Analysis of Direct Shipping Policies in an Inventory Routing Problem with Discrete Shipping Times. 266. P. Zuccolotto - A note on independency and identical distribution of transformed innovations in regime-switching

PACD models:formal proofs 267. C. Archetti, L. Bertazzi, M.G. Speranza - Reoptimizing the 0-1 Knapsack Problem. 268. G. Guastaroba, R. Mansini, M.G. Speranza - On the Effectiveness of Scenario Generation Techniques in Single-

Period Portfolio Optimization. 269. P.Falbo, D. Felletti, S. Stefani - Risk Management for a Small Electricity Producer. 270. E. Angelelli, M.W.P. Savelsbergh, M.G. Speranza - Competitive Analysis of a Dispatch Policy for a Dynamic

Multi-Period Routing Problem. 271. C. Archetti, M.G. Speranza - The Split Delivery Vehicle Routing Problem: A Survey.272. G. Bosi, M.E. Zuanon - Semicontinuous Representability of Interval Orders on a Metrizable Topological Space. 273. E. Angelelli, M.G. Speranza, Z. Tuza - Semi on-line scheduling on two uniform processors. 274. M. Bagliani, G. Bravo, S. Dalmazzone, S. Golia - A worldwide time series analysis of the relationship between

economic growth and environmental pressure. 275. E. Brentari, L. Dancelli, F. Dabrassi - Stili di attaccamento: un confronto di genere con medie bipolari.276. M. Manisera, A. Mazzali, E. Poli, - Minimax Estimation based on a L1-metric loss function for Stationary Time

Series. 277. P. Falbo, F.M. Paris, C. Pelizzari - Pricing Inflation Linked Bonds.

2007

278. E. Angelelli, N. Bianchessi, R. Mansini, M.G. Speranza - Short Term Strategies for a Dynamic Multi-Period Routing Problem.

279. L. Bertazzi, M. Savelsbergh, M.G. Speranza - Inventory Routing. 280. L. Riva, M. Trentini - Un metodo semplice per le proiezioni demografiche a livello comunale. 281. E. Angelelli, R. Mansini, M.G. Speranza - Core Search: An application to portfolio optimisation. 282. M. E. Zuanon - Choquet utility from distorted probabilities: a characterization. 283. M.T. Vespucci, E. Allevi, A. Gnudi, M. Innorta - Cournot equilibria in oligopolistic electricity markets. 284. C. Archetti, M. Savelsbergh - The Trip Scheduling Problem. 285. C. Archetti, D. Feillet, A. Hertz, M.G. Speranza - The Capacitated Team Orienteering and Profitable Tour

Problems. 286. L. Bertazzi - Optimizing the Storage Area Dimension in a Production System. 287. C. Archetti, L. Bertazzi, G. Paletta, M.G Speranza - Optimization of an Integrated Production-Distribution

System. 288. M.F. Sandri, P. Zuccolotto - Analysis of a bias effect in a tree-based variable importance measure. 289. E. Allevi, M.I. Bertocchi, F. Maggioni - Stochastic Semidefinite Programs in mobile ad hoc networks. 290. E. Allevi, A. Gnudi, I.V. Konnov - An Extended Gauss-Seidel Method for a Class of Multi-Valued

Complementarity Problems. 291. P. Manfredi, M. Manisera, F. Dabrassi - Categorical principal component analysis to identify the component

structure of alexithymia. 292. E. Brentari, S. Golia - Unidimensionality in the Rasch model: how to detect and interpret. 293. M. Manisera - Scoring Ordinal Variables for Costructing Composite Indicators. 294. M. Manisera, A.J. van der Kooij, E. Dusseldorp - Identifying the component structure of satisfaction scales by

nonlinear principal components analysis.295. M. Manisera, A. Mazzali - Robust estimation for stationary ARMA time series.296. E. Angelelli, R. Mansini, M. Vindigni - The Dynamic Traveling Purchaser Problem.297. E. Brentari, L. Dancelli, P. Zuccolotto - Analisi dei fattori di maggior impatto sulla formazione del prezzo del

vino: un esempio di utilizzo delle Random Forest.298. P. Falbo, A. Guerrini, C. Pelizzari - Optimal portfolios of trading strategies.

2008

299. P. Falbo, C. Pelizzari - Markov Chain Bootstrapping and Trading Rules Clustering.300. C. Filippi, G. Romanin-Jacur - Exact and approximate algorithms for high-multiplicity parallel machine

scheduling. 301. L. Riva, M. Trentini - Aspetti demografici dell’immigrazione a Brescia (con particolare riferimento ai giovani). 302. L. Riva, M. Trentini - La demografia che cambia L’immigrazione straniera nello scenario delle trasformazioni

demografiche della Provincia di Brescia nei prossimi anni. 303. L. Riva, M. Trentini - Un metodo “ingenuo” per l’analisi dei flussi elettorali. 304. E. Allevi, A. Gnudi, I.V. Konnov, M.T. Vespucci - Spatial Auction Markets with Unique Consumer Price. 305. M.E. Zuanon - A note on the existence of maximal elements on compact topological spaces.

306. G. Oggioni - Investments in the European Power Sector. How do the European Emission Trading Scheme and the Application of Special Contracts Matter? Part I: Formulation.

307. G. Oggioni - Investments in the European Power Sector. How do the European Emission Trading Scheme and the Application of Special Contracts Matter? Part II: Application.

308. C. Carini, L. Riva - La dinamica recente delle famiglie in Brescia ed il relativo fabbisogno abitativo. 309. E. Angelelli, S. Ortobelli - American and European Portfolio Selection Strategies: The Markovian Approach.310. E. Angelelli, N. Bianchessi, R. Mansini, M.G. Speranza - Comparison of policies in dynamic routing problems.311. E. Allevi, A. Gnudi, I.V. Konnov - An Extended Gauss-Seidel Method for Multi-Valued Mixed Complementarity

Problems. 312. M. Carpita, S. Golia - Subjective Measures of Quality of Work in the Italian Social Cooperatives. 313. H.L. Petersen, C. Archetti, M.G Speranza - Exact Solutions to the Double Travelling Salesman Problem with

Multiple Stacks.

2009

314. E. Allevi, A. Gnudi, S. Schaible, M.T. Vespucci - Equilibrium and least element problems for multivalued functions.

315. C. Archetti, D. Feillet, A. Hertz, M.G. Speranza - The Capacitated Arc Routing Problem with Profits316. S. Coene, C. Filippi, F.C.R. Spieksma, E. Stevanato - The traveling salesman problem on trees: balancing profits

and costs.317. C. Archetti, L. Bertazzi, A. Hertz, M.G. Speranza - A Hybrid Heuristic for an Inventory-Routing Problem.318. L. Bertazzi, L.M.A. Chan, M.G. Speranza - Analysis of Practical Policies for an Inventory Routing Problem with

Minimum Intershipment Time.319. L. Bertazzi, S.S.M. Cherubini - An Intermodal Inventory-Transportation System with Stochastic Demand.320. M. Vezzoli - Alberi di classificazione e formazione degli strati nel campionamento stratificato.321. M. Palamenghi, L. Riva, D. Ruggeri, M. Trentini - Habitare in famiglia. Indagine sulle famiglie che curano.322. M. E. Zuanon - On the representability of general preferences by means of a Choquet utility.323. M. Vezzoli, P. Zuccolotto - CRAGGING Variable Importance measurement in sovereign default prediction.324. L. Bertazzi, O. Zappa - Integrating Transportation and Production when Production is Internationalized.325. C. Archetti, L. Bertazzi, G. Paletta, M.G. Speranza - Analysis of the Maximum Level Policy in a Production-

Distribution System.326. C. Filippi - Sensitivity analysis in linear programming. 327. R. Mansini, M.G. Speranza - CORAL: An exact algorithm for the Multidimensional Knapsack Problem. 328. C. Filippi - An approximate algorithm for a high-multiplicity parallel machine scheduling problem. 329. C. Archetti, N. Bianchessi, M.G. Speranza - A Column Generation Approach for the Split Delivery Vehicle

Routing Problem. 330. L. Bertazzi - Rollout Algorithms for the 0-1 Knapsack Problem: Minimum and Worst-Case Performance Ratios. 331. C. Archetti, D. Feillet, M. Gendreau, M.G. Speranza - Complexity of the VRP and SDVRP. 332. M. Rocco, J.E. Martínez-Legaz - On surjectivity results for maximal monotone operators of type (D). 333. G. Guastaroba, G. Mitra, M.G. Speranza - Investigating the Effectiveness of Robust Portfolio Optimization

Techniques. 334. G. Oggioni, Y. Smeers - Analysis of the market coupling and counter-trading approaches in the European electricity

market 335. P. Zuccolotto - Principal Component Analysis with Interval Imputed missing values 336. M. Rocco - A note on some extensions of monotone operators to the bidual 337. M.E. Zuanon - Su un teorema di impossibilità nell’aggregazione di flussi infiniti di utilità. 338. E. Brentari, L. Dancelli, W. Maffenini - Osservazioni sullo scostamento medio dalla media bipolare.

2010

339. C. Archetti, M. Bouchard, G. Desaulniers - Enhanced Branch-and-Price-and-Cut for Vehicle Routing with Split Deliveries and Time Windows.

340. L. Riva, M. Trentini - Linkage tra i microdati dei censimenti 1991 e 2001: una sperimentazione.