Statistica e archeologia. Metodi, esempi e ...qualche ortaggio

56
STATISTICA E ARCHEOLOGIA Metodi, esempi e ... qualche ortaggio Denis Francisci (Università di Verona, 8 aprile 2015)

Transcript of Statistica e archeologia. Metodi, esempi e ...qualche ortaggio

STATISTICA E ARCHEOLOGIA

Metodi, esempi e ... qualche ortaggio

Denis Francisci(Università di Verona, 8 aprile 2015)

Statistica e archeologia. Università di Verona, 8 aprile 2015

Ricognizione di superficie:Posizione e densità ritrovamenti

Prospezione geoelettrica

Fot

oint

erpr

etaz

ione

LID

AR

GISGIS

Statistica e archeologia. Università di Verona, 8 aprile 2015

GISGIS

Rilievo di scavo

Sezioni di scavo (software

ArchaeoSection)

Prospetti murari (Archeologia delle architetture) Matrix di scavo

Statistica e archeologia. Università di Verona, 8 aprile 2015

Laserscanner 3D data da IBM/SFM techniques

4D, Temporal data

Voxel

SfMGISGIS

http://fatra.cnr.ncsu.edu/temporal-grass-workshop/

Statistica e archeologia. Università di Verona, 8 aprile 2015

http://bwplus.fzk.de/berichte/ZBer/2003/ZBerbwc21016.pdf

Micro-pedologia (da: F. Oehler, Ein Anwendungs-beispiel von Methoden der Landschaftsanalys anhand mikro-pedologischer Anschliffe)Reperti 3D

(da: Barton, Bezzi, Bezzi, Francisci, Gietl, Neteler 2007)GISGIS

Reperti: distribuzione spaziale Reperti: disegno profili

STATISTICA

E' ovunque … come il prezzemolo!

Statistica e archeologia. Università di Verona, 8 aprile 2015

www.impariamoamangiare.com

Statistica e archeologia. Università di Verona, 8 aprile 2015

Ricognizione di superficie

Classificazione delle UT in base alla densità di ritrovamenti

Statistica e archeologia. Università di Verona, 8 aprile 2015

Fotointerpretazione LIDAR

Algoritmi di interpolazione (IDW, Kriging ...)

Gestione delle bande e filtri di Image Enhancement

Controllo accuratezza rilievo 3D

Statistica e archeologia. Università di Verona, 8 aprile 2015

Controllo errore di poligonale

Rilievo bidimensionale e tridimensionale

Da Abate 2012

Seriazione

Statistica e archeologia. Università di Verona, 8 aprile 2015

Studio dei materiali Analisi fattoriale

Da Jaxa-Chamiec, Taroni 2008

GeoarcheologiaTriangolo delle tessitura del suolo

Statistica e archeologia. Università di Verona, 8 aprile 2015

DendrocronologiaCurve dendrocronologiche

https://huxley.wwu.edu/huxley-tree-ring-laboratory

Statistica e archeologia. Università di Verona, 8 aprile 2015

Praticamente assente nei programmi universitari italiani di archeologia,più diffusa all'estero:

Stanford University (California)

UCL (Londra)

Obiettivi di questo seminario:

✔ Puntualizzare alcuni concetti✔ Panoramica delle tecniche✔ Qualche esempio pratico

Statistica e archeologia. Università di Verona, 8 aprile 2015

Statistica e archeologia: alcuni cenni storici

✔ Anni '60-'70: NEW ARCHEOLOGY. Grande successo delle tecniche statistiche, funzionali all'approccio scientifico dell'archeologia processuale (J. E. Doran, F. R. Hodson, Mathematics and Computers in Archaeology, 1975)

✔ Anni '80-'90: POSTPROCESSUALISMO: diffidenza e abbandono di queste tecniche ritenute troppo deterministiche

✔ OGGI: ritorno alle tecniche statistiche anche grazie ➢ alla massiccia diffusione dell'informatica e in

particolare dei GIS che fanno abbondante uso di metodi statistici

➢ Alla diffusione di nuovi approcci come quello bayesiano che tiene conto della soggettività e dell'esperienza dello studioso

Ian Hodder

Statistica e archeologia. Università di Verona, 8 aprile 2015

Per una definizione della statistica

WIKIPEDIA (05.04.2015):

“La statistica è una disciplina che ha come fine lo studio quantitativo e qualitativo di un particolare fenomeno in condizioni di non determinismo o incertezza ovvero di non completa conoscenza di esso o parte di esso. Studia i modi (descritti attraverso formule matematiche) in cui una realtà fenomenica - limitatamente ai fenomeni collettivi - può essere sintetizzata e quindi compresa. La statistica studia come raccogliere i dati e come analizzarli per ottenere l'informazione che permetta di rispondere alle domande che ci poniamo. Si tratta di avanzare nella conoscenza partendo dall'osservazione e dall'analisi della realtà in modo intelligente e obiettivo”.

David HAND, Statistica. Dati, numeri e l'interpretazione della realtà, 2012:

Non è una scienza, ma un insieme di tecnologie:● tecnologia per estrarre significato dai dati● tecnologia per trattare l'incertezza● tecnologia per produrre sintesi efficiaci di dati

Statistica e archeologia. Università di Verona, 8 aprile 2015

“Peeling the onion”(Cool, Baxter 1999)

La statistica può essere definita come un insieme di tecniche che permettono di sfogliare i dati come fossero le bucce di una cipolla alla ricerca di strutture, tendenze, relazioni tra i dati celate dietro il primo strato più apparente e che permettono di sintetizzare e poter fare previsioni sulla realtà.

NON UNA SOLA STATISTICA:

➢ Statistica “classica”

➢ Statistica circolare

➢ Geostatistica

➢ Statistica bayesiana

➢ ….

http://pixgood.com/

Statistica e archeologia. Università di Verona, 8 aprile 2015

Il tipo di dati

Tabella Archeologia Database Statistica

Riga OGGETTO RECORD OSSERVAZIONE

Colonna ATTRIBUTO CAMPO (Field) VARIABILE

Variabile

Discreta/Qualitativa/Categorica(valori = “modalità”)

Continua/Quantitativa/Numerica(valori = numeri)

Nominale (“Ferro”, “Bronzo”, “Piombo”)

Ordinale(“Alto”, “Medio”, “Basso”)

Intervallo(150 a.C., 300 a.C., 450 a.C.)

Rapporto(5, 7, 14, 21, 26, 39, 58, 149)

Una schematizzazione (molto approssimativa)

In costruzione ….

Statistica e archeologia. Università di Verona, 8 aprile 2015

UNIVARIATE: Summarizing data (sintesi dei dati)

Indici o misure che sintetizzano una distribuzione di variabili numeriche.

Misure di tendenza centrale

- MEDIA: aritmetica.

- MODA: il valore più frequente (anche variabili categoriche nominali).

- MEDIANA: valore centrale di una distribuzione numerica

- QUARTILE: I° = 25% II° = 50% = mediana

III° = 75%- quantili, media interquartile, media ponderata, etc.

Misure di dispersioneI singoli valori centrali di media e mediana possono discostarsi anche di molto dai vari valori di una distribuzione numerica. Questo scostamento viene calcolato con le misure di dispersione.

- RANGE (min-max) o campo di variazione: quanto è ampia la distribuzione

- VARIANZA: media dei quadrati delle distanza dal valore medio.

- DEVIAZIONE STANDARD o scarto quadratico medio: √ della varianza (σ)- mean deviation, coefficiente di varianza, etc.

Statistica e archeologia. Università di Verona, 8 aprile 2015

5

troncopiramidale(tpr)

troncopiramidale a base arrotondata (tpr_ba)

2 1

troncopiramidale a base quadrangolare (tpr_bq)

troncopiramidale a base rettangolare (tpr_br)

11 148

troncopiramidale a base rettang. stretta (tpr_bs)

troncopiramidale a testa arrotondata (tpr_ta)

50 27

Pie charts (Torta)

Frequency table (Tabella di frequenza)

Bar plot (Diagramma a barre)

UNIVARIATE: Presenting data (presentazione dei dati)

1 VARIABILE CATEGORICA

Statistica e archeologia. Università di Verona, 8 aprile 2015

Da Tricomi 2014

5

Stem and leaf (grafico a ramo e foglia)

Boxplot (Diagramma a scatola e baffi)

Histogram(Istogramma)

UNIVARIATE: Presenting data (presentazione dei dati)

1 VARIABILE NUMERICA

Statistica e archeologia. Università di Verona, 8 aprile 2015

Da Tricomi 2014

BIVARIATE: Summarizing data (sintesi dei dati)

VARIABILI NUMERICHE:Coefficiente di correlazione lineare ( “r” di Pearson)

VARIABILI CATEGORICHE:Coefficiente di correlazione lineare ( “r

s” di Spearman)

Producono valori da +1 a -1:+1 = forte correlazione ascendente 0 = assenza di correlazione -1 = forte correlazione discendente

Regressione lineare semplice:Variabile dipendente (peso) e

indipendente (altezza); retta di regressione

Statistica e archeologia. Università di Verona, 8 aprile 2015

Da Tricomi 2014

BIVARIATE: Presenting data (presentazione dei dati)

2 VARIABILI CATEGORICHE

Statistica e archeologia. Università di Verona, 8 aprile 2015

Contingency Table (tabella di contingenza)

Multiple bar charts (diagramma a barre multiple)

BIVARIATE: Presenting data (presentazione dei dati)

2 VARIABILI NUMERICHE

Scatterplot (diagramma di dispersione)

Da Tricomi 2014

Scatterplot matrices

Statistica e archeologia. Università di Verona, 8 aprile 2015

MULTIVARIATE: 3 VARIABILI

Statistica e archeologia. Università di Verona, 8 aprile 2015

Ternary diagram (Diagramma Ternario)

Associazione di recipienti per bere, versare e mangiare nelle tombe di I-III d.C.

MULTIVARIATE: MOLTE VARIABILI

Statistica e archeologia. Università di Verona, 8 aprile 2015

Pre

senc

e-A

bsen

ce M

atrix

(mat

rice

di p

rese

nza-

asse

nza)

Seriatio n Table (Tabel la di ser iazione )

“Seriazione”

MULTIVARIATE: MOLTE VARIABILI

Statistica e archeologia. Università di Verona, 8 aprile 2015

Cluster Analysis

Dendrogram (diagramma ad albero)

MULTIVARIATE: MOLTE VARIABILI

Statistica e archeologia. Università di Verona, 8 aprile 2015

Analisi fattoriale

VARIABILI CATEGORICHE:Correspondence Analysis (analisi delle corrispondenze)

VARIABILI NUMERICHE:PCA Principal Component Analysis (analisi delle componenti principali)

Da Muggeo, Ferrara 2005

Una schematizzazione (molto approssimativa)

In costruzione ….

Statistica e archeologia. Università di Verona, 8 aprile 2015

Statistica inferenziale (...e qui sono cavoli !!!)

Statistica e archeologia. Università di Verona, 8 aprile 2015

● è fortemente legata alla teoria della probabilità

● è fortemente legata alla teoria del campionamento

● utilizza i test di ipotesi:

- si formulano 2 ipotesi, una nulla (H0) ed una alternativa (H

1); solo una delle due è valida.

Secondo l'ipotesi zero, i gruppi sono fra loro uguali e la differenza osservata va attribuita al caso;

per l'ipotesi alternativa la differenza non è casuale.

- si calcola il valore p = probabilità del risultato osservato (livello di significatività)

- se ad es. p <0.05 (=5%) allora l'ipotesi va rigettata ad un livello del 5% (cioé al 95% è vera

l'altra ipotesi)

La statistica inferenziale ha come obiettivo quello di

stabilire delle caratteristiche dei dati e dei

comportamenti delle variabili statistiche con una

possibilità di errore predeterminata. Tale conoscenza

permetterà di fare previsioni.

www.leverduredelmioorto.it

Statistica inferenziale

Statistica e archeologia. Università di Verona, 8 aprile 2015

Intervallo di confidenza: dato un campione di osservazioni, è l'intervallo di valori entro i quali si stima che cada, con un livello di probabilità (p) scelto a piacere, il valore vero della media dell'intera popolazione.

Test del c2 (chi quadro): stabilisce se c'è una correlazione significativa tra le variabili di una tabella di contingenza

E-W N-S

1st – 3rd A.D. 22 9

3rd – 5th A.D. 4 19

χ-squared = 13.1108 df = 1P-value = 0.0003 = 0.03%

Mean of distances from 710 m (20 actus) = between 7.58 and 13.86 m

Direzione e cronologia dei percorsi stradali

Sulla base di questi valori, confrontati con apposite tabelle, si può respingere l'ipotesi nulla (H

0) di indipendenza delle variabili e si

può affermare con una probabilità superiore al 99% che l'associazione tra direzione delle strade ed epoca è statisticamente rilevante (la variabile direzione è dipendente dalla variabile epoca)

Qualche esempio concreto

Statistica e archeologia. Università di Verona, 8 aprile 2015

1. I pesi da telaio

Da Tricomi 2014

Analisi univariata delle 3 variabili, - Morfologia- Spessore- Peso

Qualche esempio concreto

Statistica e archeologia. Università di Verona, 8 aprile 2015

1. I pesi da telaio

Da Tricomi 2014

Analisi bivariata (Scatterplot) delle variabili peso e spessore

Fili fini e trama larga Fili spessi e trama larga

Fili fini e trama densa Fili spessi e trama densa

Qualche esempio concreto

Statistica e archeologia. Università di Verona, 8 aprile 2015

1. I pesi da telaio

Da Tricomi 2014

Analisi bivariata (Scatterplot) delle variabili peso e spessore con distinzione dei punti in base alla terza variabile morfologia

Qualche esempio concreto

Statistica e archeologia. Università di Verona, 8 aprile 2015

2. I muri in terra

Montebelluna (TV),Scavo di un edificio artigianale con muri composti da zoccolo in pietra e alzato in terra.

(Direzione Scientifica M.S. Busana, Università di Padova)

http://www.casediterra.it/

Qualche esempio concreto

Statistica e archeologia. Università di Verona, 8 aprile 2015

2. I muri in terra

Setacciatrice meccanica per la distinzione di 9 classi granulometriche

Qualche esempio concreto

Statistica e archeologia. Università di Verona, 8 aprile 2015

2. I muri in terra

Analisi univariata: curve cumulative e curve di frequenza delle classi granulometriche (scala logaritmica di Krumbein)

Qualche esempio concreto

Statistica e archeologia. Università di Verona, 8 aprile 2015

2. I muri in terra

Analisi univariata e multivariata: boxplot e diagramma ternario

Qualche esempio concreto

Statistica e archeologia. Università di Verona, 8 aprile 2015

3. La simbologia graduata

Il problema (apparentemente semplice): rappresentare in maniera corretta ed efficace la distribuzione di una variabile numerica all'interno di una quadrettatura di scavo, di una griglia di survey, di una mappa tematica o di una dispersione di punti.

Es. Quadrati di scavo o unità di survey differenziati in base al quantitativo di reperti

Qualche esempio concreto

Statistica e archeologia. Università di Verona, 8 aprile 2015

3. La simbologia graduata

Alla base della simbologia graduata c'è un procedimento matematico-statistico di classificazione della variabile continua considerata (es. quantità reperti, dimensioni siti,...), finalizzato al raggruppamento dei valori in intervalli definiti da specifici metodi.Tra i metodi più diffusi ci sono:

Qualche esempio concreto

Statistica e archeologia. Università di Verona, 8 aprile 2015

3. La simbologia graduata

Qualche esempio concreto

Statistica e archeologia. Università di Verona, 8 aprile 2015

3. La simbologia graduata

I metodi di classificazione sono diversi ed è necessario conoscerli per applicarli in maniera appropriata, perché metodi di classificazione differenti portano a visualizzazioni differenti e a diverse interpretazioni dei dati.

Equal Intervals Standard Deviation Natural Breaks (Jenks)

Pretty Breaks Quantile Geometric Intervals

La scelta del metodo:

Per scegliere quale sia il metodo migliore da utilizzare bisogna analizzare i propri dati e verificare quale forma di distribuzione essi assumano.

Conoscere la forma della distribuzione è fondamentale per applicare il metodo o i metodi più corretti.

Tra le forme di distribuzione principali elenchiamo:

1. Uniforme (o rettangolare)

2. Normale (o gaussiana o “a campana”)

3. Bimodale o multimodale (non uniforme)

4. Esponenziale (Asimmetrica a destra, positiva )

Qualche esempio concreto

Statistica e archeologia. Università di Verona, 8 aprile 2015

3. La simbologia graduata

1. DISTRIBUZIONE UNIFORME

→ Equal Intervals

→ Pretty Breaks

2. DISTRIBUZIONE NORMALE

→ Standard deviation

→ Quantile

3. DISTRIBUZIONE BIMODALEO MULTIMODALE

4. DISTRIBUZIONE ESPONENZIALE (ASIMMETRICA POSITIVA)

Qualche esempio concreto

Statistica e archeologia. Università di Verona, 8 aprile 2015

4. Fabric Analysis

Fabric analysis = “la misura e la descrizione dell'assetto spaziale di un qualsiasi deposito archeologico, definite dai valori angolari di direzione e di inclinazione delle sue singole componenti (naturali e/o artificiali) e dalla qualità dei rapporti spaziali che esse intrattengono reciprocamente e con l'ambiente esterno” (Francisci 2012).

In altre parole per ciascun elemento si misurano e si analizzano con metodi statistici i valori angolari di direzione e di inclinazione dell'asse maggiore e/o dell'asse di massima pendenza. In base ai risultati ottenuti si possono trarre deduzioni sull'origine del deposito e sugli agenti post-deposizionali che lo hanno modificato.

Da McPherron 2005

Qualche esempio concreto

Statistica e archeologia. Università di Verona, 8 aprile 2015

4. Fabric Analysis

Trattandosi di valori angolari in questo caso si usano altre tecniche statistiche, quelle proprie della statistica circolare:

Utilizza diversi indici di tendenza centrale e dispersione...:

● Media vettoriale (VS media aritmetica)● Varianza circolare (VS varianza e deviazione standard)

… e diversi diagrammi di presentazione dei dati, tra cui in particolare:

Media vettoriale=

Dati gli angoli: 320°, 0°, 10°La media aritmetica = 110°La media vettoriale = -10° = 350°

(Da: Ricci Lucchi 1980)

atan∑ sin x

∑ cos x

DIAGRAMMA A ROSA (istogramma, univariato)

DIAGRAMMA DI SCHMIDT (scatterplot, bivariato)

Qualche esempio concreto

Statistica e archeologia. Università di Verona, 8 aprile 2015

4. Fabric Analysis

Montebelluna (TV).Crollo primario o riarrangiamento antropico?

Qualche esempio concreto

Statistica e archeologia. Università di Verona, 8 aprile 2015

4. Fabric Analysis

Cumulo sperimentale

Qualche esempio concreto

Statistica e archeologia. Università di Verona, 8 aprile 2015

4. Fabric Analysis

WOODCOCK DIAGRAM

BENN DIAGRAM

L'unità di crollo presenta un arrangiamento spaziale più simile al cumulo sperimentale e ad un altro cumulo sospetto di riarrangiamento, mentre è diverso da un'uità generata da sicuro crollo primario e dal crollo del tetto.

Qualche esempio concreto

Statistica e archeologia. Università di Verona, 8 aprile 2015

5. GIS Analysis

N° siti / pendenzaN° siti / pendenza

N° siti / esposizione

Qualche esempio concreto

Statistica e archeologia. Università di Verona, 8 aprile 2015

5. GIS Analysis

8

Thiessen Polygons

Nearest Neighbour Distances

Qualche esempio concreto

Statistica e archeologia. Università di Verona, 8 aprile 2015

5. GIS Analysis

8Da Conrad 2010

GEOSTATISTICA:

- variogramma- semivariogramma- Kriging- Regression Analysis- ….

Statistica e archeologia. Università di Verona, 8 aprile 2015

Quale software?http://cran.r-project.org/

Statistica e archeologia. Università di Verona, 8 aprile 2015

Letture consigliate (tra le infinite...):

● Baxter M. 2003. Statistics in archaeology, London

● Bietti A. 1982, Tecniche matematiche nell'analisi dei dati archeologici, Roma

● Doran J., Hodson F.R. 1975, Mathematics and Computers in Archaeology, Edinburgh

● Drennan R. D. 1996, Statistics for archaeologists, New York

● Fletcher M., Lock G. 2005, Digging Numbers, Oxford.

● Orton C.R. 1980, Mathematics in Archaeology, London.

● Shennan S. 1997, Quantifying Archaeology, Edinburgh.

SITOGRAFIA:

http://www.uselessarchaeology.com/

http://www.antiqui.it/archeologiaquantitativa/sommario.htm

http://www.treccani.it/enciclopedia/ricerca-archeologica-le-analisi-matematico-statistich

e-e-l-archeologia-sperimentale_%28Il_Mondo_dell%27Archeologia%29/

Statistica e archeologia. Università di Verona, 8 aprile 2015

Riferimenti bibliografici

● Abate D. 2012, La Modellazione di una Lapide Sepolcrale Attraverso Tecniche Low-CostRange ed Image Based, in Low-cost

3D: sensori, algoritmi, applicazioni (FBK Trento, 8-9 Marzo 2012), http://3dom.fbk.eu/files/lc3d/Abate_lowcost3d-2012-Trento.pdf

● Barton M., Bezzi A., Bezzi L., Francisci D., Gietl R., Neteler M. 2007, GRASS, un potente GIS per archeologi, in R. Bagnara e

G. Macchi Jànica (eds.), Open Source, Free Software e Open Format nei processi di ricerca archeologici, Atti del I Workshop

(Grosseto, 8 maggio 2006), Firenze 2007, pp. 95-101.

● Conrad O. 2010, Geostatistica in SAGA, (http://www.geostat-course.org/system/files/geostat2010_00_saga_geostatistics.pdf)

● Cool H.E.M., Baxter M.J. 1999, Peeling the onion: an approach to comparing vessel glass assemblages, “Journal of Roman

Archaeology”, 12, 72-100.

● Francisci D. 2012, Analisi di fabric in archeologia: proposta di un metodo per la raccolta, l'elaborazione e l'interpretazione dei

dati, “Archeologia e Calcolatori”, 22 [2011], pp. 217-241.

● Jaxa-Chamiec M., Taroni G. 2008, I thymiateria di El Cabecico del Tesoro (Verdolay, Murcia): caratterizzazione morfometrica,

“Archeologia e Calcolatori”, 19 [2008], pp. 257-270.

● McPherron, S. J. P., 2005. Artifact orientations and site formation processes from total station proveniences, “J. Archaeol. Sci.”,

32, pp. 1003-1014.

● Muggeo M. R., Ferrara G. 2005, Il linguaggio R: concetti introduttivi ed esempi (http://cran.r-project.org/doc/contrib/nozioniR.pdf)

● Ricci Lucchi, F. 1980. Sedimentologia. I. Materiali e tessiture dei sedimenti. Bologna.

● Tricomi A.R. 2014, L'archeologia tessile nella Venetia romana. Testimonianze materiali per una sintesi storica. [Tesi di dottorato]

THE END