Arqueología, SIG y modelos predictivos basados en redes neuronales artificiales. Un caso de estudio

7
Resumen En este articulo Se muestra c6mo aplicar tecnicas de inteligencia artificial (redes neuronales artificiales) en la efaboraci6n de mode ~ los predictivos en arqueologfa. Los mtodos para predecir el riesgo arqueol6gico son cada vez mas utilizados ante la necesidad de implementar planes de protecci6n del patrimonio arqueol6gico, pues no siempre pueden desarrollarse programas de prospecci6n intensiva que cubran la totalidad de un territorio. A pesar de esta aparente utilidad su uso no est todavfa plenamente consolidado hi generalizado entre los arque6logos por lo Que Sus posibles aplicaciones necesitan siempre ser contrastadas y acompanadas de Una reflex|On critica. Para contribuir a esta discusi6n compara- mos los mapas de riesgo obtenidos con dos tcnicas diferentes: regresiones logisticas y redes neuronales artificiales. Abstract Thisarticle shows how to apply artificial intelligence techniques (Arti- ficial Neural Net works) to develop predictive models in archaeoLogy~ Methods to predict risk in archaeology are /"ncreasing/y used, in the need to Implement plans for protecting archaeological heritage, but intensive sur veys to coverthe whole territory cannot a/ways be done. Despite this apparent usefulness, Its use by archaeologists is recent and not widespread. Therefore, this potential applications require to be compared and accompanied by crltica/ reflections. To contribute to discussl`on, we compare archaeological risk maps obtained by t wo different techniques." logistic regression and artiflcia/. (1) Area de Historic Medleva/. Unlversidad de Oviedo [email protected] Recepcion. 20I04I2073 Aprobaci6n: 30/05/2013

Transcript of Arqueología, SIG y modelos predictivos basados en redes neuronales artificiales. Un caso de estudio

ResumenEn este articulo Se muestra c6mo aplicar tecnicas de inteligencia

artificial (redes neuronales artificiales) en la efaboraci6n de mode ~

los predictivos en arqueologfa. Los mtodos para predecir el riesgo

arqueol6gico son cada vez mas utilizados ante la necesidad de

implementar planes de protecci6n del patrimonio arqueol6gico,

pues no siempre pueden desarrollarse programas de prospecci6n

intensiva que cubran la totalidad de un territorio. A pesar de esta

aparente utilidad su uso no est todavfa plenamente consolidado

hi generalizado entre los arque6logos por lo Que Sus posibles

aplicaciones necesitan siempre ser contrastadas y acompanadas

de Una reflex|On critica. Para contribuir a esta discusi6n compara-

mos los mapas de riesgo obtenidos con dos tcnicas diferentes:

regresiones logisticas y redes neuronales artificiales.

AbstractThis article shows how to apply artificial intelligence techniques (Arti-

ficial Neural Net works) to develop predictive models in archaeoLogy~

Methods to predict risk in archaeology are /"ncreasing/y used, in the

need to Implement plans for protecting archaeological heritage, but

intensive sur veys to coverthe whole territory cannot a/ways be done.

Despite this apparent usefulness, Its use by archaeologists is recent

and not widespread. Therefore, this potential applications require to

be compared and accompanied by crltica/ reflections. To contribute

to discussl`on, we compare archaeological risk maps obtained by t wo

different techniques." logistic regression and artiflcia/.

(1) Area de Historic Medleva/. Unlversidad de [email protected]

Recepcio�n.� 20I04I2073Aprobaci6n: 30/05/2013

1. INTRODUCCION

En un articulo publicado en esta misma rev|Sta se

proponfa la elaboraci6n de un protocolo de investigaci6narqueol6gica basado en la utilizaci6n de mode|Os pre ~

dictivos implementados med|ante regresiones logfsticas

en un Sistema de lnformaci6n Geogra~fica [FERIO]. La

principal conclusion alcanzada en aquel trabajo fue Que

este tipo de mode|Os es especialmente 6tif, mas que por

su valor predict-wow por su utilidad como herramienta deplanificaci6n y comparaci6n entre diferentes metodos de

anal|sis: Se trata, en ese sent|do, mas de ponderar lo Que

se preVe y contrastarlo con lo que se observe para reforzar

o discutir determinados modelos explicativos.El objetivo de este nuevo artfculo es precisamente

abundar en esta metodologia de trabajo, introdu`ciendo

en un programa de Arqueologia del Paisaje Una t6cnica

de la Inteligencia Artificial (IA): las Redes Neurone(es Artf-~ficiales (RNA), como Una escala analftica o mOdo de tra-

bajo mas, mostrando un ejemplo practico y comparando

~estos resultados con los obtenidos mediante la �t:ecnfca de

fas regresiones logfsticas~

2. ARQUEOLOGfA

Y COMPUTACION

El conjunto de la informaci6n arqueol6gica es incom-

pleto, impreciso y heteroger.1eo, su interpretaci6n es diff ~cil y compleja. Frente a este panorama, las herramientas

informatices ban cumplido un papel clave en la gesti6n

de tan fragmentaria informaci6n, especialmente durante

las �ultimas tres decadas~ Los arque6logos ban ido inte ~grando en Sus m6todos de trabajo cada vez ma~s, y mas

intensamente las computadoras para la gesti6n y analisisde datos. En este sentido herramientas como los Siste-

mas de lnformaci6n Geografica (SIG), ban supuesto Unaaut1:ica revoluci6n dentro de la disciplina. Una de Sus

aplicaciones m8s recientes es la utilizaci6n de modefospredictivos [MITOI] [MEHO6] [STA99] [WAROO], [WOOOI].

Esta herramienta puede compensar la falta de informa-

ci6n arqueol6gica a es(ala tern'torial en zonas donde lavisibilidad de materiales o yacimientos en superffcie es in-

suficiente o nula por la abundancia de vegetaci6n u otras

causas~ Los mode|Os predictivos no pueden suplir la infor-

maci6n obtenida mediante la prospecci6n arqueol6gica

pero si contribuyen a sustituirla de forma aprioristica, lo

que permite la formulaci6n de propuestas o hip6tesis detrabajo en este tipo de casos~ Tambien pueden ayudar a la

mejor planificaci6n de intervenciones arqueol6gicas, me-d|ante la selecci6n preferente de areas de prospecci6n,

I conjunto de ainformaci6n arqueol6gica es

incompleto, imprecisoy heterogeneo, su interpretaci6n

es diffcil y compleja

o a la gesti6n del Patrimonfo, generando cartograffa de

riesgo arqueol6gico que puede utilizarse, ~por ejemplo, en

105 planes de ordenaci6n def territorio, contribuyendo a

la protecci6n de aquellas 8fees donde existe Una mayorprobabilidad de Que est6n presentes yacimientos arqueo ~

l6gicos~

Sobre la problematica inherente a los modelos pre-

dictivos y Sus caracterfsticas recomendamos la lectura del

trabajo de [FERO9].Los avances realizados en el mundo de la informa~tica

nos permiten Ir introduciendo nuevos paradigmas com-putacionales en la elaboraci6n de nuestros mode|Os. Un

ejemplo son las Redes Neuronales Artificiales (RNA), queson sistemas de procesamiento de la informaci6n inspi-

rados en la forma en Que funcionan las redes neurone|es

biol6gicas [ROS58]. Sus aplicaciones en el campo de faarqueologia son todavia escasas y recientes [DERO6] y

requieren de un amplfo periodo de aplicaci6n reflexion

y crftica que ahora apenas estamos iniciando en nuestra

disciplina.

3. LAS REDES NEURONALES

Las RNA pueden ser descritas como sistemas de in-

terconexi6n de efementos de procesamiento (nodos o

neuronas) conectadas entre sf en Una red Que transfor-

ma un conjunto de datos de entrada en Va|ores de salida

deseados [ZH096]. Los componentes bsicos de Una RNA

son unidades y conexiones, al igual Que las neuronas bio-l6gicas y Sus sinapsis. El factor clave para el desarrollo y

aplicaci6n de RNA, asf como para el propio cerebro, es la

interconectividad~ La amplitud de esta interconectivfdades la Que determinara la capacidad de la RNA para adap-

terse a los patrones de aprendizaje, a traves delos que se

incorpora el conocimiento en las redes neuronales.

Cada neurona tiene un valor num6rico modificableIlamado peso. La actividad Que cada unidad de procesa-

miento realiza en Una red de este tipo consiste en sunnar

los Va|ores de las entradas (Inputs) Que son recibidos de

otras neuronas conectadas a eIIa despues, compara esta

cant|dad con el valor denominado umbra! y, si lo igualao supera, envfa Una informaci6n de activacio� n o salida

(output) a las unldades de la capa siguiente a las Que este

conectada. Las entradas y las salidas Que cada unidad re-

cibe c envfa dependen def peso de las conexiones. Una

RNA esta constituida por varies capes de informaci6n, ge-neralmente Una capa de entrada (compuesta por las va-

riables independientes consideradas), Una o varias capas

intermedfas (ocultas), Que establecen las relaciones entre

las variables de entrada y salida y finalmente, Una capade salida Que es el resultado def conjunto de operaciones

anterior.

El primer modelo de neurona artificial Se lo debemos

a [WAR43]..

F!qu tja 7. ModeIo de neurolla artiflcialde McCulZoch y Pitts

Esta neurona recibiria Ne entradas. Las conexiones

aparecen en \a Figura 1 como f\echas Que parten de \azona izquierda y Que \\evan asociado un peso Wi donde

e\ subindice i Se ref|ere a \a entrada y toma va\ores entre

1 y Ne (Figura 2).

Ne

y j g(a) - g( S wixi)t-1

Las RNA son mode|Os de adaptaci6n es decir, Que

son capaces de aprender. Esta es la raz6n por la Que sonincluidas entre las tecnicas de la Inteligencia Artificial.

Como vimos, esta capacidad de adaptaci6n de Una RNA

Se utiliza mediante un proceso de formaci6n especifica enla Que el usuario aprepara>> la red mediante un patr6n de

entrenamiento.

Debido a su estructura, las RNA se basan en un tipo de

l6gica diferente a la booleana: se trata de la l6gica dlfu-sa. Por ello, las RNA pueden convertirse en herramientas

Los mode|Os predictivosno pueden sU plir la informaci6n

obtenida mediantela prospecci6n arqUleol6gica,

pero sf CorltribUyen a sustituirlade forma apriorfstica

__________________________________

mas flexibles para abordar el problema de la complejidad

social/arqueol6gica, aunque esto l6gicamente esta. porver~ Desarrollaremos a continuaci6n un caso practico en

el Que aplicamos las RNA en la elaboraci6n de un modelo

predictivo arQueol6gico.

4. UN C ASO PRACTICO

EN ARQUEOLOGfA

Para implementar la red utilizada en nuestro caso

practico, Se utiliz6 el software libre Pithya orientado al

diseho y desarrollo de redes neuronales artificiales, y un

$!Sterne de lnformaci6n Geogra�fica.Los parametros de la RNA (<<pesos~) son inicialmen-

te un conjunto de Va|ores aleatorios. Durante la fase deentf enamiento el output de la red es comparado con el

output esperado el error y el error propagado hacia la

entrada de la red. La propagaci6n hacia atras de errores

o retropropagaci6n (def ingl6s backpropagation) es un af-

goritmo de aprendizaje supervisado Que suele utilizarsepara el entrenamiento de redes neuronales artificiales.

Consiste en minimizar un error (generalmente cuadra'tico)

mediante un gradiente descendiente, asf, el fundamento

def algoritmo es el caIculo de las derivadas parciales def

error con respecto a los para~metros de la red. Por tanto,

durante la fase de entrenamiento las entradas y salidasdeseadas, se procesan para optlmizar la salida de la red, lo

Que significa reducir al mfnimo la desviaci6n:

( ol!TPl;T D!\_^ - ol!TPI NET)2

OUTPUT 85 el va\or de salida en los datos de entrena-o^T>miento OtIlPtITNj j, es el valor de salida Que ofrece la repro-

ducci6n de los datos de entrada con la red.Durante la siguiente fase, la de reproducci6n estos

S

Las RNA son mode|Os deadaptaci6n, es decir, qUe soncapaces de aprender. Esta es

la razn por la que son incluidasentre las tcnicas de la Inteligencia

~Arti~cial

par8metros de la red no se modifican y la red se utiliza

para la reproducci6n de dams de entf ada con el fin deupredecir>> los datos adecuados de salida.

INPUTS LEvEL 1 LEVEL 2 OUTPUT

ooooo~093988

funci6n Fermi: I/(I+Exp(-4*(x-0.5))).

La <<activity>> de Nl Se calcula de la siguiente forma:

A = Cl*0.249733)+(0*-0.233776) = 0.249733

El output de Nl:O = Fermi(A)= 1/(1+ExpC-4*(0.249733-0.5))) = 0.268731

El output de Nl y N2 es el input para calcular N3

INPUTS LEVEL 1 LEVEL 2 OUTPUT

1,ool||i! 02

- -

La Figura 3 muestra Una red de retropropagaci6n

con dos Inputs y un output. Contiene dos capas de neu-ronas, compuestos por dos neuronas en el primer nivel y

Una en el Segundo. En estas redes de retroporpagaci6ncada neurona Heme Una salida y tantas entradas como

neuronas haya en la capa anterior. Cada entrada de red

es conectada a todas las neuronas en el primer nivel y

cada neurona de salida esta a su vez conectada a todaslas neuronas del nivel siguiente. Este tipo de arquitectU ra

tambien recibe el nombre generico de Perceptr6n Multi-

capa o MLP {Multi/ayer Perceptron).

La salida de la red es la entrada del siguiente nivel deneuronas. Cada salida de Una neurona se expresa de la

siguiente forma:

Para implementar la red utilizadaen nuestro caso practico, se utiIiz6

el software libre i)ithya, orientado aIdiseo y desarrollo de redes neuronalesartifclales, y un Sistema de Informaci6n

Geograf`ca

4. LAS VARIABLES

Nuestro estudio de caso Va a ser de nuevo el patr6n

de asentamiento de los asentamientos fortificados o <<cas-

tros>> del bajo Valle del Trubia. En otro trabajo ya hemos

desarrollado Una discusi6n extensa sobre la problem6tica

arqueol6gica de estos yacimientos [FERO9]. La intenci6nen este caso es comparar los resultados de la RNA con los

de la regresion Ifogfstica [FERIO], de forma que enfrenta-

mos no s6lo dos mode|Os predictivos diferentes (escalas

analiticas), sino tambien las dos l6gicas procedimentales.Este tipo de asentamientos a los que vamos a acercar-

nos fortificados y en altura son entidades ubicadas en

espacios muy especificos de caracteristicas singulares y

pueden ser caracterizados por algunas variables anatura-les>> o fisicas, Que !es son comunes Ca|turd, escasa accesibi ~

lidad, visibilidad sobre el entomo, distancia de las cuencas

hidrograficas). Hay por otro |ado otros tipos de variables,

como la relaci6n entre asentamientos o el control sobre

recursos agrol6gicos/ Que podriamos denominar <<cultu-rales>>. Asi, cada variable individual que caracteriza a los

asentamientos fortificados puede ser considerada como

Una entrada dentro de Una RNA. La salida u output de la

red consist|fa en delimitar aquellas zonas donde un asenta-miento fortificado <<puede>> o <<no debe>> estar. Las variables

Que hemos considerado para la elaboraci6n del patr6n de

entrenamiento son las siguientes:

1. Altura relativa

2.Visualscape

3. Control visual sobre los espacios mas 6ptimos para el

paso4.Orientaci6n

5. Alt ura absoluta sobre el hive| del mar

6. Distancia a los espacios ms 6ptimos para mantener

cultivos permanentes

La preparaci6n de todas el|as para ser integradas en

el SIG como variables ha sido explicada en otro trabajo[FERIO]. Una vez seleccionados los 23 patrones (uno por

yacimiento incluido en la muestra) se utiliz6 la calculadora

rster del m6dulo SIG, para aplicar las f6rmulas correspon-dientes. En primer lugar para el calculo de la actividad de

cada neurona (Activity = (Xl*Weigthl) +(X2*Weigth2) + . . .)~

Posteriormente con la aplicaci6n de la funci6n fermi CO =

Fermi(A)= I/(l+Exp((activity-O.5)))) se obtuvieron losoutputs. La topologia de la red utilizada puede verse en la

Figura 5.

La red neuronal esta compuesta por dos hive|es deneuronas de 6 y Una neuronas respectivamente. El out-

put final, o modelo de predicci6n se muestra en la Figura

6, donde Se compara con el anterior modelo obtenido

med|ante la aplicaci6n de regresiones logfsticas [FERIO],Figura 7.

a -

5. TEST DE MODELOS

Y COMPARACION

Durante las campaf:ias de prospecci6n realizadas enel 8rea de estudio tras la elaboraci6n de estos mode|Os,

se localizaron diferentes lugares de interes arqueol6gicoaunque no en todos ellos se ha documentado evidencia

material. En otros trabajos ya hemos defendido Que la

presencia de toponimia arqueol6gica (aspectos inmate ~riales de la cultura), Una vez sometida a ana|Isis es perfec-

tamente valida para sostener mode|Os interpretativos en

Arqueologfa del Paisaje [FERII].

A falta de un patr6n de test mas amp\io, esta pequeamuestra de yacimientos (5 en total) nos servir para estable-

cer la fiabilidad de los mode|Os generados provisionalmente.En el modelo de regresi6n logfstica 4 de los 5 nuevos

yacimientos localizados estaban en areas con un porcen-taje superior al 75% de probabilidad. Un 0nico caso en el

rango 50-75%.En el modelo de redes neuronales 4 de los 5 yaci-

mientos se localizaron en las areas de mayor probabilidad

(>90%), frente a 1 Que Se quedaba fuera de este rango.

En ambos casos el grado de fiabilidad del modelo esdel SID%.

Por areas el espacio de mayor probabilidad de nues-

tro modelo basado en RNA ocupa Una extensf6n de

aproximadamente 24 km2, lo Que representan el 26% delterritorio analizado (en total unos 94 km2).

En el caso de la regresi6n logistica, las zonas con un

rango de posibilidad superior al 75% se extend|Bron porun area de aproximadamente 21.5 km2: 22.4% del total.

En conclusi6n, no podemos afirmar,con los datos utilizados, que

ninguno de los mode|Os sea masefectivo en ningn sentido

Hay que aadir que noSe ha prospectado el 100%

del territorio, por lo que la fiabilidadde cada uno de los mode|Os

podrfa variar Si Se diesen nuevosdescubrimientos

__________________________________

Como podemos observar ambos modelos son va-

riables respecto a las areas de mayor previsi6n, aunque

equiparables en su extension. Si los combinasemos in-crementariamos la efectividad al 100% aunque como es

I6gico, tambien del area de maximo riesgo arqueol6gico.

En conclusi6n no podemos afirmar, con los datos uti-

lizados Que ninguno de los mode|Os sea m efectivo en

ningun sentido,Por 0Itimo hay Que ahadir Que no se ha prospectado

el 100% del territorio] por lo Que la fiabilidad de cada uno

de los modelos podrfa variar si se diesen nuevos descu-brimientos~

6. CONCLUSION Y CRfTICA

Mediante la utilizaci6n de un modelo predictivo gene-

rado a partir de RNA hemos mostrado Que su efectividadno difiere de otros modelos (por ejemplo los utilizados

con regresiones logfsticas) partiendo de las mismas varia-

bles dependientes.

Defendemos Una vez mas Que cuando hablamos de

probabilidad (presencia o no presencia de eventos en

modelos predictivos), no debemos olvidar Que se tratamas de Una herramienta para gestionar nuestro elevado

grado de desconocimiento, Que de Una <<propiedad>> de

la naturaleza o los fen6menos culturales. Simplificamos la

real|dad para entenderla aunque los mode|os utilizados(escalas analfticas, diferentes m6todos de trabajo) inten-

tan alcanzar un grado mayor de abstracci6n sobre elfa.

Cuanto mayor sea el nomero de escalas analfticas utiliza-

das rnas nos aproximaremos a la complejidad inherentea los fen6menos sociales-culturales aunque los Ifmites

siguen estando presentes: nuestra propia capacidad para

entenderlos med|ante modelos Que simplifican~ Es preci ~

samente en este ejercicio dial6gico de confrontaci6n de

distintos elementos donde cobra para nosotros sentido eluso de los mapas de riesgo, no siendo su verdadera fun-

ci6n tanto la de prever, como la de contrastar y evalUar

crfticamente lo previsto.

REFERENCIAS[FERIO] FERNANDEZ FERNANDEZ, J. (2010): <<Modelos pre-

dictivos y SIG. Algunos ejemplos de su aplicaci6n en

Arqueologfa: los asentamientos fortfflcados del VaIIedeI

Trubia (Asturias, Espaha)>>, Mapping, 140, pp.76-82.[DERO6] DERAVIGNONE, t-., MACCHI, G., (2006): aArtiflcial

Neural Networks in Archaeology>> Archeologia e Calco-

latori, 17, pp. 121-36.

[FERO9] FERNANDEZ CACHQ S. (2009):<<Bases conceptuales

y metodol6gicas de los modelos predictivos en arqueo-logia>>, en Fernandez Cacho (Coord.), MAPA: Modelo

Andaluz de Predicci6n Arqueol6gica e-ph cuademos,

Junta de Andalucfa nol pp. 8-32.

[FERO9] FERNANDEZ FERNANDEZ, J. (20O9): <<Una contribu-

ci6n a la lectura crftica de determinadas fuentes de infor-maci6n arQueol6gicas mediante la utilizaci6n de los SIG:

IDs "castros" del Valle del Trubia>> Territorio, Sociedad y

Poder: revista de estudios medievales, no 4 pp. 5-46.[FERII] FERNANDEZ FERNANDEZ, J. (2011): aToponifnia y

Sistemas de lnformaci6n Geografica. Un ejemplo de su

uso combinado en Arqueologia del Paisaje>>, Lletres As-

turianes, rlo 104, pp. 139-53.GAINES S.W~ y GAINES W.M. (1980): <<Future trends in com-

puter applications>>, American Antiquity 4513 pp. 462-71.

[MCC43] McCULLOCH W. Y PITTS, W. (1943): <<A logical cal-

culus of the ideas immantent in nervous activity>>~ Bulle-

tin of Mathematical Biophysics, vol. 5, pp. 115-133.[MEHO6] MEHRER, M. W., WESCOTT, K. L. (eds.). 2006.. GIS

and archaeological site location modeling. Boca Raton,

FL

[MITOI] MITHEN, SJ. 2001. Hunter ~garanter landscape ar ~

chaeology: The southern Hebrides Mesolitic Proyect,1988-98. Cambridge~

[ROS58] ROSENBLAT, F~ (1958): <<The Perceptron: A probabi-

listic model for information storage and organization in

the brain~ Psychological Review, 65, pp. 386-408.{STA99] STANI, Z., KVAMME, K. L 1999. Settlement pat ~

terns mode(ling through boolean overlays of social and

environmental variables. In New Techniques for Old Ti-

mes, edited by J. A~ Barcel6, Briz I., Vila A., Eds. Oxford:

BAR International Series[WAROO] WARREN, R.E., ASCH, [).L. 2000. A predictive mo-

del of archaeological site location in the Eastern Praire

Peninsula. In Practical applications of GlS for archaeolo-

~9ist: a predictive modeling kit, edited by K. L. WESCOTTLondon.

[WOOOIIWOODMAN,P E. 2001~ A predictive model for me-

solithic site location on Islay using Logistic Regressionand GIS. In Hunter-garanter landscape archaeology: The

southern Hebrides Mesolitic Proyect 1988-98, edited by

S. J. Mithen. Cambridge.

[ZH096] ZHOU J., CIVCO, D. (1996): <<Using genetic learning

neural networks forspatial decision making in GlS>>t Pho-

togrammetric Engineering & Remote Sensing, 62/11, pp.1287-95.

JesOs Fern8ndez Fern8ndez

Arque6logo y doctor en Hisforia por la Universidad de

Oviedo. Ha desarro/fado tareas de investigaci6n y docen-

cia en var/Os cenfros y Universidades entre las que desta-

can Las unlversidades de Oxford, londres (UCL), BurgosSantiago de Compostela y Granada. Cuenta con m6s de

una quincena de trabajos publicados teniendo como

/fneas de investigaci6n principa/es /a arqueoLogfa de/

palsaje y la aplicaci6n en este campo de los Sistemas de!nformaci6n Geogr6fica. Actualmente desarrolLa un pro-

yecto SIG denominado ARMENOP (ArqueologCa Medieva/

de/ Norte Peninsu/ar) con /a Universidad del Pals Vasco.