La lexicografía histórica del español: tradición y nuevas perspectivas

19
monografías XIV MAR CAMPOS SOUTo-RAMÓN MARIÑo- J OSÉ IGNACIO PÉREZ PASCUAL-ANTONIO RIFÓN (EDS.) INSTITUTO HISTORIA DE LA LENGUA director JoséA. Pascual coordinadorade la colección Marta Gómez Martínez <<ASSÍCOMO ESDE SUS O DICHO»: ESTUDIOS DE MORFOLOGÍA Y LÉXICO EN HOMENAJE A JESÚS PENA COMITÉ ASESOR DE LA COLECCIÓN DE MONOGRAFÍAS Rosa María Espinosa Elorza, Universidad de Valladolid Rafael Carda Péreil Universidad Carlos IJI deMadrid MiguelAngel PucheLorenzo, Universidad deMurcia M. a Nieves Sánchez Conzález deHerrero, Universidad de Salamanca CONSEJO CIENTÍFICO DEL CILENGUA El Director de la Real Academia Española, Prof José Manuel Blecua Perdices,presidente Prof. Micbe! Banniard, Université de Toulouse-I,s Mirail Prof. Roger Cbartier; EHESS & College de France t Prof. Alan Deyermond, University ofLondon Pro[ José Angel Garda de Cortázar, Universzdad de Cantabria Prof Francisco Gimeno, Universidad de Valencia Prof Carlo Ossola, College de France El Director del Dpto. de Filología Española de la Universidad de La Rioja, Prof. Jorge Ferrtández El Director del Instituto de Historia de la Lengua del Cilengua, Prof José Antonio Pascual El Director del Instituto Literatura y Traducción, Prof. Carlos Alvar El Director del Instituto Origenes del Espatio! del CzJmgua, Pro! Claudio Garda Tur-:ta El S ecre/ariodel Consejo Científico, Pro[ Gonzalo Capellán ~ ..", ( lengua SAN MILLÁN DE LA COGOLLA 2012

Transcript of La lexicografía histórica del español: tradición y nuevas perspectivas

monografíasXIV

MAR CAMPOS SOUTo-RAMÓN MARIÑo-JOSÉ IGNACIO PÉREZ PASCUAL-ANTONIO RIFÓN (EDS.)

INSTITUTO HISTORIA DE LA LENGUA

directorJosé A. Pascual

coordinadorade la colecciónMarta Gómez Martínez <<ASSÍCOMO ES DE SUS O DICHO»:

ESTUDIOS DE MORFOLOGÍA Y LÉXICOEN HOMENAJE A JESÚS PENA

COMITÉ ASESOR DE LA COLECCIÓN DE MONOGRAFÍASRosa María Espinosa Elorza, Universidad de ValladolidRafael Carda Péreil Universidad Carlos IJI deMadridMiguelAngel Puche Lorenzo, Universidad deMurcia

M. aNieves Sánchez Conzález deHerrero, Universidad de Salamanca

CONSEJO CIENTÍFICO DEL CILENGUAEl Director de la Real Academia Española, Prof José Manuel Blecua Perdices,presidente

Prof. Micbe! Banniard, Université de Toulouse-I,s MirailProf. Roger Cbartier; EHESS & College de Francet Prof. Alan Deyermond, University ofLondon

Pro[ José Angel Garda de Cortázar, Universzdad de CantabriaProf Francisco Gimeno, Universidad de Valencia

Prof Carlo Ossola, College de FranceEl Director del Dpto. de Filología Española de la Universidad de La Rioja, Prof. Jorge Ferrtández

El Director del Instituto de Historia de la Lengua del Cilengua, Prof José Antonio PascualEl Director del Instituto Literatura y Traducción, Prof. Carlos Alvar

El Director del Instituto Origenes del Espatio! del CzJmgua, Pro! Claudio Garda Tur-:taEl S ecre/ariodel Consejo Científico, Pro[ Gonzalo Capellán ~ ..",

( lengua

SAN MILLÁN DE LA COGOLLA2012

REDACCIÓN Y ADMINISTRACIÓNCilengua - Instituto Historia de la Lengua

Plaza del Convento, s/n.26226 San Millán de la Cogolla. La RiojaPágina web: http://www.cilengua.es

Correo electrónico: [email protected]éfono: 941.373.389 / Fax: 941.373.390

Se aceptan colaboraciones para esta colección de MONOGRAFÍAS siempre y cuandosean textos originales, inéditos y no se hayan enviado a otra revista o publicaciónpara su evaluación. Cada propuesta de colaboración será evaluada anónimamentepor, al menos, dos miembros del Comité Asesor de la colección y llevará el vistobueno del director del Instituto Historia de la Lengua, don] osé Antonio Pascual. Laresponsabilidad sobre las opiniones vertidas en los textos y sobre el respeto a lapropiedad intelectual corresponde a los autores.

© Cilengua. Fundación San Millán de la Cogolla©Autor

LS.B.N.: 978-84-939292-7-5D.L.: LR 408-2012

Impreso en España. Printed in Spain

13

LA LEXICOGRAFÍA HISTÓRICA ACTUAL:TRADICIÓN y NUEVAS PERSPECTIVAS

ALEJANDRO FAJARDO AGUIRREUniversidad de La Laguna

1. LA LEXICOGRAFÍA HISTÓRICA ENTRE DOS SIGLOS

En los comienzos del siglo XXI, la lexicografía histórica se encuentra enuna situación de transformación profunda y los lexicógrafo s deben hacerfrente a una incómoda coyuntura que les aboca a renovar sus métodos detrabajo al mismo tiempo que se esfuerzan por dar continuidad a proyectoscomenzados muchos años atrás. Comentaremos una serie de diccionariosdiacrónico s de distintas lenguas europeas que son de interés por surecorrido y pueden ser representativos por la forma en que han sidoafectados por las nuevas circunstancias o se han adaptado a ellas.

En los últimos decenios, la premura en la obtención de resultados,también en el campo de las humanidades, se ha convertido en prioritaria pordelante de otras consideraciones, de manera que los proyectos culturales alargo plazo deben soportar, en el mejor de los casos, una presión constantey la exigencia de resultados visibles a corto plazo; en cambio, la tradición dela lexicografía histórica, tal como nació en el siglo XIX y se continuó hacien-do durante gran parte del xx, mide habitualmente el periodo de vida de susproyectos en decenios: nueve (Bahr, 1984) son los que tardó en completarse

196 ALEJANDRO FAJARDO AGUIRRE

el representante más significativo de estos diccionarios: el Deutsches Wdrter-buch (DW) de Jacob y Wilhelm Grimm (1854-1961); su duración se ha vistosuperada por el Deutsches Rechtswdrterbuch (DRW), comenzado en 1896, queanuncia ya su previsible finalización en torno a 2035; en Francia, para la ela-boración del Trésor de la languefranfaise (TLF) trabajaron durante tres décadasun promedio de cien redactores y personal técnico en una obra que se pu-blicó en 16 volúmenes (Del Mancino, 2009). En lo que se refiere al inglés(Torres, 2012), la larga trayectoria del Oxford English Dictionary (OED) tuvosu desarrollo diacrónico en el proyecto del Historical Thesaurus of the OxfordEnglish Dictionary (HTOED) publicado en 2009, pero fraguado desde losaños sesenta por Michael Samuels en la Universidad de Glasgow, tuvo quesortear toda clase de obstáculos, incluido un incendio en los setenta, y lasdificultosas adaptaciones a las nuevas formas de trabajo con datos quellegaron después (Kay, 1987). En el caso del español, el segundo intento dela RAE de elaborar el Diccionario histérico de la lengua española (DHLE) se inte-rrumpió antes de finalizar el cuarto decenio de trabajo, en 1996, tras consi-derar la Docta Casa que el primer fascículo databa de 1960 y que los mediosentonces disponibles condicionaban un lentísimo ritmo de producción 1 -

aunque no de trabajo para un reducido equipo-, por lo que el tiempo parasu finalización debería medirse en siglos.

Otro proyecto vital para la historia del español como el Diccionario del es-pañol medieval (DEM) del que nos ocuparemos luego, ha quedado detenidosine die,mientras que el Nuevo diccionario históricode español (NDHE), de recien-te diseño, se ve constreñido a probar pronto su eficacia.

Los longevo s diccionarios que se empezaron a elaborar hace muchotiempo son equiparables, valga el símil, a pesados trenes de mercancías queavanzan lentamente con una copiosísima carga que no deja de incrementarseen el trayecto, pero la alta velocidad que se demanda en nuestros días esdifícil de compatibilizar con la lentitud con que el personal --especializado,pero escaso- puede cargar ordenadamente miles de artículos. Solo con laprovisión a largo plazo de recursos suficientes se puede lograr una moderni-zación que no deje en vía muerta estos grandes proyectos; es lo que se hahecho con éxito, p. ej., en Francia con el Trésor de la languefranfaise itifonnatisé(TLFz); en Alemania, el citado DRW puede ser el modelo de adaptación alos nuevos tiempos sin romper con el valiosísimo acopio de materialeshecho durante un siglo. También el DW ha sido adaptado a las nuevas exi-

1 Los fascículos, digitalizados por la Fundación Rafael Lapesa, están disponibles en<http://web.frl.es/dh.html> [30/5/2012].

LA LEXICOGRAFÍA HISTÓRICA ACTUAL 197

gencias (Bartz, 2003) mediante un proceso de retrodigitalización- llevado acabo entre 1997 y 2001.

La lexicografía histórica no puede renunciar a su objetivo de partida: ladescripción exhaustiva de los cambios del léxico a través del tiempo, pero elconcepto de diccionario sí está experimentando una transformación queafecta a su misma concepción, a su estructura, a los métodos de trabajo dellexicógrafo y a la forma de poner los resultados a disposición del público.Los diccionarios deben ser, al fin y al cabo, información en estado puro,filtrada, contrastada, destilada y elaborada hasta el límite de la minuciosidad,en pugna siempre con el calendario y el reloj. Los lexicógrafo s, por tanto, nopueden permanecer con sus viejos métodos de trabajo inalterables y seguirsiendo el lujo erudito de antaño, sino que deben encontrar nuevos caminosmanteniendo, al mismo tiempo, el nivel filológico de su trabajo, es decir,presentando información fiable y de calidad científica.

2. LAs DOS CARAS DE LA MONEDA

Desde los años ochenta, el concepto tradicional de diccionario históricoempezó a resquebrajarse, al tomarse conciencia de que la informatizaciónabría nuevas posibilidades, no sólo en cuanto a herramientas de trabajo paraahorrar tiempo, sino fundamentalmente en cuanto a la cantidad de informa-ción disponible y a la manera en que ésta debía procesarse y ser recibida porel usuario.

Los procesos de informatización que afectan a la lexicografía puedencontemplarse desde un doble punto de vista:

a) Desde la perspectiva del usuario, las ventajas son evidentes: disponede un nuevo medio de acceso a la información caracterizado por la ubicui-dad, pues ya no existen barreras geográficas que lo impidan y su manejo escómodo, es posible disponer de grandes cantidades de obras en soporte di-gital con un coste reducido y realizar búsquedas selectivas. Existen tambiénalgunos inconvenientes, porque el proceso informatizado produce erroresnumerosos: la máquina puede automatizar también los errores, como vere-mos más adelante.

b) Desde el punto de vista del lexicógrafo, en cambio, todos los méto-dos de trabajo se ven afectados y transformados ante la necesidad de proce-sar una información que se presenta a veces en forma de avalancha, lo quelejos de facilitar la tarea, supone en ocasiones un impedimento para avanzar;

2 El proceso, llevado a cabo en el Kompetenzzentrum ftir elektronische Erschliej1ungs-undPublikationsverfahren in den Geisteswissenschaften de la Universidad de Trier, se describe en:<http://dwb.uni-trier.de/start> [30/5/2012].

198 ALEJANDRO FAJARDO AGUIRRE

esto obliga a establecer filtros que desechen información, entre la que siem-pre se puede ocultar, para desazón del lexicógrafo, algún dato importante.

Hace unos años, en la primera de las ocho recomendaciones que dabaTrauth (2004: 4) para el adecuado uso de los medios informático s en losproyectos lexicográficos a largo plazo, señalaba la necesidad de un distan-ciamiento crítico:

Bewahren Sie sich kühle und kritische Distanziertheit gegenüber einerWelt, die von selbsternannten Fachleuten, falschen Propheten undideologischen Grabenkampfern nur so wirnmelt. Machen Sie sich frei vondem Druck, den Gurus und Medizinmanner, Kollegen, Ministerien undStiftungen auf Sie ausüben, und fragen Sie sich, von Zeitgeist undmodischen Zwangen unbeeindruckt, ganz nüchtern: «Was kann die EDVoder dieses Programmsystem oder jene neue Publikationsform mirüberhaupt Wesentliches leisten? Worin besteht denn eigentlich derFortschritt oder die davon zu erwartende Bereicherung meinerwissenchiftlichen Arbeit, und nicht zuletzt: Rechnet sich der dafür zu treibendeAufwand?» (2004:4)3.

Aun compartiendo con Trauth la necesidad de distanciamiento crítico,debemos ser conscientes de que la informatización completa de los procesosque implica la elaboración de diccionarios no es ya una opción, sino unaexigencia indispensable. Naturalmente, esto conlleva la necesidad dedistinguir con claridad entre la actividad asépticamente fllológica, por unaparte, y el necesario apoyo técnico, por otra. La rápida evolución del softwarey la de la inteifaz de usuario está haciendo cada vez más sencilla la labor dellexicógrafo. Otras tareas hace poco tiempo engorrosas en las nuevasredacciones lexicográficas se han simplificado con rapidez, como laconservación segura de los datos y la búsqueda de comodidad en lavisualización de los trabajos; además, la elección de lenguajes informático scon perspectivas de futuro permite usar los datos en distintas plataformas yliberarse así de la dependencia de programas comerciales que quedan porcompleto inservibles al cabo de unos pocos años.

Para tener una perspectiva de cómo se ha enfrentado la lexicografíahistórica a la transición informática, exarrunaremos los cambios

3 «Manténgase frío y con distancia crítica frente a un mundo de autodenominadosespecialistas, falsos profetas y luchas ideológicas. Libérese de las presiones que ejercensobre usted, de los gurús y hechiceros, colegas, ministerios y fundaciones, y cuestión ese aldesnudo, sin impresionarse por el espíritu del tiempo y las presiones de la moda: ¿Quépuede aportarme en cuanto al conocimiento la informática o determinado programa o esanueva forma de publicación? En qué consiste el progreso o el esperado enriquecimiento demi trabajo científico y no en último término: ¿vale la pena el esfuerzo?».

LALEXICOGRAFÍA HISTÓRICAACTUAL 199

metodológicos experimentados, con distintos procedimientos y soluciones,por varios diccionarios históricos dedicados a distintas lenguas, que cuentancon una larga trayectoria y que, aunque se encuentran en etapas derealización muy distintas, están inacabados en la actualidad: el DeutschesRechtswiirterbuchs (DRW), el Dictionnaire Érymologique de l'Ancien Francais(DEAF), el Dictionnaire onomasiologiquede I'anciengascon (DEAG); el Diccionariodel españolmedieval (DEM) y el Nuevo diccionariolnstárico del español (NDHE).

3. TRES SUERTESY SOLUCIONES DISTINTAS

3.1. EIDeutsches Rechtswórterbuchs. una trayectoriaenvidiable4

Este diccionario es especialmente interesante por varios motivos. Enprimer lugar, por su longevidad: tiene su origen en la Prusia del XIX, en1896, auspiciado por la KiiniglichPreujischen Akademie der Wissenschaften, fue en1912 cuando se publicó el primer fascículo y en la actualidad, estánpublicándose los fascículos del tomo XII (2012), se prevé la finalización delmonumental diccionario entre 2031 y 2035. La continuidad y la seguridad enla financiación a largo plazo han permitido abordar sin precipitaciones laadaptación de una obra concebida en el XIX -y comenzada a publicar hacecerca de un siglo- a las posibilidades técnológicas del XXI. Junto a los casidoce volúmenes completos, aparecidos periódicamente en la formatradicional, se ha llevado a cabo de forma paralela un proceso dedigitalización que ha permitido conjugar la tradición con las nuevasposibilidades de acceso electrónico a la información. Por una parte, se hacreado el DRQEDIT, con la finalidad de hacer accesible via Internet elcorpus completo de los textos jurídicos de los siglos XV-XVI, parte de loscuales pueden encontrarse ya en las bibliotecas digitales y son accesiblesahora por búsqueda a partir de diversos metadatos. Es especialmenteinteresante la relación de la versión en línea del DRW con su versiónimpresa, en la que se basa, pero de la que se diferencia en algunos aspectos:no se trata de reproducir la imagen tal como se imprimió, sino de hacer unapresentación visualmente adaptada a las características del nuevo medio.Cuenta con posibilidades de remitir mediante enlaces a otros artículos, a lasfuentes y a otros diccionarios históricos. También se hace posible incluir enla versión electróncia de los nuevos fascículos las citas que por motivos deespacio no aparecen en la edición en papel. Entre las distintas opciones, sonposibles las búsquedas truncadas mediante el asterisco, las textuales

4 <http://drw-www.adw.uni-heidelberg.de/cIrw/> [30/4/2012].

200 ALEJANDRO FAJARDO AGUIRRE

completas en las citas o en las explicaciones y las combinadas con palabrasrelacionadas.

El banco de datos del DRW en línea, basado en la estructura del artículolexicográfico, ha sido incrementado con el volcado de los datos procedentesde los antiguos fascículos, lo que fue precedido de la unificación de las siglasy de una revisión de indicaciones poco claras sobre las fuentes, asimismo secrearon enlaces con aquellas que estaban ya digitalizadas. El proceso derevisión permite, además, incorporar correcciones sobre errores detectadosen los fascículos y, eventualmente, incluir artículos que por una u otra causano habían llegado a aparecer impresos. La versión electrónica permite,además, el enlace de cada artículo con la versión impresa, con diversasposibilidades entre las que se incluye la presentación electrónica del facsímil.

3.2. El Dictionnaire Étymologique de l'Ancien Francais y elDictionnaireonomasiologique de l'ancien gascon: dosmaneras de sobrevivir5

En el caso del Dictionnaire Érymologiquede l'Ancien Fran{ais (DEAF), se hadesarrollado desde 2008 un sistema de trabajo y de publicación mediantesistemas electrónicos, realizado en colaboración con técnicos en gestión dedatos, lo que ha dado lugar a la nueva versión electrónica del diccionario: elDEAFEI. Este aporta dos tipos de informaciones: en el llamado DEAF-plus, se presentan los artículos tal como estaban en la versión impresa. Seaccede así a todo lo publicado en los volúmenes aparecidos entre 1974 Y2008, los dedicados a las letras G, H, I,], K que se reproducen en formatode imagen. Las letras D, E, F se presentan tanto en la forma impresatradicional como en Internet: tras un periodo de embargo de dos años desdeel momento de la publicación en papel, aparece la versión electrónica, elDEAF-plus, que añade también la posibilidad de acceder electrónicamente amateriales complementarios que no están, por razones de espacio, en laversión en papel. Por otra parte, el trabajo con las letras A-e y L-Z consistióen llevar a cabo su lematización y en proveer al diccionario de un estructurasemántica, para hacerlo accesible en el desarrollo de trabajos posteriores-.

Una vía adicional de información se presenta a través del DEAF-pré-del que están disponibles por el momento las letras L y M-, queproporciona materiales lematizados, publicados solo en línea y cuyo usodebe hacerse con cuidado, según indican los autores, pues están en procesode constante revisión. Se trata de materiales a los que se ha dotado de unaestructura semántica provisional, porque para hacerla no se han verificado

5 <http://deaf-server.adw.uni-heidelberg.de/ > [30/4/2012].6 <http://www.deaf-page.de/beschreibung.htm> '[30/4/2012].

LA LEXICOGRAFÍA HISTÓRICA ACTUAL 201

los materiales con las fuentes de manera directa, sino únicamente con losregistros de las fichas, que en muchas ocasiones adolecen de unainformación insuficiente. Sin embargo, son de gran utilidad los datos que seaportan: formas, ejemplos de uso y, además, la posibilidad de acceder,mediante un enlace en las siglas, a la bibliografía electrónica? (DEAFbibIEL).En ocasiones, también se enlazan las entradas con informaciones que danotros diccionarios en linea.

El DzCtionnaireonomasiologiquede l'anaen gascon / Wó"rterbuchder altgaskognischenUrkundensprache (DOAG) tiene su origen a mediados del siglo xx, cuando en1955 Kurt Baldinger presentó el proyecto; veinte años habría que esperarhasta la llegada del primer fascículo. En 2007 hubo una modificación en lasorientaciones científicas, una vez se hizo cargo de su dirección Jean-PierreChambon, sin embargo, en este caso no se llevó a cabo la transformaciónpara presentar los materiales en forma digital. Los cambios llegaron de otraforma, cuando en 2009 apareció el fascículo 11 de una obra que inicialmentefue planeada en 130 fascículos de unas ochenta páginas, pero que a partir delsiguiente fascículo 12 se presentó como un diccionario mucho más conciso,simplificado y con citas limitadas a un solo ejemplo.

3.3. El Diccionario del español medieval: batalla contra dos tipos deproblemas

3.3.1. Problemas metodológicos y solucionesEl Diccionario del español medieval (DEM) (Müller, 1987-2005) comenzó a

fraguarse en los años setenta, cuando Bodo Müller proyectó en laUniversidad de Heidelberg cubrir la laguna que para la filología románicasuponía la ausencia de un diccionario que describiera, con los métodosrigurosos de la lexicografía histórica, el léxico español de los siglos X afinales del XIV. El primer fascículo se publicó en 1987, y el último fue el 26,en 2005, superada la mitad del tercer tomos.

La propia historia del DEM, que ha ido experimentando en el últimotercio de siglo las profundas transformaciones impuestas por la transmisiónde la información en la nueva sociedad, es una excelente muestra de loscambios a los que se ha visto forzada nuestra disciplina. La informatizaciónha afectado a este diccionario, que también nació en los moldes de lalexicografía histórica tradicional y tuvo que ir incorporando con el paso delos años sucesivas modificaciones, a tenor de los avances técnicos. Su

7 <http://www.deaf-page.de/fr/bibl_neu.htm> [30/5/12]81994: vol. 1, 2000: vol. II, vol. III (fase. 26, 2005).

202 ALEJANDRO FAJARDO AGUIRRE

periodo de actividad ha venido a coincidir con los años en que seimplantaron los nuevos métodos de adquisición, almacenamiento Y"procesamiento de la información, por lo que los investigadores del proyectodebieron resolver cuestiones que afectaban a dos aspectos fundamentales:las enormes masas de datos suministrados en forma digital, pero sinclasificar ni elaborar f.tlológicamente (materiales sin lematización) y laadaptación informática de los articulo s redactados.

En los comienzos del proyecto, cuando el libro era el soporte de todaslas fuentes textuales, se fue reuniendo una extensa biblioteca medieval conmás de setecientas obras de todas las ramas del saber, de cuya lecturameticulosa se extractaron las informaciones con las que hicieron lastradicionales papeletas lexicográficas en fichas de papel, cientos de miles,que contenían información de unas 50 000 palabras lematizadas y ordenadaspor familias y con su referencia a la biblioteca de textos y a la literatura se-cundaria. Almecanadas en cientos de archivadores, las fichas fueroncubriendo todas las paredes del Romanisches Seminar de la Universidad deHeidelberg. A finales de la década, comenzaron a cambiar las cosas, porquellegaron al mercado las transcripciones de los primeros textos del HispanicSeminary of Medieval Studies de Madison en cuya edición se habían utilizadocomputadoras, lo que implicaba que los textos venían acompañados de lasconcordancias de formas extraídas por los medios informático s de la época,que, si bien precarios aún, ya presagiaban lo que estaba por venir: elincremento implacable de la cantidad de datos que el equipo de redacción severía obligado a procesar (el RqyalScriptorium de Madison, p. ej., contiene entotal 8 000 páginas de texto, de las cuales cada forma se encuentra registradaen las concordancias correspondientes). Se introdujeron así los ordenadores,como complemento de los ficheros, y con ellos se añadieron, en el nuevosoporte digital, muchos miles más de documentaciones.

En este momento, se definió con claridad la existencia de dos procesosparalelos: por una parte, los lexicógrafo s realizaron una extracción manualde los datos texto a texto, con paciencia y meticulosidad se dedicaron aestablecer los criterios f.tlológicos que afectan a la valoración del texto y de laedición, a la datación de la forma, a la resolución de cuestiones referentes alas grafías, a la determinación de valores semánticos, a la lematización, etc.Por otra parte, los nuevos productos aportaron enormes cantidades deformas sin f.tltrar, repetidas en infinidad de ocurrencias, todo ello con unorden únicamente superficial, limitado a la alfabetización, lo que hizonecesario trabajar f.tlológicamente enormes cantidades de datos, analizándo ylematizando interminables listas de concordancias para incorporadas alfichero general.

LA LEXICOGRAFÍA HISTÓRICA ACTUAL 203

En 1984 se encontraba ya lematizado y ordenado el más importantefichero documental existente sobre el español medieval; en ese momento laDeutsche Forschungsgemeinschcifttransfirió el proyecto a la HeidelbergerAkademieder Wissenschaften, que lo recibió dentro de su programa con la categoría de«proyecto de larga duración», junto a otros trabajos lexicográficos que yaacogía (como el DRW, el DEAFy el DOAG). En los años ochenta, el DEMpreparó un sistema informático con el fin de facilitar la publicación de susfascículos, que- empezó en 1987; se trataba de un programa escrito en unlenguaje informático de la época: turbopascal, que aunque exigía lapermanente introducción de códigos para indicar la tipografía y los signosespeciales necesarios para la impresión, supuso la introducción en 1988 de laredacción digital.

A comienzos de los noventa, por tanto, la digitalizacion ya habíaafectado al DEM en dos aspectos: la aportación de materiales paraincorporar al fichero y la manera de preparar los artículos para lapublicación; en este empeño en readaptarse a las novedades, en 1992 se dióun paso más para transformar los métodos de trabajo y se comenzó acompilar una base de datos con textos digitalizados, a la que se incorporaronlas grandes colecciones de textos hasta entonces editadas: ediciones demicrofichas que abarcaban unas 30 000 páginas, las colecciones del Archivodigital de manuscritosy textos españoles (ADMYTE) , etc., y continuó creciendocon la incorporación progresiva de textos hasta el año 2000. Las edicionesdigitalizadas que aparecieron presentaban en muchas ocasiones un problemaañadido (aunque ya conocido a través de las publicaciones de Madison): nose trataba de ediciones críticas, sino paleográficas, con defectos frecuentesde transcripción, que a veces debían ser desechadas cuando se comprobabanlos problemas que ocasionaba su uso.

Para acceder a la enorme cantidad de datos almacenados en formadigital, se desarrolló en los años noventa un programa de búsqueda propio,llamado DEMSUCH. La base de datos funcionaba como las microfichas, esdecir, registraba todas las formas en todas sus ocurrencias, por lo tanto,dejaba el trabajo de análisis y lematización a los fllólogos y el caudal dematerial para trabajar siguió creciendo. La gran masa de datos del ficheroinformatizado sumaba 272 043 unidades, que se añadieron a las del ficherotradicional, aunque este aumento no fue acompañado de un incrementoparalelo de la cantidad de unidades totales, pues aproximadamente un 80 %de los lemas ya habían sido recopilados de forma manuaL

Las ediciones de textos en CD, como p. ej., ADMYTE (1992),aportaban una burda lematización, muestra de que los editores de la

204 ALEJANDRO FAJARDO AGUIRRE

colección capitularon ante la cantidad de datos: los numerosos hápax fuerondesechados y la lematización revela que no fueron revisados los textoscorrespondientes. Como consecuencia de esto, no se puede determinar en elglosario si una forma como, p. ej., agua es un verbo o un sustantivo ni si abiense identifica con ha bien o con a bien. Por tanto, la incorporación deinformaciones procedentes de esta fuente, con ser valiosa, no llegó exenta deproblemas para los lexicógrafos. Los cedés vienen con un glosario de formas yun glosario de lemas, pero los editores no informan de cuántas palabras seencuentran documentadas en los dos discos de ADMYTE (64 textos en laversión O y 651 la 1) (pellen, 1997). Se pueden estimar en 4 600 000 lasformas solamente en la versión 1, lo que vienen a ser unas 160000 unidadesléxicas. Según los editores, el glosario de lemas que acompaña los cedésregistra las formas castellanas con una frecuencia >1 (o sea, excluyen loshápax), lo que son unas 46 918 formas distintas (Mayor, 1993). El glosariode lemas contiene 11 165 lemas (ib.). El criterio de selección de formas paralematizar es, por tanto, estadístico y no lingüístico. Las formas asíseleccionadas han sido lematizadas sin lectura de control del textocorrespondiente, lo que explica los numerosos errores que se encuentran: p.ej., el adverbio así se ha lematizado bajo el verbo asir, venga se encuentrasolamente bajo vengar y falta bajo venir;fui se encuentra solamente bajo ser yfalta bajo ir (pellen, 1997: 95).

La enseñanza que extraemos de casos como este es que la lematizaciónftlológica, que sigue a la atenta lectura de los textos, no puede ser sustituida,sin más, por una lematización automática fiable. Los diccionarios publicadoshasta la fecha con este procedimiento indican que en el momento en que seelaboraron no se disponía de un programa de lematización específico para elespañol medieval; por otra parte, si aplicáramos automáticamente unalematización basada en el español actual, incurriríamos en una cantidad defallos muy importante, como se observa en algunos ejemplos queencontramos en el Diccionario de la Prosa Castellana deAlfonso X el Sabio (2002),donde la definición automática de palabras marcadas como gentilicio s dalugar a errores provocados por la extrapolación del valor semántico a unarealidad, la medieval, que puede ser muy distinta de la actual, tal como seaprecia, p. ej, en «alemán: natural de Alemania»: la transferencia del valorsemántico de hoy día al gentilicio resulta errónea, puesto que Alemania noexistía en la Edad Media como en la actualidad. Otro ejemplo extraído de lamisma obra: el artículo alcalde acaba con «Definiciones indeterminadas [...]»:aquí se reúnen todas las documentaciones que la redacción no puede o notiene tiempo de aclarar, lo que resulta metodológicamente cuestionable.

LA LEXICOGRAFÍA HISTÓRICA ACTUAL 205

El DEM buscó una solución de compromiso a la enorme masa deejemplos disponible con el fin de aprovechar el trabajo filológico realizadodurante treinta años de recopilación y lematización. Con esa finalidad, seestablecieron unos criterios que limitaran el número de ejemplos quetrabajar y así poder obtener resultados en un plazo razonable de tiempo. Elprocedimiento consistiría en procesar y añadir los ejemplos siguiendo uncriterio cronológico, hasta un límite fijado en los cinco primeros casos, a losque en etapas posteriores se podrían añadir más; el resultado sería un dic-cionario de aproximadamente 40 000 entradas. Para la semántica de las pa-labras, el criterio cronológico implica que, en ocasiones, los significadostardíos en palabras abundantemente documentadas hasta finales del sigloXIV no podrían ser registrados en el diccionario; este sería el tributo a pagarpor la aceleración del ritmo de redacción, tal como se aprecia en las zonassombreadas de la muestra de la palabra almizcle. Abajo, vemos una selecciónde ejemplos procedentes del fichero del DEM desde la pruneradocumentación de la palabra almizcle hasta comienzos del siglo XV:

almizcle m.

1.1. «cierta sustancia aromática»

[1253] LEngaños p 7,127(var.): almyscle

[1381] Estéfano Visita 32r54: almizq<ue>

[c 1381] SevillanaMedicinaJaviñón 68 p 336: almisque

[1385?] LPalladio 227v14: Almesch

[1389] DocsArchivoMedinaceli 1 28 P 32: almisque

[2amit. S XIV] Heredia MarcoPolo 72r66: lalmesech

[fines s XIV] Sinonima p 129,14: almizque

[1423] ArteCisoria(ADMYTE O)24r: almjz<que>

[a 1429] Chirino Medicina 108r18: almiz<que>

1.2. «perfume elaborado a base de esta sustancia»

[a 1330?] LeyesMoros p 77: almizcan [sic]

1.3. «frasco de perfumes»

[e 1400] BibliaJudCrist II Is 3 p 477: almizques

2.1. «mirra»

206 ALEJANDRO FAJARDO AGUIRRE

[e 1280] AT Exodo 30,23: almisque

[e 1400] BibliaJudCrist II Est 2 p 177: almizque

2.2. «perfume u óleo aromático a base de mirra»

[e 1400] BibliaJudCrist II Can 5 p 372: almizque

3. «olor de las flores de la casia»

[e 1400] BibliaJudCrist II al 44 P 257: almizgue

3.3.2. La problemática financiación a largo plazo de los estudioshispánicos

Este planteamiento de desarrollo selectivo no se ha llevado a cabo debi-do a que se interrumpió en la financiación al proyecto. Durante varios años,a partir de 2006, un equipo de investigadores del Instituto de Estudios Me-dievales y Renacentistas de la Universidad de La Laguna, formado en elmétodo del DEM y trabajando en conexión con Heidelberg a través de In-ternet debería aumentar el ritmo de redacción. Sin embargo, los recortespresupuestarios en investigación por parte de la institución financiadoraalemana afectaron directamente al proyecto de diccionario del español. Ellanzamiento por esas mismas fechas del proyecto del Nuevo diccionario históricodel español, auspiciado por la RAE, truncó las posibilidades de continuidaddel DEM, pues algunos quisieron ver como redundante s proyectos en reali-dad muy distintos y que eran, en cierta medida, complementarios y de distin-to fundamento metodológico. A diferencia de la pervivencia de los proyec-tos históricos del ámbito galorrománico que hemos comentado, llevados acabo también en Alemania, el riguroso diccionario dirigido por Boda Mü-ller, en la tradición admirable de los grandes romanistas alemanes de otrostiempos, quedó abandonado a su suerte por parte de quienes deberían haberpuesto los medios necesarios (económicos, diplomáticos y de política cultu-ral), para su pervivencia, considerando que era el único proyecto existentededicado a documentar y describir los primeros siglos de vida de la que sepresenta, a veces con excesiva retórica, como una gran lengua internacionalde cultura.

4. EL NUEVO DICCIONARIO HISTÓRICO DEL ESPAÑOL: UNA OPCIÓNRUPTURISTA

En el caso de la RAE, las opciones eran bien la adaptación del viejo Dic-cionario histórico de la lengua española a los nuevos tiempos, mediante alguno delos métodos aplicados en los diccionarios que hemos visto, o bien la rupturacon los métodos tradicionales. La apuesta se hizo por un nuevo modelo: «se

LA LEXICOGRAFÍA HISTÓRICA ACTUAL 207

basará en los métodos de la Lingüística, la Filología y la Informáticae". Laobra se concibe como un diccionario electrónico y para llevarlo a cabo fuecreada, a instancias de la Real Academia Española, la Fundación Instituto deInvestigación Rafael Lapesa para el Nuevo diccionario histórico del español. Sufinalidad lexicográfica consiste en: «La construcción del NDHE, obra enque se presentará la evolución de las formas y de los significados de las pa-labras, dentro de las redes de relaciones que, en los distintos niveles lingüís-ticos y semántica s, se han ido estableciendo entre ellas a lo largo de los si-glOS»lO.Para el trabajo interno en la Fundación, se ha confeccionado el Cor-pus del Nuevo diccionariobistárico (CDH), punto de partida del que se extrae ellemario básico para una primera etapa de redacción del NDHE.

Hasta la fecha, los resultados que se han hecho públicos consisten fun-damentalmente en la digitalización de materiales del antiguo Diccionario bistá-rico de la lengua española, de cuatro ediciones del DRAE Y la publicación enimágenes de las viejas papeletas de los ficheros de la RAE. Es decir, se posi-bilita el acceso digital a datos sobre el léxico español que estaban en papel,pero es necesario aún que su elaboración dé frutos en forma de artículoslexicográficos (en cualquier soporte) con una rapidez que justifique la ruptu-ra radical con los antiguos métodos, en cuyo rechazo tiene un peso impor-tante el argumento de la lentitud de elaboración.

5. CONSIDERACIONES FINALES

Los avances técnicos han afectado, como señalábamos al principio, a lamisma concepción de la lexicografía histórica, a los métodos de trabajo dellexicógrafo y a la forma de poner los resultados a disposición del público.Sin embargo, con la perspectiva de unas pocas décadas desde que comenzóla revolución informática, podemos distanciamos del deslumbramiento ini-cial que nos ocasionaba la facilidad de acceso a una información tan abun-dante como inabarcable. Es indiscutible que las atractivas maneras de proce-sar las informaciones y hacerlas llegar a los usuarios mediante nuevos proce-dimientos electrónicos son un gran paso adelante que, sin embargo, no debedejar en segundo plano la inmensa labor ftlológica y humanística necesariapara llevar a cabo los diccionarios diacrónicos.

En estos tiempos, ni es factible ni sería inteligente plantear el comienzode proyectos de diccionarios de muchos decenios de duración como los quehemos mencionado. Sin embargo, un error aún mayor es abandonar proyec-

9 <http://www.frl.es/Paginas/PresentacionNDHE.aspx> [30/5/2012].10 < http://www.frl.es/Paginas/default.aspx> [30/5/2012].

208 ALEJANDROFAJARDOAGUIRRE

tos en los que se han invertido muchos años de estudio con el falso argu-mento de que se trata de cosas de otro siglo, sin haber aprovechado el pro-ducto de su trabajo. Siempre que ha habido un apoyo institucional para pro-piciar la provisión de recursos (como vimos con DRW; DEAF, etc.), se hademostrado que es posible reorientar los proyectos de larga duraciónaplicándoles nuevos métodos de trabajo que permitan llevar a término estasobras monumentales en unos plazos de tiempo razonables. También ha sidouna buena inversión el aprovechamiento y salvaguarda de los antiguos mate-riales, como se ha hecho en el caso del español con los del DHIE -aunqueno se pudo hacer lo mismo con los del DEM- digitalizándolos para poder-los reutilizar en el NDHE.

Lamentablemente, también se ha demostrado que las oportunidades detransformación no siempre se aprovechan para avanzar y el conocimientodel español medieval sufrirá un retraso inevitable de años, porque por igno-rancia o por contraposición de intereses se ha dejado de sustentar proyectoscomo el DEM) lo que es un dispendio de medios, porque no se tiene encuenta que el inmenso trabajo filológico que en él se ha realizado habrá quevolverlo a hacer de nuevo en el momento en que se quieran conocer en pro-fundidad el vocabulario de los primeros siglos de historia de una de las de-nominadas grandes lenguas de cultura. No todas las tareas son automatizables,por más que avance la técnica, y el trabajo frente a un diccionario, en cual-quier soporte, deberán seguir haciéndolo filólogos bien especializados y conun conocimiento profundo de la historia de la lengua que les permita leer,clasificar semánticamente, lematizar, describir y relacionar las viejas palabrasde una forma que no ha variado, en lo sustancial, respecto a como se hacíaantes de la revolución informática.

Referencias bibliográficas

ÁLVAREZDE MIRANDA, Pedro (2003): «Los diccionarios históricos», en Ma

Antonia Martín y José Luis Aliaga (eds.), La lexicografía hispánica ante elsigloXXI. Balancey perspectivas, Gobierno de Aragón, Zaragoza, 51-70.

ATILF: Ana!yse et traitement informatique de la langue franfaise: (ATILF / CNRS-Nancy Université) en <http://www.atilf.fr/> [30/5/2012].

BAHR, Joachim (1984): «Eine Jahrhundertleistung historischer Lexikographie:Das Deutsche Warterbuch, begründet von Jacob und Wilhelm Grimm»,en Werner Besch (ed.), Sprachgeschichte.Ein Handbuch zur Geschichte derdeutschenSprache und ihrerErforschung,Halbband, Berlin-New York, 492-501.

LA LEXICOGRAFÍA HISTÓRlCA ACTUAL 209

BARTZ, Hans-Werner et alii (2003): «Beyond the Scope of the Printed Die-tionary. Digitizing the 'Deutsche Würterbuch' by Jacob and WilhelrnGrimm», en Thomas Burch et alii (eds.), Standards und Methoden derVolltextdigitalisierung. Beitrdge des Intemationalen Kolloquiums an der Uniuersita:Trier, 8./9. Oktober 2001, Akademie der Wissenschaften und derLiteratur Mainz, Sttutgart, 291-295.

CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE (1971-1994): Trésorde la languefranfaise: dictionnaire de la langue du XIXe et du XXe siecle (1789 -1960), 16 vols., Gallimard, Paris.

DEL MANCINO, William y Jean-Marie PIERREL (2009): <<Du trésor de lalangue francaise al' ATILF et au CNRTL», La revuepour l'histoiredu CNRS [enlínea], 24 I 2009, <http://histoire-cnrs.revues.org/9133> [30/5/2012].

Deutsches Rtchtswiirterbuch (DRW) (1912- ): Heidelberger Akademie derWissenschaften Stuttgart, Verlag J. B. Metzler / Verlag HermannBóhlaus Nachfolger Weirnar. Versión electrónica en <http://dwb.uni-trier.de/start> [30/5/2012].

Deutsches Rtchtswóderbuch Online (DRWO) <http:/ / drw-www.adw.uni-heidelberg.de/drw/> [30/5/2012].

Dictionnaire étymologique de l'ancien franfais (DEAF) (1971- ): K. Baldinger, F.Móhren et alii (eds.), De Gruyter, Berlin.

Dictionnaire étymologiquede l'ancienfranfais électronique (DEAFEL) <http:/ / deaf-server.adw.uni-heidelberg.de/> [30/5/2012].

Dictionnaire onomasiologiquede l'anciengascon (1975- ): De Gruyter, Berlin.

FAJARDO AGUIRRE, Alejandro (2006): «La datación del léxico en la léxico-grafía histórica del español», en Rafael Arnold y Jutta Langenbacher-Liebgott (eds.), Cosmos léxico. Contribuciones a la lexicologíay a la lexicogrcifíahispánicas, Peter Lang, Frankfurt am Main, 51-60.

FAJARDO AGUIRRE, Alejandro y Eva GÜIDA (2007): «Las primeras docu-mentaciones del léxico español. Aportación del Diccionario del español me-dieual», en Mar Campos Souto, Rosalía Cotelo García, José Ignacio PérezPascual (coords.), Historia del léxico español, Universidade da Coruña, ACoruña, 49-58.

GARCÉS GÓMEZ, Ma del Pilar (ed.) (2008): Diccionario bistárico: nuevasperspectivas lingüísticas, Iberoamericana -V ervuert, Madrid -Frankfurt.

GRlMM, Jacob y Wilhelm GRlMM (1854-1961): Deutsches [J:7iirterbuch,16 vols.,Hirzel, Leipzig.

210 ALEJANDROFAJARDOAGUIRRE

Historical Thesaurus rif the O:>ifOrd EngliSh Dictionary (HTOED)<http://www.oup.com/online/ht/history /> [30/5/2012].

KASTEN,Lloyd A. (ed.) (1978): Concordancesand texts rif the &yal Scnptoriummantacripts rif Alfonso X, El Sabio, [Microfichas], Hispanic Seminary ofMedieval Studies, Madison.

KASTEN, Lloyd A. y Florian J. CODY (dirs.) (2001): Tentative Dictionary ofMedieval Spanish, 2" ed., Hispanic Seminary Publications, New York.

KAY, Christian y Thomas J. P. CHASE (1987): «Constructing a ThesaurusDatabase», Literary and Linguistic Computing, 2, 161-163.

KAY, Christian et alii (2009): Historical Thesaurus rif the O:>ifOrdEnglish Diction-ary, Oxford University Press, Oxford.

KASTEN, Lloyd A. y John J. Nrrrr (dirs.) (2002): Diccionario de la ProsaCastellana de A!fonso X el Sabio, 3 vols., Hispanic Seminary Publications,NewYork.

MARCOS MARÍN, Francisco (dir.) (1992): ADMITE. Archivo Digital deManuscritos y Textos Españoles, [CD-ROM, disco I y Manual], SociedadEstatal del Quinto Centenario-Micronet, Madrid.

MAYOR,Carlos (1993): «Construcción de un sistema formal de recuperaciónde lemas y formas desde CD-ROM», Incipit, XIII, 181-190.

MÜLLER, Bodo (dir.) (1987-2005): Diccionario del español medieval (DEM) ,1994: vol. I, 2000: vol. II, vol. III (fase. 26, 2005), UniversitatsverlagWinter, Heidelberg.

PELLEN, René (1997): «Le CD-ROM: un nouvel age pour la recherche?Étude d'ADMITE-l, Base de Textes Espagnols Médiévaux», Revue deLinguistique Romane, 61, 89-131.

REAL ACADEMIAESPAÑOLA (1933-1936): Diccionario bistárico de la lenguaespañola. I (A) Y II (B-Ce), Madrid.

REAL ACADEMIAESPAÑOLA (1960-1996): Diccionario bistárico de la lenguaespañola,Madrid, t. I, 1972; t. II, 1992; t. III, fase. 1, 1993; fase 2, 1996; t.IV fase. 1, 1996. Versión electrónica en <http://web.frl.es/dh.html>[30/5/2012].

SIMPSON, John y Edmund WEINER (eds.) (1989): The Oxford EnglishDictionary, 2a ed., Clarendon Press, Oxford.

TORRESMEDINA, Dolores (2012): «La producción lexicográfica del inglésantiguo: contribuciones y limitaciones para la reconstrucción del léxico»,en G. Wotjak, D. García y M: del Carmen Fumero (eds.), Estudios sobrelengua, culturay cognición,Peter Lang, Frankfurt am Main, 253-263.

LALEXICOGRAFÍAHISTÓRICAACTUAL 211

TRAUTH, Michael (2004): «Vorn rechten Gebrauche der EDY. AchtEmpfehlungen Romanistik und neue Medien», en W. Dahmen et alii(eds.), Romanistik und neue Medien: Romanistisches Kolloquium XVI, Narr,Tübingen.

Trésor de la languefranfaise informatisé <http:/ / atilf.atilf.fr/> [30/5/2012].