Joseba Andoni Lakarra


In this paper, we show the direct relation between reconstruction and etymology and between linguistic theory and philology, as well as the need to overcome atomistic approaches which are based on anecdote or which are not backed up by any theoretical model of lin- guistic change. At the same time, we also try to extend a new etymological paradigm which runs parallel to the reconstruction model developed from the analysis of the canonical form and evolution of Basque morphemes. Th is paradigm sets out to cover periods and explain aspects of the language never before dealt with or even contemplated by previous paradigms (Lakarra 1995a and later work).

After a review (§1) of different deffinitions of the notion of «etymology» and its fundamental role in reconstruction, we provide an analysis (§2) of the etymological research centered upon Latin-Romance borrowings which was carried out by the main linguists who worked up to the 1960s on the reconstruction of the prehistory of Basque and proto-Basque: Schuchardt (§2.1), Gavel (§2.2), Martinet (§2.3) and Mitxelena (§2.4); in §2.5 we deal with the situation of etymology and reconstruction in the wake of Mitxelena’s work.

In §3 we analyze two alleged alternatives (§3.1 glottochronology and §3.2 massive comparison) to the traditional comparative method and evaluate their impact (§3.3) —unconstructive, with no tangible progress— on the studies of Basque diachronic linguistics.

Sections §4 and §5 constitute the core of our proposal: after an overview of some of the implications of the fact that Mitxelena did not use the canonical form (CF) in his etymological work, we contend that future etymological work must include internal reconstruction based on the analysis of the CF, associated with the diachronic holistic typology and the philology «of precision» set out by Meillet (§4.2). In (§4.3) we review the antecedents of the theory of the Basque root (mainly Uhlenbeck 1942) and the data that required the adoption of a reconstructive and etymological model which was more constrained and explanatorily more powerful than the previous one: namely, irregularities and gaps in morphophonological paradigms which could not be accounted for by the old model (§§4.4-4.5). In §4.6 we show that the view of the alleged Basque-Caucasian kinship as rather implausible and barely productive is clearly reinforced by the use of a fundamental and lasting feature such as the canonical form of morphemes. In §§ 4.7-4.8 we examine alleged exceptions to phonetic laws or to restrictions on the co-occurrence of certain phonemes in Basque words as formulated by Mitxelena. We provide evidence that it is absolutely necessary to make the best possible use of philology in both etymological analysis and reconstruction, by availing of advances in linguistic theory and, particularly, the analysis of the CF of morphemes. In §4.9, our use of the reconstruction of lexical families and features of the old grammar such as reduplication allows us to overturn the claim that items such as adar ‘horn, antler, feeler’ are borrowings, in opposition to the atomist analysis.

Since these items fit into old reduplicative paradigms, their status as borrowings is rendered rather improbable, thus leading further into the reconstruction of proto-Basque grammar by ruling out false leads. In §4.10 we show that Vennemann and other comparativists sacrifice the principled explanation of specific terms such as handi «big» or ahuntz «goat» (both analyzable within an older morphology) and of real diachronic problems of the Basque language in favor of comparisons or alleged borrowings that neither shed light on their past nor further their reconstruction. In §4.11 we analyze zemai «threat, menace», not previously identified as a borrowing despite the / m / and the diphthong in final position; this word can be explained along with abagadaune «occasion», a borrowing (Mitxelena 1964) for which no specific origin has been provided in previous work.

We elaborate new criteria for the identification of borrowings such as the impossibility of coexistence of strictly identical allomorphs in the same dialectal areas and we point out the importance of metathesis in etymological work. The example of andere «lady, woman» (§4.12) is used to illustrate certain problems posed (and types of help off ered) by the analysis based on the CF when deciding whether a specifi c term is patrimonial or a borrowing. In § 4.13 we summarize a study on the evolution of dentals and conclude that azal ‘skin’, ahal ‘can, be able’, ohol ‘log’, ahan-tz ‘forget’, ihin-tz ‘dew’, etc., constitute cases of V1CV1C (old reduplications of roots with a dental in initial position). In §4.14 such a dental drop is shown to explain a great number of diphthongs which appear in verbal roots, a situation that leads us to reconstruct primitive roots as CVC —and old prefi xes (*da-) previously unattested in uninflected forms— in opposition to the generalized polimorphism accepted by Lafon (1943) and other authors.

In §5 we contend that among the most relevant consequences of the monosyllabic root theory and etymology based on the CF of morphemes is the possibility —a crucial one given the exiguous Basque corpus— of developing a formal etymology and elaborating a sketch of the prehistory of the Basque patrimonial lexicon. Th e criteria that may help to distinguish between old and new root types in a principled manner include:

(a) the relationship between attested as opposed to potencial roots in each model;

(b) words with and without a known etymology as opposed to the set of possible words in each root model;

(c) the presence of borrowings, compounds and derived words or phonosymbolisms present in each model;

(d) the phonotactic and geographic conditions that hold or fail to hold for each model.

In §6 we summarize the main conclusions and in §7 we review the most relevant bibliography. In §8 we include two appendixes: §8.1 is an excursus about false illusions in literary language and some of their consequences in previous etymological work and §8.2 contains several tables with analyses of some root models according to several of the criteria and issues presented in §5. In work in progress (cf. Lakarra in progress-1) we provide a list of around 450 new etymologies, the result of our etymological work based on the analysis of the canonical form of morphemes and on the monosyllabic root theory.

Tabla de contenidos


En otras lenguas se han escrito La Iliada, La Divina Comedia o El Quijote, pero la lengua vasca tiene su epopeya propia: la de su conservación desde los tiem- pos prehistóricos y la de constituir el archivo de sí misma y de la historia del pue- blo vasco. Quisiéramos que esta epopeya, implícita y misteriosa en las palabras, quedara en su día explicada y patente en las páginas de un diccionario etimológico (Tovar 1956: 96) n3

Me propongo mostrar en este trabajo con materiales vascos la directa relación existente en nuestro campo (como en los restantes) entre reconstrucción y etimología, entre teoría lingüística y filología, más la evidente necesidad de superar aproximaciones atomistas, basadas en la pura anécdota o sin apoyatura en modelo alguno de cambio lingüístico.

Igualmente, de manera consecuente con lo anterior, defendemos y tratamos de extender un nuevo paradigma etimológico paralelo al modelo de reconstrucción desarrollado a partir de Lakarra (1995a), [cf. 2007c], basado en el análisis de la forma canónica y de la evolución de los morfemas vascos («teoría de la raíz monosilábica protovasca antigua»), la cual se propone alcanzar épocas y explicar aspectos de la lengua no cubiertos ni previstos en paradigmas anteriores.

Tras un rápido repaso (§1) a distintas definiciones de «etimología» y al perenne papel básico de ésta en la reconstrucción y en la lingüística histórica en general, en §2 procedemos a un somero análisis de la labor etimológica centrada en los préstamos latino-románicos de la lengua vasca que llevaron a cabo los principales lingüistas que se ocuparon implícita o explícitamente desde fines del XIX y hasta los ’60 del XX, de la reconstrucción de la prehistoria de la lengua vasca y del protovasco: Schuchardt (§2.1), Gavel (§2.2), Martinet (§2.3) y, sobre todo, Mitxelena (§2.4); en §2.5 abordamos el estado de la etimología y de la reconstrucción después de Mitxelena: no puede decirse que ni una ni otra hayan experimentado avances relevantes.

n3 Como no voy a ocuparme aquí del desapego de Mitxelena —evidente, incluso, para quien quiera atender exclusivamente a los testimonios impresos— respecto al diccionario etimológico de Tovar y Agud, no puedo dejar de citar el comienzo de «La lengua vasca como medio de conocimiento histórico»:

Al valorar la lengua vasca se suele pecar con frecuencia, en mi opinión, tanto por defecto como por exceso. Más de uno se ha sentido inclinado a hablar despectivamente de su capacidad expresiva como lengua viva, y es muy posible que esto siga ocurriendo en lo sucesivo. Para citar un nombre ilustre, don José Ortega y Gasset no parece haber tenido mayores reparos para estampar esta rotunda sentencia: «Ser vasco es, sin más, una renuncia nativa a la expresión verbal. El misterioso pueblo vascongado posee un idioma elemental que apenas sirve para nombrar las cosas materiales, y es por completo inepto para expresar la influencia fugitiva de la vida interior». Cuando uno —dejando a un lado cualquier susceptibilidad— se pone a pensar en los fundamentos de esta condenación inapelable y cae en la cuenta de que el señor Ortega y Gasset, usando su propia expresión, apenas sabía que en vascuence bai significa «sí» y ez quiere decir «no», no se puede menos de sentir un compasivo asombro al ver la facilidad con que nos vemos arrastrados a hacer afirmaciones categóricas en terrenos que caen por completo fuera de nuestra competencia. En compensación, más de uno también ha tenido la convicción, clara o confusamente sentida, de que en el vascuence está, más o menos oculta, la clave que puede servir para resolver problemas que de otro modo difícilmente alcanzarían solución. No hablo de la aclaración por ese medio de los misterios del Apocalipsis (…) Me refiero naturalmente a las tentativas iniciadas hacia 1800 por G. de Humboldt y J. Antonio Moguel para ilustrar la prehistoria, no sólo en la Península, sino también en buena parte del Sur y Occidente de Europa (Mitxelena 1956: 49-50).


En §3 analizamos dos supuestas alternativas (§3.1 glotocronología y §3.2 comparación masiva) al método comparado tradicional y su repercusión (§3.3) —profundamente negativa y sin avance positivo tangible— en los estudios de lingüística diacrónica vasca.

§4 y §5 constituyen el núcleo de nuestra propuesta: tras recordar (§4.1) algunas de las implicaciones de la no utilización explícita de la forma canónica por Mitxelena en su labor etimológica, defendemos la necesidad de combinar en la abundante tarea etimológica pendiente una reconstrucción interna basada en el análisis de la forma canónica, asociada a la tipología holística diacrónica y a la filología «de precisión» que reclamaba Meillet (§4.2). Pasamos revista (§4.3) a los antecedentes de la teoría de la raíz vasca (fundamentalmente Uhlenbeck 1942) y a los datos que ya antes reclamaban la adopción de un modelo reconstructivo y etimológico más estricto y de mayor poder explicativo que el estándar, dadas las irregularidades y huecos existentes en paradigmas morfo-fonológicos de los que aquel no daba cuenta (§§4.4-4.5).

En §4.6 mostramos que si el supuesto parentesco vasco-caucásico era tiempo ha poco verosímil y escasamente productivo para aclarar la evolución de ninguna de las dos partes de la comparación (cf. ya Mitxelena 1964), la utilización en la comparación de un rasgo tan importante y duradero como la forma canónica de los morfemas refuerza claramente ese diagnóstico pues resultan antitéticas las de ambas familias (cf. Lakarra 1998b y Gorrochategui & Lakarra 2001). En §§ 4.7-4.8 —examinando supuestas excepciones a leyes fonéticas o a restricciones de coaparición de fonemas en las voces vascas formuladas por Mitxelena (1961-1977)— damos pruebas de que es imprescindible la utilización de la mejor filología posible en el análisis etimológico y en la reconstrucción, evitando malas lecturas, anacronismos, cacografías, falsas traducciones, etc., ayudándonos de los avances de la teoría lingüística y, en particular, del análisis de la forma canónica de los morfemas.

En §4.9 vemos que, frente al análisis atomista, con la ayuda de la reconstrucción de familias léxicas y de rasgos de la antigua gramática como la reduplicación, supuestos préstamos como adar ‘cuerno’ dejan de serlo —no sólo por determinados problemas ya señalados para la parte celta de la ecuación, cf. de Bernardo (2006)—, y que, además, la aparición de antiguos paradigmas que los engloban (cf. eder ‘her- moso’, adats ‘melena’, odol ‘sangre’, etc.) hace radicalmente inverosímil una propuesta de tal tipo, exigiendo, por el contrario, profundizar en la reconstrucción de la gramática protovasca desechando falsos espejismos. De manera similar, en §4.10 (cf. antes Lakarra 1996a) hacemos ver que Vennemann y otros comparatistas sacrifican la explicación principiada de determinados términos como handi ‘grande o ahuntz ‘cabra’ —como, en general, de cualquier problema diacrónico real de la lengua vasca—, analizables dentro de una morfología más antigua, en aras de comparacio- nes o supuestos préstamos a otras lenguas que nada ayudan a esclarecer el pasado de ninguna de ellas (no al menos de la vasca) ni a avanzar en la reconstrucción de las mismas. En §4.11 analizamos zemai ‘amenaza’, préstamo anteriormente no detectado o señalado como tal a pesar de su /m/ y, en parte, de su diptongo final; esta voz puede recibir una explicación conjunta con abagadaune ‘ocasión’, término ya señalado como préstamo por Mitxelena (1964) pero al cual no se le había dado todavía un origen concreto.


Tal intento de análisis sirve para elaborar ciertos nuevos criterios de detección de préstamos como la imposibilidad de la convivencia de alomorfos estrictamente equivalentes en las mismas zonas dialectales o para señalar la importancia (y complejidad) de la metátesis en la labor etimológica.

En (§4.12) andere ‘señora’ es utilizado —sin que se dé ninguna solución definitiva a su caso— para mostrar ciertos problemas (y ayudas) planteados por el análisis basado en la forma canónica a la hora de decidir si un determinado término es patrimonial o préstamo.

En § 4.13 hemos resumido un estudio (cf. Lakarra 2006b, 2006c) sobre la evolución de las dentales, concluyendo que azal ‘pellejo’, ahal ‘poder, ohol ‘madero’, ahan-tz ‘olvidar’, ihin-tz ‘rocío’, etc., constituyen casos de V1CV1C (con antiguas reduplicaciones de raíces con dental inicial) y en §4.14 que tal caída de dentales explica numerosos diptongos presentes en las raíces verbales, lo cual nos lleva a reconstruir primitivas raíces en CVC —y antiguos prefijos (*da-) hasta ahora desconocidos en las formas no conjugadas (cf. Trask 1977)—, frente al polimorfismo casi ad libitum aceptado por Lafon (1943) y la morfología diacrónica anterior y posterior.

En §5 defendemos que entre las consecuencias más relevantes de la teoría de la raíz monosilábica y de la etimología basada en la forma canónica de los morfemas se halla la posibilidad —crucial dado el exiguo y no siempre exhaustivamente conocido corpus vasco (cf. Gorrochategui & Lakarra 2001 sobre algunos aspectos de Trask 1997)— de poder desarrollar una etimología formal y elaborar un esbozo de prehistoria del léxico patrimonial vasco, tareas a las que hemos dedicado algún trabajo todavía inédito. Además de los imprescindibles filtros fonotáctico y geográfico aplicado a cada item, entre los criterios formales de aplicación general que pueden ayudarnos a discernir de manera principiada entre tipos radicales antiguos y modernos pueden citarse —además de otros que puedan elaborarse en el futuro— los siguientes: (a) la relación entre raíces atestiguadas frente a las potenciales de cada modelo; (b) las voces con y sin etimología conocida frente al conjunto de las posibles en cada modelo ra- dical; (c) la presencia de préstamos, compuestos y derivados o fonosimbolismos, pre- sentes en cada uno de ellos; (d) las condiciones fonotácticas y geográficas cumplidas o las carencias de las que adolece al respecto cada modelo. En §6 resumimos las principales conclusiones y en §7 damos la bibliografía utilizada más relevante.

En §8 se incluyen dos apéndices: en §8.1 un excursus sobre espejismos de la lengua literaria y algunas de sus consecuencias en la labor etimológica anterior; en §8.2 damos varias tablas con análisis de algunos modelos radicales (cf. Lakarra 2002a y 2004a) en función de varios de los criterios y aspectos expues- tos en §5. No hemos incluido uno más con los morfemas y etimologías discuti- dos en el presente trabajo pues lo han sido a guisa de meros ejemplos, de manera que es en otros lugares —normalmente en trabajos anteriores, señalados en cada caso—, donde han recibido un tratamiento más pormenorizado; con todo, espero que próximamente (cf. Lakarra en prep.-1, en prep.-5 o en prep.-8) el lector pueda hallar esos detalles junto a bastantes otras novedades de nuestra labor etimológica (más de 450 nuevas etimologías) fruto de nuestra labor etimológica basada en el análisis de la forma canónica de los morfemas y en la teoría de la raíz monosilábica (v. Lakarra 1995a y ss.).



A estas alturas de la bibliografía (cf., simplemente, el último capítulo de Trask 1997) no parece excesivamente osado constatar que la comparación tradicional (la dirigida a probar parentescos entre lenguas) y estándar (es decir, realizada con los mismos criterios y fundamentos utilizados en otras familias de lenguas, particularmente en las mejor establecidas) no ha aportado nada relevante al conocimiento de épocas anteriores a las documentadas en vascuence ni tampoco, a fortiori, al conocimiento del protovasco.

Esto equivale, sencillamente, a decir que la comparación no ha cumplido en el campo vasco con su cometido fundamental, el mismo o similar al que tiene entre lingüistas profesionales en la familia indoeuropea, en la semítica, en la urálica, en la austronesia o en la algonquina.

Es más, podría argüirse que en más de una ocasión —y en este trabajo o en Lakarra (1997b) podrá encontrarse alguna muestra de ello— la comparación a ultranza ha llevado a determinados «tratadistas» a falsificar la realidad y, en todo caso, a postergar y dificultar el análisis de problemas reales y relevantes de la diacronía del vascuence que podían y debían ser encarados desde la propia lengua.

Muy otra es la situación de la reconstrucción interna, de la que es ejemplo en todos los sentidos la obra de Mitxelena: guiada en todo momento por el conocimiento de los datos reales y de la filología pertinente, y por la mejor teoría lingüística a disposición del investigador en cada momento, ha permitido conocer aspectos del pasado de la lengua y de su evolución que de otra manera no hubieran podido alcanzarse.

Es poco probable que la proporción entre los magros e inciertos resultados de la reconstrucción comparada y los espléndidos y esperanzadores de la interna cambie radicalmente en el futuro; más bien hay fundadas razones para sostener que las diferencias entre ambas —abrumadoras a favor de la segunda— pueden acentuarse más y más en medida proporcional a la labor de sus respectivos cultivadores (véase Gorrochategui & Lakarra 1996, 2001).

Si Devoto (apud Watkins 1990) recogía el sentir de muchos hace ya varias décadas, dando por muerta o agotada la etimología indoeuropea, ¡qué decir de la etimolo gía vasca posterior a Fonética histórica vasca!

A uno se le antoja que al modelo presentado en ese libro capital de la vascología se le ha otorgado un carácter de completitud o de eternidad que, desde luego, su autor no se arrogó ni buscó para sí ni para su obra, sin que los pocos vascólogos aún interesados por estos temas sean capaces de producir nuevos resultados que, en uno u otro momento, puedan llevar a plantear modelos superiores.

Como Mary Haas (1969) y muchos otros han mostrado (véase p.e. el artículo programático de Pulleyblank 1992 y varios de Sagart sobre el caso del chino), el estudio de los préstamos antiguos es, —junto al hallazgo de nuevos parientes o el hallazgo de nuevos datos y/o la reinterpretación de los anteriores—, una de las razones por las cuales ha de ser revisada y alterada, en su caso, la reconstrucción de una protolengua.

Antoine Meillet (1925) sentenció que una lengua sin parientes, citando expresamente el caso del vascuence, era una lengua sin historia, vale decir con más precisión (cf. Mitxelena 1963), sin prehistoria. A pesar del tiempo transcurrido y de los múltiples ensayos comparativos realizados desde entonces, han sido nulas las pruebas fehacientes obtenidas acerca de las relaciones genéticas de la lengua vasca (cf. Trask 1997) y, a grandes rasgos, es válida aún hoy día la opinión de Meillet, sin que ello signifique, naturalmente, que no estemos legitimados a intentar avanzar algo más en el co- nocimiento de la prehistoria de la lengua.


Es evidente que este avance, ante la falta de socorro externo, solamente puede provenir de datos internos de la propia lengua y del empleo de argumentos adecuados, como son los de la reconstrucción interna y los que nos ofrecen los paralelismos históricos y tipológicos (v. Lakarra 2006a).

Como es sabido, la sucesión histórica entre los datos más antiguos y los primeros textos vascos de una mínima extensión, ya en los siglos XV y XVI, presenta un amplio vacío de información superior al milenio.

La propia naturaleza lingüística de los restos antiguos permite su identificación con la lengua vasca histórica, a lo que ayuda en ciertos casos afortunados la existencia de onomástica medieval, atestiguada a partir de los siglos X y XI, la cual hace la función de eslabón en la cadena que une ambos extremos cronológicos, como ya percibiera y mostrara Luchaire en el último tercio del siglo XIX e ilustrara documentalmente Caro Baroja antes de mediar el XX: es el caso de la utilización como nombres personales de Andere, Oxso, Nescato o Enne- tanto en la Aquitania romana como en la Navarra medieval y su uso como morfemas del léxico no-onomástico aún en la actualidad (cf. Gorrochategui 1984 y Gorrochategui-Lakarra 1996).

De todos modos, el hiato temporal es muy amplio —mayor que el existente entre el celta antiguo y las lenguas célticas medievales— aunque no impida la evidencia de tal relación genética, al contrario de lo que ocurre entre ibérico y vasco antiguo.

Hay que pensar que durante ese periodo la lengua pudo sufrir cambios y alteraciones profundos de todo orden, como los ocurridos entre 1571 (traducciones bíblicas de Leizarraga) y 1643 (Gero de Axular) o entre el breve catecismo de Betolaza (1596) y los Refranes y Sentencias, publicados ese mismo año a partir de una variedad geográficamente cercana pero claramente más arcaizante (cf. Lakarra 2002d): desde las puramente geográficas, que son las más fácilmente reconocibles, hasta las internas que afectaron a su estructura gramatical y a su léxico, pasando por las de índole sociolingüística.

Si conociéramos algo realmente significativo del vasco antiguo que fuera mucho más sustancioso de lo que podemos inferir a partir de los restos onomásticos, estaríamos en mejores condiciones de describir los cambios producidos a lo largo de ese largo vacío documental. Pero dada la escasez de nuestra información antigua, solamente podemos postular un puñado de cambios, que en su generalidad afectan al ámbito fonológico de la lengua (cf. Gorrochategui-Lakarra 1996 y Lakarra 1997a-b). n4

n4 Cf. «Podemos ahora plantearnos una pregunta: la lingüística vasca, o como también se suele de cir, la vascología, ¿ha avanzado lo suficiente en el conocimiento y elaboración de los materiales que tiene a su disposición? (…) Si lo que queremos es una historia de la lengua como fue, y es la única que puede servir a fines científicos, y no una historia de la lengua tal como quisiéramos que hubiese sido, no hay testimonio por breve, fragmentario, bárbaro y falto de interés que nos parezca que no deba ser publicado y estudiado inmediatamente, con tal de que los demás testimonios de igual fecha y variedad sean sufi cientemente escasos. De esto se sigue que nuestras ideas acerca del pasado de la lengua, fundadas generalmente en hechos presentes que inconscientemente propendemos a trasladar a otras épocas, sean tan frecuentemente equivocadas» (Mitxelena 1956: 60-61).

Se me ocurre que los supuestos «descubrimientos» de Iruña-Veleia pueden servir, ya que no para am pliar nuestros conocimientos sobre el vasc. antiguo, sí al menos para comprobar la calidad de los están dares en la historia de la lengua (más la fidelidad a los mismos de tirios y troyanos).



Etimologia ha tenido, desde luego, significados y funciones muy diferentes desde el inicial de «sentido verdadero»:


n32 Dada la falta tanto de (/ t- / como de / d- / la caída de las dentales le parece anterior al contacto con el latín; cita, con todo, casos de t-, d- > l- / ø- como teca > leka, *do.i > lohi y otros como *e-dun, *e-thorri que mostrarían que anteriormente las dentales se dieron también en esa posición (cf. Mitxelena 1951: 209). En Lakarra (1995) y trabajos posteriores —véase aquí más abajo § 4.13— he añadido a la lista de d- > ø- otros casos como adar ‘cuerno’, odol ‘sangre’, eder ‘hermoso’, etc; para estos y para *d > l- veánse Lakarra (2006b), (2006c) y (2007a).


n34 Realmente el vocalismo le merece aquí —y cf. el resumen de su FHV (pp. 371-372)— escasa atención dado que, prácticamente sin salvedades, los morfemas aquitanos o éuscaros antiguos (Nescato, Cison, Sembe, Ummesahar…) no parecen haber sufrido cambios relevantes antes de las caídas y neutralizaciones medievales en final de primer elemento: idi ‘buey’ + aurre ‘delante’ > it-aurre ‘arando’, baso ‘bosque’ + uri ‘villa’ > Basauri ‘(topon.), villa del bosque’ o luze ‘largo’ + -tu ‘participio’ > luzatu ‘alargar’. En otras palabras, la información transmitida no permitiría (pero cf. Lakarra 2005a y 2006a) llevar la reconstrucción del sistema vocálico protovasco a otro muy diferente al históricamente documentado en la mayor parte de las hablas modernas. El vasco antiguo poseería, pues, un sistema vocálico de cinco vocales orales (las vocales nasales de algunos dialectos son el resultado histórico de la desaparición de nasales intervocálicas) con tres grados de abertura, sin rastro alguno de oposición de cantidad. Las semiconsonantes históricas, tanto / j / como / w /, son fácilmente explicables como derivaciones contextuales de anteriores vocales /i, e/ u /o, u/, respectivamente.

Una de las primeras decisiones de Mitxelena a la hora de elaborar el inventario de fonemas protovascos será excluir del mismo el subsistema de sonidos palatales, debido a su carácter secundario o subordinado a otros fonemas consonánticos; n35 posteriormente seguirá el mismo camino la [ m ] por su nulo papel morfológico (cf. Trask 1996 y 1997), su extensión a partir de los préstamos, el hecho de que sea alófono de / n / en los morfemas autóctonos o que principalmente se explique por asimilación de / b / anterior. Las oclusivas, n36 cuatro sibilantes, las sonantes y la / h / son, por tanto, las consonantes postuladas para el inventario del sistema principal, i.e., el resultante de la exclusión de las palatales, por un lado, y de otros sonidos tardíamente fonematizados.

n35 Como Mitxelena hace notar, «secundario» o «subordinado» no significa necesariamente «tardío» ya que el subsistema de las palatales tiene con seguridad un milenio y probablemente bastante más. Es claro que su rendimiento funcional era tanto más relevante cuanto menor era el número de resultados palatales automáticamente desarrollados (o heredados en préstamos) en el léxico existente en cada mo- mento. No parece casual que sea mínimo o inexistente desde hace ya varios siglos en vizcaíno, dialecto en el que la palatalización automática (no «semántica» para utilizar términos de Azkue) ha adquirido, por el contrario, mayores proporciones (cf. Oñederra 1991). 36 Mitxelena cree que las labiales son defectivas, faltando la / p / como fonema: supuestos pares mí- nimos como ibar ‘valle’ e ipar ‘norte’ son casi inexistentes y poco seguros puesto que, como en el pre- sente caso, se trata de antiguos compuestos vueltos inanalizables (Mitxelena 1951a); sobre [ f ] véase en el texto más abajo. Es explícita su voluntad de incluir / h / en el sistema antiguo.

n36 Mitxelena cree que las labiales son defectivas, faltando la / p / como fonema: supuestos pares mínimos como ibar ‘valle’ e ipar ‘norte’ son casi inexistentes y poco seguros puesto que, como en el presente caso, se trata de antiguos compuestos vueltos inanalizables (Mitxelena 1951a); sobre [ f ] véase en el texto más abajo. Es explícita su voluntad de incluir / h / en el sistema antiguo.


En un trabajo ya mencionado (Mitxelena 1951b), el autor consolida el sistema de las oclusivas presentado por Martinet —que encuentra básicamente correcto— antes de pasar a examinar los restantes subsistemas. Son principalmente tres tipos de con- sideraciones las que Mitxelena añade a las argumentaciones de Martinet en favor del carácter [fortis / lenis] de la oposición principal en las oclusivas antiguas:

a) el comportamiento de las geminadas en los préstamos latinos siempre sordas simples en vascuence frente al conservadurismo romance, n37

b) el de [ f ], alófono y variante tanto de sorda como de sonora, contra lo que ocurre en sistemas claramente estructurados sobre la oposición [sorda / sonora] y

c) las grafías geminadas < tt > y < cc > de aquitano e ibérico.

Mitxelena hace notar que la oposición fortes / lenes era fácilmente extensible a las sibilantes: ciertamente ambos subsistemas coinciden en sus puntos de neutralización (inicial y final de palabra, e incluso tras sonante y ante consonante) y es lícito suponer que en ambos casos estemos ante la misma oposición y no se trate de dos distintas e inconexas que, casualmente, se mantengan casi exclusivamente en posición intervocálica, neutralizándose en todas las restantes.

Había, por tanto, dos órdenes de sibilantes según su punto de articulación, con sendos modos de articulación: dos sibilantes dentales (una fricativa y otra africada) y dos dorso-alveolares de igual naturaleza.

Tampoco en las vibrantes encuentra excesivos obstáculos —los testimonios gráficos y otros son bastante claros—, si bien aquí ni [ r ] ni [ R ] pueden aparecer en inicial en vocablos patrimoniales y ni siquiera en préstamos hasta épocas recientes.

Es en el resto de las sonantes donde las dificultades o las novedades son mayores. Con todo, a diferencia de lo que pensaba Gavel, el testimonio de los préstamos muestra claramente que en vascuence se ha dado -n- > ( -h- >) -ø- (area, ohore, freu) pero con conservación de -n- en ciertos morfemas, precisamente aquellos que mostraban nasal geminada —no simple— en latín (Kapanaga). n38

Habiendo como hay ambos resultados en el léxico patrimonial (ardâo, ard(a)o ‘vino’, gaztâe, gazta/gazna ‘queso’ cf. ardan-, gaztan-, pero anaia ‘hermano’, Eneko, antropónimo) unos con alternancia -n- / -ø- y otros sin ella, parece lógico concluir que el vascuence anterior al contacto latino-románico y aún después por bastantes siglos tuvo dos tipos de n (fuerte y lene).

También en las laterales cabía distinguir dos tipos de resultados en los préstamos puesto que aingeru, goru, gura, etc., por un lado, y angelu, gaztelu, balea, etc., por otro, nos muestran de manera bastante sistemática dos cambios bien diferentes: -l- > -r- en simples latinas pero -ll- > -l- en las geminadas (justo al contrario que en gascón); n39 dado que también en hiri, Araba ~ ilun, alaba encontramos ejemplos de ambos procesos, parece insoslayable aceptar dos unidades (fortis y lenis) y no una sola para la protolengua.

n37 Resultan igualmente útiles para el caso los grupos / -bd- / o / -db- / (gutizia < cobdiçia, apal < ad valle(m)); hay, incluso, ejemplos en préstamos tomados del árabe (atorra ‘camisa’). El haber descuidado entre otros este argumento explica que Trask propusiera en (1985) entender el sistema mitxeleniano como [simple] / [geminada]; en (1997), sin embargo, vuelve a la postura clásica.

n38 anoa < annona puede ser uno de los pocos casos con valores nemotécnicos al juntarse en el mismo morfema ambos fenómenos.

n39 Véase, ahora, Chambon & Greub (2002), sobre la definición y fecha del protogascón.


He aquí el conjunto del inventario para el sistema consonántico protovasco establecido por Mitxelena:

  • fortes (P) T C Ć K N L R n40
  • lenes p t s ś k n l r (más h) n41

Son también conocidas algunas coincidencias tipológicas entre este modelo propuesto para el vasco antiguo y el ibérico, que Mitxelena subrayó y explicó, a falta de pruebas más concluyentes, como debidas a fenómenos areales: carencia de / p / y / m /, ausencia de r- inicial, existencia de dos clases de sibilantes, que presentaban indicios de neutralización en contextos similares a los del vasco, etc. (v. Mitxelena 1979, Gorrochategui 1993 y últimamente de Hoz 2001). n42

En cuanto a la forma canónica de los morfemas léxicos, postuló con claridad una estructura bisílaba para las bases ibéricas, dejando vislumbrar algo parecido para el vasco antiguo, sobre todo en consideración a la documentación aquitana. Por lo que toca a la estructura silábica —(C) V (W) (R) (S) (T)— parecía convenir en su opinión a una y a otra. Mitxelena (1977: 485) precisa que (C) no podía ser cualquier consonante, sobre todo en posición inicial. Así, por ejemplo, estaba vedada esta posición —como se ha indicado— para r, R, las africadas ts, tz, y las oclusivas sordas en general, pero también para d, con la única excepción —en formas patrimoniales o no hipocorísticas— de las formas finitas del verbo (cf. de Rijk 1992 y Lakarra 2006b, 2006c).

n40 A pesar de que Mitxelena escriba (p), t, tz, ts, k, N, L, R / b, d, z, s, g, n, l, r, prefiero transcribirlos de esta manera para hacer más explícita la oposición fundamental.

n41 En § 2.3 hemos hecho notar que no acepta, en cambio, los fonemas complejos / mb / y / nd / postulados por Martinet, pues no ve ni rastro de ellos en la documentación o en los testimonios modernos, ni necesidad de postularlos para la protolengua (vide también la nota 160). Por otro lado, Trask (1997) se aleja radicalmente del modelo mitxeleniano al pretender que la aspiración habría sido una mera cuestión suprasegmental determinada por el acento: éste explicaba para Mitxelena sólo la posterior desaparición de las / hh / a su derecha, no la creación inicial de tal fonema.

2.5. Etimología y reconstrucción después de Mitxelena


Es posible que tuviéramos que llevar a 1950 una fecha paralela en los estudios vascos a la que Watkins (1991) estableciera hacia 1850 para la madurez de la misma en los indoeuropeos. De tal año es el «De etimología vasca» de Koldo Mitxelena, uno de los primeros trabajos del autor, hecho destacable por cuanto que constituye un hito relevante en la metodología, no sólo de la comparación vasco-caucásica, sino de la lingüística diacrónica vasca en general. Sólo después n43 aparecen sus diversos artículos sobre varios aspectos de la fonética histórica vasca (distribución de la aspiración, acento antiguo, etc.) que se coronan al final de la década con «Las antiguas consonantes vascas» y, sobre todo, la fundamental Fonética histórica vasca presentada como tesis doctoral en 1959.

n43 Es de suponer, además, que —habiendo aparecido en uno de los tres volúmenes del homenaje a J. de Urquijo— su publicación se dilatará más que en el caso de Mitxelena (1951a) y (1951b), aparecidos por ver primera en el BAP, de cuya redacción formaba parte él mismo.


2.5.2 Trask (1985)-Hualde (1997)

Apenas han existido propuestas alternativas a la basada en la oposición fortis/lenis de Martinet-Mitxelena y únicamente cabe destacar entre ellas las de Trask (1985) y Hualde (1997).

En ambas —diferentes en los detalles entre sí— los autores no se ven obligados a alterar el sistema mitxeleniano por creencias previas sobre la posibilidad de comparar el euskera o emparentar con otras lenguas (como, p.ej., las kartvélicas o, más modernamente, las na-dene); son razones de índole interna a la lengua vasca y a las diversas teorías fonológicas que adoptan las que les mueven a ello.

Trask discute la naturaleza de la oposición fortis/lenis en las antiguas oclusivas vascas —al igual que luego Hualde, se limita a ellas— dado que en las que considera «verdaderas lenguas lenis/fortis» como las zapotecas, no se dan sólo en medial ni ocurren una serie de neutralizaciones de ese rasgo, como parece que sucede en protovasco:


  • errege ‘rey’ + bide ‘camino’ > erret-bide > errepide ‘camino real’,
  • begi ‘ojo’ + gain ‘sobre’ > bekain ‘ceja’,
  • bat ‘uno’ + bat +-ean > ‘de pronto’ (Trask 1985: 887)

Sin embargo, hay un error fundamental en la argumentación de Trask, puesto que atribuye al protovasco fenómenos que, en el mejor de los casos, son vasco común, pero que no parecen corresponder al anterior estado de lengua: así, es difícil que pudieran ocurrir las neutralizaciones citadas en oclusivas finales de morfema si, como es muy probable, aún ¡y por muchos siglos! n44 no existían dichos fonemas en tal posición.

Tampoco es factible que la negación ez —< *eze como se señala en FHV— ensordeciera (fortición) oclusivas sonoras (lenes) siguientes, (ez ‘no’ + dator ‘viene’ > ez- tator ‘no viene’) o que la ilativa bait hiciera lo propio con las formas verbales gara o dira (bait + gara > baikara, bait + dira > baitira) dado que esos morfemas no terminaban en consonante en protovasco.

Es claro, por tanto, que se intenta dilucidar las características de un sistema más antiguo a partir del estudio parcial de otro posterior (quizás muy posterior) centrando tal crítica, precisamente, en innovaciones y no en arcaísmos del más reciente. Por lo demás, la propuesta alternativa concreta de Trask (que el propio autor retira explícitamente en su The History of Basque de 1997) n44b ya había sido discutida y dese- chada implícita y explícitamente por Mitxelena y no puede considerarse un avance: en concreto ¿cómo explicar que en latino-romance (con oposición simple/geminada) las sordas iniciales se mantuvieran y, en cambio, se sonorizaran en vascuence (pace(m) > paz / bake, pice(m) > la pez / bike)? ¿Cómo explicar, además, que en medial en romance occidental se sonorizaran y en vascuence se mantuvieran (-atu > -ado / -atu) y, sobre todo, que las geminadas mantuvieran la voz pero no la duración, justo al contrario de lo ocurrido en vascuence, donde tanto las geminadas sonoras como las sordas devienen sordas simples (fortes): sabbatu > sábado / zapatu, cobdicia > codicia / gutizia?

n44 ¿Cerca de una decena? I.e., los que van del siglo II a. de C. al VIII o IX en el que pudieran ocurrir los conocidos fenómenos de caidas y neutralizaciones de vocales en final de 1.º elemento; nada si- milar está documentado todavía en aquitano (cf. Mitxelena 1954a y Gorrochategui 1984). Sobre el vasco común, demasiadas veces confundido con el protovasco, sigue siendo imprescindible Mitxelena (1981).

n44b Esto por lo que toca a las oclusivas pero no en lo referido a la relación del acento y la aspiración: mientras que para Mitxelena el acento limita y determina donde NO se da la aspiración, para Trask una de las funciones del acento es precisamente la generación de aspiradas; véase también la n. 27.

La alternativa de Hualde (1997a) pretende basarse en una mayor simplicidad, esto es, la oposición sorda/sonora le parece al autor la más verosímil para el protovasco teniendo en cuenta que es ésa la que hallamos en las variedades históricas de la lengua.


6. Ondorioak eta laburpena. Mitxelenaren leherkari sistemaren berreraiketa oso jarrera estrukturalista batean oinarritzen da. Mitxelenak asumitzen du bi soinuren arteko bereizkuntza fonologiko bat markatzeko ezaugarri jakin bat erabiliko dela beti testuingu guztietan. Gaurko euskaraz bi leherkari talde ditugu eta bereizkuntza markatzen duen ezaugarria ‘ahotsa’ izango litzateke. Hau da, ahostun/ahoskabe oposaketa dugu leherkarien sisteman. Aitzineuskaran, aldiz, lenis/fortis edo ahul/bortitz oposaketa izango genuke, ezaugarri bereizgarria ahoskeraren indarra edo tentsioa delarik. Sistema batetik bes- tera nola iragan zen azaldu gabe gelditzen da.

Mitxelenak bere lan bikaina idatzi zuen urtetik hona p/b, t/d, k/g bezalako ‘ahostun’/’ahoskabe’ bereizkuntzaz ikerketa fonetiko garrantzitsua egin da hizkuntza askotan (eta bereziki ingelesez). Ikerketa lan honetatik ondoriozta dezakegu aipatutako jarrera estrukuralista ez dela errealista. Bi fonema desberdin ezaugarri fonetiko bat baino gehiagoren bidez bereiz daitezke eta ingurune desberdinetan ezaugarri desberdinek garrantzia desberdina izando dute. Ingurune jakin batean pisu handia duen ezaugarri bat agian ez da erabiliko beste ingurune batean. Batzuetan ezaugarri bakar bat identifikatzea ezinezkoa dateke. Hau da ‘ahostun/ahoskabe’ oposaketarekin gertatzen dena hizkuntza askotan. Alde honetatik, euskara ez litzateke bereziki bitxia izango, ez gaurko euskara eta ez erromatarren garaikoa ere.

Erakutsi bezala, datuak azaltzeko ez dugu aldaketarik postulatu behar ahozkeraren mailan edo ‘sistema’ mailan. Hipotesizatu aldaketa bakarra hauxe da: euskaraz kontsonante-atzetik gertatzen diren asimilazioen ondorioz, hitz hasieragunean k-/g- kontrastea galtzeko zorian zegoen garai batean. Geroago, alboko hizkuntzen eraginez, kontrastea indartu da berriro. Hau da dena (Hualde 1997: 423).

Sin embargo, ya en la propuesta de Martinet (y en sus cuadros-resúmenes), que subyace a la de Mitxelena, es claro que cualquier oposición fonológica, p.ej., la fortis/lenis, puede (y acostumbra a) realizarse de maneras diferentes y a través de alófonos distintos en las diversas posiciones y no vemos que Mitxelena contradijera esto en ningún momento.

Por otro lado, no recordamos que Hualde dé un solo ejemplo de antigua oposición sorda/sonora en morfemas patrimoniales “restituida” por la acción de las lenguas vecinas; sería interesante saber, en este contexto, cuándo y cómo se dio esa benéfica tendencia, dado que es opinión común que durante algún tiempo —más bien— los préstamos no consolidaron, ni mucho menos esa distinción (ni ninguna otra), sino que reforzaron con carácter cuasi-exclusivo las filas de los fonemas lenes (i.e. las posteriores sonoras) y no porque en origen no abundaran las sordas (pace, peccatu, pice, cela, etc).

No habría que olvidar, tampoco, raíces como e-thorr-i ‘venir’, e-kharr-i ‘traer’ o e-khus-i ‘ver’ (sin **e-h- pero también sin **e-k- o **e-t-), donde se han conservado las antiguas oclusivas aspiradas iniciales gracias a la presencia del prefijo verbal que les evitaba que- dar expuestos a la conversión en espirantes y en h- (en múltiples ocasiones en ø-) como parece haber ocurrido con las ‘fortes’ de Mitxelena y Martinet (cf. Trask 1997). n45


Pero no quisiera extenderme ahora en estas cuestiones, por lo que fi nalizo y resumo; la propuesta de Hualde comparte con la de Trask (1985) dos características que no parecen hablar en su favor como posible alternativa al modelo mitxeleniano: 1) se limitan únicamente a las oclusivas, frente a la explicación (y los paralelismos sobre neutralizaciones) de Mitxelena que se extendía a todas las consonantes, y 2) (circunstancia crucial desde nuestro punto de vista), no proporcionan, ni ve- mos cómo podrían hacerlo, una sola etimología desconocida anteriormente, por lo que —a lo sumo— pueden aspirar a ser variantes notacionales del sistema estándar.

