Vous êtes sur la page 1sur 22

Cómo crear un lenguaje

por Pablo David Flores


basado parcialmente en el Language Construction Kit de Mark Rosenfelder

[Pueden bajarse todas las páginas de Cómo crear un lenguaje en un archivo .zip para leerlas offline, sin incluir gráficos ni sonidos. También existe una versión 


consolidada que se puede leer online y es un poco más apta para imprimirse, aunque no lo garantizo.]

Estas páginas están orientadas a gente interesada en crear lenguajes para propósitos de ficción (o sólo por diversión) y en la lingüística en general. No pretenden ser un 
curso de lingüística en línea, pero seguramente podés aprender algunas cuantas cosas de lingüística leyéndolas, de la misma forma que yo, no siendo un lingüista, 
aprendí de otros. Tampoco se supone que sean una guía para crear lenguajes auxiliares o internacionales como el Esperanto.

Estas páginas se dividen en dos campos principales: sonidos (fonología) y estructura (gramática). Cubrirán ambos campos, en ese orden, y muchos otros que están de 
alguna forma en medio. También se explicarán los términos técnicos lingüísticos que se usen.

Antes de empezar, me gustaría darle el crédito merecido a Mark Rosenfelder, quien me dio mi primera herramienta para ponerme a desarrollar lenguajes seriamente. 
La estructura y los puntos principales de estas páginas están basados en su trabajo, aunque he tratado de no copiar todo (lo cual hubiera sido bastante tonto de mi 
parte), sino, en cambio, dar algún consejo y entrar en mayor profundidad en detalles que él no menciona en su Language Construction Kit. Algo de material,
especialmente en la sección de Cambio de Sonidos, también se ha sacado de la newsletter Model Languages, de Jeffrey Henning. Colegas creadores de lenguajes y
amables lectores sugirieron muchas correcciones y añadiduras a la versión original de este documento. Algunas explicaciones han sido adaptadas de mensajes a la lista 
CONLANG. ¡Gracias a todos!

He mencionado y/o usado ejemplos de una buena docena de lenguajes, tanto naturales como ficcionales, estos últimos creados por mí y por otros. He intentado ser 
tan exacto como fuera posible; todo depende de mis fuentes, algunas de las cuales son libros que alguna vez tomé de una biblioteca y que ya he devuelto, por lo cual 
debo citar de memoria. Esto debería explicar la naturaleza dubitativa de alguna que otra afirmación. No obstante, tengo buena memoria y creo que cada cosa que he 
escrito es correcta hasta donde sé. No he incluido conjeturas que no estén explicitadas como tales.

Si alguien encuentra un error, o algo que parezca ser un error, o desea hacer una sugerencia, o quiere que se discuta un tema en particular (o enseñarme sobre él), por 
favor escríbame. Adiciones y correcciones son bienvenidas.

Estas páginas no requieren para su visualización de ningún aditamento avanzado (Flash, Shockwave, ni siquiera Java). Se recomienda un navegador con capacidad 
para entender la especificación de hojas de estilo en cascada (Cascaded Style Sheets - CSS); en general todos los navegadores modernos (incluso los más 
defectuosos, como el ubicuo Microsoft Internet Explorer) soportan esta especificación hasta donde se requiere. Los navegadores más antiguos mostrarán estas 
páginas con otro formato, pero el contenido se preservará.

Aunque no se requiere, estas páginas son compatibles con Opera, que con su soporte de ciertas innovaciones estándar permite una navegación más sencilla.

En algunos lugares se ofrecen muestras de sonido en formato MP3, que fue elegido por producir archivos de audio muy compactos y que se pueden escuchar, grabar
y/o modificar con herramientas al alcance de cualquiera. Estas muestras no son indispensables para la comprensión del resto del contenido.

Sonidos
Los sonidos son la forma en que un lenguaje se vuelve real en el mundo físico, así que comenzaremos hablando de ellos. Algunas personas creen que una letra en su 
alfabeto es lo mismo que un sonido, o que todos los sonidos de todos los lenguajes del mundo son los mismos (que los sonidos de su propio lenguaje), sólo que con 
'acentos' diferentes. Por qué esto es falso se puede explicar fácilmente y ser entendido por la mayor parte de la gente. Aquí no mezclaré sonido con representación o 
transliteración, y daré ejemplos de sonidos en lenguajes que pueden resultar familiares sólo para simplificar las cosas.

Sin embargo, tenemos que hablar primero de un tema bastante abstracto, para poder proseguir con confianza después. Hablaremos de fonos (sonidos reales) y


fonemas (los sonidos en un lenguaje como los ve un lingüista).

Fonos y fonemas

El inmenso (de hecho, infinitamente denso) rango de sonidos posibles que un ser humano puede producir se llaman fonos. Cada posición particular de los labios, 
lengua y otras características de nuestro órganos fonadores puede pensarse como un punto en un continuo multidimensional. Dadas dos posiciones de la lengua con 
respecto al interior de la boca, siempre hay una posición en el medio, y así sucesivamente. Como los números reales en su recta.

Sin embargo, agrupamos los sonidos en torno a ejemplos prototípicos de ellos mismos, para estudiarlos mejor y más fácilmente, y llamamos a cada uno un fono, un
sonido simple (es decir, único) que se puede describir por ciertas características (por ejemplo, la lengua toca los dientes, las cuerdas vocales vibran, etc.).

En un lenguaje dado, encontraremos muchos fonos, pero éstos no son el objeto de nuestro estudio. Necesitamos distinguir los sonidos que son distinguibles por los 
hablantes del lenguajes, es decir, los que éstos conceptualizan como diferentes. Éstos se llaman fonemas. Un fonema puede pensarse como una familia de sonidos
relacionados que los hablantes consideran como una misma unidad fonética. Los sonidos que forman parte de un mismo fonema se llaman alófonos o variantes
alofónicas.

En símbolos fonéticos, las transcripciones fonémicas se encierran entre barras (/X/), mientras que las fonéticas (aquéllas que distinguen los alófonos de un mismo 
fonema) se encierran entre corchetes ([X]). Los símbolos fonéticos estándar que usa la mayor parte de la gente hoy en día pertenecen a un conjunto, el IPA
(International Phonetic Alphabet, "Alfabeto Fonético Internacional"). Son muchos, y necesitarías una fuente especial para verlos si los usara aquí, así que yo (como 
la mayoría de los que tienen que manejar símbolos del IPA en la Web o en e-mail) uso una transliteración que permite representar el IPA con caracteres ASCII de 7 
bits, y que se llama X-SAMPA.

Hay varios otros tipos de transliteraciones del IPA en ASCII. Para oír los sonidos del IPA, podés usar un programa, IPAHelp.

De vuelta al tema... Los alófonos de un fonema no tienen por qué ser sonidos parecidos. Pueden serlo o no. Por ejemplo, en español el fonema /b/ tiene dos


alófonos, [b] y [B] (una fricativa bilabial, parecida a la v del inglés, donde se sopla aire entre los labios). Éstos son sonidos similares y relacionados. Por otro lado, 
la /h/ japonesa tiene tres alófonos, [h], [C] (algo así como en huge en inglés, el Ich-Laut del alemán, o la j española ante /i/), y por último [p\] (como /f/, pero
el aire soplado entre los labios, no entre labios y dientes). Éstos son sonidos bastante distintos entre sí. Lo que los hace alófonos es que los hablantes de japonés los 
tratan como el mismo sonido (fonema). Notemos que, por ejemplo, en alemán [C] y [h] son alófonos de distintos fonemas, así que sí pueden distinguir palabras.

Esto nos lleva a la principal característica de los alófonos: usualmente están en distribución complementaria. Esto significa que el alofóno dado de un fonema que 
aparece en una posición particular depende de esa posición, la cual determina cuál fonema (uno y no otros) aparecerá. Volviendo a los ejemplos, en español /b/ es
[b] después de /m/ y cuando comienza una palabra claramente (por ejemplo, al principio de una oración); de otra forma es [B]. No se puede tener [mB] o [ab], ya
que solamente [mb] y [aB] son posibles.

Esto se reduce al hecho que define qué son los fonemas: sonidos que pueden distinguir palabras. Si dos sonidos son alófonos, no pueden producirse dos palabras 
(distintas) intercambiándolos, porque de hecho son lo mismo; si pronunciás uno donde debería aparecer otro, sonará extraño o incorrecto a los hablantes nativos, pero 
probablemente no oirán una palabra diferente.

Vas a ver más de esto después, en otras secciones, ya que seguiré repitiéndome. Si no entendés el concepto de fonema, es mejor que sigas tratando.

Vocales y consonantes

Los sonidos usados en cualquier lenguaje se pueden dividir (generalmente) en consonantes y vocales. Esta división no es necesariamente univeral; en muchos 
lenguajes algunas 'consonantes' como r, m, n, l, sirven de hecho como vocales (es decir, se las trata como núcleos de sílaba, pueden ser acentuadas or alargadas, 
etc.). Por ejemplo, el sánscrito tiene l y r silábicas; y la n japonesa de final de sílaba es moraica (se pronuncia con longitud similar a una vocal, e influye en la métrica). 
La división entre vocales y consonantes es un asunto de cierre: cuanto más cerrados están los pasajes respiratorios, más consonántico es un sonido. Vamos a examinar 
los diferentes tipos de sonidos usando esta escala.

Consonantes

Los sonidos varían a lo largo de dimensiones. Éstas representan rangos de características posibles, o características binarias (de tipo sí/no). Cada lenguaje tiene una 
fonología con una o más dimensiones dentro de las cuales se encuentran y reconocen sonidos. Una dimensión importante es el grado de cierre (u oclusión). De 
acuerdo a esto, las consonantes se clasifican en:

l Oclusivas: el flujo de aire se detiene completamente por un instante, y luego se suelta, para producir el sonido. Los sonidos /p t b g/ son oclusivos.
l Fricativas: el flujo de aire no se detiene totalmente, pero causa una fricción audible. Por ejemplo: /f/, /s/, la j  española /x/ o la ch alemana, la sh inglesa
(/S/), etc.
l Aproximantes: el flujo de aire apenas se modifica. Por ejemplo: /w l r/.

Además, una africada es una oclusiva más una fricativa, que ocurren en el mismo punto de articulación, como la ch española (que es /tS/, donde /S/ = sh), o la z


alemana (que se pronuncia /ts/).

Un click es un sonido producido colocando la lengua en posición para una oclusiva, mientras hay un segundo cierre del paso de aire en otro lugar (generalmente el 
velo del paladar, donde se pronuncia /k/), acumulando presión y luego soltando el aire (ver abajo).

También tenemos el punto de articulación, es decir, dónde ocurre la obstrucción del flujo de aire. De acuerdo a esto, las consonantes pueden ser:

l Labiales: formadas por los labios (/m/, /p/, también conocidas como bilabiales), o por los labios y los dientes (/f/, también conocidas como labiodentales), 


o por los labios y un cierre parcial en el velo del paladar (/w/, labiovelar).
l Dentales: entre los dientes y los alvéolos, como en la th inglesa (/T/ o /D/), o la t española. 
l Alveolares: en los alvéolos, el lugar justo atrás de los dientes (/s/, /l/, la t inglesa, la r y la rr españolas). 
l Palato-alveolares (o postalveolares): un poco más atrás, casi en el paladar duro (como sh en inglés, o j  en inglés y francés). 
l Retroflejas: como las palatoalveolares, pero la lengua se curva hacia atrás (de forma que lo que toca el paladar es la cara inferior). La característica r con
sonido 'hueco' de buena parte de los dialectos norteamericanos del inglés es retrofleja. 
l Palatales: en la cúspide del paladar (el sonido de la i en diptongo, como en hierro, diodo, diálogo).
l Velares: en la parte de atrás de la boca, o velo (/k/, la j  española /x/, la ng inglesa /N/ como en sing).
l Uvulares (o postvelares): muy atrás en la boca, en la úvula (o campanilla) (el sonido oclusivo /q/, tal como aparece en árabe; la r francesa).
l Glotales: en la parte de atrás de la garganta, pronunciadas con participación del órgano (la epiglotis) que cierra la glotis o pasaje entre el esófago y la tráquea. 
Por ejemplo, la h inglesa, el glottal stop que aparece ante vocales iniciales.

Algunas otras dimensiones son:

l Voz: presente cuando las cuerdas vocales vibran al producir el sonido (que se llama sonoro), ausente cuando no vibran (sordo). Los sonidos /p t f/ son
sordos, mientras que /b d l/ son sonoros.
l Nasalización: depende de si pasa aire por la nariz o no. Los sonidos /m n/ son nasales.
l Aspiración: (sobre todo hablando de oclusivas) se presenta cuando hay una 'explosión' de aire al soltarlo. Los sonidos /p t k/ iniciales, en inglés, son 
aspirados. (La aspiración es lo que hace que la t de la palabra inglesa two suene parecida a una ch a muchos hispanohablantes.)
l Palatalización: cuando la parte media de la lengua se eleva hacia el paladar al pronunciar la consonante. La ñ española (y la ll, en España) son palatales o 
palatalizadas, según el análisis que se haga. 
l Glotalización: cuando hay un cierre en la glotis al mismo tiempo que se pronuncia el sonido principal, y ambas obstrucciones se sueltan juntas.

Examinemos ahora estos contrastes. Los llamo contrastes porque eso es lo que son: cosas que pueden ser distinguidas. La lingüística se basa en contrastes, en 
diferencias. Si un lenguaje no distingue entre dos sonidos, entonces, para todos los propósitos prácticos, es el mismo sonido, y como tal debe ser estudiado.

La voz (vibración o no de las cuerdas vocales) es un contraste muy común en los lenguajes occidentales indoeuropeos, aunque no en muchas otras familias lingüísticas, 
donde esta distinción no se hace (de manera que, por ejemplo, /p/ y /b/, o /t/ y /d/, son el mismo fonema).

La nasalización es un contraste muy común. Las nasales más comunes son a su vez oclusivas sonoras, pero algunos lenguajes (como el galés) tienen nasales sordas, y 
unos pocos tienen nasales fricativas. Si no te imaginás como pronunciar una nasal sorda, tené en cuenta que una m es similar a una b nasalizada (la diferencia es
mínima), de manera que una m sorda es casi como una p  nasalizada: pronunciá una p  al mismo tiempo que dejás salir aire por la nariz, y listo. Mucha gente de hecho 
nasaliza las consonantes (y las vocales) después de una nasal, aunque no se dan cuenta: la distinción generalmente no es fonémica (no se puede usar para distinguir una 
palabra de otra).

Ya hablamos de la aspiración. Un lenguaje puede tener oclusivas aspiradas, no aspiradas, o ambas; y puede hacer fonémica esa distinción (como el hindi) o sólo 
fonética (como el inglés).

La palatalización es un fenómeno bastante común entre los lenguajes. Una consonante se palataliza elevando la parte media de la lengua hacia la parte superior de la 
boca (el paladar). Normalmente la consonante palatalizada tiene una contrapartida alveolar. El resultado es algo que suena como la consonante alveolar
correspondiente más un sonido /j/ (como la i en 'tiene' o, en España, la y  de 'yo'). El ruso tiene una serie de consonantes palatalizadas, transliteradas con un apóstrofe 
(t', l', d'). El español (peninsular) tiene dos, ll (en IPA, /L/) y ñ (/J/); el francés tiene también éste último, escrito gn, y el portugués tiene lh, nh.

La glotalización se hace cerrando la glotis (el órgano que impide que la comida vaya a los pulmones y el aire al estómago, cuando se cierra a tiempo), y abriéndola al 
mismo tiempo que se pronuncia el sonido. Los sonidos glotalizados son generalmente oclusivas, y se las llama también eyectivas. Se puede crear una glotalización 
produciendo un glottal stop (oclusiva glótica) al mismo tiempo (en coarticulación) que la oclusiva principal, y luego liberando ambos cierres al mismo tiempo. Pero 
¿qué es un glottal stop? Al comenzar una palabra en vocal, y si no hay nada antes, solemos producir uno antes de la vocal, aunque no nos damos cuenta. También 
cuando queremos separar dos vocales, haciendo una pausa entre ellas. Al aclararnos la garganta dos veces, generalmente hay un glottal stop entre ellas. En alemán, 
siempre hay un glottal stop antes de una vocal inicial. Este sonido no es fonémico en alemán o en español, pero es bastante común en otros lenguajes, generalmente 
transliterado como un apóstrofe (como en hawaiiano o klingon), o con su símbolo IPA, similar a un signo de interrogación sin punto (transliterado /?/). El georgiano y
el quechua tienen sendas series completas de oclusivas sordas glotalizadas o eyectivas, que también se llaman glotálicas egresivas.

También hay consonantes glotálicas ingresivas, o implosivas. Para producir una implosiva, hay que crear, además de una aproximación o clausura en otro punto, 


una clausura o cierre en la glotis, luego bajar la glotis, y al alcanzarse una cierta presión soltar ambos cierres. Algunos lenguajes africanos, entre otros, tienen 
consonantes implosivas, que son usualmente oclusivas sonoras. Mi lenguaje construido g'amah tiene oclusivas implosivas y nasales implosivas.

Algunos otros contrastes que no mencioné hasta ahora:

Una consonante lateral es una en la que la lengua mantiene cerrado el paso de aire en la parte central de la boca, pero dejando que fluya aire por los costados. La
lateral más común que conocemos es /l/, que usualmente indica un sonido alveolar y sonoro. Sin embargo, el inglés tiene dos variantes, una alveolar y otra velar 
[L\]; ésta última (llamada dark L o 'L oscura') es la que le da ese sonido extraño a la l en palabras como milk, sell, etc. Esta l velar es más parecida a una g que a
otra cosa. Ambas variantes, al igual que nuestra l, son sonoras, pero algunos lenguajes, como el galés, tienen una l sorda y fricativa (que se escribe /K/, y se parece a
una mezcla entre /l/ y /s/).

Una consonante retrofleja se produce doblando la lengua hacia atrás dentro de la boca, hasta que toque el paladar con la punta de la cara inferior. La retroflexión 


existe y es fonémica en muchos lenguajes. Las retroflejas también se llaman apico-palatales (lo cual significa que el ápice, o sea la punta de la lengua, toca el paladar). 
No hay ejemplos conocidos (para nosotros) de retroflejas, excepto la r de muchos dialectos del inglés norteamericano. En sánscrito hay una serie completa de 
consonantes retroflejas que van paralelas a las alveolares, y se transliteran como t, d, s, etc., con un punto debajo.

Si sólo se usan las dos dimensiones principales (grado de cierre y punto de articulación) y se simplifican algunos puntos de articulación, puede mostrarse la distribución 
de las consonantes del español rioplatense en una grilla como ésta:

labial lab-dnt dental alv alv-pal velar

oclusivas p b t d k g
fricativas f s S x
africadas tS
aproximantes 4 l r
nasales m n J

Nótese que /S/ representa el sonido tanto de ll como de la y  consonántica, ya que ambas consonantes se funden en una en este dialecto, y su articulación varía entre 


la postalveolar a la francamente palatal. Esta tabla es válida, sin estas consideraciones, para todos los otros dialectos del castellano.

Nuevas consonantes

¿Cómo inventar nuevas consonantes para tu lenguaje? El primer paso debería ser decidir qué contrastes vas a usar. El español tiene tres puntos de articulación (PdAs) 
para las oclusivas, que son normalmente el marco de referencia, y distingue voz para las oclusivas (no para las fricativas) y nasalización.

Lo más importante es notar que la fonología de un lenguaje es un sistema. Las consonantes que estén fuera del sistema (porque, por ejemplo, usan contrastes 
excepcionales) tienden a perderse y desaparecer, o se funden con otras similares. Por ejemplo, el español no podría tener una eyectiva (glotalizada) porque usaría un 
contraste que no se encuentra en ningún otro punto del lenguaje, y no sobreviviría mucho tiempo. Las excepciones (como la presencia de /tS/, el sonido ch, que es la
única africada) son posibles, pero no deberías abusar de ellas. Si tenés un sonido exótico, deberías tener otros del mismo tipo. Por otra parte, probablemente no 
deberías inventar muchos sonidos extraños; tenés que saber cómo pronunciar cada uno de ellos, y ser capaz de leer tu lenguaje fluidamente. (Esto también involucra 
una planificación cuidadosa del esquema de transliteración.)

Una vez decididos los contrastes que vas a usar, armá la grilla y llená los huecos. Probablemente tengas que inventar nuevos símbolos o digrafos para algunas letras 
(ver Cómo escribir). Si te parece que hay muchas consonantes, borrá una serie, o algunos miembros. No hay obligación de ocupar todos los lugares de la grilla (el 
español, como habrás visto, deja muchos espacios vacíos). Por ejemplo, podés tener oclusivas sordas y sonoras, pero solamente fricativas sordas y nasales sonoras, y 
no tener africadas.

El español tiene sólo una africada, ch /tS/; en cambio, tu lenguaje podría tener africadas en todas las posiciones donde haya una oclusiva y una fricativa. Por ejemplo, 
las consonantes pf  (que se encuentra en alemán, como en Pferd), ts (también en alemán, escrita z como en zehn, y en japonés, como en tsukuru, aunque sólo es una 
variante alofónica de /t/), tth /tT/ (donde /T/ es la th sorda del inglés, o la z dental del español de Castilla), tsh (ch), kkh (como sonarían kj simultáneas en 
español), etc.

Puede completarse una serie de consonantes, por ejemplo las nasales españolas: no hay nasal velar (no hay razón para que la haya, pero tampoco para que no). Una 
nasal velar es el sonido del grupo final escrito ng en inglés). También podría completarse la serie de las oclusivas para que hubiera una palatal que se correspondiera 
con la nasal ñ (/J/), etc.

Para meterte de lleno en la cosa, podrías añadir un contraste no usado en español, y crear una serie de consonantes palatalizadas. O usar la aspiración como distinción 
fonética, o lateralizar o retroflexionar consonantes. Como dice Mark Rosenfelder, la clave de un lenguaje naturalista es añadir (o sustraer) dimensiones. Estudiante de 
quechua, menciona él que este lenguaje no tiene una o dos, sino tres series de oclusivas: aspiradas, no aspiradas, y glotalizadas; pero no distingue entre consonantes
sordas y sonoras. De manera que para un hablante de quechua la p de peso y la b de beso son el mismo sonido (fonema), y las dos palabras suenan como lo mismo.

Algunos sonidos son más comunes que otros. De acuerdo a las fuentes de Mark Rosenfelder, la mayoría de los lenguajes tienen las oclusivas simples /p t k/. Por lo


que he podido averiguar, los sistemas fonológicos más simples corresponden al hawaiano, con ocho consonantes y cinco vocales, y el rotokas, con sólo seis 
consonantes y cinco vocales. El quechua tiene muchas consonantes pero sólo tres vocales (/a i u/, que son las más comunes). El sistema más complejo parece ser 
el del !xu~ (o !kung), lengua de la familia khoisan de África, con 92 consonantes (47 de las cuales son clicks).

Vocales

Las vocales se producen exactamente igual que las consonantes; no son diferentes esencialmente de ellas. Pero el detalle principal es que el flujo de aire prácticamente 
no es molestado de ninguna forma al pasar por la boca; sólo es modulado por la posición de la lengua y otras partes de los órganos del habla. Además, las vocales son 
normalmente sonoras (algunos lenguajes tienen vocales sordas, especialmente al final de las palabras; suenan como pronunciar una h inglesa con la lengua, labios, etc.
en la misma posición que para la vocal).

Las vocales varían a lo largo de las siguientes dimensiones:

l Altura: cuán abierta está la cavidad de resonancia, formada dentro de la boca por la lengua (cuanto más alta está la lengua, más cerrada la cavidad). Las 
vocales se clasifican usualmente en altas (/i/, /u/), medias (/e/, /o/), y bajas (/a/). Esta escala es por supuesto continua, no discreta; en algunos casos no
puede describirse una vocal como media o baja, por ejemplo, pero se puede decir que es más alta que /a/ pero no tan alta como /e/.
l Frontalidad: cuán cerca está la parte articuladora de la lengua del frente de la boca. Puede variar desde frontal (/i/, /e/), a central (/a/), hasta posterior
(/o/, /u/). Las vocales frontales se llaman a veces palatales, y las posteriores velares.
l Redondeamiento: depende de si los labios están redondeados o no. Las vocales /o/, /u/, la u francesa o la ü alemana (IPA /y/) son redondeadas, mientras
que las vocales /i e a/ son no redondeadas. In muchos lenguajes esto cubre todas las posibilidades, pero de hecho el sueco tiene tres grados de
redondeamiento en una vocal frontal, desde no redondeada hasta totalmente redondeada, pasando por semi-redondeada.
l Longitud: cuánto tiempo se estira la vocal, por supuesto. El español o el inglés no distinguen las vocales por longitud, pero el latín, el griego, el inglés antiguo y 
muchos otros sí. El estonio tiene tres grados de longitud (vocales cortas, semilargas y largas). 
l Nasalización: como las consonantes, las vocales pueden ser nasalizadas. En español, una vocal al lado de una consonante nasal generalmente se nasaliza, pero 
esto no es distintivo (fonémico). En francés, por otro lado, hay cuatro pares de vocales que se distinguen por ser nasales u orales. 
l Voz: las vocales normalmente son sonoras, pero algunos lenguajes tienen vocales sordas (suenan como /h/ con los labios y lengua en posición para pronunciar 
la vocal). En japonés, /u/ e /i/ son sordas si no tienen tono alto y se encuentran entre consonantes sordas (pero se hacen sonoras cuando por alguna razón se 
las enfatiza).
l Tensión: es difícil de explicar, excepto con ejemplos; en inglés tenemos que las vocales /I/ y /U/ de pit y put son laxas, mientras que /i/ y /u/ como en
repeat y boot son tensas. En español, /e/ y /o/ tienen variantes alofónicas tensas cuando están en sílaba abierta (terminada en vocal) y laxas cuando están en 
sílaba cerrada (terminada en consonante). 
l Retroflexión: igual que la retroflexión en consonantes. Una vocal se hace retrofleja curvando y doblando la lengua hacia atrás, de manera que la parte inferior 
quede levemente hacia arriba. Un cierto lenguaje africano cuyo nombre no recuerdo ahora tiene tres series de tres vocales cada una; la primera es de no
retroflejas, la segunda de semi-retroflejas, y la tercera de totalmente retroflejas.
l Constricción: una vocal constreñida suena como si te estuvieras atragantando. En algunos lenguajes, éstas y otras formas de pronunciar sonidos son fonémicas, 
no sólo un accidente. 
l Otras: hay más contrastes para vocales, pero no sé nada de ellos. Otras modificaciones se pueden hacer por medio del acento y el tono (en lenguajes tonales,
como el chino o el vietanamita; ver abajo).

El español tiene este sistema vocálico:

front centr post

altas i u

medias e o

bajas a

Este diagrama en forma de triángulo es recurrente, y se encuentra en todos los libros de fonética; usa las dos dimensiones principales (altura y frontalidad). Puede 
pensarse el triángulo como un diagrama del interior de la boca, donde los dientes (la parte frontal) están a la izquierda. Dentro del triángulo puede haber vocales en 
cualquier lugar. Los sonidos centrales y medios, como la schwa inglesa (/@/), son los menos distinguibles y marcados; la schwa está justo en el centro del triángulo, 
sobre la /a/. En ruso hay una vocal central alta /i\/ (en cirílico ы), que se encuentra también sobre la /a/, pero más arriba, en el medio de la línea i—u.

Nuevas vocales

Como ocurre con las consonantes, podés inventar tantas vocales como quieras. Tendrías que tener en cuenta que las vocales forman un sistema, uno que no debe estar 
desbalanceado. Si hay una versión tensa y una laxa de i, es porque estás usando la tensión como contraste, y debería estar presente en algún otro par de vocales.

El redondeamiento, aunque así lo parece, no está desbalanceado en español. Parece ser que el redondeamiento es más frecuente en las vocales posteriores que en las 
anteriores. Sin embargo, muchos lenguajes tienen frontales redondeadas, que el español no tiene (el alemán y el francés tienen ambos formas redondeadas de i y e,
escritas ü y ö en alemán). Por otro lado, podés usar vocales posteriores no redondeadas (como la u japonesa).

Puede haber tantas vocales como quieras. Los sistemas más simples tienen tres, generalmente /i a u/ (los vértices del triángulo, y no por casualidad). Esto significa 
que distinguen tres sonidos vocálicos, no que sus hablantes no puedan o sepan pronunciar una [e] o una [o]. Un hablante de quechua puede decir algo que suena
como [e] a un hablante español, pero que es de hecho una /i/, de la cual el sonido [e] es una mera variante alofónica.

El español y el japonés tienen cinco vocales, /i e a o u/. El inglés británico estándar tiene doce vocales, el alemán catorce, y el sueco alrededor de diecicho. Pero 
no hace falta que llegues a tanto.

Hay al menos dos lenguajes naturales con sólo dos vocales, el abkhazio y el abaza, hablado en el Cáucaso Noroccidental, a los cuales podría sumarse otro del mismo 
origen, el ubykh, si no fuera porque se supone extinto. Estas vocales probablemente podrían caracterizarse como /a/ e /i/, donde /i/ tendría como variantes [i],
[u] y quizá cualquier otro sonido alto, sea frontal, central o posterior, redondeado o no.

Acento y altura
El acento es por supuesto la fuerza que ponemos en cierta sílaba de cada palabra (o de las palabras importantes en una oración completa). Un lenguaje puede tener 
una regla de acentuación regular, en cuyo caso solamente hay que mencionarla, o puede tener una acentuación irregular, en cuyo caso deberías indicarla. En español, 
por ejemplo, aunque el acento es impredecible, hay reglas para saber dónde colocarlo en palabras que uno lee, ya que se lo indica usando un 'acento agudo' o tilde, o 
se explicita por la forma de la palabra. En inglés, el acento es también impredecible, pero no se lo marca de ninguna forma en la escritura. En francés, todas las 
palabras se acentúan en la última sílaba (el uso de 'acentos' agudos, graves y circunflejos no tiene nada que ver con esto). En quechua, todas las palabras son graves; 
en finés, el acento cae en la primera sílaba, no importa lo larga que sea la palabra. En latín, la regla es un poco más compleja: se acentúa la penúltima sílaba si es larga 
(es decir, si contiene una vocal larga o termina en una consonante), y si no se acentúa la antepenúltima. Es decir que seculus es /'sekulus/, mientras que secundus
es /se'kundus/ (el apóstrofe, en IPA, indica que en la próxima sílaba cae el acento).

La altura se refiere al nivel (musical) de una sílaba, que puede ser alto, medio, bajo, etc. El japonés usa un sistema de acentuación por altura, que ignora la fuerza o 
acento al que estamos acostumbrados, y marca las palabras con distintos patrones de altura. Algunas sílabas son bajas, y otras altas, dependiendo de dónde caiga un 
punto en particular donde la altura baja más abruptamente (ver aquí para más detalles). En japonés no hay palabras graves, agudas, esdrújulas, o de cualquier otro tipo 
como ése; lo que varía es la altura, no la fuerza de las sílabas.

En la mayoría de los lenguajes, algunas palabras no reciben acento (de fuerza o de altura) cuando participan de una oración completa. En español, por ejemplo, en la 
frase 'La casa es vieja', no hay acento sobre 'la' ni sobre 'es'. Al perder su acentuación, además, estas palabras en algunos lenguajes reducen sus vocales, 
transformándolas en versiones más centrales y menos distintivas (por ejemplo, el inglés tiende a reducir las vocales no acentuadas a /@/ o /I/).

Tono
El tono es el perfil de entonación de una sílaba. Existe en todos los lenguajes, pero no suele ser fonémico. En español, podés pronunciar '¿Qué hiciste?' con muchos 
tonos distintos, pero las palabras son las mismas.

En algunos lenguajes, el tono es fonémico. Estos lenguajes incluyen el chino mandarín, el cantonés, el vietnamita, y muchos lenguajes africanos. Cada sílaba recibe un 
tono particular, que es tan característico como la altura de las vocales que contiene, y que puede distinguir palabras. El mandarín, por ejemplo, tiene cuatro tonos, 
llamados alto, ascendente, descendente bajo y descendente alto. Ejemplos de Mark Rosenfelder: ma 'madre', má 'cáñamo', mâ 'caballo', mà 'maldición'. El vietnamita 
tiene seis tonos, dos de los cuales incluyen una pronunciación tan grave que las vocales presentan creaky voice o voz quebrada, donde las vibraciones de las cuerdas
vocales son de tan baja frecuencia que se pueden oír separadamente.

Podés tratar de usar tonos en tu lenguaje, pero no lo recomiendo a menos que sepas hablar un lenguaje tonal previamente. Es una característica interesante, pero 
requiere mucha reeducación de los órganos del habla. El tono puede ser una característica fonémica y/o (raramente) un dispositivo gramatical.

Hay una interesante discusión corta en un trabajo de Marjorie K.M. Chan [en inglés]: "Tone and Melody in Cantonese", que plantea y responde tentativamente una


pregunta interesante: ¿cómo se hace para cantar una canción en un lenguaje tonal?

Restricciones fonológicas
Cada lenguaje tiene combinaciones de sonidos que son consideradas difíciles, prohibidas, o imposibles. Se llaman restricciones fonológicas, y son los moldes en los
que toda palabra tiene que caber o hacerse entrar para lograr coherencia y 'familiaridad'.

Lenguajes como el inglés están bastante libres de restricciones fonológicas. De ahí la gran cantidad de palabras extranjeras que ha podido absorber, como garage,
sombrero, mosquito, ersatz, schmuck... Algunos lenguajes no resisten tales invasiones. El español, aunque no tan libre, permite una cierta relajación, pero otros no.

Por ejemplo, el japonés (uno de los lenguajes más restringidos) sólo permite sílabas formadas por una consonante (quizás doble, o ninguna), una vocal, y 
opcionalmente /n/: (C)V(n). La palabra inglesa club fue adaptada al japonés como kurabu, para dar sólo un ejemplo. Aún un nombre español sencillo como 
Rodríguez se transforma en Rodorigesu. Cualquier fan del anime conoce además las indelicadezas cometidas por los creadores de superhéroes (y heroínas) al forzar 
gritos de batalla en inglés a la fonética del japonés, como cuando Sailor Moon exclama muun kurisutaru pawaa meeku appu!, o sea "moon crystal power make
up!".

El lenguaje hablado en las islas Fidji es casi igual de restringido: consonante más vocal, con una consonante opcional al final de las palabras.

El finés no toleraba combinaciones de consonantes como /pr/ o /fl/ hasta no hace mucho. El lenguaje élfico Quenya directamente no tolera combinaciones de 
consonantes iniciales o finales. Las palabras griegas sólo pueden terminar en /s/, /n/ o una vocal. Algunos lenguajes pueden usar ciertos sonidos junto con otros,
nunca solos.

Es difícil diseñar un patrón in abstracto; pero deberías hacerte una idea de él. Lo principal es definir si tu lenguaje será vocálico o consonántico, por decirlo en 
términos no técnicos e inexactos. El inglés y la mayoría de los lenguajes del norte de Europa son bastante consonánticos. El español, el japonés y el griego son bastante 
vocálicos. El hawaiano es muy vocálico (¡una palabra como Kilauea no es posible en muchos lenguajes!). La tendencia global, de acuerdo a algunas teorías, es hacia 
la estructura básica consonante + vocal. Podrías empezar por ahí.

Un lenguaje sintético con muchas inflexiones generalmente prefiere una estructura simple. (Sin embargo, considérese el georgiano, un lenguaje muy aglutinante, donde 
se pueden encontrar hasta seis consonantes seguidas, como en vprtskvni 'Yo lo estoy pelando' [ts es una africada y cuenta como una sola consonante]). Un lenguaje
aislante puede tener palabras muy intrincadas, ya que no se les va a añadir nada más a ellas. Lo mejor es probar y probar hasta que las palabras comiencen a sonar 
bien respecto a tu gusto y ánimo particular (¡pero no lo cambies a mitad de camino!).

Los sonidos tienden a influenciarse unos a otros y a cambiar. El cambio de sonidos puede eventualmente producir un nuevo lenguaje o dialecto.
Cambio de sonidos
Nadie sabe por qué, pero los sonidos cambian en todos los lenguajes. Los únicos lenguajes que no cambian son los muertos.

Los sonidos se transforman en otros, y a veces por influencia de otros. Los cambios de sonidos se pueden clasificar en condicionados e incondicionados (no recuerdo
si hay palabras más correctas para esto). Un cambio de sonido incondicionado transformó la palabra inglesa antigua sceadu /'sk&adu/ en shadow /'S&dOw/, de la
misma forma que en toda otra palabra que comenzaba con /sk/ éste la cambió a /S/ (sh). La mayoría de las palabras inglesas modernas con /sk/ inicial son
préstamos escandinavos, por si te lo estabas preguntando. Un cambio de sonido condicionado transformó el francés marbre en el inglés marble (la segunda /r/ se
disimiló de la primera).

Los tipos principales de cambio de sonido influenciado son:

l Asimilación: un sonido se acerca a otro vecino. Por ejemplo, la misma palabra asimilar, del latín ad- + simul-; la /d/ se volvió /s/ a causa de la /s/ vecina
(luego las dos se fundieron, desde luego). La asimilación puede transformar a los dos sonidos a la vez (recíproca), al primero (regresiva) o al segundo 
(progresiva).
l Disimilación: lo contrario a la asimilación; dos sonidos idénticos o similar se apartan uno de otro. Por ejemplo, el cambio marbre → marble ya mencionado, o
el cambio del mismo tipo ocurrido con palabras latinas como arbor, que dio en español árbol. La disimilación suele ser para evitar cacofonías. 
l Metátesis: dos sonidos intercambian sus lugares. Esto generalmente produce una nueva combinación más fácil de pronunciar (aunque 'fácil' es un término muy 
subjetivo). Por ejemplo, en español antiguo en palabras como dejadle solía producirse metátesis en dejalde.
l Elisión, síncopa, apócope: todos éstos son nombres para el mismo fenómeno. Se refieren a la pérdida de sonidos; elisión específicamente significa pérdida de 
vocales o sílabas no acentuadas, mientras que síncopa se refiera a la pérdida de sonidos medios, y apócope es la pérdida de sonidos finales. En francés se 
produce mucha elisión, como en au revoir /or'vwa/. La pérdida de la /e/ final en inglés y francés es un apócope, al igual que las formas alternativas de 
algunos adjetivos en español, como gran vs. grande.
l Haplología: la pérdida de una secuencia de sonidos por semejanza con sonidos vecinos. En latín, según las reglas de derivación y cambio esperadas, 
stipendium debería haber sido *stipipendium; la misma haplología se reduciría probablemente a haplogía si fuese un término más comúnmente usado. 
l Liaison ('ligadura', pronunciada /li.e'zo~/): la introducción de un sonido entre otros dos, especialmente entre palabras. El francés, de donde viene la 
palabra, produce mucha: las consonantes finales 'perdidas' de muchas palabras reaparecen cuando la siguiente palabra empieza por vocal. Por ejemplo, C'est
moi /,sE'mwa/ vs. C'est Anne /,sEt'an/.
l Prótesis: se añade un sonido inicial extra al principio de ciertas palabras, como la /e/ que en español se añadió a las palabras latinas comenzadas en /sp/ (y
hoy en día aún a muchos préstamos ingleses): latín spectrum → espectro.
l Epéntesis: un sonido medio extra se añade entre otros. En galés, una vocal epentética aparece entre ciertos pares de consonantes en position final; por
ejemplo llyfr se pronuncia como si fuese llyfyr.

Los cambios de sonido condicionados e incondicionados no son siempre fáciles de separar. Si tomamos la definición como una regla estricta, casi todos los cambios 
son condicionados; muy pocos son absolutamente espontáneos. Por ejemplo, el cambio de la /k/ latina (escrita c) en los lenguajes romances se ve como
incondicionado, pero fue de hecho producido por la influencia de las vocales: /k/ cambió en /s/ en español y francés (aunque siguió siendo escrita c) cuando el
sonido siguiente era una vocal frontal (/e/ o /i/).

El cambio de sonidos suele producir irregularidades. En español, las diferentes formas en las que cambió la /k/ latina produjo las formas irregulares del verbo decir:


digo, dice, dijo, dicho. Pero un cambio de un tipo específico puede ser regularizador. Se llama analogía, y se lo tratará en su propia sección.

Reglas de cambio de sonidos

Los cambios de sonido pueden ser de muchos tipos distintos, como se vio arriba; pero todos cumplen ciertas reglas:

l El cambio de sonidos es gramaticalmente irrestricto. Si un cierto fonema cambia a otro, no importa qué clase de palabra sea. Una regla de cambio que 


transforma un fonema o conjunto de fonemas en otro puede incluir sólo restricciones fonéticas, por ejemplo: 'A cambia a B cuando sigue a C, excepto en sílabas 
acentuadas', o 'X intervocálica cambia a YZ'. Una regla de cambio no puede restringirse a ciertas clases de palabras o construcciones gramaticales, como 'A y 
B finales se pierden, excepto en los adjetivos' o 'X cambia a Y en los sustantivos con inflexión'. 
l El cambio de sonidos no tiene memoria. Esto puede sonar estúpido, pero no lo es. Una regla de cambio que transforma X en Y no puede discriminar entre 
una cierta X que el lenguaje ha tenido desde el principio y otra X que proviene de un cambio anterior W → X. Los ciclos de cambio de sonidos son 
acumulativos y cada uno, por decirlo así, borra las huellas del anterior. 
l El cambio de sonidos es imparable. Algunas personas solían pensar que un lenguaje escrito ayuda a evitar el cambio en el lenguaje hablado. Esto es 
obviamente falso. Lo que hace un lenguaje escrito es hacer que las palabras escritas se vean como eran antes de cambiar. Si aprendiéramos nuestro lenguaje 
nativo de los libros, el argumento sería probablemente válido; ¡pero aprendemos a hablar escuchando a otra gente hablar! Si un lenguaje no cambia, es 
probablemente una lengua muerta. Esto por supuesto no se aplica a los lenguajes artificiales auxiliares como el esperanto, o a lenguajes artificialmente
resucitados y mantenidos vivos como el latín. Con respecto al esperanto, no sé si los esperantistas hablan el lenguaje en su casa para que sus hijos lo oigan y 
aprendan como (segunda) lengua nativa. Si lo hacen, los niños probablemente harán algunos cambios muy lentamente a medida que pasan los años (si ellos 
hacen lo mismo con sus hijos, y así sucesivamente). Esto quizá horrorizaría al doctor Zamenhof y a sus seguidores, pero sería un signo seguro de que el lenguaje 
es de hecho usado para la comunicación y está vivo, un lenguaje natural(izado) más entre pares. En cuanto al latín, todos lo hablan más o menos como 
prefieren...

Estas reglas pueden tener excepciones, pero deben ser adecuadamente explicadas. Si escribís la historia de tu lenguaje, podés explicarlas o bien decir que "por alguna 
razón desconocida...", pero no dejes que esto se vuelva una excusa para violar las reglas lingüísticas.

Las excepciones a estas reglas son causadas en general por la analogía o procesos relacionados que tienden a regularizar el lenguaje. Por ejemplo, si un cambio hace
que X se vuelva Y y esto provoca que dos pronombres suenen igual, una de éstas cosas ocurrirá: 1) nada, 2) los dos pronombres se fundirán en uno, gramaticalmente 
como lo fueron fonéticamente, 3) el pronombre que cambiaría se 'rehusará' a cambiar, 4) la gente dejará de usar uno de los pronombres para evitar la confusión, 
reemplazándolo por otra construcción.

El cambio de sonido puede ser lentificado o acelerado. Algunas personas han tratado de formular un conjunto de factores que podrían causar que un lenguaje entre en 
una fase de cambio rápido (como caos económico y social, guerras, un movimiento religioso nuevo, etc.) Estas teorías se han demostrado inútiles. Seguramente hay 
factores sociales que regulan la velocidad y calidad del cambio de sonidos, pero dependen de tantas 'variables sociales' que son imposibles de calcular. Algunas las
podés imaginar: si un país cerrado (en una isla, por ejemplo) de pronto entra en contacto con una cantidad masiva y constante de visitantes extranjeros, su lenguaje 
probablemente comenzará a cambiar más rápido, tomando prestadas nuevas palabras y estructuras, creando o copiando expresiones idiomáticas, e inventando 
palabras para conceptos que antes no conocían.

Otra causa de excepciones es el hecho de que algunas palabras son menos comunes que otras. Las palabras cambian si son dichas y repetidas una y otra vez, siendo
así 'desgastadas'; las palabras extrañas y raramente usadas probablemente quedarán incambiadas. Estas palabras raramente usadas incluyen términos muy educados, 
muy formales o específicos. Algunas veces no son exactamente preservados, sino represtadas desde el lenguaje antiguo (u otro), como tiroides, que viene del griego
thurā 'puerta' y ésta a su vez del protoindoeuropeo *dhwor-, de donde también provienen fuera, foro, forense, foresta  y el inglés door 'puerta'; o semáforo, donde
-foro 'llevar' tiene mismo origen, *bher-, que el elementio -f(e)r - que aparece en conferir, diferir, inferir, preferir, proferir, transferir, vociferar, ofrecer, y hasta
ferry . Algunos otros ejemplos incluyen pares de palabras relacionadas como noche-nocturno, recibir-receptáculo, ped ir-repet ir, hablar-fabul ar, etc.

Armonía
Armonía es un cambio en alguna de las cualidades de un sonido, en ciertos contextos, para concordar o armonizar con otro sonido. Puede relacionarse (aunque no
siempre) con un proceso de asimilación. Se produce entre los fonemas de la raíz de una palabra y los fonemas de los afijos (cambiando estos últimos para acomodarse 
a las cualidades de los primeros).

Por ejemplo, la armonía vocálica se encuentra en el finés y otros lenguajes fino-úgricos (como el húngaro), y en el turco, que son aglutinantes y sufijantes. En finés el 


elemento radical viene primero y le sigue una cadena de sufijos. La vocal de la raíz está acentuada y marca el grupo armónico al que deben pertenecer todas las 
vocales de los sufijos. Estos grupos armónicos se componen de vocales que comparten alguna característica (generalmente el punto de articulación, por ejemplo 
frontal, central y posterior). Cada sufijo tiene varias formas alternativas, con vocales que pertenecen a cada uno de los grupos. Aquí hay algunas palabras finesas con 
marcas de caso:

autossa 'en el auto'


laatikossa 'en la caja'
järvessä   'en el lago'

¿Ves cómo la vocal final alterna entre -a (posterior) y -ä (frontal)? Algunos otros ejemplos, con el tiempo perfecto de verbos:

on lyönyt   'ha golpeado'
on ajanut 'ha conducido'

La marca de tiempo perfecto es -nut para las raíces con vocales posteriores, -nyt para raíces con vocales frontales (como y, que es /y/, como la ü alemana).

La armonía vocálica puede extenderse a otros contrastes además del punto de articulación; puede incluir longitud, nasalidad o redondeamiento. La armonía de altura 
vocálica es posible, pero no se la encuentra en ningún lenguaje natural conocido.

Otra forma de armonía es conocida como armonía nasal. Se la encuentra en el guaraní (el lenguaje de un grupo nativo sudamericano que habitaba en el noreste de 
Argentina y en Paraguay, donde el lenguaje aún es floreciente y de hecho es lengua única de un gran porcentaje de la población). La armonía nasal 'enciende' el 
contraste de nasalización en ciertas consonantes de los afijos aglutinados (sí, el guaraní también es aglutinante) cuando la raíz de la palabra contiene consonantes 
nasales. Así, muchos afijos tienen dos formas, una nasal y otra no nasal. Por ejemplo, de hecha 'ver' podemos formar jajoechapeve 'hasta que nos veamos'. Esto es
no nasal. Pero de hendu 'oír' tenemos que decir ñañoendumeve 'hasta que nos oigamos'. La j , que es una palatal no nasal, cambia a una nasal palatal, ñ, y además la 
oclusiva labial p (en -peve ) cambia a la nasal labial m (-meve).

Puede haber otros tipos de armonía en tu lenguaje. Por ejemplo, una especie de 'armonía inversa' donde dos sílabas consecutivas no puedan tener la misma vocal, o no 
puedan comenzar ambas por una cierta combinación de consonantes. Esto tiene mucha relación con el fenómeno de disimilación disimilación, sólo que es sistemático, 
no accidental. El griego provee un ejemplo de esto: al derivar palabras de sus raíces, no puede haber dos sonidos fricativos que comiencen sílabas consecutivas; si los 
hay, el primero se transforma en oclusiva. Por ejemplo, la raíz thrikh- 'pelo' da trikhós (en vez de lo que esperaba, **thrikhós). (El griego también produce mucha 
asimilación.)

Umlaut y Ablaut
Umlaut es el nombre dado a la asimilación regresiva de vocales no contiguas. Asimilación, porque la cualidad de una de las vocales se asimila a la de la otra (en una o 
varias de sus características fonéticas); regresiva, porque ocurre de atrás hacia adelante (la vocal afectada anticipa la cualidad de la vocal que provoca el Umlaut); no
contiguas, porque se produce entre distintas sílabas, con las vocales generalmente separadas.

En alemán se encuentra Umlaut en varios puntos de la gramática, como una manera de marcar plurales de sustantivos y también en varios tiempos verbales. Algo 
similar ocurre en inglés, aunque aquí es diacrónico (el cambio se ve actualmente como una alternancia vocálica, siendo que el Umlaut ocurrió en una etapa anterior, 
ahora oscurecida por la desaparición de la vocal que lo provocó).

Se comprenderá mejor esto con ejemplos. El lenguaje que originó el inglés tenía un sufijo de pluralidad -i. Este sufijo provocó Umlaut de las vocales precedentes de la 
raíz del sustantivo pluralizado (la forma singular quedó igual, naturalmente); las vocales afectadas fueron las centrales y posteriores, que se volvieron anteriores 
(frontales). Luego el inglés perdió gran parte de las vocales finales y la fuente del Umlaut original quedó oculta:

           antes                           después
>------------------------------------->
SINGULAR fo:t fo:t fo:t fo:t fu:t fUt 'pie'
PLURAL      fo:ti  fø:ti  fe:ti  fe:t   fi:t  fit     'pies'

Un cambio similar dio origen a los pares singular/plural goose/geese, man/men, mouse/mice.

El Umlaut es en general provocado por una de las tres vocales que forman los vértices del triángulo vocálico, /i/ - /a/ - /u/, en ese orden de frecuencia. En inglés y 


alemán hay sólo Umlaut provocado por /i/, que frontaliza las vocales afectadas, pero el galés tiene, por ejemplo, Umlaut diacrónico por /a/, que baja la altura de las
vocales: el femenino de gwyn 'blanco' es gwen, provocado por una -a final que se ha perdido.

Ablaut
El Ablaut se menciona aquí como advertencia, ya que no es un cambio provocado sino básicamente arbitrario, en el cual las vocales de una raíz alternan según un 
criterio gramatical, no fonético. Es Ablaut, por ejemplo, la alternancia que se observa en los verbos ingleses llamados 'fuertes', como por ejemplo los siguientes:

I sing. /sIN/ ("Canto.")


I sang.        /s&N/   ("Canté.")
I've sung. /sVN/ ("He cantado.")

I write. /raIt/ ("Escribo.")


I wrote.       /roUt/  ("Escribí.")
I've written. /ritn/ ("He escrito.")

Si bien se supone que el Ablaut tiene alguna explicación diacrónica, ésta no se conoce con certeza. Según entiendo, el protoindoeuropeo ha sido reconstruido como un 
lenguaje con Ablaut que quizá fue condicionado por la presencia de ciertas consonantes en cercanía de las vocales (es decir, por asimilación); esto debe ser así puesto 
que Ablaut es muy frecuente en toda la familia indoeuropea.

Sandhi o mutación
Sandhi es el nombre dado por los antiguos académicos sánscritos a una serie regular de cambios de sonidos que se producen en las palabras en determinadas 
condiciones. También se lo llama mutación. Estos cambios pueden ser de distintas formas. Mencionaré una, aquélla con la que estoy más familiarizado: la lenición.

Lenición or suavizamiento es un cambio producido en los sonidos iniciales de las palabras cuando son usadas en ciertas posiciones, o para ciertos propósitos. Estos 


cambios afectan los inicios de las palabras quitando, añadiendo o cambiando sonidos iniciales. Así, las palabras pueden tener dos o más formas.

De los lenguajes occidentales que conozco algo, el galés y el irlandés tienen patrones de lenición. El galés, de hecho, inspiró la fonología del famoso lenguaje sindarin 
inventado por J. R. R. Tolkien para los Elfos Grises de la Tierra Media. No conozco mucho del galés, pero tengo algo de material sobre el sindarin, que tiene patrones
de lenición tomados del galés. Así que usaré el sindarin para los ejemplos.

La lenición sindarin afecta las consonantes iniciales de las palabras en ciertos contextos. Una consonante lenitada cambia de esta forma: las oclusivas sordas p, t, k se
hacen sonoras b, d, g. Las oclusivas sonoras se hacen fricativas, excepto g: b, d, g cambian a v, dh, y nada. Las sordas lh y rh se sonorizan en l, r; s da h, y m da v.

En sindarin, una palabra es lenitada cuando es (a) el objeto de un verbo, y está junto a él, (b) cualquier cosa después de conjunciones y artículos, (c) un adjetivo que


sigue el sustantivo al que describe, y (d) el segundo elemento de un compuesto. Por ejemplo: de certh 'runa' tenemos i gerth 'la runa'; de peth 'palabra' el hechizo
mágico Lasto beth lammen 'Escucha la palabra de mi boca'; de calen 'verde' el nombre Tol Galen 'Isla Verde'; de mellyn 'amigos' el nombre Elvellyn 'Amigos de
los Elfos'.

Los patrones de mutación del galés son bastante más complicados que eso; hay tres tipos de mutación, llamados suave (lenición), nasal, y espirante. El galés también 
muestra un fenómeno relacionado, que involucra la conjugación verbal (al menos para el verbo bod 'ser') donde las formas interrogativas y negativas, a parte de
cambiar la entonación y/o usar partículas, producen un cambio de los sonidos iniciales.

Se pueden usar otros tipos de lenición y mutación, y especificar cuándo se deberían aplicar. En el lenguaje africano ful, un sustantivo de la clase de las personas es 
lenitado cuando se pluraliza; el singularjim  'compañero' se hace yim'be  en plural, con lenición j → y . Curiosamente, los sustantivos de la clase de las cosas mutan
exactamente al revés.

Escribiendo tu lenguaje
Una vez determinados los sonidos que va a usar tu lenguaje, vas a necesitar una forma de escribirlos (transliterarlos) en el alfabeto latino, y quizá un alfabeto propio. 
En un momento hablaremos de alfabetos.

La transliteración puede ser una pesadilla. Lo ideal sería tener un símbolo para cada sonido, pero el alfabeto latino no tiene símbolos para representar algunos 
sonidos muy comunes. Aquí está la primera elección que tenés que hacer: ¿vas a inventar o usar un símbolo para cada sonido, o vas a usar alguna otra manera?

Si querés un símbolo para cada sonido, probablemente vayas a tener que usar símbolos que no son letras (como ' @ ? !) o recurrir a marcas diacríticas, es decir


modificar letras usando pequeños signos encima (o debajo) de ellas. Los acentos y diéresis sobre las vocales son marcas diacríticas: á è î ÿ. El español muestra alguna 
de sus vocales acentuadas con un acento agudo: acá éramos ínfimos órganos súbitos, y escribe el sonido nasal palatal como ñ. El inglés, por otra parte, no usa 
diacríticos (pero su ortografía es impredecible y atroz). El francés usa acentos para mostrar que una e debe pronunciarse, y por tradición, en muchas palabras: été âme 
à mère; y tiene una letra ç (cedilla) para representar /s/ antes de a, o, u. El portugués muestra las vocales nasales con una tilde(~) sobre ellas (como en são). De
hecho, esta tilde es del mismo origen que la que va sobre ñ; se trata de una N estirada y estilizada por el uso. El alemán escribe las versiones frontales de las vocales 
con una diéresis (ä ö ü). El danés escribe una especie de a redondeada con å, y una o frontal con ø. Muchos lenguajes tienen letras no estándar para ciertos sonidos, y 
a menos que hablés uno de ellos y tu teclado esté configurado para ellos, no vas a poder acceder a ellas fácilmente al escribir tu lenguaje en tu computadora.

Si no querés tantos símbolos extraños, probablemente vas a tener que usar dos o más símbolos (formando símbolos compuestos) para representar algunos sonidos, tal 
como el español usa rr y ch para sonidos individuales. Éstos se llaman digrafos (los trigrafos, aunque posibles, deberían evitarse por su longitud). La letra h es
generalmente útil para hacer digrafos. Pero hay que tener en cuenta algo: dos símbolos nunca deberían usarse para hacer un digrafo si pueden aparecer solos para 
representar dos sonidos distintos. El español puede usar ch porque h no tiene sonido asignado y ch no se usa nunca para el mismo sonido que c (de los dos que tiene);
podemos escribir ll porque no hay combinaciones /ll/ en nuestra fonología. En cambio, no podríamos usar ls para representar una fricativa lateral, porque ls
representa dos sonidos, /l/ + /s/.

La transliteración no tiene reglas sobre cuáles símbolos hay que usar para representar tal sonido, pero tendrías que tratar de hacer legible el lenguaje: está bien usar zh
para representar /f/, pero la mayoría de la gente seguramente leerá algo completamente distinto de /f/ cuando se encuentren con este digrafo, y además, ya tenemos 
un símbolo más familiar, f , para llenar este espacio, ¿verdad?

La transliteración debería ser tan fonémica como sea posible. El español y el italiano son bastante fonémicos, y en cuanto al español en particular, es muy importante el 
hecho de que se puede leer una palabra y saber siempre cómo se va a pronunciar. Por el contrario, el inglés tiene una ortografía arcaica, donde las palabras se 
escriben como sonaban hace siglos, aunque en cierta medida se puede adivinar el sonido de muchas. Lo mismo o peor se puede decir del francés (Ferdinand de 
Saussure cita como ejemplo la palabra oiseau, que se pronuncia /wa'zo/, de manera que no hay un solo sonido que se corresponda con una letra 'apropiada'). El
tibetano escrito es aún peor; el lenguaje escrito ha permanecido casi incambiado desde el siglo VII d. C. En cambio, otros lenguajes (como el ruso) son muy 
consistentes en cuanto a la concordancia entre lo escrito y lo fonético.

Desde luego puede haber utilidad en utilizar una ortografía arcaica. El inglés tiene muchos dialectos, y si se intentara representarlo fonéticamente sin ambigüedad, se 
lograría una representación adecuada para algunos pocos dialectos pero incorrecta para otros; así, la forma escrita permite una intercomunicación entre los dialectos 
(cada uno de los cuales pronuncia distinta una misma palabra escrita). Lo mismo vale para el tibetano, que además es una lengua sagrada (en la que están transcriptas 
antiquísimas escrituras), por lo cual es interesante y útil conocer la etimología y forma precisa de las palabras antiguas, preservada en la ortografía. Cualquiera de estos 
motivos, y otros, pueden utilizarse para "justificar" ficcionalmente una ortografía a primera vista complicada y contraintuitiva para un lenguaje construido, si su creador 
tiene ganas de hacerlo.

Alfabetos y otras escrituras

Un alfabeto es una colección de símbolos que representan sonidos. Si querés poder inventar uno para tu lenguaje. Si lo hacés, y tu ortografía romanizada es fonémica, 
tu alfabeto debería serlo también: un símbolo para cada sonido. También podés usar digrafos y añadir diacríticos. Si tu lenguaje deriva de otro lenguaje para el cual ya 
tenías un alfabeto, probablemente el lenguaje más joven use el alfabeto viejo, pero algunas letras habrán cambiado de sonido. Por ejemplo, el español usa el alfabeto 
latino, pero la letra c (que en latín era siempre /k/) ahora representa /s/ frente a e, i. Esto no es fonémico, pero es completamente regular.

Al inventar letras, jugá un poco con ellas y escribílas rápidamente una después de otra. La gente en la mayoría de los casos escribe sin cuidado, y las letras muy 
elaboradas probablemente serán simplificadas. También tenés que tratar de hacer que cada letra se distinga bien de las otras, para que no se las confunda. El punto 
sobre la i apareció cuando el palito de la i minúscula comenzó a confundirse con las líneas verticales de las m y n en la escritura gótica. Algunas fuentes de 
computadoras y los programadores distinguen 0 (cero) y O (la letra o mayúscula) escribiendo una barra sobre el cero.

Tenés que decidir también cómo vas a escribir y leer. ¿Será de izquierda a derecha, como en el alfabeto latino y el cirílico? El hebreo y el árabe se escriben de derecha 
a izquierda, y las vocales no se escriben excepto en los libros para niños y (el árabe) en el Corán. El japonés se escribe tradicionalmente (en novelas y manga) de
arriba a abajo y de derecha a izquierda, pero en ciertos libros (de texto, como los de matemáticas) se escribe a la manera occidental, en líneas de izquierda a derecha. 
Los japoneses leen intercambiablemente en un sentido u otro.

Ideogramas, silabarios, etc.

Los alfabetos no son la única manera de escribir. El chino usa ideogramas, o caracteres que solían representar un dibujo de un objeto. Cada carácter se lee como una 
sílaba; pero palabras que suenan igual y no tienen relación se escriben como caracteres distintos. Los caracteres chinos (hanzi) tienen cada uno dos partes, el radical
y la fonética. El radical da una idea del significado, y la fonética daban una idea del sonido (caracteres con la misma fonética representaban sílabas que rimaban, hace 
milenios). Un radical puede actuar a veces como fonética y viceversa. Muchas veces la relación entre el significado original y el actual es sumamente tortuosa, o su 
sentido se ha perdido en el tiempo.

El japonés usa un sistema mixto de kanji (ideogramas, tomados de los chinos) y kana (caracteres silábicos fonéticos). En general, el contenido principal de lo que uno 


dice (las raíces de las palabras) se escribe en kanji, mientras que las partículas, conjugaciones y terminaciones se escriben en kana. Hay unos 90 kana divididos en
dos conjuntos equivalentes (hiragana y katakana). Se usan normalmente hiragana para las palabras japonesas originales; se prefieren katakana para las palabras
prestadas o inventadas, y también para añadir énfasis, como la cursiva en el alfabeto latino. Cuando se usa un kanji inusual, se puede clarificar escribiéndolo 
fonéticamente en hiragana (que se llaman en este caso furigana). En un kana se puede cambiar la calidad de la consonante usando algunas marcas diacríticas. Hay 
1945 kanji estándar, de los cuales 1006 se enseñan en la escuela primaria, y cada kanji se puede leer de acuerdo a su pronunciación japonesa (kun-yomi ) o a su
pronunciación china original (on-yomi ). Como si no fuese complicado ya, cada kanji suele tener varias lecturas para cada forma.

El coreano usa un alfabeto llamado hangul que es un código característico (featural code ), un sistema en el cual sonidos similares se representan con símbolos 
parecidos. La tradición dice que fue inventado por un rey. En cualquier caso, requiere un notable análisis fonético. En hangul, los símbolos se agrupan en sílabas, 
haciendo que la escritura parezca como si consistiese de muchos ideogramas o caracteres silábicos, el cual no es el caso.

El árabe usa una escritura cursiva, lo cual es raro porque la mayoría de los pueblos históricamente han comenzado con letras de bloque aisladas, debido a la 
naturaleza del soporte material de su escritura (piedra, arcilla o madera). El árabe, imagino, comenzó desde el principio a ser escrito con pinceles finos sobre alguna 
superficie lisa; las letras cursivas son completamente inadecuadas para esculpirlas rápidamente en piedra o arcilla. En árabe y en hebreo no se escriben las vocales 
(excepto las vocales largas en árabe), sino sólo las consonantes, debiéndose interpolar las vocales según el contexto; este tipo de sistema se llama abjad.

El tailandés, aunque de raíces monosilábicas, usa un alfabeto fonético de letras únicas, que frecuentemente tienen pequeños bucles y torceduras en los extremos. 
Algunas otras escrituras de pueblos de ese área geográfica también usan este tipo de caracteres que parecen un poco demasiado elaboradas. La razón es que fueron 
pensados para escribirse usando materiales que requerían que las líneas fueran 'cerradas' de alguna forma.

Muchas lenguas de la India se escriben con un silabario llamado devanagari, el cual funciona así: el símbolo básico representa una sílaba con la vocal a (pa, ta, sa, ra,
etc.). Por medio de signos diacríticos se puede cambiar la vocal por otra. Si se requiere la consonante sola, se utiliza otro signo diacrítico, el "matavocales", que se 
llama virama. El sistema base, con signos que implican una "vocal inherente", lleva el nombre genérico de abugida.

Todo esto se reduce a un principio: para inventar un alfabeto, tenés que saber sobre qué se va a escribir y por qué medios.

Inventar un alfabeto es simple, pero un silabario (o ideogramas) puede ser un dolor de cabeza, así que tendrías que meditarlo cuidadosamente antes. Los ideogramas 
son probablemente la peor forma de escritura (en términos de practicidad), y probablemente no deberías usarlos a menos que tengas memoria fotográfica. Los 
silabarios están muy bien, pero funcionan mejor en lenguajes muy restringidos; el español, por ejemplo, tiene un número bastante grande de sílabas posibles, e inventar 
un signo para cada una sería casi imposible.

Si te parece, echále una mirada a algunas escrituras de lenguajes naturales en Ancient Scripts [en inglés], una página con ejemplos de todo el mundo.

El orden del sistema de escritura

Estamos acostumbrados a tener las letras en orden. Esto es muy útil para diccionarios y guías de abonados telefónicos, y para los índices en generales. ¿Cómo vas a 
ordenar tus símbolos?

Los alfabetos occidentales derivados del alfabeto latino usualmente siguen un orden predecible. El inglés, que es probablemente el más reducido y simple de todos, usa 
un conjunto pequeño de símbolos, y los digrafos no se consideran símbolos independientes; pero esto no es así en otros lenguajes. Por ejemplo:
l El alfabeto español consiste de todas las letras del alfabeto inglés (que conocemos por ser el set estándar ASCII), más las siguientes: ch (después de c), ll
(después de l), y ñ (después n). Así que una palabra como chico no se encuentra en la sección de la C. ¿Tu lenguaje usa un derivado del alfabeto latino? ¿Qué 
símbolos extra usa, y cuáles tienen lugar propio en el alfabeto? 
l El finés pone las vocales con Umlaut ä y ö después de la y .
l En holandés, el digrafo ij todavía se considera a veces un símbolo independiente (¡las máquinas de escribir antiguas tienen una tecla para él!). 
l En sueco, la v y la w se consideran dos versiones de la misma letra, así que ambas caen en la sección de la V en las listas alfabéticas. Esto causa grandes 
problemas dada la gran cantidad de palabras inglesas y alemanas con w que han sido tomadas por el sueco (el cual usa solamente v para palabras nativas).

Algunos otros lenguajes, que usan escrituras no latinas, ordenan sus caracteres de forma distinta. Algunos usan las características fonéticas de los sonidos para ordenar 
las letras; por ejemplo, primero los labiales (p, b, m, f ), luego los alveolares (t, d, n, s) y así.

En cuanto a los silabarios, también hay generalmente un orden fijo. En japonés, ambos tipos de kana se disponen así: primero las vocales, a i u e o, luego las sílabas 
que comienzan con k (ka, ki, ku, ke, ko), luego t-, n-, h-, m-, y -, r-, w-, y finalmente el símbolo para la n silábica. Otro orden, más tradicional, se usaba en tiempos 
antiguos (y todavía se usa en índices y tablas, por oposición al moderno, que se usa en diccionarios). Este orden sigue el de un poema del monje budista Kuukai, que 
usa cada carácter hiragana exactamente una vez:

Iro ha nihohe to
chirinuru wo
waka yo tare so.
Tsune naramu
uwi no okuyama
kefu koete
asaki yume
mishi wehi mo sesu.

(Nota: esto probablemente no es japonés moderno correcto, ni ésta es la pronunciación correcta. El kana de ha, donde aparece aquí, se pronuncia wa, y los de wi y


we son obsoletos. El de wo se pronuncia o.)

En cuanto a los ideogramas, los kanji japoneses (y los hanzi chinos) se ordenan por número de radical y, dentro del mismo radical, por el número de trazos que se 


usan para escribirlos (hay un método para contarlos apropiadamente).

Sería una buena idea tener letras con nombres que signifiquen algo, o que puedan ser recitadas en orden. Las letras latinas tienen nombres sin sentido en todos los 
lenguajes que las usan, y esos nombres son muy similares entre sí; de ahí la necesidad de códigos como 'Alpha, Bravo, Charlie'... Otros lenguajes y escrituras no tienen 
este problema.

Gramática
En esta sección tomaré algunos temas gramaticales y los desarrollaré, mostrando con ejemplos, cuando sea posible, cómo los manejan lenguajes naturales, y qué 
podés hacer sobre ellos. No se puede tener un lenguaje sin gramática; si no pensás en eso, seguramente vas a terminar copiando la estructura de tu propio lenguaje, y 
todo no va a pasar de un ejercicio de traducción de palabras sueltas.

Tipología morfológica

La categorización clásica divide a las lenguas en inflexivas, aglutinantes, y aislantes. Esta categorización se ha probado muy limitada, pero la voy a explicar porque 


es un buen comienzo para entender las diferencias.

Inflexión

Un lenguaje inflexivo usa inflexiones, las cuales son afijos usados, por ejemplo, para conjugar verbos, declinar sustantivos y otras cosas. Algunos lenguajes usan
sufijos para esto, mientras que otros usan prefijos o incluso infijos. Algunos ejemplos del español son la -s usada para pluralizar sustantivos, y las terminaciones -aba, -
abas, -ábamos del tiempo pasado de los verbos.

Otro tipo de inflexión (más 'puro', si es posible) es el cambio de las raíces de las palabras. Por ejemplo, la inflexión de los verbos ingleses como sing, pasado sang,


participio sung, que son inflexiones de un concepto radical abstracto sing. La inflexión por cambio vocálico es bastante común en ciertas lenguas. El cambio 
consonántico también existe, pero es más raro. También en inglés hay ejemplos: pares como breath /brET/ 'aliento' vs. breathe /briD/ 'respirar' (donde /T/
cambia de sorda a sonora /D/, además de alternarse la vocal), house 'casa' vs. house 'albergar' (cambia /s/ por /z/).

La inflexión incluye también el cambio de tono, de acento, de altura o longitud de una vocal, o repetir una parte de la raíz. Lo principal es que una inflexión puede tener 
más de un significado al mismo tiempo. Por ejemplo, en español, la -í de viví es una inflexión que une tiempo pretérito indefinido, primera persona del singular, modo 
indicativo. Ejemplos de lenguajes inflexivos son el inglés, el español, el alemán, el latín, el griego, y en general todos los lenguajes indoeuropeos.

Aglutinación

Un lenguaje aglutinante usa afijos cuyo significado es único, y que se concatenan uno después del otro sin fundirse. Algunos lenguajes aglutinantes conocidos son el 
quechua y muchos otros lenguajes nativos americanos, el turco, el finés, y el húngaro. Por ejemplo, en la palabra quechua wasikunapi 'en las casas', el sufijo de plural -
kuna está separado del caso locativo -pi . En finés, huoneissansakaan significa '(ni) siquiera en sus habitaciones', y consiste de cinco morfemas aglutinados,
'habitación-es-en-sus-siquiera'.

Aislación

Un lenguaje aislante no usa afijos ni modificaciones de la raíz. Cada palabra es invariable, y los significados se modifican insertando palabras adicionales, o se 
entienden por contexto. El más conocido ejemplo de lenguaje aislante es el chino. En chino (mandarín), un sustantivo por sí mismo no es singular ni plural, y un verbo 
no tiene tiempo ni persona; estas distinciones se hacen (cuando hace falta) añadiendo cuantificadores, adverbios o pronombres. En efecto se dice 'libros' diciendo algo 
parecido a 'varios libro'.
Análisis y síntesis

La clasificación moderna de las gramáticas es una escala continua que va desde analítico a sintético. Cuanto más analítico un lenguaje, menos significado tienen las 
palabras por sí solas, y más importante es el contexto. Cuando más sintético es un lenguaje, más autocontenidas son las palabras. Los lenguajes más analíticos 
dependen del contexto y del orden de las palabras para expresar significados, mientras que los sintéticos tienden a declinar (añadir inflexiones a) las palabras.

Esta escala se toma como referencia; no hay puntos extremos, pero se pueden comparar dos lenguajes y decir que uno es más sintético que el otro. El chino mandarín 
es muy analítico; una palabra china sola puede significar muchas cosas, porque no se hacen distinciones en ella: no se sabe si es un verbo, un sustantivo o un adjetivo, o 
si es pasado o futuro, o plural, o singular, o nada, solamente se tiene el concepto raíz. Algunos lenguajes nativos americanos como el nootka o el chinook son el otro 
extremo, tan sintéticos que de hecho se los llama polisintéticos, y declinan de tal forma las palabras que una sola puede significar 'los muchos pequeños fuegos que 
estuvieron encendidos en la casa' (esto no lo estoy inventando; la palabra es inikwihl'minih'isit, y de hecho ni siquiera es un verbo o sustantivo aún; necesita prefijos 
nominales o verbales...). En el medio tenemos el japonés (bastante analítico excepto en los verbos), el inglés (muy analítico, ya que apenas distingue caso en los 
sustantivos o persona en los verbos), el español, el francés, el italiano, el alemán (ya con muchas inflexiones) y todos los lenguajes aglutinantes, que son de hecho un 
subconjunto de los inflexivos; el latín, el griego, el sánscrito...

Así que vas a tener que elegir un punto en la escala y quedarte allí. Ésta es probablemente la más importante decisión del proceso. Cada tipo de gramática tiene sus 
pros y sus contras.

l Un lenguaje aislante evita mucho trabajo en asuntos difíciles como decidir cómo pluralizar sustantivos y conjugar verbos. Pero requiere que planees un orden 
de palabras rígido y que lo respetes a toda costa, después de asegurarte de que no conduce a ambigüedades (serias). Y un lenguaje totalmente aislante es difícil 
de crear, ya que hay que eliminar todo rastro de inflexión, aun aquellos de los que nunca sospecharías. 
l Un lenguaje aglutinante implica un cuidadoso plan de afijos (docenas de ellos) que deben tener significados únicos. También tenés que decidir en qué orden 
aparecerán después o antes de una raíz. Finalmente, los lenguajes aglutinantes pueden producir palabras muy largas, o que son muy difíciles de pronunciar 
(considerá el georgiano, donde muchos afijos están formados por sólo una o dos consonantes; a veces tienen que unirse a otros afijos del mismo tipo, y terminás 
teniendo hasta seis consonantes seguidas).
l Un lenguaje inflexivo produce palabras más cortas y oraciones compactas (cuanto más inflexivo, más compactas), pero requiere que planees todas las 
inflexiones y combinaciones de significados, porque a veces no vas a poder colocar dos o más seguidas (aglutinadas). Se puede tener una inflexión mínima 
(como la del inglés) o producir un lenguaje polisintético que declina las palabras para casi cualquier propósito concebible. Cuanto más inflexivo es un lenguaje, 
más vas a tener que tener cuidado con la concordancia (el acuerdo entre adjetivos y sustantivos, y entre sustantivos y verbos). 

La clasificación de Sapir

Hay otra clasificación de lenguajes, que es mucho más compleja, y fue creada por Edward Sapir en los años 1920. Divide los conceptos en cuatro clases:

Grupo I. Conceptos básicos (concretos) (objetos, acciones, cualidades): expresados normalmente mediante palabras o elementos radicales independientes; no
denotan ninguna relación propiamente dicha.

Grupo II. Conceptos derivativos (por lo general menos concretos que el grupo I, pero más concretos que el grupo III): expresados normalmente mediante la 


afijación de elementos no radicales a los elementos radicales, o mediante una modificación interna de estos últimos; difieren del grupo I porque denotan ideas que no 
interesan al conjunto de la proposición u oración, pero que dan a un elemento radical un incremento particular de significación y que, de ese modo, están íntimamente 
relacionadas, de una manera concreta, con los conceptos del grupo I. Por ejemplo, los prefijos pre -, in-, des- y los sufijos -mente, -ito.

Grupo III. Conceptos concretos de relación (más abstractos aún, pero no totalmente desprovistos de un matiz concreto): expresados normalmente mediante la 
afijación de elementos no radicales a los elementos radicales, pero, por lo común, de manera menos íntima que los elementos del grupo II, o mediante una modificación 
interna de los elementos radicales; difieren fundamentalmente del grupo II porque indican o dan a entender relaciones que trascienden la palabra particular a la cual van
adheridos de manera inmediata. Por ejemplo, la -s del plural de los sustantivos.

Grupo IV. Conceptos puros de relación (totalmente abstractos): expresados normalmente mediante la afijación de elementos no radicales a los elementos radicales 
(y en tal caso estos conceptos suelen entremezclarse con los del grupo III), o por su modificación interna, o por palabras independientes, o por la posición en la frase; 
sirven para relacionar entre sí los elementos concretos de la proposición, dándoles así una forma sintáctica definida. Por ejemplo, las modificaciones de le, la, te de él, 
ella, tú que indican caso acusativo; las preposiciones a, para; la posición de "el perro" en "Veo al perro" indicando que es el objeto del verbo, etc.

La clasificación de los lenguajes con respecto a estas clases es como sigue:

Tipo A. Lenguajes que sólo expresan conceptos de los grupos I y IV, de manera que no tienen medios para modificar el significado de un elemento radical (o raíz) por 
medio de afijos o cambios internos. Por ejemplo, el chino.

Tipo B. Lenguajes que expresan conceptos de los grupos I, II y IV, preservando las relaciones sintácticas en forma pura (fuera de la palabra) y capaces de modificar 
el significado de las raíces por afijación o cambio interno.

Tipo C. Lenguajes que expresan conceptos de los grupos I y III, es decir, en los cuales las relaciones sintácticas se expresan en conexión necesaria con conceptos no 
totalmente desprovistos de significado concreto, pero que, si se prescinde de esa mezcla, no tienen la facultad de cambiar el sentido de sus elementos radicales por
medio de afijos o de cambios internos. [El grupo III absorbe al grupo IV.]

Tipo D. Lenguajes que expresan conceptos de los grupos I, II y III, es decir donde las relaciones sintácticas se expresan de forma mezclada, como en el tipo C, y que 
también pueden modificar el significado de los elementos radicales por afijación o cambio interno. A este grupo pertenecen la mayoría de los lenguajes inflexivos con 
los que estamos familiarizados, como así también muchos de los aglutinantes.

Cada uno de los tipos A, B, C, D se puede subdividir en aglutinante, fusional y simbólico. Aglutinante significa que las cosas añadidas a la raíz están simplemente 


yuxtapuestas (puestas juntas); fusional significa que a veces se funden; simbólica implica, aproximadamente, cambio interno de la raíz. El tipo A también tiene un 
subtipo aislante.

El método (aglutinante, fusional o simbólico) de un cierto grupo de conceptos no tiene por qué ser igual al método de un grupo diferente. La clasificación usa un 
término compuesto, la primera parte del cual se refiere al método para los conceptos de grupo II, y la segunda a los conceptos de los grupos III y IV. Estos métodos 
no están solos; el inglés, por ejemplo, los usa todos (aunque algunos predominan y otros son marginales). Por ejemplo, goodness 'bondad' de good 'bueno' es
aglutinación; books 'libros' de book 'libro' es fusión regular, depth 'profundidad' de deep 'profundo' es fusión irregular, y geese 'gansos' de goose 'ganso' es fusión 
simbólica o simbolismo. El español no usa la fusión simbólica y prefiere fundamentalmente la fusión regular.

Todo esto conduce a una sola cosa: no tenés por qué esperar que todo esté en su lugar 'correcto' en tu lenguaje (es decir, en el mismo lugar que en español). El 
número en español (singular vs. plural) es un concepto del grupo III, bastante abstracto y que forma parte íntima de las palabras; no concebimos una palabra sin 
número. En tibetano, sin embargo, el número es una característica opcional y no está gramaticalizada como en español; no es una cosa abstracta que debe incluirse en 
la palabra, sino una cosa concreta, la idea de pluralidad: 'varios' o 'muchos' se expresa por una raíz que es una palabra separada y con todas las de la ley, un concepto 
del grupo I. No es parte obligatoria de la sintaxis y por lo tanto se omite cuando no se necesita.

Pensá mucho sobre esto. Después de colocar tu lenguaje en la escala, tenés que decidir qué clases de palabras vas a usar, y cómo se relacionarán unas con otras.

Sustantivos
Número

La distinción de número no está restringida a singular-plural; muchos lenguajes tienen formas especiales para pares de cosas (número dual) y algunos para grupos de 
tres (trial). Ciertos lenguajes tienen un número paucal (del latín paucum  'poco'), que se usa para plurales de pocos objetos (generalmente no más de diez), 
reservándose el plural simple para cantidades más grandes.

Podrías tener un singular que se refiere a un objeto realmente único, o plurales que distingan las cosas que se ven ('estas casas') o todas las cosas de ese tipo ('las 
casas' en general). Tu imaginación es el único límite.

Pero también podés dejar el número fuera del sistema. Esto es lo que hacen el japonés, el chino y la mayoría de las otras lenguas de Asia Oriental. En caso de 
necesidad, y si el contexto no es suficiente, se puede usar una partícula o adjetivo similar a 'varios' o 'muchos' para expresar la idea de pluralidad.

Si usás una inflexión para marcar el plural, no hace falta que sea un sufijo corto; puede ser relativamente largo (como el quechua -kuna) o puede ser un prefijo, o un


infijo, o aparecer como un cambio vocálico interno. Muchos lenguajes marcan el plural de ciertas clases de objetos por reduplicación, es decir repitiendo la palabra o 
su primera o última sílaba (en Bahasa Indonesia se dice baterei-baterei 'baterías'; en japonés, hitobito 'gente' como una reduplicación ligeramente modificada de hito
'persona').

Los plurales ingleses de palabras como man, goose, mouse (men, geese, mice) son ejemplos de cambio de una vocal por otra, conocido como gradación o 
alternancia vocálica. La misma resultó de un cambio fonético (Umlaut) originalmente condicionado por la presencia de un sufijo de plural, que se perdió más tarde.

Género

Género es el término común que designa al concepto general de clase (nominal). El género no tiene por qué ser una oposición masculino-femenino. El alemán, el griego 
y el latín tienen tres géneros: masculino, femenino y neutro. El swahili tiene clases nominales (géneros) distintas para animales, para seres humanos, para sustantivos 
abstractos, etc. Muchos lenguajes hacen una distinción de género entre objetos animados e inanimados (personas y animales vs. plantas y objetos no vivientes, o 
similar).

Las clases nominales pueden ser más o menos arbitrarias. En las lenguas indoeuropeas usualmente no hay relación entre el género y el objeto real (el género no tiene 
significado, es convencional). Aunque mesa en español es femenino, no sólo no tiene absolutamente nada de femenino, sino que tampoco tiene nada en común con 
otros sustantivos de género femenino, como comadreja o crisis... La distinción animado-inanimado tiende a ser menos arbitraria, pero siempre hay casos límite e 
idiosincracias culturales particulares (por ejemplo, algunos lenguajes pueden tomar fuego como sustantivo animado). En los casos en que hay muchas clases que tienen
contenido semántico (como en las lenguas bantúes), puede suceder que algunos sustantivos cambien de significado pero permanezcan en la misma clase, ahora 
'incorrecta' para ellos (supongamos que se tiene una clase nominal para objetos redondos o curvos, y la palabra arco pasa a significar 'rectángulo por donde debe 
pasar la pelota para marcar un gol en el fútbol', como en español...).

Caso

En un sentido estricto, un caso gramatical es una marca inflexiva de la función de un sustantivo en la oración. En un sentido más amplio, es el rol del sustantivo en la 
oración (marcado de la forma que sea). No hay un conjunto fijo de casos posibles; cada lenguaje distingue uno o más casos morfológicamente marcados y los usa 
para determinados propósitos. Sin embargo, algunos casos que presentan funciones comunes en muchos lenguajes reciben siempre el mismo nombre.

El latín tiene los siguientes casos, marcados por inflexiones: nominativo, acusativo, genitivo, ablativo, dativo, y vocativo. Un sustantivo está en caso nominativo cuando 
es el sujeto de una oración; acusativo, cuando es el objeto directo; dativo cuando es objeto indirecto; genitivo cuando es posesivo; ablativo cuando es parte de un 
complemento verbal; y vocativo cuando muestra una llamada. El español no tiene casos morfológicos (podemos hablar de casos sintácticos, marcados por orden de 
palabras y por preposiciones). El inglés tiene un caso genitivo marcado por la partícula 's. Ambos además distinguen entre formas sujeto y formas objeto de los 
pronombres (en español, yo vs. me, él vs. le, etc.). Tu lenguaje puede tener más casos; el estonio tiene 14, y el finés aún más (unos 18, creo). La mayoría de estos 
casos son locales (es decir, se refieren a posiciones y direcciones: en, sobre, debajo, alrededor, dentro, al lado, desde, hacia, etc.).

Algunos casos se usan luego de ciertas preposiciones (se dice que la preposición 'gobierna' el caso). Mi lenguaje Stālāg tiene un caso base o absoluto (usado para


sujetos y objetos, que son diferenciados además de otras maneras) y un caso oblicuo (que se usa como genitivo o compositivo/asociativo, y con todas las 
posposiciones).

Adjetivos
Con los adjetivos entramos en la tierra de las posibilidades. Podés elegir tener adjetivos (como clase de palabras separada), o no. Los adjetivos pueden ser una clase 
enteramente distinta de las otras, como en inglés; o pueden ser un subconjunto de los sustantivos (en morfología y costumbres), como en español o latín; o pueden 
comportarse como verbos (como en japonés). Examinemos estas alternativas.

Si son una clase completamente aparte, los adjetivos no tienen por qué comportarse como algo más; pueden tener sus propias reglas de inflexión, o no tener inflexión 
alguna. Los adjetivos del inglés son un ejemplo de esto: son palabras invariables, excepto (en los adjetivos cortos) por la forma comparativa y superlativa.
Si son como sustantivos, o un subconjunto de éstos, entonces se comportan como sustantivos. En español, donde los sustantivos tienen género y número, los adjetivos 
también los tienen, y deben concordar con su sustantivo. Muchas veces, gracias a esto, pueden transformarse en sustantivos sin cambiar; rojas puede ser tanto
adjetivo ('quiero rosas rojas') como sustantivo ('déme de las rojas') en cuanto a sintaxis y morfología. Curiosamente, algunos sustantivos pueden funcionar como 
adjetivos en el uso coloquial (por ejemplo, he escuchado muchas veces la frase ¡Es tan payaso!. En latín, los adjetivos concuerdan con su sustantivo modificado aún 
en caso gramatical.

En japonés, los adjetivos de una clase particular (adjetivos na) se comportan como sustantivos; se colocan antes del sustantivo que modifican, seguidos por na, que es
la forma relativa de la cópula 'ser'. Por ejemplo: kirei na kimono 'hermoso kimono' -- el adjetivo nominal (o sustantivo calificativo, como se lo llama también), kirei,
significa 'hermoso' o 'hermosura', y la frase podría traducirse como 'un kimono que es hermoso / que posee hermosura'. Se puede añadir tiempo a la expresión 
marcando el tiempo en la cópula: kirei datta kimono 'un kimono que era hermoso'.

Si los adjetivos son como verbos, se conjugan como tales. Otra clase de adjetivos japoneses (adjetivos i, porque todos terminan en -i) funcionan de esta manera; son
generalmente una especie de forma participial de los verbos, o bien una cláusula relativa de palabra única (las cláusulas relativas del japonés vienen antes de lo que 
modifican, al igual que adjetivos y demostrativos). Puede pensarse en los adjetivos japoneses como una combinación de un adjetivo en español + la cópula 'ser', 
aunque los adjetivos japoneses pueden tomar, y toman, la cópula a veces. Pero el tiempo sigue estando en el adjetivo, no en la cópula. Por ejemplo: Kakkoii desu 'Él 
es lindo' (forma cortés); Kakkoikatta desu 'Él era lindo'. Aquí kakkoi- es la raíz, mientras que -i es el sufijo para adjetivos en tiempo presente, -katta es para el
tiempo pasado, y desu es la forma cortés en tiempo presente de la cópula. Como se ve, el tiempo en esta clase va directamente en el adjetivo, no en la cópula, que 
puede omitirse a veces.

También puede ocurrir simplemente que los adjetivos no se diferencien para nada de los verbos, como ocurre en mi lenguaje draseléq. En él hay verbos que significan 
'ser grande', 'ser amarillo', e incluso 'ser cuatro'. Se dice 'un árbol alto' diciendo 'un árbol siendo-alto', donde 'siendo-alto' es el participio activo del verbo 'ser alto'. Se
puede decir 'el árbol es alto' usando 'el árbol' como sujeto del verbo 'ser alto', que se conjuga en tercera persona del singular. Lo mejor de esto es que se pueden 
fundir dos clases de palabras en una, y cualesquiera medios expresivos que se usen para una sirven para la otra. En draseléq, por ejemplo, se puede decir 'Nos 
hicimos cuatro (personas)' en una sola palabra. [Si tenés que saberlo: la palabra es tenenrrednüat, ten- reflexivo, en- causativo, rred(n)- 'cuatro', -(n)üat primera
persona plural exclusiva, tiempo pasado.]

Muchos adjetivos pueden no existir de ninguna forma (aunque todos los lenguajes tienen algunas palabras que actúan como adjetivos). Las ideas de calificación pueden 
expresar de otras maneras. El tibetano usa sustantivos abstractos en vez de adjetivos; no hay un adjetivo 'grande', pero sí un sustantivo 'magnitud, tamaño', y 'una 
habitación grande' se puede expresar como 'una habitación de magnitud'. Esto no es ridículo en español; 'un desastre de proporciones', que sigue una estructura similar, 
es una expresión conocida y común.

En algunos lenguajes, los adjetivos forman una clase cerrada; hay un cierto número (pequeño) de ellos, generalmente pares opuestos como 'grande/chico' y los colores) 
y no se pueden formar otros adjetivos.

Si tenés en tu lenguaje una clase morfológicamente separada para los adjetivos, deberías crear algunos afijos (u otros medios) para colorear su significado, para 
negarlos, y para transformarlos en otras clases de palabras. También tenés que pensar en comparativos y superlativos. No es obligación tenerlos, pero un lenguaje 
debería poder expresar ideas tales como la de que algo es más alto, o más rojo, o más feo, que alguna otra cosa. El español es analítico en este caso (usa la frase más
+ adjetivo). El inglés utiliza un sufijo comparativo y otro superlativo con los adjetivos cortos. El japonés utiliza una adposición para los comparativos, y marca los 
superlativos diciendo simplemente ichiban 'número uno, primero'.

Verbos
Persona y número

En muchos lenguajes, el verbo concuerda con uno de sus argumentos (una de las frases nominales de la oración); en los que marcan sujeto y objeto, generalmente el 
sujeto. Sin embargo, algunos lenguajes tienen doble concordancia (los verbos en húngaro, por ejemplo, concuerdan con el sujeto y con el objeto a la vez), y en ciertos 
casos hay concordancia polipersonal (como en vasco, donde los verbos ditransitivos llevan marcado el sujeto, el objeto directo y el objeto indirecto). En otros
lenguajes, el verbo concuerda con la frase nominal que esté un caso particular (el nominativo en lenguajes nominativo/acusativos, el absolutivo en los 
ergativo/absolutivos).

En más de un lenguaje no hay ninguna concordancia: el inglés apenas distingue la tercera persona del singular en presente de las demás; el chino y el japonés no marcan 
persona ni número en el verbo de ninguna forma.

Tiempo

El sistema de tiempos puede ser cualquier cosa desde una distinción binaria entre presente y no presente, hasta una estructura muy compleja. El único tiempo universal 
es el presente. Suele haber una distinción básica entre eventos pasados y no pasados, esta última englobando el presente y el futuro. Muchas lenguas no tienen un 
tiempo futuro marcado morfológicamente en el verbo. Por ejemplo, el inglés usa un auxiliar, will, que de hecho significa también 'querer' o 'tener la intención de', y el 
verbo queda en infinitivo. El español tiene un tiempo futuro que proviene de una fusión del infinitivo más formas de haber, habiendo perdido el futuro latino original
(perderé proviene de perder he , es decir he de perder), y va firmemente en camino de perder este tiempo futuro sintético, que está prácticamente obsoleto en el 
discurso coloquial (reemplazado por una perífrasis con ir a) y apenas se usa para expresar incertidumbre ("vendré mañana o pasado").

Se pueden tener varios tipos de presente, pasado o futuro. El español tiene dos pasados, el pretérito imperfecto (para acciones que ocurrieron en un período del 
pasado) y el indefinido (que muestra acciones terminadas, sin considerar su duración), aunque esta distinción es formalmente una de aspecto. Algunos lenguajes no 
usan marca de tiempo nunca, sino adverbios o frases adverbiales ('hoy', 'mañana', 'hace una semana') para marcarlo cuando haga falta.

Aspecto

Del sitio Invisible Lighthouse, de Richard Harrison (traducido libremente): "El aspecto se refiere a la constitución temporal interna de un evento, o la manera en que la 


acción verbal se distribuye a través del continuo espaciotemporal. El tiempo, en cambio, señala la ubicación de un evento en el continuo de eventos." En muchas 
descripciones de gramática tradicionales, el tiempo y el aspecto (al igual que el modo) se toman como una unidad; por ejemplo, lo que se llama 'pretérito indefinido' en 
español es en realidad un tiempo pasado junto con un aspecto perfectivo.

Los verbos pueden declinarse para mostrar que el énfasis es en el proceso (progresivo), o la acción en sí, o una acción habitual, o una acción repetida, o el comienza o 
fin de una acción, etc. Algunos lenguajes tienen docenas de estos aspectos. Un par interesante es la distinción entre estático y dinámico. Una forma estática describe 
un estado particular, mientras que una dinámica muestra un cambio de estado. Por ejemplo, en árabe, rukubun significa 'cabalgar' en forma estática, y 'montar' en su 
forma estática.

El japonés tiene un aspecto condicional, pudiendo declinar un verbo para transformarlo en cláusula condicional: nobasu 'extender' produce nobaseba 'si yo extiendo'.

Perfectividad

La perfectividad o compleción es un aspecto que depende de si la acción está completada (desde el punto de vista del que habla) o no. La acción completada se llama 
perfecta (por ejemplo 'He llegado') y la no completada imperfecta ('Estoy llegando').

Modo

El modo, por oposición al aspecto, se refiere más a la actitud del hablante que a la forma del evento en sí. Se refiere, por ejemplo, a si la acción es real y cierta 
(indicativo), o es dudosa o deseable (subjuntivo), o no sucede en realidad (negativo), etc. El modo indicativo es el más común y el menos marcado.

En español y otros lenguajes romances se usa el subjuntivo (entre otras cosas) para acciones hipotéticas y para expresiones de deseo.

El inglés no distingue entre indicativo y subjuntivo, y usa un auxiliar para negar el verbo. El japonés declina los verbos para negarlos (keru 'patear', keranai 'no


patear'), mientras que el finés utiliza un verbo auxiliar conjugado (ei) junto con una forma del verbo principal.

También está el modo imperativo, que se usa para dar órdenes o hacer pedidos. Estos modos, por supuesto, no son los únicos. Nenets, un lenguaje siberiano 
(urálico/samoyédico), tiene muchos modos (algunos son en realidad aspectos): indicativo, imperativo, hortativo ('dejáme hacer'), optativo ('que él haga'), conjuntivo ('él 
lo hará' [pedido]), necesitativo ('él debe'), interrogativo ('¿Lo hizo?'), probabilitativo ('quizá lo haga'), obligativo ('debería hacerlo'), aproximativo ('parece que hace'), 
superprobabilitivo ('probablemente lo haga'), hiperprobabilitivo ('seguramente lo ha hecho'), reputativo ('se supone que debe hacerlo'), habitivo ('acostumbra hacerlo').

Evidencialidad

Se refiere a cómo el hablante sabe lo que está diciendo. Puede ser por experiencia personal directa, o de oídas, o simplemente una idea que le parece probable. El 
quechua, el aymará y muchos otros lenguajes nativos americanos (y otros) distinguen estos aspectos con diferentes niveles de sutileza. También se los llama 'niveles de 
experiencia', y Umberto Eco llama al sistema del aymará 'lógica trivalente' (es decir, no basada en nuestra lógica binaria 'verdadero' contra 'falso', sino con niveles 
intermedios).

Estructura argumental

Los argumentos de un verbo son las partes de la oración (generalmente frases nominales) que éste une y que están en relación gramatical cercana con él. En general 
esto significa el sujeto y (si están presentes) el objeto directo y quizá un objeto indirecto.

El número de argumentos de un verbo se llama valencia (por analogía con la valencia de los elementos químicos, que es la cantidad de átomos de otros elementos que 
se pueden enlazar a un átomo del elemento dado).

Valencia Tipo de verbo Ejemplo


0 impersonal "Llueve."
1 intransitivo "Él corre."
2 transitivo "Ella comió lechuga."
3 ditransitivo "Les dimos regalos."

En inglés y francés, por dar un ejemplo, todos los verbos deben tener algo que ocupe el lugar de un sujeto, aun en el caso de verbos como 'llover', así que 'llueve' en 
francés se dice il pluie, y en inglés it rains; es decir, la valencia mínima de un verbo es 1 y se usa como sujeto un pronombre que no designa nada en realidad.

La mayoría de los lenguajes no distinguen entre verbos transitivos e intransitivos con inflexiones en el verbo (morfológicamente), pero por ejemplo el húngaro tiene 
diferentes conjuntos de inflexiones de persona/número (paradigmas) para los verbos transitivos y para los intransitivos.

Las formas reflexivas son un caso especial. Algunos lenguajes las marcan en el verbo, mientras que otros pueden usar pronombres reflexivos (el español utiliza los 
pronombres objeto como reflexivos cuando es necesario, a veces con el añadido de mismo).

En algunos lenguajes, además, los pronombres objeto (y/o los sujetos) son incorporados en el verbo (el español añade los pronombres clíticos de objeto a los verbos, 
aunque esto no es inflexión).

Algunos lenguajes son más rígidos que otros con respecto a la estructura argumental de los verbos. Por ejemplos, puede exigirse que los verbos transitivos lleven 
siempre un sujeto explícito. Compárese esto con la libertad del español, y en mayor medida, del inglés, donde muchos verbos transitivos pueden aparecer sin objeto 
('comer', 'escribir', etc.). En inglés, además, muchos verbos son intercambiablemente intransitivos o transitivos/reflexivos (burn 'quemar algo' o 'quemarse', stand up
'dejar plantado' o 'pararse').

Voz

El concepto de voz se puede entender desde dos puntos de vista: el sintáctico y el semántico. El punto de vista semántico se refiere a lo que representa la voz para el 
significado del verbo y la oración. En español, por ejemplo, uno puede enfocar la acción en el sujeto (voz activa) o en el objeto (voz pasiva). Un perro me mordió es
voz activa (focalizada en un perro), mientras que Fui mordido por un perro es voz pasiva (focalizada en el sujeto tácito yo ).

Desde el punto de vista sintáctica, la voz cambia la forma en que se estructuran el sujeto y el objeto (los argumentos). Así, el cambio de voz es una operación 
gramatical que desplaza argumentos de su lugar original y puede incrementar o disminuir la valencia del verbo. En las construcciones de voz pasiva en español, el 
objeto original se transforma en sujeto (es promovido), mientras que el sujeto original se transforma en complemento opcional (es degradado).

El español, el inglés y otros lenguajes usan una construcción perifrástica con el verbo ser y un participio verbal (y por lo tanto no tienen distinción morfológica de voz 
verbal, aunque sí distinción sintáctica). Los verbos latinos, por otra parte, se pueden declinar para cambiar de voz: curare 'curar', curantur 'son curados'.

Activa y pasiva no son las únicas distinciones de voz. El griego tenía una voz media, que sugería una acción realizada por el sujeto en beneficio propio. Desde el punto 
de vista semántico, las construcciones seudorreflexivas del español tienen un valor de voz media (o mediopasiva): La carne se vende bien, Me voy, Lávese las 
manos, son todos ejemplos.

Aparte de estas, hay voces más difíciles de definir desde lo semántico, pero que pueden entenderse sin dificultad como dispositivos sintácticos. Por ejemplo, muchos 
lenguajes ergativo/absolutivos tienen una voz antipasiva, la cual transforma un verbo transitivo en uno intransitivo ('Yo como carne' se hace 'Yo como'). En estos
lenguajes, esto también significa que el sujeto es degradado de ergativo a absolutivo, aunque esto no se hace evidente en la traducción; esto sugiere un cambio de 
significado, del de acción (ergativo = agente activo) al de estado (absolutivo = paciente pasivo).

En Stālāg, uno de mis lenguajes, hay una voz aplicativa que promueve un complemento oblicuo opcional a la posición de objeto, con una marca especial en el verbo 
que muestra la función general del complemento original (¿se refería a una posición, un destino, una fuente?). Por ejemplo, 'él nada bajo el bote' se transforma en 'él 
*sub-nada el bote'. En Stālāg hay también una especie de voz antipasiva que actúa sobre verbos intransitivos con complementos, promoviendo un complemento a la 
posición de sujeto y degradando el sujeto original: 'el gato duerme sobre la alfombra' se transforma en 'la alfombra *sobre-duerme al gato'.

Deferencia

Muestra el grado de deferencia (o necesidad de cortesía) entre el hablante y el oyente. En ciertos lenguajes, hay formas diferentes de verbos y pronombres para hablar 
a un subordinado, a un igual y a un superior. Los verbos japoneses se declinan para mostrar cortesía: hanasu 'hablar', en forma cortés hanashimasu. El japonés tiene 
otras formas más y menos formales y corteses para dirigirse a otras personas según su sexo y posición social, en distintas ocasiones.

Rarezas

Algunos verbos muy comunes en español no se encuentran en otros lenguajes, como 'tener'. Muchos lenguajes reemplazan 'Yo tengo un libro' por perífrasis como 'Un 
libro es a mí', o 'conmigo', o 'junto a mí', o algo similar. En el caso de 'tener', además, hay lenguajes que distinguen (verbos y pronombres) entre posesión alienable o 
accidental (que no es inherente al objeto), como 'mi libro', y posesión inalienable (que es parte de la esencia del objeto y no puede cambiar), como 'mi carácter' o 'mi 
padre'.

Algunos verbos pueden ser usados como palabras gramaticales más allá de su estado original. Por ejemplo, en khmer se usa el verbo 'dar' como equivalente del 
significado de la preposición 'a' o 'para', para marcar objetos indirectos. Y en ainu, las formas conjugadas del verbo 'tener' se usan como marcas posesivas. Por 
ejemplo:

kukor kunupe kunukar rusuy


1s.tener 1s.hermano 1s.ver querer
'Quiero ver a mi hermano'

(nótese que el prefijo de primera persona singular, 1s, se coloca ante verbos y sustantivos). Dado esto, no es imposible pensar en un lenguaje donde los pronombres
posesivos no existen, ni se forman a partir de los pronombres personales, sino que son cláusulas subordinadas consistentes en formas conjugadas del verbo 'tener' (en 
vez de 'mi hermano', digo 'el hermano que tengo').

En japonés, los verbos se usan a veces en lugar de adjetivos, aprovechando el hecho de que las cláusulas subordinadas se colocan antes que el sustantivo modificado 
(igual que los adjetivos). Por ejemplo: sabitsuita kokoro 'corazón oxidado' (sabitsuita 'se oxidó'), takanaru mirai 'futuro exaltado' (takanaru 'sube, se eleva').

Conjunciones
Las conjunciones son palabras que juntan partes de la oración. Algunas conjunciones comunes en español son y, o, si, pero, etc. Se pueden incluir algunas
distinciones en las conjunciones que no están presentes en español; por ejemplo, la diferencia entre o inclusivo y exclusivo (lo que en lógica de Boole se expresa 
como OR y XOR). En latín, se puede decir vel X vel Y ('X o Y' inclusivo, o sea uno u otro o los dos') o bien aut X aut Y ('X o Y' de forma excluyente, o sea uno u
otro, pero no los dos al mismo tiempo). Las conjunciones pueden a veces transformarse en otras cosas; por ejemplo, en latín, además de et 'y', se puede usar una
partícula pospuesta, -que, para unir dos sustantivos: Senatus Populusque Romae 'el Senado y el Pueblo de Roma'. Algunos lenguajes no tienen conjunciones;
simplemente ponen las cosas juntas. 'X Y' (quizá con una pausa intermedia) puede significar 'X e Y' o también 'X o Y' (dependiendo de otros factores, como el 
contexto y la entonación). También se pueden usar casos gramaticales para unir cosas, por ejemplo diciendo 'X junto-con-Y' en vez de 'X e Y', si el significado 'junto
con' se expresa con un caso (típicamente llamado comitativo). O se pueden reemplazar las conjunciones por adverbios o frases adverbiales: 'Traté pero no pude' se 
transformaría en 'Traté, sin embargo no pude'.

Artículos
¿Tiene artículos tu lenguaje? El español tiene indefinidos (un, una, unos, unas) y definidos (el, la, los, las), que deben concordar en género y número con los 
sustantivos. El inglés tiene sólo dos artículos, a y the, y no tiene artículo indefinido plural, ni concordancia. En griego, los artículos no sólo deben concordar en número 
y género (femenino, masculino o neutro) sino también en caso, con sus sustantivos. Los lenguajes escandinavos colocan los artículos al final de las palabras, en vez de 
al principio (por ejemplo, en sueco, en bok 'un libro', boken 'el libro', böcker 'unos libros', böckerna 'los libros'). Muchos lenguajes no tienen artículos.

En la mayoría de los casos, se pueden parafrasear los artículos usando adjetivos, cuantificadores (como algunos, todos) o demostrativos (este, ese, aquel). Los


artículos frecuentemente no llevan acentuación y se unen al comienzo de las palabras siguientes (son clíticos), quizás elidiendo vocales o causando otros cambios. En 
francés, se dice la voiture 'el automóvil' pero l'avion 'el avión'. En italiano y portugués, los artículos se funden con cualquier partícula (generalmente preposiciones) 
que se ponga en su camino. En otros lenguajes, como el galés o el hebreo, el artículo provoca mutación de los sonidos iniciales de los sustantivos (en galés, lenición; en 
hebreo, geminación). En árabe el artículo se asimila parcialmente a la consonante inicial de ciertos sustantivos.

Adposiciones y partículas
Las partículas son pequeñas palabras invariables que modifican el significado de otras, o de la oración. Entre ellas encontramos las adposiciones (preposiciones y 
postposiciones), que son usadas por la mayoría de las lenguas para modificar el significado de frases nominales y crear complementos (de lugar, tiempo, manera, etc.).
Hay partículas que tienen un rango más amplio de funciones, como las muchas partículas del japonés, algunas de las cuales funcionan como marcas de caso 
postposicionales, otra como parte de frases adverbiales, y otras para añadir matices semánticos a la oración entera. Por ejemplo, watashi no 'mi' usa la partícula 
genitiva no para marcar watashi 'yo'; la partícula wa marca un nuevo tópico o tema de la oración, que se omitirá (dándose por entendido) en lo sucesivo. Hay incluso 
una partícula exclamativa, yo , que añade fuerza a las afirmaciones (como un signo de admiración), y una partícula interrogativa, ka, que sirve para hacer preguntas
(Taberu ka '¿Comemos?'); ka también crea deícticos indefidos (itsu 'cuándo', itsuka 'en algún momento').

Un lenguaje puede tener (como clase aparte) preposiciones o postposiciones, o ninguna de las dos (no conozco ningún caso en que se encuentren ambas en el mismo 
lenguaje). El que un lenguaje sea preposicional o postposicional depende sobre todo de la posición de las partes de la oración (especialmente los argumentos 
verbales). Como regla general, los lenguajes SOV son postposicionales (ejemplo clásico: japonés), y los lenguajes VSO son preposicionales (ejemplo clásico: árabe); 
los lenguajes SVO pueden ir para cualquiera de los dos lados. Desde luego, hay muchas excepciones (el latín es SOV y preposicional).

Las adposiciones más comunes pueden ser adecuadamente reemplazadas por casos, y quizá por adverbios. El japonés muestra muchas relaciones con partículas 
pospuestas que no tienen un significado real, sino muchas funciones aparentemente desconectadas. En algunos casos, cuando se necesita usar el equivalente a una frase
adposicional, usa dos sustantivos unidos por la partícula genitiva:

heya no naka
heya no naka
habitación GEN interior
"(en) el interior de la habitación"

ki no ue
ki no ue
árbol GEN parte_superior
"encima del árbol"

Esto no es lejano a las construcciones preposicionales perifrásticas del español (debajo de por abajo, encima de por sobre, etc.).

Sintaxis
En términos simplificados, sintaxis es el orden y la estructura de las palabras y frases dentro de una proposición gramatical.

Los varios componentes de una oración suelen aparecer en un orden fijo. Cuanto más analítico es un lenguaje, generalmente más fijo es el orden de palabras. Las 
sentencias del chino tienen un orden tan estricto que el colocar mal una palabra puede alterar mucho el significado. Cuanto más sintético es un lenguaje, probablemente 
más libre sea el orden, porque las palabras sintéticas, con mucha inflexión, pueden permanecer solas y no dependen tanto del contexto. Por ejemplo, en latín Petrus
amat Paulum 'Pedro ama a Pablo', el sujeto y el objeto están perfectamente determinados por sus marcas de caso, y sus lugares se pueden intercambiar sin cambiar 
el significado de la frase: se puede decir Paulum Petrus amat o amat Petrus Paulum, etc., y estará bien. Pero en español, 'Pedro ama a Pablo' y 'Pablo ama a 
Pedro' son cosas diferentes, ya que el orden de las palabras sirve para distinguir sujeto y objeto.

Un lenguaje sintético puede tener un orden libre no sólo recurriendo a casos. Me ha sido señalado que otros medios gramaticales como la concordancia (entre verbos 
y sustantivos, sustantivos y adjetivos, etc.) pueden también servir a este propósito.

Sujeto, verbo, objeto

La estructura básica de una oración completa incluye sujeto, objeto y verbo. Éstos, por supuesto, sólo pueden ocurrir en seis posiciones relativas diferentes: SVO, 
SOV, VSO, OVS, OSV, VOS. El español casi siempre usa SVO, aunque para algunos verbos y expresiones prefiere VSO, y para dar énfasis puede soltar algún 
OVS. El inglés es mucho más restringido, casi siempre SVO. Quizá algunos verbos de tu lenguaje puedan usar un orden, y otros otro, o usar un orden distinto para 
oraciones largas que para las más cortas.

Siempre hay un orden de palabras no marcado, que es un orden particular que no transmite información extra (como el énfasis), y que por lo tanto es 'neutral' para 


el que escucha. Por ejemplo, el orden no marcado en español, para casi todos los verbos en oraciones afirmativas, es SVO.

Algunos órdenes son más comunes que otros. De acuerdo a estadísticas, SVO y SOV, cada uno, engloban a cerca del 40% de los lenguajes de todo el mundo. Los 
lenguajes VSO son también relativamente frecuentes, un 15%. Los otros órdenes (aquéllos donde el objeto precede al sujeto) suman entre todos un 5%. O sea que si 
tu lenguaje intenta ser promedio, debería ser SVO o SOV; si la idea es que sea exótico y extraño, podés probar OVS, OSV o VOS.

Núcleos y modificadores

Cada parte de una oración puede dividirse en un núcleo y cero o más modificadores. Un núcleo y sus modificadores forman una frase.

Una frase como la pequeña casa roja, donde el núcleo es el sustantivo casa y los modificadores son el artículo y los dos adjetivos, es una frase nominal (que puede 


funcionar como sustantivo). Una frase cuyo núcleo es un verbo se llama frase verbal, y de manera similar puede ser modificada por adverbios, otros verbos, etc.

En cada caso un lenguaje tiene un orden no marcado para colocar el núcleo y los modificadores. El español coloca los artículos antes de los sustantivos, y los adjetivos 
generalmente después; los adverbios también suelen ir después de los sustantivos, y las frases genitivas y adposicionales también. Por lo tanto se lo llama un lenguaje 
con núcleo inicial o con ramificación a la derecha (traduzco aproximadamente del inglés head-first , right-branching). El inglés es más bien head-last (con núcleo 
final).

Hay que tener en cuenta que estas son tendencias. El español no siempre coloca los adjetivos antes que los sustantivos; hay algunos que van tradicionalmente antes. En 
inglés, al igual que en español, se invierte el orden usual en ciertos tipos de discurso (poesía). También hay variación en cuanto a los tipos de modificadores: el inglés 
coloca los adverbios antes de los verbos, pero las frases preposicionales y adverbiales (más largas) después. El japonés es más estricto: coloca todos los 
modificadores antes de sus núcleos, incluso las proposiciones subordinadas, que actúan como adjetivos:

Kanojo ga dakishimeta otoko wa goshujin deshita.


ella NOM abrazar-PAS hombre TOP su_esposo ser-CORTÉS-PAS
"El hombre que ella abrazó es su esposo."
Hay algunas tendencias generales que correlacionan el orden de los elementos sintácticos a nivel de la oración con el orden dentro de las frases.

Orden oraciones Orden frases Adposiciones


SOV núcleo final postposiciones
VSO núcleo inicial preposiciones
SVO cualquiera de los dos cualquiera de las dos

Estas son sólo tendencias y tienen muchas excepciones. Mientras que los lenguajes SOV son casi siempre de núcleo final y postposicionales (el ejemplo prototípico es 
el japonés), el latín es SOV y sin embargo usa preposiciones y posiciona bastante libremente los modificadores con respecto a sus núcleos. Los lenguajes SVO son 
indiferentes (el inglés y el chino son ambos preposicionales, pero el chino tiende más marcadamente a ser de núcleo final que el inglés; y el español, el francés y el 
italiano, todos ellos SVO, son de núcleo inicial). Los lenguajes SOV usualmente marcan el sujeto de alguna forma explícita, para que no se confunda con el objeto que 
sigue; los lenguajes SVO no necesitan esa clase de marca, aunque muchos la usan, porque el verbo mismo separa y distingue el sujeto del objeto.

Lenguajes V2

Algunos lenguajes (con diferentes órdenes de palabras) muestran una peculiaridad en la posición del verbo dentro de la oración. Se los llama lenguajes V2 (abreviado
del inglés verb-second languages, o lenguajes con verbo segundo). Todos los lenguajes germánicos (excepto el inglés) son V2. El verbo tiene que ser siempre el 
segundo constituyente de la oración. Esto no es lo mismo que tener orden SVO u OVS; el español es casi siempre SVO, pero en una oración como 'Ayer en mi casa 
hubo una fiesta', el verbo es el tercer constituyente (el primero es el adverbio 'ayer', y el segundo es el complemento 'en mi casa'). Para nuestros propósitos, los 
constituyentes son las frases nominales (el artículo o demostrativo + sustantivo + adjetivos), las frases verbales (verbos conjugados y auxiliares), adverbios y frases 
adverbiales (complementos de lugar, tiempo, etc.).

En los lenguajes V2, hay espacio para un y sólo un constituyente antes del verbo. Si algo tiene que ser enfatizado, usualmente se mueve al principio de la oración (esto 
ocurre en muchos lenguajes). Si el lenguaje es V2, sin embargo, esto significa que lo que estaba al principio va a tener que desplazarse hacia atrás, después del verbo. 
Por ejemplo, en alemán se puede decir (con el auxiliar verbal en MAYÚSCULAS):

Zum Geburtstag HAT sie ihm ein Buch geschenkt.


Por su cumpleaños ella le ha regalado un libro.
(lit. 'Para su cumpleaños ha ella a él un libro regalado.')

Ein Buch HAT sie ihm zum Geburtstag geschenkt.


Ella le ha regalado un libro por su cumpleaños.
(lit. 'Un libro ha ella a él por su cumpleaños regalado.')

Geschenkt HAT sie ihm zum Geburtstag ein Buch.


Ella le ha regalado un libro por su cumpleaños.
(lit. 'Regalado ha ella a él por su cumpleaños un libro.')

Por supuesto, el alemán tiene casos gramaticales, así que el sujeto y los objetos no se confunden tanto como en la traducción literal española.

Sistemas de gatillo

Este tema queda un poco fuera del propósito de esta sección, pero sentí que valía la pena incluirlo. La clasificación de órdenes de la que he estado hablando asume 
que habrá un sujeto, un verbo y un objeto, que serán diferenciables por el orden de las palabras en sí, o por inflexiones de caso.

Hay un sistema diferente, que se usa en la mayoría de los lenguajes de Filipinas, como el tagalog, en el cual el sujeto, el objeto y otros modificadores pueden aparecer 
en órdenes distintos y no están marcados de forma tradicional. Se llama sistema de gatillo.

El gatillo es la parte de la oración sobre la cual se pone énfasis (creo que es correcto llamarla el tópico). El gatillo puede ser el sujeto de la oración de acuerdo a 
nuestra visión, pero también el objeto, o una localización, o el verbo o predicado mismo. El gatillo está marcado como tal (por una partícula, por inflexión o por orden 
de palabras), pero esto sólo indica que es el gatillo, no su función. Otras partes de la oración se marcan de forma distinta. Luego, el verbo se marca para mostrar la 
relación entre la acción y el gatillo. Es decir, el 'caso' del gatillo no se marca en él, sino en el verbo.

Para ilustrar esto, voy a transcribir parte de un mensaje de Kristian Jensen a la lista Conlang, enviado amablemente por él cuando pregunté de qué se trataba el tema. 
Traduzco:

En tagalog, hay sólo tres marcas de caso: el gatillo, el genitivo, y el oblicuo. Esto es exactamente como la mayoría de (si no todos) los lenguajes filipinos. 
Más aún, como ocurre en muchos lenguajes austronésicos occidentales, hay un gran inventario de afijos usados para crear diferentes matices en los 
verbos, notablemente el gatillo verbal. Cuando el gatillo cumple el rol de agente, un afijo de gatillo-agente se usa en el verbo. Cuando el gatillo cumple el
rol de paciente, un afijo de gatillo-paciente se usa con el verbo. Cuando el gatillo cumple el rol de una locación, entonces se usa un afijo de gatillo-
locación en el verbo. Etc. etc....

Una característica particularmente digna de mención en este sistema es que los argumentos básicos no-gatillo (no enfocados) se marcan como genitivos.


Como resultado, "Estoy comprando" y "Mi compra (de algo)" tienen estructuras idénticas. Las construcciones verbales parecen ser idénticas a las 
nominales, por medio del uso de genitivos. Una teoría dice que los afijos verbales de gatillo son realmente afijos nominalizantes. Los ejemplos siempre 
ayudan. Tomemos la oración "El hombre cortó madera en el bosque". Con tres argumentos distintos, son posibles tres formas del gatillo. Aquí abajo hay 
ejemplos desglosados de la forma en que un lenguaje filipino traduciría la oración. He decidido no usar ejemplos de un lenguaje real en este punto 
esperando que sea más fácil de entender cómo funciona el _sistema gramatical_ (_no_ el morfológico).

Gatillo AGENTE:
AGT-cortar GEN-madera OBL-bosque GAT-hombre
[agente-de-cortar] [de madera] [en bosque] = [hombre]
lit.: "El cortador de madera en el bosque es el hombre"
trad.: "El hombre, él cortó madera en el bosque"

Gatillo PACIENTE:
PAC-cortar GEN-hombre OBL-bosque GAT-madera
[paciente-de-cortar] [de hombre] [en bosque] = [madera]
lit.: "El paciente de corte del hombre en el bosque es la madera"
trad.: "La madera, el hombre la cortó en el bosque"

Gatillo LOCACIÓN:

LOC-cortar GEN-hombre GEN-madera GAT-bosque


 [locación-de-cortar] [de hombre] [de madera] = [bosque]
lit.: "La locación de corte de madera del hombre es el bosque"
trad.: "El bosque, el hombre cortó madera allí"

Noten cómo he nominalizado los verbos en la transcripción. Así, el verbo para cortar ha sido nominalizado como un agente, un paciente, o una locación, 
dependiendo del rol del gatillo. Hay otras formas verbales de gatillo, incluyendo benefactor e instrumento. Mi propia teoría es que los lenguajes de gatillo 
tienen sólo un argumento básico. Siendo éste el caso, recurren a nominalizar los verbos. Esto puede explicar también por qué no existen construcciones 
pasivas en los lenguajes de gatillo, ya que valencia de los verbos no cambia (no puede cambiar) con gatillos diferentes.

En un lenguaje que usa un sistema de gatillo, no es útil hablar de sujeto, objeto, etc., y el orden de palabras puede variar considerablemente. En tagalog, el predicado 
(el verbo nominalizado) es la primera palabra de la oración, y el gatillo es la última. Otros lenguajes pueden ser distintos. También es igualmente inútil hablar de verbos 
transitivos o intransitivos, o de voz (activa, pasiva o media).

Esto es sólo para mostrarte cómo las cosas pueden ser realmente diferentes, y aun así entendibles. ¡A ver si podés imaginarte algo más!

Tipología morfosintáctica
Cuando uno habla de argumentos verbales (o elementos sintácticos que están en relación con el verbo), se pueden distinguir dos básicos, que llamamos sujeto y 
objeto. Según la forma en que se marcan (con sintaxis y/o con morfología) el sujeto y el objeto, tenemos varias clases de lenguajes:

1. Un lenguaje acusativo es uno en que

l el sujeto de todos los verbos (transitivos e intransitivos) se marca con un mismo caso gramatical, que convencionalmente se denomina "nominativo";
l el objeto de un verbo transitivo se marca con otro caso, que convencionalmente se llama "acusativo".

2. Un lenguaje ergativo es uno en que

l el sujeto de un verbo intransitivo y el objeto de un verbo transitivo se marcan ambos con el mismo caso gramatical, que se denomina "absolutivo";
l el sujeto de un verbo transitivo se marca con otro caso, que por convención se llama "ergativo". 

3. Un lenguaje activo es uno en que

l el sujeto de un verbo transitivo se marca con un caso gramatical, que se llama generalmente "agentivo" (A);
l el objeto de un verbo transitivo se marca con otro caso, que se denomina "pacientivo" (P);
l el sujeto de un verbo intransitivo se marca con uno de los dos casos mencionados (agentivo o pacientivo) según consideraciones semánticas. 

Una forma diferente y más formal de entender este tema es usar tres categorías sintácticas, que convencionalmente se llaman S, A y P, donde S es el único argumento 
de un verbo intransitivo, y A y P son los dos argumentos de un verbo transitivo.

No hay (según parece) ningún lenguaje en la Tierra que marque estos tres roles usando tres casos gramaticales diferentes; generalmente están divididos, dos por un 
lado (con un caso dado) y uno por el otro (con otro caso distinto). Un lenguaje que agrupa (trata igualmente) los argumentos S y A es un lenguaje acusativo (P va en
acusativo); un lenguaje que agrupa S y P es un lenguaje ergativo (A va en caso ergativo); y un lenguaje que agrupa S y A o S y P según el verbo es un lenguaje activo.

Aparentemente no hay lenguajes que agrupen los tres roles; algo (morfología, orden de las frases) distingue entre ellos en la mayoría de las ocasiones (y si no, el 
contexto resuelve las ambigüedades). Además, casi ningún lenguaje agrupa A y P y aparta S, ya que A y P necesitan ser diferenciados de alguna forma porque 
aparecen los dos juntos con el verbo es transitivo, mientras que S no necesita marcas especiales porque el verbo es intransitivo y no tiene otros argumentos.

_ _
/ \ / \
/ S \ / S \
/ / \ \
/ / \ \
\ A / P A \ P /
\_/ \_/
^ ^
^ | | ^
| | | |
NOM ACU ERG ABS

Lenguajes acusativos

Recordemos la definición dada arriba: los lenguajes acusativos marcan el sujeto de todos los verbos con un mismo caso (nominativo, NOM) y el objeto de los verbos


transitivos con otro caso (acusativo, ACU). Por eso también se llaman nominativo-acusativos.

El ejemplo clásico de lenguajes de este tipo es el latín.

domin-us veni -t
señor-NOM venir-3sPRS
"El señor viene."

domin- us serv -um audi -t


señor-NOM esclavo-ACU escuchar-3sPRS
"El señor escucha al esclavo."

En la mayoría de los lenguajes romances no se han preservado las marcas morfológicas de caso del latín, pero el orden de las palabras dentro de la oración, al igual 
que la concordancia y el contexto, permiten diferenciar el rol nominativo y el acusativo, con lo cual dichas lenguas presentan acusatividad sintáctica antes que 
morfológica.

Ésta puede confirmarse observando frases donde un argumento es elidido (omitido) y queda expresado en forma tácita. En la frase "el alumno vio a la maestra y se


fue"  hay dos proposiciones coordinadas con un argumento en común. El hecho de que el argumento faltante sea "el alumno" apunta a que éste es un lenguaje 
acusativo, porque el argumento que está en caso nominativo tomó precedencia para ocupar el lugar vacante, ya que el verbo de la segunda preposición ("se fue")
requiere un sujeto nominativo. En un lenguaje ergativo (ver abajo) el lugar faltante hubiera sido ocupado por el argumento en caso absolutivo (que es el objeto de la
primera proposición).

La inmensa mayoría de los lenguajes indoeuropeos son acusativos. Sin embargo, algunos presentan comportamiento ergativo parcial.

Lenguajes ergativos

Un lenguaje ergativo, como ya vimos, es uno que marca los sujetos de los verbos transitivos con un caso (ergativo, ERG), y los sujetos de los verbos intransitivos y los
objetos de los transitivos con otro caso (absolutivo, ABS).

El lenguaje ergativo más conocido en Europa es el euskara (vasco); de hecho es el único lenguaje ergativo europeo, y no puede ser agrupado en ninguna familia 
lingüística, representando probablemente el último resto de ergatividad que quedó atrás luego de la ocupación indoeuropea.

El georgiano (hablado en la nación de Georgia, ex-república soviética y lugar de nacimiento de Stalin) presenta patrones ergativos en una de las series de 
conjugaciones verbales (sistema extremadamente complicado), pero es acusativo en el resto. En una gramática de la que dispongo se lo describe como de ergatividad 
formal, pero con características de lenguaje activo de tipo Split-S (ver abajo).

El lenguaje australiano dyirbal es también ergativo en parte (utiliza una estructura ergativa para las oraciones en tercera persona, pero es acusativo cuando se usan los 
pronombres de primera y segunda persona), con una estructura sintáctica subyacente ergativa. El hindi es ergativo en los tiempos verbales perfectos y acusativo en los 
imperfectos. (Estos casos extraños han sido explicados de varias maneras, todas ellas muy densas...)

Un ejemplo de ergatividad (en euskara):

umea erori da
ume -a -0 eror-i da
niño-el-ABS caer-PRF AUX:PRS+3sS
el niño (ABS) caído está
"El niño se cayó."

emakumeak gizona ikusi du


emakume-a -k gizon -a -0 ikus-i du
mujer -la-ERG hombre-el-ABS ver -PRF AUX:PRS+3sS+3sO
la mujer (ERG) al hombre (ABS) visto ha
"La mujer ha visto al hombre."

En un lenguaje ergativo, el argumento en caso absolutivo es el que se asume cuando falta. Así, mientras que en español "el alumno vio a la maestra y se fue" se


interpreta que "el alumno vio a la maestra" + "el alumno se fue", el equivalente en euskara u otro lenguaje ergativo (con ergatividad sintáctica) se interpretaría 
incorporando el objeto absolutivo de la primera proposición como sujeto del segundo verbo (que es intransitivo):

"el alumno (ERG) vio a la maestra (ABS) y se fue"


se interpreta como
"el alumno (ERG) vio a la maestra (ABS)" + "[la maestra (ABS)] se fue"

Una prueba de este tipo con los hablantes nativos de un lenguaje (donde se les fuerce a llenar los espacios vacantes y completar su interpretación) es una forma de 
determinar si un lenguaje es ergativo/absolutivo.

Como rasgo interesante, los lenguajes ergativos no suelen presentar voz pasiva, pero sí una voz antipasiva, la cual elimina el objeto directo y degrada el sujeto de 
ergativo a absolutivo (transforma el verbo en intransitivo).

Lenguajes activos

Recordemos que un lenguaje activo es uno donde el Sujeto de un verbo intransitivo puede marcarse de dos formas (A o P) según consideraciones semánticas del 
verbo o de su argumento.

Los lenguajes activos se subdividen a su vez en dos tipos:

l a. Lenguajes con Sujeto Dividido ("Split-S"), en los que la decisión de marcar el sujeto de un determinado verbo como agentivo o como pacientivo está por así 


decirlo tomada de antemano de forma convencional, y fijada como parte de la estructura sintáctica; 
l b. Lenguajes con Sujeto Fluido ("Fluid-S"), en los que la decisión de marcar un sujeto como agentivo o pacientivo depende de consideraciones semánticas 
actuales y debe ser tomada por el hablante según su intención y contexto, pudiendo variar el significado de la expresión. 

Las consideraciones semánticas mencionadas pueden tener que ver con la clase de concepto descripta por el verbo (¿es un evento o acción, o es un estado o 
circunstancia?), así como con el grado de control o voluntad del sujeto sobre la acción o estado expresado por el verbo (¿es una acción voluntaria o involuntaria? ¿la 
realiza el actor directamente o a través de un instrumento u otro medio indirecto?). En los lenguajes Fluid-S estas consideraciones deben ser meditadas por el hablante
para inclinar el significado hacia un lado u otro. En los lenguajes Split-S cada verbo tiene asignada estas connotaciones (y por lo tanto la forma en que debe marcar su
sujeto) como parte de su definición, y por lo tanto el hablante sólo puede aprender la forma usual y emplearla, modificándola por otros medios cuando le parezca 
necesario cambiar el significado más común.

Por ejemplo, 'dormir' es un estado no voluntario. En un lenguaje Split-S, el hablante marcará el sujeto de 'dormir' como pacientivo siempre. Si desea explicitar que se 


realizó un esfuerzo para conciliar el sueño, o algo similar, deberá recurrir a auxiliares ('tratar de dormir') u otros medios para transmitir este significado. En cambio, en 
un lenguaje Fluid-S, si bien típicamente se usará 'dormir' con un sujeto en pacientivo, quizá el hablante podría sugerir un 'irse a dormir con esfuerzo' utilizando el mismo 
verbo 'dormir' con sujeto agentivo. De la misma manera se podrían dar significados distintos al verbo 'toser' (generalmente involuntario pero a veces provocado por el 
mismo actor) o 'darse vuelta' (activo y casi siempre voluntario, pero a veces un acto reflejo inconsciente).

Daniel Andreasson, de la lista CONLANG, investigó el tema por su cuenta y envió a la lista un resumen. Afirma que los lenguajes activos distinguen los sujetos A y P 
según varios criterios (cada lenguaje utiliza primariamente uno de éstos):

l a) evento vs. estado


l b) control
l c) actuación, efecto e instigación 

"Evento vs. estado" significa que si el verbo expresa un evento ('correr', 'bailar', 'hablar', 'matar'), entonces el sujeto se marcado con A. Si es un estado ('tener hambre',
'estar cansado', 'dormir'), entonces se marca con P.

"Control" significa que si el argumento del verbo controla el evento (o estado), entonces es marcado con A; y si no tiene dicho control, entonces es marcado con P.
'Irse' y 'tener cuidado' son predicados controlados; 'morir' y 'caer' no lo son.

"Actuación, efecto e instigación" se refiere a que algunos predicados son de alguna manera actuados (realizados) o instigados por el actor, aun cuando no estén 
controlados por él, como ocurre en el caso de verbos como 'estornudar' y 'vomitar'. En lenguajes como el lakhota o el georgiano, es suficiente si el actor de cualquier 
forma efectúa la acción (o el estado), aunque no lo controle, para que el sujeto sea marcado como A. En un lenguaje del tipo (c), 'estornudar' y 'tener hipo' marcan su 
argumento como A, al contrario que los del tipo (b), donde por no tener control el actor se marcan como P.

Analogía
Analogía es el término general que designa varios tipos de procesos que cambian la forma fonética y la gramática de una palabra o de una expresión, y que se produce 
por ciertas causas que detallaré. Cuando hable de analogía aquí, me referiré normalmente a un cambio fonético.

La analogía es la creación de una nueva forma (de una palabra) por influencia de otras formas similares, análogas. Es un medio gramatical muy fructífero, y 
probablemente uno de los que más crean palabras en todos los lenguajes. Veamos un ejemplo.

El latín deriva del protoindoeuropeo (un lenguaje o conjunto de dialectos de un lenguaje que ha sido reconstruido basándose en sus lenguas hijas). En PIE, los 
sustantivos tenían caso gramatical. La palabra para 'honor' se reconstruyó con una raíz *honos, que en un cierto caso era *honosem.

Ahora bien, a medida que el PIE se transformaba en latín (y también en griego, germánico, sánscrito, etc.), se produjeron algunos cambios de sonidos. En particular, 
la /s/ intervocálica se hizo gradualmente sonora (/z/), y finalmente produjo un sonido trillado alveolar, /r/ (como la rr española). Este cambio es bastante común (se 
llama rotacismo). Sucedió solamente cuando la /s/ era intervocálica, no en otra posición.

(Antes)       (Después)

*honos -> honos


*honosem -> honorem

Esto, como se ve, produjo una irregularidad; la forma radical de la palabra se dividió en dos formas, honos- y honor-. Todos los lenguajes tienen formas irregulares,


pero ésta (y muchas otras de la misma clase) probablemente no fue aceptado por los hablantes. Ahora vamos a poner una mano sobre la columna 'Antes' para taparla, 
ignorarla. Los hablantes de latín no sabían nada de cambio de sonidos, que es un proceso sutil e inconsciente (y no estudiado en esa época). ¿Qué hacer con el par 
irregular, honos/honorem?

La solución vino de la mano de una analogía con las muchas palabras que no habían cambiado su forma, conservando la misma raíz (o cambiándola consistentemente). 
Tenían honorem y también tenían honoris, quizá incluso palabras como honorificum y así, de manera que comenzaron a decir honor en vez de honos. Por analogía, 
una forma se asimiló a las otras.

Por supuesto, ningún lenguaje lleva la analogía tan lejos como para regularizar toda su gramática.

Una forma relacionada de analogía aparece cuando la gente crea palabras a partir de elementos que tenían, basadas palabras similares. Por ejemplo, teniendo fin -
finalizar  y otras similares, en español han aparecido idealizar, nacionalizar, hospitalizar y muchísimas más. Si estás creando un lenguaje, la analogía probablemente 
sea la mejor herramienta posible para incrementar tu léxico.

Otros medios gramaticales


Ésta es una sección general en la que menciono y hago un sumario de los medios gramaticales más comunes que se encuentran en los lenguajes del mundo, es decir, 
cómo la gramática se maneja a nivel práctico, en palabras reales.

Ya hemos visto la mayoría de estos medios de una forma u otra. Aquí hay una breve lista de ellos:

l Afijación: añadir prefijos, sufijos o infijos a las palabras, para cambiar su significado o su relación con otras palabras. Estos afijos incluyen lo que llamamos 
inflexiones y aglutinación. 
l Orden de palabras: es libre en algunos lenguajes, y fijo en otros. En general, cuanto más sintético es un lenguaje, más libre es el orden. Un lenguaje analítico 
depende más del orden de las palabras para clarificar su significado y relaciones, ya que estas palabras no toman inflexiones y por lo tanto no muestran su 
función en su estructura. Un lenguaje sintético puede construir una oración con palabras desparramadas o desordenadas (de hecho esto se llama hipérbaton y
es un tipo de licencia poética). 
l Acento y altura: los hemos visto. En algunos lenguajes son solamente formales; en muchos otros, dos palabras pueden tener diferentes significados si difieren
sólo en sus patrones de acentuación. Por ejemplo, en español camino (verbo o sustantivo) vs. caminó, o en inglés record /'rEk@rd/ 'disco, grabación' vs. 
record /rI'kord/ 'grabar, registrar' (el inglés tiene muchos pares de palabras bisilábicas como éstas, que alternan entre verbo y sustantivo según cambie el 
acento).
l Tono: lo mismo que para el acento y la altura. A veces un cambio en el tono distingue dos palabras, y a veces produce una forma diferente del mismo concepto
raíz. En shilluk, yít (tono alto) significa 'oreja', y yìt  (tono bajo) significa 'orejas'; el tono no es sólo fonético sino gramatical. En chino, por otro lado, el tono es 
casi siempre sólo fonético y fonémico, pero no tiene función gramatical. 
l Alternancia: la hemos visto con ejemplos. Es el cambio (regular) de sonidos en las palabras. La más común es la alternancia vocálica, que se encuentra mucho 
en los lenguajes germánicos, particularmente en el inglés: obsérvense las formas verbales sing/sang/sung 'cantar/cantó/cantado', y los plurales irregular 
man/men 'hombre/hombres', goose/geese 'ganso/gansos'. En algunos lenguajes esto no es irregular sino la norma. La alternancia consonántica es menos común 
pero existe. Las consonantes pueden alternar en formas diferentes: por voz (sonora/sorda), por modo de articulación (cambiando de oclusiva a fricativa, o a 
africada, o de simple a doble [geminada]), o de formas más extrañas. Hay un lenguaje africano donde /t/ alterna con /l/, y /p/ alterna con /w/ (esto es
alternancia de voz y de modo de articulación). 
l Reduplicación: (una parte de) una palabra es duplicada, repetida antes o después de ella. Un verbo reduplicado puede hacerse continuo o incrementar su 
fuerza, como en el hotentote, go 'mirar' vs. go-go 'examinar con atención' (usado por Philip J. Farmer en Jinetes del salario púrpura, en su "Escuela de Crítica 
Go-go"). Un sustantivo reduplicado puede ser tomado como plural, como gyat 'persona' vs. gyigyat 'personas' (de vuelta un lenguaje africano), que también 
muestra alternancia vocálica. A veces la reduplicación no tiene función en sí sino que forma parte de una inflexión. En griego, las formas perfectas de los verbos 
usan reduplicación y alternancia: līp ō 'me voy', hélipon 'me fui', léloipa 'me he ido'.

Creando palabras
Bien, ahora que todo está dispuesto, hay que empezar a crear palabras. Probablemente ya tengas algunas partículas, terminaciones de caso, afijos, etc., pero eso es 
solamente el esqueleto.

¿Cuántas palabras necesitás? Si estás creando un lenguaje completo (asumo que así es, porque no habrías llegado hasta aquí si no), vas a necesitar cerca de dos mil 
palabras para comunicarte con cierta comodidad. Se puede hacer bastante con unas mil palabras, si eso te asusta; pero probablemente vayas a ir creando nuevas
palabras de cuando en cuando.

Mark Rosenfelder menciona la tesis de Ogden y Richards. Esta gente demostró que la mayor parte de un texto común en inglés (pero esto vale para cualquier 
lenguaje) contiene un léxico muy reducido. Un cierto grupo de palabras comunes cubre el 80 o 90% de todo el texto. Entonces dijeron, "Bueno, entonces aislemos 
estas palabras y usémoslas a ellas y sólo a ellas, combinándolas para formar los conceptos más complicados en vez de usar palabras menos comunes". Por ejemplo, 
olvidar la palabra succeed 'tener éxito' y usar la expresión make good 'irle bien a uno'. En total uno podría arreglarse con 850 palabras comunes, más unas cien extra 
para campos específicos.

El argumento es correcto, pero tiene un falla. Las palabras más comunes que cubren tanto del texto son también las que llevan menos información: artículos, 
preposiciones, pronombres, etc. En los titulares de los diarios, éstos son usualmente omitidos, porque no son tan importantes, y el resto se puede entender. Las 
palabras no tan comunes no se pueden omitir, porque son las que transportan todo el significado, toda la información. De hecho, la base teórica de la informática 
moderna dice que los signos más raros son los que poseen la mayor información. Si entendés el 90% de las palabras de un texto, pero el 10% restante se compone de 
la información más crítica, realmente no estás obteniendo nada excepto un montón de partículas que conectan conceptos ininteligibles.

Por lo tanto, no ahorres palabras. Nunca pueden ser demasiadas.

¿Cómo empezar? No hay método, pero puedo contarte algunas maneras que he usado:

l Podés traducir textos simples. Cuando necesites una palabra, la creás; si hay una raíz relacionada disponible, la derivás de ahí, o de lo contrario creás y anotás 
una raíz nueva primero. No se puede hacer salir palabras de ninguna parte. La traducción es tediosa, y es molesto parar a cada palabra e inventarla, pero es 
muy buena para crear palabras. Qué traducir es tu decisión. Desde luego, no recomiendo comenzar con Borges o Cortázar... El texto de Babel (Génesis 11, 1-
9) es bastante bueno (y un clásico entre la comunidad internacional de creadores de lenguajes, por razones obvias). Podés continuar con la Biblia (o el Talmud o 
el Rgveda o cualquier otro libro sagrado de tu religión, si tenés una y si tiene libros sagrados). Si parece demasiado denso, probá con comics o con El Hobbit.
Si te animás, probá traducir de otro lenguaje construido.
l Quizá puedas encontrar una lista de vocabulario básico. Por ejemplo, yo tengo un diccionario inglés-inglés pensado para alumnos no nativos, con una lista de 
dos mil palabras comunes que se usan para explicar las definiciones, y he tomado algunas palabras de allí y las he traducido a mi propio lenguaje. No traduzcas
diccionarios. Es aburrido, consume tiempo, y no tiene sentido; vas a terminar teniendo muchas palabras raras, con traducciones españolas comenzadas todas 
por a.
l Encontrá un tema o campo semántico e inventá palabras pertenecientes a él. Por ejemplo, verbos de movimiento (caminar, ir, saltar, venir, levantarse, arrastrar, 
girar), o partes del cuerpo (cabeza, brazos, piernas, dedos, cara, ojos, pelo), o colores (ya conocés los colores), o números (vas a tener que crear un sistema 
numérico o usar el decimal), o herramientas, o animales, o electrodomésticos. 
l Ésta todavía no la he usado, pero parece interesante: crear palabras que riman. Tomá cualquier conjunto de conceptos en español, y traducí el primero con una 
cierta palabra en tu lenguaje, y todas las otras con palabras que rimen con ésa. O al revés. O podés probar con series alternantes, palabras que varían sólo su 
primera consonante, o sus vocales (por supuesto, deberían ser conceptos sin relación, a menos que la alternancia de sonidos sea un dispositivo de inflexión 
válido). Después podés usar la lista para hacer juegos de palabras. :-)

Hay una lista de palabras muy interesante (Universal Language Dictionary) que abarca 1600 palabras divididas por temas, y usadas de alguna forma por los
lenguajes más comunes del mundo. La podés encontrar en el sitio de Model Languages: viene con el generador de lenguajes Langmaker. Muy bueno, por lo menos
para buscar palabras (no es muy divertido sentarse y generarlas una después de otra). Para una forma simple pero útil de generar palabras, probá Wordgen. Te
permite especificar las consonantes y combinaciones iniciales, medias y finales, las vocales y diptongos, y el número de sílabas que querés.

Palabras finales
Si querés ser un gran creador de lenguajes, ¡leé! Leé cualquier cosa que te caiga en las manos o que pase cerca. La Web está llena de material, aunque un poco 
desparramado. Ya he mencionado algunas de mis fuentes. Aquí hay una lista completa de sitios que deberías visitar (todos en inglés, desafortunadamente; de ahí que 
yo haya hecho esta traducción):

Model Languages es una newsletter dedicada a la creación de lenguaje, que solía publicarse cada dos meses. Ahora ya no se publica, pero las entregas antiguas 


todavía están en el sitio. Hay mucho material allí, bastante para leer, y también tiene una lista de más de 200 links a páginas de lenguajes construidos. Hay también un 
generador de palabras que maneja diferentes estructuras silábicas y produce palabras a partir de ellas, y puede derivarlas por cambios de sonidos sencillos.

Mark Rosenfelder ha hecho un gran trabajo en su sitio, Metaverse, incluyendo el Language Construction Kit, una introducción al quechua, una lista de números del 1 al 


10 en más de tres mil lenguajes, y mucho material sobre uno de sus lenguajes, el verdurian.

También está la Human Languages Page, que está un poco mezclada, pero te ayuda a encontrar recursos de lingüística sobre muchos lenguajes naturales.


Si sos un fan de J. R. R. Tolkien, podés encontrar inmensas descripciones de los lenguajes que él inventó en Ardalambion (Lenguas de Arda).

Para ver algunas escrituras del mundo, tenés Ancient Scripts, un conjunto de páginas muy bien armadas con ejemplos de sistemas de escritura de todo el mundo, 
incluyendo Mesoamérica, Europa y el Oriente Medio. 

Si hablás inglés y querés entrar en la comunidad de lenguajes construidos, uníte a la lista de e-mail Conlang escribiendo a listserv@listserv.brown.edu con


subscribe conlang tu_nombre en el cuerpo del mensaje. Conlang está dedicada a la discusión de lenguajes construidos para propósitos de ficción (no lenguajes
auxiliares).

Joshua Shinavier, un miembro compañero de Conlang, tiene una lista bastante completa de lenguajes construidos de los cuales se puede encontrar material en Internet:
The Conlang Yellow Pages. No hay mejor forma de aprender que ver cómo otros lo hacen.

Y después, por supuesto, están las bibliotecas, esos edificios silenciosos llenos de libros. He aprendido mucho de los libros de lingüística. Casi siempre son densos y a 
veces ininteligibles (no fueron hechos para gente común que trata de crear lenguajes), pero frecuentemente explican temas curiosos junto con ejemplos. Para inventar 
un buen lenguaje hay que estudiar lenguajes naturales.

¡Y bien, hasta pronto! Si estás creando un lenguaje y te gustaría exponerlo al aplauso o la crítica del mundo, o tenés que pedir consejo o dar consejo, escribíme y voy
a hacer lo que pueda para corresponder a tus expectativas.

Agradecimientos
Deseo dar gracias a los siguientes:

l Mark Rosenfelder, por su excelente trabajo en el "Kit de Construcción de Lenguajes", que me enseñó mucho y me inspiró a escribir esto, y por no quejarse 
cuando me apropié de grandes trozos del mismo. 
l Jeffrey Henning, por su (también impresionante) trabajo como editor de la famosa revista online "Model Languages". 
l Nik Taylor, compañero miembro de CONLANG, que si mal no recuerdo fue la primera persona que me escribió en referencia a estas páginas, corrigiendo 
algunos graves errores y contribuyendo con datos sobre el récord de 92 consonants del !Xu~ y la proporción promedio de obstruentes a sonorantes. 
l Kristian Jensen, quien me enseñó a mí y al resto de la lista CONLANG sobre los sistemas de gatillo. 
l Markus Miekk-oja, alias Miekko, quien compartió conmigo muchas cosas curiosas sobre lenguajes reales y ficticios, incluyendo los misterios de los muchos 
casos gramaticales del finés, y los nombres y usos de los modos verbales del nenets. 
l Jarkko Hietaniemi, por un bonito ejemplo de aglutinación en finés. 
l Donald Patrick Michael Goodman III, por enseñarme a decir "Él es guapo" en japonés y luego poner el adjetivo en tiempo pasado. 
l Reena D., por corregir un error tipográfico en el ejemplo dado por Donald. 
l Mathias Lasailly, compañero de CONLANG, quien suministró el ejemplo de posesión demostrada por una cláusula subordinada con el verbo "tener" en ainu. 
l Cseri Benedek, quien corrigió mi error de haber afirmado que ningún lenguaje marca consistentemente la transitividad en los verbos, mostrándose cómo se 
hace precisamente esto en húngaro. 
l Todos los miembros de la lista CONLANG que no he nombrado arriba.
l John Ronald Reuel Tolkien, Jorge Luis Borges, y tantos otros que me han hecho pensar sobre las palabras, su significado, su belleza y su magia, que hace
tangible la sustancia de los pensamientos y de los sueños. 

Vous aimerez peut-être aussi