Caballos y diccionarios

Publicado el 17 / noviembre / 2007 por pseudópodo

El primer mandamiento de un diccionario es que una definición no puede contener el término definido. Si en la definición de «martillo» apareciera la palabra «martillo», se produciría una autorreferencia, un cortocircuito fatal.

Ahora abrimos el DRAE y la primera palabra que nos encontramos es:

a. (Del lat. ad). prep. Precede a determinados complementos verbales….

¡Alto!¡En la definición de la preposición «a» aparece la preposición «a»! Mal empezamos…¿Cómo es posible?

La razón de que la palabra definida esté prohibida en su definición es que una definición sirve para saber el significado de la palabra definida, y esto sólo ocurre si conocemos el significado de todas palabras que intervienen. Pero ¿qué significado tiene una preposición? En realidad, no tiene contenido semántico, igual que las conjunciones, artículos o pronombres. Así que nos olvidaremos de estas palabras: el primer mandamiento de un diccionario se lo deberíamos aplicar sólo a sustantivos, verbos, adjetivos y adverbios.

Ahora bien, no es tan fácil escapar de la autorreferencia. Vamos a verlo con un ejemplo. Abro al azar una página del DRAE y me encuentro con:

copete. (Del dim. de copo). 1. m. Pelo que se lleva levantado sobre la frente.

Para saber el significado de «copete» debo pues conocer el significado de «pelo», «llevar», «levantar» y «frente». Pero para saber qué significa «pelo» tengo que conocer una segunda generación de palabras, que aparecen en su definición: nada menos que «filamento», «cilíndrico», «sutil», «naturaleza», «córnea», «nacer»… hasta catorce palabras. Y así sucesivamente. En sentido amplio, la definición de «copete» incluye todas esas palabras de generaciones sucesivas.

Es probable que el lector a estas alturas haya olfateado una progresión geométrica. Supongamos por simplicidad que cada definición tiene siete palabras. Para hacer explícito el significado de cada una de ellas, necesitamos otras siete, y así sucesivamente. En la séptima generación ya hemos usado 137257 palabras: más de las que tiene la mayoría de los diccionarios. Obviamente estamos repitiendo palabras. Y eso significa que las palabras definidas aparecen en las definiciones. No en su misma generación, porque lo prohíbe el primer mandamiento, pero sí en generaciones sucesivas: ya avisamos que no es tan fácil escapar de la autorreferencia.

Pero quizá hay alguna posibilidad. Veámoslo de forma gráfica. Si ponemos en papel un punto por cada palabra, y trazamos una flecha de cada punto-palabra a los puntos-palabra que aparecen en su definición, tenemos un esquema enormemente complicado que resume la estructura de la lengua, tal como la recoge ese diccionario (en matemáticas a un esquema así se le llama grafo dirigido). Si queremos evitar la autorreferencia, en ese grafo no debería haber recorridos que se cerraran sobre sí mismos. ¿Es eso posible? Parece que sí. Sólo hace falta que haya un conjunto suficientemente amplio de puntos de los que no salgan flechas. De ese modo, los recorridos que lleguen allí se interrumpen y no pueden cerrarse.

Los puntos de los que no salen flechas son palabras no definidas, algo así como axiomas del idioma. Deberían ser palabras cuyo significado fuera evidente; palabras sencillas como caballo: porque lo que es un caballo, resulta obvio para todo el mundo.

* * *

[Epílogo para matemáticos] El problema puede formalizarse así: para un número dado de enlaces salientes (que podría ser una distribución realista en lugar de un nº fijo), estudiar el nº de recorridos que se cierran sobre sí mismos en el grafo en función del tamaño del subconjunto de puntos axioma. Apuesto a que ese número de recorridos decrece muy rápido al ir aumentando el nº de puntos axioma; quizá hay una transición de fase para un número crítico, y eso nos daría el número mínimo de axiomas necesarios para hacer un buen diccionario. ¿Estará estudiado esto?

Esta entrada fue publicada en Ciencia, Ideas & Thoughts. Guarda el enlace permanente.

10 respuestas a Caballos y diccionarios

panta dijo:

18 / noviembre / 2007 en 12:44 pm

Esto me recuerda al razonamiento de por qué la humanidad ha sido siempre más numerosa en la antigüedad : al fin y al cabo cada niño tiene 2^1 padres, 2^2 abuelos …

Por otro lado la forma de escapar a la autorreferencia también genera problemas : si queremos un sistema con axiomas irreducibles y evidentes ¿ hay una única elección que genere el resto de definiciones (léase teoremas) ? ¿Cuál es la correcta?

Por último, disparatando un poco sobre el tema de los grafos, se podría ya de paso extender el teorema de Euler sobre los polígonos a los lenguajes.

Saludos

Responder
Javier dijo:

18 / noviembre / 2007 en 2:28 pm

La eliminación completa de la autorreferencia se intentó muy seriamente en las matemáticas a principios del siglo XX con una revisión sistemática de los fundamentos de las mismas. En esta dirección está todo el axiomatismo que presentan los «Principia Mathematica» de Russell y Whitehead. Por lo poco que he comprendido del tema (que es interesante en principio pero luego se vuelve enormemente farragoso) uno acaba entrando en un pozo sin fondo y se enfrenta a dos posibilidades: (a) dejar caer todo el edificio matemático; (b) admitir una serie de conceptos primitivos que se muestran pero no se axiomatizan con rigor y tirar para adelante.
Es el mismo problema con el lenguaje. Puesto que el lenguaje surge en la mente del hombre, ¿puede el lenguaje expresar todo lo que el hombre comprende (incluso sobre sí mismo)? Lenguaje, metalenguaje, meta-metalenguaje. Pero no habléis de estas cosas con nihilistas y posmodernos. Es darles combusible para negar la ciencia y la existencia de la realidad. En lugar de una «realidad». Hablar de estas cosas parece siempre muy profundo aunque se acaba escribiendo frases sin contenido.
[Respecto del problema matemático que planteas…]. Cuántos recorridos se cierran es irrelevante (una vez se cierra uno se cierran muchos intermedios que no aportan nada nuevo). El tipo de problemas de los que hablas tiene que ver con grafos dirigidos y con el hecho de que las componentes conexas salientes de un subconjunto de fuentes (axiomas; puntos que no citan a nadie) cubran todo el grafo. Hay más, pero es domingo.

Responder
pseudopodo dijo:

19 / noviembre / 2007 en 9:30 pm

Al hilo del comentario de Panta sobre los 2^2 abuelos, etc, se me ocurre que puede ser interesante la comparación del grafo del diccionario con un árbol genealógico. En vez de palabras tenemos personas, y en lugar de las palabras de la definición tenemos los progenitores: ponemos un punto por persona y lo unimos con una flecha con cada uno de sus progenitores.

El esquema es más sencillo que el del diccionario porque de cada persona salen siempre dos flechas. También es más sencillo porque aquí es imposible que haya caminos que se cierren sobre sí mismos: ¡eso significaría que una persona es su propio antepasado!, de modo que lo que queríamos evitar en el diccionario se evita aquí de manera natural, “por construcción”.

Pero es que el grafo árbol genealógico tiene una estructura mucho más rígida que el grafo del diccionario: el 1º está estratificado por generaciones; lo podemos dibujar, por ejemplo, con las generaciones precedentes cada vez más arriba, y nunca habrá una flecha hacia abajo. Podemos parar de dibujar en una determinada generación; esa sería la población primigenia y de ella no saldría ninguna flecha: serían como las palabras axioma del diccionario.

Pero un diccionario de un idioma natural nunca podría responder a este esquema, que es más bien el de un sistema axiomático (¿podría ser el de un idioma analítico como el de John Wilkins?)

Javier, ya que no es domingo, aceptamos más… 😉

Responder
loiayiga dijo:

20 / noviembre / 2007 en 12:31 am

Voy a intervenir aun con el riesgo de decir alguna tontería (o varias). No tengo nada claro el asunto y desde luego el tema de los grafos dirigidos va mucho más allá de donde yo puedo ir.

Me quiero limitar sólo al lenguaje natural.
El simil entre la autoreferencia en un lenguaje natural y un sistema axiomático puede estar bien como recurso para llamar la atención, (la definición polaca de caballo tiene gracia) como broma o como gancho para enlazar y dedicarse a debatir posteriormente sobre los grafos, pero creo que lo problemático de la autoreferencia en un diccionario no pasa de la primera definición y en todo caso de la segunda. Quiero decir que la autoreferencia en sucesivas definiciones de las palabras usadas en la primera definición no es un problema práctico. Siempre que en la primera definición -ya está dicho- no incluyamos la palabra definida.
En un diccionario nadie se plantea (que yo sepa) cuales son las palabras-axioma. Ni existen, ni tienen razón para existir. Unas palabras se definen en función de otras y a su vez esas de otras, y así sucesivamente hasta que aparece de nuevo (es inevitable) la primera que quisimos definir. Pero no existe problema real porque el que consulta un diccionario conoce el significado de un número suficiente de términos como para poder entender las definiciones de las que desconoce sin que exista problema ninguno.

No hay problema en que las definiciones sean en último término circulares, porque siendo el círculo suficientemente amplio y conociendo el significado (como conocen los hablantes de esa lengua) de una gran parte de él, lo desconocido se define suficientemente desde lo conocido.

Y en relación con los axiomas, desde mi enciclopédica ignorancia de las matemáticas la idea que tengo de un sistema axiomático es una especie de arbol invertido. De unos pocos axiomas se van derivando (hacia abajo) un montón de teoremas de los que a su vez se derivan otros y otros y otros. ES decir la estructura contraria al arbol genealógico. ¿No?
No creo que un diccionario se parezca ni tenga por qué parecerse a eso.
Pero ya he dicho que no estoy seguro de enteder bien lo que se quería plantear. En fin, que no me sé estar callado.

Responder
Topo Universitario dijo:

20 / noviembre / 2007 en 1:00 am

Dicho de otro modo: no existe el Diccionario de la Lengua. En su uso habitual, todos son Diccionarios de dudas.

Responder
Rogelio Yoyontzin dijo:

20 / noviembre / 2007 en 7:56 am

Si al buscar una definición en un diccionario, me veo en la necesidad de buscar el significado en otro diccionario por omisión, el primer diccionario pierde puntos. Creo que ambas cosas son dignas de valorar en un diccionario: que no use lo que quiere definir para su definición y que dentro de él se encuentre la definición de cualquier palabra. Si aceptamos estas dos condiciones como mínimas para un diccionario, entonces existirán necesariamente autoreferencias. Entre dos diccionarios que cumplan las dos premisas mínimas entonces yo escogería aquel en el que el «ciclo de autoreferenica» con el menor número de palabras involucradas, tenga el mayor número de palabras entre los dos diccionarios. Yo propondría entonces esta pregunta: En un diccionario de n palabras que cumple las dos condiciones básicas, ¿cuál es el número máximo posible de palabras que contiene un ciclo de autoreferecia con el número mínimo de palabras en el diccionario? Este número sería una buena medida que podría ayudar a descartar entre un diccionario u otro, o al menos, un punto a consideración para la gente que hace diccionarios.

En términos de grafos yo lo podría así. Si definimos la longitud de un ciclo como el número de aristas que tiene el ciclo, y si definimos la longitud de la gráfica como la longitud mínima de todos sus ciclos, mi pregunta es esta: ¿cuál es la longitud máxima de una gráfica dirigida con n vértices? A lo mejor ya existe respuesta, le preguntaré a un amigo que se dedica a gráficas.

Saludos.

Responder
pseudopodo dijo:

20 / noviembre / 2007 en 9:41 pm

Rogelio, lo he tenido que leer tres veces pero creo que es una buena idea: aceptando que haya ciclos (para que todas las palabras estén definidas) el mejor diccionario sería el que tuviera los ciclos más largos…Pero como dices, eso posiblemente ya está estudiado (y no parece un problema fácil)… si te enteras de algo, cuéntanoslo.

Loiayirga, tienes razón en que el problema de la autorreferencia se va diluyendo a medidad que el ciclo se hace más largo. Pasa como con la consanguinidad: todos somos consanguíneos (la demostración: lo que decía Panta, que el nº de nuestros antepasados crece en progresión geométrica) pero si esa consanguinidad es lejana no es problema.

Pero aquí no estamos discutiendo un problema práctico, sino jugando. Cuando leí la definición polaca de caballo me hizo mucha gracia. Siempre me habían parecido un poco absurdas las definiciones de cosas obvias en el diccionario, porque ¿quién va a buscar en un diccionario qué es un caballo? ¿Si no sé qué es un caballo, cómo voy a saber qué son los perisodáctilos? Por eso pensé que era una gran idea lo de Chmielowski. Y luego, pensando más sobre esto (después de poner el post anterior) se me ocurrió que se podía formalizar y convertir en un problema matemático. Que es una manera de seguir jugando…

Sobre la estructura del sistema axiomático vs. la del árbol genealógico, ten en cuenta que si hacemos el arbol genealógico de toda la humanidad, entonces sí se estrecha hacia arriba (hasta reducirse idealmente a dos puntos -dos axiomas-: Adán y Eva)

Responder
pseudopodo dijo:

3 / diciembre / 2007 en 9:31 pm

Acabo de ver, con retraso, una entrada en Microsiervos va precisamente de esto: Bucles autorreferentes en diccionarios y enciclopedias. Y otra más: definición de genética.

Responder
Isenez dijo:

12 / febrero / 2009 en 10:03 pm

Hacía tanto tiempo que no me topaba con un/a troll de este tipo…

Enhorabuena, Pseudópodo, esto es prueba de que tu blog va viento en popa.

Responder
pseudopodo dijo:

12 / febrero / 2009 en 10:51 pm

Gracias, Isenez, eres la policía del blog 😉 Voy a borrar el comentario, que no se merece otra cosa.

Responder

L	M	X	J	V	S	D
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30