Lo mío con las nubes fue un amor a primera vista: ya dejé constancia en la prehistoria de este blog, y volví a hablar de ellas cuando las incorporó WordPress. Me refiero, claro está, a las nubes de etiquetas o de palabras, como esta:
Aquí tenemos, de un golpe de vista, las 50 palabras principales del post anterior, más grandes cuanto más frecuentes. Me encantan las nubes porque son una especie de cromatografía de textos: los analizan y presentan gráficamente sus componentes. Y de un golpe de vista puedes saber qué hay ahí dentro.
Conocía varias aplicaciones en la web para hacer nubes de etiquetas, como Tag Crowd o keyword-density-checker, pero todas tenían inconvenientes, porque la cosa no es tan fácil como parece: hay que filtrar las palabras comunes (stopwords), a menudo los acentos dan problemas… Ahora me he enterado, vía Entropía, de una nueva: Wordle.
Wordle es una delicia: detecta el idioma, filtra automáticamente las palabras comunes (y si se cuela alguna, se elimina con un click), y sobre todo hace unas nubes preciosas (vease el ejemplo anterior). Mi impresión es que va a conseguir que las nubes de palabras se conviertan en un estándar y que cada vez sea más corriente que los textos vengan acompañados de su nube, como una ayuda cognitiva.
Pero quizá lleguemos un poco más lejos. Lo cierto es que hay muchos textos que no merecen ser leídos detenidamente: basta tener una idea del soniquete, de las palabras que se repiten; una visión a vista de pájaro, expurgada de incordios retóricos e incluso de la sintaxis.
Por ejemplo, los discursos de los políticos. ¿Para qué leer las intervenciones parlamentarias de Rajoy y de Zapatero sobre la crisis (tal como vienen en la web del Congreso), si basta con ver sus nubes?:
(click para ampliar). Cada nuevo descubrimiento tiene un potencial que a menudo tarda en realizarse por completo. Cuando las nubes lo alcancen, se hará evidente que el discurso sobra y basta la nube. Cada político imprimirá la suya en una camiseta, se hará la foto con ella para la prensa, y sobrará el parlamento. Ya sé que no será tan distinto de lo que hay ahora, pero estará todo más claro, ¿no?

2 / Julio / 2008 a las 2:54 pm |
Yo también estoy encantado con Wordle. La idea de las nubes de los discursos de los políticos ha sido buenísima.
2 / Julio / 2008 a las 3:22 pm |
Sencillamente… ¡Genial!
En un examen más detenido de la nube del post, llama la atención que el autor más destacado sea MACINTYRE. Y también es gracioso que en una esquinita del ángulo inferior derecho aparezca la palabra “obvio” (obvio).
3 / Julio / 2008 a las 2:26 pm |
Oye, ¡que cooosa más chula! Apenas pongo tags en mis entradas de bitácora porque además de que soy vagonli, resulta que no sé qué poner… ¿podré colocar esta facilidad en mi blogo? Me encanta la tecnología aliada con la estética
jis!
3 / Julio / 2008 a las 4:54 pm |
Y los ciudadanos les pediremos a los políticos “show me your cloud”
Genial!
Mira el que hice de Obama, el de “we the people”
http://wordle.net/gallery/wrdl/49774/We_the_People,_Obama%27s_Speech
Interesante!!
4 / Julio / 2008 a las 11:42 am |
Genial, utilísimo… voy a usar este tipo de nube en cuanto pueda.
Vengo de hacer un comentario en otro blog sobre la necesidad de filtrar automáticamente el contenido de los discursos políticos para encontrar si se ha dicho algo interesante (o “algo”, a secas) y me encuentro con este post tuyo que da absolutamente en el clavo. Me has dejado entusiasmado.
4 / Julio / 2008 a las 1:32 pm |
Bueno, gracias a todos aunque el mérito es de Jonathan Feinberg, que es el programador de Wordle. Yo el único fallo que le veo es que no te da una lista con la frecuencia de las palabras, que es muy útil si quieres hacer un análisis más fino. Pero por lo demás es una gozada.
Mujerárbol, ya veo que lo has puesto en tu blog. Y Jaaziel, es buen ejemplo el del discurso de Obama con Black y White bien grandes (pero Black un poquito más grande que White)
4 / Julio / 2008 a las 4:46 pm |
Sí.
Y es interesante también ver, como ha pesar de nuestro entusiasmo “europeo”, el centro del discurso es “black&white”… que, creo, tiene tan poco que ver con lo “europeo”… ¿o no?
5 / Julio / 2008 a las 12:38 pm |
Bueno, no sé si tendrás tiempo y ganas para contestar, pero ¿cómo consigues guardar las nubes como jpg? Tal y como aparece en la galería o con el código generado son muy pequeñas y apenas pueden distinguirse.
¿como puedes ampliar la imagen sin perder definición?
Bueno.. si alguien me puede contestar, agradecido estaré.
5 / Julio / 2008 a las 3:35 pm |
Veo una utilidad principal : medir cuándo no se dice nada.
En una de las novelas de fundación de Asimov existía un analizador de discursos para entresacar el mensaje o sentido último de lo que se decía.
Con un pequeño guiño matemático podríamos definir una categoría ascendente de nube-objetos del siguiente modo:
Si pasamos el filtro = palabras comunes + jerga especializada para despistar, los conjuntos de medida nula sería las 0-nubes.
¿Alguien se anima a extender la definición a las ‘n-nubes’?
(Perdón por la broma no he podido resistirme
Saludos
5 / Julio / 2008 a las 10:17 pm |
Panta, yo me basaba en la presunción de los discursos de los políticos son tan vacuos que con la nube ya vale. Vamos, que les daba ya la medida cero de entrada… Eso sí, es útil ver la diferencia en la jerga y los tópicos que se manejan entre unos y otros políticos.
Serenus, para guardar como jpg la única manera es una captura de pantalla. Puede hacerse con la tecla de “imprimir pantalla” pero te capura toda la pantalla, si le das a la vez “alt” te captura sólo la ventana activa. Luego lo pegas donde quieras con “cntrl+v”.
De todos modos lo mejor es usar algún programa gráfico para recortar, y si éste tiene la opción de capturar área, mejor. Pero en la galería de wordle no quedan pequeñas, me parece a mí.
6 / Julio / 2008 a las 11:43 am |
Gracias, hombre¡
6 / Julio / 2008 a las 3:55 pm |
Coincido en que no es un detalle la forma de presentarlo. Este formato pega duro, es viral. Muy bueno el hallazgo.
8 / Julio / 2008 a las 7:16 am |
Muy interesante y geniales tus comentarios. Puedo hacer referencia a tu entrada en mi blog?
Gracias!
8 / Julio / 2008 a las 3:07 pm |
Claro, María. Basta con que lo enlaces.
18 / Julio / 2008 a las 5:10 pm |
Lo he probado con mi tesis y con un par de artículos, funciona de miedo. Tenían que dar la posibilidad de eliminar algunas palabras gazapo que se cuelan…
Lo veo como el germen de un creador de mapas conceptuales…de palabras sueltas a palabras relacionadas por distancia hay un corto trecho…
Vinculado y comentado en http://uamblogger.blogspot.com/2008/07/hbitos-20-en-ciencia.html
18 / Julio / 2008 a las 10:45 pm |
Gracias, Roke, por el aviso, lo acababa de ver en tu blog. Muy buena la idea de aplicarlo a la tesis. Sobre la creación automática de mapas conceptuales sé que están trabajando los de la web semántica, que se dedican a unas cosas que llaman “ontologías”… pero nunca lo he acabado de entender. De momento, es verdad que wordle da un mapa de “orden cero”, como diríamos en física, que ya está muy bien.