The Anscombe quartet…

La estadísitica trabaja con conjuntos de datos, que generalmente pueden dibujarse como una nube de puntos en un espacio n-dimensional. Su objeto (o al menos uno de sus objetos) es describir esas nubes de puntos de una manera económica mediante unos parámetros que “compriman” la información significativa. Pero, claro está, a veces no se consigue.

Cito aquí del Blog de Juan de Mairena:


Los gráficos de arriba (tomados de aquí, que a su vez lo sacó de acá) corresponden a cuatro conjuntos de datos, conocidos como el Anscombe’s quartet. Coinciden distintos parámetros estadísticos, se “ve” numéricamente que tienen la misma recta de cuadrados mínimos, aunque también se ve claramente en los gráficos que los datos son muy distintos.

No conocía el problema, me lo envía Osvaldo Gonzalez, y es algo así como la pesadilla de su área (data mining, inteligencia artificial). No alcanza con un programa que haga las cuentas y calcule promedios, varianzas, regresiones, errores… para distinguir entre distintos conjuntos de datos. Hace falta mirarlos, o programar algo que mire por uno.

Esta entrada fue publicada en Ciencia. Guarda el enlace permanente.

Deja un comentario

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s