Qué hace un físico con las estadísticas del blog (1)

¿Qué hace la gente con las estadísticas de su blog? Todo depende del carácter y la formación de cada uno. Casi todos curiosean; algunos, con el ego típico del gremio, las publican 😉 ; y luego estamos los físicos, que queremos entenderlas. Voy a explicar cómo.

Para entender cualquier cosa (por ejemplo: ¿qué es lo que hace que unos posts tengan más éxito que los otros?) siempre empezamos haciendo una gráfica:
posts3.jpg

Aquí cada punto es un post y hemos representado su número de visitas en función de su antigüedad (la llamaremos A). Obtenemos una bonita nube (en forma de pez, diría yo), en la que ya se ve alguna cosa interesante.

Ante todo, en vertical (obsérvese la escala logarítmica), destacan sobre la nube principal los “grandes éxitos”. Se ven también los “gaps” de agosto de 2007 (A ≈ 180) y de agosto de 2006 (A ≈ 550) como bandas verticales vacías. Y está claro que hay dos regímenes distintos, con una prehistoria antes del verano del 2006 (A > 600). Para fechas más recientes, los puntos son más densos (publico mucho más) y la nube se contrae por abajo (no hay pots huérfanos que no lee casi nadie). Esto último indica que hay unos lectores fijos, y que son cada vez más, porque según nos acercamos a la actualidad (a A = 0) el borde inferior de la nube sube.

¿Qué ocurre con el borde superior de la nube? Dejando al margen los puntos anómalos (“meneados” hacia arriba) parece que el borde superior sube cuando crece la antigüedad, para alcanzar quizá un máximo hacia 300 y luego decaer. Esto indicaría que los posts antiguos tienden a tener más visitas, pero los muy antiguos tienen menos. No está muy claro, porque hay mucho ruido, pero promediando por meses -les ahorro la gráfica- se confirma que en la región “histórica” (A< 600) eso es cierto.

Hay una explicación obvia: los post antiguos tienen más visitas porque han tenido más tiempo de ser vistos. Pero ¿por qué los muy antigüos tienen menos visitas? Probablemente porque las visitas a un post decrecen con el tiempo después de su publicación. Eso no influiría si el tráfico (el número total de visitas) fuera constante, pero no lo es, porque ha crecido mucho desde A = 600 a la actualidad. De modo que la mayoría de visitantes, que son nuevos, no leen posts muy antiguos.

¿Es esta la explicación? Llegado a este punto, un físico pasa a la segunda etapa: hacer un modelo. He armado un modelito suponiendo que:

  1. El tráfico total ha venido creciendo exponencialmente (para A < 600), y que
  2. Las visitas a un post determinado decrecen exponencialmente con el tiempo desde su publicación (en realidad, como el tráfico aumenta, no es el número absoluto de visitas, sino la fracción del total que ve el post la que decrece).

No puedo explicar mucho más sin colgar el cartel de explicith maths, así que sólo diré que ajustando los parámetros del modelo se consigue que la gráfica de visitas tenga un máximo, que puede situarse en A = 300… : ¡funciona!

¿Qué hago ahora? Me pongo contento porque el juguete me ha funcionado, pero no puedo ir mucho más allá: el crecimiento del tráfico del blog no es realmente exponencial, sino que tiende a saturarse en los últimos meses, el modelo de decaimiento exponencial de las visitas a un post no tampoco muy correcto (las visitas no tienden estrictamente a cero con el tiempo), y además todo es discreto en vez de contínuo… en fin, todos esos incordios que se resumen en que las vacas no son esféricas.

Pero lo peor es que sólo explicamos el difuso máximo de la nube, y no que salga una nube: el modelo da una curva suave, en la que post de la misma antigüedad deberían tener la misma popularidad. Algo que no se parece nada a lo que ocurre en realidad. Seguimos sin tener ninguna explicación de las diferencias de popularidad entre posts.

¿Qué hace en este momento el físico? Recurrir a la bibliografía. Y resulta que sí hay un modelo que describe muy bien las estadísticas del blog… (continuará).

Esta entrada fue publicada en Blogs, estadistica, fisica. Guarda el enlace permanente.

12 respuestas a Qué hace un físico con las estadísticas del blog (1)

  1. Y ahora el estadístico pide un índice de ajuste del modelo. Porque tú no quieres explicar los datos, sino una elevada proporción de la variabilidad de los mismos, preferentemente de un modo parsimonioso. Y ya, para completar, que aportes pruebas de que se trata de un modo generalizable.

    Voy limpiando la lupa para leer el siguiente post. 😉

  2. Juanjo dijo:

    ¡Con anotaciones así harás que la nubosidad aumente!

  3. pseudopodo dijo:

    Topo: en estos datos (quitando los puntos atípicos debidos a “meneos” y similares) hay dos variabilidades: (1) el “ruido” que hace que sea una nube en vez de una línea de puntos, y (2) la tendencia al alza en promedio con la antigüedad.

    El modelo que menciono aquí pretende explicar (2), pero no puede explicar (1) que es con mucho la mayor variabilidad. De modo que no recoge lo esencial de “la física del problema”. Por eso tampoco me he molestado en calcular un índice de ajuste (sé que es un modelo de juguete, lo único bonito que tiene es que es muy sencillo: la virtud de la parsimonia).

    Miedo me da tu lupa, porque el próximo modelo es un poco peculiar 🙂

    Juanjo, me temo que con anotaciones así la nubosidad va aumentar… pero con más puntitos bajo la tripa del pez.

  4. ayreonauta dijo:

    Sólo una corrección: el gráfico no tiene forma de pez, si no de pez virtual despresuri-pixelándose hacia el vacío.

  5. ARP dijo:

    Siento meterme aquí de rondón, pero necesito ayuda autorizada para confirmar estos que decían en Microsiervos
    Es una discusión con un amigo y necesito el argumento de autoridad.

    Saludos

  6. Javier dijo:

    ARP. ¿es un truco para que vayamos a Microsiervos? … Yo no soy físico y para mi la fuerza de Coriolis no es más que un término de derivación en la regla de la cadena para cambios de sistemas de referencia (ergo, soy matemático). En efecto, tal y como yo lo veo, lo del grifo es una leyenda urbana. He ido bastante al hemisferio sur y te aseguro que el agua del váter y del desagüe van como aquí, unas veces al diestro y otras al siniestro.

  7. pseudopodo dijo:

    Hola, ARP,

    Me encanta ser la voz del argumento de autoridad… los de Microsiervos tienen razón, punto por punto. La fuerza de Coriolis si que afecta de esa manera a las masas de aire (anticiclones y borrascas) pero en el agua es mucho más pequeña que otros efectos.

    Por cierto, que recuerdo de pequeño un concurso en la TV en el que contaban una historia de alguien a quien secuestaban, narcotizaban, tapaban los ojos, ysin embargo averiguaba que se lo habían llevado al hemisferio sur ¿cómo? Había que responder que por la dirección del remolino del desagüe…

    ¿Hay alguna apuesta de por medio en la discusión?

    Javier, si para un físico la vaca tiene simetría esférica, para los matemáticos… ¿es quizá un conjunto conexo topológicamente equivalente a un toro? 😉

    Ayreonauta, es verdad, el pez se está desintegrando… quizá en sus átomos constituyentes. Pero eso lo podéis arreglar los lectores visitando las páginas adecuadas para que se recomponga. ¿Bonito problema, eh? (por cierto, bienvenido).

  8. Javier dijo:

    La verdad es que el chiste de la vaca yo lo había escuchado con el matemático proponiendo la vaca esférica. Obviamente, si tenemos en cuenta el conducto desde la boca al tracto rectal (hay que ignorar varios esfínteres para ello, pero siempre podemos hacer como los físicos), vaca o toro dan igual, todos son una taza de café. Las de caldo se van a otra clase de homotopía (las deberían llamar estantes, pero allí anduvieron sosos lo topólogos). Para un veterinario hay marcadas diferencias entre vaca y toro. El torero opina lo mismo.

    Analíticamente, vaca y toro son bien distintos (toro as in doughnut), ya que el segundo es bien regular y la vaca tiene al menos dos singularidades, una en el extremo de cada cuerno.

    Cuando los Simpson viajaron a Australia, en el cuarto de baño de su embajada tenían un dispositivo para darle la vuelta al remolino, de forma que fuera más americano.

  9. pseudopodo dijo:

    Yo también había oído la versión que dices tú, y era el físico el que proponía usar el agua desplazada para medir el volumen. El ingeniero lo que decía era: “es muy sencillo, sólo hay que encontrar la tabla de la vaca, se mira el resultado y ya está” . Por lo que yo sé de los ingenieros esa es la versión que da en el clavo, claro, pero para este post me venía mejor la que he enlazado (uno, que no tiene orgullo corporativo).

    Me ha hecho gracia lo de la singularidad del cuerno (¿vendrá de ahí lo de “vete al cuerno”?) pero pensando sobre el asunto, he caído en que topológicamente la vaca no es como la taza de café: ¡no nos habíamos fijado en los agujeros de la nariz! Y más aún, otro problema: ¿no modifica el piercing la topología?

  10. Javier dijo:

    A ver si va a resultar que la vaca es una plasmación física de los anillos de Borromeo. [Receta topológica: para deshacer un nudo, subir a dimensión cuatro. Es como lo de Alejandro Magno pero en listo.]

  11. Pedro dijo:

    Os confirmo que hay diferencias entre un toro y una vaca…soy veterinario

  12. María Julia dijo:

    ¡Hola! Me gustó mucho tu explicación. Me divertí un rato leyendo las cosas que un físico puede hacer. Soy física y estoy terminando la licenciatura en Argentina. Espero que sigas siempre motivado. Este post es antiguo, pero no debe ser muy antiguo porque sino no lo estaría leyendo, según tus cálculos, jajaja. Besos.-

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s