Skip to Content

Spammers Relevantes

Hace tan sólo unos días noté que el tráfico de mi blog crecía de repente y al investigar encontré que la razón fue un lector que publicó un vínculo en el popularísimo Meneame. Para quienes no lo conocen es un agregador de noticias simil Digg donde la idea es que sean los usuarios de la comunidad los que propongan y promuevan noticias, esto se hace mediante votos, las mejores noticias llegan a "publicarse".

Mientras entraba a revisar lo que había aparecido en Meneame descubrí que varios usuarios marcaban como "spam" el artículo lo que me llamó poderosamente la atención por lo que me puse a leer la ayuda a ver qué significa eso, según el propio Meneame:

Un error típico suele ser enviar artículos de tu blog sin parar. Algunos usuarios lo consideran de mal gusto y lo votan como "spam". No tiene nada de malo enviar del propio blog; pero es mejor enviar sólo los artículos que consideres más interesantes y no abusar, procurando que la proporción de envíos de tu blog sea baja respecto al total de tus envíos.

Ok, es lógico, pero cómo puede ser spam si es el primer artículo que se publica? y si no soy yo además el que publica, como es esto?

Lo dejé pasar... y de repente salió otro artículo y otro más (gracias quien quiera que seas) y todos respondieron al mismo patrón, me surgió entonces hacer una investigación un poco más seria y me puse a prestar atención a las noticias que van a apareciendo, noté que en TODAS ellas hay un grupo de usuarios que votan siempre, son siempre el mismo grupo y votan en sintonía entre ellos, miré entonces el patrón de votación de estos usuarios, y encontré algo realmente interesante: estos usuarios votan en forma negativa alrededor del 85% de las noticias que se publican.

Es un número impactante, y algunas observaciones que puede hacer mediante medición:

  1. Son usuarios que están constantemente conectados, votando.
  2. En el peor de los casos hay un usuario de los que estudié que vota negativas al 100% de las noticias.
  3. No suelen publicar noticias.
  4. Las razones de votar en forma negativa nunca son claras, de hecho todo indica que no se preocupan siquiera en leer los artículos, directamente votan en forma negativa.
  5. En términos de Meneame: tienen una "entropía" del alrededor del 50%, es decir, publican enlaces de muy pocas fuentes (es lógico, se conjuga con el punto 3). Hacen exactamente lo que aparentemente quieren combatir.
  6. Su alta influencia en el destino de una noticia viene porque la votación da puntos ("karma" en términos Meneame) y un usuario con muchos puntos influye más que otro con pocos.

Así, por la forma en que funciona el algoritmo de Meneame, toda noticia a la que estos usuarios votan en forma negativa será dada de baja, primero porque son usuarios que tienen reputación según la lógica de Meneame y segundo porque generan el efecto copia, otros usuarios votan como ellos, son en cierta forma generadores de opinión.

Y más allá de los números que muestro donde estudié un sitio X, estoy convencido que esto no es culpa del creador de Meneame, ni tampoco es culpa de la comunidad, ni tampoco es un problema de este servicio, es un problema que todos los sitios de comunidades tienen, este tipo de usuarios existen y son dañinos para la comunidad. Son lo que yo llamo Spammers Relevantes.

Por qué es importante este grupo de gente? si nuestra próxima búsqueda es la de la la reputación de las personas, cómo vamos a lidiar con ellos?, Mariano se lo pregunta perfectamente, concuerdo en cada pregunta, y más aún creo que el post que estoy escribiendo se complementa con el de Mariano donde habla justamente de este problema, distorsionan el valor de una comunidad, el hecho que sean Populares no implica que sean Relevantes a lo que estamos buscando. Estamos hablando de "votantes" o "posteadores", o como queramos llamarles, compulsivos: la versión 2.0 de los "opinólogos".

Por otro lado, ser influyente es una responsabilidad, Eduardo nos lo demostró en los últimos días corrigiendo una entrada de ALT1040 que él consideró equívoca y dando las explicaciones del caso.

El algoritmo definitivo que nos permita de cierta forma estimar la reputación online de una persona es todo un desafío sin lugar a dudas, requiere procesar gran cantidad de información y tener en cuenta estos problemas, que un usuario publique 10.000 twits por día o tenga 10.000 amigos en Facebook no significa que sea una persona que "sepa" de algún tema o que valga la pena escucharla.

Necesitamos inteligencia artificial... o un ejército de monos

Sin respuestas para “Spammers Relevantes” Deje un comentario ›

Deje una respuesta

Seguime en Twitter