Tendencias21
Una herramienta automática frena el vandalismo en Wikipedia

Una herramienta automática frena el vandalismo en Wikipedia

Investigadores de la Universidad de Alabama en Birmingham (EE.UU.) han creado una herramienta capaz de detectar identidades falsas entre los usuarios que escriben en la Wikipedia. Estas cuentas suelen usarse para escribir a favor de una empresa que paga o para realizar actos de vandalismo contra la información. Por Carlos Gómez Abajo.

Una herramienta automática frena el vandalismo en Wikipedia

Cada vez hay más personas que utilizan varias identidades falsas para escribir textos en la Wikipedia. Las reglas de esta enciclopedia colaborativa estipulan que cada persona puede tener sólo una cuenta, pero la realidad es que Wikipedia no utiliza medios técnicos para que la regla se cumpla.

Estas identidades se pueden utilizar tanto para escribir a favor de una empresa determinada, a cambio de dinero, como para saltarse un bloqueo (en el caso de que la persona haya sido bloqueada por los administradores por vandalismo o mal uso de la Wikipedia); como para crear una opinión mayoritaria fraudulenta sobre algún tema polémico en general, o en el contexto de la edición de Wikipedia.

Actualmente, el proceso para la detección de estas identidades falsas es manual y depende de la experiencia de los administradores, es decir, de que sepan detectar estilos similares de escritura entre varios usuarios aparentemente distintos.

El proceso se complica porque los textos de la Wikipedia suelen ser demasiado cortos como para observar un estilo determinado. Así que la única manera de detectarlas es acceder a las direcciones IP de los usuarios, a las que solo tienen acceso unos pocos administradores, lo que además viola la privacidad de la que presume la propia web.

Llega una solución

Ahora, investigadores de la Universidad de Alabama en Birmingham (EE.UU.) han desarrollado una herramienta automática, que utiliza una base de datos de identidades falsas y los textos escritos por ellas, procedente de investigaciones anteriores realizadas por los administradores de Wikipedia, y que es capaz de detectar a los farsantes sin violar su privacidad.

En un artículo publicado en arxiv.org, Thamar Solorio, Ragib Hasan y Mainul Mizan explican que su herramienta también podrá aplicarse en otros problemas de atribución de autoría de textos cortos, como en la identificación de terroristas en foros web, mensajes de teléfono, tuits y otros ámbitos donde las comunicaciones suelen ser muy breves.

Los investigadores recolectaron datos de 700 investigaciones sobre identidades falsas realizadas por administradores de la Wikipedia. En un ejemplo que citan en su artículo, muestran las similitudes estilísticas de las distintas identidades uno de los autores fraudulentos: no deja un espacio después de cada punto y seguido, sino que empieza directamente con la siguiente frase.

Con este material elaboraron un algoritmo que analiza unas 230 características de escritura, y que logra determinar qué cuentas son falsas con una tasa de acierto, es decir, de concordancia con la decisión de los administradores de la Wikipedia, del 75%.

Mor Naamán, de la universidad Cornell Tech en Nueva York, declara en New Scientist que le gusta el trabajo, y que aún hay mucho margen para mejorar, puesto que el algoritmo utiliza sobre todo rasgos sintácticos y muy pocos marcadores lingüísticos de otro tipo.

En un post reciente publicado en el blog de la Fundación Wikimedia, a la que pertenece la Wikipedia, su directora ejecutiva, Sue Gardner, explica que han bloqueado más de 250 cuentas de usuario por este problema. En el texto, Gardner es especialmente crítica con las empresas que pagan o que encargan a gente escribir artículos o comentarios favorables a ellas en la enciclopedia online por excelencia.

Referencia bibliográfica:

Thamar Solorio, Ragib Hasan, Mainul Mizan: Sockpuppet Detection in Wikipedia: A Corpus of Real-World Deceptive Writing for Linking Identities. arXiv:1310.6772.

RedacciónT21

Hacer un comentario

RSS Lo último de Tendencias21

  • La IA podría ser el límite para todas las civilizaciones avanzadas en el Universo 10 abril, 2024
    Un nuevo estudio sugiere que el desarrollo de la Inteligencia Artificial (IA) hacia una Superinteligencia Artificial (ASI) podría explicar por qué no hemos detectado aún otras civilizaciones avanzadas en el cosmos, a pesar de la alta probabilidad de su existencia: en vez de supernovas, plagas, guerras nucleares o eventos climáticos extremos que hayan sido un […]
    Pablo Javier Piacente
  • Higgs ha podido dejar abierta la puerta a la Nueva Física 10 abril, 2024
    La muerte de Peter Higgs, que pasará a la historia como el descubridor del bosón que explica cómo se forma la materia, deja un legado en la historia de la física que todavía puede aportar algo más trascendente: la prueba definitiva de una Nueva Física más allá del Modelo Estándar.
    Eduardo Martínez de la Fe
  • Descubren neuronas "zombis" en el cerebro, que serían claves en el proceso de aprendizaje 9 abril, 2024
    Las neuronas "zombis" son unidades vivas pero funcionalmente alteradas, que parecen "dormidas" en determinadas situaciones: los investigadores han revelado que cumplen un papel fundamental en el cerebelo, concretamente en aspectos relativos a la forma en la cual aprendemos.
    Pablo Javier Piacente
  • La Luna se invirtió por completo hace más de 4 mil millones de años 9 abril, 2024
    Hace unos 4.220 millones de años, poco después de que la Luna se formara a partir de un trozo de la Tierra que se desprendió durante una colisión violenta a principios de la historia del Sistema Solar, nuestro satélite se dio vuelta y comenzó así una etapa clave de su desarrollo. Así lo ha comprobado […]
    Pablo Javier Piacente
  • Arte rupestre de hace 2.000 años podría representar música psicodélica 9 abril, 2024
    Aunque la música psicodélica moderna no nació hasta la década de 1960, las influencias psicodélicas se pueden encontrar en el arte rupestre de hace miles de años. Grabados precolombinos en piedra, de 2.000 años de antigüedad, reflejan figuras humanas bailando en estado de trance chamánico.
    Redacción T21
  • Descubren antiguas partículas de polvo espacial provenientes de otro sistema estelar 8 abril, 2024
    Los astrónomos han descubierto una rara partícula de polvo atrapada en un antiguo meteorito extraterrestre, que fue formado por una estrella distinta a nuestro Sol. El polvo se habría originado luego de una supernova: las partículas son como "cápsulas del tiempo celestes" y proporcionan una instantánea de la vida de su estrella madre.
    Pablo Javier Piacente
  • Un lejano mundo deja ver una increíble explosión de luz en sus cielos "metálicos" 8 abril, 2024
    Utilizando datos del Telescopio Espacial CHEOPS de la Agencia Espacial Europea (ESA), cuyo centro de operaciones científicas se localiza en la Universidad de Ginebra, en Suiza, un equipo internacional de científicos logró detectar por primera vez un extraño fenómeno lumínico denominado “gloria” en un exoplaneta: el estallido de luz se apreció en WASP-76b, un mundo […]
    Pablo Javier Piacente
  • El ordenador cuántico desembarca en el mundo universitario 8 abril, 2024
    La última computadora cuántica System One de IBM se ha instalado en el Instituto Politécnico Rensselaer (RPI) en Nueva York. Es la primera máquina cuántica de IBM instalada en un campus universitario de Estados Unidos. Una revolución en el mundo académico que impulsa la formación de un ecosistema cuántico global.
    Eduardo Martínez de la Fe
  • Los cocodrilos imitan a las ballenas antes de aparearse 7 abril, 2024
    Los cocodrilos cortejan a las hembras lanzando un chorro de agua al aire, tal como hacen las ballenas cuando salen a la superficie. A ellas les encantan también los silbidos y las burbujas que les dedican sus parejas antes de aparearse. Se está elaborando un diccionario de cocodrilos.
    Redacción T21
  • Los drones policiales se implantan en Estados Unidos 6 abril, 2024
    Chula Vista, un suburbio de San Diego, California, con una población de 275.000 habitantes, es una de las pocas ciudades estadounidenses que utiliza sistemáticamente drones para ayudar a la policía en caso de emergencia. En activo desde 2018, el sistema está sirviendo de referencia a otros Estados y tal vez otros países.
    Redacción T21