Tendencias 21. Ciencia, tecnología, sociedad y cultura




Proyectan un programa informático que detecta las opiniones

El lenguaje de la subjetividad puede ser rastreado informáticamente, aunque esté escondido


El Gobierno norteamericano ha concedido a un consorcio de tres universidades 2,4 millones de dólares para trabajar sobre un sistema informático capaz de extraer, resumir y rastrear información acerca de hechos y creencias a partir de un texto libre. La idea es crear patrones capaces de separar las afirmaciones de los hechos y de detectar estados de opinión no manifestados en los textos que circulan por Internet y otros medios. Con este programa se pretende extraer información de artículos, noticias o cualquier tipo de texto, acerca de, por ejemplo, posibles atentados terroristas, accidentes, adquisiciones empresariales o contenidos virtuales. Por Yaiza Martínez.


Yaiza Martínez
Escritora, periodista, y Directora de Tendencias21. Saber más del autor


Fuente: Proyecto Screen.
Fuente: Proyecto Screen.
Fuente: Proyecto Screen.
Fuente: Proyecto Screen.
Descubrir las verdaderas intenciones que se ocultan tras el lenguaje corriente es lo que pretende un proyecto de sistema informático que será capaz de extraer, resumir y rastrear información acerca de hechos y creencias a partir de un texto libre, informa la Universidad de Cornell en un comunicado.

Será desarrollado por científicos del Cornell Natural Language Processing Group (NLP de la universidad de Pittsburgh, a partir de tres líneas de investigación, según describe una de sus creadores, Janyce Wiebe, que codirige el NLP con Diane Litman y Rebbeca Hwa.

En primer lugar, los especialistas pretenden generar algoritmos fáciles de manejar que automáticamente puedan crear patrones acerca de un tema concreto, con el fin de identificar fenómenos y vínculos asociados a hechos relevantes, como un atentado terrorista.

Para la seguridad nacional

En segundo lugar, se desarrollarán otros algoritmos que permitan distinguir afirmaciones factuales u objetivas de las aserciones subjetivas o no-factuales. También identificarán creencias acordes con determinadas organizaciones y evaluarán la intensidad, la polarización, la motivación y los tipos de actitudes relacionados con dichas creencias.

Por último, se elaborarán métodos de rastreo de la evolución de creencias y sucesos a lo largo del tiempo. Con este trabajo, se esperan descubrir patrones de actividad, cooperación y convicciones en individuos de distinto tipo y en regiones geográficas diversas.

El proyecto ha sido respaldado económicamente por el Department of Homeland Security (departamento de seguridad nacional) estadounidense, que ha acordado una financiación de 2,4 millones de dólares. En el proyecto, que ha recibido el nombre de "Information Extraction of Events and Beliefs from Text", participarán, además de la universidad de Pittsburg, las universidades de Cornell y de Utah.

Las tres universidades forman uno de los cuatro centros nacionales encargados de trabajar en nuevos métodos de análisis de datos para la seguridad nacional. La metodología para detectar opiniones, emociones y expresiones en el lenguaje ha sido explicada en un artículo de la mencionada universidad.

Intención y fiabilidad

El "Information Extraction of Events and Beliefs from Text" pretende analizar el lenguaje natural utilizando las técnicas clásicas de representación (gráfica sujeto-verbo, por ejemplo) y las relaciones de las palabras en las frases (diferentes palabras o grupos de palabras que se refieren al mismo concepto), así como supervisar el aprendizaje. No se pretenden analizar discursos completos, sino más bien oraciones e incluso sólo palabras.

Las nuevas técnicas, principalmente desarrolladas en la universidad de Pittsburgh, en el NLP, permiten distinguir los enunciados relacionados con las opiniones, rastreando dentro de ellos los componentes asociados a categorías preestablecidas, así como la entonación positiva o negativa de las frases e incluso de cada palabra. Permite asimismo evaluar la fiabilidad de cada enunciado.

Una combinación de ciencia computacional y de lingüística hará posible un sistema de análisis de sentimientos y subjetividad, de semántica léxica, de procesamiento del discurso o de extracción de información a partir del lenguaje, y por métodos empíricos. Para ello, resulta esencial un esquema detallado de anotaciones que definan los componentes clave y las propiedades de la expresión de dichas emociones privadas.

Análisis de la subjetividad

Con este programa informático se pretende extraer información de artículos, noticias o cualquier tipo de texto, acerca de, por ejemplo, posibles atentados terroristas, accidentes, adquisiciones empresariales o páginas web.

La tecnología de análisis lingüístico ha sufrido un enorme despliegue en los últimos años, aunque su eficacia es aún relativamente baja debido, principalmente, a que en los textos o en el lenguaje en general la información contenida suele ser de los dos tipos: objetiva y subjetiva.

El lenguaje subjetivo expresa opiniones, juicios o estimaciones. Es muy común en noticias y páginas web, que se han convertido en la primera fuente de análisis de la mayoría de las aplicaciones de extracción de información a partir de los textos.

El objetivo de la investigación es utilizar el análisis de esa subjetividad para crear un sistema de obtención de información más exacto, así como mejorar las técnicas de extracción de información a partir del análisis de la subjetividad en el lenguaje. Así se espera reconocer ciertos cambios en el tiempo, como por ejemplo, un aumento o disminución del grado de agresividad con que se expresan aquellas personas que pertenecen a grupos de interés, o cualquier modificación en su retórica.

Martes, 3 de Octubre 2006
Artículo leído 9353 veces




Nota


Otros artículos de esta misma sección
< >