Dixired desvela nuevos datos sobre el uso de los robots en el proceso informativo

Ya han dejado claro desde Dixired que su apuesta por los algoritmos y la mecanización de procesos a través de robots que hagan más eficiente el proceso informativo. Por eso han intentado dejar claro en lo que consistirá este vértice de su triángulo a través de su boletín, del que saco estas ideas:

El periodista pasará más tiempo en la calle; el Proyecto i será una guía de destinos con más de 1.000 fuentes en español que se organizarán a través de procesos de web semántica; se optimizará el tiempo de consulta gracias a la categorización en tags, grupos y otros contenedores que generarán hasta 30.000 portadas; la creación del Inforank, un algoritmo informativo propio; el nuevo medio intentará mostrar al lector qué noticias son más importantes de cada tema y quién está informando mejor y todo esto lo realizará con una declarada pluralidad de fuentes

¿Un poco desconcertado? Pues amplio con unas frases sacadas del boletín, que mañana estará disponible al completo en 233 grados:

Mucho más allá de la actualización de los datos, las máquinas van aprendiendo a ser cada día más inteligentes y pueden desarrollar labores básicas, pero masivas, de recopilación y estructuración de información.

Casos de éxito: Topix, Daylife o Google News (que hoy ya pelean entre el Top 10 de los medios más consultados en EE UU) o Wikio, Cunoticias.com y lalistawip.com en España.

Nuestro ‘Proyecto i’ pretende recoger esa filosofía, la de dejar las labores básicas en manos de las máquinas y permitir que los periodistas se dediquen a contar historias y a investigarlas. También la de facilitar la consulta de información y construir un medio de medios donde permanecer informado sobre cualquier tema, lugar o personaje con todas las fuentes posibles.

Hay una parte de nuestro nuevo medio en la que no seremos un destino final sino una buena guía de destinos.

El trabajo de las máquinas estará continuamente supervisado por periodistas, que dictarán reglas, guiarán y enseñarán a las máquinas a realizar y perfeccionar su labor. Algo así como poner a las máquinas al servicio de los periodistas.

EL FUNCIONAMIENTO

1.- Monitorización en tiempo real. A través de ‘bots’ (robots que recorren Internet) se analizarán en tiempo real los RSS de más de 1000 fuentes en español para localizar, catalogar y ordenar las noticias a medida que se vayan generando. ¿Cómo lo haremos? Mediante revolucionarias y novedosas técnicas de web semántica, que “leerán” y “traducirán” los datos de los sites y harán la información comprensible para las máquinas.

2.- Procesamiento. Con estas técnicas analizaremos la información de modo inteligente y la agruparemos en torno a eventos, tags o categorías temáticas, personajes, países, organismos, empresas y grupos.

Los objetivos serán dos, cubrir el mayor ámbito informativo posible y ofrecer la mejor información en el menor tiempo. En total, el Proyecto i contará con más de 30.000 portadas entre categorías, personajes y conceptos de todo tipo. De esta forma, cualquier lector podrá conocer las últimas y más relevantes noticias del tema que más le interese.

3.- El Inforank. Intentaremos dar un paso más con respecto a webs como Google News y dotaremos a los resultados de una jerarquía informativa real. Para ello hemos creado el Inforank, nuestra herramienta estrella y uno de los algoritmos más sofisticados de la Red. El Inforank se basará en una combinación de casi 20 criterios, donde se ponderará en tiempo real la importancia de la fuente con respecto a cada tema y la relevancia de las noticias teniendo en cuenta factores como su interés, impacto, debate, contextualización, notoriedad y vigencia.

4.- Agrupación de noticias. Una vez ponderadas, se agruparan automáticamente las noticias de un mismo tema (gracias a una técnica llamada clustering) elaborando un ránking y destacando la mejor versión. El objetivo, intentar mostrar al lector qué noticias son más importantes de cada tema y quién está informando mejor.

5.- Pluralidad de fuentes. Las fuentes que utilizaremos serán fundamentalmente medios, aunque también se incorporarán contenidos de blogs, publicaciones especializadas, portales, ayuntamientos, etc… Es decir, toda fuente que pueda ser relevante en cualquier categoría temática.

Tengo muchas ganas de ver una versión Beta pero, ¿qué opináis vosotros?

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.