Sobre la web semántica y los artefactos para informarse e investigar

La literatura médica es una jungla de millones de estudios. ¿Cómo buscar y manejarse en esta selva? El problema de la búsqueda de información relevante y de calidad en medicina es sólo un caso particular del problema al que se enfrentarán los buscadores de Internet en los próximos años. Las listas interminables, ordenadas por fechas o por popularidad, son desalentadoras e insuficientes. ¿No podría alguien hacer un resumen de lo que dicen todos esos artículos? En los próximos 10 años, la mayoría de las búsquedas serán habladas, asegura Peter Norvig, director de Investigación de Google. Y apunta que el resultado de estas búsquedas ofrecerá un resumen de las principales aproximaciones, contrastará sus diferencias, traducirá automáticamente los documentos a la propia lengua y ordenará los resultados por relevancia e incluso por la calidad de los documentos. La interacción con los buscadores, según Norvig, se parecerá a una conversación, una continua conversación perfectamente integrada con las demás tareas cotidianas.

En 2009 se catalogaron en PubMed 830.000 artículos de biomedicina, frente a los 814.000 de 2008 y los 772.000 de 2007. El archivo de literatura biomédica es ya ingobernable, inasequible e indigerible. Y no sólo para los médicos, que son un caso único de sobreinformación que no se da en ninguna otra profesión. Para ellos es sencillamente imposible estar al día, y por eso los resultados de la investigación clínica tardan casi una década en llegar a la práctica. También los investigadores sufren los efectos de la sobreinformación. Cualquier área es una maraña de publicaciones que va a crecer más con el despegue de los países asiáticos, cuyo presupuesto en investigación ya ha superado al de Europa y pronto superará al de EE UU. PubMed ha introducido herramientas para saltar de un artículo a otros similares, o enlazar los que se citan entre sí. Pero no parece suficiente. La investigación es demasiado cara como para pasar por alto lo que otros han hecho, sus hipótesis y los datos que las avalan o desmienten. Los investigadores y expertos en gestión documental apuestan por introducir herramientas que simplifiquen la tarea de leer y revisar montañas de artículos.

Para un artefacto que explore la red, el desafío está en captar el sentido de la lectura y extraer lo esencial. Esta es la idea de la web semántica: añadir metadatos y esquemas conceptuales para que las máquinas puedan hacer una lectura inteligente. En biomedicina, ya empiezan a surgir algunas aplicaciones, como la Semantic Web Applications in Neuromedicine (SWAN), desarrollada para ayudar a los investigadores a concentrarse en los artículos más relevantes, a encontrar relaciones no obvias entre ellos y a generar nuevas hipótesis. Hasta no hace mucho, la lectura de los trabajos nuevos en un área estaba al alcance del cerebro humano, pero esto ya es imposible. Y parece que ha llegado el momento de poner a punto máquinas que nos ayuden a pensar e investigar, es decir, que puedan leer por nosotros e incluso conversar.