Supercomputación, biología y medicina. Entrevista a Alfonso Valencia

Equipo de Hospitecnia | FEBRERO 2022
Artículos Tecnología Big Data Hospital digital Inteligencia Artificial Supercomputación, biología y medicina. Entrevista a Alfonso Valencia

Alfonso Valencia es biólogo de formación y es el actual director del Departamento de Ciencias de la Vida en el Barcelona Supercomputing Center - Centro Nacional de Supercomputación. Es investigador y profesor de la Institución Catalana de Investigación y Estudios Avanzados (ICREA). Su investigación se centra en el estudio de sistemas biomédicos con enfoques de biología computacional y bioinformática.

En el Centro Nacional de Supercomputación de Barcelona lidera un equipo de más de 135 personas entre ingenieros, informáticos, biólogos y científicos que abordan temas de tanto interés como la genómica, la biología de redes, cuestiones ligadas a la medicina personalizada, al desarrollo de fármacos, para poner sólo algunos de los temas que se tratan cuando se unen campos de conocimiento como la biología, la medicina y las tecnologías de la computación.

Nos reunimos con él en un momento donde el BSC proyecta su crecimiento con un nuevo supercomputador, el Mare Nostrum 5, que lo convertirá en una de las infraestructuras con más capacidad de Europa.

 

¿Qué es la bioinformática y cómo ha cambiado en las últimas décadas?

La bioinformática nació cuando se empezaron a recopilar datos de ADN y proteínas. Era necesario empezar a pensar cómo registrar y qué hacer con esos datos, y aquí es donde nacen los primeros programas y la bioinformática. Es decir, que en sus inicios la bioinformática se centraba en la organización y el tratamiento de datos biológicos, principalmente de datos moleculares.

A partir de los años 1990, la secuenciación del genoma de todo tipo de organismos genera un alud de datos. Ante este desarrollo de la genómica, la bioinformática se muestra muy necesaria e influyente. Todavía hoy, la genómica sigue siendo una de las áreas de la biología que más datos genera, y gran parte de la bioinformática se ha encaminado a problemas de genómica.

En los últimos años, estamos asistiendo a una mezcla entre lo que antes era la bioinformática y la informática médica. Podríamos decir que estas son las dos grandes evoluciones de la bioinformática: un nacimiento con pocos datos y con algunos datos moleculares, luego la genómica (que sigue siendo un área muy importante de trabajo) y en los últimos años una aproximación imparable a la medicina y a los datos médicos.  

Podríamos definir actualmente la bioinformática como aquella área del conocimiento que aplica tecnologías computacionales en el registro y análisis de datos biomédicos.

 

¿Qué proyectos desarrolláis que sin una infraestructura como un supercomputador no se podrían llevar a cabo?

Ahora mismo, los datos biológicos o biomédicos no son la fuente de datos más importantes del mundo, pero sí que es el área que crece más rápidamente.

Para poner un primer ejemplo, el Barcelona Supercomputing Center alberga el Archivo Europeo de Genomas y Fenomas (EGA), que es el repositorio de datos genómicos de referencia en Europa que garantiza su seguridad y permite su uso en la investigación. Se trata de los datos genómicos de 100.000 personas sanas y de personas que presentan fenotipos de enfermedades de todo tipo, que han autorizado el uso de sus datos en el marco de investigaciones científicas. Estos datos se ponen a disposición de la comunidad científica mundial.

Hay campos de conocimiento que serán fundamentales en el futuro de la medicina que requieren de gran capacidad de computación para analizar datos. Un claro ejemplo es la capacidad de analizar informes médicos a través del procesamiento de lenguaje natural. Es una cuestión muy compleja, como también lo es la capacidad de lectura de imágenes médicas a través de la computación.

A parte de esta capacidad de análisis de datos, otro campo en el que es necesaria la capacidad de computación de nuestra institución es el campo de las simulaciones. Es una cuestión que en biología no se realizaba hasta muy recientemente, ya que no existían datos suficientes para validar modelos. Ahora empieza a ser posibles, tanto en campos como son la simulación de proteínas y de fármacos, como otras a nivel celular, que es en las que estamos más interesados.

Uno de los objetivos que tenemos actualmente es simular un sistema de 1.000 millones de células que interaccionen recreando el espacio que ocupan, donde se encuentran y las condiciones y la dinámica de flujos en las que se encuentran. Se trata de preparar una simulación de lo que está pasando en una célula, de todo su metabolismo. Tenéis que pensar que un órgano tiene muchísimas células más, esto solo es una simulación a pequeña escala que ya requiere de una gran capacidad de computación.

Poder realizar simulaciones de este tipo nos permite saber qué efectos puede tener un fármaco o una hormona. Es necesaria la capacidad de un superordenador para poder gestionar la gran capacidad de datos generados.

De hecho, ante los retos actuales requerimos un nuevo supercomputador ya que el MareNostrum 4 empieza a estar en los límites de sus capacidades.

 

¿Qué investigaciones habéis terminado estos últimos años que ya son trascendentales? ¿Qué proyectos tenéis entre manos y cómo los lleváis a cabo?

Uno de los campos en que estamos investigando algunos grupos del Barcelona Supercomputing Center es el diagnóstico por la imagen. Utilizamos tecnologías de machine learning y aplicaciones de tratamiento de imagen. Se trata de un campo de interés que puede abarcar muchos problemas: desde proyectos de análisis de imagen con baja resolución, a diagnóstico de tumores en imágenes de radiografías. Este tipo de proyectos solemos desarrollarlos en colaboración con hospitales.

Con el Hospital Clínic de Barcelona estamos trabajando en los recursos que ofrece el procesamiento de lenguaje natural. Desde mi punto de vista es asombroso lo bien que funcionan las nuevas tecnologías de lenguaje natural en “medical records” a pesar de que es un lenguaje “extraño”, con frases que no son frases exactamente, que acumulan abreviaciones, etc. En el Clínic, además, tenemos la mezcla de catalán, castellano e inglés que convierte el proyecto en todavía más interesantes. El Clínic cuenta con sistemas de notación automática que han ido evolucionando. Actualmente, las notaciones automáticas son validadas por personas expertas. Actualmente seguimos trabajando en cuestiones relativas a la sintomatología de los pacientes, un aspecto con muchas más variables que requieren de tiempo. No se está inventando nada, pero sí que se está innovando a partir de cosas que ya existían y nuevas tecnologías actuales. Ahora podemos extraer toda esa información acumulada (existente) en los medical records y, con el tiempo, será algo muy útil para la medicina.  

Para poder seguir leyendo y poder descargar esta entrevista en PDF debe iniciar sesión o darse de alta grauitamente en el portal.

Para poder escribir un comentario debe iniciar sesión o darse de alta en el portal.

Patrocinadores Platino

Patrocinadores Plata