Un equipo de científicos ha logrado un avance significativo en la comprensión del enigmático “lado oscuro” del genoma, la vasta porción de nuestro ADN que hasta ahora había permanecido en gran parte inexplorada. Utilizando una innovadora herramienta de inteligencia artificial, han conseguido desentrañar la presencia de miles de microproteínas, esas diminutas moléculas con funciones aún por descubrir pero que podrían ser fundamentales para la salud y la enfermedad. Esta investigación no solo redefine nuestra percepción del genoma, sino que también promete revolucionar el diagnóstico y tratamiento de diversas patologías, abriendo un campo de estudio sin precedentes en la biología y la medicina.
Las proteínas son elementos fundamentales para la vida, actuando como componentes estructurales o catalizadores enzimáticos dentro de las células. Toda la información necesaria para su creación reside en el ADN, el manual de instrucciones biológico conocido como genoma. Curiosamente, solo un pequeño porcentaje de este genoma, aproximadamente el 1%, es “codificante”, es decir, contiene las instrucciones para la síntesis de proteínas conocidas. El restante 99%, anteriormente denominado “ADN basura”, ha sido objeto de una intensa investigación y se ha revelado que no es inactivo, sino que alberga elementos reguladores y estructurales vitales para el correcto funcionamiento celular. En este vasto territorio inexplorado, la comunidad científica ha comenzado a identificar regiones que transcriben pequeñas proteínas, denominadas microproteínas, cuya estructura y función precisas son aún un misterio.
A diferencia de las proteínas convencionales, compuestas por miles de aminoácidos, las microproteínas apenas cuentan con un centenar de estos bloques fundamentales. Dada su diminuta escala, estas moléculas eluden los métodos de detección tradicionales, lo que ha dificultado enormemente su estudio. Para sortear este obstáculo, los investigadores se han enfocado en identificar las regiones del genoma que potencialmente podrían generar estas microproteínas, para luego analizar la información genética y buscar indicios de su existencia. Este enfoque, análogo a buscar el hábitat de un ave rara antes de intentar encontrarla directamente, aumenta considerablemente las probabilidades de éxito en su descubrimiento.
El análisis del genoma humano es una tarea monumental. Con sus 3 mil millones de pares de bases, equivalentes a una biblioteca de vastas proporciones, identificar secuencias específicas que codifiquen microproteínas es un desafío formidable para cualquier investigador humano. Además, existen secuencias que simulan ser codificantes pero que, en realidad, son “señuelos” sin función conocida. Para abordar esta complejidad, científicos del Instituto Salk de Estudios Biológicos han entrenado un sistema de inteligencia artificial, bautizado como ShortStop, utilizando secuencias de microproteínas ya identificadas.
ShortStop ha demostrado ser excepcionalmente eficaz en la discriminación de regiones codificantes de microproteínas. Brendan Miller, uno de los autores del estudio, destaca que la potencia de ShortStop radica en su compatibilidad con conjuntos de datos de secuenciación de ARN comúnmente utilizados en laboratorios de todo el mundo. Esto democratiza la búsqueda de microproteínas y permite explorarlas a una escala sin precedentes, tanto en tejidos sanos como en aquellos afectados por enfermedades. Este avance no solo ampliará nuestro conocimiento biológico, sino que también podría conducir a la creación de nuevas herramientas diagnósticas y opciones terapéuticas para afecciones como el cáncer y el Alzheimer.
De hecho, la eficacia de ShortStop ya ha sido demostrada. Los investigadores lograron identificar una microproteína cuya concentración era notablemente más alta en células provenientes de tumores malignos de pulmón. Comparando datos genéticos de tejidos sanos y afectados, descubrieron una secuencia que producía esta microproteína específica, cuya expresión variaba significativamente. Aunque su función precisa aún no se ha dilucidado, esta microproteína podría servir como un biomarcador temprano. Su detección elevada podría indicar la presencia incipiente de cáncer de pulmón, incluso antes de que los métodos tradicionales lo hagan, facilitando un diagnóstico precoz y permitiendo el inicio de tratamientos en etapas tempranas, lo que maximizaría las posibilidades de supervivencia para los pacientes.