Análisis de los gráficos de conocimiento para descubrir medicamentos para la COVID-19

Jacob Al-Saleem , Senior Data Scientist

CAS Biomedical Knowledge Graph thumbnail image

Acelerar las oportunidades para encontrar nuevos tratamientos para la COVID-19

Actualmente hay pocos tratamientos aprobados para tratar la COVID-19, pero, dado que desarrollar tratamientos nuevos puede llevar décadas y costar miles de millones de dólares, ¿se podrían reposicionar algunos medicamentos ya existentes para usarlos como nuevos tratamientos? El informe más reciente de CAS Insights muestra cómo revelan los gráficos de conocimiento de CAS nuevos conocimientos e informaciones que identifican algunos medicamentos que se podrían reposicionar.

El reposicionamiento de fármacos es esencial para desarrollar tratamientos con más rapidez, pero recopilar toda la información y las conexiones importantes de los nuevos virus, proteínas, dianas y vías, junto con la información clínica, puede resultar difícil. En esta entrada veremos cómo pueden ayudar los gráficos de conocimiento de CAS a identificar los candidatos clínicos con más potencial para el reposicionamiento como tratamientos para la COVID-19.

¿Qué es un gráfico de conocimiento? 

Un gráfico de conocimiento combina datos de fuentes dispares para crear un modelo de un área concreta. Describe los datos en forma de nodos y aristas. Los nodos representan cada punto de datos y las aristas, las relaciones que existen entre ellos. La imagen siguiente proporciona un ejemplo simplificado de un gráfico de conocimiento que predice los fármacos que podrían inhibir la inflamación vascular. 

Gráfico de conocimiento de CAS que muestra los nodos y las aristas de conexión de los datos

Figura 1. Ejemplo de un gráfico de conocimiento que muestra las conexiones entre los datos por medios de nodos y aristas.


Las bases de datos tradicionales permiten ver únicamente las conexiones directas (inhibidores directos del factor de transcripción STAT3), pero un gráfico de conocimiento puede mostrar conexiones de datos más profundas. En este ejemplo, el gráfico de conocimiento presenta inhibidores que actúan en puntos posteriores del proceso.

Un análisis profundo de la COVID-19: descubrimiento de fármacos de moléculas pequeñas

CAS Biomedical Knowledge Graph combina datos seleccionados por expertos en CAS Content CollectionTM con datos biomédicos disponibles públicamente. 

Contiene datos de alta calidad de más de 6 millones de moléculas pequeñas, 24 000 enfermedades y 26 000 genes víricos y humanos. Un gráfico de conocimiento revela información que no sería posible obtener con los métodos de investigación tradicionales. 

Nuestra estrategia incluyó dos componentes básicos para encontrar posibles tratamientos farmacológicos para la COVID-19:

  • Los científicos de CAS identificaron 20 procesos biológicos vinculados a la COVID-19. Entre estos procesos se incluyeron la coagulación de la sangre, la entrada del virus y la endocitosis. Un nodo de la enfermedad representaba la "tormenta de citocinas", un aspecto importante de los casos graves de COVID-19.
  • Cambios en la expresión de los genes documentados en la bibliografía. En concreto, genes cuya expresión se potencia significativamente con la infección por SARS-CoV-2. Se usaron para identificar procesos biológicos relevantes y los procesos asociados con 4 o más de estos genes. Entre estos procesos se incluyeron la respuesta inflamatoria, la angiogénesis y la regulación negativa de la transcripción de ARN.
Componentes de datos empleados para crear el gráfico de conocimiento de CAS

Figura 2. Diagrama que describe la estrategia de dos componentes empleada para identificar posibles fármacos de moléculas pequeñas para tratar la COVID-19.

Con la ayuda del gráfico de conocimiento, identificamos:

  • Las moléculas pequeñas que tienen relaciones de inhibición o activación con estos procesos biológicos
  • Las moléculas pequeñas que inhiben los genes cuya expresión se ve potenciada por la infección

El análisis identificó 1350 moléculas pequeñas que podrían tener potencial para el reposicionamiento como tratamiento de la COVID-19.

Evaluación de nuevos posibles tratamientos para la COVID-19

Una vez identificadas las moléculas con potencial, evaluamos la fuerza de sus conexiones y aumentamos sus puntuaciones proporcionalmente. Lo hicimos utilizando un nuevo método algorítmico para clasificar cada molécula. La ecuación evaluó las relaciones existentes entre las moléculas pequeñas y las interacciones con los genes y los procesos biológicos identificados en nuestro método de dos componentes. 

Por ejemplo, una tormenta de citocinas se consideró una conexión importante. A continuación, evaluamos las relaciones existentes entre las moléculas pequeñas y las interacciones con los genes y los procesos biológicos identificados en nuestro método de dos componentes. Se asignaron incrementos de la puntuación a conexiones importantes, como la tormenta de citocinas y las moléculas pequeñas que tienen una relación de activación con los genes, dado lo infrecuentes que son estos casos.

De este modo, pudimos confeccionar una tabla de clasificación con todas las moléculas pequeñas y presentamos las 50 con mayor puntuación en el informe técnico. En la figura 2, puede ver los 10 fármacos candidatos que recibieron una puntuación mayor en los resultados. El tamaño del nodo es proporcional al número de conexiones con otros modos.

diagrama de red de gráfico de conocimiento con los diez fármacos candidatos con las puntuaciones más altas para el tratamiento de la COVID-19
Haga clic para ampliar" data-entity-type="file" data-entity-uuid="8b0840af-ea59-4d98-b438-1c0a04ae9f44" src="/sites/default/files/inline-images/knowledge-graph-network-diagram.png" />

Figura 3. Diagrama de red que muestra la conexión de los 10 fármacos candidatos con las puntuaciones más altas en los resultados. El tamaño del nodo es proporcional al número de conexiones con otros nodos.

De los 50 fármacos con puntuaciones más altas identificados en la tabla de clasificación, 11 se están estudiando actualmente en ensayos clínicos como tratamientos para la COVID-19. Esto valida nuestros resultados. 

Nuestro gráfico de conocimiento biomédico revela cuatro clases de fármacos que se han relacionado anteriormente con el SARS-CoV-2 o con los mecanismos de infección generales de los virus.  Las cuatro clases de fármacos son:

Inhibidores de cinasa

Esta fue la mayor clase de fármacos encontrada en nuestros resultados. Las cinasas participan en casi todos los procesos biológicos y sus actividades se desregulan en muchas enfermedades. Los receptores de tirosina cinasa intervienen en la entrada de muchos virus en las células. Entre los inhibidores de cinasa identificados, se incluyen los que afectan a los receptores de tirosina cinasa, como los receptores EGF, FGF, PDGF y ALK, además de las tirosinas cinasas no receptoras, como la tirosina cinasa de Bruton. En el gráfico de conocimiento también se identificaron inhibidores de serina-treonina cinasa que actúan sobre los receptores B-RAF, PKC, PIM y GSK-2beta. 

Inhibidores de histona deacetilasa (HDI)

Los HDI regulan la expresión de los genes reduciendo la desacetilación de las histonas. Los HDI reducen la expresión tanto de la enzima convertidora de angiotensina 2 (ECA2) —el principal receptor del SARS-CoV-2 en la superficie celular— como de la glucosiltransferasa de ABO, una enzima que ayuda a regular el tipo de sangre, un factor de riesgo conocido para la COVID-19. Los HDI también regulan varias de las quimiocinas y citocinas que intervienen en la respuesta inmunitaria a la COVID-19. Por tanto, parece lógico que esté entre los resultados.

Agentes reguladores de microtúbulos

Los microtúbulos son filamentos compuestos por subunidades de tubulina. Algunos estudios han mostrado que las proteínas del SARS-CoV-2 interactúan con los microtúbulos o con proteínas asociadas a los microtúbulos. Nuestros resultados revelaron que los agentes que regulan los microtúbulos, como docetaxel, colchicina y mebendazol, pueden ser útiles para detener la infección por SARS-CoV-2. La colchicina ya se está estudiando en varios ensayos clínicos para el tratamiento de pacientes con COVID-19.

Inhibidores de la proteasa

De los inhibidores de la proteasa identificados, la mayoría resultaron ser inhibidores de proteasomas. Varios estudios han mostrado que el sistema ubiquitina-proteasoma participa en la replicación del virus y en la tormenta de citocinas en diversas enfermedades, incluidas las asociadas con los coronavirus. Los inhibidores de la proteasa son una elección lógica para la exploración relacionada con la COVID-19. De hecho, varios de estos inhibidores ya se están investigando como posibles tratamientos para la COVID-19. Algunos de ellos aparecieron en nuestros resultados, como bortezomib, carfilzomib y saxagliptina.


El poder de las conexiones

La metodología de nuestros gráficos de conocimiento mejora la identificación de candidatos farmacológicos para el tratamiento de la COVID-19 y tendrá un gran valor para el descubrimiento de fármacos en otras enfermedades, como el alzhéimer, el párkinson, los trastornos autoinmunitarios, el cáncer e incluso algunas enfermedades raras. Nuestros gráficos de conocimiento son ampliables y modulares y ofrecen un gran valor para todas las áreas de la ciencia, como la química, la nutrición y las energías renovables. Las oportunidades son innumerables.