Die Biologische Expressionssprache (BEL) ist eine domänenspezifische Sprache, die verwendet wird, um biologische Interaktionen (und ihre Kontexte) in einem standardisierten, berechenbaren Format zu erfassen. Unter Verwendung eines Korpus von manuell kuratierten BEL-Anweisungen verwenden wir unsere hauseigene Software e(BE:L), um Wissensgraphen mit Hilfe des Datenbankmanagementsystems (DBMS) OrientDB zu erstellen. Obwohl die Benutzer über unseren Graphenspeicher direkt auf das Netzwerk zugreifen können, sind für den korrekten Zugriff auf Schlüsselinformationen fortgeschrittene Recherche-Kenntnisse erforderlich. Zu diesem Zweck haben wir den Biological Knowledge Miner (BiKMi) konstruiert, eine Webanwendung, die die von e(BE:L) generierten RESTful-API-Funktionen nutzt, um den Benutzern einen Überblick über die im Modell verfügbaren Informationen sowie Werkzeuge zur Identifizierung von interessanten BEL-Aussagen und zum Vergleich von Genexpressionsdaten mit den zitierten molekularen Beziehungen zu ermöglichen.
Der Wissensgraph COVID-19 ist ein umfassendes Ursache-Wirkungs-Netzwerk, das auf der Grundlage der wissenschaftlichen Literatur über das neue Coronavirus erstellt wurde und einen umfassenden Überblick über seine Pathophysiologie gibt (weitere Details). In seiner aktuellen Form umfasst er 3954 Knoten, die 10 Entitätstypen (z.B. Proteine, Gene, Chemikalien und biologische Prozesse) und 9484 Beziehungen (z.B. Zunahme, Abnahme und Verbindungen) abdecken und ein durchgängiges Interaktionsnetzwerk bilden. Diese Ursache-Wirkungs-Beziehungen bezeichnen in erster Linie Wirt-Pathogen-Interaktionen sowie Komorbiditäten und Symptome im Zusammenhang mit COVID-19. Darüber hinaus enthält der Wissensgraph molekulare Interaktionen im Zusammenhang mit der Wirtsinvasion (z.B. Spike-Glykoprotein und seine Interaktion mit dem Wirt über den Rezeptor ACE2) und den Auswirkungen der nachgeschalteten Entzündungs-, Zellüberlebens- und Apoptose-Signalwege. Ein Schlüsselaspekt des COVID-19-Wissensgraphs liegt in der umfassenden Erfassung der Wechselwirkungen zwischen Medikament und Zielmolekülen sowie der biologischen Prozesse, Gene und Proteine, die mit dem neuartigen Coronavirus assoziiert sind. Wir haben über 300 Arzneimittelkandidaten identifiziert, die derzeit im Rahmen von COVID-19 untersucht werden, darunter auch vorgeschlagene Kandidaten für eine Neuverwendung und Arzneimittel in der klinischen Prüfung.
Um die Benutzerfreundlichkeit und Interoperabilität unseres Wissensgraphen zu erleichtern, haben wir seinen Inhalt in verschiedenen Standardformaten (z.B. SIF, GraphML und NDEx) veröffentlicht, um seine Annahme und Verbesserung durch die wissenschaftliche Gemeinschaft zu fördern. Die neueste Version zusammen mit den verschiedenen Formaten sind hier frei verfügbar. Darüber hinaus ist der COVID-19-Wissensgraph dank unserer früheren Harmonisierungsarbeit mit Datenbanken wie DrugBank, KEGG und Reactome interoperabel.
Da die Menge der zu COVID-19 verfügbaren Forschung und Informationen exponentiell zunimmt, ist es unerlässlich, dass Wissenschaftler die verschiedenen Modelle vergleichen können, um Inkonsistenzen mit den verfügbaren Daten sowie potenzielle therapeutische Ziele zu identifizieren. Daher planen wir, unser Modell nicht nur auf andere verwandte Netzwerke (siehe z.B. Gordon et al., with interactome data), sondern auch auf Informationen aus mehreren renommierten biologischen Datenbanken wie ChEBI, ClinVar und DisGeNet auszudehnen. Unser Ziel ist es, die Wissensentdeckung zu erleichtern, indem wir alle relevanten Informationen in einem einzigen Repository zusammenführen und den Benutzern die Werkzeuge zur freien Navigation und zum Vergleich von Modellen zur Verfügung stellen. Mit der Erweiterung des COVID-19-Wissensgraphen werden auch funktionelle Erweiterungen in BiKMi entwickelt, um die in der Datenbank vorhandenen Informationen möglichst einfach nutzen zu können.
Partner
Causality BioModels, India