Literatur-Mining

Das Informations-Retrieval-System SCAIView ermöglicht die semantische Suche in großen Textsammlungen, indem es Freitextsuchen mit den ontologischen Darstellungen von Entitäten kombiniert, die von Text-Mining-Systemen abgeleitet wurden. Wir haben ein spezielles System – das COVID-19 SCAIView – für die Forschung über das neuartige Coronavirus SARS-CoV-2 und die daraus resultierende COVID-19-Krankheit entwickelt. Dieses System ist so ausgelegt, dass es Fragen wie »Welche Gene / Proteine sind mit COVID-19 verwandt?«, «Welche Medikamente sind im Zusammenhang mit COVID-19 relevant?« oder »Welche biologischen Aspekte über das neue Coronavirus SARS-CoV-2 sind bekannt?« beantworten kann.

COVID-19 SCAIView bietet

  • eine benutzerfreundliche Suchumgebung mit einem Query Builder, der semantische Abfragen mit biomedizinischen Entitäten unterstützt,
  • schnelle und präzise Suche und Retrieval, basierend auf den neuesten Technologien semantischer Suchmaschinen,
  • farbcodierte Visualisierung und Ranking der relevantesten Entitäten und Dokumente,
  • Export der Suchergebnisse in verschiedene Dateiformate.

Derzeit indexiert COVID-19 SCAIView Korpora aus PubMed, PubMed Central und den CORD-19-Datensätzen, die auch bioRxiv- und medRxiv-Publikationen enthalten. Diese Korpora werden in unserem System regelmäßig aktualisiert, damit Forscher die neuesten Forschungsbeiträge durchsuchen können. Die Dokumente werden durch präzise formulierte Fragen unter Verwendung ontologischer Darstellungen biomedizinischer Entitäten abgerufen. Zu den Entitäten gehören Gene/Proteine, Phänotypen, Arzneimittelverbindungen und mehr. COVID-19 SCAIView unterstützt die Auswahl geeigneter Entitäten durch eine Autovervollständigungsfunktion und eine Wissensdatenbank für jede Entität. Dazu gehören eine Textbeschreibung der Entität, alternative Namen, ein Entitätsidentifikator und Links zu relevanten biomedizinischen Datenbanken.

In naher Zukunft konzentrieren wir uns auf die Berücksichtigung von Informationen über Drug-Target-Effekte und Nebenwirkungen von Wirkstoffen. Darüber hinaus entwickeln wir auch Text-Mining-Module für die Extraktion von Informationen, die klinische Behandlungen mit Ergebnissen verknüpfen.