BioChatter will große Sprachmodelle für die biomedizinische Forschung zugänglich machen

von | Jan. 22, 2025 | Digitalisierung, Forschung, Nicht kategorisiert

Für biomedizinische Forscher kann die Optimierung von LLMs für eine spezifische Forschungsfrage entmutigend sein, da sie Programmierkenntnisse und Fachwissen über maschinelles Lernen erfordert. Solche Hindernisse haben die Akzeptanz von LLMs für viele Forschungsaufgaben, einschließlich Datenextraktion und -analyse, verringert.

Eine neue Veröffentlichung in Nature Biotechnology stellt BioChatter vor, um diese Einschränkungen zu überwinden. BioChatter ist ein quelloffenes Python-Framework für den Einsatz von LLMs in der biomedizinischen Forschung im Einklang mit den Prinzipien der offenen Wissenschaft. Um die Bedenken hinsichtlich des Datenschutzes und der Reproduzierbarkeit auszuräumen, die oft mit kommerziellen LLMs verbunden sind, bietet BioChatter ein Framework für Forscher, die Transparenz und Flexibilität in ihren LLM-Workflows suchen.

“Große Sprachmodelle haben ein immenses Potenzial, die biomedizinische Forschung zu verändern, indem sie komplexe Daten und Analyseaufgaben zugänglicher machen”, sagte Julio Saez-Rodriguez, Forschungsleiter am Europäischen Institut für Bioinformatik des EMBL (EMBL-EBI) und beurlaubter Professor an der Universität Heidelberg. “Um das Beste aus dieser Technologie für die biomedizinische Forschung herauszuholen, brauchen wir jedoch Werkzeuge, bei denen Transparenz und Reproduzierbarkeit im Vordergrund stehen. BioChatter überbrückt diese Lücke und ermöglicht es Forschern, LLM-Funktionen in viele biomedizinische Forschungsaufgaben zu integrieren.”

BioChatter: macht große Sprachmodelle für die biomedizinische Forschung zugänglich. 
Credits: Karen Arnott/EMBL-EBI
BioChatter: macht große Sprachmodelle für die biomedizinische Forschung zugänglich.
Credits: Karen Arnott/EMBL-EBI

BioChatter kann an spezifische Forschungsbereiche angepasst werden, um Daten aus biomedizinischen Datenbanken und Literatur zu beziehen. Darüber hinaus können LLMs durch den Aufruf der BioChatter-API-Funktionalität externe Software nutzen, was einen Echtzeit-Zugang zu aktuellen Informationen und die Integration mit Bioinformatik-Tools ermöglicht.

Ein wichtiges Merkmal von BioChatter ist seine Fähigkeit zur Integration mit BioCypher-gebauten Wissensgraphen – Netzwerke, die biomedizinische Daten wie genetische Mutationen, Assoziationen zwischen Medikamenten und Krankheiten und andere klinische Informationen miteinander verbinden. Diese Graphen helfen Forschern bei der Analyse komplexer Datensätze, um genetische Variationen bei Krankheiten zu identifizieren oder Wirkstoffmechanismen zu verstehen.

“BioChatter wurde entwickelt, um die Hürden für biomedizinische Forscher bei der Verwendung großer Sprachmodelle zu senken, indem ein offenes, transparentes Framework bereitgestellt wird, das an unterschiedliche Forschungsbedürfnisse angepasst werden kann”, sagte Sebastian Lobentanzer, Postdoktorand am Universitätsklinikum Heidelberg und neuer Principal Investigator am Helmholtz München. “Unser Ziel ist es, den Wissenschaftlern zu helfen, sich auf ihre Forschung zu konzentrieren und die technische Komplexität der Plattform zu überlassen.”

Original Paper:

A platform for the biomedical application of large language models | Nature Biotechnology

Lesen Sie auch:

Große Sprachmodelle (LLM) zur Analyse von radiologischen Befunden – MedLabPortal


Redaktion: X-Press Journalistenbürö GbR

Gender-Hinweis. Die in diesem Text verwendeten Personenbezeichnungen beziehen sich immer gleichermaßen auf weibliche, männliche und diverse Personen. Auf eine Doppel/Dreifachnennung und gegenderte Bezeichnungen wird zugunsten einer besseren Lesbarkeit verzichtet.