Veröffentlicht 5. Dezember 2024 von Andrei Mihai
Chemienobelpreis 2024: Proteinfaltung und KI
Proteine sind die molekularen Maschinen des Lebens. Sie bilden und reparieren Zellen, übertragen Signale und können sogar Krankheiten verursachen oder heilen. Der menschliche Körper verfügt über mehr als 100.000 verschiedene Proteine, von denen jedes einzelne spezifische Aufgaben erfüllt, was ihre Erforschung jedoch zu einer Herausforderung macht.
Mit dem Nobelpreis für Chemie 2024 wurden Demis Hassabis, John Jumper und David Baker ausgezeichnet. Die drei Wissenschaftler nutzten Künstliche Intelligenz (KI), um die Geheimnisse der Proteine zu entschlüsseln. Zu ihren bahnbrechenden Beiträgen gehören die Lösung des Problems der Proteinfaltung und Pionierarbeiten auf dem Gebiet des rechnergestützten Proteindesigns.
Die Struktur der Proteine
Proteine sind Ketten von Aminosäuren, die sich zu komplizierten dreidimensionalen Formen falten. Diese Formen spielen eine entscheidende Rolle: Da Proteine mit vielen anderen Molekülen und Strukturen im Organismus interagieren, bestimmt ihre Form maßgeblich ihre biologische Funktion. Kennt man die Struktur eines Proteins, kann man oft seine Funktion vorhersagen, da diese durch seine Form bestimmt wird. Umgekehrt lässt die Kenntnis der Funktion eines Proteins mitunter Rückschlüsse auf seine Form zu, da bestimmte funktionelle Aufgaben mit bestimmten Strukturmustern verbunden sind.
Die Entschlüsselung der Proteinstruktur ist für das Verständnis von Krankheiten, die Entwicklung von Medikamenten und sogar für die Entwicklung neuer Materialien von entscheidender Bedeutung. Dies ist jedoch keine leichte Aufgabe, und in der Vergangenheit war die Strukturbestimmung von Proteinen oft langwierig und mühsam.
Experimentelle Methoden wie die Röntgenkristallographie und Kryo-Elektronenmikroskopie sind zeit- und ressourcenaufwändig. Jahrzehntelang träumten Wissenschaftler/innen davon, Proteinstrukturen anhand ihrer Aminosäuresequenzen rechnerisch vorherzusagen – eine Herausforderung, die als „Proteinfaltungsproblem“ bekannt ist.
In den 1990er Jahren führte dies zu einem Wettbewerb namens „Critical Assessment of Protein Structure Prediction“ (CASP). Ziel dieses Wettbewerbs war es, rechnergestützte Methoden zur Vorhersage der Proteinfaltung zu erarbeiten, also vom Sequenzcode zur Struktur zu gelangen. Jedes Jahr wurden Forscher/innen Aminosäuresequenzen von Proteinen vorgegeben. Die Organisator/innen des Wettbewerbs hatten bereits die Strukturen dieser Proteine festgelegt, aber diese wurden vorerst geheim gehalten – Die Teilnehmer/innen mussten die Proteinstrukturen selbständig ableiten.
Die Mehrzahl der Versuche erreichte 40 Punkte oder weniger auf einer 100-Punkte-Skala. CASP zog zwar viele Wissenschaftler/innen in den Bann, aber das Problem der Strukturvorhersage war weiterhin unlösbar. Bis David Baker ins Spiel kam.
Vom Philosophiestudium zu den Proteinen
Baker studierte zunächst Philosophie und Sozialwissenschaften, doch ein Lehrbuch mit dem Titel „Molekularbiologie der Zelle“ brachte ihn dazu, einen anderen Kurs einzuschlagen. Er war fasziniert von Proteinstrukturen und begann, Experimente und Algorithmen zu entwickeln, um zu erforschen, wie sich Proteine falten. Letztlich entwickelte er einen Algorithmus namens Rosetta.
Verglichen mit den meisten anderen Teilnehmer/innen, erzielte Baker mit Rosetta gute Ergebnisse. Allerdings führte ihn seine Arbeit zu einer ganz anderen Erkenntnis: Die Software konnte auch in umgekehrter Richtung eingesetzt werden. Das heißt, anstatt Aminosäuren einzugeben, um Proteinstrukturen zu erhalten, konnte man eine Struktur eingeben, um mögliche Aminosäuresequenzen zu erhalten. Dadurch wurde es möglich, neue Proteine mit den gewünschten Funktionen zu designen.
2003 schuf Bakers Team das synthetische Protein Top7, eines der ersten mit einer neuartigen Struktur. Seitdem hat sein Labor eine Vielzahl von Proteinen für unterschiedliche Anwendungen entwickelt. Mal war es eine Modifikation eines bestehenden Proteins, damit es gefährliche Stoffe abbaut, mal ein völlig neues Protein, das in der chemischen Industrie eingesetzt werden kann.
Die Welt der Proteine wurde Schritt für Schritt erschlossen. Doch der Fortschritt war zunächst schleppend. Die Entwicklung neuer Proteine war äußerst schwierig, und die begrenzte Auswahl an natürlichen Proteinen stellte eine weitere Hürde dar. Baker bemerkte hierzu: „Wenn man ein Flugzeug bauen will, fängt man nicht damit an, einen Vogel zu modifizieren, sondern man muss die einfachen Grundregeln der Aerodynamik verstehen und daraus Flugmaschinen bauen.“
In diesem Fall bedeuteten die Grundlagen, sich erneut mit der Proteinfaltung auseinanderzusetzen – doch diese stellte weiterhin eine große Herausforderung dar. Bis 2018 der große Durchbruch gelang.
Vom Schach zu den Proteinen
AlphaFold ist ein von DeepMind entwickeltes Programm für künstliche Intelligenz (KI), das von Demis Hassabis und John Jumper initiiert und 2014 von Google übernommen wurde. Es ist nicht das erste „Alpha“. Bevor sich DeepMind mit der Proteinfaltung beschäftigte, entwickelte das britische Unternehmen AlphaZero und AlphaGo – KI-Programme, die Schach und das strategische Brettspiel Go durch autodidaktisches Lernen und die Erkennung von Mustern meisterten.
Schach und Proteinfaltung haben auf den ersten Blick nicht viel miteinander zu tun, weisen aber dennoch grundlegende Gemeinsamkeiten auf. Bei beiden kann ein Algorithmus zur Problemlösung eingesetzt werden, und in beiden Fällen profitiert man von großen Datensätzen, aus denen sich Muster ableiten lassen. Ähnlich wie man die Spielstrategien von Schach und Go entschlüsseln kann, ist es auch bei der Proteinfaltung möglich, die zugrundeliegenden Muster vorherzusagen und zu erkennen, selbst wenn man die Regeln nicht vollständig durchdringt.
Durch die Integration physikalischer, geometrischer und evolutionsbiologischer Prinzipien erreichte AlphaFold eine Genauigkeit, die mit der von Labormethoden für die meisten Proteine vergleichbar war. 2018 wurde AlphaFold beim Wettbewerb CASP eingesetzt. Das Programm schnitt hervorragend ab und belegte in der Gesamtwertung den ersten Platz. Besonders gut waren die Ergebnisse bei den schwierigsten Proteinen, für die es keinerlei Vorlagen ähnlicher Proteine gab.
Die meisten Proteinstrukturen, die im Rahmen von CASP vorhergesagt wurden, hatten eine Genauigkeit von etwa 40 %. Mit AlphaFold stieg die Genauigkeit der Vorhersagen auf fast 60 %. Das war ein unerwarteter Fortschritt und deutete auf einen vielversprechenden neuen Weg hin. Und doch war dies erst der Anfang.
Zwei Jahre später wurde AlphaFold 2 erneut bei CASP eingesetzt und erreichte bei der Vorhersage von Proteinen mittlerer Schwierigkeit eine Genauigkeit von etwa 90 %. Das war ein großer Erfolg. In einigen Fällen schnitt das Programm genauso gut ab wie die Röntgenkristallographie. Endlich war das Problem der Proteinfaltung gelöst. Nur ein Jahr später wurde der Quellcode von AlphaFold 2 zusammen mit einer riesigen Datenbank, in der nach Proteinen gesucht werden kann, der Öffentlichkeit zugänglich gemacht. Die Datenbank umfasst heute mehr als 29.000 Referenzen. DeepMind nutzte AlphaFold 2, um die Strukturen von mehr als 200 Millionen Proteinen vorherzusagen, die in Datenbanken erfasst sind, was praktisch alle bekannten Proteine abdeckt. Diese monumentale Leistung wurde anschließend der weltweiten Wissenschaftsgemeinschaft frei zugänglich gemacht, um die Forschung in Biologie und Medizin zu beschleunigen.
Eine neue Ära für die Biologie
Die Leistungen von Demis Hassabis, John Jumper und David Baker sind insofern bemerkenswert, als dass sie zwei grundlegende Herausforderungen der Biologie lösen: die präzise Vorhersage von Proteinstrukturen und die Entwicklung neuer Proteine mit spezifischen Funktionen. Die Verbindung von Biologie mit Algorithmen war keine Selbstverständlichkeit, aber die drei Forscher sind ein Beispiel für das transformative Potenzial interdisziplinärer Forschung. Mit der Lösung des Problems der Proteinfaltung und ihrer Pionierarbeit im Proteindesign haben die Preisträger den Grundstein für eine neue Ära der Biologie gelegt – eine Ära, in der die Geheimnisse der molekularen Maschine des Lebens nicht mehr unerreichbar sind.
Dieser Erfolg wurde mit dem Nobelpreis für Chemie 2024 gewürdigt: Eine Hälfte geht an Baker für „rechnergestütztes Proteindesign“, die andere an Hassabis und Jumper für „die Vorhersage von Proteinstrukturen“. Obwohl die Forschung relativ neu ist, hat sie bereits großen Einfluss auf die Welt.
In der Medizin beschleunigt AlphaFold die Entwicklung von Medikamenten durch die Entschlüsselung von Proteinstrukturen, die für die Bekämpfung von Krankheiten wie Krebs und Alzheimer entscheidend sind. Das Programm unterstützt die Entwicklung von Impfstoffen durch die Identifizierung stabiler Antigenstrukturen. Proteindesign ermöglicht die Herstellung maßgeschneiderter Enzyme für industrielle Prozesse, die umweltfreundliche Alternativen zu herkömmlichen Katalysatoren bieten. Im Bereich der Ökologie werden unter anderem Proteine hergestellt, die Kunststoffe zersetzen oder Schadstoffe abbauen. Darüber hinaus tragen synthetische Proteine zur Weiterentwicklung der Nanotechnologie bei und ermöglichen die gezielte Verabreichung von Medikamenten sowie biotechnologische Innovationen. Diese Verfahren revolutionieren die Biologie und bieten Lösungen für globale Gesundheits-, Umwelt- und Industrieprobleme.
Noch ist die Forschung aber nicht am Ziel. AlphaFold und Rosetta sind zwar revolutionär, aber nicht ohne Einschränkungen zu verwenden. Eine experimentelle Validierung ist nach wie vor unerlässlich, um die rechnerischen Vorhersagen zu überprüfen. Außerdem stellen einige Proteine, insbesondere solche, die Komplexe bilden oder mit anderen Molekülen interagieren, eine Herausforderung für derzeitige KI-Systeme dar.
Trotz dieser anhaltenden Herausforderungen legen diese Errungenschaften den Grundstein für eine Zukunft, in der wir die molekularen Maschinen des Lebens mit Präzision konstruieren können. Dies wird die die Art und Weise, wie wir die biologische Welt verstehen und mit ihr interagieren, nachhaltig verändern.