• IT-Karriere:
  • Services:

Alpha Fold: Künstliche Intelligenz hat die Protein-Faltung gelöst

Deepmind kann mehr als nur Spielereien und löst nach einem halben Jahrhundert eines der größten Probleme der Chemie und Biologie.

Artikel veröffentlicht am ,
Deepmind arbeitet seit mehreren Jahren an der Bestimmung von Proteinstrukturen.
Deepmind arbeitet seit mehreren Jahren an der Bestimmung von Proteinstrukturen. (Bild: Deepmind/Screenshot Golem.de)

Eines der großen Probleme der Chemie und Biologie ist gelöst. Eine künstliche Intelligenz von Deepmind - die Firma die 2016 für die Alpha Go Software bekannt wurde - ist in der Lage, die Faltung von Proteinen schnell und ausreichend präzise zu berechnen. Damit löst die Firma ihr Versprechen ein, dass die grundlegende Idee der neuronalen Netze in der künstlichen Intelligenz viel mehr erreichen kann, als nur Großmeister alter asiatischer Brettspiele zu besiegen.

Stellenmarkt
  1. Bayerisches Landesamt für Gesundheit und Lebensmittelsicherheit, Erlangen, Oberschleißheim bei München
  2. HABA Group B.V. & Co. KG, Bad Rodach

Wenn in einer Zelle die genetische Information der DNA ausgelesen wird, dann entsteht daraus oft nach einigen Schritten eine Sequenz von Aminosäuren, die von einem Ribosom Stück für Stück zusammengesetzt wird. Die Kette von Aminosäuren, die dabei entsteht, bleibt aber nicht gerade. Sie knickt und faltet sich und die Aminosäuren bleiben aneinander kleben, bis aus der Kette von Molekülen ein kompliziertes Protein geworden ist - Grundbaustein für alle Lebensfunktionen in der Zelle. Diese Erkenntnis war Christian Anfinsens Beitrag zum 1972 verliehenen Nobelpreis in Chemie.

Ein Wettbewerb sollte die Rechenverfahren verbessern

Aber die komplizierten Proteinstrukturen, die dabei entstehen, bereiten der Wissenschaft seitdem große Probleme. Die Faltungsregeln sind zwar für sich genommen recht einfach, müssen aber so oft angewendet werden, dass dies für einzelne Menschen ein unbeherrschbar komplexes Problem darstellt. Schon die Struktur eines fertigen Proteins lässt sich nur mit viel Aufwand im Labor bestimmen. Methoden wie Röntgenkristallographie liefern oft nur Anhaltspunkte zu Teilen der Struktur. Anschließend muss in weiteren Experimenten bestimmt werden, welche Form das gesamte Protein haben kann, wenn die neuen bekannten Anhaltspunkte berücksichtigt werden.

Die Laborarbeit ist ein großes Puzzle, zumal sich einige Proteine nur sehr schwer überhaupt in einer regelmäßigen Kristallstruktur für die Untersuchung anordnen lassen. Dazu kommen dann noch viel wichtigere Fragen wie: Welches Protein entsteht aus einer gegebenen Code-Sequenz? Wie ändert sich das resultierende Protein, wenn sich die Code-Sequenz ändert? Und: Was macht so ein Protein überhaupt?

Um die Entwicklung der Berechnungsmethoden zur Vorhersage der Proteinstrukturen aus den bekannten Daten zu beschleunigen, gibt es seit 1994 alle zwei Jahre die Experimente: Critical Assessment of protein Structure Prediction (CASP) . Dabei werden einer Reihe von Forschungsgruppen unvollständige Daten von Proteinen vorgelegt, deren Struktur bereits experimentell bestimmt, aber noch nicht veröffentlicht wurde.

Anschließend sollen die Forschungsgruppen mit ihren Rechenmodellen vorhersagen, welche Struktur für das Protein im Labor gefunden wurde. Zum Schluss wird bestimmt, wie weit die berechneten Ergebnisse von den Messdaten abweichen, und alle Gruppen müssen ihre Rechenverfahren veröffentlichen, damit alle von den Fortschritten profitieren können.

Deepmind machte riesige Fortschritte

Die Fortschritte kamen. Langsam. Ausgehend von den experimentellen Methoden im Labor wird geschätzt, dass die Proteinstrukturen auf einer Skala von 100 Punkten mit einer Genauigkeit von etwa 90 Punkten bestimmt werden können. 1994 erreichten die besten Programme 20 Punkte in diesem "Global Distance Test". Bis 2016 verbesserten sich die Punktzahlen auf 30 bis 40 Punkte. 2018 stieg Deepmind mit Alpha Fold in den Wettbewerb ein und erreichte im Durchschnitt 58 Punkte. 2020 waren es fast 90 Punkte. Der KI von Alpha Fold gelang es, zwei Drittel der vorgelegten Proteine mit der Präzision von Labormessungen zu berechnen.

Selbst da, wo Proteinstrukturen noch nicht im Labor bestimmt werden konnten, ist die Software hilfreich. Denn das große Problem dort ist, dass die Untersuchungsmethoden eine ganze Reihe von plausiblen Strukturen liefern und dann durch immer weiter gehende Untersuchungen die falschen Möglichkeiten ausgeschlossen werden. Das kann nun auch durch den Vergleich von Labor- und Rechenergebnissen getan werden, die auf stark unterschiedliche Weise zustande kamen. Damit lassen sich mehr potenziell mögliche Strukturen verwerfen und sie liefern zusammen viel zuverlässigere Ergebnisse. Auf diese Weise soll die Struktur neu auftauchender Proteine in Zukunft viel schneller betimmt werden können, wie etwa bei den Bindungs- und Hüllenproteinen im Coronavirus SARS-CoV-2.

In Anbetracht des überwältigenden Fortschritts lautete die Pressemeldung zum 14. Wettbewerb im Jahr 2020, dass damit ein schnelles und präzises Verfahren zur Lösung des Problems der Proteinfaltung gefunden ist, zumindest für einzelne Proteine. Dem stimmen auch die Wissenschaftsjournale Nature und Science zu. Allerdings ist das nur der erste Schritt. Denn Proteine bilden Komplexe in Zellen. Sie interagieren mit anderen Proteinen und anderen Stoffen, was ihre eigentliche Funktion ausmacht. Deren Untersuchung ist nun das nächste Ziel.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Anzeige
Hardware-Angebote
  1. (reduzierte Überstände, Restposten & Co.)

ClausWARE 05. Dez 2020 / Themenstart

Das ist schon 5 Jahre her und ging nicht um komprimierte PDFs sondern um Pattern...

Kommentieren


Folgen Sie uns
       


Audi RS E-Tron GT Probe gefahren

Audis E-Tron GT ist das bislang PS-stärkste RS-Modell auf dem Markt.

Audi RS E-Tron GT Probe gefahren Video aufrufen
    •  /