Zum Hauptinhalt Zur Navigation

Fehler im Algorithmus: Wie ich für todkrank erklärt wurde und mich gesund debuggte

Die Biotechnologiefirma 23andme stellt bei Lukas Hartmann eine Genmutation fest, die eine lebensbedrohliche Krankheit auslöst. Der Programmierer entschlüsselt die Rohdaten, die ihm das Unternehmen zuschickt, und heilt sich gewissermaßen selbst, als er einen Fehler in dessen Algorithmus entdeckt.
/ Lukas F. Hartmann
121 Kommentare News folgen (öffnet im neuen Fenster)
Programmierer und Startup-Gründer Lukas F. Hartmann (Bild: Lukas F. Hartmann)
Programmierer und Startup-Gründer Lukas F. Hartmann Bild: Lukas F. Hartmann

Seit November 2010 bin ich Mitglied bei 23andme(öffnet im neuen Fenster) . Ich sandte meinen Speichel dorthin und bekam dafür einen Onlinezugang zu meinem Genom. Das dachte ich jedenfalls damals. Heute habe ich mich etwas genauer informiert und weiß nun, dass 23andme eine Art Gensuppe aus dem Speichel extrahiert und diese auf einen sogenannten DNA-Microarray-Chip der Firma Illumina(öffnet im neuen Fenster) kippt. Diese Chips sind mit Abertausenden Testfeldern bestückt. Ein Testfeld besteht aus einem kleinen Molekülstrang, an den sich wiederum genau passende Schnipsel aus meiner DNA andocken. Die Moleküle auf dem Chip sind so designt, dass sie auf das erfolgreiche Andocken mit dem Ausstrahlen von fluoreszentem Licht reagieren. Auf dem gesamten Chip passieren Hunderttausende einzelne Tests parallel. Daraus ergibt sich ein Bild, das gescannt und mit einer Datenbank sogenannter SNPs - sprich: Snips(öffnet im neuen Fenster) - abgeglichen wird.

Laut Wikipedia stellen diese SNPs (Single Nucleotide Polymorphisms) "ca. 90 Prozent aller genetischen Varianten im menschlichen Genom dar" . Wird bei mir eine SNP-Variation festgestellt, bedeutet das, dass es in einem Basenpaar meiner DNA eine Abweichung vom sogenannten Reference Genome(öffnet im neuen Fenster) gibt. Wir erinnern uns: Die Nukleinbasen Adenin (A), Guanin (G), Cytosin (C) und Thymin (T) sind die Grundbausteine des DNA-Codes. Hätte ich also ein AC-SNP, würde das bedeuten, dass bei mir zum Beispiel auf dem jeweiligen Nukleotid statt eines A ein C herumliegt. Diese Abweichung muss nicht automatisch gut oder schlecht sein. Das wird erst dadurch bewertet, indem man statistisch abgleicht, ob beispielsweise alle Mitglieder einer Patientengruppe mit dieser Mutation eine bestimmte Krankheit entwickeln.

23andme gleicht also Hunderttausende gescannte SNPs aus meinem Genom mit seiner Datenbank ab, die es ständig auf Basis wissenschaftlicher Quellen und Studien aktualisiert. Dessen Website zeigt dann hübsch aufbereitete, allgemeinverständliche Interpretationen etwaiger genetischer Abweichungen, durch die sich Krankheitsrisiken ergeben, an, aber unterrichtet auch von unterhaltsamen Dingen wie der genetischen Herkunft (99 Prozent Europäer, 3 Prozent Neandertaler, 0,5 Prozent Skandinavier).

Jedes Mal, wenn es neue Erkenntnisse zu "Health Risks" oder "Inherited Conditions" gibt, bekommt man eine E-Mail. Lange Zeit ging alles gut, es gab keine besonderen Überraschungen, davon abgesehen, dass ich wahrscheinlich an einem Herzinfarkt mit einer Dosis Prostatakrebs sterben werde. Aber so ungewöhnlich ist das ja nun auch wieder nicht.

Vor wenigen Wochen gab es jedoch plötzlich ein Update in einem Erbkrankheitenreport. Ich klickte auf den Link, und ein Hinweis poppte auf. Bei brisanten Befunden wird man aufgefordert zu bestätigen, ob man das wirklich wissen will. Ich klickte auf OK und wurde weitergeleitet. Dort stand: "Has two mutations linked to limb-girdle muscular dystrophy (dt: Gliedergürteldystrophie(öffnet im neuen Fenster) , eine Art lähmendem Muskelschwund). A person with two of these mutations typically has limb-girdle muscular dystrophy." Ich ließ das kurz auf mich wirken. Ich hatte noch nie von dieser Krankheit gehört. "Some people with limb-girdle muscular dystrophy lose the ability to walk and suffer from serious disability" , stand dort neben einem Bild eines lächelnden Physiotherapeuten, der eine ebenso lächelnde Patientin stretcht. Was es nicht verriet, Wikipedia jedoch schon, war, dass diese Krankheit auch häufig tödlich endet. Je mehr ich über LGMD nachlas, desto schlechter wurde meine Laune. Ich drückte an meinen Schultern und Oberschenkeln herum und bemerkte nichts Besonderes. Ich dachte, das kann nicht sein, es muss ein Fehler sein!

Mir wurde klar, dass ich keine Ahnung hatte, was die technischen Angaben, die mir hinter einem kleingedruckten Link bei 23andme angezeigt wurden, überhaupt bedeuteten.

Wenn ein Mensch in eine lebensbedrohliche Situation gerät, können ihm ungeahnte Kräfte erwachsen. Wenn ein Nerd in eine lebensbedrohliche Situation gerät, liest er erstmal das Internet leer, bis er die Situation restlos verstanden hat. Ich lud zunächst meine 23andme-Rohdaten herunter und prökelte mit dem Texteditor darin herum. Ich las bis in die frühen Morgenstunden kryptische Gentechnikartikel und setzte die seltsame Genanalysesoftware Promethease(öffnet im neuen Fenster) ein, die unter anderem die 23andme-Daten versteht, aber einem nichts aus diplomatischen Gründen vorenthält. Ich fuchste mich in Genetik ein, um meinen Quellcode zu verstehen. Jemand hatte bei mir einen Bug gefunden und ich wollte ihn reproduzieren, koste es, was es wolle.

Detektiert hat 23andme bei mir zwei SNPs, die es intern als rs28933693 und rs28937900 bezeichnet. Ich versuchte, Genaueres zu diesen Mutationen herauszufinden. Zum Eintrag rs28933693 findet man in der sogenannten SNPedia(öffnet im neuen Fenster) - eine Art Wikpedia für SNPs - einen Link zu einem Eintrag in der OMIM(öffnet im neuen Fenster) (Online Mendelian Inheritance in Man). Im betreffenden Eintrag(öffnet im neuen Fenster) dort findet man Auszüge aus Studien, bei denen bei LGMD-Patienten eine sogenannte homozygote(öffnet im neuen Fenster) Mutation in einem Gen identifiziert wurde.

Exkurs: Um das zu erklären, muss man verstehen, dass Menschen zwei Kopien jedes Chromosoms, eins von der Mutter, eins vom Vater, haben. Eine heterozygote(öffnet im neuen Fenster) Mutation betrifft nur eine der beiden Chromosomenkopien, bei einer homozygoten Mutation ist dieselbe Stelle in beiden Kopien des Chromosoms auf dieselbe Art und Weise verändert.

Das Praktische an der Chromosomenkopie ist, dass ich sozusagen ein Backup für die betroffene Funktion habe. Wenn also eine Stelle meiner DNA zum Beispiel ein wichtiges Enzym codiert und diese auf einem Chromosom "kaputt" ist, habe ich dieselbe mit etwas Glück nochmal auf dem anderen Chromosom. Wenn man Pech hat und zwei Eltern, die beide "Carrier" (Träger) derselben Mutation sind und die beiden defekten Hälften unglücklich im Kind kombiniert werden, manifestiert sich die Erbkrankheit. Bei den untersuchten LGMD-Patienten ist genau das der Fall, bei ihnen sind beide Kopien auf dieselbe Art (homozygot) verändert und dadurch defekt - was schrecklich selten passiert, aber es passiert.

Bugreport an 23andme

Und ich soll nun einer dieser wenigen sein? Nachdem ich mir all dieses Wissen nach vielen Stunden bangen Recherchierens angeeignet hatte, schaute ich genauer hin - und zwar in die Rohdaten. Ja, ich hatte tatsächlich zwei Mutationen. Aber nicht im selben Gen, sondern in zwei unterschiedlichen. Seltenerweise aber in zweien, die beide statistisch mit LGMD verknüpft sind. Meine Mutation war also gar nicht homozygot, sondern heterozygot - ich hatte sie nur in einem Chromosom und die andere betraf ein völlig anderes Gen! Jemand bei 23andme hat aber in der Vorlage für LGMD die beiden eigentlich unabhängigen Mutationen zu einer einzigen homozygoten zusammengezählt, und Zack - der Algorithmus schlug Alarm.

Ich schrieb eine Supportanfrage mit meinen Recherchen und Schlussfolgerungen. In der Softwareentwicklung nennen wir das Bugreport. Nach ein paar Tagen Wartezeit wurde mir der Bug inklusive Entschuldigung von 23andme bestätigt. Der fehlerhafte Code war also gar nicht in mir, sondern im Algorithmus. Im Gegensatz zu meinem genetischen Code kann ein Algorithmus aber leicht gefixt werden.

Auf meiner Ergebnisseite steht nun: "Has multiple mutations linked to limb-girdle muscle dystrophy, but they are in different genes. A person with such mutations typically does not have the condition, but can pass the mutations to offspring. May have other mutations linked to limb-girdle muscular dystrophy (not reported here)."

Damit kann ich leben. Ziemlich lange sogar.

Der Autor Lukas F. Hartmann ist Programmierer, Gründer des Startups Spacedeck(öffnet im neuen Fenster) und 23andme-Kunde. Er twittert unter @mntnm(öffnet im neuen Fenster) . Der Beitrag ist zuerst auf ctrl-verlust.net(öffnet im neuen Fenster) erschienen.


Relevante Themen