Noch ist der Auslese-Prozess fehleranfällig

Die Sequenzierung erfolgt durch Polymerase-Kettenreaktionen. Das ist ein chemischer Vorgang, der durch biologische Enzyme in Gang gesetzt wird. Die Kettenreaktion dient dazu, gezielt vorhandene DNA-Sequenzen in einer Lösung zu vervielfältigen. Erst die vervielfältigten Stränge werden sequenziert. Um knapp 17.000 Stränge mit je 120 Nukleotiden auszulesen, mussten im Labor die Sequenzen von 20,6 Millionen Strängen ausgelesen werden. Ein Prozess, der auf dem heutigen Stand der Technik mehrere Stunden dauert. Damit gezielt nur Stränge ausgelesen werden, die auch die benötigten Daten beinhalten, werden alle Stränge mit Adressen versehen. Alle DNA-Stränge, die den falschen Anfang haben, werden nicht dupliziert und dadurch auch nie ausgelesen.

  • Übersetzung binärer Informationen in DNA per Huffman-Kodierung (Bild: Microsoft Research)
  • Schreib- und Lese-Prozess der DNA (Bild: Microsoft Research)
Schreib- und Lese-Prozess der DNA (Bild: Microsoft Research)
Stellenmarkt
  1. 1st and 2nd Level Support Specialist (m/w/d)
    BCG Platinion, München
  2. Wissenschaftliche*r Mitarbeiter*in (m/w/d) für den Bereich Community Interaction innerhalb ... (m/w/d)
    BAM - Bundesanstalt für Materialforschung und -prüfung, Berlin-Steglitz
Detailsuche

Der Prozess des Auslesens ist sehr fehleranfällig. Tatsächlich gelang es den Forschern nie, Daten aus den vorhandenen Strängen vollständig wieder herzustellen, weil sich immer wieder einzelne Fehler einschlichen oder ganze Stränge verlorengingen. Um trotzdem die Daten zu rekonstruieren, müssen redundante Datenstrukturen benutzt werden. Eine Möglichkeit besteht darin, dass die erste Hälfte eines Datenstrangs identisch mit der zweiten Hälfte des letzten Datenstrangs ist. Effizienter ist aber eine XOR-Kodierung.

Wie in einem Raid-5 wird aus je zwei Strängen A und B mit unterschiedlichen Daten durch eine XOR-Verknüpfung ein dritter Strang erzeugt. Wenn jetzt einer der beiden ursprünglichen Stränge verloren geht, kann dessen Inhalt mit dem dritten Strang rekonstruiert werden. Besonders wichtige Daten können auch noch besser geschützt werden, indem sie mit mehreren anderen Strängen verknüpft werden. Wenn Daten im Strang A sehr wichtig sind, dann können durch XOR-Verknüpfung mit weiteren Strängen noch mehr solche Sicherheitskopien hinterlegt werden.

Beispielsweise können Fehler im Header einer jpg-Datei die gesamte Datei unlesbar machen, die Fehler in den eigentlichen Bilddaten führen dagegen schlimmstenfalls zu einzelnen Artefakten und sind im Allgemeinen kaum wahrnehmbar. Für diesen Bereich werden dann nicht mehr so viele Backups benötigt wie für den Header, wodurch die Speicherdichte steigt. Zur Zeit lassen sich mit der Technik nur wenige Hundert Kilobyte speichern, und das Auslesen der Daten nimmt mehrere Stunde in Anspruch. Durch die ständige Verbesserung der DNA-Sequenzierung und Synthese in den vergangenen Jahren hofft Microsoft aber auf eine vielversprechende Zukunft.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed
 Datenspeicherung: Microsoft kauft zehn Millionen Stränge synthetischer DNA
  1.  
  2. 1
  3. 2


Moe479 30. Apr 2016

dass das nicht rund läuft ist gerade der motor der natur: MUTATION! die lösung dagegen...

Moe479 30. Apr 2016

Säure oder Acid ... sind gleichbedeutend, oder wird wiedereinmal der Untergang des...

Trollversteher 29. Apr 2016

OK, Sorry, wollte Dich auch nicht beim Philosophieren unterbrechen, also lass Dich von...

Trollversteher 29. Apr 2016

Artikel gelesen und verstanden? Es geht um Forschung. Und ob eine Konvertierung in was...



Aktuell auf der Startseite von Golem.de
Visual Studio Code im Web mit Gitpod
Ein Gewinn für jede Tool-Sammlung

Helferlein Der Code-Editor Visual Studio Code erobert den Browser und die Remote-Arbeit - und das Kieler Unternehmen Gitpod ist mit seiner Lösung ganz vorne mit dabei.
Von Kristof Zerbe

Visual Studio Code im Web mit Gitpod: Ein Gewinn für jede Tool-Sammlung
Artikel
  1. SFConservancy: Open-Source-Entwickler sollen Github wegen Copilot verlassen
    SFConservancy
    Open-Source-Entwickler sollen Github wegen Copilot verlassen

    Ähnlich wie schon vor Jahrzehnten mit Sourceforge sollen Open-Source-Projekte nun auch Github verlassen.

  2. Wärmeversorgung: Berlin baut Thermoskanne gegen Gasnotstand
    Wärmeversorgung
    Berlin baut Thermoskanne gegen Gasnotstand

    Der Versorger Vattenfall baut in Berlin einen riesigen Warmwasserspeicher, um Häuser im Winter heizen zu können. Das könnte beim möglichen Gasnotstand helfen.

  3. Softwareupdate: Teslas können Schlaglöcher erkennen und Federung anpassen
    Softwareupdate
    Teslas können Schlaglöcher erkennen und Federung anpassen

    Durch ein Softwareupdate können Teslas nach Schlaglöchern suchen und bei Bedarf die adaptive Federung ändern.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • HP HyperX Cloud II Gaming-Headset -40% • Samsung Galaxy S20 128GB -36% • Audible -70% • MSI RTX 3080 12GB günstig wie nie: 948€ • AMD Ryzen 7 günstig wie nie: 259€ • Der beste 2.000€-Gaming-PC • Cooler Master 34" UWQHD 144 Hz günstig wie nie: 467,85€ • Asus RX 6900 XT OC günstig wie nie: 1.049€ [Werbung]
    •  /