Integration im 19-Zoll-Formfaktor

Biologische Festplatten: Wenn Rechenzentren DNA drucken

DNA Rechenzentrum, Data Center

Die enzymatische DNA-Synthese ersetzt giftige Chemie durch Biologie. 19-Zoll-Drucker speichern Petabytes direkt im Server-Rack der Rechenzentren.

Die Archivierung der weltweit exponentiell wachsenden Datenmengen stößt an physikalische Grenzen. Herkömmliche Speichermedien wie Magnetspeicher (HDDs) und Magnetbänder (LTO-Tapes) leiden unter begrenzter Haltbarkeit und erfordern kontinuierliche Migrationszyklen sowie einen hohen Energieaufwand für die Kühlung. Als Lösungsansatz gilt die Verwendung von Desoxyribonukleinsäure (DNA) als Speichermedium. Mit einer theoretischen Speicherdichte von bis zu $10^{18}$ Bytes pro Kubikzentimeter und einer Haltbarkeit von Jahrtausenden übertrifft die biologische Makromolekülkette elektronische Medien in puncto Langlebigkeit und Kompaktheit. Der bisherige Engpass für den kommerziellen Einsatz in Rechenzentren lag in der Synthese, also dem Schreiben der Daten. Die etablierte chemische Methode war für den Rechenzentrumsbetrieb zu langsam, zu teuer und ökologisch bedenklich. Dieser Zustand ändert sich durch den Wechsel zur enzymatischen DNA-Synthese.

Anzeige

Enzymatische DNA-Synthese imitiert natürlichen Prozess der Zell-Replikation

Seit den 1980er-Jahren basiert die künstliche Herstellung von DNA-Strängen primär auf der sogenannten Phosphoramidit-Methode. Bei diesem chemischen Verfahren werden die vier Basen Adenin (A), Cytosin (C), Guanin (G) und Thymin (T) Schritt für Schritt in einem zyklischen Prozess aneinandergereiht. Diese Methode erfordert den Einsatz toxischer organischer Lösungsmittel wie Acetonitril und verlangt strikt wasserfreie Bedingungen. Zudem ist die Länge der fehlerfrei synthetisierbaren Stränge meist auf etwa 200 Basenpaare beschränkt, da sich mit jedem Syntheseschritt chemische Nebenprodukte anreichern. Für den Betrieb innerhalb eines standardisierten IT-Rechenzentrums ist dieses Verfahren aufgrund der Sicherheitsauflagen und der Entsorgungsproblematik flüssiger Chemieabfälle ungeeignet.

Die enzymatische DNA-Synthese imitiert hingegen den natürlichen Prozess der Replikation, wie er in lebenden Zellen stattfindet. Das Verfahren nutzt spezialisierte Enzyme, primär die Terminale Deoxynucleotidyl-Transferase (TdT). Diese Proteine sind in der Lage, Nukleotide in einer wässrigen Lösung bei Raumtemperatur und normalem Umgebungsdruck an einen bestehenden DNA-Strang anzuhängen. Das Startup DNA Script hat mit seiner Syntax-Plattform demonstriert, dass diese biologische Methode die Synthese von DNA in einem geschlossenen, laborfreien System erlaubt. Da als Abfallprodukt im Wesentlichen salzhaltiges Wasser entsteht, entfallen die regulatorischen Hürden für den Betrieb chemischer Syntheseanlagen.

Integration im 19-Zoll-Formfaktor für Rechenzentren

Die Skalierung dieser Technologie für den Enterprise-IT-Markt erfordert die Anpassung an bestehende Infrastrukturstandards. Pioniere wie Molecular Assemblies entwickeln Synthese-Workflows, die für die Integration in vollautomatische Roboter-Units optimiert sind. Das Rechenzentrum agiert hierbei als „Druckerei“: Ein DNA-Synthesizer im standardisierten 19-Zoll-Rack-Format wird direkt neben klassischen Serverschränken platziert.

Anzeige

Der Datenfluss von der digitalen Datei bis zur biologischen Einlagerung verläuft über vordefinierte Hardware- und Softwareschichten:

  • Transkodierung: Ein Software-Algorithmus übersetzt den binären Code (0 und 1) in die quartäre Logik der vier DNA-Basen (z. B. 00=A, 01=C, 10=G, 11=T).
  • Synthese-Steuerung: Die digitalen Sequenzdaten werden an den Rack-Synthesizer übermittelt.
  • Mikrofluidischer Druck: Im Inneren des Geräts steuern Mikrofluidik-Chips den präzisen Zufluss der TdT-Enzyme und der jeweiligen Nukleotide zu einer Speicher-Kartusche.
  • Trocknung und Archivierung: Nach Abschluss des Synthesevorgangs wird der synthetisierte DNA-Strang automatisiert gereinigt, getrocknet und in einer versiegelten Mikrokapsel abgelegt.
Newsletter
Newsletter Box

Mit Klick auf den Button "Jetzt Anmelden" stimme ich der Datenschutzerklärung zu.

Standardisierung durch das Industriekonsortium

Um die Interoperabilität zwischen Hardware-Herstellern und Cloud-Anbietern zu gewährleisten, wurde die DNA Data Storage Alliance ins Leben gerufen. Zu den Gründungsmitgliedern und treibenden Kräften gehören Technologiekonzerne wie Microsoft und Western Digital sowie der Synthese-Spezialist Twist Bioscience. Die Allianz veröffentlicht Spezifikationen, die definieren, wie DNA-Speicher als logische Schicht in bestehende Betriebssysteme und Speicherarchitekturen (wie Object Storage über S3-Schnittstellen) eingebunden werden.

Microsoft erforscht im Rahmen seiner Cloud-Infrastruktur-Projekte seit Jahren die logistische Kette des DNA-Speicherzugriffs. Die technologische Zielsetzung besteht darin, den gesamten Prozess vom Schreiben über die robotergestützte Kapselverwaltung bis hin zum Auslesen vollautomatisch und ohne manuellen Eingriff zu steuern. Die Spezifikationen der Allianz regeln dabei unter anderem die Fehlerkorrekturverfahren (Forward Error Correction), die notwendig sind, um potenzielle Lesefehler beim späteren Sequenzieren biologischer Daten softwareseitig zu kompensieren.

Der Ausleseprozess via Nanoporen-Sequenzierung

Ein Speichersystem ist nur funktional, wenn die Daten mit hoher Zuverlässigkeit und adäquater Geschwindigkeit zurückgewonnen werden können. Das Auslesen der DNA-Speicherkartuschen erfolgt über die sogenannte Next-Generation-Sequenzierung (NGS). Während in Laboren oft große, optisch basierte Sequenziergeräte dominieren, setzt die IT-Infrastruktur auf die Technologie der Nanoporen-Sequenzierung, wie sie von Oxford Nanopore Technologies entwickelt wird.

„Die Nanoporen-Technologie ermöglicht es, die Abfolge der Basen in Echtzeit elektrisch zu messen, indem der DNA-Strang durch eine mikroskopisch kleine Protein-Pore gezogen und die Veränderung des Ionenstroms aufgezeichnet wird.“

Oxford Nanopore Technologies

Diese Sequenzierer sind extrem kompakt und lassen sich ebenfalls als Rack-Komponente oder USB-Modul in die Server-Architektur integrieren. Die gemessenen Stromänderungen werden von nachgeschalteten Field Programmable Gate Arrays (FPGAs) oder Grafikprozessoren (GPUs) in Echtzeit wieder in den binären Originalcode zurückübersetzt.

„Zero-Power“-Datenerhalt

Der primäre wirtschaftliche und ökologische Hebel der enzymatischen DNA-Synthese liegt im operativen Betrieb nach dem Schreibvorgang. Einmal synthetisierte und getrocknete DNA benötigt für die Datenerhaltung über Jahrzehnte hinweg keinerlei Energiezufuhr. Während LTO-Tape-Bibliotheken in klimatisierten Hallen gelagert werden müssen, um Materialdehnungen und Schimmelbildung zu verhindern, ist dehydrierte DNA in Edelstahlkapseln resistent gegen moderate Temperaturschwankungen und benötigt keine aktive Kühlung.

Das Einsparungspotenzial hinsichtlich des CO2-Fußabdrucks von Archivrechenzentren ist erheblich. Der Verzicht auf seltene Erden und komplexe elektronische Bauteile bei der Medienproduktion verringert zudem das Aufkommen von Elektroschrott. Die enzymatische Synthese etabliert sich somit als biologische Alternative, die die Brücke zwischen der organischen Chemie und der digitalen Datenspeicherung schließt.

Autorenbild Lisa Löw

Lisa

Löw

Junior Online-Redakteurin

IT-Verlag

Anzeige

Weitere Artikel

Newsletter
Newsletter Box

Mit Klick auf den Button "Jetzt Anmelden" stimme ich der Datenschutzerklärung zu.