Przejdź do treści

700 terabajtów w 1 g DNA

Ilość ge­ne­ro­wa­nych przez nas da­nych ro­śnie z dnia na dzień. Gdzie je za­pi­sy­wać, aby po pierw­sze: zmie­ścić, po dru­gie: trwale za­cho­wać?

Firma Hi­ta­chi twier­dzi, że w szkle kwar­co­wym (pi­sa­li­śmy już o tym), a na­ukowcy z Ha­rvard Me­di­cal School, że w DNA. Czło­wiek do­piero nie­dawno od­krył jego po­ten­cjał. Choć na­tura ko­rzy­sta z tej me­tody za­pisu od mi­liar­dów lat, po­dwójna he­lisa kwasu de­ok­sy­ry­bo­nu­kle­ino­wego (DNA) zo­stała opi­sana przez ze­spół na­ukow­ców z Ca­ven­dish La­bo­ra­tory w Cam­bridge do­piero w 1953 roku.

Pro­wa­dzone od tam­tego czasu ba­da­nia DNA są zwią­zane nie tylko z me­dy­cyną, ale rów­nież z bio­tech­no­lo­gią, a jed­nym z kie­run­ków ba­dań jest wy­ko­rzy­sta­nie tego na­tu­ral­nego no­śnika do za­pi­sa­nia do­wol­nych da­nych. Jest to moż­liwe dzięki prze­kształ­ce­niu ich na za­pis bi­narny, gdzie pary za­sad od­po­wia­dają ze­rom i je­dyn­kom.

Po­je­dyn­cza nitka DNA, która zo­stała po­trak­to­wana jako blok da­nych, prze­cho­wuje 96 bi­tów in­for­ma­cji plus 19-bi­towy ad­res umoż­li­wia­jący od­ko­do­wa­nie za­pi­sa­nych in­for­ma­cji. Dane bi­narne są naj­pierw prze­twa­rzane na ciąg od­po­wia­da­ją­cych im za­sad, a po­tem na­stę­puje zsyn­te­ty­zo­wa­nie od­po­wied­nich cią­gów DNA. W ten spo­sób in­for­ma­cja zo­staje ukryta w ko­dzie DNA.

Te­stu­jąc moż­li­wo­ści prze­cho­wy­wa­nia da­nych za po­mocą DNA, na­ukowcy z Ha­rvard Me­di­cal School za­pi­sali w ten spo­sób 53 tys. słów, kil­ka­na­ście ilu­stra­cji i pro­gram kom­pu­te­rowy, osią­ga­jąc za­ra­zem re­we­la­cyjną gę­stość – w prze­li­cze­niu 700 te­ra­baj­tów na każdy gram DNA.

To tak jakby za­pi­sać 14.000 fil­mow Blu­Ray w kro­pli wody. Za­równo za­pis, jak i de­ko­do­wa­nie jest na obec­nym eta­pie roz­woju tech­no­lo­gii bar­dzo cza­so­chłonne. Za­pi­sa­nie 30-stro­ni­co­wej książki po­chło­nęło kilka dni, a od­czy­ty­wa­nie da­nych przy po­mocy no­wej tech­no­logi przy­po­mina od­czy­ty­wa­nie kodu ge­ne­tycz­nego.

Wy­daj­ność obec­nych kom­pu­te­rów na ra­zie jest zbyt słaba, aby za­pew­nić przy­zwo­ite pręd­ko­ści od­czytu tych da­nych. Naj­szyb­sze kom­pu­tery świata po­trze­bują kilku go­dzin aby prze­pro­wa­dzić ana­lizę kodu ge­ne­tycz­nego i od­czy­tać za­warte w nim in­for­ma­cje. Czas po­trzebny do za­pisu i od­czytu bę­dzie jed­nak ma­leć, więc DNA ze względu na trwa­łość i po­jem­ność może być bar­dzo efek­tyw­nym no­śni­kiem da­nych. Będą mo­gły prze­trwać ty­siące, mi­liony, mi­liardy lat.

Powiązane materiały: