Сега можем да запазим спомените си за милиони години… Израелски

...
Сега можем да запазим спомените си за милиони години… Израелски
Коментари Харесай

Цифрово безсмъртие за човечеството: ИИ ускори разчитането на ДНК архивите с хиляди пъти

Сега можем да запазим спомените си за милиони години…

Израелски учени от Технион създадоха ИИ логаритъм, който разрешава 3200 пъти по-бързо добиване на информацията, съхранена в молекулите на ДНК. Освен това те са съумели да реализират доста усъвършенстване на точността на този развой.

Съхраняването на информация в ДНК е едно от най-обещаващите посоки в развиването на системите за цифрова памет. Молекулите на наследствения материал са способни да съхраняват данни в продължение на стотици хиляди години. Това се удостоверява да вземем за пример от сполучливото добиване на генетичния код от останките на античен кон на 700 000 години и мамути, живели преди повече от милион години. За съпоставяне, актуалните магнитни устройства за предпазване, употребявани в центровете за данни, устоят най-вече няколко десетилетия.

Предимствата на ДНК като притежател на цифрова информация не се лимитират единствено до продължителността на живота. Съвременните центрове за данни употребяват към 3% от международната електрическа енергия и създават 2% от международните излъчвания на въглероден диоксид. Като се има поради експоненциалното повишаване на размера на информацията, това екологично натоварване ще продължи да се усилва. Използването на биологични носители доста ще понижи потреблението на сила.

Особено впечатляваща е плътността на запис в ДНК молекулите – тя е 100 милиона пъти по-голяма от опциите на обичайните цифрови носители. В размер, който в този момент побира един мегабайт, теоретично е допустимо да се слагат до 100 терабайта благодарение на биологичните технологии.

Съхранението на данни се основава на поредност от органични съединения – нуклеотиди от четири типа, означавани с буквите A, C, G и T. За разлика от компютрите, които употребяват двоичен код от нули и единици, четирите признака обезпечават доста по-голям брой вероятни комбинации.

Съществуват обаче и спънки. При записването на данните се прави химически синтез на ДНК, по време на който нуклеотидите не всеки път се включват тъкмо в дадената поредност – някои могат да изпаднат от веригата, други да бъдат включени на ненужни места, а трети да бъдат сменени с неправилни. Освен това всяка носеща молекула се възпроизвежда в голям брой неидентични копия, които се смесват безредно в разтвора. В резултат на това, когато се опитваме да прочетем информацията, би трябвало да се оправим с голям брой неточни копия, някои от които също се губят в процеса на биохимичния разбор.

Затова експертите от Технион са основали DNAformer – система, способна да реконструира истинските последователности от набор от неточни копия. Методът се основава на трансформационна невронна мрежа, подготвена на виртуални данни, с цел да разпознава и поправя типичните неточности при синтеза и секвенирането. Алгоритъмът е допълнен със специфичен код за промяна, който е изключително ефикасен при работа със мощно изкривени фрагменти от генетичния текст.

Работоспособността на технологията е тествана върху разнороден набор от файлове с размер 3,1 мегабайта. Той включва цветна фотография, исторически аудиозапис на първите думи на Нийл Армстронг на повърхността на Луната, теоретичен текст за вероятностите за предпазване на ДНК и блок от криптирани данни, с цел да се ревизира универсалността на метода.

Резултатите надминаха всички упования: DNAformer обработва до 100 мегабайта информация 3200 пъти по-бързо от съществуващите способи със същата акуратност. А спрямо бързите, само че не толкоз надеждни способи, той сподели 40% по-малко неточности при доста по-висока скорост.

Изследователският екип възнамерява да сътвори профилирани версии на своята разработка за разнообразни задания. Архитектурата на системата разрешава елементарно увеличение на нейните благоприятни условия, тъй че методът ще може да се развива дружно с технологиите за синтез и разчитане на ДНК, обработвайки все по-големи количества данни.

Източник: kaldata.com


СПОДЕЛИ СТАТИЯТА


КОМЕНТАРИ
НАПИШИ КОМЕНТАР