Microsoft Research tiene un plan basado en el ADN para resolver los problemas de almacenaje de datos

Sobre la base de las primeras investigaciones relacionadas con el almacenamiento de películas y documentos en el ADN, Microsoft Research está desarrollando un aparato que utiliza la biología para reemplazar las unidades de cinta, aseguran los investigadores de la compañía.

Los arquitectos informáticos de Microsoft Research dicen que la compañía ha formalizado la meta de tener un sistema operativo de almacenamiento basado en el ADN, que funcionará dentro de un centro de datos hacia finales de esta década. El objetivo es un «sistema proto-comercial de tres años almacenando de una cierta cantidad de datos sobre el ADN, en uno de nuestros centros de datos, para al menos una aplicación de boutique«, dice Doug Carmean, un socio arquitecto de Microsoft Research. Él describe el dispositivo eventual como el tamaño de una copiadora grande, de la era de los años 70, una Xerox.

Internamente, Microsoft alberga el objetivo aún más ambicioso de reemplazar las unidades de cinta, un formato común utilizado para archivar información. «Esperamos conseguirlo calificado como ‘Your Storage with DNA’ (‘Tu Almacenamiento con ADN’)», dice Carmean.

Los planes señalan la seriedad con que algunas empresas de tecnología están tomando la aparentemente extraña idea de guardar videos, fotos o documentos valiosos en la misma molécula de la que están hechos nuestros genes. La razón, dice Víctor Zhirnov, científico principal de la Semiconductor Research Corporation, es que los esfuerzos para reducir la memoria del ordenador están alcanzando los límites físicos, pero el ADN puede almacenar datos a densidades increíbles.

Microsoft Research

Formateado en ADN, cada película que se haya hecho cabría dentro de un volumen más pequeño que un terrón de azúcar.

«El ADN es el medio de almacenamiento más denso conocido en el universo, basado solo en las leyes de la física. Esa es la razón por la cual la gente lo está estudiando», dice Zhirnov. «Y el problema que estamos resolviendo es el crecimiento exponencial de la información almacenada«.

En julio pasado, Microsoft anunció públicamente que había almacenado 200 megabytes de datos en hebras de ADN, incluyendo un video musical, estableciendo un récord. El trabajo, descrito en un artículo publicado el pasado mes marzo en el servidor de pre-impresión Biorxiv, ha sido dirigido por Karin Strauss, de Microsoft Research, y la Universidad de Washington laboratorio de informática Luis Ceze.

Siguen existiendo obstáculos importantes para un sistema práctico de almacenamiento. Convertir bits digitales en código de ADN (compuesto de cadenas de nucleótidos marcados A, G, C y T) sigue siendo laborioso y costoso debido al proceso químico utilizado para fabricar hebras de ADN. En su proyecto de demostración, Microsoft utilizó 13.448.372 piezas únicas de ADN. Los expertos dicen que comprar mucho material en el mercado libre costaría 800.000 dólares.

«El principal problema con el almacenamiento de ADN es el coste», dice Yaniv Erlich, profesor de la Universidad de Columbia, que a principios de este año informó de un nuevo enfoque para el almacenamiento de datos en ADN. «Por lo tanto, la pregunta principal es si Microsoft ha resuelto este problema». Según su publicación, Erlich dice: «No vi ningún progreso hacia este objetivo, pero tal vez tengan algo en camino».

Según Microsoft Research, el coste del almacenamiento de ADN debe caer por un factor de 10.000 antes de que sea ampliamente adoptado. Aunque muchos expertos dicen que es poco probable, Microsoft cree que tales avances podrían ocurrir si la industria de la computación los demanda.

Automatizar el proceso de escribir datos digitales en el ADN también será crítico. Basado en las varias semanas que se necesitaron para llevar a cabo su experimento, Carmean estima que la tasa de movimiento de datos en el ADN fue de solo 400 bytes por segundo. Microsoft Research dice que necesita aumentar a 100 megabytes por segundo.

Microsoft Research

Leer los datos es más fácil y se hizo usando una máquina de secuenciación de alta velocidad, incluyendo, para recordar partes específicas de los archivos, de forma análoga a la memoria de acceso aleatorio en un ordenador. Incluso una doble mejora en la lectura del ADN haría que ese aspecto del sistema sea lo suficientemente eficiente para el uso comercial, piensa Microsoft.

Debido a que la escritura y recuperación de datos en el ADN es lenta, cualquier uso temprano de la tecnología se restringirá a situaciones especiales. Esto podría incluir datos que necesitan ser archivados por razones legales o reglamentarias, como videos de cámara de la policía o registros médicos.

Microsoft actualmente trabaja con Twist Bioscience, un fabricante de ADN ubicado en San Francisco. Twist es una de las nuevas compañías que intentan mejorar la producción de ADN, una lista que ahora incluye a las primeras empresas como DNAScript, Nuclera Nucleics, Evonetix, Molecular Assemblies, DNA, Helixworks y una spin-off de Oxford Nanopore llamada Genome Foundry.

Una posibilidad emocionante que persiguen algunas de las startups es reemplazar el proceso químico de 40 años usado para hacer el ADN con uno que emplea enzimas, como lo hacen nuestros propios cuerpos. Jean Bolot, director científico de Technicolor Research, en Los Altos, dice que está financiando este trabajo en la Universidad de Harvard, en el laboratorio de George Church, el experto en genómica.

«Estoy seguro de que tendremos resultados este año y se hablará de ello», dice Bolot, quien añade que su compañía ha estado en conversaciones con estudios de cine sobre cómo podrían emplear el almacenamiento de ADN. Piensa que la mitad de todas las películas hechas antes de 1951 ya están perdidas porque estaban almacenadas en celuloide. Ahora los nuevos formatos, como el vídeo de alta definición y la realidad virtual, están estirando la capacidad de los estudios para preservar su trabajo, afirma.

Microsoft ResearchZhirnov piensa que los fabricantes de chips de ordenador se están tomando lo del ADN en serio porque hay límites físicos a la gran cantidad de datos que se pueden almacenar en los medios convencionales, como cintas o discos duros. Su organización, que está financiada por Microsoft, Intel y otros para realizar investigación aplicada, comenzó a hacer un vistazo más de cerca de la opción ADN desde 2013. Dice que expertos en semiconductores que creían que el ADN era demasiado «suave» se sorprendieron al saber que dura de un centenar a mil veces más que un dispositivo de silicio. La molécula es tan estable que es frecuentemente recuperada de huesos de mamut y de restos humanos antiguos.

Pero su característica más importante es la densidad. El ADN puede contener 1.000.000.000.000.000.000 (aka un quintillion) octetos de información en un milímetro cúbico. «La densidad está impulsando todo«, dice Zhirnov.

Un portavoz de Microsoft Research dijo que la compañía no podía confirmar «especificaciones sobre un plan de producto» en este momento. Dentro de la empresa, la idea de almacenamiento de ADN está aparentemente ganando adhesiones, pero aún no es universalmente aceptada. «Nuestro personal interno nos cree, pero no la gente de almacenamiento en cinta», dice Carmean, anteriormente un diseñador de chips de Intel.

Además de ser denso y duradero, el ADN tiene una ventaja adicional que no se menciona a menudo, su extrema relevancia para la especie humana. Piensa en los discos viejos que no puedes leer más o en las tabletas de arcilla con jeroglíficos indescifrables. A diferencia de estos medios, el ADN probablemente nunca pasará de moda.

«Siempre estaremos leyendo el ADN mientras seamos humanos«, dice Carmean.