ADN, alfabeto ADN
Como ocurre con la mayoría de las cosas, el sistema de almacenamiento de datos de la naturaleza, el ADN, supera con creces cualquier cosa que hayamos creado.
Ahora, los investigadores de la Universidad de Illinois Urbana-Champaign han duplicado su ya increíble capacidad de almacenamiento al agregar letras adicionales a su "alfabeto" y han desarrollado una nueva forma de leerlo. La investigación fue publicada en la revista Nano Letters .
El ADN se compone naturalmente de combinaciones de cuatro nucleobases: adenina, guanina, citosina y timina. Representadas por las letras A, G, C y T, estas bases se agrupan en diferentes secuencias para formar planos para cada organismo vivo. Y este sistema de almacenamiento de información es increíblemente denso, con un solo gramo de ADN capaz de almacenar hasta 215 petabytes (215 millones de GB) de datos.
Eso, por supuesto, lo convierte en una solución de almacenamiento potencial muy atractiva para las enormes cantidades de datos que la sociedad moderna produce diariamente: todo el contenido de Internet podría caber en una caja de zapatos llena de ADN. Y como si ese almacenamiento no fuera lo suficientemente denso, los investigadores del nuevo estudio han encontrado una manera de duplicarlo.
Junto con las habituales A, G, C y T, el equipo agregó efectivamente siete "letras" adicionales al alfabeto de ADN. Estos toman la forma de nucleótidos modificados químicamente, abriendo combinaciones más variadas que permiten almacenar más información dentro de la misma cantidad de espacio físico.
Imagínese el alfabeto. Si solo tuviera cuatro letras para usar, solo podría crear un paquete limitado de palabras. Si tuviera el alfabeto completo, podría producir combinaciones ilimitadas de palabras. Eso es lo mismo con el ADN. En lugar de convertir ceros y unos en A, G, C y T, podemos convertir ceros y unos en A, G, C, T y las siete letras nuevas del alfabeto de almacenamiento.
Claro que agregar nucleótidos adicionales significa que los sistemas existentes para leer datos no los reconocerán, por lo que el equipo también desarrolló un nuevo sistema que puede hacerlo. La hebra de ADN pasa a través de un nanoporo en una proteína especialmente diseñada, que puede detectar las unidades individuales sin importar si son naturales o sintéticas. Luego, los algoritmos de aprendizaje automático decodifican la información almacenada en ellos.
Se probaron 77 combinaciones diferentes de los 11 nucleótidos, y el método propuesto pudo diferenciar cada uno de ellos perfectamente. El marco de aprendizaje profundo como parte del nuevo método para identificar diferentes nucleótidos es universal, lo que permite generalizar este enfoque a muchas otras aplicaciones.
Además de la densidad, el nuevo método también mejora la velocidad de escritura de los datos, que normalmente es un proceso bastante lento para el ADN. Este sistema redujo aproximadamente a la mitad la cantidad de tiempo que lleva escribir información en el ADN. Este trabajo podría ayudar a que el ADN sea un sistema de almacenamiento de datos viable, así como en las técnicas de edición genética tipo CRISPR.
COMENTARIOS