Nội dung
Lưu trữ dữ liệu bằng DNA
DNA có thể lưu trữ dữ liệu của toàn thế giới Lưu trữ dữ liệu bằng DNA
Những công nghệ lưu trữ hiện nay không thể đuổi kịp sự phát triển vũ bão của các đơn vị thông tin. Nhưng tự nhiên có thể nắm giữ câu trả lời cho vấn đề này rồi.
PHẦN MỞ ĐẦU
Loài người đang tạo ra thông tin với một tốc độ không thể hình dung được, đến một mức mà các công nghệ lưu trữ hiện nay không thể bắt kịp. Cứ mỗi 5 năm, lượng thông tin chúng ta tạo ra lại tăng gấp 10 lần, bao gồm ảnh và các video. Không phải toàn bộ chúng cần được lưu trữ, nhưng các nhà sản xuất thiết bị lưu trữ đang không tạo ra các ổ cứng và thẻ nhớ kịp để lưu lại thứ chứng ta muốn giữ. Vì chúng ta vẫn không ngừng chụp ảnh, ghi hình, chúng ta cần phải phát triển một cách để lưu trữ chúng. Lưu trữ dữ liệu bằng DNA
Trong hàng thiên niên kỷ, thiên nhiên đã phát triển một công cụ lưu trữ thông tin đáng kinh ngạc – DNA. Nó phát triển để lưu trữ thông tin di truyền, các bản thiết kế cho việc xây dựng protein, nhưng DNA có thể được sử dụng cho nhiều mục đích hơn thế. DNA có mật độ lớn hơn phương tiện lưu trữ hiện nay nhiều: Dữ liệu trên hàng trăm ngàn đĩa DVD có thể cho vừa một gói DNA có kích thước bằng bao diêm. DNA cũng bền hơn nhiều – trải qua hàng ngàn năm – hơn so với các ổ đĩa cứng hiện nay, có thể tồn tại hàng năm hay vài thập kỷ. Và mặc dù các định dạng ổ cứng và các kết nối tiêu chuẩn trở nên lỗi thời, DNA sẽ không bao giờ, ít nhất cũng chừng nào còn có sự sống.
Vào cuối những năm 1970, một lý thuyết kỳ quặc đã bắt đầu vạch ra con đường của nó trong cộng đồng khoa học. Nhà tiên phong về trình tự DNA Frederick Sanger thuộc Phòng thí nghiệm sinh học phân tử của Hội đồng Nghiên cứu Y khoa cùng các đồng nghiệp của ông công bố bài báo quan trọng về bộ gen của virus Phi X174 (hay φX174), một bacteriophage được nghiên cứu kỹ có trong E. coli. Bộ gen đó, một số người nói trong sự phấn khích, chứa một tin nhắn từ người ngoài hành tinh. Lưu trữ dữ liệu bằng DNA.
Trong cái mà họ gọi là “nỗ lực ban đầu. . . để điều tra liệu phage φX174 DNA có mang thông điệp từ một xã hội tiên tiến hay không,” hai nhà nghiên cứu Nhật Bản Hiromitsu Yokoo và Tairo Oshima đã khám phá ra một số lý do khiến người ngoài hành tinh có thể chọn giao tiếp với con người thông qua mã DNA. DNA bền, và có thể dễ dàng sao chép. Hơn nữa, nó phổ biến trên Trái đất, và không có khả năng trở nên lỗi thời khi cuộc sống vẫn tiếp tục-thuận tiện cho người ngoài hành tinh chờ đợi cho con người để phát triển các công nghệ giải trình tự cần thiết để giải mã các thông điệp của họ. Lưu trữ dữ liệu bằng DNA.
Ý tưởng lưu trữ dữ liệu số trong DNA xuất hiện cách đây vài chục năm, nhưng những nghiên cứu gần đây của Harvard và Viện Thông tin Sinh học châu Âu cho thấy sự tiến bộ trong các phương pháp thao tác DNA hiện đại có thể làm cho nó trở nên thực tế và có thể thực hiện được. Nhiều nhóm nghiên cứu, bao gồm cả tại ETH Zurich, Đại học Illinois tại Urbana-Champaign và Đại học Columbia đang làm việc về vấn đề này.
Ý tưởng ban đầu để hiện thực hóa việc lưu trữ dữ liệu bằng DNA
Vào ngày 16 tháng 2, 2011, “Đó là một khoảnh khắc lóe sáng”, theo Goldman, dẫn đầu một nhóm nghiên cứu thuộc Viện Tin sinh học Châu Âu (EBI) tại Hinxton, Vương quốc Anh. Đúng, lưu trữ DNA có thể chậm một cách đáng thương so với khoảng thời gian cỡ 10-6 giây để đọc và ghi các bits trong một con chip bộ nhớ bằng silic. Phải tốn đến hàng giờ để mã hóa thông tin bằng chuỗi tổng hợp DNA với một trật tự base đặc trưng, và thậm chí nhiều giờ hơn để khôi phục thông tin sử dụng một máy giải trình tự. Nhưng với DNA, một hệ gen người đầy đủ lại vừa trong một tế bào không thể nhìn được bằng mắt thường. Xét về mật độ lưu trữ thông tin, DNA có thể được xếp trên rất xa chip silic – hoàn hảo cho lưu trữ lâu dài. Lưu trữ dữ liệu bằng DNA.
“Chúng tôi ngồi trong quầy bar với khăn ăn và những cây bút bi,” Goldman nói, và bắt đầu làm rõ những ý tưởng: “Chúng ta nên làm gì để điều đó diễn ra?” Lo lắng lớn nhất của các nhà nghiên cứu đó là tổng hợp và giải trình tự DNA có thể phát sinh 1 lỗi cứ mỗi 100 nu. Điều này sẽ làm cho lưu trữ thông tin quy mô lớn trở nên không đáng tin cậy – trừ khi họ có thể tìm ra một quy trình sửa lỗi có thể vận hành được. Họ có thể mã hóa các bit vào cặp base theo một cách mà cho phép họ phát hiện và hoàn tác các lỗi? “Chỉ trong một một buổi tối, chúng tôi biết rằng chúng tôi có thể.”
Ông và đồng nghiệp tại EBI là Ewan Birney đưa ý tưởng này quay trở lại phòng thí nghiệm và chỉ hai năm sau họ đã thông báo rằng họ đã thành công khi sử dụng DNA để mã hóa 5 tệp tài liệu, bao gồm các bản sonet của Shakespeare và đoạn trích bài diễn thuyết ‘Tôi có một giấc mơ’ của Martin Luther King. Sau đó, nhà sinh học George Church và nhóm của ông ở Đại học Harvard tại Cambridge, Massaachusetts, đã tiết lộ về việc độc lập xác định sự mã hóa DNA. Nhưng với 739 kilobytes (kB), các file EBI được coi là sự lưu trữ DNA lớn nhất được tạo ra đến thời điểm đó – cho đến tháng 7 2016, khi các nhà nghiên cứu từ Microsoft và Đại học Washington đã công bó một bước nhảy vọt đến 200 megabytes (MB). Lưu trữ dữ liệu bằng DNA
Các dấu hiệu thử nghiệm mới nhất quan tâm đến việc sử dụng DNA như là một công cụ lưu trữ đang dậy lên vượt ra ngoài giới hạn của genomic: toàn thế giới đang đối mặt với một cuộc khủng hoảng thông tin. Đếm tất cả mọi thứ từ các ảnh thiên văn và các bài báo công bố cho đến các video Youtube, việc lưu trữ kỹ thuật số (digital) toàn cầu có thể chạm đến 44 nghìn tỉ (44×1012 ) Gigabytes (GB) vào năm 2020, cao gấp 10 lần so với 2013. Đến 2040, nếu mọi thứ được lưu trữ để truy cập tức thời, các con chip nhớ flash được dùng trong bộ nhớ, thì việc lưu trữ có thể tiêu tốn 10 – 100 lần so với khả năng đáp ứng của chip silic nano.
Đây là một lý do vì sao lưu trữ cố định những dữ liệu ít truy cập hiện nay hiếm khi dùng đến loại băng từ cũ. Phương tiện này nén thông tin với mật độ cao hơn chip silic nhưng tốc độ đọc chậm hơn rất nhiều. Một trung tâm thông tin đang nắm giữ một exabyte (1 tỷ GB) trên băng từ đòi hỏi 1 tỉ đô-la Mỹ trong 10 năm để xây dựng và duy trì, cũng như hàng trăm MW điện. Lưu trữ dữ liệu phân tử có tiềm năng hạn chế tất cả những yêu cầu đó. Nếu thông tin có thể được đóng gói chặt như trong gen của vi khuẩn E.coli, nhu cầu lưu trữ của thế giới có thể đạt được bằng khoảng 1 kg DNA. (Xem phần Storage limits).
Việc lưu trữ sẽ không dễ dàng. Trước khi DNA có thể trở thành một đối thủ lộ diện của các công nghệ lưu trữ thông thường hiện nay, các nhà khoa học sẽ phải vượt qua những thách thức, từ độ tin cậy và chỉ thu thập thông tin mà một người dùng cần, để tạo các trình tự nucleotide đủ rẻ và nhanh.
Nhưng những nỗ lực để đáp ứng những thách thức đó đang được nâng lên. Tập đoàn Nghiên cứu Bán dẫn (SRC), một tổ chức tại Durham, North Carolina, được hỗ trợ bởi một tập đoàn các công ty sản xuất chip, đang hỗ trợ công việc lưu trữ DNA. Goldman và Birney có nguồn tài chính của chính phủ Anh để thử nghiệm các phương pháp tiếp cận lưu trữ DNA thế hệ kế tiếp và đang lên kế hoạch thành lập một công ty để xây dựng nghiên cứu của họ. Và vào tháng 4 2016, IARPA và SRC đã tổ chức một hội thảo cho các nhà nghiên cứu học thuật và công nghiệp, bao gồm từ chuyên gia các công ty như IBM, để định hướng nghiên cứu trong lĩnh vực này.
Is DNA the future of data storage?
In the event of a nuclear fallout, every piece of digital and written information could all be lost. Luckily, there is a way that all of human history could be recorded and safely stored.The key ingredient is inside all of us: our DNA.
Posted by TED-Ed on Monday, October 9, 2017
Xem phần 1: Phần 1ưu trCó ữ dữ liệu bằng DNA.
Iceberg (tổng hợp)
No Responses