Arctic-Cave2

 

Đó là quần đảo Svalbard của Na Uy nằm trên Bắc Băng Dương, cách vùng đất liền Châu Âu 1.000 km về phía Bắc. Tại đây có một mỏ than bị bỏ hoang trên sườn núi. Và bên trong mỏ than ấy, có một hầm thép chứa kho dữ liệu được mã hóa của hàng trăm nghìn dự án trên thế giới nằm sâu dưới lòng đất khoảng 250 mét. Kho dữ liệu này chính là Cơ quan lưu trữ Bắc Cực (AWA) thuộc sở hữu của Công ty Pipl.

Lưu trữ ngoạn mục

Kĩ sư Rune Bjerkestrand đã thành lập công ty này vào năm 2002. Mục đích ban đầu là để bảo quản phim thông qua việc mã hóa các bộ phim dưới dạng mã nhị phân. Piql có công nghệ số hóa các bộ phim với tốc độ nhanh hơn 100 lần so với các đối thủ cạnh tranh, và được các hãng phim lớn như Warner Brothers, Walt Disney và Universal Studios tin tưởng hợp tác.

Nhưng Bjerkestrand sớm nhận ra hầu hết mọi sản phẩm kĩ thuật đều có thể xâu chuỗi dưới dạng mã nhị phân – 1 và 0. Và những dữ liệu này có thể bảo quản trong hộp tới hàng trăm năm. Khác với những thiết bị lưu trữ khác – yêu cầu phải cập nhật phần mềm liên tục, kĩ thuật của Piql dựa trên phần cứng: chừng nào hộp còn tồn tại thì mã vẫn còn đó.

Với sự giúp đỡ của công ty khai thác mỏ Na Uy, Piql đã xây dựng AWA trong một mỏ than ngừng hoạt động, ngay dưới kho hạt giống toàn cầu và bắt đầu tiếp nhận dữ liệu từ năm 2017.

Svalbard là địa điểm lí tưởng để xây dựng AWA bởi quần đảo có nhiều tuyến đường lưu thông nhưng vẫn cách biệt với thế giới. Điều kiện đóng băng vĩnh cửu và khí hậu tại đây phù hợp với việc lưu trữ lạnh khô dài hạn. Ngoài ra, Svalbard là một khu vực phi quân sự và độc lập kể từ năm 1925, nên nó được coi là một trong những nơi an toàn nhất về địa lí và chính trị trên thế giới.

Các hộp chứa phim của Piql hầu như không thể bị phá hủy. Công ty Piql đã thử nghiệm tác động những hộp phim này dưới điều kiện -196°C cùng xung điện từ và bức xạ hạt nhân. Một viện nghiên cứu của Na Uy đã ước tính một chiếc hộp có thể tồn tại hơn 500 năm mà không bị hư hỏng. Cuộn phim cũng được phủ tinh thể bạc halua và oxit sắt, và có tuổi thọ dự kiến từ 500 đến 2.000 năm.

Chi phí lưu trữ dữ liệu ở AWA phụ thuộc vào thời gian tồn tại của sản phẩm. Khách hàng cần thanh toán trước dựa trên độ bền của vật liệu họ yêu cầu, ví dụ 50 năm hay là 500 năm.

Có khả thi?

Chúng ta được cảnh báo rằng xã hội đang trải qua “Thời kì kĩ thuật số đen tối”: con người đang tạo ra và sử dụng rất nhiều dữ liệu, nhưng phần lớn dữ liệu có thể sẽ không tồn tại được đến cuối thế kỉ này.

Theo Rick West – nhà quản lí dữ liệu của Google: “Một ngày nào đó, chúng ta có thể biết về đầu thế kỷ 21 ít hơn cả đầu thế kỷ 20”. Lí do là các chuẩn định dạng lưu trữ dữ liệu hiện nay đang thay đổi nhanh đến mức tài liệu của một vài thập kỉ trước đã gần như không đọc được nữa. Bởi vậy, việc nghiên cứu giải pháp lưu trữ dữ liệu dài dạn là vô cùng cấp bách.

Ngoài Piql, rất nhiều công ty khác cũng đang cố gắng bảo quản thông tin như Arkivum, StorCentric và PreserveOn. Nhưng điều này khả thi đến mức nào? Và ngay cả khi chúng ta thành công trong việc lưu trữ dữ liệu trong hơn 500 năm, liệu các thế hệ tương lai có thể giải mã được ý nghĩa của nó không?

Ông Ruth Duerr, Chuyên gia quản lý dữ liệu tại Viện Ronin, nói: “Nếu chỉ có dữ liệu gốc thì đôi khi không hữu ích với người sử dụng. Ví dụ hình ảnh một chiếc giày của George Washington sẽ không có tác dụng gì nhiều, đặc biệt nếu bạn không biết George Washington đã từng mang nó trên chân”.

Để giải quyết vấn đề này, Piql có một hệ thống để giải thích cho các thế hệ tương lai cách đọc mã QR. Trên mỗi hộp dữ liệu là một tập hợp các hướng dẫn, có thể đọc được bằng kính lúp. Những thông tin được viết bằng tiếng Anh, tiếng Ả Rập, tiếng Tây Ban Nha, tiếng Trung và tiếng Hindi.

Nhưng thiếu bối cảnh thông tin cụ thể, liệu các thế hệ tương lai có thể phát hiện ra rằng họ đang xem mã cho một ứng dụng giao đồ ăn chứ không phải cho một chiếc ô tô tự lái không? Chắc thế hệ chúng ta khó biết được câu trả lời vì chẳng ai trong số chúng ta sống được 500 năm.

Nhưng hiện tại, Piql vẫn đang ăn nên làm ra. Khách hàng lớn mới nhất của họ là Github – công ty chuyên lưu trữ mã nguồn lớn nhất thế giới của Mỹ. Github vừa chuyển 21 terabyte dữ liệu của hàng triệu người dùng vào AWA.

Linh Nguyễn