Thứ Bảy, 28/9/2024
Khoa học, công nghệ
Thứ Sáu, 9/4/2010 14:43'(GMT+7)

Câu chuyện khoa học: Lưu dữ liệu số, hãy cảnh giác!

Để bảo vệ an toàn cho dữ liệu quan trọng, sao chép ít nhất hai bản lưu trữ dữ liệu trên những phương tiện khác nhau là một trong những lời khuyên của các chuyên gia về đĩa quang số đưa ra.

Để bảo vệ an toàn cho dữ liệu quan trọng, sao chép ít nhất hai bản lưu trữ dữ liệu trên những phương tiện khác nhau là một trong những lời khuyên của các chuyên gia về đĩa quang số đưa ra.

Bạn là một doanh nghiệp đang lưu trữ nhiều thông số, dữ liệu trong kinh doanh của mình trên các bộ nhớ nhân tạo, hiện đại ấy… Hãy cảnh giác, tất cả những phương tiện lưu trữ dữ liệu số hoá đó đều… vô thường!Một báo cáo của hai hàn lâm viện khoa học và công nghệ Pháp mang tên “Tuổi thọ của thông tin số” (Longévité de l’information numérique), được giới thiệu với báo chí hôm 29.3 vừa qua, nhấn mạnh điều này và đưa ra một vài lời khuyên hữu ích. Nhóm chuyên gia tác giả báo cáo do tiến sĩ Erich Spitz, nguyên chủ tịch – tổng giám đốc Thomson-LCD, thành viên của hai viện hàn lâm, làm chủ tịch. Các ông Frank Laloë, nghiên cứu sư (Directeur de Recherches, CNRS) về vật lý, làm việc tại trường Normale Supérieure; Jean – Charles Hourcade, kỹ sư, trong ban giám đốc của Thomson, thành viên hội đồng chiến lược về công nghệ thông tin (CSTI) của Chính phủ Pháp, là thành viên. Trong phần mở đầu, báo cáo nhắc lại một ước lượng của UNESCO năm 2002, theo đó mỗi năm nhân loại sản xuất ra hơn 1 tỉ gigabit(*) thông tin số hoá. Theo một nghiên cứu mới hơn của công ty IDC, năm 2007 con số đó lên tới 281 gigabit, lớn hơn tổng dung lượng của tất cả các phương tiện lưu trữ hiện có!

Giữ CD được bao lâu?

Dù sao thì câu hỏi về tuổi thọ của các phương tiện lưu trữ thông tin số cũng đặt ra gay gắt, không chỉ vì các công ty cung cấp máy ghi và đọc đĩa thay đổi phần mềm của mình (khiến cho các đĩa cũ chỉ còn nước… vứt đi, như các đĩa mềm – floppy disc hai mươi năm trước), mà còn do đĩa bị hư hoại theo thời gian. Theo báo cáo của hai hàn lâm viện Pháp (dưới đây gọi tắt là “báo cáo”), tuổi thọ trung bình của các loại CD, DVD hiện nay chỉ khoảng 5 – 10 năm.

Một hội thảo khoa học ngày 17.11.2009 của nhóm các phòng thí nghiệm Pháp trong Tổ hợp khoa học về các đĩa quang số (tên tắt GIS-DON) đã trình bày các kết quả nghiên cứu về độ bền của các loại đĩa quang số như CD, DVD… Cả qua việc đo tính bền vững của các loại đĩa trong điều kiện tự nhiên và qua các phương pháp làm già nhân tạo (đặt đĩa trong những điều kiện vật lý cực đoan – nhiệt độ 80°C và độ ẩm 85%). Tác giả của nghiên cứu cho thấy sự già mau của đĩa trong các điều kiện bất thường không tuân theo một quy luật rõ ràng nào, biên độ về kết quả giữa các đĩa y hệt nhau của cùng một hãng sản xuất hoặc giữa các đĩa có mác khác nhau đều lớn như nhau. Mặt khác, không thể kết luận về tuổi thọ của đĩa vì thiếu một định luật vật lý thuyết phục về sự thay đổi chất lượng theo thời gian. Còn trong điều kiện tự nhiên, sau bảy năm, các đĩa giữ trong phòng thí nghiệm (không sử dụng sau khi ghi dữ liệu và được bảo quản trong hộp, điều kiện bình thường về nhiệt độ và độ ẩm) có 26% bị hư hỏng nặng, 25% khác có biến đổi chất lượng bình thường, còn 49% không biến chuyển gì. Các đĩa đã qua sử dụng, do các gia đình cung cấp, ghi dữ liệu từ 1994 – 2004 và đưa ra phân tích vào 2009, có xấp xỉ cùng một tỷ lệ bị hư hỏng nặng (23%), nhưng số không biến chuyển lại cao hơn (63%). 

Như vậy, đối với khoảng 1/4 đĩa lưu trữ, không còn có thể đọc các thông tin trong đó sau chưa tới mười năm, đĩa không mang ra sử dụng không có nghĩa là không bị thời gian làm thoái hoá! Theo các tác giả của báo cáo, các loại ổ cứng tuy đã thắng tuyệt đối về mặt dung lượng thông tin so với đĩa quang số nhưng lại có tuổi thọ ngắn hơn. Từ đó, báo cáo nhấn mạnh: “rất nhiều thông tin cá nhân, y tế hay khoa học, hành chính… thực sự có nguy cơ biến mất hoàn toàn” nếu không có biện pháp hữu hiệu để chấn chỉnh lại tình trạng này. Nguy cơ đã bước đầu được các nhà nghiên cứu báo động, như trên trang web của cục Thư viện và lưu trữ Canada. Tại Nhật, công ty Bifröstec đã thành lập một trung tâm thử đĩa lưu trữ, với một phòng thí nghiệm có phương tiện làm già nhân tạo, nhận cung cấp những thông tin về đĩa qua quá trình này cho người dùng (cần đưa cho trung tâm 100 đĩa cùng loại). Tuy nhiên, Frank Laloë nhận xét trong hội thảo của GIS-DON, các công ty sản xuất không công khai những kỹ thuật kiểm tra chất lượng của họ, và thị trường hiện nay vẫn chủ yếu chạy theo sản xuất các loại đĩa nhanh, dung lượng lớn thay vì lo tới độ bền cho các thông tin được ghi trên đó. Do đó, việc nghiên cứu độ bền này vẫn mới chỉ ở bước đầu.

“Rất nhiều thông tin cá nhân, y tế hay khoa học, hành chính… thực sự có nguy cơ biến mất hoàn toàn”

Làm gì để bảo vệ dữ liệu?

Hướng mở ra đầu tiên về lâu dài dĩ nhiên là tăng cường nghiên cứu khoa học và công nghệ để có thể đưa những loại đĩa lưu trữ có tuổi thọ dài hơn nhiều đến với công chúng với một giá phải chăng. Hiện nay, một loại đĩa làm bằng thuỷ tinh tôi luyện của hãng Century Disc (Pháp), được tin là có tuổi thọ hàng trăm năm – và đã được NASA tin cậy đưa lên một phi thuyền không gian – nhưng giá bán của nó không dưới 100 euro/chiếc. Đây là một trong những lời khuyên của hai hàn lâm viện Pháp dành cho chính quyền. Cũng như việc mau chóng thiết lập và tiến hành một chiến lược bảo vệ các lưu trữ hành chính quan trọng ở mọi cấp. Còn đối với công chúng? Cách tốt nhất hiện thời vẫn là chép lại toàn bộ lưu trữ của mình mỗi năm năm. Tuy nhiên, báo cáo chỉ ra, nếu mỗi gia đình làm theo cách này, để giữ lại khoảng từ 100 – 1.000 gigabit dữ liệu số hoá trong vòng 25 – 50 năm, họ sẽ phải tiêu vào việc này từ 100 – 1.000 euro/năm. Nhân lên cho 25 triệu gia đình Pháp, tổn phí chung đạt mức khổng lồ 2,5 – 25 tỉ euro/năm, chưa kể khối năng lượng tiêu thụ rất lớn.

Trong khi chờ đợi các tiến bộ khoa học có tính quyết định, sẽ không thừa khi nhắc lại vài lời khuyên của GIS-DON. Cùng với việc sao chép lại theo một định kỳ năm năm (thậm chí ba năm nếu là thông tin quan trọng), GIS-DON lưu ý: thứ nhất, mỗi người cần chọn lọc những thông tin mà mình muốn giữ lâu dài, rất nhiều thông tin chẳng còn ý nghĩa gì sau một thời gian ngắn, và nhớ tổ chức các “cặp tài liệu” của mình cho dễ tìm lại; Thứ hai, cần tránh các dạng tệp thay đổi quá nhanh hoặc gắn với những phần mềm thay đổi quá nhanh. Các dạng tệp mở nên được ưu tiên. Các tệp pdf, powerpoint lưu trữ nên bỏ đi một số chức năng ít tương thích với việc lưu trữ (ví dụ như các hoạt hình trong powerpoint). Các thông tin khoa học, mỗi khi có thể, nên dùng Tex/Latex ; thứ ba, cần tránh các sự cố bất ngờ bằng cách sao chép ít nhất hai bản lưu trữ trên những phương tiện khác nhau (nếu cùng là đĩa cứng hay cùng là CD, thì nên chọn hai hãng khác nhau). Nếu là đĩa quang (CD, DVD), không nên trữ đầy vì thí nghiệm cho thấy khoảng 10% cuối đĩa mau hư hơn phía trước.

(*) Gigabit = 1 tỉ bit. Để so sánh, một bài hát khoảng 4 – 5 phút, mã hoá theo mã wma nặng khoảng 5.000KB, tức 5MB, hay 5 triệu bit. Một tệp word không có hình, 1.500 chữ Việt, chiếm khoảng 40KB. Một DVD cho một phim truyện thông thường khoảng 6 gigabit. Một tấm ảnh chụp từ một máy 5 megapixel có thể có dung lượng tới 2,3MB.

Hà Dương Tường (Sài Gòn Tiếp Thị)

Phản hồi

Các tin khác

Thư viện ảnh

Liên kết website

Mới nhất