VnReview
Hà Nội

Tìm hiểu về lưu trữ số phần 3: Đảm bảo an toàn dữ liệu

Một trong các chức năng của thiết bị lưu trữ, có thể nói là chức năng quan trọng nhất, là bảo đảm các dữ liệu lưu trữ được an toàn, nhất là trong trường hợp có hỏng hóc về phần cứng. Hai phương pháp để bảo vệ an toàn dữ liệu gồm sao lưudư thừa dữ liệu (redundancy). Hai phương pháp này thực sự khác nhau, nên hiểu rõ về sự khác biệt này.

Dư thừa dữ liệu

Về cơ bản, dư thừa dữ liệu (sau đây tôi sẽ dùng thuật ngữ gốc tiếng Anh là redundancy) là sử dụng nhiều ổ gắn trong để lưu thông tin, hay nói cách khác, lưu cùng một thông tin ở nhiều nơi. Có nhiều cách để thực hiện phương pháp này, nhưng cách phổ biến nhất là sử dụng RAID (đã được nói tới ở phần 2 của loạt bài viết này). Bạn cần lưu ý rằng redundancy không phải là một giải pháp sao lưu dữ liệu, mà là một phương thức khôi phục dữ liệu khi có ổ gắn trong bị hỏng hóc. Hai cấu hình RAID thường được sử dụng nhất có tính năng redundancy là RAID 1 và RAID 5.

Tìm hiểu về lưu trữ số phần 3:  đảm bảo an toàn dữ liệu

Redundancy là phương pháp lưu cùng một thông tin ở nhiều ổ, để khi có sự cố thì có thể nhanh chóng lấy lại thông tin để tiếp tục hoạt động

RAID 1 yêu cầu ít nhất hai ổ cứng, và số lượng ổ cứng cần thiết để sử dụng trong RAID 1 nhiều gấp đôi so với số lượng thông thường. Hai ổ gắn trong này "phản chiếu" dữ liệu của nhau, tức là chứa những dữ liệu y như nhau. Do đó, chỉ có một nửa dung lượng có thể dùng để lưu dữ liệu, nửa dung lượng còn lại được sử dụng cho redundancy. RAID 5 yêu cầu ít nhất 3 ổ gắn trong, và dung lượng lưu trữ có thể sử dụng tương đương với tổng số ổ trừ đi 1. Ở phương thức này, nếu như một ổ bị hỏng thì các ổ khác sẽ giúp khôi phục lại dữ liệu để tránh bị mất.

Lưu ý: Mặc dù RAID thường sử dụng trong các thiết bị lưu trữ hỗ trợ nhiều ổ gắn trong, đối với thiết bị lưu trữ sử dụng cổng Thunderbolt, như Lacie Liggle Big Disk Thunderbolt, bạn có thể nối nhiều ổ đơn lại với nhau và tạo cấu hình RAID. Thiết bị lưu trữ cần có hai cổng Thunderbolt, và khi cấu hình RAID được tạo thì chúng chỉ có thể được sử dụng trên một máy tính. Tuy nhiên hầu như việc đầu tư cho một hệ thống lưu trữ nhiều ổ cứng hỗ trợ RAID vẫn tiết kiệm hơn.

Bạn có thể hình dung redundancy như hai cái túi nhựa bọc vào nhau, để mang đồ từ siêu thị về nhà. Nếu như có một túi bị hỏng trên đường về, thì các thức ăn bên trong sẽ không bị rơi ra ngoài.

Dù vậy phương pháp redundancy cũng bao gồm cả ưu và nhược điểm.

Ưu điểm: Ưu điểm rõ rệt nhất và lớn nhất của redundancy chính là khả năng bảo vệ an toàn dữ liệu thời gian thực trong trường hợp ổ hỏng hóc. Điều này có nghĩa là nếu như bạn đang làm việc trên một tập tin và một trong các ổ của cấu hình RAID hỏng, thiết bị lưu trữ vẫn có thể hoạt động tiếp (một số cấu hình RAID còn có thể hoạt động khi hỏng tới hai ổ). Thiết bị lưu trữ sẽ thông báo rằng một trong các ổ gắn trong đã hỏng, cho phép bạn sao lưu lại các thông tin quan trọng và thay ổ hỏng bằng ồ mới. Sau đó, trong một quá trình gọi là xây dựng lại RAID, ổ thay thế sẽ được ghi lại bằng những thông tin của ổ cũ để trở thành một phần của hệ thống RAID; và trong suốt quá trình đó thiết bị lưu trữ vẫn có thể hoạt động bình thường.

Nói ngắn gọn, redundancy là một cách bảo vệ dữ liệu tức thời. Và do các ổ gắn trong có thể hỏng bất cứ lúc nào, redundancy rất quan trọng đối với các thiết bị lưu trữ những thông tin quan trọng hay cung cấp các dịch vụ không thể bị gián đoạn.

Nhược điểm: Nhược điểm đầu tiên của redundancy là chi phí; bạn cần phải mua nhiều ổ gắn trong, và điều này có thể rất tốn kém. Ví dụ một hệ thống RAID 1 sẽ yêu cầu bạn chi tiền gấp đôi so với số lượng lưu trữ được.

Nhược điểm thứ hai là redundancy không thể bảo vệ dữ liệu khi có các tai họa như cháy nhà hay ngập lụt, hoặc khi chính thiết bị lưu trữ bị hỏng. Redundancy cũng không cho phép lưu nhiều phiên bản của cùng một dữ liệu. Chức năng này được bàn tới trong phần sau về sao lưu.

Và cuối cùng, thời gian xây dựng lại RAID có thể rất dài, đến vài ngày tùy thuộc vào lượng dữ liệu lưu trên thiết bị lưu trữ. Trong quá trình đó, RAID rất có thể gặp vấn đề, và nếu như ổ thứ hai cũng hỏng trước khi quá trình này hoàn thành, cả hệ thống RAID sẽ trục trặc và bạn sẽ mất hết dữ liệu. Trong thực tế, trong thời gian xây dựng lại RAID, một hệ thống lưu trữ RAID còn tiềm ẩn nguy hiểm hơn cả một thiết bị lưu trữ một ổ, do việc xây dựng lại RAID làm các ổ cứng đều phải hoạt động, đặc biệt khi hệ thống RAID vẫn tiếp tục hoạt động để cung cấp dữ liệu cho người dùng.

Không cần biết bạn thiết lập RAID như thế nào, hãy nhớ là nó giống như mua bảo hiểm vậy, là một thứ mà bạn cần để đề phòng trường hợp xấu xảy ra, và thực sự thì không muốn trường hợp đó xảy ra. Chức năng thay nóng một ổ chỉ nên dùng khi thực sự cần thiết, chứ không nên coi nó như một tính năng "thú vị". Bạn càng sử dụng tính năng này thường xuyên thì càng có nguy cơ mất sạch dữ liệu lưu trên cả thiết bị. Do đó, khi bạn có một thiết bị lưu trữ có khả năng RAID, nên lựa chọn dung lượng ổ cứng lớn từ đầu để tránh phải thay ổ giữa chừng để nâng dung lượng.

Cuối cùng, tôi muốn nhắc lại lần nữa: redundancy không phải là sao lưu dữ liệu. Và bạn không nên lưu tất cả dữ liệu của mình trên một thiết bị lưu trữ, kể cả thiết bị hỗ trợ redundancy.

Sao lưu

Người dùng bình thường có thể không cần redundancy, nhưng chắc chắn cần sao lưu, có nghĩa là giữ nhiều phiên bản sao chép của dữ liệu ở nhiều địa điểm để nếu có việc gì xảy ra thì có thể sử dụng một phiên bản này thay thế cho một phiên bản khác. Càng có nhiều bản sao lưu thì dữ liệu càng an toàn.

Lại lấy ví dụ về việc mua đồ. Sao lưu giống như sử dụng hai (hoặc nhiều hơn) túi đựng số lượng trứng như nhau. Nếu như các quả trứng trong một túi bị vỡ, bạn vẫn có còn trứng trong các túi khác để làm bữa sáng.

Việc sao lưu rất đơn giản, và thực tế là vẫn diễn ra nhiều hơn những gì bạn nghĩ. Ví dụ, gửi email kèm một văn bản Word tới người khác (hoặc tới chính bạn) cũng là một hình thức sao lưu, vì giờ đây có ít nhất hai phiên bản của tập tin đó, một trong máy tính của bạn và một trong máy người nhận. Nếu như bạn sử dụng dịch vụ email nền Web, như Gmail, thì một bản lưu cũng được trữ trên máy chủ của Google. Đối với các bức ảnh hay những dữ liệu nhẹ (xét về dung lượng) khác cũng tương tự.

Rõ ràng sử dụng email không thể là phương pháp sao lưu chính của bạn: nó rất mất thời gian. Bạn nên sử dụng một phương pháp hiệu quả hơn. Dưới đây là những phương pháp sao lưu thông dụng nhất, phù hợp với nhiều yêu cầu.

Sao lưu trực tuyến (hay còn gọi là sao lưu đám mây)

Một dịch vụ sao lưu trực tuyến cho phép bạn lưu trữ dữ liệu bằng cách tải lên mạng thông qua Internet tới một hoặc nhiều máy tính. Thông thường thì bạn không cần biết máy tính lưu trữ dữ liệu ở đâu. Thực tế, dữ liệu của bạn thường được lưu trữ trên nhiều máy chủ ở nhiều trung tâm dữ liệu khác nhau trên thế giới.

Có nhiều dịch vụ sao lưu trực tuyến, như Dropbox, Google Drive hay SkyDrive, và tất cả đều tự động đồng bộ nội dung ở máy tính với máy chủ theo thời gian thực, hoặc dựa trên một lịch mà bạn đặt ra từ trước. Hầu hết các dịch vụ này đều cung cấp cho bạn dung lượng lưu trữ miễn phí là 5 GB, và bạn có thể mua thêm dung lượng nếu cần. Google cũng cung cấp dịch vụ Google Docs, dịch vụ thay thế cho Microsoft Office, cho phép lưu tất cả văn bản lên đám mây (các máy chủ) của Google.

Tìm hiểu về lưu trữ số phần 3:  đảm bảo an toàn dữ liệu

Google Drive là dịch vụ sao lưu rất tốt cho người dùng Gmail

Ưu điểm của lưu trữ trực tuyến: Phương pháp này rất tiện lợi và giúp bạn tránh mất dữ liệu kể cả khi có tai nạn gì đó. Bạn cũng không cần mua thêm dụng cụ gì. Thông thường bạn có thể lấy lại dữ liệu từ bất cứ đâu, bất cứ máy tính nào, miễn là có kết nối Internet. Phương pháp này phù hợp với lượng dữ liệu không lớn (dưỡi 5 GB) và khi có Internet tốc độc ao.

Nhược điểm của lưu trữ trực tuyến: Phương pháp này phụ thuộc rất lớn vào kết nối Internet, đặc biệt là tốc độ tải lên. Ví dụ bạn có một kết nối với tốc độ tải lên là 12 Mbps, như vậy sẽ cần khoảng 1 giờ để tải lên 5 GB dữ liệu. Hầu hết các dịch vụ Internet phổ thông hiện nay tại Việt Nam có tốc độ tải lên từ 0,5 Mbps tới 1 Mbps. Tương tự, quá trình tải dữ liệu về cũng phụ thuộc vào tốc độ và độ ổn định của mạng, và có thể sẽ mất rất nhiều thời gian. Lưu trữ trực tuyến cũng đồng nghĩa bạn phải phụ thuộc vào một bên thứ ba về sự an toàn và riêng tư của dữ liệu cá nhân, và những dịch vụ trả phí đôi khi cũng khá tốn kém.

Do vậy, nếu như bạn có rất nhiều ảnh, bài hát, và đặc biệt là phim và muốn lưu trữ an toàn, bạn nên tìm kiếm một phương pháp sao lưu khác.

Sao lưu cục bộ hay sao lưu trực tiếp

Với phương pháp sao lưu này dữ liệu được sao lưu lên các ổ lưu trữ gắn ngoài, như ổ cứng gắn ngoài hay ổ nhớ USB. Phương pháp này cho phép sử dụng thiết bị lưu trữ với dung lượng lớn hơn và rẻ hơn. Như đã đề cập ở phần hai của loạt bài viết, có hai loại thiết bị lưu trữ gắn ngoài chính: ổ loại nhỏ và ổ loại lớn.

Tìm hiểu về lưu trữ số phần 3:  đảm bảo an toàn dữ liệu

Một vài thiết bị sao lưu trực tiếp

Ổ loại nhỏ thường có kích thước nhỏ và được cấp điện qua cáp nối với máy tính, thông thường là cáp USB hoặc Thunderbolt. Những thiết bị này lưu trữ dựa trên ổ gắn trong với kích thước 2,5 inch. Chúng có giá thấp nhưng thường là loại được thiết lập một ổ, và dung lượng dưới 2 TB. Dù vậy, với dung lượng của chúng thì đây cũng là những lựa chọn sao lưu rất tốt và đặc biệt là thuận tiện cho những người muốn đem dữ liệu theo. Nhiều loại ổ gắn ngoài loại nhỏ được trang bị phần mềm sao lưu có thể tự chạy mỗi khi bạn cắm ổ vào máy tính, giúp thuận tiện hơn cho việc sao lưu. Cá nhân tôi cho rằng việc sử dụng một hoặc hai ổ loại nhỏ là cách tốt nhất để sao lưu dữ liệu. Nếu như bạn chưa bao giờ sao lưu dữ liệu của mình, hãy làm ngay khi có thể.

Ổ loại lớn thông thường lưu trữ vào các ổ gắn trong kích thước 3,5 inch. Chúng có thể có thiết lập gồm một ổ hoặc nhiều ổ, và loại nhiều ổ có thể sử dụng ổ gắn trong 2,5 inch để nhỏ gọn hơn. Tất cả các loại ổ loại lớn đều cần một bộ cấp điện thoại, tuy nhiên có khả năng cung cấp dung lượng nhiều hơn ổ loại nhỏ, lên tới 4 TB với thiết lập một ổ. Các ổ loại lớn đôi khi có cả tính năng redundancy, đem lại giải pháp lý tưởng cho những người muốn có cả tính năng sao lưu và redundancy hoặc cần phải giao lưu một lượng rất lớn dữ liệu. Một vài loại thiết bị còn có khả năng chống chọi lại tai nạn như cháy hoặc ngập nước, ví dụ như thiết bị Solo Fireproof Waterproof External Hard Drive của hãng IoSafe.

Ưu điểm của việc sao lưu cục bộ là tốc độ cao, đặc biệt là khi sử dụng các thiết bị kết nối qua cổng Thunderbolt, và có thể xử lý lượng lớn dữ liệu. Tùy thuộc vào phần mềm sao lưu, nó có thể lưu cả các phiên bản khác nhau của tập tin, và trong nhiều trường hợp việc lưu dữ liệu trên một thiết bị độc lập, bên cạnh bản chính của nó, giúp cho bạn có thể trở về phiên bản trước đó ngay khi có vấn đề với tập tin đang làm việc.

Nhược điểm của phương pháp này là bạn chỉ có thể sao lưu một máy tính hoặc thiết bị trong một thời điểm, và bạn phải kết nối ổ lưu trữ vào máy tính trước khi thực hiện việc sao lưu. Mặc dù việc này nghe rất đơn giản nhưng cũng có nhiều người lại quên mất. Sao lưu cục bộ cũng làm cho không gian làm việc của bạn bừa bộn hơn với nhiều thiết bị.

Nếu như bạn có nhiều máy tính ở nhà và muốn quản lý các bản sao lưu chỉ tại một máy, bạn có thể nghĩ đến phương pháp sao lưu qua mạng.

Sao lưu qua mạng

Giống như tên gọi của nó, phương pháp này cho phép bạn sử dụng một máy tính làm nơi sao lưu cho tất cả các máy tính và thiết bị khác. Cách tốt nhất để thực hiện điều này là sử dụng máy chủ NAS. Sao lưu là một trong số rất nhiều tính năng của các máy chủ NAS, và cũng có nhiều loại sao lưu bạn có thể thực hiện.

Tuy vậy, một số máy chủ NAS, ví dụ như Time Capsule của Apple, được thiết kế chỉ dành cho mục đích sao lưu. Những máy chủ NAS này lưu trữ các bản sao của dữ liệu ở nhiều máy tính trong mạng. Đối với Time Capsule, bạn có thể sử dụng ứng dụng Time Machine để lưu trữ dữ liệu của nhiều máy Mac trên Time Capsule.

Những máy chủ NAS cao cấp còn cung cấp phương pháp sao lưu đám mây, để bạn có thể sao lưu nhiều máy tính ở xa thông qua Internet. Về cơ bản thì phương thức hoạt động của nó giống như những dịch vụ lưu trữ trực tuyến đã được nhắc tới ở trên, chỉ khác là bạn có toàn quyền điều khiển máy chủ của riêng bạn.

Tìm hiểu về lưu trữ số phần 3:  đảm bảo an toàn dữ liệu

Với khả năng hỗ trợ hai ổ cứng và các kết nối USB, máy chủ NAS Synology DS213air có cả tính năng sao lưu lẫn redundancy

Sao lưu qua mạng có nhiều ưu điểm, do nó khá giống với hình thức sao lưu trực tuyến, trừ việc bạn luôn cần kết nối Internet. Nó cũng giống với hình thức sao lưu cục bộ, ngoại trừ việc phải cắm thiết bị vào mỗi lần muốn thực hiện sao lưu. Một khi thiết bị đã được cấu hình, nó sẽ tự chạy và bạn không cần phải làm gì nữa. Thêm nữa, nhiều máy tính có thể cùng sao lưu một lúc, và có thể nói là không có một giới hạn nào cho mức dung lượng lưu trữ. Một máy chủ NAS có thể để gọn ở một góc, không gây bừa bộn.

Hình thức này cũng có các nhược điểm như thường tốn kém và phức tạp hơn so với hai hình thức sao lưu trên. Đối với hầu hết người dùng tại gia thì phương pháp này cũng hơi thừa thãi. Thêm nữa, so với việc sao lưu trực tiếp, đặc biệt là với thiết bị dùng kết nối Thunderbolt, việc sao lưu qua mạng thường chậm hơn, do nó bị giới hạn bởi tốc độ của mạng cục bộ, hiện nay tối đa là 1 Gbps.

Phương pháp tốt nhất

Phương pháp tốt nhất để đảm bảo an toàn cho dữ liệu là sử dụng cả redundancy và sao lưu nếu có thể. Tất cả các thiết bị có thể thiết lập dùng nhiều ổ sẽ cung cấp cho bạn tính năng redundancy. Tuy nhiên nếu như phải chọn giữa một trong hai, thì nên nhớ là việc sao lưu thường quan trọng hơn, nhất là đối với người dùng tại gia.

Khi xét tới sao lưu, hãy sử dụng bất kỳ phương pháp nào mà bạn có thể. Ví dụ, nếu như bạn sử dụng một chiếc smartphone, hãy đảm bảo là bạn thường xuyên đồng bộ hóa dữ liệu với máy tính hoặc với một máy chủ trực tuyến, hoặc tạo thói quen email những tài liệu quan trọng của bạn tới chính địa chỉ của bạn hay một người bạn thân.

Nên nhớ rằng dù bạn có rất nhiều dữ liệu, thì lượng dữ liệu đặc biệt quan trọng và không thể thay thế thường không nhiều. Các nội dung số trả tiền như nhạc hay phim hoàn toàn có thể tải lại hoặc thậm chí mua lại, nên bạn không cần phải sao lưu chúng nếu như không có đủ dung lượng lưu trữ. Tuy nhiên, nếu như bạn đang thực hiện một dự án quan trọng, hoặc lưu trữ những thông tin tài chính, thì bạn nên sao lưu hàng ngày hoặc thậm chí sau mỗi lần sửa đổi.

Và quan trọng nhất là đừng bao giờ chỉ lưu một bản của dữ liệu quan trọng, trên đúng một thiết bị lưu trữ.

Tuấn Anh

Chủ đề khác