Một trong các chức 
năng của thiết bị lưu trữ, có thể nói là chức năng quan trọng nhất, là 
bảo đảm các dữ liệu lưu trữ được an toàn, nhất là trong trường hợp có 
hỏng hóc về phần cứng. Hai phương pháp để bảo vệ an toàn dữ liệu gồm sao lưu và dư thừa dữ liệu (redundancy). Hai phương pháp này thực sự khác nhau, nên hiểu rõ về sự khác biệt này.
  Bài liên quan:
  
Cơ bản về lưu trữ số (phần 1): Bộ nhớ RAM và ổ đĩa lưu trữ
  Cơ bản về lưu trữ số (phần 2): ổ đĩa gắn ngoài và máy chủ NAS
  Bài viết này là phần cuối trong series bài tư vấn cơ bản về lưu trữ số của trang công nghệ uy tín 
Cnet. Bạn có thể tìm đọc hai bài đầu tiên trong series bài tư vấn này ở hai link phía trên.
  
Dư thừa dữ liệu
 
 Về cơ bản, dư thừa dữ liệu (sau đây tôi sẽ dùng thuật ngữ gốc tiếng Anh
 là redundancy) là sử dụng nhiều ổ gắn trong để lưu thông tin, hay nói 
cách khác, lưu cùng một thông tin ở nhiều nơi. Có nhiều cách để thực 
hiện phương pháp này, nhưng cách phổ biến nhất là sử dụng RAID (đã được 
nói tới ở 
phần 2 của loạt bài viết này). Bạn cần lưu ý rằng redundancy 
không phải
 là một giải pháp sao lưu dữ liệu, mà là một phương thức khôi phục dữ 
liệu khi có ổ gắn trong bị hỏng hóc. Hai cấu hình RAID thường được sử 
dụng nhất có tính năng redundancy là RAID 1 và RAID 5.
 
 Redundancy
 là phương pháp lưu cùng một thông tin ở nhiều ổ, để khi có sự cố thì có
 thể nhanh chóng lấy lại thông tin để tiếp tục hoạt động
RAID 1 yêu cầu ít nhất hai ổ cứng, và số lượng ổ cứng cần thiết để sử 
dụng trong RAID 1 nhiều gấp đôi so với số lượng thông thường. Hai ổ gắn 
trong này "phản chiếu" dữ liệu của nhau, tức là chứa những dữ liệu y như
 nhau. Do đó, chỉ có một nửa dung lượng có thể dùng để lưu dữ liệu, nửa 
dung lượng còn lại được sử dụng cho redundancy. RAID 5 yêu cầu ít nhất 3
 ổ gắn trong, và dung lượng lưu trữ có thể sử dụng tương đương với tổng 
số ổ trừ đi 1. Ở phương thức này, nếu như một ổ bị hỏng thì các ổ khác 
sẽ giúp khôi phục lại dữ liệu để tránh bị mất.
  Lưu ý: Mặc dù 
RAID thường sử dụng trong các thiết bị lưu trữ hỗ trợ nhiều ổ gắn trong,
 đối với thiết bị lưu trữ sử dụng cổng Thunderbolt, như Lacie Liggle Big
 Disk Thunderbolt, bạn có thể nối nhiều ổ đơn lại với nhau và tạo cấu 
hình RAID. Thiết bị lưu trữ cần có hai cổng Thunderbolt, và khi cấu hình
 RAID được tạo thì chúng chỉ có thể được sử dụng trên một máy tính. Tuy 
nhiên hầu như việc đầu tư cho một hệ thống lưu trữ nhiều ổ cứng hỗ trợ 
RAID vẫn tiết kiệm hơn.
  Bạn có thể hình dung redundancy như hai 
cái túi nhựa bọc vào nhau, để mang đồ từ siêu thị về nhà. Nếu như có một
 túi bị hỏng trên đường về, thì các thức ăn bên trong sẽ không bị rơi ra
 ngoài.
  Dù vậy phương pháp redundancy cũng bao gồm cả ưu và nhược điểm.
  
Ưu điểm:
 Ưu điểm rõ rệt nhất và lớn nhất của redundancy chính là khả năng bảo vệ
 an toàn dữ liệu thời gian thực trong trường hợp ổ hỏng hóc. Điều này có
 nghĩa là nếu như bạn đang làm việc trên một tập tin và một trong các ổ 
của cấu hình RAID hỏng, thiết bị lưu trữ vẫn có thể hoạt động tiếp (một 
số cấu hình RAID còn có thể hoạt động khi hỏng tới hai ổ). Thiết bị lưu 
trữ sẽ thông báo rằng một trong các ổ gắn trong đã hỏng, cho phép bạn 
sao lưu lại các thông tin quan trọng và thay ổ hỏng bằng ồ mới. Sau đó, 
trong một quá trình gọi là xây dựng lại RAID, ổ thay thế sẽ được ghi lại
 bằng những thông tin của ổ cũ để trở thành một phần của hệ thống RAID; 
và trong suốt quá trình đó thiết bị lưu trữ vẫn có thể hoạt động bình 
thường.
  Nói ngắn gọn, redundancy là một cách bảo vệ dữ liệu tức 
thời. Và do các ổ gắn trong có thể hỏng bất cứ lúc nào, redundancy rất 
quan trọng đối với các thiết bị lưu trữ những thông tin quan trọng hay 
cung cấp các dịch vụ không thể bị gián đoạn.
  
Nhược điểm:
 Nhược điểm đầu tiên của redundancy là chi phí; bạn cần phải mua nhiều ổ
 gắn trong, và điều này có thể rất tốn kém. Ví dụ một hệ thống RAID 1 sẽ
 yêu cầu bạn chi tiền gấp đôi so với số lượng lưu trữ được.
  
Nhược điểm thứ hai là redundancy không thể bảo vệ dữ liệu khi có các tai
 họa như cháy nhà hay ngập lụt, hoặc khi chính thiết bị lưu trữ bị hỏng.
 Redundancy cũng không cho phép lưu nhiều phiên bản của cùng một dữ 
liệu. Chức năng này được bàn tới trong phần sau về sao lưu.
  Và 
cuối cùng, thời gian xây dựng lại RAID có thể rất dài, đến vài ngày tùy 
thuộc vào lượng dữ liệu lưu trên thiết bị lưu trữ. Trong quá trình đó, 
RAID rất có thể gặp vấn đề, và nếu như ổ thứ hai cũng hỏng trước khi quá
 trình này hoàn thành, cả hệ thống RAID sẽ trục trặc và bạn sẽ mất hết 
dữ liệu. Trong thực tế, trong thời gian xây dựng lại RAID, một hệ thống 
lưu trữ RAID còn tiềm ẩn nguy hiểm hơn cả một thiết bị lưu trữ một ổ, do
 việc xây dựng lại RAID làm các ổ cứng đều phải hoạt động, đặc biệt khi 
hệ thống RAID vẫn tiếp tục hoạt động để cung cấp dữ liệu cho người dùng.
 
 
 
Không cần biết bạn thiết lập RAID như thế nào, hãy nhớ là nó giống như 
mua bảo hiểm vậy, là một thứ mà bạn cần để đề phòng trường hợp xấu xảy 
ra, và thực sự thì không muốn trường hợp đó xảy ra. Chức năng thay nóng 
một ổ chỉ nên dùng khi thực sự cần thiết, chứ không nên coi nó như một 
tính năng "thú vị". Bạn càng sử dụng tính năng này thường xuyên thì càng
 có nguy cơ mất sạch dữ liệu lưu trên cả thiết bị. Do đó, khi bạn có một
 thiết bị lưu trữ có khả năng RAID, nên lựa chọn dung lượng ổ cứng lớn 
từ đầu để tránh phải thay ổ giữa chừng để nâng dung lượng.
  Cuối cùng, tôi muốn nhắc lại lần nữa: redundancy 
không phải là sao lưu dữ liệu. Và bạn không nên lưu tất cả dữ liệu của mình trên một thiết bị lưu trữ, kể cả thiết bị hỗ trợ redundancy.
 
Sao lưu
 
 Người dùng bình thường có thể không cần redundancy, nhưng chắc chắn cần
 sao lưu, có nghĩa là giữ nhiều phiên bản sao chép của dữ liệu ở nhiều 
địa điểm để nếu có việc gì xảy ra thì có thể sử dụng một phiên bản này 
thay thế cho một phiên bản khác. Càng có nhiều bản sao lưu thì dữ liệu 
càng an toàn.
  Lại lấy ví dụ về việc mua đồ. Sao lưu giống như sử
 dụng hai (hoặc nhiều hơn) túi đựng số lượng trứng như nhau. Nếu như các
 quả trứng trong một túi bị vỡ, bạn vẫn có còn trứng trong các túi khác 
để làm bữa sáng.
  Việc sao lưu rất đơn giản, và thực tế là vẫn 
diễn ra nhiều hơn những gì bạn nghĩ. Ví dụ, gửi email kèm một văn bản 
Word tới người khác (hoặc tới chính bạn) cũng là một hình thức sao lưu, 
vì giờ đây có ít nhất hai phiên bản của tập tin đó, một trong máy tính 
của bạn và một trong máy người nhận. Nếu như bạn sử dụng dịch vụ email 
nền Web, như Gmail, thì một bản lưu cũng được trữ trên máy chủ của 
Google. Đối với các bức ảnh hay những dữ liệu nhẹ (xét về dung lượng) 
khác cũng tương tự.
  Rõ ràng sử dụng email không thể là phương 
pháp sao lưu chính của bạn: nó rất mất thời gian. Bạn nên sử dụng một 
phương pháp hiệu quả hơn. Dưới đây là những phương pháp sao lưu thông 
dụng nhất, phù hợp với nhiều yêu cầu.
  
Sao lưu trực tuyến (hay còn gọi là sao lưu đám mây)
 
 Một dịch vụ sao lưu trực tuyến cho phép bạn lưu trữ dữ liệu bằng cách 
tải lên mạng thông qua Internet tới một hoặc nhiều máy tính. Thông 
thường thì bạn không cần biết máy tính lưu trữ dữ liệu ở đâu. Thực tế, 
dữ liệu của bạn thường được lưu trữ trên nhiều máy chủ ở nhiều trung tâm
 dữ liệu khác nhau trên thế giới.
  Có nhiều dịch vụ sao lưu trực 
tuyến, như Dropbox, Google Drive hay SkyDrive, và tất cả đều tự động 
đồng bộ nội dung ở máy tính với máy chủ theo thời gian thực, hoặc dựa 
trên một lịch mà bạn đặt ra từ trước. Hầu hết các dịch vụ này đều cung 
cấp cho bạn dung lượng lưu trữ miễn phí là 5 GB, và bạn có thể mua thêm 
dung lượng nếu cần. Google cũng cung cấp dịch vụ Google Docs, dịch vụ 
thay thế cho Microsoft Office, cho phép lưu tất cả văn bản lên đám mây 
(các máy chủ) của Google.
 
 Google Drive là dịch vụ sao lưu rất tốt cho người dùng Gmail
Ưu điểm của lưu trữ trực tuyến: Phương
 pháp này rất tiện lợi và giúp bạn tránh mất dữ liệu kể cả khi có tai 
nạn gì đó. Bạn cũng không cần mua thêm dụng cụ gì. Thông thường bạn có 
thể lấy lại dữ liệu từ bất cứ đâu, bất cứ máy tính nào, miễn là có kết 
nối Internet. Phương pháp này phù hợp với lượng dữ liệu không lớn (dưỡi 5
 GB) và khi có Internet tốc độc ao.
  
Nhược điểm của lưu trữ trực tuyến:
 Phương pháp này phụ thuộc rất lớn vào kết nối Internet, đặc biệt là tốc
 độ tải lên. Ví dụ bạn có một kết nối với tốc độ tải lên là 12 Mbps, như
 vậy sẽ cần khoảng 1 giờ để tải lên 5 GB dữ liệu. Hầu hết các dịch vụ 
Internet phổ thông hiện nay tại Việt Nam có tốc độ tải lên từ 0,5 Mbps 
tới 1 Mbps. Tương tự, quá trình tải dữ liệu về cũng phụ thuộc vào tốc độ
 và độ ổn định của mạng, và có thể sẽ mất rất nhiều thời gian. Lưu trữ 
trực tuyến cũng đồng nghĩa bạn phải phụ thuộc vào một bên thứ ba về sự 
an toàn và riêng tư của dữ liệu cá nhân, và những dịch vụ trả phí đôi 
khi cũng khá tốn kém.
  Do vậy, nếu như bạn có rất nhiều ảnh, bài 
hát, và đặc biệt là phim và muốn lưu trữ an toàn, bạn nên tìm kiếm một 
phương pháp sao lưu khác.
  
Sao lưu cục bộ hay sao lưu trực tiếp
 
 Với phương pháp sao lưu này dữ liệu được sao lưu lên các ổ lưu trữ gắn 
ngoài, như ổ cứng gắn ngoài hay ổ nhớ USB. Phương pháp này cho phép sử 
dụng thiết bị lưu trữ với dung lượng lớn hơn và rẻ hơn. Như đã đề cập ở 
phần hai của loạt bài viết, có hai loại thiết bị lưu trữ gắn ngoài chính: ổ loại nhỏ và ổ loại lớn.
 
 Một vài thiết bị sao lưu trực tiếp
Ổ loại nhỏ
 thường có kích thước nhỏ và được cấp điện qua cáp nối với máy tính, 
thông thường là cáp USB hoặc Thunderbolt. Những thiết bị này lưu trữ dựa
 trên ổ gắn trong với kích thước 2,5 inch. Chúng có giá thấp nhưng 
thường là loại được thiết lập một ổ, và dung lượng dưới 2 TB. Dù vậy, 
với dung lượng của chúng thì đây cũng là những lựa chọn sao lưu rất tốt 
và đặc biệt là thuận tiện cho những người muốn đem dữ liệu theo. Nhiều 
loại ổ gắn ngoài loại nhỏ được trang bị phần mềm sao lưu có thể tự chạy 
mỗi khi bạn cắm ổ vào máy tính, giúp thuận tiện hơn cho việc sao lưu. Cá
 nhân tôi cho rằng việc sử dụng một hoặc hai ổ loại nhỏ là cách tốt nhất
 để sao lưu dữ liệu. Nếu như bạn chưa bao giờ sao lưu dữ liệu của mình, 
hãy làm ngay khi có thể.
  
Ổ loại lớn thông 
thường lưu trữ vào các ổ gắn trong kích thước 3,5 inch. Chúng có thể có 
thiết lập gồm một ổ hoặc nhiều ổ, và loại nhiều ổ có thể sử dụng ổ gắn 
trong 2,5 inch để nhỏ gọn hơn. Tất cả các loại ổ loại lớn đều cần một bộ
 cấp điện thoại, tuy nhiên có khả năng cung cấp dung lượng nhiều hơn ổ 
loại nhỏ, lên tới 4 TB với thiết lập một ổ. Các ổ loại lớn đôi khi có cả
 tính năng redundancy, đem lại giải pháp lý tưởng cho những người muốn 
có cả tính năng sao lưu và redundancy hoặc cần phải giao lưu một lượng 
rất lớn dữ liệu. Một vài loại thiết bị còn có khả năng chống chọi lại 
tai nạn như cháy hoặc ngập nước, ví dụ như thiết bị Solo Fireproof 
Waterproof External Hard Drive của hãng IoSafe.
  
Ưu điểm của việc sao lưu cục bộ là
 tốc độ cao, đặc biệt là khi sử dụng các thiết bị kết nối qua cổng 
Thunderbolt, và có thể xử lý lượng lớn dữ liệu. Tùy thuộc vào phần mềm 
sao lưu, nó có thể lưu cả các phiên bản khác nhau của tập tin, và trong 
nhiều trường hợp việc lưu dữ liệu trên một thiết bị độc lập, bên cạnh 
bản chính của nó, giúp cho bạn có thể trở về phiên bản trước đó ngay khi
 có vấn đề với tập tin đang làm việc.
  
Nhược điểm của phương pháp này
 là bạn chỉ có thể sao lưu một máy tính hoặc thiết bị trong một thời 
điểm, và bạn phải kết nối ổ lưu trữ vào máy tính trước khi thực hiện 
việc sao lưu. Mặc dù việc này nghe rất đơn giản nhưng cũng có nhiều 
người lại quên mất. Sao lưu cục bộ cũng làm cho không gian làm việc của 
bạn bừa bộn hơn với nhiều thiết bị.
  Nếu như bạn có nhiều máy 
tính ở nhà và muốn quản lý các bản sao lưu chỉ tại một máy, bạn có thể 
nghĩ đến phương pháp sao lưu qua mạng.
  
Sao lưu qua mạng
 
 Giống như tên gọi của nó, phương pháp này cho phép bạn sử dụng một máy 
tính làm nơi sao lưu cho tất cả các máy tính và thiết bị khác. Cách tốt 
nhất để thực hiện điều này là sử dụng máy chủ NAS. Sao lưu là một trong 
số rất nhiều tính năng của các máy chủ NAS, và cũng có nhiều loại sao 
lưu bạn có thể thực hiện.
  Tuy vậy, một số máy chủ NAS, ví dụ như
 Time Capsule của Apple, được thiết kế chỉ dành cho mục đích sao lưu. 
Những máy chủ NAS này lưu trữ các bản sao của dữ liệu ở nhiều máy tính 
trong mạng. Đối với Time Capsule, bạn có thể sử dụng ứng dụng Time 
Machine để lưu trữ dữ liệu của nhiều máy Mac trên Time Capsule.
  
Những máy chủ NAS cao cấp còn cung cấp phương pháp sao lưu đám mây, để 
bạn có thể sao lưu nhiều máy tính ở xa thông qua Internet. Về cơ bản thì
 phương thức hoạt động của nó giống như những dịch vụ lưu trữ trực tuyến
 đã được nhắc tới ở trên, chỉ khác là bạn có toàn quyền điều khiển máy 
chủ của riêng bạn.
 
 Với khả năng hỗ trợ hai ổ cứng và các kết nối USB, máy chủ NAS Synology DS213air có cả tính năng sao lưu lẫn redundancy
Sao lưu qua mạng có nhiều ưu điểm,
 do nó khá giống với hình thức sao lưu trực tuyến, trừ việc bạn luôn cần
 kết nối Internet. Nó cũng giống với hình thức sao lưu cục bộ, ngoại trừ
 việc phải cắm thiết bị vào mỗi lần muốn thực hiện sao lưu. Một khi 
thiết bị đã được cấu hình, nó sẽ tự chạy và bạn không cần phải làm gì 
nữa. Thêm nữa, nhiều máy tính có thể cùng sao lưu một lúc, và có thể nói
 là không có một giới hạn nào cho mức dung lượng lưu trữ. Một máy chủ 
NAS có thể để gọn ở một góc, không gây bừa bộn.
  
Hình thức này cũng có các nhược điểm
 như thường tốn kém và phức tạp hơn so với hai hình thức sao lưu trên. 
Đối với hầu hết người dùng tại gia thì phương pháp này cũng hơi thừa 
thãi. Thêm nữa, so với việc sao lưu trực tiếp, đặc biệt là với thiết bị 
dùng kết nối Thunderbolt, việc sao lưu qua mạng thường chậm hơn, do nó 
bị giới hạn bởi tốc độ của mạng cục bộ, hiện nay tối đa là 1 Gbps.
  
Phương pháp tốt nhất
 
 Phương pháp tốt nhất để đảm bảo an toàn cho dữ liệu là sử dụng cả 
redundancy và sao lưu nếu có thể. Tất cả các thiết bị có thể thiết lập 
dùng nhiều ổ sẽ cung cấp cho bạn tính năng redundancy. Tuy nhiên nếu như
 phải chọn giữa một trong hai, thì nên nhớ là việc sao lưu thường quan 
trọng hơn, nhất là đối với người dùng tại gia.
  Khi xét tới sao 
lưu, hãy sử dụng bất kỳ phương pháp nào mà bạn có thể. Ví dụ, nếu như 
bạn sử dụng một chiếc smartphone, hãy đảm bảo là bạn thường xuyên đồng 
bộ hóa dữ liệu với máy tính hoặc với một máy chủ trực tuyến, hoặc tạo 
thói quen email những tài liệu quan trọng của bạn tới chính địa chỉ của 
bạn hay một người bạn thân.
  Nên nhớ rằng dù bạn có rất nhiều dữ 
liệu, thì lượng dữ liệu đặc biệt quan trọng và không thể thay thế thường
 không nhiều. Các nội dung số trả tiền như nhạc hay phim hoàn toàn có 
thể tải lại hoặc thậm chí mua lại, nên bạn không cần phải sao lưu chúng 
nếu như không có đủ dung lượng lưu trữ. Tuy nhiên, nếu như bạn đang thực
 hiện một dự án quan trọng, hoặc lưu trữ những thông tin tài chính, thì 
bạn nên sao lưu hàng ngày hoặc thậm chí sau mỗi lần sửa đổi.
  Và quan trọng nhất là đừng bao giờ chỉ lưu một bản của dữ liệu quan trọng, trên đúng một thiết bị lưu trữ.
 
 Tuấn Anh