Một trong các chức
năng của thiết bị lưu trữ, có thể nói là chức năng quan trọng nhất, là
bảo đảm các dữ liệu lưu trữ được an toàn, nhất là trong trường hợp có
hỏng hóc về phần cứng. Hai phương pháp để bảo vệ an toàn dữ liệu gồm sao lưu và dư thừa dữ liệu (redundancy). Hai phương pháp này thực sự khác nhau, nên hiểu rõ về sự khác biệt này.
Bài liên quan:
Cơ bản về lưu trữ số (phần 1): Bộ nhớ RAM và ổ đĩa lưu trữ
Cơ bản về lưu trữ số (phần 2): ổ đĩa gắn ngoài và máy chủ NAS
Bài viết này là phần cuối trong series bài tư vấn cơ bản về lưu trữ số của trang công nghệ uy tín
Cnet. Bạn có thể tìm đọc hai bài đầu tiên trong series bài tư vấn này ở hai link phía trên.
Dư thừa dữ liệu
Về cơ bản, dư thừa dữ liệu (sau đây tôi sẽ dùng thuật ngữ gốc tiếng Anh
là redundancy) là sử dụng nhiều ổ gắn trong để lưu thông tin, hay nói
cách khác, lưu cùng một thông tin ở nhiều nơi. Có nhiều cách để thực
hiện phương pháp này, nhưng cách phổ biến nhất là sử dụng RAID (đã được
nói tới ở
phần 2 của loạt bài viết này). Bạn cần lưu ý rằng redundancy
không phải
là một giải pháp sao lưu dữ liệu, mà là một phương thức khôi phục dữ
liệu khi có ổ gắn trong bị hỏng hóc. Hai cấu hình RAID thường được sử
dụng nhất có tính năng redundancy là RAID 1 và RAID 5.
Redundancy
là phương pháp lưu cùng một thông tin ở nhiều ổ, để khi có sự cố thì có
thể nhanh chóng lấy lại thông tin để tiếp tục hoạt động
RAID 1 yêu cầu ít nhất hai ổ cứng, và số lượng ổ cứng cần thiết để sử
dụng trong RAID 1 nhiều gấp đôi so với số lượng thông thường. Hai ổ gắn
trong này "phản chiếu" dữ liệu của nhau, tức là chứa những dữ liệu y như
nhau. Do đó, chỉ có một nửa dung lượng có thể dùng để lưu dữ liệu, nửa
dung lượng còn lại được sử dụng cho redundancy. RAID 5 yêu cầu ít nhất 3
ổ gắn trong, và dung lượng lưu trữ có thể sử dụng tương đương với tổng
số ổ trừ đi 1. Ở phương thức này, nếu như một ổ bị hỏng thì các ổ khác
sẽ giúp khôi phục lại dữ liệu để tránh bị mất.
Lưu ý: Mặc dù
RAID thường sử dụng trong các thiết bị lưu trữ hỗ trợ nhiều ổ gắn trong,
đối với thiết bị lưu trữ sử dụng cổng Thunderbolt, như Lacie Liggle Big
Disk Thunderbolt, bạn có thể nối nhiều ổ đơn lại với nhau và tạo cấu
hình RAID. Thiết bị lưu trữ cần có hai cổng Thunderbolt, và khi cấu hình
RAID được tạo thì chúng chỉ có thể được sử dụng trên một máy tính. Tuy
nhiên hầu như việc đầu tư cho một hệ thống lưu trữ nhiều ổ cứng hỗ trợ
RAID vẫn tiết kiệm hơn.
Bạn có thể hình dung redundancy như hai
cái túi nhựa bọc vào nhau, để mang đồ từ siêu thị về nhà. Nếu như có một
túi bị hỏng trên đường về, thì các thức ăn bên trong sẽ không bị rơi ra
ngoài.
Dù vậy phương pháp redundancy cũng bao gồm cả ưu và nhược điểm.
Ưu điểm:
Ưu điểm rõ rệt nhất và lớn nhất của redundancy chính là khả năng bảo vệ
an toàn dữ liệu thời gian thực trong trường hợp ổ hỏng hóc. Điều này có
nghĩa là nếu như bạn đang làm việc trên một tập tin và một trong các ổ
của cấu hình RAID hỏng, thiết bị lưu trữ vẫn có thể hoạt động tiếp (một
số cấu hình RAID còn có thể hoạt động khi hỏng tới hai ổ). Thiết bị lưu
trữ sẽ thông báo rằng một trong các ổ gắn trong đã hỏng, cho phép bạn
sao lưu lại các thông tin quan trọng và thay ổ hỏng bằng ồ mới. Sau đó,
trong một quá trình gọi là xây dựng lại RAID, ổ thay thế sẽ được ghi lại
bằng những thông tin của ổ cũ để trở thành một phần của hệ thống RAID;
và trong suốt quá trình đó thiết bị lưu trữ vẫn có thể hoạt động bình
thường.
Nói ngắn gọn, redundancy là một cách bảo vệ dữ liệu tức
thời. Và do các ổ gắn trong có thể hỏng bất cứ lúc nào, redundancy rất
quan trọng đối với các thiết bị lưu trữ những thông tin quan trọng hay
cung cấp các dịch vụ không thể bị gián đoạn.
Nhược điểm:
Nhược điểm đầu tiên của redundancy là chi phí; bạn cần phải mua nhiều ổ
gắn trong, và điều này có thể rất tốn kém. Ví dụ một hệ thống RAID 1 sẽ
yêu cầu bạn chi tiền gấp đôi so với số lượng lưu trữ được.
Nhược điểm thứ hai là redundancy không thể bảo vệ dữ liệu khi có các tai
họa như cháy nhà hay ngập lụt, hoặc khi chính thiết bị lưu trữ bị hỏng.
Redundancy cũng không cho phép lưu nhiều phiên bản của cùng một dữ
liệu. Chức năng này được bàn tới trong phần sau về sao lưu.
Và
cuối cùng, thời gian xây dựng lại RAID có thể rất dài, đến vài ngày tùy
thuộc vào lượng dữ liệu lưu trên thiết bị lưu trữ. Trong quá trình đó,
RAID rất có thể gặp vấn đề, và nếu như ổ thứ hai cũng hỏng trước khi quá
trình này hoàn thành, cả hệ thống RAID sẽ trục trặc và bạn sẽ mất hết
dữ liệu. Trong thực tế, trong thời gian xây dựng lại RAID, một hệ thống
lưu trữ RAID còn tiềm ẩn nguy hiểm hơn cả một thiết bị lưu trữ một ổ, do
việc xây dựng lại RAID làm các ổ cứng đều phải hoạt động, đặc biệt khi
hệ thống RAID vẫn tiếp tục hoạt động để cung cấp dữ liệu cho người dùng.
Không cần biết bạn thiết lập RAID như thế nào, hãy nhớ là nó giống như
mua bảo hiểm vậy, là một thứ mà bạn cần để đề phòng trường hợp xấu xảy
ra, và thực sự thì không muốn trường hợp đó xảy ra. Chức năng thay nóng
một ổ chỉ nên dùng khi thực sự cần thiết, chứ không nên coi nó như một
tính năng "thú vị". Bạn càng sử dụng tính năng này thường xuyên thì càng
có nguy cơ mất sạch dữ liệu lưu trên cả thiết bị. Do đó, khi bạn có một
thiết bị lưu trữ có khả năng RAID, nên lựa chọn dung lượng ổ cứng lớn
từ đầu để tránh phải thay ổ giữa chừng để nâng dung lượng.
Cuối cùng, tôi muốn nhắc lại lần nữa: redundancy
không phải là sao lưu dữ liệu. Và bạn không nên lưu tất cả dữ liệu của mình trên một thiết bị lưu trữ, kể cả thiết bị hỗ trợ redundancy.
Sao lưu
Người dùng bình thường có thể không cần redundancy, nhưng chắc chắn cần
sao lưu, có nghĩa là giữ nhiều phiên bản sao chép của dữ liệu ở nhiều
địa điểm để nếu có việc gì xảy ra thì có thể sử dụng một phiên bản này
thay thế cho một phiên bản khác. Càng có nhiều bản sao lưu thì dữ liệu
càng an toàn.
Lại lấy ví dụ về việc mua đồ. Sao lưu giống như sử
dụng hai (hoặc nhiều hơn) túi đựng số lượng trứng như nhau. Nếu như các
quả trứng trong một túi bị vỡ, bạn vẫn có còn trứng trong các túi khác
để làm bữa sáng.
Việc sao lưu rất đơn giản, và thực tế là vẫn
diễn ra nhiều hơn những gì bạn nghĩ. Ví dụ, gửi email kèm một văn bản
Word tới người khác (hoặc tới chính bạn) cũng là một hình thức sao lưu,
vì giờ đây có ít nhất hai phiên bản của tập tin đó, một trong máy tính
của bạn và một trong máy người nhận. Nếu như bạn sử dụng dịch vụ email
nền Web, như Gmail, thì một bản lưu cũng được trữ trên máy chủ của
Google. Đối với các bức ảnh hay những dữ liệu nhẹ (xét về dung lượng)
khác cũng tương tự.
Rõ ràng sử dụng email không thể là phương
pháp sao lưu chính của bạn: nó rất mất thời gian. Bạn nên sử dụng một
phương pháp hiệu quả hơn. Dưới đây là những phương pháp sao lưu thông
dụng nhất, phù hợp với nhiều yêu cầu.
Sao lưu trực tuyến (hay còn gọi là sao lưu đám mây)
Một dịch vụ sao lưu trực tuyến cho phép bạn lưu trữ dữ liệu bằng cách
tải lên mạng thông qua Internet tới một hoặc nhiều máy tính. Thông
thường thì bạn không cần biết máy tính lưu trữ dữ liệu ở đâu. Thực tế,
dữ liệu của bạn thường được lưu trữ trên nhiều máy chủ ở nhiều trung tâm
dữ liệu khác nhau trên thế giới.
Có nhiều dịch vụ sao lưu trực
tuyến, như Dropbox, Google Drive hay SkyDrive, và tất cả đều tự động
đồng bộ nội dung ở máy tính với máy chủ theo thời gian thực, hoặc dựa
trên một lịch mà bạn đặt ra từ trước. Hầu hết các dịch vụ này đều cung
cấp cho bạn dung lượng lưu trữ miễn phí là 5 GB, và bạn có thể mua thêm
dung lượng nếu cần. Google cũng cung cấp dịch vụ Google Docs, dịch vụ
thay thế cho Microsoft Office, cho phép lưu tất cả văn bản lên đám mây
(các máy chủ) của Google.
Google Drive là dịch vụ sao lưu rất tốt cho người dùng Gmail
Ưu điểm của lưu trữ trực tuyến: Phương
pháp này rất tiện lợi và giúp bạn tránh mất dữ liệu kể cả khi có tai
nạn gì đó. Bạn cũng không cần mua thêm dụng cụ gì. Thông thường bạn có
thể lấy lại dữ liệu từ bất cứ đâu, bất cứ máy tính nào, miễn là có kết
nối Internet. Phương pháp này phù hợp với lượng dữ liệu không lớn (dưỡi 5
GB) và khi có Internet tốc độc ao.
Nhược điểm của lưu trữ trực tuyến:
Phương pháp này phụ thuộc rất lớn vào kết nối Internet, đặc biệt là tốc
độ tải lên. Ví dụ bạn có một kết nối với tốc độ tải lên là 12 Mbps, như
vậy sẽ cần khoảng 1 giờ để tải lên 5 GB dữ liệu. Hầu hết các dịch vụ
Internet phổ thông hiện nay tại Việt Nam có tốc độ tải lên từ 0,5 Mbps
tới 1 Mbps. Tương tự, quá trình tải dữ liệu về cũng phụ thuộc vào tốc độ
và độ ổn định của mạng, và có thể sẽ mất rất nhiều thời gian. Lưu trữ
trực tuyến cũng đồng nghĩa bạn phải phụ thuộc vào một bên thứ ba về sự
an toàn và riêng tư của dữ liệu cá nhân, và những dịch vụ trả phí đôi
khi cũng khá tốn kém.
Do vậy, nếu như bạn có rất nhiều ảnh, bài
hát, và đặc biệt là phim và muốn lưu trữ an toàn, bạn nên tìm kiếm một
phương pháp sao lưu khác.
Sao lưu cục bộ hay sao lưu trực tiếp
Với phương pháp sao lưu này dữ liệu được sao lưu lên các ổ lưu trữ gắn
ngoài, như ổ cứng gắn ngoài hay ổ nhớ USB. Phương pháp này cho phép sử
dụng thiết bị lưu trữ với dung lượng lớn hơn và rẻ hơn. Như đã đề cập ở
phần hai của loạt bài viết, có hai loại thiết bị lưu trữ gắn ngoài chính: ổ loại nhỏ và ổ loại lớn.
Một vài thiết bị sao lưu trực tiếp
Ổ loại nhỏ
thường có kích thước nhỏ và được cấp điện qua cáp nối với máy tính,
thông thường là cáp USB hoặc Thunderbolt. Những thiết bị này lưu trữ dựa
trên ổ gắn trong với kích thước 2,5 inch. Chúng có giá thấp nhưng
thường là loại được thiết lập một ổ, và dung lượng dưới 2 TB. Dù vậy,
với dung lượng của chúng thì đây cũng là những lựa chọn sao lưu rất tốt
và đặc biệt là thuận tiện cho những người muốn đem dữ liệu theo. Nhiều
loại ổ gắn ngoài loại nhỏ được trang bị phần mềm sao lưu có thể tự chạy
mỗi khi bạn cắm ổ vào máy tính, giúp thuận tiện hơn cho việc sao lưu. Cá
nhân tôi cho rằng việc sử dụng một hoặc hai ổ loại nhỏ là cách tốt nhất
để sao lưu dữ liệu. Nếu như bạn chưa bao giờ sao lưu dữ liệu của mình,
hãy làm ngay khi có thể.
Ổ loại lớn thông
thường lưu trữ vào các ổ gắn trong kích thước 3,5 inch. Chúng có thể có
thiết lập gồm một ổ hoặc nhiều ổ, và loại nhiều ổ có thể sử dụng ổ gắn
trong 2,5 inch để nhỏ gọn hơn. Tất cả các loại ổ loại lớn đều cần một bộ
cấp điện thoại, tuy nhiên có khả năng cung cấp dung lượng nhiều hơn ổ
loại nhỏ, lên tới 4 TB với thiết lập một ổ. Các ổ loại lớn đôi khi có cả
tính năng redundancy, đem lại giải pháp lý tưởng cho những người muốn
có cả tính năng sao lưu và redundancy hoặc cần phải giao lưu một lượng
rất lớn dữ liệu. Một vài loại thiết bị còn có khả năng chống chọi lại
tai nạn như cháy hoặc ngập nước, ví dụ như thiết bị Solo Fireproof
Waterproof External Hard Drive của hãng IoSafe.
Ưu điểm của việc sao lưu cục bộ là
tốc độ cao, đặc biệt là khi sử dụng các thiết bị kết nối qua cổng
Thunderbolt, và có thể xử lý lượng lớn dữ liệu. Tùy thuộc vào phần mềm
sao lưu, nó có thể lưu cả các phiên bản khác nhau của tập tin, và trong
nhiều trường hợp việc lưu dữ liệu trên một thiết bị độc lập, bên cạnh
bản chính của nó, giúp cho bạn có thể trở về phiên bản trước đó ngay khi
có vấn đề với tập tin đang làm việc.
Nhược điểm của phương pháp này
là bạn chỉ có thể sao lưu một máy tính hoặc thiết bị trong một thời
điểm, và bạn phải kết nối ổ lưu trữ vào máy tính trước khi thực hiện
việc sao lưu. Mặc dù việc này nghe rất đơn giản nhưng cũng có nhiều
người lại quên mất. Sao lưu cục bộ cũng làm cho không gian làm việc của
bạn bừa bộn hơn với nhiều thiết bị.
Nếu như bạn có nhiều máy
tính ở nhà và muốn quản lý các bản sao lưu chỉ tại một máy, bạn có thể
nghĩ đến phương pháp sao lưu qua mạng.
Sao lưu qua mạng
Giống như tên gọi của nó, phương pháp này cho phép bạn sử dụng một máy
tính làm nơi sao lưu cho tất cả các máy tính và thiết bị khác. Cách tốt
nhất để thực hiện điều này là sử dụng máy chủ NAS. Sao lưu là một trong
số rất nhiều tính năng của các máy chủ NAS, và cũng có nhiều loại sao
lưu bạn có thể thực hiện.
Tuy vậy, một số máy chủ NAS, ví dụ như
Time Capsule của Apple, được thiết kế chỉ dành cho mục đích sao lưu.
Những máy chủ NAS này lưu trữ các bản sao của dữ liệu ở nhiều máy tính
trong mạng. Đối với Time Capsule, bạn có thể sử dụng ứng dụng Time
Machine để lưu trữ dữ liệu của nhiều máy Mac trên Time Capsule.
Những máy chủ NAS cao cấp còn cung cấp phương pháp sao lưu đám mây, để
bạn có thể sao lưu nhiều máy tính ở xa thông qua Internet. Về cơ bản thì
phương thức hoạt động của nó giống như những dịch vụ lưu trữ trực tuyến
đã được nhắc tới ở trên, chỉ khác là bạn có toàn quyền điều khiển máy
chủ của riêng bạn.
Với khả năng hỗ trợ hai ổ cứng và các kết nối USB, máy chủ NAS Synology DS213air có cả tính năng sao lưu lẫn redundancy
Sao lưu qua mạng có nhiều ưu điểm,
do nó khá giống với hình thức sao lưu trực tuyến, trừ việc bạn luôn cần
kết nối Internet. Nó cũng giống với hình thức sao lưu cục bộ, ngoại trừ
việc phải cắm thiết bị vào mỗi lần muốn thực hiện sao lưu. Một khi
thiết bị đã được cấu hình, nó sẽ tự chạy và bạn không cần phải làm gì
nữa. Thêm nữa, nhiều máy tính có thể cùng sao lưu một lúc, và có thể nói
là không có một giới hạn nào cho mức dung lượng lưu trữ. Một máy chủ
NAS có thể để gọn ở một góc, không gây bừa bộn.
Hình thức này cũng có các nhược điểm
như thường tốn kém và phức tạp hơn so với hai hình thức sao lưu trên.
Đối với hầu hết người dùng tại gia thì phương pháp này cũng hơi thừa
thãi. Thêm nữa, so với việc sao lưu trực tiếp, đặc biệt là với thiết bị
dùng kết nối Thunderbolt, việc sao lưu qua mạng thường chậm hơn, do nó
bị giới hạn bởi tốc độ của mạng cục bộ, hiện nay tối đa là 1 Gbps.
Phương pháp tốt nhất
Phương pháp tốt nhất để đảm bảo an toàn cho dữ liệu là sử dụng cả
redundancy và sao lưu nếu có thể. Tất cả các thiết bị có thể thiết lập
dùng nhiều ổ sẽ cung cấp cho bạn tính năng redundancy. Tuy nhiên nếu như
phải chọn giữa một trong hai, thì nên nhớ là việc sao lưu thường quan
trọng hơn, nhất là đối với người dùng tại gia.
Khi xét tới sao
lưu, hãy sử dụng bất kỳ phương pháp nào mà bạn có thể. Ví dụ, nếu như
bạn sử dụng một chiếc smartphone, hãy đảm bảo là bạn thường xuyên đồng
bộ hóa dữ liệu với máy tính hoặc với một máy chủ trực tuyến, hoặc tạo
thói quen email những tài liệu quan trọng của bạn tới chính địa chỉ của
bạn hay một người bạn thân.
Nên nhớ rằng dù bạn có rất nhiều dữ
liệu, thì lượng dữ liệu đặc biệt quan trọng và không thể thay thế thường
không nhiều. Các nội dung số trả tiền như nhạc hay phim hoàn toàn có
thể tải lại hoặc thậm chí mua lại, nên bạn không cần phải sao lưu chúng
nếu như không có đủ dung lượng lưu trữ. Tuy nhiên, nếu như bạn đang thực
hiện một dự án quan trọng, hoặc lưu trữ những thông tin tài chính, thì
bạn nên sao lưu hàng ngày hoặc thậm chí sau mỗi lần sửa đổi.
Và quan trọng nhất là đừng bao giờ chỉ lưu một bản của dữ liệu quan trọng, trên đúng một thiết bị lưu trữ.
Tuấn Anh