Một số giải pháp sao lưu: Sao lưu cục bộ và sao lưu tập trung

Trong mô hình của giải pháp sao lưu dữ liệu đối với một hệ thống, thiết bị lưu trữ là một thành phần không thể thiếu để thực hiện sao lưu dữ liệu. Thiết bị này bao gồm các đầu đọc/ghi dữ liệu vào thiết bị lưu trữ như băng từ, ổ đĩa di động, USB, CD/DVD … Đồng thời nó cũng là nơi tập trung chụi trách nhiệm quản lý và xử lý các thao tác liên quan đển những thiết bị lưu trữ dữ liệu này. Việc tổ chức một hệ thống thực hiện sao lưu cho một hệ thống máy chủ hoặc một máy tính cục bộ được thực hiện theo 2 mô hình tương ứng là : Mô hình sao lưu cục bộ và mô hình sao lưu tập trung:

1. Mô hình Sao lưu cục bộ

Trường hợp khi thiết bị lưu trữ là một thành phần vật lý nội bộ của máy chủ, hoặc thiết bị lưu trữ là thiết bị riêng, nhưng kết nối trực tiếp vào máy chủ và chỉ phục vụ cho việc sao lưu dữ liệu trên máy chủ đó. Đây là mô hình sao lưu cục bộvà được áp dụng phổ biến trong môi trường IT có quy mô nhỏ. Mô hình này chỉ đơn giản là gắn các thiết bị lưu trữ dữ liệu sao lưu như đĩa cứng di động, ổ CD/DVD … vào máy tính cục bộ và sử dụng chương trình sao lưu thích hợp để sao lưu dữ liệu và lưu trữ bản backup vào thiết bị lưu trữ đó. Thiết bị lưu trữ sau đó sẽ được cất giữ ở một nơi an toàn tùy vào người thực hiện sao lưu.
Click image for larger version

Name:	hinh6.1.gif
Views:	38
Size:	2.4 KB
ID:	211

2. Mô hình Sao lưu tập trung

Trường hợp khi thiết bị lưu trữ nối vào một máy chủ, nhưng sẽ cung cấp chức năng sao lưu cho nhiều máy chủ khác nhau trong hệ thống.
Click image for larger version

Name:	hinh6.2.png
Views:	41
Size:	10.9 KB
ID:	212
Máy chủ có thiết bị băng từ kết nối trực tiếp đến thường được gọi là máy chủ backup, trên đó cài đặt phần mềm quản trị và điều khiển toàn bộ quá trình sao lưu dữ liệu của các máy chủ khác trong hệ thống. Đây là mô hình sao lưu tập trung, lưu trữ dữ liệu của nhiều máy chủ về một địa điểm. Một số hình thức của sao lưu tập trung gồm có

  • Sao lưu qua mạng LAN: Tận dụng hạ tầng mạng có sẵn để chuyển luồng dữ liệu cần sao lưu đến máy chủ Backup để từ đó chuyển đến thiết bị lưu trữ.
  • Sao lưu qua mạng lưu trữ chuyên biệt SAN( Storage Area Network): SAN là một mạng lưu trữ chuyên biệt, có tốc độ cao nhờ vào việc sử dụng giao thức quang. Trong mạng SAN thiết bị lưu trữ không nhất thiết phải kết nối với máy chủ Backup, nhưng nó là một thành phần của SAN. Điều này có thể thực hiện được khi thiết bị băng từ kết nối trực tiếp vào thiết bị chuyển mạch của mạng SAN. Sao lưu qua mạng SAN vẫn có sự xuất hiện của máy chủ Backup, sử dụng phần mềm chuyên dụng để quản lý quá trình sao lưu

Với mô hình sao lưu tập trung có nhiều hình thức để chuyển dữ liệu sao lưu từ máy chủ Backup ra thiết bị lưu trữ.
Ví dụ: Một phương thức phổ biến trong công nghệ sao lưu phục hồi là sử dụng băng từ. Việc thực hiện này có thể được thực hiện bằng cách sao lưu luồng dữ liệu trực tiếp từ đĩa cứng trên máy chủ Backup sang băng từ hay còn được gọi là phương thức sao lưu Disk – to – Tape. Hoặc một mô hình cải tiến hiện nay là phương thức sao lưu Disk – to – Disk – To – Tape.

3. Các biện pháp sao lưu tập trung

a. Sao lưu qua mạng LAN

Sao lưu qua mạng LAN là cơ chế luồng dữ liệu sao lưu sẽ được chuyển tải qua mạng LAN, dùng chung cơ sở hạ tầng với các luồng dữ liệu khác trong mạng. Trong mô hình này máy chủ backup có cài đặt phần mềm quản lý quá trình sao lưu. Luồng dữ liệu sao lưu di từ các máy client qua mạng LAN đến máy chủ Backup về thiết bị lưu trữ.
image

  • Nhược điểm: Nhược điểm của phương pháp backup qua mạng LAN là sự chia sẻ băng thông giữa lưu lượng backup và lưu lượng dữ liệu thông thường. Điều này có thể dẫn đến tắc nghẽn đường truyền (hiện tượng nghẽn cổ chai) khi dung lượng dữ liệu sao lưu quá lớn, ảnh hưởng đến chất lượng của các ứng dụng thông thường trong mạng. Ví dụ khi dữ liệu của ứng dụng Web bị nghẽn tại đường truyền đang tải dư liệu sao lưu, thời gian truy cập vào trang Web sẽ trở nên lâu hơn bình thường. Sự bất bình thường, giảm sút về chất lượng dịch vụ này sẽ ảnh hưởng trực tiếp đến cảm nhận của chính người sử dụng. Ngược lại, khi lượng dữ liệu thông thường quá lớn thì cũng có hiệu ứng xấu đến luồng dữ liệu sao lưu. Thời gian cần thiết để sao lưu trọn vẹn lượng dữ liệu cần thiết sẽ kéo dài hơn mức bình thường, ảnh hưởng đến quá trình bảo toàn dữ liệu.
  • Ưu điểm: Tận dụng hạ tầng mạng IP sẵn có, không cần thiết tăng thêm chi phí đầu tư và vận hành hạ tầng IT. Chi phí đầu tư ở đây bao gồm chi phí liên quan đến hạ tầng phần cứng và chi phí bản quyền cho phần mềm quản lý sao lưu tập trung. Khi sử dụng cùng một phần mềm quản lý sao lưu tập trung, đầu tư bản quyền cần thiết cho sao lưu qua mạng LAN là thấp nhất so với đầu tư bản quyền để triển khai các biện pháp sao lưu khác.

Với mô hình sao lưu qua mạng LAN có nhiều cách để xây dựng một mô hình sao lưu tập trung. Tùy thuộc vào thiết bị lưu trữ backup sử dụng mà ta xây dựng một mô hình riêng cho nó.
Ví dụ: một mô hình sử dụng loại thiết bị phổ biến, và gần như được coi là giải pháp backup truyền thống là sử dụng thiết bị lưu trữ Tape. Với việc lưu trữ qua băng từ với mô hình tập trung có thể thực hiện theo 2 phương pháp sau
Sao lưu Disk – to – Tape
Phương thức này rất đơn giản, hệ thống lưu trữ băng từ được kết nối trực tiếp với máy chủ Backup, và luồng dữ liệu được sao lưu trực tiếp từ đĩa cứng sang băng từ. Với tốc độ truyền tải cao của mạng SAN hiện nay, có thể nói cách làm này không bị hạn chế gì về tốc độ truyền dữ liệu. Tuy nhiên nếu chúng ta quan tâm đến quá trình phục hồi, tức là quá trình chuyển dữ liệu ngược lại từ băng từ về các ổ đĩa cứng khi có nhu cầu, thì phương thức sao lưu disk-to-tape là hoàn toàn không khả thi.
imageVấn đề cơ bản ở đây là tốc độ truy cập dữ liệu được lưu trữ trên thiết bị đĩa cứng so với dữ liệu được lưu trữ trên băng từ là khác nhau hoàn toàn. Đĩa cứng sử dung cơ chế truy cập ngẫu nhiên (random access) với thời gian truy cập dữ liệu không phụ thuộc vào vị trí vật lý của nó trên đĩa. Trong khi đó băng từ sử dụng cơ chế truy cập tuần tự (sequential access) thì thời gian truy cập dữ liệu phụ thuộc trực tiếp vào vị trí của nó trên băng từ. Băng từ phải được quay đến đúng vị trí dữ liệu đang được lưu trữ thì mới có thể truy cập vào dữ liệu. Như vậy rõ ràng là thời gian để phục hồi dữ liệu từ băng từ ra đĩa cứng sẽ lâu hơn nhiều so với từ đĩa cứng. Đây cũng là nhược điểm lớn nhất của phương pháp sao lưu phục hồi truyền thống sử dụng băng từ.
Sao lưu Disk – to – Disk
Phương thức sao lưu disk-to-disk được phát triển để khắc phục thời gian truy nhập dữ liệu trong quá trình phục hồi. Sao lưu theo phương thức disk-to-disk (gọi ngắn gọn là d2d, hay còn được nhắc đến với thuật ngữ kỹ thuật disk-to-disk-to-tape hoặc tape-cache backup) về mặt vật lý là khi dữ liệu trước hết được sao lưu từ đĩa cứng sang đĩa cứng, thay vì sang băng từ như trong phương thức thông thường. Dữ liệu từ đĩa cứng sao lưu, sau khi được lưu trữ một thời gian dài cần thiết, mới được chuyển tiếp (sao chép, hoặc tạo bản clone) sang băng từ vật lý tại thời điểm được kích hoạt tùy theo nhu cầu của người quản trị. Như vậy quá trình phục hồi dữ liệu phần lớn sẽ là chuyển dữ liệu ngược lại từ đĩa cứng sang đĩa cứng, giảm thiểu được thời gian truy cập vào dữ liệu cần được phục hồi, và theo đó là giảm thời gian phục hồi dữ liệu.
image
Ưu điểm của phương thức sao lưu d2d
Tăng hiệu năng và tốc độ sao lưu: hiệu năng và tốc độ sao lưu phục hồi tăng đáng kể với các yếu tố như:

  • Khả năng mở rộng linh hoạt: Trong phương pháp sao lưu dùng băng từ thông thường, việc tăng hiệu năng và tốc độ cho quá trình sao lưu chỉ có thể thực hiện được bằng cách tăng số đầu đọc của thiết bị băng từ hoặc thay đầu đọc cũ bằng đầu đọc mới có tốc độ cao hơn. Vấn đề này được giải quyết bằng việc sử dụng các thiết bị băng từ ảo (VTL)trong giải pháp sao lưu d2d, cho phép tạo ra một cách linh hoạt nhiều đầu đọc ảo.
  • Thông lượng truyền tải và thời gian phục hồi dữ liệu nhanh: Các ổ đĩa SATA dùng trong giải pháp d2d có tốc độ nhanh. Nguyên lý truy cập ngẫu nhiên dữ liệu của ổ đĩa cứng, thay vì cách truy cập tuần tự của băng từ cho phép dữ liệu được ghi vào (trong quá trình sao lưu) và đọc ra (trong quá trình phục hồi) với tốc độ của đĩa cứng, mà không cần tốn thời gian lắp đặt băng từ và quay băng từ đến đúng vị trí lưu trữ dữ liệu cần được phục hồi như trong giải pháp truyền thống disk-to-tape. Điều này dẫn đến tốc độ phục hồi dữ liệu khi sử dụng giải pháp d2d nhanh hơn hẳn so với dùng băng từ thông thường.

Tăng độ sẵn sàng cho giải pháp: lỗi phổ biến thường gặp trong quá trình sao lưu dự phòng là các sự cố liên quan đến đầu từ (tape drive) và chính các băng từ. Các lỗi này sẽ không còn xuất hiện trong giải pháp d2d, đơn giản là vì thiết bị băng từ vật lý không còn được dùng cho bước sao lưu đầu tiên (giải pháp d2d gồm 2 bước: trước hết sao lưu dữ liệu từ đĩa cứng sang đĩa cứng và sau đó sao lưu từ đĩa cứng sang băng từ. Nhưng bước thứ hai xảy ra theo định kỳ và không thường xuyên, do đó các lỗi về thiết bị băng từ sẽ ít gặp hơn). Ngoài ra vì có áp dụng các phương pháp RAID cho các ổ đĩa SATA, nơi chứa dữ liệu sau bước sao lưu thứ nhất của giải pháp d2d, nên giải pháp này có tính bảo vệ cao cho dữ liệu.
Chi phí hợp lý, tạo mức thu hồi vốn đầu tư ROI (Return of Investment) xứng đáng: Công nghệ lưu trữ đã và đang đi qua những bước phát triển nhanh chóng. Nhiều công nghệ đĩa cứng mới được thử nghiệm và đưa vào sản xuất hàng loạt trên thị trường. Trong đó các ổ đĩa cứng SATA (dùng trong các thiết bị tủ đĩa để chứa dữ liệu sau bước sao lưu thứ nhất của giải pháp d2d) với dung lượng ngày càng lớn đã không còn quá đắt. Điều này cho phép sử dụng các ổ đĩa cứng làm môi trường chứa các dữ liệu được sao lưu với chi phí đầu tư hợp lý. Bên cạnh đó, với việc mang lại hiệu năng hoạt động cao hơn hẳn so với băng từ vật lý cho quá trình phục hồi dữ liệu, đầu tư xây dựng hệ thống sao lưu d2d là lựa chọn hoàn toàn xứng đáng.

b. Sao lưu qua mạng lưu trữ SAN

Đối vơi mô hình hệ thống mạng lớn, Hệ thống lưu trữ được xây dựng tách biệt với cơ sở hạ tầng. Hệ thống lưu trữ chuyên biệt này được biết đến là công nghệ SAN cung cấp nhiều tính năng về hiệu quả quản lý thiết bị lưu trữ, tính sẵn sàng của hệ thống…. Việc sao lưu qua mạng SAN tức là luồng dữ liệu sao lưu được chuyển tải qua mạng SAN, tách biệt hoàn toàn với luồng dữ liệu thông thường trên cơ sở hạ tầng mạng.
image
Như trong hình minh họa trên, luồng dữ liệu điều khiển việc sao lưu từ máy chủ Backup vẫn được truyền qua mạng LAN đến thiết bị lưu trữ backup. Còn luồng dữ liệu sao lưu (màu đỏ) thì được chuyển qua mạng lưu trữ riêng biệt SAN sử dụng công nghệ truyền dẫn quang. Do lưu lượng điều khiển sao lưu là không đáng kể do đó không ảnh hưởng đến lưu lượng trên mạng LAN. Còn với việc chuyển dữ liệu sao lưu qua mạng SAN sử dụng công nghệ truyền dẫn quang cho phép tốc độ truyền tải nhanh từ 300Mbit/s đến 4Gbps giảm thời gian truy cập dữ liệu trong các quá trình sử dụng, sao lưu, phục hồi. Như vậy ưu điểm nổi bật của phương pháp này là giúp quá trình sao lưu lượng dữ liệu rất lớn diễn ra nhanh chóng.

c. Sao lưu qua mạng SAN, nhưng giảm thiểu vai trò của máy chủ backup

Trong mô hình sao lưu qua mạng SAN trình bày ở trên, trong đó vai trò của máy chủ Backup là rất lớn. Luồng dữ liệu điều khiển sao lưu phải đi qua máy chủ Backup và luồng dữ liệu sao lưu phải đi qua máy chủ được sao lưu (client). Như vậy với phương pháp này các máy chủ cần phải xử lý luồng dữ liệu đi qua nó, định tuyến cho luồng dữ liệu đó đi đến thiết bị lưu trữ. Để thực hiện backup với dữ liệu lớn các máy chủ phải có đủ tài nguyên (CPU, Memory, Cache…) để xử lý luồng dữ liệu sao lưu. Lượng dữ liệu sao lưu càng nhiều thì yêu cầu tài nguyên máy chủ Backup càng lớn. Như vậy ảnh hưởng đến các hoạt động khác của máy chủ trong khi tiến trình backup được thực hiện.
Để hạn chế được khối lượng công việc mà máy chủ phải thực hiện trong quá trình sao lưu. Một phương thức sao lưu mới qua mạng SAN, đồng thời giảm vai trò của máy chủ Backup được đưa ra như được mô tả trong hình sau.
imageVới phương pháp này, luồng dữ liệu sao lưu không còn đi qua các máy chủ nữa. Thay vào đó nó được truyền trực tiếp từ thiết bị lưu trữ SAN đến thiết bị lưu trữ backup thông qua một thiết bị trung gian chuyên dụng trong mạng SAN gọi là Data Mover. Thiết bị này có thể là một thiết bị vật lý riêng biệt (ví dụ Storage Router của hãng Crossroads hay SAN Data Gateway 2108-G07 của hãng IBM), hoặc nó có thể được tích hợp sẵn trong các thiết bị chuyển mạch quang (ví dụ dòng SAN switch MDS 9000 của hãng Cisco).
Phương thức này giúp giảm tải đáng kể cho các máy chủ. Như vậy tài nguyên của các máy chủ đó có thể được sử dụng để phục vụ cho các ứng dụng khác. Nhưng bên cạnh đó, việc bắt buộc phải có thiết bị trung gian Data Mover cũng tương đương với việc tăng chi phí đầu tư ban đầu. Do đó cần tùy vào từng trường hợp thiết kế hệ thống sao lưu cụ thể để đánh giá lợi ích tựu chung có được do áp dụng phương thức sao lưu này, và từ đó quyết định có nên đầu tư đưa vào sử dụng hay không.

Sưu tầm internet

Posted on 02/03/2011, in Giải pháp quản lý kinh doanh, Tổng quan công nghệ and tagged , . Bookmark the permalink. Để lại bình luận.

Gửi phản hồi

Mời bạn điền thông tin vào ô dưới đây hoặc kích vào một biểu tượng để đăng nhập:

WordPress.com Logo

Bạn đang bình luận bằng tài khoản WordPress.com Log Out / Thay đổi )

Twitter picture

Bạn đang bình luận bằng tài khoản Twitter Log Out / Thay đổi )

Facebook photo

Bạn đang bình luận bằng tài khoản Facebook Log Out / Thay đổi )

Google+ photo

Bạn đang bình luận bằng tài khoản Google+ Log Out / Thay đổi )

Connecting to %s

%d bloggers like this: