Поиск по этому блогу

24 сент. 2013 г.

На чем хранить бэкапы: Лента VS Дисковые СХД

В чистом виде слил отсюда для собственных нужд.


Многие компании используют ленточные архивы для долговременных бэкапов и резервного копирования самой важной информации. Понять их несложно: достаточно дешевый, простой и надёжный метод хранения данных, успешно используюшийся много лет — срок годности картриджа составляет 2-3 десятка лет, информации на него влезает много, потоковый бэкап пишется быстрей, чем на классические дисковые системы, иными словами: зачем что-то менять, если это тебя устраивает?

Хранить бэкапы и бэкапы бэкапов на дисковых системах — дорого и неэффективно, а восстанавливать что-либо из бэкапа нужно не так часто, так что общая неторопливость системы мало кого беспокоит.

К счастью, мир не стоит на месте, технологии развиваются, и сегодня VTL (virtual tape library) уже догнали в стоимости владения ленточные архивы, многократно превосходя их по ряду других параметров. Давайте разберёмся, чем собирается крыть лента, и не пора ли переходить на дисковые библиотеки?

Лента VS Диски


Ленточный архив, безусловно, надёжный и простой способ защитить информацию, но он не лишён недостатков, прямо вытекающих из его ленточной природы, в основном эти трудности связаны с восстановлением маленьких файлов:

  • Значительное время поиска данных;
  • Одно приложение может на 100% загрузить один привод, создавая проблемы для бэкапа другим приложениям
  • Невозможность одновременного чтения и записи, если все приводы заняты чем-либо (требуется подождать полного завершения операции);
  • Сложность контроля качества и корректности записи.


Дисковый массив лишён всех этих недостатков:

  • Поиск данных на винчестере в сотни раз быстрее, чем на ленте, которую требуется найти в архиве, принести, вставить в привод, перемотать, начать считывание;
  • VTL может эмулировать десятки и сотни приводов за раз: параллельное копирование и восстановление данных для множества приложений без увеличения стоимости владения системой;
  • Высокая надёжность хранения данных: серверные жесткие диски работают в жесточайших условиях годами, нагрузка VTL-системы для них не является сильно изнашивающей. Кроме того, все данные копируются внутри самой VTL и защищены при помощи RAID-массива, что увеличивает как надёжность хранения данных, так и сложность несанкционированного доступа к ней: даже если удастся украсть несколько жёстких дисков, никакой реальной целостной информации на них не будет.
Преимущества HP StoreOnce D2D Backup System

Если бы меня попросиили коротко описать все преимущества дисковых бэкапов, то я не задумываясь бы ответил: скорость, надёжность, масштабируемость и гибкость.

Со скоростью и так всё понятно: чтение и запись отдельных файлов с ленты куда медленней, чем с обычных жестких дисков. Дисковые же системы давно эволюционируют, используются не только в серверах, но и в обычных десктопах, и уже накоплен богатый опыт по ускорению повседневных операций. Надёжность мы также рассмотрели в предыдущем абзаце: RAID-6, физическая неподвижность жёстких дисков, отсутствие необходимости в переносе или хранении их в том виде, в котором хранятся картриджи для ленточных систем (картридж можно и физически украсть при транспортировке, например). А вот к масштабируемости и гибкости, я уверен, есть вопросы, и сейчас я постараюсь на них ответить.


Масштабируемость

Вопрос масштабируемости системы предлагаю рассмотреть на примере HP StoreOnce B6200:

Базовая система содержит два контроллера и две дисковые полки суммарноё ёмкостью в 48ТБ. Каждый контроллер может управлять четырьмя полками, под завязку набитыми ЖД объёмом до 2ТБ каждый. Таких контроллеров можно подключить до восьми штук (3 пары в добавок к двум имеющимся). Таким образом, B6200 будет обеспечивать до 768ТБ сырой ёмкости (из-за RAID-системы полезная ёмкость меньше на треть, но и 512ТБ всё ещё внушительный показатель), при этом с ростом объёма хранилища растёт и его производительность. 

В данном случае вы сами вольны выбирать, по какой схеме расширять функционал системы: сначала наращивать объем до предела, а затем увеличивать производительность, или равномерно закупать контроллеры с дисковыми полками для увеличения производительности, и, при необходиомсти, увеличить объём хранилища, установив дополнительные дисковые полки.


Гибкость

За широчайшие возможности по резервному копированию отвечает специализированное ПО — HP Catalyst. HP Catalyst – это программный агент, который устанавливается на медиа-сервер (сервер резервного копирования), на котором работает ПО резервного копирования HP DataProtector или Symantec NetBackup и Backup Exec.  HP Catalyst производит дедупликацию данных прямо на медиа-серверах, задействуя функционал этого ПО и уже дедуплицированные данные отправляет на систему HP StoreOnce. Это позволяет добиться высоких скоростей резервного копирования, так как несколько медиасерверов способены обработать гораздо больший поток, чем одно выделенное целевое устройство. Например, топовая система HP B6200 может записывать данные сдедупликацией со скоростью до 40 ТБ/час, а с использованием HP Catalyst – уже до 100ТБ/час. 

Главным отличием HP Catalyst от большинства аналогов является работа не только по LAN, но и по WAN. Таким образом, в малых региональных офисах можно не ставить выделенную библиотеку HP StoreOnce, а только установить на медиасервер HP Catalyst + ПО резервного копирования. Далее бэкап в дедуплицированном виде пойдет на библиотеку HP StoreOnce в центральном офисе или крупном территориальном отделении. Это позволяет мультифилиальным организациям организовать централизованное управление бэкапом и его консолидацию с минимальными затратами.

Если использовать только аппаратные средства, то для территориально распределенных организаций консолидация бэкапа выглядит следующим образом. В филиалах ставятся библиотеки начального уровня –  HP 2620, а в центре – старшая модель, например  HP 4430 или B6200. Филиальный  backup записывается на  HP StoreOnce Backup System и уже дедуплицированные данные (в 20 раз меньше исходных) передаются в центр, где записываются на большую библиотеку. Дедупликация реплицируемых данных существенно сокращает стоимость каналов связи. Одна  HP B6200 позволяет собирать данные с 384  филиалов и вся эта сеть управляется одним администратором, что позволяет отказаться от администраторов резервного копирования в филиалах. Такая схема весьма популярна в мире, а самая крупная подобная инсталляция в России насчитывает уже порядка 100 устройств HP StoreOnce и продолжает расти. 

У нас уже есть ленточный бэкап, куда его девать?

Мы не призываем полностью отказаться от проверенной временем технологии: вы можете установить HP Store Once как промежуточное звено между пользовательскими системами и долгосрочным архивом, что позволит уменьшить время ожидания ежедневного бэкапа, проводить частичный бэкап изменённых частей больших файлов, не перезаписывая ленточный массив полностью, ускорить работу по резервному копированию и восстановлению данных, а на ленту писать всё то, что может пригодиться в долгосрочной перспективе и не требует частого доступа.





2 коммент.:

s0n1q комментирует...

Прочитал у тебя в блоге эту заметку, и решил, что пора написать что-то подобное в своем. Поэтому будет более развернутая статья :)

Yefimov Dmitry комментирует...

На самом деле меня крайне эта тема интересует. Мне вообще не понятно нафиг теперь использовать ленты. Особенно когда уже дедупликация есть. И мне не понятно назначение VTL.

Отправить комментарий

Общее·количество·просмотров·страницы

Ефимов Дмитрий. Технологии Blogger.