Резервный ЦОД необходим для того, чтобы обеспечить непрерывность и эффективность бизнес-процессов в случае превышения допустимых значений времени восстановления вышедшего из строя основного вычислительного центра. Решение об организации резервного ЦОД базируется на анализе рисков серьезных потерь, вызванных как кратковременным, так и длительным простоем информационной системы предприятия (так, например, согласно данным крупной исследовательской и консалтинговой компании Gartner, убытки, вызванные часовым простоем информационной системы среднестатистической брокерской компании, составляют порядка 6,5 млн. долларов).
Предпосылки создания и основные требования к организации резервного ЦОД
Непрерывная доступность данных и информационных служб, а значит и эффективность работы предприятия, зависят от надежности взаимодействия каждого из элементов информационной системы. Тем не менее, на уровень доступности могут оказывать влияние случайные либо злонамеренные разрушительные действия пользователей, а также внешние факторы – пожары, техногенные катастрофы и т. п. Вот почему даже наличие дублированных на случай отказа ЦОД компонентов, сосредоточенных в том же месте, что и сам ЦОД, не могут выступать гарантией надежности. Наиболее практичным решением в таких случаях является резервный ЦОД. Кроме того, резервный вычислительный центр может применяться для подготовки и тестирования программно-аппаратных средств.
Разумеется, резервный вычислительный центр не обязан являться точной копией основного, однако должен дублировать те его функции, в отсутствие которых деятельность предприятия невозможна. Как правило, для этого необходимо обеспечить:
- создание актуальных резервных копий данных: их наличие позволит в случае сбоя основного ЦОД продолжить работу информационной системы на ресурсах резервного ЦОД
- возможность перевода информационных служб на ресурсы резервного ЦОД
- передачу резервных данных в режиме реального времени
Современный подход к созданию резервных вычислительных центров подразумевает создание сети хранения данных, предоставляющей требуемый уровень производительности каналов связи, а также репликацию и резервирование с минимальным влиянием на общую доступность к информационным службам. Такая сеть реализуется в виде удаленной фабрики-хранилища актуальных копий корпоративной электронной информации. А синхронная репликация осуществляется по высокоскоростному каналу, позволяющему информации без труда преодолевать значительные расстояния.
Как правило, выделяют два режима восстановления данных – «горячий» режим и режим постепенного восстановления. В первом случае вычислительные механизмы резервного ЦОД находятся в постоянной боевой готовности, а второй предполагает взаимное резервирование данных между основным и резервным вычислительным центрами. Выбор того или иного режима определяется допустимым сроком восстановления работоспособности основного ЦОД.
Наряду с техническими аспектами строительства резервных ЦОДов необходимо уделять пристальное внимание организационной части вопроса. Ведь своевременное обнаружение нештатной ситуации и наличие четкого плана аварийных действий поможет значительно минимизировать убытки, а то и вовсе исключить их. Планирование восстановительных работ включает выявление критически важных функций основного ЦОД, разработку стратегии и установку приоритетов восстановительных работ, а также тестирование выбранной стратегии. «Ходовые испытания» должны регулярно документироваться. А для того, чтобы избежать повторных сбоев, сразу же после устранения их последствий необходимо приступить к разработке комплекса соответствующих мер.
Компания «Флайлинк» специализируется на создании вычислительных центров любого масштаба и направленности, в том числе и резервных ЦОД. С нами Ваша информационная инфраструктура будет надежной и эффективной.