среда, 10 ноября 2010 г.

ISSP \ Домен 07. Непрерывность бизнеса и восстановление после аварий. Часть 6

В этой части рассмотрены следующие вопросы:
  • Страхование
  • Восстановление и реконструкция
  • Разработка целей плана
  • Внедрение стратегий


В процессе проведения BIA команда наверняка выявит ряд угроз, реализацию которых компания не сможет предотвратить. Принятие в полном объеме рисков, вызванных этими угрозами, часто является слишком опасным. Именно для таких случаев и существует страхование (insurance). Решение о страховании определенных угроз и сумме страхового покрытия на случай реализации этих угроз должно быть основано на вероятности реализации угрозы и потенциальных потерях, которые понесет компания в случае их реализации. Эти данные (вероятность и потери) были определены в процессе проведения BIA. Команде ВСР следует взаимодействовать с руководством компании, чтобы понять текущий уровень страхового покрытия, используемые компанией варианты страховки, лимиты на каждый вариант. Целью этой работы является обеспечение уверенности в том, что страховка заполнит имеющиеся недостатки превентивных контрмер, не позволяющие обеспечить надлежащую защиту от выявленной угрозы. Мы можем есть здоровую пищу, заниматься спортом, есть витамины – но все это не спасет нас от смерти. На этот случай мы страхуем свою жизнь, чтобы после смерти о наших родных позаботилась страховая компания.

Люди платят страховым компаниям различные суммы страховых премий, страхуя свое здоровье и жизнь, в зависимости от типа страховки, которую они покупают. Аналогично, различные типы страховки могут быть приобретены и компаниями, одним из таких типов является страхование в компьютерной сфере (cyberinsurance). Страхование в компьютерной сфере – это новый тип страховых продуктов, которые страхуют потери компании, вызванные, например, DoS-атаками, вирусами, атаками хакеров, кражами электронных данных и т.п. Когда человек страхует свою жизнь, его спрашивают, сколько ему лет, каково его здоровье, курит ли он и т.д., на основании его ответов определяется размер страховой премии. В аналогичной ситуации у компании спрашивают о ее программе безопасности, в частности, есть ли у нее система IDS, антивирусное программное обеспечение, межсетевые экраны и другие средства и меры обеспечения безопасности.

Компания также может принять решение о страховании прерывания своего бизнеса. При этом, если компания будет вынуждена пректарить свою работу на некоторое время, страховая компания возместит ее расходы и упущенную прибыль. Другой возможностью является страхование доступности для компании ее счетов. Если компания по тем или иным причинам не сможет воспользоваться средствами на своих счетах, она получит от страховой компании компенсацию части или всех своих потерь и убытков.

Стаховые контракты компании следует пересматривать на ежегодной основе, поскольку может изменяться уровень угроз, компания может решиться выпустить на рынок еще один рискованный продукт – все это должно быть надлежащим образом учтено. Покупка страховки не должна рассматриваться компанией как решение всех своих проблем и создавать ложное чувство безопасности. Сумма страхового покрытия ограничена, а если компания не проявляет должную заботу, страховая компания может получить законные основания, чтобы вообще не платить в случае возникновения аварии. Перед заключением страхового контракта, компания должна внимательно ознакомиться с ним, при этом важно прочитать и правильно понять в том числе и то, что написано мелким шрифтом, чтобы знать, в каких случаях не стоит ждать помощи от страховой компании.


Координатор ВСР должен организовать несколько различных команд, провести их обучение и тренировки, обеспечить их доступность в случае аварии. Необходимые компании типы таких команд зависят от самой компании. Ниже приведено несколько примеров команд, которые может потребоваться организовать в компании:
  • Команда оценки повреждений
  • Юридическая команда
  • Команда взаимодействия со средствами массовой информации
  • Команда восстановления сети
  • Команда перемещения оборудования и персонала на новое место
  • Команда восстановления
  • Команда спасения имущества
  • Команда безопасности
  • Телекоммуникационная команда
Координатор ВСР должен понимать потребности компании и типы команд, которые должны быть организованы и обучены. Набор сотрудников в эти команды должен основываться на их знаниях и навыках. В каждой команде должен быть назначен руководитель, который будет управлять деятельностью членов команды. Руководители этих команд должны отвечать не только за достижение целей своей команды, но также и за взаимодействие с другими командами, что необходимо для обеспечения эффективной и слаженной работы команд особенно на взаимосвязанных этапах, когда работа одной команды зависит от результатов работы другой, либо когда работы нескольких различных команд должны выполняться паралелльно.

Команда восстановления (restoration team) отвечает за приведение в рабочее состояние альтернативной площадки и ее окружения, команда спасения имущества (salvage team) отвечает за запуск работ по восстановлению основной площадки. Обе команды должны уметь выполнять множество задач, таких как установка операционных систем, настройка рабочих станций и серверов, прокладка электрической проводки и сетевых кабелей, организация сети, настройка сетевых сервисов, установка оборудования и приложений. Обе команды должны также знать, как безопасно восстанавливать данные из резервных копий, обеспечивая сохранение конфиденциальности, целостности и доступности систем и данных.

План ВСР должен описывать необходимые команды, их обязанности, процедуры информирования. План должен определять способы связи с руководителями команд в рабочее и нерабочее время.

Должна быть создана роль (или команда) для выполнения оценки повреждений (damage assessment) в случае аварии. Процедуры оценки должны быть задокументированы и включать следующие шаги:
  • Определение причин аварии
  • Оценка вероятности того, что произойдут дополнительные повреждения
  • Определение бизнес-функций и областей, на которые оказано негативное воздействие
  • Определение текущего уровня функционирования критичных ресурсов
  • Определение ресурсов, которые должны быть заменены немедленно
  • Оценка времени, которое потребуется для восстановления работы критичных функций (если время, которое потребуется для восстановления функционирования, превышает предварительно рассчитанные значения MTD (максимально допустимого времени простоя), должна быть объявлена аварийная (чрезвычайная) ситуация и план ВСР должен быть приведен в действие).
После сбора и анализа этой информации станет понятно, какие команды должны приступить к выполнению возложенных на них обязанностей, и действительно ли требуется приведение в действие плана ВСР. Координатор ВСР и команда BCP должны разработать критерии активации плана BCP. Если после оценки повреждений, выполняется один или более критериев, план BCP приводится в действие и команды приступают к восстановлению.

У каждой компании будут свои критерии, поскольку бизнес-драйверы и критичные функции сильно отличаются в различных компаниях. Такие критерии могут учитывать некоторые (или все) из перечисленных ниже элементов:
  • Опасность для человеческой жизни
  • Опасность для безопасности города или государства
  • Опасность для здания
  • Опасность для критичных систем
  • Приблизительное ожидаемое время простоя
После завершения оценки повреждений и активации плана, различные команды должны приступить к своей работе, что будет говорить о том, что компания перешла к этапу восстановления. У каждой команды есть собственные цели и задачи. Например, команда восстановления готовит внешнюю площадку (при необходимости), команда восстановления сети организует на ней сеть и устанавливает системы, команда перемещения начинает готовить штат к переезду в новое здание.

Процесс восстановления должен быть максимально организованным, что позволит восстановить работу компании в максимально короткие сроки. Проще сказать это, чем реализовать на практике. Именно поэтому так важно документировать все процедуры. В процессе BIA выявляются критичные функции и необходимые для их работы ресурсы. Сущетсвуют вещи, над которыми команды должны работать совместно, чтобы максимально быстро восстановить их и запустить в работу в первую очередь. При разработке плана следует создать схемы процессов выполнения работ. Эти схемы будут использоваться различными командами для прохождения определенных этапов и документирования результатов. Например, если один из этапов не может быть завершен, пока не закуплена новая система, это должно быть указано в соответствующей схеме. Если этап завершен только частично, это должно быть зафиксировано, чтобы команда не забыла вернуться к нему и закончить, когда это будет возможно. Эти схемы напоминают командам об их задачах, а также позволяют руководителям команд быстро оценить прогресс, возникшие затруднения и потенциальное время, которое потребуется для восстановления.
ПРИМЕЧАНИЕ. Примеры шаблонов можно найти в документе NIST Contingency Planning Guide for Information Technology Systems по адресу http://csrc.nist.gov/publications/nistpubs/800-34-rev1/sp800-34-rev1.pdf.

Когда у компании появится возможность вернуться обратно на основную площадку или полностью перейти на новую площадку, настанет время перехода компании на этап реконструкции (reconstruction phase). Компания не выйдет из аварийного состояния, пока ее функционирование не будет возвращено на основную площадку (или на новую площадку, построенную взамен основной), поскольку при работе на альтернативной площадке компания остается уязвимой. Должно быть решено множество логистических вопросов, прежде чем компания сможет вернуться с альтернативной площадки на основную. Ниже приведен список некоторых из таких вопросов:
  • Обеспечить безопасность персонала
  • Обеспечить приемлемую внутреннюю среду (электроснабжение, инфраструктура здания, водоснабжение, отопление, вентиляция, кондиционирование)
  • Обеспечить наличие расходных материалов, снабжения, а также наличие оборудования и его работоспособность
  • Обеспечить наличие и работоспособность коммуникационного оборудования и связи
  • Протестировать надлежащим образом новое окружение
После того, как координатор, руководство и команда спасения имущества подпишутся за готовность основного (нового) здания, команда спасения имущества должна выполнить следующие шаги:
  • Сделать резервную копию данных на альтернативной площадке и восстановить их на основной (новой) площадке
  • Аккуратно прекратить выполнение работ в аварийном режиме
  • Безопасно доставить оборудование и персонал в основное (новое) здание
Выполнение наименее критичных операций следует возвратить назад в первую очередь, поскольку в случае возникновения каких-либо проблем, например, с настройками сети или связью, важные для компании операции не будут подвержены их негативному влиянию. Зачем выполнять сложный процесс перемещения важных систем и операций со стабильно работающей площадки на основную площадку, только для того, чтобы увидеть, что она не была протестирована и находится в непригодном для использования состоянии? Предоставьте это наименее критичным подразделениям. Если они смогут работать на основной площадке, перемещайте на нее все остальные подразделения и системы.


К настоящему моменту команда ВСР выполнила следующие шаги:

1. Разработана политика планирования непрерывности бизнеса
  • Определены границы и цели ВСР, а также роли команды ВСР
2. Выполнен BIA
  • Идентифицированы критичные бизнес-функции, необходимые им ресурсы и значения MTD
  • Идентифицированы угрозы и рассчитано воздействие от этих угроз
  • Определены решения
  • Результаты представлены руководству
3. Определены и внедрены превентивные защитные меры
  • Внедрены защитные меры для снижения выявленных рисков компании
  • Заключен договор страхования, произведены структурные укрепления здания, внедрены решения по организации резервного копирования, установлены избыточные и отказоустойчивые механизмы и т.д.
4. Разработаны стратегии восстановления
  • Реализованы процессы восстановления работы компании в течение необходимого времени
  • Организованы необходимые команды, определены цели и разработаны процедуры для каждой команды, определены шаги процесса оповещения и критерии приведения в действие плана, выбрано решение по организации резервирования на альтернативной площадке и т.д.
Итак, команда ВСР долго и хорошо работала и на данный момент имеет все указанное выше. Теперь нужно отразить все эти решения и шаги в самом плане, протестировать план, провести обучение и тренировку людей, определить порядок хранения и использования плана, разработать стратегию поддержания плана в актуальном состоянии.

Ссылки по теме:

Автоматизированные средства разработки плана BCP. Сбор, анализ и поддержка данных DRP и ВСР требует большого объема работы, поэтому применение для этой работы средств автоматизации может быть очень полезным. Автоматизация разработки плана может помочь вам создать:
  • Настраиваемые опросные листы, основанные на шаблонах экспертных систем
  • Расписания выполнения процедур восстановления после аварий
  • Смоделировать сценарии «что-если»
  • Отчет по анализу финансового и операционного воздействия
  • Графическое представление результатов анализа
  • Примеры опросных листов, форм и шаблонов
  • Поддержка плана, основанная на разрешениях
  • Централизованный контроль версий и интеграция
  • Соответствие требованиям законодательства и регуляторов


Если у вас нет определенных целей, как вы узнаете, что ваша работа выполнена и что ваши усилия были успешными? Цели определяются, чтобы все знали, какие требуются конечные результаты. Определение целей важно для любой задачи, но для разработки планов непрерывности бизнеса и восстановления после аварий это особенно важно. Определение целей помогает правильно распределить ресурсы и задачи, разработать необходимые стратегии, помочь с экономическим обоснованием планов и программы в целом. По сути, установленные цели являются руководством по разработке самих планов. Цели устанавливаются для возможности контроля их реализации и получения нужных результатов.

Прекрасно, мы поняли, что цели очень важны. Но цель может быть сформулирована, например, так: «Обеспечить, чтобы компания осталась на рынке, если случится землетрясение». Хорошая цель, но не очень полезная, поскольку в ней очень мало ясности и конкретики. Чтобы была действительно полезной, она должна содержать определенную ключевую информацию, такую как:
  • Обязанности. Каждый человек, участвующий в восстановлении и обеспечении непрерывности, должен иметь свои обязанности, изложенные в письменном виде для четкого их понимания в критической ситуации и состоянии хаоса. Каждая задача должна быть назначена определнному, обоснованно выбранному, человеку. Эти люди должны знать, чего от них ожидают, зачем нужно проводить учения, отработку, готовить документацию. К примеру, человек должен знать, что он обязан сначала выключить сервер, а уже потом может с криками бежать из здания.
  • Полномочия. Во время кризиса, очень важно знать, кто является главным. Командная работа имеет ключевое значение в таких ситуациях, а практически любая команда работает гораздо эффективнее, когда у нее есть назначенный руководитель, которому доверяют члены команды. Такие руководители должны знать, что они обазаны определить истинное положение вещей в момент кризиса, выбрать и сообщить подчиненным сотрудникам направление, в котором они должны работать. Четкое определение полномочий будет способствовать сокращению хаоса и расширению плодотворного сотрудничества.
  • Приоритеты. Чрезвычайно важно знать, что является действительно важным, а чем просто желательно обладать. Различные подразделения выполняют различные функции в компании. Критичные подразделения должны быть отделены от подразделений, обеспечивающих функциональность, без которой компания может спокойно прожить одну – две недели. Необходимо знать, какое подразделение должно вернуться в работу первым, какое вторым и т.д. Это обеспечит наиболее эффективное, полезное, целенаправленное и последовательное выполнение работ. Наряду с приоритетами подразделений, должны быть установлены приоритеты для систем, информации и программ. Например, может быть необходимо подготовить и запустить серверы баз данных до начала работ по восстановлению файлового сервера. Основные приоритеты должны быть установлены руководством при участии различных подразделений и персонала ИТ.
  • Внедрение и тестирование. Конечно, прекрасно записать глубокие идеи и разработать планы, но если они не проверены и невыполнимы на практике, они могут не иметь никакой ценности. После разработки плана непрерывности, он должен быть официально введен в действие. Он должен быть задокументирован, его хранение должно быть организовано в местах, легко доступных в кризисной ситуации. Люди, на которых возложены конкретные задачи, должны быть обучены выполнению этих задач, должны быть проведены учения, чтобы люди могли на практике отработать свои задачи в различных ситуациях. Подобные учения должны проводиться не реже одного раза в год, а программа в целом должна постоянно обновляться и совершенствоваться.
Исследования показали, что 65% компаний, которые теряют свои вычислительные возможности более, чем на одну неделю, уже не могут восстановить свою работу и выходят из бизнеса. Если компания не сможет быстро восстановить свою работу, она может потерять свой бизнес и свою репутацию. В мире конкуренции у клиентов есть много вариантов. Если одна компания не может вернуться к работе после аварии или стихийного бедствия, клиенты могут перейти к другой компании и остаться с ней.


После определения стратегий, они должны быть задокументированы и внедрены командой ВСР. Это переводит работу с этапа планирования на этап фактической реализации и действий.

Как было сказано ранее, копии плана должны храниться в одном или нескольких местах, отличных от основной площадки, поскольку в случае, если основная площадка будет уничтожена или подвержена негативному воздействию, план все равно должен быть доступен команде. Важно, чтобы команде был доступен план как в электронной, так и в бумажной форме. Помимо планов восстановления аналогичным образом должны храниться документы с информацией о критичных процедурах и дереве вызовов. Контактная информация, которая будет необходима в чрезвычайной ситуации (часть дерева вызовов), может быть напечатана, например, на обратной стороне бейджей руководителей и сотрудников, которые участвуют в процедурах оповещения, или выданы им в виде карточек, которые можно хранить в бумажнике. В критической ситуации ценность каждой минуты очень высока и лучше потратить время на работу в рамках реакции на инцидент, чем на поиск документа или ожидание, пока загрузится ноутбук.

План должен в деталях учитывать все вопросы, которые мы рассмотрели к настоящему времени. Формат реального плана зависит от окружения, целей плана, приоритетов и выявленных угроз. После того, как каждый из этих аспектов проанализирован и документирован, разделы плана могут быть разделены на необходимые категории.

Общепринятая структура плана ВСР показана на Рисунке 7-2. План ВСР каждой компании может выглядеть по-разному, но эти ключевые разделы должны быть рассмотрены в плане любой компании. План предназначен для предварительной подготовки последовательной структуры реализации задач, предусмотренных в каждой категории. План должен обеспечивать определенную гибкость, поскольку никто не знает, какая конкретно авария или чрезвычайная ситуация произойдет и какое она окажет воздействие на компанию. Процедуры для всех этапов плана должны быть документированы, но при этом должен быть достигнут баланс между детализацией и гибкостью, чтобы не оказалось, что компания готова только к одному единственному типу аварии.

Рисунок 7-2. Основные компоненты структуры плана обеспечения непрерывности бизнеса

Некоторые компании разрабатывают отдельные планы для отдельных целей и задач. Такие планы приведены в Таблице 7-2. Руководство совместно с командой ВСР должны определить количество и типы планов, которые следует разработать и внедрить.

Таблица 7-2. Различные типы планов восстановления

Команда ВСР может решить интрегрировать многие из этих компонентов в план ВСР. Чаще всего, наилучшим вариантом является оформление этих отдельных планов в виде приложений к основному плану, чтобы каждый документ был ясен, краток и действительно полезен.

Комментариев нет: