Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Учитывая растущую зависимость организаций от информационных технологий для выполнения своих операций, планирование непрерывности бизнеса охватывает всю организацию, а аварийное восстановление сосредоточено на ИТ .

Аудит документов, охватывающих планы обеспечения непрерывности бизнеса и аварийного восстановления организации, обеспечивает стороннюю проверку заинтересованным сторонам, что документация является полной и не содержит существенных искажений.

Недостаточная полнота может привести к игнорированию вторичных эффектов, например, когда значительно увеличившаяся работа на дому приводит к перегрузке входящей телекоммуникационной способности участка восстановления, а двухнедельная заработная плата, которая не была критичной в течение первых 48 часов, теперь вызывает предполагаемые проблемы с когда-либо восстановлением. , осложненного реакцией правительства и, возможно, профсоюзов. [1]

Обзор [ править ]

Термины «Непрерывность бизнеса» и «Восстановление после сбоя», которые часто используются вместе, сильно различаются. Непрерывность бизнеса относится к способности бизнеса продолжать выполнение критически важных функций и бизнес-процессов после возникновения аварии, тогда как аварийное восстановление относится конкретно к информационным технологиям (ИТ) и функциям бизнеса, ориентированным на данные, и является подмножеством бизнеса. Непрерывность. [2]

Показатели [ править ]

Основная цель - защитить организацию в случае, если все или часть ее операций и / или компьютерных услуг будут частично или полностью непригодны для использования.

План аварийного восстановления, иллюстрирующий хронологию RPO и RTO по отношению к MI .

Минимизация времени простоя и потери данных во время аварийного восстановления измеряется двумя концепциями:

Роль аудитора [ править ]

Аудитор исследует и оценивает

  • процедуры, указанные в плане BCP и DR, фактически соответствуют реальной практике
  • конкретное лицо в организации, которое может называться сотрудником по аварийному восстановлению, координатором аварийного восстановления, координатором аварийного восстановления или каким-либо другим подобным званием, имеет технические навыки, подготовку, опыт и способности для анализа возможностей члены команды для выполнения поставленных задач
  • более одного человека обучены и способны выполнять определенную функцию во время упражнения по аварийному восстановлению. Тесты и опросы персонала могут помочь в достижении этой цели.

Документация [ править ]

Чтобы максимизировать свою эффективность, планы аварийного восстановления наиболее эффективны при частом обновлении и должны:

  • быть неотъемлемой частью всех процессов бизнес-анализа ,
  • пересматриваться при каждом крупном корпоративном приобретении, при каждом запуске нового продукта и на каждом этапе разработки новой системы.

Организация должна вести соответствующие записи. Аудитор проверяет записи, счета и контракты, чтобы убедиться, что записи ведутся. Одна из таких записей - это текущий список поставщиков оборудования и программного обеспечения организации. Такой список составляется и периодически обновляется с учетом меняющейся деловой практики. Его копии хранятся на сайте и за его пределами и становятся доступными для тех, кто в них нуждается. Аудитор тестирует процедуры, используемые для достижения этой цели, и определяет их эффективность.

План аварийного восстановления [ править ]

План аварийного восстановления ( DRP ) документированный процесс или набор процедур для ВЫПОЛНИТЬ организации аварийного восстановления процессов и восстановлению и защите бизнес - ИТ - инфраструктуры в случае стихийного бедствия . [3] Это «исчерпывающее изложение последовательных действий, которые необходимо предпринять до, во время и после бедствия». [4] Бедствие может быть стихийным , экологическим или антропогенным . Техногенные катастрофы могут быть преднамеренными (например, террористический акт) или непреднамеренными (то есть случайными, например, прорыв искусственной плотины).

Типы планов [ править ]

Хотя универсального плана не существует [5], существуют три основные стратегии: [3] [5]

  1. профилактика, включая надлежащее резервное копирование, наличие сетевых фильтров и генераторов
  2. обнаружение, побочный продукт регулярных проверок, которые могут выявить новые (потенциальные) угрозы
  3. исправление [6]

Последнее может включать обеспечение надлежащих страховых полисов и проведение мозгового штурма «извлеченные уроки». [3] [7]

Связь с планом обеспечения непрерывности бизнеса [ править ]

План обеспечения непрерывности бизнеса (BCP) - это комплексный организационный план, который включает план аварийного восстановления и состоит из пяти планов компонентов: [8]

  • План возобновления бизнеса
  • План действий в чрезвычайной ситуации
  • План непрерывности операций
  • План управления инцидентами
  • План по ликвидации последствий катастрофы

Первые три (планы возобновления бизнеса, чрезвычайных ситуаций и непрерывности операций) не относятся к ИТ-инфраструктуре. План управления инцидентами (IMP) действительно имеет дело с ИТ-инфраструктурой, но поскольку он устанавливает структуру и процедуры для противодействия кибератакам на ИТ-системы организации, он обычно не представляет собой агента для активации плана аварийного восстановления, выходящего из плана аварийного восстановления. как единственный компонент BCP, представляющий интерес для ИТ. [8]

Преимущества [ править ]

Как и любой план страхования, есть преимущества, которые можно получить при правильном планировании, в том числе: [4]

  • Минимизация риска задержек
  • Гарантия надежности резервных систем
  • Обеспечение стандарта для тестирования плана
  • Сведение к минимуму принятия решений во время бедствия
  • Снижение потенциальной юридической ответственности
  • Снижение излишне стрессовой рабочей среды

Методология планирования и тестирования [ править ]

По словам Джеффри Х. Уолда из журнала Disaster Recovery Journal, весь процесс разработки плана аварийного восстановления состоит из 10 шагов: [4]

  • Выполнение оценки рисков : комитет по планированию готовит анализ рисков и анализ воздействия на бизнес (BIA), который включает ряд возможных бедствий. Каждая функциональная область организации анализируется для определения возможных последствий. Традиционно наибольшую опасность представляет пожар. Тщательный план предусматривает «наихудшие» ситуации, например, разрушение главного здания.
  • Установление приоритетов для обработки и операций : критические потребности каждого отдела оцениваются и устанавливаются приоритеты. Подготовлены письменные соглашения для выбранных альтернатив с подробным указанием продолжительности, условий прекращения, тестирования системы , стоимости , любых специальных процедур безопасности, процедуры уведомления об изменениях системы, часов работы, конкретного оборудования и другого оборудования, необходимого для обработки, требований к персоналу. , определение обстоятельств, составляющих чрезвычайную ситуацию , процесс согласования расширений услуг, гарантии совместимости , доступности , требования к ресурсам, не относящимся к мэйнфреймам, приоритеты и другие договорные вопросы.
  • Сбор данных : сюда входят различные списки (список резервных должностей сотрудников, список важных телефонных номеров, главный список вызовов, главный список поставщиков, контрольный список уведомлений), инвентаризация (оборудование связи, документация, офисное оборудование, формы, страховые полисы , компьютер для рабочей группы и центра обработки данных. аппаратное обеспечение, аппаратное и программное обеспечение микрокомпьютеров , канцелярские товары , оборудование для хранения за пределами предприятия, телефоны и т. д.), регистр распределения, графики резервного копирования / хранения программ и файлов данных, спецификации временного местонахождения, любые другие подобные списки, материалы, инвентарные запасы и документация . Предварительно отформатированные формы часто используются для облегчения процесса сбора данных.
  • Составление и документирование письменного плана
  • Разработка критериев и процедур тестирования: причины для тестирования включают:
    • Определение возможности и совместимости средств и процедур резервного копирования.
    • Выявление областей в плане, которые необходимо изменить.
    • Обучение руководителей и членов команды.
    • Демонстрация способности организации восстанавливаться.
    • Обеспечение мотивации для поддержания и обновления плана аварийного восстановления.
  • Тестирование плана : начальный « пробный прогон » плана выполняется путем проведения структурированного пошагового теста. Необходимо выполнить фактический пробный запуск. Проблемы исправлены.

Первоначальное тестирование можно запланировать по частям и в нерабочее время, чтобы свести к минимуму сбои. Последующие тесты проводятся в обычное рабочее время.

Типы тестов включают: тесты контрольного списка, тесты моделирования, параллельные тесты и тесты полного прерывания.

Предостережения / противоречия [ править ]

Из-за высокой стоимости различные планы не остаются без нареканий. Dell определила пять «типичных ошибок», которые организации часто допускают при планировании BCP / DR: [9]

  • Недостаток поддержки : когда высшее руководство рассматривает планирование аварийного восстановления как «еще одно ложное учение о землетрясении», или руководители не могут сделать планирование аварийного восстановления и подготовку к нему приоритетом.
  • Неполные RTO и RPO : неспособность включить каждый важный бизнес-процесс или блок данных. Рябь может усилить воздействие стихийного бедствия. Заработная плата может быть изначально не критичной, но оставленная в покое на несколько дней, она может стать более важной, чем любая из ваших первоначальных проблем.
  • Системная близорукость : третья точка отказа заключается в сосредоточении внимания только на аварийном восстановлении без учета более крупных потребностей в непрерывности бизнеса. Потеря офисных помещений в результате стихийного бедствия может привести к мгновенному появлению пула удаленных сотрудников, который, в свою очередь, может в мгновение ока перегрузить VPN компании , перегрузить персонал ИТ-поддержки и вызвать серьезные узкие места и монополию на телефонную АТС. система.
  • Слабая безопасность : когда происходит катастрофа, данные и бизнес-процессы организации становятся уязвимыми. Таким образом, безопасность может быть более важной, чем чистая скорость, связанная с RTO плана аварийного восстановления. Тогда наиболее важным соображением становится обеспечение безопасности новых конвейеров данных: от новых виртуальных частных сетей до подключения внешних служб резервного копирования.
    • При стихийных бедствиях планирование патологоанатомической экспертизы
    • Блокировка или удаленная очистка потерянных портативных устройств

Решения и стратегии [ править ]

  • Обозначение площадки : горячая или холодная. Горячий участок полностью оборудован для возобновления работы, в то время как холодный объект не имеет такой возможности. Теплый сайт может возобновить некоторые, но не все операции.
Необходим анализ затрат и выгод .
  • Периодические тесты и испытания подтверждают жизнеспособность и эффективность плана. Аудитор изучает вероятность того, что деятельность организации может поддерживаться на уровне, который предполагается в плане, и способность организации фактически наладить операции на месте.
  • Аудитор может проверить это с помощью бумажной и безбумажной документации и фактического физического наблюдения. Безопасность сайта хранения подтверждается.
  • Резервное копирование данных : аудит процессов резервного копирования определяет, являются ли (а) они эффективными и (б) действительно ли они реализуются задействованным персоналом. [10] [11]
План аварийного восстановления также включает информацию о том, как лучше всего восстановить данные, которые не были скопированы. Чтобы гарантировать, что данные не будут повреждены, изменены или уничтожены во время этого процесса, предусмотрены средства контроля и защиты.
  • Сверла : Практика буры , проведенные периодически , чтобы определить , насколько эффективно план и определить , какие изменения могут быть необходимы. Основная задача аудитора здесь - убедиться, что эти учения проводятся должным образом и что проблемы, обнаруженные в ходе этих учений, решаются.
  • Поддержка ключевого персонала - включая периодическое обучение и перекрестное обучение .

Другие соображения [ править ]

Проблемы со страхованием [ править ]

Аудитор определяет адекватность страхового покрытия компании (в частности , страхование имущества и страхование от несчастных случаев ) посредством обзора страховых полисов компании и других исследований. Аудитору необходимо проверить следующие элементы: объем политики (включая любые заявленные исключения), достаточность охвата для покрытия потребностей организации и актуальность политики. С помощью анализа рейтингов, присвоенных независимыми рейтинговыми агентствами, аудитор также устанавливает, что страховая компания или компании, обеспечивающие покрытие, имеют финансовую жизнеспособность для покрытия убытков в случае бедствия.

Эффективные планы аварийного восстановления учитывают степень ответственности компании перед другими организациями и ее способность выполнять эти обязательства, несмотря на крупную катастрофу. Хороший аудит аварийного восстановления будет включать анализ существующих MOA и контрактов, чтобы убедиться, что юридическая ответственность организации за неэффективность в случае стихийного бедствия.или любые другие необычные обстоятельства сведены к минимуму. Также описаны соглашения, относящиеся к оказанию поддержки и помощи в восстановлении компании. Методы, используемые для оценки этой области, включают изучение разумности плана, определение того, учитывает ли план все факторы, а также проверку разумности контрактов и соглашений с помощью документации и сторонних исследований.

Проблемы со связью [ править ]

Аудитор должен убедиться, что планирование гарантирует, что и руководство, и группа восстановления имеют эффективное коммуникационное оборудование, контактную информацию как для внутреннего общения, так и для внешних вопросов, таких как деловые партнеры и ключевые клиенты.

Методы аудита включают

  • тестирование процедур, интервьюирование сотрудников, сравнение с планами другой компании и отраслевыми стандартами,
  • изучение руководств компании и других письменных процедур.
  • прямое наблюдение за тем, чтобы номера телефонов экстренных служб были перечислены и были легко доступны в случае бедствия.

Действия в чрезвычайных ситуациях [ править ]

Процедуры поддержки персонала во время круглосуточного аварийного восстановления включены в любой хороший план аварийного восстановления. Процедуры по хранению продуктов питания и воды, возможности проведения СЛР / оказания первой помощи и действий в чрезвычайных ситуациях в семье четко прописаны и проверены. Как правило, это может быть достигнуто компанией с помощью хороших программ обучения и четкого определения должностных обязанностей. Проверка способности плана к готовности часто включает такие задачи, как опросы персонала, непосредственное физическое наблюдение, а также изучение записей о тренировках и любых сертификатов.

Экологические проблемы [ править ]

Аудитор должен проанализировать процедуры, которые принимают во внимание возможность сбоев питания или других ситуаций, не связанных с ИТ.

  • Могут понадобиться фонарики и свечи .
  • Меры безопасности в случае утечки газа, пожара или других подобных явлений

См. Также [ править ]

  • Схема ротации резервных копий
  • Аудит информационных технологий
  • Сравнение программного обеспечения для резервного копирования
  • Сравнение онлайн-сервисов резервного копирования
  • Уязвимость (вычисления)

Ссылки [ править ]

  1. ^ «Обеспокоены ли внешние аудиторы раскрытием киберрисков» (PDF) .
  2. ^ Susan Snedaker (2013). Планирование непрерывности бизнеса и аварийного восстановления для ИТ-специалистов (2-е изд.). Берлингтон: Elsevier Science. ISBN 9780124114517.
  3. ^ a b c Билл Абрам (14 июня 2012 г.). «5 советов по созданию эффективного плана аварийного восстановления» . Вычислительная техника для малого бизнеса . Проверено 9 августа 2012 года .
  4. ^ a b c Уолд, Джеффри Х. (1997). «Процесс планирования аварийного восстановления» . Журнал аварийного восстановления . Взято из Тома 5 №1. Мир аварийного восстановления. Архивировано из оригинального 15 августа 2012 года . Проверено 8 августа 2012 года .
  5. ^ a b «Планирование аварийного восстановления - пошаговое руководство» . Университет штата Мичиган. Архивировано из оригинала 8 марта 2014 года . Проверено 9 мая 2014 .
  6. ^ «Резервное копирование аварийного восстановления» . Архивирование электронной почты и удаленное резервное копирование. 2010. Архивировано из оригинального 22 января 2013 года . Проверено 9 мая 2014 .
  7. ^ «Планы аварийного восстановления и обеспечения непрерывности бизнеса» . Решения для каменных переходов. 2012. Архивировано из оригинального 23 августа 2012 года . Проверено 9 августа 2012 года .
  8. ^ а б Чад Бахан. (Июнь 2003 г.). «План аварийного восстановления» . Проверено 24 августа 2012 года .
  9. ^ Кормак Фостер; Корпорация Dell (25 октября 2010 г.). «Пять ошибок, которые могут убить план аварийного восстановления» . Архивировано из оригинала на 2013-01-16 . Проверено 8 августа 2012 года .
  10. ^ Constance Gustke (7 октября 2015). «Ураган Хоакин подчеркивает важность планов по сохранению работоспособности» . Нью-Йорк Таймс .
  11. ^ Берман, Алан. : Построение успешного плана обеспечения непрерывности бизнеса. Журнал Business Insurance , 9 марта 2015 г. http://www.businessinsurance.com/article/20150309/ISSUE0401/303159991/constructing-a-successful-business-continuity-plan
  • Мессье-младший, WF (2011). Услуги аудита и подтверждения достоверности информации: систематический подход (8-е изд.). Нью-Йорк: Макгроу-Хилл / Ирвин. ISBN 9780077520151.
  • Гальегос, Ф .; Senft, S .; Дэвис, А.Л. (2012). Контроль и аудит информационных технологий (4-е изд.). Бока-Ратон, Флорида: Публикации Ауэрбаха. ISBN 9781439893203.