Disaster Recovery: бұл не және бизнеске не үшін қажет

Disaster Recovery (DR) – сақтық көшірме емес және "кейінірек қалпына келтіретін нәрсе"емес. Бұл алдын-ала жасалған жоспар, ол апаттан кейін жүйені тез арада іске қосуға көмектеседі, деректер мен уақыттың ең аз шығыны. Егер сізде жоспар мен репликация болмаса-сізде ақаулыққа төзімділік жоқ.

Disaster Recovery - бұл жиынтық:

  • техникалық шешімдер,
  • регламенттер,
  • адамдар және SLA,

сәтсіздіктер кезінде IT жүйелерін қалпына келтіруді қамтамасыз ететін: Dcdo сәтсіздігі, өрт, ransomware, адам факторы, санкциялық тәуекелдер.

DRaaS қалай жұмыс істейді

  • Сіздің инфрақұрылымыңыз резервтік алаңға көшіріледі (көбінесе бұлт).
  • Деректер кесте бойынша немесе нақты уақыт режимінде синхрондалады.
  • Апат кезінде жүйенің көшірмесін failover — іске қосады.
  • Пайдаланушылар жұмысты минималды үзіліспен жалғастырады.

Disaster Recovery ұйымдастыру тәсілдері

ТәсіліАртықшылықтарыКемшіліктері
Өзінің резервтік серверіТолық бақылауӨте қымбат
Екінші ДБОСенімдіҚолдау қиын
БұлтИкемділік, масштабтауДұрыс орнатуды қажет етеді
DRaaSSLA бойынша жылдам, болжамдыПровайдерге тәуелділік

80% жағдайда DRaaS — бағасы мен қалпына келтіру жылдамдығы үшін ең жақсы нұсқа болып табылады.

Disaster Recovery сақтық көшірмелерден қалай ерекшеленеді

Жиі еленбейтін негізгі мәселе.

ПараметрBackupDR
МақсатыДеректерді сақтауЖұмысты қалпына келтіру
Бос уақытСағат/күнМинуттар
АвтоматтандыруМинималдыТолық
ПайдаланушыларКүтудеЖұмыс

Факт: сақтық көшірмелер DR бөлігі болып табылады, бірақ ешқашан ауыстыру емес.

Апатты қалпына келтірудің негізгі параметрлері

  • RTO — рұқсат етілген тоқтау уақыты.
  • RPO — деректердің рұқсат етілген жоғалуы.

Мысал:

ЖүйеRTORPO
Интернет-дүкен15 мин5 мин
Бухгалтерлік есеп4 сағат1 сағат
Мұрағат24 сағат24 сағат

Disaster Recovery жоспары дегеніміз не

Жоспар жоқ — қалпына келтіру жоқ.

DRP жоспары нені қамтиды

  • DR командасының құрамы және жауапкершілік аймақтары
  • Сыртқы және ішкі тәуекелдерді бағалау
  • Маңызды бизнес-процестер
  • Әр жүйе үшін RTO және RPO
  • Апат сценарийлері және іс-қимыл тәртібі
  • Провайдермен бірге SLA
  • Тұрақты failover сынақтары

Маңызды: Disaster recovery жоспары тестілеусіз-қағаз.

Апатты кезең-кезеңмен қалпына келтіру

  • Оқиғаны анықтау
  • Failover туралы шешім қабылдау
  • Резервтік инфрақұрылымды іске қосу
  • Ақпараттың тұтастығын тексеру
  • Пайдаланушыларды ауыстыру
  • Талдау және негізгі ортаға қайтару (failback)

Disaster Recovery параллель инфрақұрылымы: резервті қайда сақтау керек

  • Бұлтта - жылдамырақ іске қосу, аз CAPEX
  • Екінші деректер базасында-қымбатырақ, бірақ реттеушілер үшін қолайлы
  • Гибрид көбінесе ірі бизнес үшін ең жақсы нұсқа болып табылады

Disaster Recovery кімге керек

Міндетті түрде, егер:

  • қарапайым = тікелей қаржылық шығындар;
  • онлайн қызметтер бар;
  • реттеушілердің немесе клиенттердің талаптары;
  • бизнес 24/7 жұмыс істейді.

Салалардың мысалдары:

  • банктер және қаржы,
  • e-commerce,
  • SaaS және IT компаниялары,
  • сервистік компаниялар.

Хостинг провайдерінің тәжірибесіндегі нақты жағдай

Міндеті: ~30 млн айналымы бар e-Commerce жобасының үздіксіз жұмысын қамтамасыз ету ? айына және сату маусымындағы ең жоғары жүктемелер.

Бастапқы жағдай

Негізгі Инфрақұрылым бір ДБО-да орналастырылды:

  • 4 VM (web, app, DB, кезек),
  • PostgreSQL + Redis,
  • күнделікті сақтық көшірмелер.

Ресми түрде "сақтық көшірме бар", жоспар жоқ.

RTO іс жүзінде бірнеше сағатты құрайды және бизнес үшін бұл өте маңызды болар еді.

Оқиға

АШД тарапындағы сәтсіздік нәтижесінде негізінен ДҚБО:

  • деректер базасы қол жетімді болмады,
  • сайт пен API жауап беруді тоқтатты,
  • сақтық көшірмелерден қалпына келтіру 6-8 сағатты алады.

Клиент үшін:

  • тікелей сату шығындары,
  • байланыс орталығына жүктеме,
  • беделді тәуекелдер.

Disaster Recovery Жоспарын Іске Асыру

Біз DRaaS келесі архитектурамен енгіздік:

Виртуалды машиналарды бұлттың резервтік алаңына көшіру.

RPO бар асинхронды ДБ репликациясы 5 минут.

Disaster Recovery Plan Дайындаған:

  • апат сценарийі,
  • жауапты тұлғалар,
  • Тапсырыс failover.

Триггер бойынша инфрақұрылымды автоматты түрде іске қосу.

Disaster Recovery енгізілгеннен кейінгі параметрлер

ПараметрDR дейін (сағат)DRaaS кейін (минут)
RTO6–812
RPO245
FailoverҚолменАвтоматтандырылған
ТестілеуЖоқТоқсан сайын

Қайталанған оқиға (4 айдан кейін)

Негізгі провайдер жағында желілік оқиға болды:

  • Disaster Recovery Plan регламент бойынша іске қосылды,
  • резервтік Инфрақұрылым автоматты түрде көтерілді,
  • пайдаланушылар қысқа мерзімді деградацияны ғана байқады.

Факт: бизнес тоқтаған жоқ, сату жалғасты, SLA сақталды.

Бұл жағдай негізгі нүктені анық көрсетеді:

  • Сақтық көшірмелер деректерді сақтайды. Disaster Recovery бизнесті сақтайды.
  • Бұл бірінші оқиғаға тұрарлық, әсіресе қарапайым "қолайсыздықтар"емес, ақшамен өлшенетін жерде.

FAQ:

Disaster Recovery дегеніміз не және ол бәріне қажет пе?

Жоқ. Жоқ. Бірақ егер қарапайым DR — ге қарағанда қымбатырақ болса-жауап анық.

Disaster Recovery-ді өзіңіз жасай аласыз ба?

Мүмкін. Бірақ тәжірибесіз сіз артық төлейсіз және бәрібір қателесесіз.

Disaster Recovery-ді қаншалықты жиі тексеруге болады?

Жылына кемінде 1-2 рет. Біз сондай — ақ ұсынамыз-тоқсанына бір рет.

Сақтық көшірмелерді жеткілікті қорғаныс деп санауға бола ма?

Жоқ. Сақтық көшірмелер ақпаратты сақтау мәселесін шешеді, бірақ қызметтерді жылдам іске қосуды қамтамасыз етпейді. Сақтық көшірмелерден қалпына келтіру әрқашан қолмен және ұзақ процесс.

Disaster Recovery қаншалықты қауіпсіз?

Иә, Шартпен:

  • оқшауланған Инфрақұрылым,
  • мәліметтерді шифрлау,
  • нақты жазылған SLA,
  • ашық қол жеткізу регламенттері.

Қорытынды

Disaster Recovery (DR) — бұл компанияның үздіксіз жұмыс істейтін құралы, ол бар және тексерілген немесе мүлдем жоқ.

Егер жоспар тексерілмеген болса, ол жоқ деп есептеңіз.