Disaster Recovery: бұл не және бизнеске не үшін қажет
Disaster Recovery (DR) – сақтық көшірме емес және "кейінірек қалпына келтіретін нәрсе"емес. Бұл алдын-ала жасалған жоспар, ол апаттан кейін жүйені тез арада іске қосуға көмектеседі, деректер мен уақыттың ең аз шығыны. Егер сізде жоспар мен репликация болмаса-сізде ақаулыққа төзімділік жоқ.
Disaster Recovery - бұл жиынтық:
- техникалық шешімдер,
- регламенттер,
- адамдар және SLA,
сәтсіздіктер кезінде IT жүйелерін қалпына келтіруді қамтамасыз ететін: Dcdo сәтсіздігі, өрт, ransomware, адам факторы, санкциялық тәуекелдер.
DRaaS қалай жұмыс істейді
- Сіздің инфрақұрылымыңыз резервтік алаңға көшіріледі (көбінесе бұлт).
- Деректер кесте бойынша немесе нақты уақыт режимінде синхрондалады.
- Апат кезінде жүйенің көшірмесін failover — іске қосады.
- Пайдаланушылар жұмысты минималды үзіліспен жалғастырады.
Disaster Recovery ұйымдастыру тәсілдері
| Тәсілі | Артықшылықтары | Кемшіліктері |
|---|---|---|
| Өзінің резервтік сервері | Толық бақылау | Өте қымбат |
| Екінші ДБО | Сенімді | Қолдау қиын |
| Бұлт | Икемділік, масштабтау | Дұрыс орнатуды қажет етеді |
| DRaaS | SLA бойынша жылдам, болжамды | Провайдерге тәуелділік |
80% жағдайда DRaaS — бағасы мен қалпына келтіру жылдамдығы үшін ең жақсы нұсқа болып табылады.
Disaster Recovery сақтық көшірмелерден қалай ерекшеленеді
Жиі еленбейтін негізгі мәселе.
| Параметр | Backup | DR |
|---|---|---|
| Мақсаты | Деректерді сақтау | Жұмысты қалпына келтіру |
| Бос уақыт | Сағат/күн | Минуттар |
| Автоматтандыру | Минималды | Толық |
| Пайдаланушылар | Күтуде | Жұмыс |
Факт: сақтық көшірмелер DR бөлігі болып табылады, бірақ ешқашан ауыстыру емес.
Апатты қалпына келтірудің негізгі параметрлері
- RTO — рұқсат етілген тоқтау уақыты.
- RPO — деректердің рұқсат етілген жоғалуы.
Мысал:
| Жүйе | RTO | RPO |
|---|---|---|
| Интернет-дүкен | 15 мин | 5 мин |
| Бухгалтерлік есеп | 4 сағат | 1 сағат |
| Мұрағат | 24 сағат | 24 сағат |
Disaster Recovery жоспары дегеніміз не
Жоспар жоқ — қалпына келтіру жоқ.
DRP жоспары нені қамтиды
- DR командасының құрамы және жауапкершілік аймақтары
- Сыртқы және ішкі тәуекелдерді бағалау
- Маңызды бизнес-процестер
- Әр жүйе үшін RTO және RPO
- Апат сценарийлері және іс-қимыл тәртібі
- Провайдермен бірге SLA
- Тұрақты failover сынақтары
Маңызды: Disaster recovery жоспары тестілеусіз-қағаз.
Апатты кезең-кезеңмен қалпына келтіру
- Оқиғаны анықтау
- Failover туралы шешім қабылдау
- Резервтік инфрақұрылымды іске қосу
- Ақпараттың тұтастығын тексеру
- Пайдаланушыларды ауыстыру
- Талдау және негізгі ортаға қайтару (failback)
Disaster Recovery параллель инфрақұрылымы: резервті қайда сақтау керек
- Бұлтта - жылдамырақ іске қосу, аз CAPEX
- Екінші деректер базасында-қымбатырақ, бірақ реттеушілер үшін қолайлы
- Гибрид көбінесе ірі бизнес үшін ең жақсы нұсқа болып табылады
Disaster Recovery кімге керек
Міндетті түрде, егер:
- қарапайым = тікелей қаржылық шығындар;
- онлайн қызметтер бар;
- реттеушілердің немесе клиенттердің талаптары;
- бизнес 24/7 жұмыс істейді.
Салалардың мысалдары:
- банктер және қаржы,
- e-commerce,
- SaaS және IT компаниялары,
- сервистік компаниялар.
Хостинг провайдерінің тәжірибесіндегі нақты жағдай
Міндеті: ~30 млн айналымы бар e-Commerce жобасының үздіксіз жұмысын қамтамасыз ету ? айына және сату маусымындағы ең жоғары жүктемелер.
Бастапқы жағдай
Негізгі Инфрақұрылым бір ДБО-да орналастырылды:
- 4 VM (web, app, DB, кезек),
- PostgreSQL + Redis,
- күнделікті сақтық көшірмелер.
Ресми түрде "сақтық көшірме бар", жоспар жоқ.
RTO іс жүзінде бірнеше сағатты құрайды және бизнес үшін бұл өте маңызды болар еді.
Оқиға
АШД тарапындағы сәтсіздік нәтижесінде негізінен ДҚБО:
- деректер базасы қол жетімді болмады,
- сайт пен API жауап беруді тоқтатты,
- сақтық көшірмелерден қалпына келтіру 6-8 сағатты алады.
Клиент үшін:
- тікелей сату шығындары,
- байланыс орталығына жүктеме,
- беделді тәуекелдер.
Disaster Recovery Жоспарын Іске Асыру
Біз DRaaS келесі архитектурамен енгіздік:
Виртуалды машиналарды бұлттың резервтік алаңына көшіру.
RPO бар асинхронды ДБ репликациясы 5 минут.
Disaster Recovery Plan Дайындаған:
- апат сценарийі,
- жауапты тұлғалар,
- Тапсырыс failover.
Триггер бойынша инфрақұрылымды автоматты түрде іске қосу.
Disaster Recovery енгізілгеннен кейінгі параметрлер
| Параметр | DR дейін (сағат) | DRaaS кейін (минут) |
|---|---|---|
| RTO | 6–8 | 12 |
| RPO | 24 | 5 |
| Failover | Қолмен | Автоматтандырылған |
| Тестілеу | Жоқ | Тоқсан сайын |
Қайталанған оқиға (4 айдан кейін)
Негізгі провайдер жағында желілік оқиға болды:
- Disaster Recovery Plan регламент бойынша іске қосылды,
- резервтік Инфрақұрылым автоматты түрде көтерілді,
- пайдаланушылар қысқа мерзімді деградацияны ғана байқады.
Факт: бизнес тоқтаған жоқ, сату жалғасты, SLA сақталды.
Бұл жағдай негізгі нүктені анық көрсетеді:
- Сақтық көшірмелер деректерді сақтайды. Disaster Recovery бизнесті сақтайды.
- Бұл бірінші оқиғаға тұрарлық, әсіресе қарапайым "қолайсыздықтар"емес, ақшамен өлшенетін жерде.
FAQ:
Disaster Recovery дегеніміз не және ол бәріне қажет пе?
Жоқ. Жоқ. Бірақ егер қарапайым DR — ге қарағанда қымбатырақ болса-жауап анық.
Disaster Recovery-ді өзіңіз жасай аласыз ба?
Мүмкін. Бірақ тәжірибесіз сіз артық төлейсіз және бәрібір қателесесіз.
Disaster Recovery-ді қаншалықты жиі тексеруге болады?
Жылына кемінде 1-2 рет. Біз сондай — ақ ұсынамыз-тоқсанына бір рет.
Жоқ. Сақтық көшірмелер ақпаратты сақтау мәселесін шешеді, бірақ қызметтерді жылдам іске қосуды қамтамасыз етпейді. Сақтық көшірмелерден қалпына келтіру әрқашан қолмен және ұзақ процесс.
Disaster Recovery қаншалықты қауіпсіз?
Иә, Шартпен:
- оқшауланған Инфрақұрылым,
- мәліметтерді шифрлау,
- нақты жазылған SLA,
- ашық қол жеткізу регламенттері.
Қорытынды
Disaster Recovery (DR) — бұл компанияның үздіксіз жұмыс істейтін құралы, ол бар және тексерілген немесе мүлдем жоқ.
Егер жоспар тексерілмеген болса, ол жоқ деп есептеңіз.



