Business Resilience & Continuity Services
IBM 재해복구서비스
Business Resilience & Continuity Services
2006.05.03. IBM BRCS
© 2006 IBM Corporation
Business Resilience & Continuity Services
목차
1. BCP 개요 2. BCP 추진의 필요성 3. BCP 동향 4. BCP 방법론 5. 재해복구시스템 구축 및 서비스
2
Business Resilience & Continuity Services
1) BCP 개요 – 재해란? 사업환경위기, 자연재해, 전산 및 기술적 재해 등 발생가능성이 있는 재해로 인한 고객이 받는 영향과 손실은 과거와 비교할 수 없을 정도로 크고, 상당히 짧은 시간 안에 회사의 존폐를 좌우할 수 있습니다. 홍수, 지진, 번개, 화재, 가뭄, 전염병 (조류독감 등) 파업, 소요사태
자연재해 (Natural Disaster)
사업환경위기 (Business Crises)
외부의 위협 (External Threats)
재해의 종류
테러위협, 방화, 제휴업체 위기
업무 중단 지역적 (Threats Due to Your Location) 위험시설(정유, 화학공장, 방사능 폐기 시설 등)
전산 및 기술적 재해 (Technological Accidents)
자산 손실, 파산
재해발생
Computer장애 (시스템인프라, 컴퓨터 바이러스, 해킹…)
3
고객 Service 중단 회사 신뢰도 하락
정부 및 공공기관 요구사항 대응 불가
Business Resilience & Continuity Services
1) BCP 개요 – 재해란? 실제 국내외적으로 전쟁, 테러, 천재지변에 의한 재해 뿐 아니라 노사문제로 인한 파업, 전산설비 / 통신장애, 주요시스템 중단 등과 같은 장애 발 생 시 업무 중단, 대 고객 서비스 제공 등에 심각한 영향을 끼친 사례를 종종 볼 수 있습니다.
파업 등의 노사문제
2003년 6월 신한의 조흥은행 인수 시 파업으로 인한 전산망 다운 위기
2000년 9월 동원증권 시스템 작업 중 발생한 전산망 장애
전산 설비 장애
2003년 1월 인터넷 대란 2003년 2월 우리은행 UPS 장애로 인한 전산망 장애
전쟁, 테러에 의한 재해 홍수, 지진 등 천재지변
2001년 9월 New York의 WTC Terror로 인한 금융기관의 전산망 재해
1995년 1월 고베 대지진으로 인한 전산망 재해
4
전산망 다운을 전제로 필요 인력 철수 Æ 전산망 가동 중단 위기 은행 전산망 = 노조의 투쟁 수단 7조 여원의 예금 인출 및 고객 이탈 은행의 대외 이미지 및 신인도 손상 동원증권: 4일간 거래 중단으로 인한 거래 손실 – 수수료 손실 등의 직접적 피해 + 투자 손실로 인한 간접 피해 Î 고객의 금전적 손해/불만, 고객 이탈 우리은행: 2시간여 동안 업무 중단 사태 Î 고객의 불편 및 불만 28일간 통신 중단, 7만여대의 Workstation 파괴, 14일간 교통 운행 중단, 10만 feet2 Office 공간 손실 뉴욕 WTC 테러로 인한 재해 선포 고객에 재해복구 서비스 실시 사례1) Morgan Stanley 등 28개사 재해복구 센터에서 시스템 복구 사례2) E*Trade 등 11개사 재해선포 및 시스템 복구 작업 수행 준비
Business Resilience & Continuity Services
1) BCP 개요 – BCP의 개념 BCP란 일반적으로 업무연속성계획이라고 하며, 시스템 운영복구, 데이터백업 등 IT 재해복구뿐 아니라 기업의 핵심업무를 계속 유지하고, 고객서비스의 지속성을 보장하기 위한 기업의 전반적인 연속성 유지를 포괄하는 개념입니다.
신용 리스크
운영 운영 리스크 리스크
감독당국의 지침 (Pillar II)
Basel II
부적절한 부적절한 내부절차, 내부절차, 직원, 직원, 시스템 시스템 등으로 등으로 인한 인한 리스크 리스크 –– 필요 필요 자본 자본 산정 산정 시 시 반영 반영
시장 리스크
시장 규율 (Pillar III)
재해 등 비상사태 시 전행 비상대응계획을 통한 Business 연속성 보장
거래처리, 상품/Svc 제공관련 물리적인 물리적인 자산에 자산에 대한 대한 파손 파손
업무 업무 중단, 중단, 시스템 시스템 실패 실패
Data 센터 운영 Risk 측면 S/W, H/W, Network 재해복구센터
BCP 영역
고객, 상품, 상관행
최저 자기자본 규제(Pillar I)
신 바 젤 협 약 안
근로환경 및 관행
자연재해, 기타사건으로 물리적으로 자산에 가해 지는 피해로 생긴 손실 예: 자연재해, 테러, 납치 사업의 중단 또는 시스템의 실패로부터 생기는 손실 예: 하드웨어, 소프트웨어 및 통신의 실패
외부 부정행위
재해 시 재해복구시스템 및 재해복구계획으로 IT 연속성 보장
내부 부정행위
5
인적자원 재해 복구 요원의 훈련상태 재택 근무 등의 set up 인력 대치 계획 비상연락망
Business 영역 + IT 영역 (DR포함)
시설 시설의 재해요소 분석 건물 및 주위의 위험요소 분석 대체 업무 장소, 장비 네트워크 구성 Business 중요 데이터 관리 상태 기능, 프로세스 표준화 운영 Risk 점검 Connectivity (연결성) Site 별 네트워크 연결 현황 Login ID 및 보안상태 7x24 시스템 연결 현황 특정 Svcs 서비스 공급자의 SLA 등
Business Resilience & Continuity Services
1) BCP 개요 – BCP의 영역
Enterprise Risk Management
운영위험(ORM)
BCP 영역
시장위험
Business 영역 • 관련 서류 등 중요 데이터(Vital Records) 환원, 대체 업무 장소 • 인력배치 계획
신용위험
6
공통 영역 • 업무 Application • 업무 프로세스
IT영역 • Hardware • Software • Network • Facilities
Business Resilience & Continuity Services
1) BCP 개요 – BCP 성숙도 (Maturity) Model 가트너 그룹은 BCP 성숙도 모델을 통해 BCP 부재 단계로부터 최적화 단계까지 해당 조직이 현재 위치해 있는 BCP 준비상태 측정 기준을 제시하고 있 습니다. Level Level 55 -- “BCP가 “BCP가 기업에 기업에 중요한 중요한 핵심요소로서 핵심요소로서 자리잡고 자리잡고 있으며 있으며 주주들이나 주주들이나 다른 다른 이해당사자 이해당사자 사이에서도 사이에서도 BCP BCP Status가 Status가 꾸준히 꾸준히 검토되고 검토되고 논의되는 논의되는 단계” 단계”
Optimized (최적화) Managed (관리) Level Defined (정의)
Level Level 44 -- “BCP가 “BCP가 기업의 기업의 주요 주요 위험관리 위험관리 프로그램으로 프로그램으로 인식. 인식. 관리 관리 및 및 통제, 통제, 프로세스, 프로세스, 정책, 정책, 표준에 표준에 따르고 따르고 있는지 있는지 평가하는 평가하는 체계도 체계도 가지고 가지고 있는 있는 단계” 단계”
4
Level Level 33 -- “프로세스와 “프로세스와 프로시저가 프로시저가 표준화 표준화 및 및 문서화되어 문서화되어 있지만 있지만 적절히 적절히 수 수 행되는지 관리하거나 감사 및 통제가 불충분한 단계” 행되는지 관리하거나 감사 및 통제가 불충분한 단계”
Level 3 Level 2
Repeatable (반복)
Level 1
Initial (초기)
Level Level 22 -- “명확하게 “명확하게 역할과 역할과 책임이 책임이 정의되고 정의되고 담당자가 담당자가 임명되어 임명되어 있지만 있지만 그 그 역할에 역할에 대한 대한 객관적인 객관적인 평가체계가 평가체계가 존재하지 존재하지 않는 않는 단계” 단계”
Level 0
Nonexistent (부재) Level Level 11 -- “그룹 “그룹 차원 차원 또는 또는 기업 기업 전반에 전반에 형식적인 형식적인 조직. 조직. 역할 역할 또는 또는 책임이 책임이 존 존 재하지는 재하지는 않지만 않지만 BCP BCP Action Action Item을 Item을 처리하는 처리하는 몇몇 몇몇 IT IT 그룹이 그룹이 있는 있는 단계” 단계” “The “The Gartner Gartner Business Business Continuity Continuity Planning Planning Maturity Maturity Model Model isis based based on on the the principle principle that that the the quality quality of of an an enterprise’s business continuity plan will be directly enterprise’s business continuity plan will be directly related related to to the the quality quality and and maturity maturity of of the the BCP BCP processes processes and and practices practices used used to to create create and and maintain maintain it.” it.”
Level Level 00 -- “BCP를 “BCP를 위한 위한 프로세스는 프로세스는 존재하지 존재하지 않고, 않고, BCP BCP 필요에 필요에 대한 대한 최소한 최소한 의 의 인식을 인식을 가지고 가지고 있는 있는 단계” 단계”
7
Business Resilience & Continuity Services
2) BCP 추진의 필요성 BCP의 목적은 재해, 장애 등 비상상황에 대한 대응을 위해 BCP 전략과 관리체계를 수립하고 동시에 감독기관의 기준요건을 충족하여 결과적으로 업무 연속성 확보와 신뢰도 제고라는 기대효과를 얻을 수 있습니다.
『 업무연속성 확보 및 신뢰도 제고』
BCP 전략 및 BCP 관리체계 마련
대외 이미지 제고 독립적 기능 확보
감독기관 기준 충족
경쟁력 강화
재해 대비 현황의 대 고객 공지 의무
바젤 II 대응을 통한 운영리스크 감소 및 신용도 제고 방안 수립
복구 준비가 안된 대부분 기업이 재해발생 후 2년 내에 도산
재해복구 대상업무의 현실화 방안 개발
8
비상 상황에 대한 대응체계 수립
비상계획 수립 비상대응 방안, 복구절차, 모의훈련 시나리오 등 비상계획을 수립
Business Resilience & Continuity Services
2) BCP 추진의 필요성 – 기업을 위한 재해경감활동 지원/평가 (소방방재청) 신설 소방방재청은 기업에 재해경감/관리활동을 활성화시키고 이를 평가하여 재해경감 활동이 우수한 기업에 대해서는 세제혜택, 방재회계적용, 가산점 부여, 보험금 할인, 융자혜택 확대 등 정부지원을 제도화 하는 것을 법제화를 준비 중에 있습니다.
• 사례 - 지방자치단체 (시․도) 평가지표
¾ 2005년 지방자치단체의 재난관리현황에 대한 평가를 시작으로 현재 소방방재청에서 선진국가에서 적용하고 있는「재난관리표준 (NFPA 1600, 미국)」을 기업에 도입, 재해경감/관리활동을 활성화시키고 이를 평가하여 재해경감 활동이 우수한 기업에 대해서는 세제혜택, 방재회계적용, 가산점 부여, 보험금 할인, 융자혜택 확대 등 정부지원을 제도화 하는 것을 법제화를 준비, 관계기관 검토 중에 있으며 아래 내용을 구체적인 개선방안으로 준비 중에 있습니다. - 재난관리 표준을 제정하고 기업이 활용할 수 있도록 보급 - 기업은 국가가 제정한 재난관리 표준에 따라 재해를 경감할 수 있는 활동계획을 수립하고 이행토록 추진 - 재해경감 우수기업의 차별화된 지원을 위하여 인증제도를 도입 - 정부에서는 세제 지원, 설비 자금 지원, 자금지원 우대 등 기업의 재해경감활동 지원방안을 마련
9
Business Resilience & Continuity Services
3) BCP 동향 – 산업별 BCP 현황 분석자료 (1/2)
2005 2005 BCP BCP Benchmark Benchmark Study Study (조사결과) (조사결과) 미국 BC Management 사의 [2005 Benchmark Study Results]를 바탕으 로 작성된 다음의 설문조사 결과 - 각 기업들의 산업별, 규모별 BCP 프로 그램 도입 현황과 RTO, BCP 프로그램 에 책정되는 예산, BCP 전담인력 수 등 조사내용이 포함되어 있습니다.
금융권의 경우, 전사/전행차원의 BCP의 수행이 절반을 훨씬 넘고 있으며 전반적인 산업측면에서도 금융권 BCP의 수행과 수립을 주도하고 있음을 알 수 있습니다.
산업별
NO BCP
BCP 개발중
IT BCP 수행
선택된 부서 BCP 수행
전사 BCP 수행
총계
금융권
0%
6%
3%
29%
62%
34%
수도/전기/가스
0%
8%
8%
56%
28%
3%
의료서비스
2%
25%
17%
49%
8%
7%
보험
0%
7%
4%
42%
47%
12%
컨설팅 서비스
1%
11%
14%
34%
40%
8%
제조업
6%
8%
17%
47%
22%
4%
통신회사
0%
8%
3%
46%
43%
4%
항공, 운송업
0%
17%
25%
50%
8%
1%
정부기관
2%
16%
10%
43%
29%
7%
소매거래업
8%
4%
21%
50%
17%
3%
교육업
8%
17%
0%
50%
25%
1%
정보처리 서비스
4%
8%
38%
28%
22%
6%
컴퓨터 서비스/시스템
6%
12%
24%
35%
24%
4%
석유/화학
0%
20%
0%
80%
0%
1%
기타
2%
11%
15%
50%
22%
5%
총계*
1%
10%
10%
39%
40%
100%
10
Business Resilience & Continuity Services
3) BCP 동향 – 산업/회사 규모별 BCP 현황 분석자료 (2/2) 2005 2005 BCP BCP Benchmark Benchmark Study Study (조사결과) (조사결과) 미국 BC Management 사의 [2005 Benchmark Study Results]를 바탕으 로 작성된 다음의 설문조사 결과 - 각 기업들의 산업별, 규모별 BCP 프로 그램 도입 현황과 RTO, BCP 프로그램 에 책정되는 예산, BCP 전담인력 수 등 조사내용이 포함되어 있습니다.
기업 매출/자산 규모
NO BCP
IT BCP 수행
선택된 부서 BCP 수행
전사 BCP 수행
100%
응답 없음 150억 이하
총계 <1%
13%
20%
19%
15%
33%
9%
150억~500억
3%
19%
19%
25%
34%
6%
500억~1000억
11%
19%
30%
30%
11%
5%
14%
18%
32%
36%
9%
1000억~5000억
10조 이상의 매출/자산규모의 기업 또는 조직 역시 전사/전행적인 BCP의 수행 및 수립이 일반적인 상황이며 추세라고 할 수 있습니다.
BCP 개발중
5000억~1조
2%
15%
17%
30%
36%
11%
1조~5조
1%
17%
17%
33%
32%
17%
5조~10조
3%
11%
6%
34%
46%
12%
10조 이상
1%
8%
10%
40%
40%
21%
해당사항 없음 **
2%
24%
15%
38%
22%
10%
총계*
3%
15%
15%
32%
35%
100%
11
Business Resilience & Continuity Services
4) BCP 방법론 - IBM BCP Framework BCP 프레임워크는 재해 등 비상상황을 가정, 이에 대응하기 위해 고려해야 하는 전략, 조직, 프로세스, 기술, 설비 및 보안 및 어플리케이션 과 데이터 요소를 포함합니다.
연속성 전략 : 거버넌스, 전략 등 • • • • • • • • • • • •
Governance Financial strategy Continuity strategy Availability strategy Communications New product/services Risk management Value delivery and ROI Technology and innovation Technical support Alignment Corporate culture
어플리케이션과 데이터 : 데이터 보안, 스토리지, 어플리케이션 아키텍처 & • Data security 설계 • Data storage • Application architecture •
기술 • • • •
조직
and design Application ergonomics
: 하드웨어 아키텍처, 시스템 소프트웨어, 미들웨어, 네트워크 Hardware architectures System software Middleware Networks
12
STRATEGY
• • • • •
ORGANIZATION PEOPLE
PROCESS
: 역할, 책임, 구조, 스킬, 조직간 협조 등
Roles Responsibilities Structures Skills Cross-organizational cooperation
프로세스 : 비즈니스, IT 프로세스, •
교차 기능적 프로세스
IT Process • Change management • Problem management • Help desk • Situation management TECHNOLOGY • Availability management • Backup and recovery • Business Process • Back-office operations FACILITIES AND SECURITY FACILITIES & SECURITY • Claims processing, etc. • Cross-Functional Process controls : 물리적, 논리적 보안, •• Business Financial controls 접근제어, 전력, 환경요인 • Customer call centers • Suppliers Physical and logical • Enterprise Resource Planning security • Customer Resource Safeguard access Management Power protection
APPLICATIONS and DATA
설비 및 보안 • • • •
Environmental considerations
Business Resilience & Continuity Services
* BCP 구현 사례 (Benchmark) W사의 경우, 재해복구시스템 구축 및 전산업무 재개를 정확하고 신속하게 하기 위하여 복구 절차관련 담당자들의 팀의 구성을 하고 있으며, 시스템 복구반, 업무 복구반, 시설 복구반, 복구 지원반, 영업점 지원반, 응급 대응반 등으로 나누어 체계적으로 대응했습니다.
W사 BCP 전략 – 비상조직 관점 [국내] 전산센터가 재해 발생시, 재해복구시스템 구 축 및 전산업무 재개를 정확하고 신속하게 하기 위하여 복구 절차관련 담당자들의 팀의 구성은 가장 기본적이면서 중요한 사항 재해복구를 위한 일련의 작업들을 위한 팀 조직과 담당자들의 책임사항 및 역할에 대하 여 정리함으로써 재해복구 업무에 차질이 없 도록 만전을 기함
le p m Sa
각기 팀에서 평상시 하여야 되는 임무와 재 해 시 하여야 되는 임무에 대하여 정리하며, 팀에 소속되는 구성원에 대한 사항은 직책으 로 구분 재해 발생시 복구를 위한 조직 구성은 다음 의 조직도표와 같으며, 또한 아래 도표와 같 은 구성은 전산센터에 재해 발생시를 대비 하여 전산시스템의 복구 업무를 위주로 구성
13
Business Resilience & Continuity Services
* BCP 구현 사례 (Benchmark) W사의 경우 파업에 대한 비상계획을 단계별로 마련, 예상시나리오를 수립하고 인력대체, 동원방안 등을 마련했습니다. 현재 수립된 비상계획
1단계 (파업징후감지)
다양한 쟁의 시나리오 및 대응방안 보강
업무 범위 대응 방안
z
2-2단계 (부분파업) 업무별로 참여인원이 상이하여 파업의 강도가 다를 경우 z 파업율이 평균 50%이내일 경우 (연.월차 휴가 사용) z
le p m Sa
; 3일 이상 지속 시
2-3단계 (전면파업)
4단계 (비상사태 해제)
2-4단계 (전원파업)
z 50%이상의 직원이 참여하여 z 핵심인원까지 파업에 동참하여 일반업무 수행이 거의 불가능한 경우 전체 업무수행이 불가능한 경우 z 핵심인원은 파업에서 제외되어 최소한의 IT서비스만 제공
정상적인 업무 수행에 영향이 미치는 대상 업무 및 시스템 점검 및 조치
z 시스템 운영, 긴급/장애복구 중심의 z 온라인운영 이외 업무 중단 업무 운영 z 시스템 운영에 필수적인 업무 z 개발 및 유지보수 등 부가적 업무 수행 중단
z
업무 운영현황 점검 z 시스템 가동상황 점검 및 조치 z 비상대책 모의 Test z 시스템 운영안정화 조치 - 운영 매뉴얼 확보 - 운영 패스워드 확보
z
부분파업에 대비한 비상 근무조(1단계) 운영 z 핵심요원 확보 z 전산센터 출입통제 강화 z 당숙직 책임자 직급 상향 z 금융기관 지원인력 요청 및 교육실시
z
z
z
조직 및 인력
정시 출퇴근 점심시간 지키기
3단계 (파업장기화)
; 쟁의행위 및 파업개시
2-1단계 (준법쟁의) z
예상 시나리오
2단계 (파업돌입)
14
전면파업에 대비한 비상 근무조(2단계) 운영 z 계약/외주인력 보강 z 금융기관 인력 업무 실시 z 전면파업에 따른 업무처리 지침 통지 z 관할경찰 지원요청 z
운영범위 및 시간 축소 업무별 운영 우선순위에 따른 가동
z
핵심요원 동참에 대비한 비상근무조(3단계) 운영 z 외부전문인력 투입 z 대체인력 투입 / 증원
Business Resilience & Continuity Services
5) 재해복구시스템 구축 및 서비스
취약부분 분석
업무중단 손실비용
안전대책 효과분석 비예측 재해가능성
자산가치 분석 잠재력 손실
재해위험 재해위험 요인분석(RA) 요인분석(RA)
한계시간/ 비용정의
중요업무 선정
업무영향 업무영향 분석 분석 (BIA) (BIA)
복구용량 복구용량 산정 산정 (RC) (RC)
복구 필요자원 복구 소요시간
환경분석 환경분석 (EA) (EA)
현재 확보자원과 필요자원간 차이산정
분석
현재 확보 자원 분석
중요 업무/관련 중요 자원/자산
단계별 재해복구전략 및 실행계획 수립 (단기/중기/장기)
재해복구 재해복구 전략수립(RS) 전략수립(RS)
복구절차
설계 전산복구 계획수립 테스트
IT IT 재해복구 재해복구 계획서(ITRP) 계획서(ITRP)
솔루션 솔루션 연구/개발 연구/개발 (ESS) (ESS)
구현
솔루션 설계 (기술, 조직, 운영)
유지/관리
비상계획서 비상계획서 수립(BCP) 수립(BCP)
설치 설치 및 및 실행계획 실행계획 (IP) (IP)
비상사태 대비 전사적 업무계획
솔루션 구현 계획
15
Business Resilience & Continuity Services
5) 재해복구시스템 구축-필요성 1 시장 역동성에 의한 비즈니스 모델 변경 - 인프라스트럭쳐 설계의 새로운 전망
IT와 Business간 괴리 전통적 비즈니스 모델 소비자와 기업간 거래
비즈니스 프로세스
비즈니스와 IT간 밀접성 새로운 e비즈니스 모델 소비자와 IT간 거래
비즈니스 프로세스
IT
IT
소비자
기업
소비자
IT
16
요 구 증 가
탄력성 대응성 가용성 보안
Business Resilience & Continuity Services
5) 재해복구시스템 구축-필요성 2 고객의 기대수준은 계속 증대되고 있습니다.
Most Critical Factors to Corporate’ Survival 대 고객서비스/기대 42%
주주이익/만족 2%
대외 이미지 16%
 Immediate Response 비교우위 17%
 Brand Image Evaluation through experience  Customer loyalty is dependent on customer satisfaction
법규준수 12% n = 163
계약의무 조항 11%
Source: Contingency Planning Management (May, 2001)
“웹의 놀라운 발전으로 인하여 귀사의 담당자와 고객은 동시에 문제를 인지합니다. 이제 더 이상의 변명이나 속임수는 통하지 않습니다.” Senior VP of Electronic Brokerage Technology
17
Business Resilience & Continuity Services
5) 재해복구시스템 구축-필요성 3 기타
폭파,테러 인재 2.5% N/W 2.2%
8.3% 5.6% 5.5%
지진
전기공급차단
8.8% 27.3%
18.4%
5.7% 5.5%
H/W 문제 화재
10.1% 태풍
홍수
전기사고
<미국 CPR (Contingency Planning Research)사의 전산재해 분포 통계도> <재해복구계획과 복구 성공 가능성 분석> 100 80 60 40 20 0
무계획
문서화 된 재해복구계획
점검된 재해복구계획 18
테스트된 재해복구계획
유지보수 된 재해복구계획
Business Resilience & Continuity Services
5) 재해복구시스템 구축 전략 재해복구시스템을 구축하기 위해서는 계획, 분석 및 실행의 단계를 거쳐서 이행하여야 하며 업무 분석 및 솔루션 분석을 통한 결과를 바탕으로 최적의 재해 복구시스템을 구축 할 뿐 아니라 향후 복구 방안을 제시함으로써 가장 안정적인 운영이 되도록 지원합니다.
Planning
재해 복구 목표 정의
재해 복구의 일반적인 목표 - RSO - RTO - RPO - RCO 재해 복구 세부 목표 - 장애 발생 최소화 - 최적의 백업센터 구축
Analyzing
업무 및 시스템 분석
Proceeding & Execution
구축 방법론 적용
솔루션 분석
재해복구 시스템 구축
업무 및 시스템 분석 - 업무의 중요도(Impact) - Data의 중요도 - 고객 접점
재해복구시스템 구축 솔루션 선정 - H/W 솔루션
업무에 맞는 솔루션 분석 - 경제적 측면 - 관리적 측면 - 기술적 측면 - Reference
재해복구시스템 복구 방안 - 복구 방안 계획 - 복구 방안 Test 및 보안
- S/W 솔루션
19
재해복구 시스템 복구 방안 제시
Business Resilience & Continuity Services
5) 재해복구시스템 구축-BCP결과에 따른 재해복구솔루션 고객의 환경 및 업무영향 분석을 통하여 고객이 정한 재해복구솔루션의 타당성을 검증하고 보완사항을 작성, 권고하여 최적의 재해복구 전략을 수립합니다. 재해복구전략(Recovery Strategy) 수립
업무영향 분석(BIA) • • • •
• 업무별 복구시간 목표 산정 • 재해 시 업무 우선순위 파악 • 업무 상호간의 연관성 분석
RTO(Recovery Time Objective : 재해복구시간 목표) RPO(Recovery Point Objective : 재해복구시점 목표) RCO(Recovery Communication Objective : 네트워크 복구시간목표) RSO(Recovery Scope Objective : 재해복구범위 목표)
구축방안 별 소요시간
장시간 - 재해 시 추가적인 장비 도입 - 백업데이터 확보 - 부수적인 조정작업
High
②
①
①
시스템 미러링
구축 비용
단시간 - 초기투자 비용 증대 - 재해복구 infra 및 장비도입 - 데이터 실시간 이중화 - N/W 환경 구축
고객의 재해복구전략에 가장 적합한 솔루션 구축(Implementation)
데이터 이중화 거래로그 이중화 주기적 데이터 이중화
②
백업테이프 이용복구
백업테이프 원격지보관
Low Minute
20
시간
Day
Business Resilience & Continuity Services
5) 재해복구시스템 구축-재해복구 적용 솔루션에 대한 형태별 연구 다양한 솔루션구축 경험을 바탕으로 고객 환경에 맞는 최적의 재해복구 솔루션의 구현합니다. • 최소의 비용으로 복구목표시간 부합 • 기존자원 재활용방안 강구 • 전용/공용장비 여부에 따른 비용고려 • 시스템 별 다양한 솔루션 구현 • Multi-vendor 솔루션 구축
투자비용대비 최대효과
최적의 솔루션 제공
다양한 구축경험
CONTINUOUS AVAILABILITY
데 이 터 손 실
IMPROVED AVAILABILITY
HIGH AVAILABILITY
TRADITIONAL RECOVERY
②
SOS
최종 백업 이후 발생 거래
REMOTE DASD
① IRC : Intermittent Remote Copy
REMOTE TAPE
② SOS : Standby Operating System
①
IRC
거래 부분적 손실
③
Electronic ④ Journaling
XRC RR/400 GDPS/XRC 데이터 손실 없음
③ XRC : Extended Remote Copy
PPRC SRDF
④ Electronic Journaling: 거래 로그 이중화
GDPS/PPRC 0 - 1 시간
1 - 6 시간
6 - 24 시간
21
24 - 48 시간
복구시간
Business Resilience & Continuity Services
5) 재해복구시스템 구축-고려 사항 1 RSO : 복구 범위 목표 (Recovery Scope Objective)
y 기간계, 정보계, 대외계, Web, Mail.. y 원격지 단순 데이터 백업, y 재해대비 시스템 복구를 위한 백업
RTO : 재해복구 시간 목표
(Recovery Time Objective)
y 3시간, 12시간, 24시간, 72시간…
RPO : 재해복구 시점목표
y 특정 백업 시점 데이터 복구(백업 솔루션) y 전일 마감 데이터 백업 시점 y 재해발생 시점 데이터 복구(데이터 이중화 솔루션)
(Recovery Point Objective)
RCO : NW복구 시간 목표
(Recovery Communication Objective)
BCO : 백업센터 목표 (Backup Center Objective)
y 네트워크 복구 수준 y 지역 모점, 주요 영업점, 전 영업점, ..
y 자체 2nd 백업센터에 재해복구시스템 구축 y 자체 2nd 백업센터에 전문업체와 재해복구시스템 구축 공조 y 재해복구시스템 구축 전문업체에 위탁
22
Business Resilience & Continuity Services
5) 재해복구시스템 구축-고려 사항 2
재해복구시스템 구축 비용은 시간에 결정됩니다. 전산 재해복구 구축복구 비용은 복구의해 시간에 의해 결정된다. 복구시간이 짧을수록 비용은 증가합니다. 복구시간이 짧을 수록 비용은 증가함
각 업무의 중요도에 따라 복구 시간을 다르게 가져가는 각 업무의 중요도에 따라 복구시간을 다르게 가져가는 것이 전산 재해복구위한 솔루션이다. 효율적인것이 전산좋은 재해복구시스템을 솔루션입니다.
Â만약 모든 업무에 대하여 똑같은 복구시간 목표로 재해복구시스템을 구축한다면, 필요 없는 복구 비용이 증가하게 됩니다. 특정한 중요 업무에 대한 복구 시 위험성이 따르게 됩니다.
23
Business Resilience & Continuity Services
5) 재해복구시스템 구축-고려 사항 3
투자비용을 최소화하며, 향후 확장성 및 활용 방안을
경제성
담보하는 재해복구체제를 구축하여 경제성 극대화
경제성
재해 복구 체제 Compliance
사내x외 감사 및 법적 규제 조항을 준수함으로써, 기업의
Compliance
내부 통제 요건 강화를 통한 건전성과 대외 신뢰도를 제고하는 선진 재해복구 체제 구축
재해복구 전략
주요 비즈니스 프로세스/컴포넌트에 대한 보호를 통해
재해복구전략
비즈니스 연속성을 확보하기 위한 재해복구 목표에 적합한 재해복구체제 구축
24
Business Resilience & Continuity Services
5) 재해복구시스템 구축을 위한 IBM 재해복구서비스
1
BCP BCP 컨설팅 컨설팅 서비스 서비스
2
백업테이프 백업테이프 보관 보관 서비스 서비스
3
재해복구시스템 재해복구시스템 구축 구축 서비스 서비스
4
5
실시간 실시간 거래 거래 로그 로그 이중화 이중화 서비스 서비스
실시간 실시간 데이터 데이터 베이스 베이스 이중화 이중화 서비스 서비스
25
Business Resilience & Continuity Services
5) 재해복구시스템 구축 및 서비스 수행 RR/400 RR/400 솔루션을 솔루션을 이용한 이용한 재해복구시스템 재해복구시스템 구성도 구성도 IBM 재해복구센터
주 전산센터
9406-520 9406-520
Tape device
Tape device MIMIX 솔루션을 이용한 데이터 이중화
E1 * 2
인터넷 회선
Console
Clients
인터넷
5회/주 백업 테이프 소산 지점
26
Business Resilience & Continuity Services
5) 재해복구시스템 구축 및 서비스 수행 IBM IBM 재해복구센터 재해복구센터 운영 운영 개요 개요 IBM 재해복구센터는 운영 지침에 따라 24×365로 유지 관리 되며, 시스템, 네트워크 담당자에 의한 정기적인 운영 현황 보고를 통하여 재해복구센터가 효율성 있 게 운영됩니다. y 시스템 Resource, 상태 주기적 점검
1. 운영현황 보고
y 백업 네트워크 상태 주기적 점검
y 재해복구센터 운영 현황을 보고하고 센터 운영방안 개선과 센터에 관련된 제반 사항을 협의하기 위해 귀사와 재해복구센터 담당자와의 정기적인 회의
y 데이터 동기 상태 주기적 점검 y 운영일지 작성 및 보고
y 필요한 경우 귀사의 요청이나 재해복구센터 담당자의 필요에 의해 비정기적으로 소집이 가능함
심야근무 22:00 ~09:00
오후근무 14:00 ~22:00
오전근무
2. 운영현황 보고 내용 및 협의 내용 24시간 재해대비 y 운영현황보고 내용 재해복구센터 운영에 관련된 통계자료 시스템 가동 시스템 장애 현황
09:00 ~18:00
시스템 변경 현황 운영의 개선사항 등 y 운영현황보고 내용 시스템 및 운영방안 개선에 관련된 내용
y 각 시스템 운영 상태 Monitoring
y 각 시스템 운영 상태 Monitoring
y 센터간 연결 및 네트워크 상태 점검
y 센터간 연결, 네트워크 상태 주기적 점검
전환·복구 절차 변경 및 개선사항
y 운영일지 작성
y 장치 및 설비의 운영상태 점검
재해복구시스템의 발전 방향
y 데이터 Replication 상태 Monitoring
기타 재해복구시스템 운영에 필요한 제반 사항
시스템 변경, 운영절차 변경
27
Business Resilience & Continuity Services
5) 재해복구시스템 구축 및 서비스 수행 재해복구 재해복구 모의훈련 모의훈련 및 및 재해복구 재해복구 조직 조직 재해 시 운영절차를 실제 검증 및 확인함으로써 재해복구체제의 효율성을 제고하고, 모의훈련 숙련화를 통하여 시행착오 및 복구시간의 최소화를 도모합니다.
성공적인 재해복구 운영 주기적인 모의훈련 실시
Stage I 모의훈련 조직
Stage II 모의훈련 절차
Stage III 모의훈련 시나리오
Stage IV 모의훈련 점검사항
모의훈련 모의훈련 조직 조직 구성(안) 구성(안) 모의 모의 훈련 훈련 책임자 책임자
시스템 지원 팀 시스템 복구 지원 데이터베이스 복구지원
재해복구센터 운영팀 절차에 의한 복구수행 재해복구센터 관련기관 통보
28
네트워크 지원 팀 통신망 복구 지원
Business Resilience & Continuity Services
5) 재해복구시스템 구축 및 서비스 수행 재해복구 재해복구 모의훈련 모의훈련 순서도 순서도 및 및 절차 절차 모의훈련을 통하여 재해복구시스템의 검증 및 변경관리가 반드시 이루어져야 합니다. 모의훈련 순서도 및 절차, 준비사항은 다음과 같습니다. . 모의훈련 모의훈련 모의훈련 순서도 순서도 모의훈련 절차 절차 1. 1. 재해복구선포권자가 재해복구선포권자가 정해진 정해진 절차에 절차에 따라 따라 재해 재해 선포 선포 4. 4. 재해복구센터에 재해복구센터에 재해선포 재해선포 통보, 통보, 운영 운영 요원은 요원은 절차에 절차에 따라 따라 테스트 테스트 환경 환경 구성 구성
1.재해선포 1.재해선포 2.재해선포 2.재해선포 통보 통보 3.재해복구 3.재해복구 요원 요원 파견 파견 4.재해복구시스템 4.재해복구시스템 확인 확인
3. 3. 재해복구 재해복구 인원을 인원을 재해복구센터로 재해복구센터로 파견 파견 4. 4. 재해복구센터에 재해복구센터에 도착 도착 후 후 재해복구시스템 재해복구시스템 환경에 환경에 대한 대한 확인 확인 및 및 관련 관련 정보 정보 제공 제공
5. 5. 복구작업 복구작업 실시 실시 6.1 6.1 시스템복구 시스템복구
6.3 6.3 네트워크복구 네트워크복구
5. 5. 재해복구계획서에 재해복구계획서에 정의된 정의된 절차에 절차에 따라 따라 시스템, 시스템, DB, DB, 네트워크 네트워크 복구 복구 6. 복구된 시스템을 이용해 각 업무 담당자들은 담당 DB를 점검, 6. 복구된 시스템을 이용해 각 업무 담당자들은 담당 DB를 점검, 재해복구 재해복구 훈련 훈련 책임자에게 책임자에게 업무재개 업무재개 여부 여부 보고 보고
No
7. 7. 재해복구훈련 재해복구훈련 책임자는 책임자는 훈련 훈련 대상 대상 개별 개별 지점에 지점에 업무재개 업무재개 통보 통보 후 후 테스트 테스트 시작 시작 8. 테스트 완료 후 정상 완료를 확인 8. 테스트 완료 후 정상 완료를 확인
6.2 6.2 DB/FILE복구 DB/FILE복구
7. 7. 정상 정상 복구확인 복구확인
9. 9. 테스트 테스트 시 시 사용한 사용한 네트워크를 네트워크를 복원 복원 시키고, 시키고, 이중화 이중화 재개 재개 후 후 테스트 테스트 종료 종료
Yes
모의훈련 모의훈련 준비사항 준비사항
8. 8. 업무 업무 재개 재개 훈련 훈련 실시 실시
9. 9. 정상종료 정상종료 확인 확인
yy 모의 모의 훈련 훈련 참가 참가 인원 인원 구성 구성 :: 최초 최초 훈련 훈련 시에는 시에는 해당 해당 업무 업무 책임자 책임자 참가 참가 권고. 권고. 이후 훈련부터는 해당 업무 책임자와 백업 인력이 교체로 훈련 투입 권고 이후 훈련부터는 해당 업무 책임자와 백업 인력이 교체로 훈련 투입 권고 yy 훈련 훈련 시나리오 시나리오 작성 작성 :: 재해복구 재해복구 전(全)과정에 전(全)과정에 대한 대한 훈련은 훈련은 불가능하므로 불가능하므로 각 각 훈련에 훈련에 대한 목표, 범위, 일정 등을 정의, 이에 따른 훈련 대한 목표, 범위, 일정 등을 정의, 이에 따른 훈련
No
Yes
yy 관계사 관계사 지원 지원 요청 요청 :: 훈련 훈련 시 시 귀사뿐만 귀사뿐만 아니라 아니라 관계사(제품 관계사(제품 공급사, 공급사, 통신장비 통신장비 업체, 업체, 통신회선 통신회선 업체 업체 등)들의 등)들의 협조가 협조가 필요할 필요할 경우를 경우를 대비 대비 대비 대비 사전에 사전에 협조를 협조를 위한 위한 담당자 담당자 대기 요청 대기 요청
훈련 훈련 완료 완료
29
Business Resilience & Continuity Services
5) 재해복구시스템 구축 및 서비스 수행 재해복구시스템 재해복구시스템 복구 복구 순서도 순서도 재해 발생 시 재해를 선포하고, 재해복구시스템을 RTO 이내에 복구하여 가동합니다. 시간
재해복구센터
주센터 재해발생 및 선포
통보 및 이동
비상사태 접수 및 재해복구시스템 가동 준비
시스템 복구절차
시스템 복구
00: 00
재해복구대상 시스템 구동 복구시간 : 3 시간 소요
DB 및 업무 복구절차
재해복구대상 데이터 복구 DB 및 업무 복구 복구DB 정합성 확인
YES 재해복구 시스템 가동
업무 재개
03: 00
업무 재개
30
네트워크 복구
NO
DB 및 업무NO 복구 재점검
Business Resilience & Continuity Services
5) 재해복구시스템 구축-사례(제조업) 백업테이프를 이용하여 데이터를 복구할 수 있도록 재해복구시스템을 구축한 사례입니다.
RPO
• 데이터 최종 백업 소산 시점
RTO
• 24-48시간
재해복구센터 IBM 재해복구센터
주 센터
서버군
• 원격지에 소산 보관된 백업데이터를 재해복구센터에 운송하여 LOAD 및 복구 작업 실시
적용 솔루션
Backbone switch
• 네트워크 복구방안 › 최소 비용 투자 방안
SAN switch
L4switch
› ADSL 이용한 복구
EMC Disk
VPN
SAP DB
• 재해복구시스템 구축 및 테스트 서비스 • 점진적 재해 시
구축방법/ 환경
TSM
서버군
Cata;yst2950
유통/채널
유통/채널
› VPN을 이용한 복구
› 로그 데이터의 확보방안 강구
SAN switch
백업테이프 보관 서비스
Tape Device
L4switch
IBM Disk SAP DB
TSM
VPN
Tape Device
› RPO의 단축방안 수립 • 급진적 재해 시
전일자 Backup Tape
› 최종 백업 소산시점 이후 데이터 손실 › 거래 데이터 확보방안 필요
31
Cisco 3600
Business Resilience & Continuity Services
5) 재해복구시스템 구축-사례(은행업) 원격지 데이터 이중화 스토리지 솔루션을 적용하여 재해복구시스템을 구축한 사례입니다.
주 센터 RPO
재해발생 직전 시점 -최종 거래로그가 재해복구시스템에 이중화된 시점
RTO
• 3시간
IBM 재해복구센터 채널서버
채널서버
Cisco 6509
Cisco 6509
• SRDF : 기 사용중인 솔루션에 대한 투자 보호를 위한 솔루션 선정
적용 솔루션
• 일일업무 마감 후 데이터 베이스 이중화:Track 단위 백업으로 데이터 불 일치 가능성 이유
DWDM
이중화 대상
• 네트워크 복구 방안: 최소 비용투자방안, VPN을 이용한 복구
VPN
Cisco 7513
Cisco 7206
DWDM
VPN
업무 복구 용 2105 VPN
• 고려사항 : 주기별 데이터 베이스 이중화
구축방법/ 환경
• 실시간 거래로그 이중화 서비스 › 최종 거래로그를 이용 › 데이터 베이스 갱신 솔루션 적용 영업점 영업점
32
영업점 영업점
영업점 영업점
Business Resilience & Continuity Services
5) 재해복구시스템 구축-사례(보험업) 원격지 데이터 이중화 서버 솔루션을 적용하여 재해복구시스템을 구축한 사례입니다.
RPO
주센터
재해발생 직전 시점 -실시간 데이터 베이스 이중화 시점
IBM 재해복구센터
9406-820
RTO
• 3시간
9406-820
Tape device MIMIX를 이용한 데이터 이중화
Tape device
• RR/400(OMS, ODS) • 네트워크 복구방안
적용 솔루션
› 최소비용 투자방안
E1 * 2
› Internet 회선을 이용한 복구 512k 인터넷 회선
Console
Clients
인터넷
• 고려사항 : RR/400솔루션 소프트웨어 필요
구축방법/ 환경
• 재해복구시스템 위탁 서비스 › IBM 재해복구센터 이용
5회/주 백업 테이프 소산
› IBM 재해복구시스템 이용
지점
33
Business Resilience & Continuity Services
5) 재해복구시스템 이용-실 사례 국내 실제 재해복구서비스 이용 사례
IBM 재해복구서비스 계약 고객으로 P社는 최근 입주 건물의 상층에서 발생한 화재로 진화 과정에서 누수가 발생하여 전산시스템 및 사무실 사용 불가로 인한 업무중단의 위기를 맞이하였으나, 기 계약된 재해복구서비스를 이용하여 상황 발생 1일 후 재해복구시스템을 이용한 IT 서비스를 복구함으로써 비즈니스의 지속적인 운영이 가능하였습니다.
화재 발생
화재 진화
누수 발생
Server Group
건물 출입 금지, 전력 공급 중단, 사무실 및 전산시스템 사용 불가
재해복구센터 P사 입주 빌딩 실제 상황 발생 경험으로 인한 교훈 9 백업 시스템 확보를 위한 혼란 상황 방지 9 대체 사무 공간 및 집기류 확보 어려움 예방 9 평상 시 모의 훈련을 통한 복구의 효율화로 재해복구시간 목표 내 업무 재개 9 대체 사무 공간을 이용한 비상업무 수행 기간 동안 주 전산센터의 복구기간이 장기화 될 경우 추가적인 중장기 운영 계획 수립 필요 34
Business Resilience & Continuity Services
3. 재해복구시스템 구축 방안
Q & A.
35
Business Resilience & Continuity Services
3. 재해복구시스템 구축 방안
감사합니다.
BRCS. GTS. IBM-K. 홍 형식.
[email protected]. 011-898-7651
36