레질리언스(Resilience) Lifecycle Framework 사례 2

오늘날 현대 조직은 점점 더 많은 회복탄력성 관련 문제에 직면해 있습니다. 특히 고객의 기대치가 항상 켜져 있는 방향으로 변화함에 따라 항상 사용 가능한 마음가짐. 원격 팀과 복잡하고 분산된 애플리케이션은 다음과 결합됩니다. 빈번한 릴리스에 대한 필요성이 증가하고 있습니다. 결과적으로 조직과 해당 응용 프로그램에는 다음이 필요합니다. 그 어느 때보다 탄력적입니다.

​AWS는 복원력을 저항하거나 복구할 수 있는 애플리케이션의 능력으로 정의합니다 인프라와 관련된 중단, 종속 서비스, 잘못된 구성 및 일시적인 네트워크 문제, 그러나 원하는 수준의 복원력을 달성하려면 다음과 같은 절충안이 필요한 경우가 많습니다 필수. 운영 복잡성, 엔지니어링 복잡성 및 비용을 평가하고 그에 따라 조정되었습니다.

​AWS는 고객 및 내부 팀과 수년간 협력한 경험을 바탕으로 회복성 학습과 모범 사례를 포착하는 회복성 라이프사이클 프레임워크를 개발했습니다. 이 프레임워크는 다음 다이어그램에 설명된 5가지 핵심 단계를 설명합니다. 각 단계에서 전략, 서비스 및 메커니즘을 사용하여 회복성 자세를 개선할 수 있습니다.

[ AWS Risk Resilience Lifecycle Franework ]

이러한 단계는 이 가이드의 다음 섹션에서 설명합니다.

  • 1단계 : 목표 설정
  • 2단계 : 설계 및 구현
  • 3단계 : 평가 및 테스트
  • 4단계 : 운영
  • 5단계 : 반응하고 배우기

1단계: 목표 설정

​필요한 회복성 수준과 측정 방법을 이해하는 것이 목표 설정 단계의 기초입니다. 목표가 없고 측정할 수 없다면 무언가를 개선하기 어렵습니다.

​모든 애플리케이션에 동일한 수준의 회복성이 필요한 것은 아닙니다. 목표를 설정할 때 올바른 투자와 절충안을 위해 필요한 수준을 고려하여야 합니다. 이에 대한 좋은 비유는 자동차입니다. 자동차에는 타이어가 네 개 있지만 예비 타이어는 하나만 있습니다. 주행 중에 여러 개의 타이어가 펑크날 가능성은 낮고, 여분의 예비 타이어가 있으면 화물 공간이나 연비와 같은 다른 기능을 사용할 수 없으므로 이는 합리적인 절충안 입니다.

목표를 정의한 후에는 이후 단계(2단계 : 설계 및 구허현, 4 단계 : 운영)에서 관찰 가능성 제어를 구현하여 목표가 충족되고 있는지 파악합니다.

2단계: 설계 및 구현

이전 단계에서는 회복성 목표를 설정했습니다. 이제 설계 및 구현 단계에서는 이전 단계에서 설정한 목표에 따라 실패 모드를 예상하고 설계 선택을 식별합니다. 또한 변경 관리 전략을 정의하고 소프트웨어 코드와 인프라 구성을 개발합니다. 다음 섹션에서는 비용, 복잡성, 운영 오버헤드와 같은 균형을 고려하면서 고려해야 할 AWS 모범 사례를 강조합니다.

3단계: 평가 및 테스트

수명 주기의 평가 및 테스트 단계에서 응용 프로그램, 또는 기존 응용 프로그램에 대한 변경 사항은 설계되었지만 아직 릴리스되지 않았습니다. 생산. 이 단계에서는 수행된 사례를 테스트하기 위한 활동을 구현합니다. 이전 단계에서 수행하고 결과를 평가합니다. 응용 프로그램이 여전히 활성 상태일 수 있습니다 개발 또는 기본 개발이 완료되고 응용 프로그램이 진행 중일 수 있습니다. 프로덕션에 릴리스되기 전에 테스트합니다. 이 단계에서는 개발에 집중하고 응용 프로그램이 정의된 값을 충족할 것이라는 기대치를 확인하거나 반박하는 테스트 실행 복원력을 위한 목표. 또한 시스템의 작동을 개발하고 테스트합니다 절차. 2단계에서 개발한 배포 절차는 설계 및 구현 단계를 실행에 옮기고 결과를 평가합니다. 이러한 테스트 및 평가 활동은 수명 주기의 이 부분에서 시작되지만 여기서 끝이 아닙니다. 테스트 및 평가는 단계 4 : 운영으로 이동하면서 계속됩니다.

평가 및 테스트 단계는 배포 전 활동과 배호 후 활동의 두 단계로 나뉩니다. 배포 전 활동은 다음과 같은 작업으로 구성됩니다. 새 환경 배포를 포함하여 응용 프로그램을 어떤 환경에도 배포하기 전에 완료됨 소프트웨어 버전 및 테스트 환경으로의 초기 배포. 배포 후 활동은 소프트웨어가 테스트 또는 생산 환경. 다음 섹션에서는 이러한 단계에 대해 자세히 설명합니다.

4단계: 운영

3단계: 평가 및 테스트를 완료하면 애플리케이션을 프로덕션에 배포할 준비가 됩니다. 운영 단계에서는 애플리케이션을 프로덕션에 배포하고 고객 경험을 관리합니다. 애플리케이션의 설계 및 구현은 많은 복원력 결과를 결정하지만, 이 단계에서는 시스템에서 복원력을 유지하고 개선하는 데 사용하는 운영 관행에 중점을 둡니다. 운영 우수성 문화를 구축하면 이러한 관행에서 표준과 일관성을 만드는 데 도움이 됩니다.

5단계: 반응하고 배우기

애플리케이션이 중단 이벤트에 대응하는 방식은 신뢰성에 영향을 미칩니다. 경험에서 배우고 애플리케이션이 과거에 중단에 대응한 방식도 신뢰성을 개선하는 데 중요합니다.

​대응 및 학습 단계는 애플리케이션에서 중단 이벤트에 더 잘 대응하기 위해 구현할 수 있는 관행에 중점을 둡니다. 또한 운영 팀과 엔지니어의 경험에서 최대한 많은 학습을 추출하는 데 도움이 되는 관행도 포함됩니다.

​출처 : AWS Web, “AWs 규범적 지침” 일부 내용 발췌

** AWS : Amazone Web Service

​Mail ; 3rlab@naver.com


코멘트

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다