실습 개요

AnyCompany Consulting은 비영리 변호 단체의 데이터를 수신하고, 훈련을 위한 데이터세트를 준비했습니다. AnyCompany Consulting의 데이터 과학자는 이제 기계 학습(ML) 모델을 훈련시키고 결과를 평가해야 합니다. 예측하려는 레이블 특성이 바이너리 분류이므로($50,000보다 작거나 그렇지 않음), 바이너리 분류 문제에 효과가 있을 수 있는 ML 알고리즘을 선택해야 합니다. 이를 위해 SageMaker의 기본 제공 XGBoost를 기반으로 모델을 구성하고 훈련한 다음 모델의 예측 효율성을 평가합니다.

또한 보다 맞춤화된 시나리오를 탐색해야 합니다. 이를 위해 XGBoost 프레임워크에 구축된 사용자 지정 모델을 구성해야 합니다. SageMaker 내에서 XGBoost를 프레임워크로 실행하면 자신만의 훈련 스크립트를 사용자 지정할 수 있으므로 유연성이 향상되고 K-폴드 교차 검증과 같은 고급 시나리오에 액세스할 수 있습니다.

목표

이 실습을 마치면 다음을 수행할 수 있습니다.

기본 제공 SageMaker 알고리즘을 사용하여 모델을 훈련합니다.
AWS에서 유지 관리하는 일반적인 ML 프레임워크를 계속 사용하면서 사용자 지정 훈련 및 추론 코드를 작성하는 방법을 이해합니다.
사용자 지정 라이브러리 및 종속성을 가져와서 모델을 훈련하는 방법을 이해합니다.
SageMaker에서 하이퍼파라미터 튜닝 작업을 설정하는 방법을 이해합니다.

아이콘 키

이 실습에서는 다양한 유형의 지침 및 참고 사항에 대한 주의를 환기하기 위해 다양한 아이콘이 사용됩니다. 각 아이콘의 목적은 다음과 같습니다.

주의: 특별한 관심이 필요한 중요한 정보입니다(놓쳤다고 해도 장비 또는 데이터에 문제가 발생할 정도로 중요하지는 않지만 특정 단계를 반복해야 할 수 있음).
경고: 철회할 수 없으며 명령 또는 프로세스의 실패에 영향을 줄 수 있는 작업입니다(설정 후 변경할 수 없는 구성에 대한 경고 포함).
자세히 알아보기: 자세한 정보를 찾을 수 있는 위치를 나타냅니다.
참고: 힌트, 팁 또는 중요한 가이드입니다.
태스크 완료: 실습의 결론 또는 요점입니다.