Visão geral do laboratório
A AnyCompany Consulting recebeu dados do grupo de advocacia sem fins lucrativos e preparou o conjunto de dados para treinamento. Como o data scientist da AnyCompany Consulting, agora você precisa treinar o modelo de machine learning (ML) e avaliar os resultados. Como o atributo de rótulo que você está tentando prever está em uma classificação binária (menos de USD 50 mil ou não), você precisa escolher um algoritmo de ML que funcione em problemas de classificação binária. Para isso, você configurará e treinará um modelo baseado no XGBoost integrado ao SageMaker e, em seguida, avaliará a eficiência de previsão do modelo.
Você também precisa explorar um cenário mais personalizado. Para isso, você configurará um modelo personalizado criado no framework XGBoost. Ao executar o XGBoost como um framework dentro do SageMaker, você tem mais flexibilidade e acesso a cenários mais avançados, como validação cruzada k-fold, porque pode personalizar seus próprios scripts de treinamento.
Objetivos
Ao final deste laboratório, você deverá ser capaz de fazer o seguinte:
- Treinar um modelo usando algoritmos integrados ao SageMaker.
- Entender como escrever um código personalizado de treinamento e inferência e usar frameworks comuns de ML mantidos pela AWS.
- Entender como importar bibliotecas e dependências personalizadas para treinar seu modelo.
- Entender como configurar um trabalho de ajuste de hiperparâmetros no SageMaker.
Lista de ícones
Vários ícones são usados neste laboratório para chamar a atenção para diferentes tipos de instruções e observações. A lista a seguir explica a finalidade de cada ícone:
- Atenção: informações de interesse ou importância especial (não tão importantes a ponto de causar problemas com o equipamento ou dados caso você não as veja, mas que podem resultar na necessidade de repetir determinadas etapas).
- Aviso: uma ação irreversível com potencial para causar falha em um comando ou processo (inclusive avisos sobre configurações que não possam ser alteradas após serem feitas).
- Para obter mais informações: onde encontrar mais informações.
- Observação: uma sugestão, dica ou orientação importante.
- Tarefa concluída: uma conclusão ou resumo no laboratório.