Visão geral do laboratório
Sua empresa, a UmaEmpresa Consultoria, quer integrar o processamento de linguagem natural (PLN) para extrair frases-chave, entidades e sentimento dos documentos. Ela escolheu o Amazon Comprehend como serviço de PNL para que possam integrar a PNL nas aplicações existentes. Para iniciar o processo de criação de modelos e endpoints para os documentos, você deve criar um modelo de classificação personalizada para identificar documentos com categorias e rótulos.
Neste laboratório, você criará e testará um modelo de classificação personalizada usando o Amazon Comprehend.
Objetivos
Ao final do laboratório, você conseguirá:
- Criar um modelo de classificação personalizada usando o Amazon Comprehend.
- Fazer uma análise em tempo real com um endpoint de classificação personalizada.
Conhecimentos técnicos necessários
Para concluir este laboratório, você ter familiaridade com a navegação básica do Console de Gerenciamento da AWS e conhecer o Amazon S3.
Duração
O laboratório leva aproximadamente 75 minutos para ser concluído.
Lista de ícones
Vários ícones são usados neste laboratório para chamar a atenção para diferentes tipos de instruções e observações. A lista a seguir explica a finalidade de cada ícone:
- Nota: uma sugestão, dica ou orientação importante.
- Saiba mais: onde encontrar mais informações.
- Atenção: informações de interesse ou importância especial (não tão importantes a ponto de causar problemas com o equipamento ou dados caso você não as veja, mas que podem resultar na necessidade de repetir determinadas etapas).
- A considerar: um momento de parar e pensar em como aplicar um conceito no seu ambiente ou iniciar uma conversa sobre o tópico em questão.
- Conteúdo do arquivo: um bloco de código que exibe o conteúdo de um script ou arquivo que será necessário executar e que foi pré-criado para você.
- Dica: uma dica para uma pergunta ou um desafio.
- Resposta: uma resposta para uma pergunta ou um desafio.
Visão geral do ambiente
O diagrama a seguir mostra a arquitetura básica do ambiente do laboratório:
No diagrama anterior, os dados de treinamento são transferidos por upload em um bucket do Amazon S3. O Amazon Comprehend usa os dados de treinamento no bucket para treinar um modelo de classificação personalizada. Quando os documentos são analisados em tempo real usando um endpoint, o modelo treinado classifica o documento.