Visão geral do laboratório

Sua empresa, a UmaEmpresa Consultoria, quer integrar o processamento de linguagem natural (PLN) para extrair frases-chave, entidades e sentimento dos documentos. Ela escolheu o Amazon Comprehend como serviço de PNL para que possam integrar a PNL nas aplicações existentes. Para iniciar o processo de criação de modelos e endpoints para os documentos, você deve criar um modelo de classificação personalizada para identificar documentos com categorias e rótulos.

Neste laboratório, você criará e testará um modelo de classificação personalizada usando o Amazon Comprehend.

Objetivos

Ao final do laboratório, você conseguirá:

Criar um modelo de classificação personalizada usando o Amazon Comprehend.
Fazer uma análise em tempo real com um endpoint de classificação personalizada.

Conhecimentos técnicos necessários

Para concluir este laboratório, você ter familiaridade com a navegação básica do Console de Gerenciamento da AWS e conhecer o Amazon S3.

Duração

O laboratório leva aproximadamente 75 minutos para ser concluído.

Lista de ícones

Vários ícones são usados neste laboratório para chamar a atenção para diferentes tipos de instruções e observações. A lista a seguir explica a finalidade de cada ícone:

Nota: uma sugestão, dica ou orientação importante.
Saiba mais: onde encontrar mais informações.
Atenção: informações de interesse ou importância especial (não tão importantes a ponto de causar problemas com o equipamento ou dados caso você não as veja, mas que podem resultar na necessidade de repetir determinadas etapas).
A considerar: um momento de parar e pensar em como aplicar um conceito no seu ambiente ou iniciar uma conversa sobre o tópico em questão.
Conteúdo do arquivo: um bloco de código que exibe o conteúdo de um script ou arquivo que será necessário executar e que foi pré-criado para você.
Dica: uma dica para uma pergunta ou um desafio.
Resposta: uma resposta para uma pergunta ou um desafio.

Visão geral do ambiente

O diagrama a seguir mostra a arquitetura básica do ambiente do laboratório:

No diagrama anterior, os dados de treinamento são transferidos por upload em um bucket do Amazon S3. O Amazon Comprehend usa os dados de treinamento no bucket para treinar um modelo de classificação personalizada. Quando os documentos são analisados em tempo real usando um endpoint, o modelo treinado classifica o documento.