Visão geral do laboratório

Sua empresa, a UmaEmpresa Consultoria, quer integrar o processamento de linguagem natural (PLN) para extrair frases-chave, entidades e sentimento dos documentos. Ela escolheu o Amazon Comprehend como serviço de PNL para que possam integrar o PNL nas aplicações existentes. Para iniciar o processo de criação de modelos e endpoints para seus documentos, você deve criar um modelo personalizado de reconhecimento de entidades para identificar termos específicos em uma coleção de documentos.

Neste laboratório, você criará e testará um modelo personalizado de reconhecimento de entidades usando o Amazon Comprehend.

Objetivos

Ao final do laboratório, você conseguirá:

Criar um modelo personalizado de reconhecimento de entidades usando o Amazon Comprehend.
Fazer uma análise em tempo real com um endpoint de reconhecimento de entidades personalizado.

Pré-requisitos de conhecimento técnico (opcional)

Para concluir este laboratório, você deve ter familiaridade com a navegação básica do Console de Gerenciamento da AWS e conhecer o Amazon S3.

Duração

O laboratório leva aproximadamente 60 minutos para ser concluído.

Lista de ícones

Vários ícones são usados neste laboratório para chamar a atenção para diferentes tipos de instruções e observações. A lista a seguir explica a finalidade de cada ícone:

Nota: uma sugestão, dica ou orientação importante.
Saiba mais: onde encontrar mais informações.
Atenção: informações de interesse ou importância especial (não tão importantes a ponto de causar problemas com o equipamento ou dados caso você não as veja, mas que podem resultar na necessidade de repetir determinadas etapas).
A considerar: um momento de parar e pensar em como aplicar um conceito no seu ambiente ou iniciar uma conversa sobre o tópico em questão.
Conteúdo do arquivo: um bloco de código que exibe o conteúdo de um script ou arquivo que será necessário executar e que foi pré-criado para você.

Ambiente de laboratório

O diagrama a seguir mostra a arquitetura básica do ambiente do laboratório:

No diagrama anterior, os dados de treinamento são transferidos por upload em um bucket do Amazon S3. O Amazon Comprehend usa os dados de treinamento no bucket para treinar um modelo personalizado de reconhecimento de entidades. Quando os documentos são analisados em tempo real usando um endpoint, o modelo treinado encontra todas as entidades no documento.