Visão geral do laboratório
Sua empresa, a UmaEmpresa Consultoria, quer integrar o processamento de linguagem natural (PLN) para extrair frases-chave, entidades e sentimento dos documentos. Ela escolheu o Amazon Comprehend como serviço de PNL para que possam integrar o PNL nas aplicações existentes. Para iniciar o processo de criação de modelos e endpoints para seus documentos, você deve criar um modelo personalizado de reconhecimento de entidades para identificar termos específicos em uma coleção de documentos.
Neste laboratório, você criará e testará um modelo personalizado de reconhecimento de entidades usando o Amazon Comprehend.
Objetivos
Ao final do laboratório, você conseguirá:
- Criar um modelo personalizado de reconhecimento de entidades usando o Amazon Comprehend.
- Fazer uma análise em tempo real com um endpoint de reconhecimento de entidades personalizado.
Pré-requisitos de conhecimento técnico (opcional)
Para concluir este laboratório, você deve ter familiaridade com a navegação básica do Console de Gerenciamento da AWS e conhecer o Amazon S3.
Duração
O laboratório leva aproximadamente 60 minutos para ser concluído.
Lista de ícones
Vários ícones são usados neste laboratório para chamar a atenção para diferentes tipos de instruções e observações. A lista a seguir explica a finalidade de cada ícone:
- Nota: uma sugestão, dica ou orientação importante.
- Saiba mais: onde encontrar mais informações.
- Atenção: informações de interesse ou importância especial (não tão importantes a ponto de causar problemas com o equipamento ou dados caso você não as veja, mas que podem resultar na necessidade de repetir determinadas etapas).
- A considerar: um momento de parar e pensar em como aplicar um conceito no seu ambiente ou iniciar uma conversa sobre o tópico em questão.
- Conteúdo do arquivo: um bloco de código que exibe o conteúdo de um script ou arquivo que será necessário executar e que foi pré-criado para você.
Ambiente de laboratório
O diagrama a seguir mostra a arquitetura básica do ambiente do laboratório:
No diagrama anterior, os dados de treinamento são transferidos por upload em um bucket do Amazon S3. O Amazon Comprehend usa os dados de treinamento no bucket para treinar um modelo personalizado de reconhecimento de entidades. Quando os documentos são analisados em tempo real usando um endpoint, o modelo treinado encontra todas as entidades no documento.