Questo corso copre parte della fase di preparazione dei dati del ciclo di vita del machine learning (ML).Â
In questo corso verrà trattata la trasformazione dei dati. Questo corso illustra vari concetti e tecnicheÂ
di trasformazione, come la pulizia dei dati, la codifica e l'ingegneria delle caratteristiche. Scoprirai come utilizzare i servizi Amazon Web Services (AWS) come Amazon SageMaker Feature Store, Amazon SageMaker Data Wrangler e AWS Glue per trasformare i dati.
- Livello del corso: avanzato
- Durata: 60 minuti
AttivitÃ
- Materiali online
- Una dimostrazione
- Domande di verifica delle conoscenze
- Una valutazione del corso
Obiettivi del corso
- Spiegare il valore della pulizia e della trasformazione dei dati.
- Descrivere come elaborare dati errati o duplicati.
- Descrivere come rilevare e gestire i valori anomali.
- Descrivere come elaborare i valori mancanti.
- Descrivere le tecniche di codifica fondamentali.
- Identificare i casi d'uso dell'ingegneria delle caratteristiche.
- Descrivere i concetti, i vantaggi e le tecniche fondamentali dell'ingegneria delle caratteristiche.
- Descrivere le tecniche fondamentali di selezione delle caratteristiche.
- Descrivere i servizi AWS per la convalida e l'etichettatura dei dati.
- Identificare gli strumenti e i servizi AWS per la visualizzazione e la trasformazione dei dati.
- Descrivere come acquisire dati e gestire le caratteristiche utilizzando SageMaker Feature Store.
- Descrivere come acquisire e trasformare i dati utilizzando Amazon SageMaker Data Wrangler.
- Descrivere come trasformare i dati utilizzando AWS Glue.
- Identificare gli strumenti e i servizi AWS per la trasformazione dei dati in streaming.
- Descrivere come trasformare i dati in streaming utilizzando AWS Lambda e Apache Spark su Amazon EMR.
Destinatari principali
- Architetti cloud
- Ingegneri di machine learning
Competenze consigliate
- Almeno 1 anno di esperienza nell'uso di Amazon SageMaker e altri servizi AWS nell'ambito dell'ingegneria di ML.Â
- Almeno 1 anno di esperienza in un ruolo correlato, ad esempio come sviluppatore di software back-end, sviluppatore DevOps, data engineer o data scientist.Â
- Avere una comprensione dei concetti fondamentali dei linguaggi di programmazione come Python.
- Corsi precedenti nel piano formativo AWS ML Engineer Associate.
Programma del corso
- Sezione 1: Introduzione
- Lezione 1: Come utilizzare questo corso
- Lezione 2: Panoramica del corso
- Lezione 3: Fondamenti della trasformazione dei dati
- Sezione 2: Tecniche di pulizia dei dati
- Lezione 4: Dati errati e duplicati
- Lezione 5: Valori anomali nei dati
- Lezione 6: Dati incompleti o mancanti
- Sezione 3: Tecniche di codifica categoriale
- Lezione 7: Codifica categoriale
- Lezione 8: Tecniche di codifica 
- Sezione 4: Ingegneria delle caratteristiche
- Lezione 9: Concetti di ingegneria delle caratteristiche
- Lezione 10: Ingegneria delle caratteristiche numeriche
- Lezione 11: Ingegneria delle caratteristiche testuali
- Lezione 12: Tecniche di selezione delle caratteristiche
- Sezione 5: Strumenti e servizi AWS per la trasformazione dei dati
- Lezione 13: Etichettatura dei dati con AWS
- Lezione 14: Acquisizione dati con AWS
- Lezione 15: Trasformazione dei dati con AWS
- Lezione 16: Trasformazione dei dati utilizzando AWS Glue
- Sezione 6: Conclusione
- Lezione 17: Riepilogo del corso
- Lezione 18: Valutazione
- Lezione 19: Contattaci