Questo corso copre parte della fase di preparazione dei dati del ciclo di vita del machine learning (ML). In questo corso, imparerai le strategie di convalida dei dati, comprese le strategie per la mitigazione dei bias e la sicurezza dei dati. Esaminerai anche alcuni servizi Amazon Web Services (AWS) che possono supportarti nella convalida dei dati, tra cui AWS Glue DataBrew e AWS Glue Data Quality. Scoprirai inoltre le fasi finali della preparazione e della configurazione dei dati, come la suddivisione, il rimescolamento, l'arricchimento e la configurazione dei set di dati da caricare nella tua risorsa di addestramento dei modelli.
- Livello del corso: avanzato
- Durata: 45 minuti
AttivitÃ
- Materiali online
- Una dimostrazione
- Domande di verifica delle conoscenze
- Una valutazione del corso
Obiettivi del corso
- Spiegare l'importanza di garantire l'integrità dei dati.
- Identificare le metriche fondamentali sui bias precedenti all'addestramento.
- Descrivere le strategie per risolvere il problema dello squilibrio di classe nei set di dati.
- Descrivere i servizi AWS chiave per la convalida della qualità dei dati.
- Usare gli strumenti AWS per identificare e mitigare le fonti di bias nei dati.
- Descrivere le tecniche per utilizzare i servizi AWS per crittografare i dati.
- Identificare le implicazioni dei requisiti di conformità .
- Descrivere il valore e la tecnica di suddivisione, rimescolamento e arricchimento dei set di dati.
- Identificare i formati di dati utilizzati nell'addestramento dei modelli.
- Identificare gli strumenti e i servizi AWS per la configurazione dei dati di addestramento dei modelli.
- Descrivere come configurare i dati per caricarli in una risorsa di addestramento dei modelli.
Destinatari principali
- Architetti cloud
- Machine learning engineer
Competenze consigliate
- Almeno 1 anno di esperienza nell'uso di Amazon SageMaker e altri servizi AWS nell'ambito dell'ingegneria di ML.
- Almeno 1 anno di esperienza in un ruolo correlato, ad esempio come sviluppatore di software back-end, sviluppatore DevOps, data engineer o data scientist.
- Avere una comprensione dei concetti fondamentali dei linguaggi di programmazione come Python.
- Corsi precedenti nel piano formativo AWS ML Engineer Associate
Programma del corso
Sezione 1: Introduzione
- Lezione 1: Come utilizzare questo corso
- Lezione 2: Panoramica del corso
- Lezione 3: Fondamenti di convalida dei dati
Sezione 2: Convalida dei dati
- Lezione 4: Risolvere lo squilibrio di classe
- Lezione 5: Strumenti e servizi AWS per la convalida dei dati e la mitigazione dei bias
- Lezione 6: Identificazione e mitigazione dei bias con Amazon SageMaker Clarify
- Lezione 7: Sicurezza e conformità dei dati
Sezione 3: Passaggi finali della preparazione dei dati
- Lezione 8: Suddivisione, rimescolamento e arricchimento dei set di dati
- Lezione 9: Configurazione dei dati per l'addestramento dei modelli
Sezione 4: Conclusione
- Lezione 10: Riepilogo del corso
- Lezione 11: Valutazione
- Lezione 12: Contattaci
Parole chiave
- IA generativa
- IA generativa