Questo corso copre parte della fase di preparazione dei dati del ciclo di vita del machine learning (ML). In questo corso, imparerai concetti fondamentali come la distinzione fra diversi tipi di dati e fra dati efficaci e poco efficaci e la loro visualizzazione e analisi. Scoprirai alcuni dei principali servizi di storage Amazon Web Services (AWS) utilizzati durante il processo di machine learning, come Amazon Simple Storage Service (Amazon S3). Questo corso spiega come scegliere il tipo di storage AWS e il formato di dati più efficaci in base alle specifiche esigenze di machine learning. Infine, otterrai ulteriori informazioni su alcuni servizi AWS che agevolano l'acquisizione, l'estrazione e l'unione dei dati, come Amazon Kinesis.
- Livello del corso: avanzato
- Durata: 60 minuti
AttivitÃ
- Materiali online
- Una dimostrazione
- Domande sulla verifica delle conoscenze
- Una valutazione del corso
Obiettivi del corso
- Descrivere i fondamenti della raccolta dei dati.
- Definire i formati dei dati e i meccanismi di acquisizione.
- Descrivere diversi metodi per la visualizzazione dei dati.
- Descrivere le opzioni di storage AWS per la raccolta dei dati di ML, inclusi casi d'uso e compromessi.
- Scegliere il tipo di storage più efficace in base a costi, prestazioni e struttura dei dati.
- Scegliere il formato di dati appropriato per un'attività di ML in base ai pattern di accesso ai dati.
- Descrivere le origini dati di streaming AWS per l'acquisizione dei dati.
- Estrarre dati dai servizi di storage AWS utilizzando quelli che facilitano il trasferimento dei dati.
- Descrivere come unire dati provenienti da più origini.
- Identificare la causa dei problemi di acquisizione e archiviazione dei dati che coinvolgono capacità e scalabilità .
Destinatari principali
- Cloud architect
- Machine learning engineer
Competenze consigliate
- Almeno 1 anno di esperienza nell'uso di Amazon SageMaker e altri servizi AWS nell'ambito dell'ingegneria di ML.
- Almeno 1 anno di esperienza in un ruolo correlato, ad esempio come sviluppatore di software back-end, sviluppatore DevOps, data engineer o data scientist.
- Avere una comprensione dei fondamenti dei linguaggi di programmazione come Python.
- Corsi precedenti nel piano formativo AWS ML Engineer Associate.
Programma del corso
- Sezione 1: Introduzione
- Lezione 1: Come utilizzare questo corso
- Lezione 2: Introduzione al dominio 1
- Lezione 3: Panoramica del corso
- Lezione 4: Fondamenti di raccolta dei dati
- Sezione 2: Raccolta dei dati
- Lezione 5: Tipi di dati
- Lezione 6: Visualizzazione e analisi esplorativa dei dati
- Sezione 3: Origini dati e servizi AWS
- Lezione 7: Opzioni di storage AWS
- Lezione 8: Scelta del sistema di archiviazione
- Sezione 4: Acquisizione, estrazione e unione dei dati
- Lezione 9: Acquisizione dei dati
- Lezione 10: Estrazione dei dati
- Lezione 11: Unione dei dati
- Lezione 12: Risoluzione dei problemi di acquisizione e archiviazione dei dati
- Sezione 5: Conclusione
- Lezione 13: Riepilogo del corso
- Lezione 14: Valutazione
- Lezione 15: Contattaci
Parole chiave
- IA generativa
- IA generativa