Maximiser l'Utilisation des Ressources GPU pour l'IA Générative dans un Environnement OpenStack et Kubernetes (Français)
OpenInfra Foundation via YouTube
Get 20% off all career paths from fullstack to AI
Master Windows Internals - Kernel Programming, Debugging & Architecture
Overview
Google, IBM & Meta Certificates — All 10,000+ Courses at 40% Off
One annual plan covers every course and certificate on Coursera. 40% off for a limited time.
Get Full Access
Découvrez dans cette présentation en français de l'OpenInfra Day France 2024 comment optimiser l'utilisation des ressources GPU pour l'intelligence artificielle générative dans les environnements OpenStack et Kubernetes. Explorez les différentes stratégies et technologies permettant d'améliorer l'efficacité des GPU pour les tâches de calcul complexes, notamment les mécanismes de concurrence NVIDIA vGPU, CUDA streams, Time-slicing, CUDA Multi-Process Service, NVIDIA Multi-instance GPU (MIG) et AMD SR-IOV. Apprenez à adapter l'accélération GPU selon les besoins spécifiques de chaque charge de travail, qu'il s'agisse d'inférence ou d'entraînement de modèles d'IA, tout en réduisant les coûts opérationnels. Obtenez des conseils pratiques pour configurer et optimiser vos déploiements d'IA générative, présentés par Erwan Gallen de Red Hat.
Syllabus
Maximiser l'utilisation des ressources GPU pour l'IA générative (Français)
Taught by
OpenInfra Foundation