Google, IBM & Meta Certificates — All 10,000+ Courses at 40% Off
One annual plan covers every course and certificate on Coursera. 40% off for a limited time.
Get Full Access
В этой 36-минутной конференционной презентации от DevOops Дмитрий Рыбалка рассматривает четыре способа обнаружения сбоев узлов в Kubernetes и стратегии восстановления рабочей нагрузки. Узнайте, как превратить непредсказуемые отказы узлов кластера в управляемые ситуации. Доклад охватывает встроенные механизмы Kubernetes для обнаружения сбоев и способы их улучшения, возможности и кастомизацию Node-problem-detector (NPD), альтернативные решения с их преимуществами и недостатками, а также стратегии планирования размещения нагрузки с учетом доменов отказа для минимизации негативных последствий.