تغطي هذه الدورة جزءًا من مرحلة إعداد البيانات في دورة حياة التعلم الآلي (ML). في هذه الدورة، ستتعرف على استراتيجيات التحقق من صحة البيانات، بما في ذلك استراتيجيات الحد من التحيز وتأمين البيانات. ستراجع أيضًا بعض خدمات Amazon Web Services (AWS) التي يمكن أن تساعد في التحقق من صحة البيانات، بما في ذلكAWS Glue DataBrew وAWS Glue Data Quality. ستتعرف أيضًا على الخطوات النهائية لإعداد البيانات وتكوينها، مثل تقسيم مجموعة البيانات، وخلطها، وزيادتها، وتكوينها لتحميلها في مورد تدريب النموذج.
- مستوى الدورة: متقدم
- المدة: 45 دقيقة
الأنشطة
- المواد عبر الإنترنت
- عرض توضيحي
- أسئلة التحقق من المعرفة
- تقييم الدورة
أهداف الدورة التدريبية
- شرح أهمية ضمان سلامة البيانات.
- تحديد مقاييس التحيز الأساسية قبل التدريب.
- وصف الاستراتيجيات لمعالجة عدم توازن الفئات ضمن مجموعات البيانات.
- وصف خدمات AWS الأساسية للتحقق من جودة البيانات.
- استخدام أدوات AWS لتحديد مصادر التحيز في البيانات والحد منها.
- وصف تقنيات استخدام خدمات AWS لتشفير البيانات.
- تحديد الآثار المترتبة على متطلبات امتثال البيانات.
- وصف قيمة وتقنية تقسيم مجموعات البيانات وخلطها وزيادتها.
- التعرف على تنسيقات البيانات المستخدمة في تدريب النماذج.
- تحديد أدوات وخدمات AWS لتكوين بيانات تدريب النماذج.
- وصف كيفية تكوين البيانات لتحميلها في مورد تدريب نماذج.
الجمهور المستهدف
- مهندسو السحابات
- مهندسو التعلم الآلي
المهارات الموصى بها
- خبرة لا تقل عن سنة واحدة في استخدام Amazon SageMaker وخدمات AWS الأخرى لهندسة ML.
- خبرة لا تقل عن سنة واحدة في دور ذي صلة مثل مطور برامج الواجهة الخلفية أو مطور DevOps أو مهندس البيانات أو عالم البيانات.
- فهم أساسي للغات البرمجة مثل Python.
- الحصول على دورات سابقة في خطة التعلم AWS ML Engineer Associate.
مخطط الدورة التدريبية
القسم 1: مقدمة
- الدرس 1: كيفية الاستفادة من هذه الدورة التدريبية
- الدرس 2: نظرة عامة على الدورة التدريبية
- الدرس 3: أساسيات التحقق من صحة البيانات
القسم 2: التحقق من صحة البيانات
- الدرس 4: معالجة عدم البيانات
- الدرس 5: أدوات وخدمات AWS للتحقق من صحة البيانات والحد من التحيز
- الدرس 6: تحديد التحيز والحد منه باستخدام Amazon SageMaker Clarify
- الدرس 7: أمان البيانات والامتثال
القسم 3: الخطوات النهائية لإعداد البيانات
- الدرس 8: تقسيم مجموعة البيانات وخلطها وزيادتها
- الدرس 9: تكوين البيانات للتدريب على النمذجة
القسم 4: الخاتمة
- الدرس 10: ملخص الدورة
- الدرس 11: التقييم
- الدرس 12: اتصل بنا
الكلمات المفتاحية
- الذكاء الاصطناعي المولّد
- الذكاء الاصطناعي المولّد