المقدمة
التعلم المعزز (RL) هو نهج قوي يمكن الوكلاء من تعلم السلوكيات المثلى من خلال التفاعل مع البيئة. تقدم هذه الدورة مبادئ التعلم الواقعي، بما في ذلك المكافآت، والسياسات، ووظائف القيمة. سيدرس المشاركون خوارزميات التعلم المعزز الشهيرة ويفهمون كيف يتم تطبيقها في الروبوتات والألعاب وأنظمة اتخاذ القرار. تمارين البرمجة العملية ستساعد في ترسيخ المفاهيم الأساسية. بحلول النهاية، سيكون المتعلمون مستعدين لاستكشاف تقنيات التعلم المعزز المتقدمة.
أهداف الدورة
- تعلم مصطلحات ومكونات التعلم المعزز
- فهم الاستكشاف مقابل الاستغلال
- دراسة خوارزميات التعلم المعزز الرئيسية
- بناء وكلاء التعلم المعزز البسيط
- استكشف تطبيقات التعلم المعزز في العالم الحقيقي
الفئة المستهدفة
- المتعلمون المتوسطون في الذكاء الاصطناعي
- مهندسو التعلم الآلي يوسعون مهاراتهم
- باحثون مهتمون بالأنظمة الذاتية الاستقلال
- طلاب الروبوتات
- المطورون الباحثون عن مواضيع متقدمة في الذكاء الاصطناعي
المنهاج
- 5 Sections
- 0 Lessons
- 5 أيام
Expand all sectionsCollapse all sections
- اليوم الأول: أساسيات RL• الوكلاء والبيئات• الدولة، العمل، المكافأة• عمليات اتخاذ القرار في ماركوف• المهام العرضية مقابل المهام المستمرة• التجربة العملية: بيئة التعلم الواقعي الأساسية0
- اليوم الثاني: الطرق القائمة على القيمة• دوال القيمة• معادلات بيلمان• البرمجة الديناميكية• التعلم بالفرق الزمني• التطبيق العملي: تنفيذ التعلم العملي0
- اليوم الثالث: الأساليب القائمة على السياسات• السياسات والتدرجات• خوارزمية REINFORCE• المزايا والقيود• السياسات العشوائية مقابل الحتمية• التطبيق العملي: مثال على تدرج السياسات0
- اليوم الرابع: التعلم العميق لتعزيز الجميع• شبكات Q العميقة (DQNs)• إعادة التجربة• الشبكات المستهدفة• تحديات الاستقرار• التجربة العملية: بناء وكيل DQN0
- اليوم الخامس: التطبيقات والاتجاهات• التحكم في الحركة الروبوتية• وكلاء اللعب• أنظمة متعددة الوكلاء• اعتبارات السلامة• مشروع مصغر لمشروع Capstone RL0







