أساسيات التعلم المعزز

المقدمة

التعلم المعزز (RL) هو نهج قوي يمكن الوكلاء من تعلم السلوكيات المثلى من خلال التفاعل مع البيئة. تقدم هذه الدورة مبادئ التعلم الواقعي، بما في ذلك المكافآت، والسياسات، ووظائف القيمة. سيدرس المشاركون خوارزميات التعلم المعزز الشهيرة ويفهمون كيف يتم تطبيقها في الروبوتات والألعاب وأنظمة اتخاذ القرار. تمارين البرمجة العملية ستساعد في ترسيخ المفاهيم الأساسية. بحلول النهاية، سيكون المتعلمون مستعدين لاستكشاف تقنيات التعلم المعزز المتقدمة.

أهداف الدورة

تعلم مصطلحات ومكونات التعلم المعزز
فهم الاستكشاف مقابل الاستغلال
دراسة خوارزميات التعلم المعزز الرئيسية
بناء وكلاء التعلم المعزز البسيط
استكشف تطبيقات التعلم المعزز في العالم الحقيقي

الفئة المستهدفة

المتعلمون المتوسطون في الذكاء الاصطناعي
مهندسو التعلم الآلي يوسعون مهاراتهم
باحثون مهتمون بالأنظمة الذاتية الاستقلال
طلاب الروبوتات
المطورون الباحثون عن مواضيع متقدمة في الذكاء الاصطناعي

المنهاج

5 Sections
0 Lessons
5 أيام

Expand all sectionsCollapse all sections

اليوم الأول: أساسيات RL
• الوكلاء والبيئات• الدولة، العمل، المكافأة• عمليات اتخاذ القرار في ماركوف• المهام العرضية مقابل المهام المستمرة• التجربة العملية: بيئة التعلم الواقعي الأساسية
0
اليوم الثاني: الطرق القائمة على القيمة
• دوال القيمة• معادلات بيلمان• البرمجة الديناميكية• التعلم بالفرق الزمني• التطبيق العملي: تنفيذ التعلم العملي
0
اليوم الثالث: الأساليب القائمة على السياسات
• السياسات والتدرجات• خوارزمية REINFORCE• المزايا والقيود• السياسات العشوائية مقابل الحتمية• التطبيق العملي: مثال على تدرج السياسات
0
اليوم الرابع: التعلم العميق لتعزيز الجميع
• شبكات Q العميقة (DQNs)• إعادة التجربة• الشبكات المستهدفة• تحديات الاستقرار• التجربة العملية: بناء وكيل DQN
0
اليوم الخامس: التطبيقات والاتجاهات
• التحكم في الحركة الروبوتية• وكلاء اللعب• أنظمة متعددة الوكلاء• اعتبارات السلامة• مشروع مصغر لمشروع Capstone RL
0