المقدمة
يجمع الذكاء الاصطناعي متعدد الوسائط بين المعلومات من النصوص والصور والصوت وأنواع البيانات الأخرى لإنشاء أنظمة ذات فهم أعمق. تقدم هذه الدورة البنى متعددة الوسائط الأساسية، وتقنيات الاندماج، واستراتيجيات التدريب. سيتعلم المشاركون كيف تدمج نماذج مثل CLIP ومحولات لغة الرؤية عدة طرق. من خلال التمارين العملية، سيبني المتعلمون تطبيقات متعددة الوسائط صغيرة. بحلول النهاية، سيكون الحضور مستعدين لاستكشاف أبحاث متقدمة متعددة الوسائط في الذكاء الاصطناعي.
أهداف الدورة
- فهم مفاهيم التعلم متعدد الوسائط
- استكشف تقنيات الاندماج لدمج أنواع البيانات
- تعلم البنى الرئيسية للنماذج متعددة الوسائط
- تطبيق أطر العمل متعددة الوسائط على المهام العملية
- دراسة التطبيقات متعددة الوسائط في العالم الحقيقي
الفئة المستهدفة
- ممارسو التعلم العميق
- باحثو التعلم الآلي
- مطورو فيجن ومعالجة اللغة الطبيعية
- طلاب الذكاء الاصطناعي المتقدم
- فرق الابتكار التي تبني منتجات متعددة الوسائط
المنهاج
- 5 Sections
- 0 Lessons
- 5 أيام
Expand all sectionsCollapse all sections
- اليوم الأول: أساسيات الوسائط المتعددة• أنواع الأنماط• الاندماج المبكر مقابل المتأخر• مساحات التضمين• تحديات المحاذاة• التجربة العملية: استكشاف مجموعات البيانات متعددة الوسائط0
- اليوم الثاني: نماذج الرؤية واللغة• مفاهيم CLIP• الانتباه المتقاطع• استرجاع النص والصورة• مبادئ التدريب• التجربة العملية: استخدم نموذج الرؤية واللغة0
- اليوم الثالث: دمج الصوت مع الكلام• التضمينات الصوتية• خطوط التعرف على الكلام• أنظمة الصوت-نص• تحديات متعددة الوسائط• التجربة: عرض صوتي-نصي0
- اليوم الرابع: المتحولون المتعددون الوسائط• المحولات الموحدة• الانتباه متعدد الوسائط• التعلم بنظام الطلقة الصفرية• التعلم التحويلي• التجربة العملية: بناء مصنف متعدد الوسائط0
- اليوم الخامس: التطبيقات والابتكارات• التقنيات المساعدة• توليد المحتوى• الروبوتات• أنظمة الواقع المعزز والواقع الافتراضي متعددة الوسائط• مشروع التخرج0







