تقييم الذكاء الاصطناعي وقياس المقارنة

المقدمة

تقييم نماذج الذكاء الاصطناعي بشكل صحيح أمر بالغ الأهمية لضمان أدائها بشكل موثوق وآمن. تغطي هذه الدورة مقاييس التقييم، وممارسات المقارنة المرجعية، وتقنيات مقارنة النماذج لمجموعة واسعة من تطبيقات الذكاء الاصطناعي. سيتعلم المشاركون كيفية تصميم اختبارات ذات معنى وتفسير النتائج بشكل صحيح. تسلط دراسات الحالة الواقعية الضوء على تحديات مثل انحراف مجموعة البيانات والتحيز. بحلول النهاية، سيكون المتعلمون مستعدين لتقييم أنظمة الذكاء الاصطناعي بثقة.

أهداف الدورة

فهم مقاييس التقييم عبر المهام
تعلم منهجية المقارنة الصحيحة
مقارنة أداء النموذج بدقة
تحديد المخاطر الشائعة في التقييم
قم بأداء تمارين المقارنة الشاملة من البداية إلى النهاية

الفئة المستهدفة

مهندسو التعلم الآلي
علماء البيانات
باحثو الذكاء الاصطناعي
مهندسو ضمان الجودة/الاختبار
تقييم نموذج التعلم للطلاب

المنهاج

5 Sections
0 Lessons
5 أيام

Expand all sectionsCollapse all sections

اليوم الأول: أسس التقييم
• لماذا التقييم مهم• أنواع المقاييس• الأداء مقابل المتانة• تقسيمات مجموعات البيانات• تجربة عملية: عرض تقييم أساسي
0
اليوم الثاني: مقاييس التصنيف والانحدار
• الدقة، الدقة، الاستدعاء• منحنيات ROC• RMSE، MAE• تفسير مصفوفة الالتباس• التجربة العملية: تقييم نماذج التصنيف
0
اليوم الثالث: مقاييس معالجة اللغة الطبيعية والرؤية
• بلو، روج، حيرة• IoU، FID، PSNR• التقييمات البشرية• تقييم تعدد المهام• التجربة العملية: تقييم نماذج معالجة اللغة الطبيعية/الرؤية البصرية
0
اليوم الرابع: ممارسات المقارنة المرجعية
• مجموعات البيانات القياسية• دراسات الاستئصال• مقارنات الأساس• اختبار نوبات التوزيع• التجربة العملية: تشغيل مجموعة اختبارات الأداء
0
اليوم الخامس: مواضيع التقييم المتقدم
• تقييم العدالة والتحيز• الصلابة والاختبارات العدائية• المراقبة أثناء الإنتاج• قيود المعايير• مشروع تقييم التخرج
0