تحليل وتنظيف بيانات "تيتانيك" والتنبؤ بالنجاة باستخدام تعلم الآلة
منذ يوم
عرض العمل
الوصف
مشروع شامل لتحليل البيانات وتطبيق نماذج التصنيف على مجموعة بيانات تيتانيك
المهام التي تم تنفيذها :
استكشاف البيانات :
تحليل هيكل البيانات وتحديد أنواع المتغيرات.
تحديد المشاكل في البيانات مثل وجود قيم مفقودة ونسبة كل منها، وتحديد القيم الشاذة.
رسم مخططات بيانية لفهم العلاقة بين المتغيرات وعلاقتها بمعدل النجاة.
تنظيف ومعالجة البيانات:
معالجة القيم المفقودة.
حذف الأعمدة غير المؤثرة.
معالجة القيم الشاذة: تم تطبيق أسلوب تحديد القيم الشاذة على أعمدة الأجرة بالنسبة لكل درجة تذكرة لتجنب تأثير القيم المتطرفة على دقة النموذج.
هندسة المميزات :
إنشاء ميزة جديدة باسم "حجم العائلة".
تحويل الميزات الفئوية إلى صيغة رقمية.
تقسيم البيانات وقياس الارتباط:
تقسيم البيانات إلى 70% تدريب و 30% اختبار.
عرض خريطة حرارية لإظهار قوة العلاقة بين الميزات واستهداف "النجاة"، حيث أظهرت الأجرة أعلى ارتباط بالهدف.
النتيجة النهائية:
تم تجهيز البيانات بالكامل لتكون جاهزة للتنبؤ بدقة بفرصة نجاة راكب جديد بناءً على خصائصه.
التفاصيل
| المشاهدات | 0 |
| المفضلة | 0 |
| القسم | أمور اخرى |
حساب المستخدم
العربية
English