تحليل استكشافي لبيانات تيتانيك ومعالجة البيانات وتجهيزها لنماذج تعلم الآلة
منذ 16 ساعة
عرض العمل
الوصف
مشروع تحليل بيانات شامل (EDA) على مجموعة بيانات Titanic بهدف فهم العوامل المؤثرة على نجاة الركاب، مع بناء Pipeline متكامل لمعالجة البيانات وتجهيزها لنماذج تعلم الآلة.
تم تحليل توزيع النجاة حسب الفئة الاجتماعية، الجنس، العمر، وميناء الصعود، واكتشاف أن الجنس والفئة من أهم العوامل المؤثرة. كما تم التعامل مع القيم المفقودة (Age, Cabin, Embarked) باستخدام تقنيات مناسبة مثل Median وMode واستخراج معلومات مفيدة من Cabin.
شمل المشروع Feature Engineering بإنشاء متغيرات مثل Title وFamilySize، وتحليل العلاقات بين المتغيرات باستخدام Correlation Matrix. كما تم معالجة القيم الشاذة في Fare باستخدام IQR وLog Transformation.
تم تحويل البيانات إلى شكل رقمي باستخدام Encoding، وتطبيق Feature Scaling لتجهيزها للنماذج. المشروع يعكس فهم قوي لتحليل البيانات وتجهيزها بشكل احترافي قبل مرحلة بناء نماذج ML.
التفاصيل
| المشاهدات | 0 |
| المفضلة | 0 |
| القسم | برمجة, تطوير المواقع و التطبيقات - اخري |
حساب المستخدم
العربية
English