استكشاف وتنظيف وتصفية بيانات 'titanic dataset' سفينة تيتانيك

منذ أسبوع

عرض العمل

الوصف

يتضمن المشروع استكشاف البيانات (891 صف و12 عمود) وتحليل القيم المفقودة، حيث تم التعامل مع البيانات الناقصة في الأعمدة المختلفة باستخدام Median و Mode، مع حذف الأعمدة غير المفيدة مثل Cabin.
خطوات العمل
1- استيراد واستكشاف البيانات
2- تنظيف البيانات ومعالجة القيم المفقودة
3- هندسة واستحداث الميزات (Feature Engineering)
4-تصفية البيانات (Data Filtering)

تم تنفيذ خطوات Data Cleaning كاملة لضمان جودة البيانات، بالإضافة إلى Feature Engineering مثل إنشاء عمود لحجم العائلة (FamilySize) وتحديد ما إذا كان الراكب يسافر بمفرده (IsAlone)، واستخراج الألقاب (Title) من الأسماء ومعالجتها.
كما يشمل المشروع عمليات تصفية البيانات (Filtering) لاستخراج معلومات محددة مثل ركاب الدرجة الأولى أو فئات عمرية معينة.

المشروع يوضح مهارات قوية في:
Data Cleaning – Data Preprocessing – Feature Engineering باستخدام Pandas و NumPy.


التفاصيل

المشاهدات 0
المفضلة 0
القسم برمجة, تطوير المواقع و التطبيقات - اخري

حساب المستخدم

Powered By Brmja Tech

All rights reserved © kaf 2026