تنظيف البيانات وتصورها باستخدام لغة بايثون
الوصف
الأدوات والتقنيات المستخدمة:
تم استخدام لغة Python كلغة رئيسية لإجراء التحليل. كما تم الاعتماد على مكتبة Pandas لمعالجة البيانات، بما يشمل قراءة الملف، تعديل القيم، والتعامل مع القيم المفقودة. واُستخدمت مكتبة NumPy لدعم العمليات الحسابية. أما في جانب التصور البياني، فقد تم استخدام Matplotlib لإنشاء الرسوم الأساسية، وSeaborn لإنتاج رسوم بيانية أكثر احترافية وسهولة في الفهم.
خطوات تنظيف البيانات:
بدأت العملية بتحميل البيانات من ملف Excel، ثم فحصها لاكتشاف القيم المفقودة (Missing Values). بعد ذلك تم التعامل مع هذه القيم من خلال تعويض القيم المفقودة في عمود الأسعار باستخدام المتوسط الحسابي (Mean)، مع حذف الصفوف التي تحتوي على قيم ناقصة في الأعمدة المهمة. كما تم حذف الأعمدة غير الضرورية مثل عمود ID، والتأكد في النهاية من أن البيانات أصبحت نظيفة وجاهزة للاستخدام.
المخرجات المتوقعة:
النتيجة النهائية هي بيانات نظيفة يمكن الاعتماد عليها في التحليل أو في بناء نماذج تعلم آلي. بالإضافة إلى ذلك، تم إنتاج مجموعة من الرسوم البيانية التي توضح توزيع الأسعار، والعلاقات بين المتغيرات المختلفة، إلى جانب الكشف عن أي أنماط أو اتجاهات مهمة داخل البيانات، مما يساعد على فهم العوامل المؤثرة على أسعار المنازل بشكل أوضح.
البائع
معلومات
العربية
English