راهنمای کامل مبتدی ها برای تمیز کردن و پیش پردازش دادهها
پاکسازی و پیش پرداز داده ها یکی از مهمترین بخش ها قبل از ساخت مدل می باشد و در این مقاله سعی شده تا اقدامات معمولی که بر روی داده های خام انجام میشود را توضیح دهیم .
پاکسازی و پیش پرداز داده ها یکی از مهمترین بخش ها قبل از ساخت مدل می باشد و در این مقاله سعی شده تا اقدامات معمولی که بر روی داده های خام انجام میشود را توضیح دهیم .
در این پست ما در مورد چگونگی ساختن مدلهای یادگیری ماشین برای پیش بینی مقادیر مفقود شده در داده ها پرداختیم. در ابتدا ما یک مدل رگرسیون خطی آموزش داده شده بر روی ویژگی “امتیاز” برای پیش بینی قیمت نوشیدنی ساختیم. سپس ما یک مدل جنگلی تصادفی راکه بر روی ویژگی “امتیاز” و متغیرهای کیفی آموزش دادیم تا قیمت نوشیدنی را پیش بینی کنیم. ما دیدیم که مدل جنگلهای تصادفی به طور قابل توجهی از مدل مبتنی بر رگرسیون خطی بهتر است.