خانه » علم داده

علم داده

پیش بینی مقادیر مفقود شده با رگرسیون خطی و جنگل تصادفی در پایتون

در این پست ما در مورد چگونگی ساختن مدلهای یادگیری ماشین برای پیش بینی مقادیر مفقود شده در داده ها پرداختیم. در ابتدا ما یک مدل رگرسیون خطی آموزش داده شده بر روی ویژگی “امتیاز” برای پیش بینی قیمت نوشیدنی ساختیم. سپس ما یک مدل جنگلی تصادفی راکه بر روی ویژگی “امتیاز” و متغیرهای کیفی آموزش دادیم تا قیمت نوشیدنی را پیش بینی کنیم. ما دیدیم که مدل جنگلهای تصادفی به طور قابل توجهی از مدل مبتنی بر رگرسیون خطی بهتر است.

نمودارهای پرکاربرد در مصورسازی داده ها

مصور سازی داده نقش بسیار مهمی در فرایند علم داده و یادگیری ماشین دارد. با مصور سازی داده می توان تحلیل های بدست آمده از مراحل مختلف علم داده را برای همه افراد قابل فهم کرد. در این مقاله قصد داریم با بیان مقدمات و اصول مصورسازی داده آن را برای مبتدیان علم داده توضییح دهیم.

به بالای صفحه بردن