خانه » پیش پردازش داده ها

پیش پردازش داده ها

تجزیه و تحلیل مشتریان مبتنی بر مدل RFM

مدل RFM یک روش محبوب و کارا برای تجزیه و تحلیل مشتریان است. در این روش از ۳ معیار اخرین خرید مشتری، تعداد دفعات خرید و مبلغ خرید استفاده می شود. با استفاده از این معیار ها مدل RFM طراحی می شود. با روش های مصور سازی داده اطلاعات بدست آمده از مدل نمایش داده می شود.

پیش بینی مقادیر مفقود شده با رگرسیون خطی و جنگل تصادفی در پایتون

در این پست ما در مورد چگونگی ساختن مدلهای یادگیری ماشین برای پیش بینی مقادیر مفقود شده در داده ها پرداختیم. در ابتدا ما یک مدل رگرسیون خطی آموزش داده شده بر روی ویژگی “امتیاز” برای پیش بینی قیمت نوشیدنی ساختیم. سپس ما یک مدل جنگلی تصادفی راکه بر روی ویژگی “امتیاز” و متغیرهای کیفی آموزش دادیم تا قیمت نوشیدنی را پیش بینی کنیم. ما دیدیم که مدل جنگلهای تصادفی به طور قابل توجهی از مدل مبتنی بر رگرسیون خطی بهتر است.

پیش پردازش داده ها با پایتون

هسته اصلی یادگیری ماشین پردازش داده ها است. قبل از شروع کار با الگوریتم های یادگیری ماشین داده ها باید آماده شوند تا دقت و خروجی کار بالاتر رود. در این مطلب قصد داریم با یک مثال عملی پیش پردازش …

پیش پردازش داده ها با پایتون ادامه مطلب »

نمونه گیری Oversampling و Undersampling در داده های نامتوازن

در یادگیری ماشین نمونه گیری Undersampling و نمونه گیری Oversampling دو روش هستند که با در برخورد با داده های نامتوازن به کار می روند.می توانید از کلاس اکثریت کم نمونه گیری کنید یا روی کلاس اقلیت را بیش نمونه گیری انجام دهید یا از ترکیب هر دو روش استفاده کنید

پرکردن ،حذف یا جایگزینی داده های گم شده missing value

تقریباً همه مجموعه داده های دنیای واقعی مقادیر از دست رفته missing value دارند، برای حذف، پر کردن یا جایگزینی داده های گم شده شناسایی نوع آن از دست رفتن داده مهم است و این یک مشکل جدی است که …

پرکردن ،حذف یا جایگزینی داده های گم شده missing value ادامه مطلب »

جایگزینی داده های گم شده
به بالای صفحه بردن