دسته بندی موضوعی

کلان داده
هوش مصنوعی
داده کاوی
پیش پردازش و تحلیل
هوش تجاری و استراتژی
مصورسازی داده ها
برچسب‌ها
Pandas - پانداز (2) آشنایی با کتابخانه scikit Learn (1) آموزش نصب پایتون در ابونتو و فدورا (1) آموزش نصب پایتون در لینوکس (1) آموزش نصب پایتون در مک (1) آموزش نصب پایتون در ویندوز (1) اجرای پایتون در اندروید و ios (1) اجرای پایتون در موبایل و تبلت (1) استخدام دیتا ساینس (1) الگوریتم های بدون نظارت در Scikit-Learn (1) الگوریتم های یادگیری نظارت شده در scikit learn (1) انتخاب ide برای پایتون (2) انواع نمونه برداری (1) بیش نمونه گیری (1) تبدیل مجموعه داده - Dataset transformations (1) تجزیه تحلیل داده ها (2) تحلیل احساسات متن با پایتون (1) تحلیل رفتار (1) تحلیل مشتریان (1) داده های مفقود شده (1) داده های گم شده (2) داده های گم شده در پایتون (2) داده های گم شده در پیش پردازش (1) رفتار مصرف کننده (1) روش های نمونه گیری در پایتون (1) رگرسیون(Regression) (1) طبقه بندی(Classification) (1) علم داده (2) مجموعه داده (1) مجموعه داده های موجود در سایکیت لرن (1) مصور سازی داده ها (1) نصب pycharm در ویندوز (1) نمودار میله ای یا Bar Plots (2) نمودارهای دایره ای (پای) (2) نمودار هیستوگرام (2) نمودار پراکندگی Scatter (2) نمونه برداری Oversampling (1) نمونه برداری Undersampling (1) نمونه گیری داده های نامتوازن (1) ویژوال استودیو (1) ٰژوپیتر نوت بوک (2) پایتون (1) پای چارم (3) پایچارم (2) یادگیری با نظارت (1)

تجزیه و تحلیل مشتریان مبتنی بر مدل RFM

مدل RFM یک روش محبوب و کارا برای تجزیه و تحلیل مشتریان است. در این روش از ۳ معیار اخرین خرید مشتری، تعداد دفعات خرید و مبلغ خرید استفاده می شود. با استفاده از این معیار ها مدل RFM طراحی می شود. با روش های مصور سازی داده اطلاعات بدست آمده از مدل نمایش داده می شود.

ادامه ی مطلب »
ارزیابی مدل

ارزیابی مدل

ما در مورد روشهای مختلف بررسی عملکرد مدل یادگیری ماشین یا یادگیری عمیق و چگونگی استفاده از یکی به جای دیگری بحث خواهیم کرد. در مورد اصطلاحاتی مانند: accuracy- precisioc- recall-ROC وغیره.

ادامه ی مطلب »

پیش بینی مقادیر مفقود شده با رگرسیون خطی و جنگل تصادفی در پایتون

در این پست ما در مورد چگونگی ساختن مدلهای یادگیری ماشین برای پیش بینی مقادیر مفقود شده در داده ها پرداختیم. در ابتدا ما یک مدل رگرسیون خطی آموزش داده شده بر روی ویژگی “امتیاز” برای پیش بینی قیمت نوشیدنی ساختیم. سپس ما یک مدل جنگلی تصادفی راکه بر روی ویژگی “امتیاز” و متغیرهای کیفی آموزش دادیم تا قیمت نوشیدنی را پیش بینی کنیم. ما دیدیم که مدل جنگلهای تصادفی به طور قابل توجهی از مدل مبتنی بر رگرسیون خطی بهتر است.

ادامه ی مطلب »
به بالای صفحه بردن