راهنمای کامل مبتدی ها برای تمیز کردن و پیش پردازش دادهها
پاکسازی و پیش پرداز داده ها یکی از مهمترین بخش ها قبل از ساخت مدل می باشد و در این مقاله سعی شده تا اقدامات معمولی که بر روی داده های خام انجام میشود را توضیح دهیم .
پاکسازی و پیش پرداز داده ها یکی از مهمترین بخش ها قبل از ساخت مدل می باشد و در این مقاله سعی شده تا اقدامات معمولی که بر روی داده های خام انجام میشود را توضیح دهیم .
مصور سازی داده نقش بسیار مهمی در فرایند علم داده و یادگیری ماشین دارد. با مصور سازی داده می توان تحلیل های بدست آمده از مراحل مختلف علم داده را برای همه افراد قابل فهم کرد. در این مقاله قصد داریم با بیان مقدمات و اصول مصورسازی داده آن را برای مبتدیان علم داده توضییح دهیم.
به طور کلی به مساله هایی که در داده های آن یک ستون کلاس وجود داشته باشد طبقه بندی می گویند. این ستون توسط شخصی که داده را آنالیز می کند مشخص می شود به همین دلیل در داده کاوی …
استفاده از سیستم های توصیه گر هر روز در حال افزایش است .دراین مقاله قصد داریم یک سیستم توصیه گر ساده بر روی مجموعه داده سایت MovieLens طراحی کنیم.
در این مطلب قصد داریم به زبانی ساده ماتریس درهم ریختگی یا Confusion Matrix را توضییح دهیم. یادگیری این ماتریس برای ارزیابی مدل یادگیری ماشین ضروری است.
یکی از دلهره آورترین تصمیماتی که برنامه نویسان هنگام گرفتن یک پروژه جدید می گیرند انتخاب زبان برنامه نویسی مناسب است. Python و R بدون شک در هنگام انتخاب یک زبان برنامه نویسی برای یک پروژه علم داده (Data Science …
مقایسه زبان python و R برای کار در حوزره علم داده ادامه مطلب »
کلان داده یا بیگ دیتا زمینه است که هر روز در حال افزایش است. به همین جهت دانستن مفاهیم و الزامات این حوزه ضروری بنظر می رسد. در این مقاله قصد داریم ۵ نکته مهم در زمینه بیگ دیتا را با هم بررسی کنیم.
نصب vim در ویندوز Vim یک ویرایشگر کد قدرتمند است. آنقدر قدرتمند که به صورت پیش فرض بر روی سیستم عامل های Linux و Mac نصب شده است. اما اگر از ویندوز به عنوان سیستم عامل خود استفاده می کنید …
در دنیای امروز بیشتر افراد به شبکه های اجتماعی اعتیاد پیدا کرده اند. همچنین ، می دانیم که تقریباً هر سیستمی که افراد در آن تعامل داشته باشند ، می تواند به عنوان یک شبکه اجتماعی دسته بندی شود.شبکه های …
مدل RFM یک روش محبوب و کارا برای تجزیه و تحلیل مشتریان است. در این روش از ۳ معیار اخرین خرید مشتری، تعداد دفعات خرید و مبلغ خرید استفاده می شود. با استفاده از این معیار ها مدل RFM طراحی می شود. با روش های مصور سازی داده اطلاعات بدست آمده از مدل نمایش داده می شود.