داده کاوی و تجزیه و تحلیل آماری

مثال کاربردی طبقه بندی داده ها با پایتون

آموزش, پروژه, داده کاوی و تجزیه و تحلیل آماری, مفاهیم پیشرفته, یادگیری ماشین

به طور کلی به مساله هایی که در داده های آن یک ستون کلاس وجود داشته باشد طبقه بندی می گویند. این ستون توسط شخصی که داده را آنالیز می کند مشخص می شود به همین دلیل در داده کاوی …

مثال کاربردی طبقه بندی داده ها با پایتون ادامه مطلب »

نوامبر 19 2022

طراحی یک سیستم توصیه گر فیلم بر روی مجموعه داده MovieLens

آموزش, آموزش تصویری و گام به گام, پروژه, پیش پردازش داده ها, داده کاوی و تجزیه و تحلیل آماری, کاربرد در صنعت, مفاهیم پیشرفته, یادگیری ماشین

استفاده از سیستم های توصیه گر هر روز در حال افزایش است .دراین مقاله قصد داریم یک سیستم توصیه گر ساده بر روی مجموعه داده سایت MovieLens طراحی کنیم.

نوامبر 10 2022

مقایسه زبان python و R برای کار در حوزره علم داده

آموزش, داده کاوی و تجزیه و تحلیل آماری, مفاهیم پایه علم داده

یکی از دلهره آورترین تصمیماتی که برنامه نویسان هنگام گرفتن یک پروژه جدید می گیرند انتخاب زبان برنامه نویسی مناسب است. Python و R بدون شک در هنگام انتخاب یک زبان برنامه نویسی برای یک پروژه علم داده (Data Science …

مقایسه زبان python و R برای کار در حوزره علم داده ادامه مطلب »

ژوئن 17 2022

تفاوت مهندس داده و دانشمند داده

داده کاوی و تجزیه و تحلیل آماری, مفاهیم پایه علم داده, مقالات

مهندس داده و دانشمند داده دوتا از پرمخاطب ترین شغل های حوزه علم داده هستند. ولی تفاوت این شغل ها برای بسیاری مبهم و نامشخص است. در این مطلب قصد داریم این دو شغل را بررسی کینم و تفاوت آن ها با هم مقایسه کنیم.

ژوئن 9 2022

۵ نکته ای که باید در مورد کلان داده یا Big Data بدانید

آموزش, پیش پردازش داده ها, داده کاوی و تجزیه و تحلیل آماری, کلان داده, مفاهیم پایه علم داده

کلان داده یا بیگ دیتا زمینه است که هر روز در حال افزایش است. به همین جهت دانستن مفاهیم و الزامات این حوزه ضروری بنظر می رسد. در این مقاله قصد داریم ۵ نکته مهم در زمینه بیگ دیتا را با هم بررسی کنیم.

ژوئن 1 2022

رگرسیون خطی

ابزار های علم داده, داده کاوی و تجزیه و تحلیل آماری, دسته‌بندی نشده, یادگیری ماشین

تحلیل رگرسیون از مجموعه ای از روش های یادگیری ماشین تشکیل شده است که برای پیش بینی یک مقدار پیوسته از مدل های رگرسیون استفاده می شود. پیش بینی قیمت های خانه با توجه به ویژگی های خانه مانند اندازه ، قیمت و غیره یکی از نمونه های متداول رگرسیون است. این یک تکنیک با نظارت است. رگرسیون خطی یکی از ساده ترین الگوریتم های یادگیری با نظارت در مجموعه ابزارها می باشد که دو نوع ساده و چند گانه دارد.

مه 12 2022

6 الگوریتم خوشه بندی (clustering) که متخصصین علم داده باید بدانند

داده کاوی و تجزیه و تحلیل آماری, مفاهیم پایه علم داده

خوشه بندی یکی از بخش های هوش منصوعی است که شامل گروه بندی نقاط داده می شود. با توجه به مجموعه ای از نقاط داده ، می توان از یک الگوریتم خوشه بندی برای طبقه بندی هر نقطه داده به …

6 الگوریتم خوشه بندی (clustering) که متخصصین علم داده باید بدانند ادامه مطلب »

مه 9 2022

درخت تصمیم

داده کاوی و تجزیه و تحلیل آماری, یادگیری ماشین

درخت تصمیم یکی از معروف ترین الگوریتم های یادگیری ماشین می باشد که بر یک منطقه وسیع از یادگیری ماشین تاثیر گذاشته است و هم در مسائل طبقه بندی و هم در مسائل رگرسیون کاربرد دارد و همان طور که از نام آن پیداس از الگوی تصمیم گیری درخت مانند استفاده می کند. درخت تصمیم یکی از تفسیر پذیرترین مدل ها در یادگیری ماشین می باشد و در پایتون با استفاده از scikit-learn میتواند آن را به راحتی پیاده سازی کرد.

مه 1 2022

کاهش ابعاد با استفاده از انتخاب ویژگی

ابزار های علم داده, پیش پردازش داده ها, داده کاوی و تجزیه و تحلیل آماری, دسته‌بندی نشده, یادگیری ماشین

انتخاب ویژگی ها و کاهش ابعاد به ما این امکان را می دهد تعداد ویژگی های یک مجموعه داده را فقط با حفظ ویژگی های مهم به حداقل برسانیم. مزایای مختلفی در انجام انتخاب ویژگی و کاهش ابعاد وجود دارد که شامل تفسیرپذیری مدل، به حداقل رساندن بیش از حد مناسب و همچنین کاهش اندازه مجموعه train و در نتیجه زمان train است.

فوریه 13 2022

تجزیه و تحلیل مشتریان مبتنی بر مدل RFM

آموزش, پروژه, پیش پردازش داده ها, داده کاوی و تجزیه و تحلیل آماری, کاربرد در صنعت, مفاهیم پیشرفته, یادگیری ماشین

مدل RFM یک روش محبوب و کارا برای تجزیه و تحلیل مشتریان است. در این روش از ۳ معیار اخرین خرید مشتری، تعداد دفعات خرید و مبلغ خرید استفاده می شود. با استفاده از این معیار ها مدل RFM طراحی می شود. با روش های مصور سازی داده اطلاعات بدست آمده از مدل نمایش داده می شود.

آوریل 22 2021