داده کاوی و تجزیه و تحلیل آماری

Data Mining به کاربرد آمار در قالب تجزیه و تحلیل داده های اکتشافی و مدل های پیش بینی کننده برای یافتن الگوها و روند داده ها از داده های موجود استفاده می شود.
داده کاوی عموما توسط شرکتها برای تبدیل داده های خام به اطلاعات مفید استفاده می شود.با جستجوی الگوهای در دسته های بزرگ از داده ها ، مشاغل می توانند در مورد مشتریان خود اطلاعات بیشتری کسب کنند تا استراتژی های بازاریابی مؤثرتری را توسعه دهند ، فروش را افزایش دهند و هزینه های خود را کاهش دهند.
مشاغل مرتبط: دانشمند داده ، تحلیلگر تجارت ، آمارشناس

پیش بینی مقادیر مفقود شده با رگرسیون خطی و جنگل تصادفی در پایتون

در این پست ما در مورد چگونگی ساختن مدلهای یادگیری ماشین برای پیش بینی مقادیر مفقود شده در داده ها پرداختیم. در ابتدا ما یک مدل رگرسیون خطی آموزش داده شده بر روی ویژگی “امتیاز” برای پیش بینی قیمت نوشیدنی ساختیم. سپس ما یک مدل جنگلی تصادفی راکه بر روی ویژگی “امتیاز” و متغیرهای کیفی آموزش دادیم تا قیمت نوشیدنی را پیش بینی کنیم. ما دیدیم که مدل جنگلهای تصادفی به طور قابل توجهی از مدل مبتنی بر رگرسیون خطی بهتر است.

اموزش عملی ماشین بردار پشتیبان(SVM) با پایتون

یکی از الگوریتم های طبقه بندی داده ها الگوریتم SVM یا ماشین برداز پشتیبان است. در این مطلب با این الگپریتم اشنا می شویم و با یک مثال عملی آن را پیاده سازی می کنیم.

طراحی خزنده وب با پایتون

جمع آوری داده شروع و پایه کار علم داده است. روش های سنتی زیادی برای بدست آوردن داده ها وجود دارد. اینرنت به عنوان غنی ترین بستر ذخیر و نگهداری داده محل مناسبی برای جمع آوری اطلاعات است. در این مطلب قصد داریم نحوه جمع آوری و ذخیره داده ها از وب(خزنده وب) را اموزش دهیم.

چگونه با استفاده از بهینه سازها ، شبکه عصبی را سریعتر آموزش دهیم؟

بهینه سازی الگوریتم های یادگیری ماشین بهینه سازی (Optimization) فرآیندی برای جستجوی پارامترهایی است که توابع ما را به حداقل یا حداکثر می رساند. وقتی مدل یادگیری ماشین را آموزش می دهیم ، معمولاً از بهینه سازی غیرمستقیم استفاده می …

چگونه با استفاده از بهینه سازها ، شبکه عصبی را سریعتر آموزش دهیم؟ ادامه مطلب »

بهینه ساز شبکه عصبی

۴ مفهوم کلیدی در آمار برای متخصصان علم داده

آمار، استفاده از ریاضیات برای انجام تجزیه و تحلیل فنی داده ها است. در علم داده استفاده از آمار نقش اساسی در تجزیه داده ها دارد. یک مصورسازی مانند نمودار میله ای ممکن است اطلاعات سطح بالایی به شما بدهد …

۴ مفهوم کلیدی در آمار برای متخصصان علم داده ادامه مطلب »

آمار در علم داده

مثال کاربردی از کاهش ابعاد با تحلیل مولفه اساسی (PCA)

کاهش ابعاد یکی از مباحث زمینه ای پرکاربرد در حوزه علم داده است.
در این مقاله قصد داریم به صورت کاربدی مساله کاهش ابعاد یا (PCA) را بررسی کنیم

نمونه گیری Oversampling و Undersampling در داده های نامتوازن

در یادگیری ماشین نمونه گیری Undersampling و نمونه گیری Oversampling دو روش هستند که با در برخورد با داده های نامتوازن به کار می روند.می توانید از کلاس اکثریت کم نمونه گیری کنید یا روی کلاس اقلیت را بیش نمونه گیری انجام دهید یا از ترکیب هر دو روش استفاده کنید

تحلیل احساسات با پایتون

تحلیل احساسات یکی از موضوعات مهم در دنیای علم داده است. اینکه صاحبان مشاغل بفهمند مشتریان چه نظری در مورد خدمات آن ها دارند از در روند تصمیم گیری مدیران بسیار تاثیر گذار است. در این مطلب قصد داریم یک مثال کاربردی از تحلیل احساسات کاربران با زبان پایتون را آموزش دهیم.

تحلیل احساسات با python
به بالای صفحه بردن