dduser

۴ مفهوم کلیدی در آمار برای متخصصان علم داده

آمار، استفاده از ریاضیات برای انجام تجزیه و تحلیل فنی داده ها است. در علم داده استفاده از آمار نقش اساسی در تجزیه داده ها دارد. یک مصورسازی مانند نمودار میله ای ممکن است اطلاعات سطح بالایی به شما بدهد …

۴ مفهوم کلیدی در آمار برای متخصصان علم داده ادامه مطلب »

آمار در علم داده

مبانی ساختار شبکه های عصبی

در قرن اخیر ایجاد هوش مصنوعی به ما امکان ایجاد برنامه های شگفت انگیز را داده است که می تواند توانایی های بهتر از انسان داشته باشد .این امر مهم که یادگیری ماشین نامیده می شود توسط شبکه عصبی انجام می شود، شبکه های عصبی الگوهای موجود در داده های شما را شناسایی کرده و پس از آموزش خواهند توانست با شناسایی الگوهای مشابه در آینده نتایج را پیش بینی کنند. شبکه عصبی مجموعه ای از الگوریتم ها است که تلاش می کند از طریق آموزش از ساختار و عملکرد مغز انسان تقلید کنند. آنها می توانند با تغییر ورودی سازگار شوند و بنابراین این شبکه ها بدون نیاز به طراحی مجدد میتوانند بهترین نتیجه ممکن را پیش بینی کنند.

مثال کاربردی از کاهش ابعاد با تحلیل مولفه اساسی (PCA)

کاهش ابعاد یکی از مباحث زمینه ای پرکاربرد در حوزه علم داده است.
در این مقاله قصد داریم به صورت کاربدی مساله کاهش ابعاد یا (PCA) را بررسی کنیم

بهترین ide پایتون چیست؟

انتخاب بهترین ide پایتون به ویژگی های بسیاری همچون  سرعت، کارایی، قابلیت نصب پکیج ها ، مصرف منابع ، عیب یابی (دیباگ) ، اشکال زدایی، هزینه و امکاناتی چون syntax highlighter،autocomplete و  snippet  بستگی دارد. ویرایشگرهای کد پایتون برای توسعه …

بهترین ide پایتون چیست؟ ادامه مطلب »

پیش پردازش داده ها با پایتون

هسته اصلی یادگیری ماشین پردازش داده ها است. قبل از شروع کار با الگوریتم های یادگیری ماشین داده ها باید آماده شوند تا دقت و خروجی کار بالاتر رود. در این مطلب قصد داریم با یک مثال عملی پیش پردازش …

پیش پردازش داده ها با پایتون ادامه مطلب »

نمونه گیری Oversampling و Undersampling در داده های نامتوازن

در یادگیری ماشین نمونه گیری Undersampling و نمونه گیری Oversampling دو روش هستند که با در برخورد با داده های نامتوازن به کار می روند.می توانید از کلاس اکثریت کم نمونه گیری کنید یا روی کلاس اقلیت را بیش نمونه گیری انجام دهید یا از ترکیب هر دو روش استفاده کنید

پرکردن ،حذف یا جایگزینی داده های گم شده missing value

تقریباً همه مجموعه داده های دنیای واقعی مقادیر از دست رفته missing value دارند، برای حذف، پر کردن یا جایگزینی داده های گم شده شناسایی نوع آن از دست رفتن داده مهم است و این یک مشکل جدی است که …

پرکردن ،حذف یا جایگزینی داده های گم شده missing value ادامه مطلب »

جایگزینی داده های گم شده

نمودارهای پرکاربرد در مصورسازی داده ها

مصور سازی داده نقش بسیار مهمی در فرایند علم داده و یادگیری ماشین دارد. با مصور سازی داده می توان تحلیل های بدست آمده از مراحل مختلف علم داده را برای همه افراد قابل فهم کرد. در این مقاله قصد داریم با بیان مقدمات و اصول مصورسازی داده آن را برای مبتدیان علم داده توضییح دهیم.