۴ مفهوم کلیدی در آمار برای متخصصان علم داده
آمار، استفاده از ریاضیات برای انجام تجزیه و تحلیل فنی داده ها است. در علم داده استفاده از آمار نقش اساسی در تجزیه داده ها دارد. یک مصورسازی مانند نمودار میله ای ممکن است اطلاعات سطح بالایی به شما بدهد …
آمار، استفاده از ریاضیات برای انجام تجزیه و تحلیل فنی داده ها است. در علم داده استفاده از آمار نقش اساسی در تجزیه داده ها دارد. یک مصورسازی مانند نمودار میله ای ممکن است اطلاعات سطح بالایی به شما بدهد …
در قرن اخیر ایجاد هوش مصنوعی به ما امکان ایجاد برنامه های شگفت انگیز را داده است که می تواند توانایی های بهتر از انسان داشته باشد .این امر مهم که یادگیری ماشین نامیده می شود توسط شبکه عصبی انجام می شود، شبکه های عصبی الگوهای موجود در داده های شما را شناسایی کرده و پس از آموزش خواهند توانست با شناسایی الگوهای مشابه در آینده نتایج را پیش بینی کنند. شبکه عصبی مجموعه ای از الگوریتم ها است که تلاش می کند از طریق آموزش از ساختار و عملکرد مغز انسان تقلید کنند. آنها می توانند با تغییر ورودی سازگار شوند و بنابراین این شبکه ها بدون نیاز به طراحی مجدد میتوانند بهترین نتیجه ممکن را پیش بینی کنند.
کاهش ابعاد یکی از مباحث زمینه ای پرکاربرد در حوزه علم داده است.
در این مقاله قصد داریم به صورت کاربدی مساله کاهش ابعاد یا (PCA) را بررسی کنیم
انتخاب بهترین ide پایتون به ویژگی های بسیاری همچون سرعت، کارایی، قابلیت نصب پکیج ها ، مصرف منابع ، عیب یابی (دیباگ) ، اشکال زدایی، هزینه و امکاناتی چون syntax highlighter،autocomplete و snippet بستگی دارد. ویرایشگرهای کد پایتون برای توسعه …
هسته اصلی یادگیری ماشین پردازش داده ها است. قبل از شروع کار با الگوریتم های یادگیری ماشین داده ها باید آماده شوند تا دقت و خروجی کار بالاتر رود. در این مطلب قصد داریم با یک مثال عملی پیش پردازش …
در یادگیری ماشین نمونه گیری Undersampling و نمونه گیری Oversampling دو روش هستند که با در برخورد با داده های نامتوازن به کار می روند.می توانید از کلاس اکثریت کم نمونه گیری کنید یا روی کلاس اقلیت را بیش نمونه گیری انجام دهید یا از ترکیب هر دو روش استفاده کنید
تقریباً همه مجموعه داده های دنیای واقعی مقادیر از دست رفته missing value دارند، برای حذف، پر کردن یا جایگزینی داده های گم شده شناسایی نوع آن از دست رفتن داده مهم است و این یک مشکل جدی است که …
پرکردن ،حذف یا جایگزینی داده های گم شده missing value ادامه مطلب »
مصور سازی داده نقش بسیار مهمی در فرایند علم داده و یادگیری ماشین دارد. با مصور سازی داده می توان تحلیل های بدست آمده از مراحل مختلف علم داده را برای همه افراد قابل فهم کرد. در این مقاله قصد داریم با بیان مقدمات و اصول مصورسازی داده آن را برای مبتدیان علم داده توضییح دهیم.
اگر قصد دارید وارد حوزه علم داده شوید پایتون یکی از بهترین زبان های مورد استفاده در علم داده است. در این مقاله قصد داریم گام های لازم برای کار در زمینه علم داده با زبان پایتون را به شما معرفی کنیم.
این مطلب به بررسی کلی مشاغل مختلف در دنیای داده می کند. شناخت کلی هر کدام از این مشاغل می تواند نقشه خوبی برای ورود به این حوزه باشد.