پیش پردازش داده ها
احتمال اینکه در حجم داده های بزرگ ، داده ها دارای ناهنجاری و مشکل باشند بسیار زیاد است. با توجه به این واقعیت که داده های با کیفیت بالا به مدل ها و پیش بینی های بهتری منجر می شوند …
احتمال اینکه در حجم داده های بزرگ ، داده ها دارای ناهنجاری و مشکل باشند بسیار زیاد است. با توجه به این واقعیت که داده های با کیفیت بالا به مدل ها و پیش بینی های بهتری منجر می شوند …
تقریباً همه مجموعه داده های دنیای واقعی مقادیر از دست رفته missing value دارند، برای حذف، پر کردن یا جایگزینی داده های گم شده شناسایی نوع آن از دست رفتن داده مهم است و این یک مشکل جدی است که …
پرکردن ،حذف یا جایگزینی داده های گم شده missing value ادامه مطلب »
در این مطلب قصد داریم کتاب هایی که برای آموزش گام به گام پایتون و آموزش پایتون برای مبتدیان تالیف شده است را به صورت رایگان در اختیار علاقه مندان به برنامه نویسی پایتون قرار دهیم. این کتاب ها را …
مصور سازی داده نقش بسیار مهمی در فرایند علم داده و یادگیری ماشین دارد. با مصور سازی داده می توان تحلیل های بدست آمده از مراحل مختلف علم داده را برای همه افراد قابل فهم کرد. در این مقاله قصد داریم با بیان مقدمات و اصول مصورسازی داده آن را برای مبتدیان علم داده توضییح دهیم.
اگر قصد دارید وارد حوزه علم داده شوید پایتون یکی از بهترین زبان های مورد استفاده در علم داده است. در این مقاله قصد داریم گام های لازم برای کار در زمینه علم داده با زبان پایتون را به شما معرفی کنیم.
این مطلب به بررسی کلی مشاغل مختلف در دنیای داده می کند. شناخت کلی هر کدام از این مشاغل می تواند نقشه خوبی برای ورود به این حوزه باشد.
تحلیل احساسات یکی از موضوعات مهم در دنیای علم داده است. اینکه صاحبان مشاغل بفهمند مشتریان چه نظری در مورد خدمات آن ها دارند از در روند تصمیم گیری مدیران بسیار تاثیر گذار است. در این مطلب قصد داریم یک مثال کاربردی از تحلیل احساسات کاربران با زبان پایتون را آموزش دهیم.
پردزاش کلان داده ها نیازمند صرف هزینه و زمان بیشتر است. دسک ابزاری است که می تواند به صورت پردازش موازی یا توزیع شده عمل پردازش کلان داده را انجام دهد.
برای بسیاری از علاقه مندان به حوزه داده و طراحی سایت این سوال مطرح می شود که از کدام ابزار پایتون برای طراحی وب استفاده کنند. در این مطلب قصد داریم فلسک و جنگو را با یکدیگر مقایسه کنیم تا بفهمیم در کجا از کدامیک بایستی استفاده کنیم.
هر مدل طراحی شده در یادگیری ماشین باید ارزیابی شود تا عملکرد آن مشخص شود. در این مقاله قصد داریم معیار های فرااخوانی ، دقت ، صحت و F1 را بررسی کنیم.