ماتریس درهم ریختگی (Confusion Matrix) به زبان ساده
در این مطلب قصد داریم به زبانی ساده ماتریس درهم ریختگی یا Confusion Matrix را توضییح دهیم. یادگیری این ماتریس برای ارزیابی مدل یادگیری ماشین ضروری است.
در این مطلب قصد داریم به زبانی ساده ماتریس درهم ریختگی یا Confusion Matrix را توضییح دهیم. یادگیری این ماتریس برای ارزیابی مدل یادگیری ماشین ضروری است.
یکی از دلهره آورترین تصمیماتی که برنامه نویسان هنگام گرفتن یک پروژه جدید می گیرند انتخاب زبان برنامه نویسی مناسب است. Python و R بدون شک در هنگام انتخاب یک زبان برنامه نویسی برای یک پروژه علم داده (Data Science …
مقایسه زبان python و R برای کار در حوزره علم داده ادامه مطلب »
مهندس داده و دانشمند داده دوتا از پرمخاطب ترین شغل های حوزه علم داده هستند. ولی تفاوت این شغل ها برای بسیاری مبهم و نامشخص است. در این مطلب قصد داریم این دو شغل را بررسی کینم و تفاوت آن ها با هم مقایسه کنیم.
کلان داده یا بیگ دیتا زمینه است که هر روز در حال افزایش است. به همین جهت دانستن مفاهیم و الزامات این حوزه ضروری بنظر می رسد. در این مقاله قصد داریم ۵ نکته مهم در زمینه بیگ دیتا را با هم بررسی کنیم.
در دنیای امروز بیشتر افراد به شبکه های اجتماعی اعتیاد پیدا کرده اند. همچنین ، می دانیم که تقریباً هر سیستمی که افراد در آن تعامل داشته باشند ، می تواند به عنوان یک شبکه اجتماعی دسته بندی شود.شبکه های …
خوشه بندی یک تکنیک یادگیری است که شامل گروه بندی نقاط داده می شود. با توجه به مجموعه ای از نقاط داده ، می توان از یک الگوریتم خوشه بندی برای طبقه بندی هر نقطه داده به یک گروه خاص …
6 الگوریتم خوشه بندی (clustering) که متخصصین علم داده باید بدانند ادامه مطلب »
در حال حاضر پایتون محبوب ترین زبان برنامه نویسی است. در مقاله نقاط قوت و ضعف این زبان را بررسی می کنیم. و بررسی می کنیم چرا این زبان در آینده محبوب ترین زبان نخواهد بود
احتمالا اخیرا کلمه دیتا ساینس یا علم داده را شنیده اید و کنجکاو شده اید این موضوع چگونه می تواند به کسب و کار شما کمک کند. آیا بیزینس شما هم امکان استفاده از آن را دارد؟آیا دیتا سانس می …
ما در مورد روشهای مختلف بررسی عملکرد مدل یادگیری ماشین یا یادگیری عمیق و چگونگی استفاده از یکی به جای دیگری بحث خواهیم کرد. در مورد اصطلاحاتی مانند: accuracy- precisioc- recall-ROC وغیره.
در دنیای واقعی تعداد و ابعاد ویژگی ها خیلی زیاد است که کار با آن ها زمان و حافظه زیادی را می خواهد و حتی همه آن ویژگی ها را لازم نداریم و با یک سری از آنها می توانیم مدل مون را پیش بینی کنیم ولی نکته این است که کدام ویژگی ها را انتخاب کنیم. برای این کار از روش های کاهش بعد مثل pca، lda، kernelpca، nmf و tsvd می توانیم استفاده کنیم.