تولید محتوا

رگرسیون خطی

تحلیل رگرسیون از مجموعه ای از روش های یادگیری ماشین تشکیل شده است که برای پیش بینی یک مقدار پیوسته از مدل های رگرسیون استفاده می شود. پیش بینی قیمت های خانه با توجه به ویژگی های خانه مانند اندازه ، قیمت و غیره یکی از نمونه های متداول رگرسیون است. این یک تکنیک با نظارت است. رگرسیون خطی یکی از ساده ترین الگوریتم های یادگیری با نظارت در مجموعه ابزارها می باشد که دو نوع ساده و چند گانه دارد.

درخت تصمیم

درخت تصمیم یکی از معروف ترین الگوریتم های یادگیری ماشین می باشد که بر یک منطقه وسیع از یادگیری ماشین تاثیر گذاشته است و هم در مسائل طبقه بندی و هم در مسائل رگرسیون کاربرد دارد و همان طور که از نام آن پیداس از الگوی تصمیم گیری درخت مانند استفاده می کند. درخت تصمیم یکی از تفسیر پذیرترین مدل ها در یادگیری ماشین می باشد و در پایتون با استفاده از scikit-learn میتواند آن را به راحتی پیاده سازی کرد.

کاهش ابعاد با استفاده از انتخاب ویژگی

انتخاب ویژگی ها و کاهش ابعاد به ما این امکان را می دهد تعداد ویژگی های یک مجموعه داده را فقط با حفظ ویژگی های مهم به حداقل برسانیم. مزایای مختلفی در انجام انتخاب ویژگی و کاهش ابعاد وجود دارد که شامل تفسیرپذیری مدل، به حداقل رساندن بیش از حد مناسب و همچنین کاهش اندازه مجموعه train و در نتیجه زمان train است.

کاهش ابعاد

کاهش ابعاد با استفاده از استخراج ویژگی

در دنیای واقعی تعداد و ابعاد ویژگی ها خیلی زیاد است که کار با آن ها زمان و حافظه زیادی را می خواهد و حتی همه آن ویژگی ها را لازم نداریم و با یک سری از آنها می توانیم مدل مون را پیش بینی کنیم ولی نکته این است که کدام ویژگی ها را انتخاب کنیم. برای این کار از روش های کاهش بعد مثل pca، lda، kernelpca، nmf و tsvd می توانیم استفاده کنیم.

کاهش ویژگی