در حالی که این ترفند به طور قابل توجهی عملکرد را بهبود می بخشد ، اما این روش به قیمت عدم توانایی تشخیص مقادیر دقیق نوشیدنی های بسیار گران قیمت تمام می شود. به جای مدل رگرسیون که از یک ویژگی (single feature) استفاده می کند، می توانیم از مدل های مبتنی بر درخت(tree base models) مانند جنگل های تصادفی (random forests) برای پیش بینی قیمت استفاده کنیم که می تواند از متغیرهای کمی و کیفی استفاده کند. بیایید یک مدل رگرسیون جنگلی تصادفی ایجاد کنیم که از “کشور” ، “استان” ، “تنوع” ، “کارخانه” و “امتیاز” برای پیش بینی “قیمت” نوشیدنی استفاده کند. ابتدا ، متغیرهای کیفی را به کد تبدیل می کنیم که توسط مدل جنگل های تصادفی قابل استفاده باشد: