توصیه هایی برای اعمال PCA

1 دقیقه |  2020/11/13

رایج ترین کاربرد PCA سرعت بخشیدن به یادگیری با نظارت است.

تصور کنید مجموعه آموزشی با تعداد زیادی ویژگی داریم $x ^ {(1)}, … , x ^ {(m)} \in \mathbb{R ^ {10000} } $

ما می‌توانیم از PCA برای کاهش تعداد ویژگی ها در هر نمونه از مجموعه آموزش استفاده کنیم $z ^ {(1)}, … , z ^ {(m)} \in \mathbb{R ^ {1000} } $.

توجه داشته باشید که ما باید PCA را صورت کاهشی از $x ^ {(1)}$ به $z ^ {(1)}$ تعریف کنیم، فقط در مجموعه آموزش و نه در مجموعه cross-validation یا تست. می‌توانید پس از تعریف در مجموعه آموزشی، نگاشت z (i) را برای مجموعه cross-validation و آزمون خود اعمال کنید.

کاربرد ها:

  • فشرده سازی
  • مصور سازی داده ها

استفاده نادرست از PCA:

تلاش برای جلوگیری از overfitting. ممکن است فکر کنیم که کاهش ویژگی ها توسط PCA روشی موثر بر overfitting است. این ممکن است مفید باشد، اما توصیه نمی‌شود زیرا مقادیر نتایج ما یعنی y را در نظر نمی گیرد. استفاده از منظم سازی حداقل به همان اندازه موثر خواهد بود.

تصور نکنید که باید PCA را انجام دهید، ابتدا الگوریتم کامل یادگیری ماشین خود را بدون PCA امتحان کنید، سپس اگر متوجه شدید که به آن نیاز دارید استفاده کنید.