انگیزه مسئله

1 دقیقه |  2020/10/24

مانند دیگر مسائل یادگیری، مجموعه داده $x^{(1)}, x^{(2)},…, x^{(m)}$ در اختیار ما قرار دارد.

سپس یک نمونه جدید به اسم $x_{test}$ خواهیم داشت و قصد داریم بفهمیم که این نمونه غیر‌عادی/ ناهنجار است یا خیر.

یک “مدل” $p(x)$ تعریف می‌کنیم که به ما احتمال ناهنجار نبودن نمونه را می‌گوید. همچنین از یک آستانه $\epsilon$(اپسیلون) به عنوان یک خط جداکننده استفاده می‌کنیم که تعیین می‌کند کدام نمونه‌ها ناهنجار هستند و کدام نمونه‌ها ناهنجار نیستند.

یکی از کاربردهای رایج تشخیص ناهنجاری، شناسایی کلاه‌برداری است:

  • $x^{(i)}$ = ویژگی‌های فعالیت کاربر iام.
  • مدل $p(x)$ از داده.
  • شناسایی کاربران غیرعادی با تطبیق دادن مواردی که $p(x) < \epsilon $.

در صورتی که تعداد بسیار زیادی نمونه ناهنجار شناسایی شود، باید آستانه $\epsilon$ را کاهش دهیم.