صفحه اصلی » پرونده موضوعی » راهکارهای تشخیص تقلب
آیا نیاز بشر به ثروت، نیازی طبیعی است؟ مکاتب بسیاری سعی در پاسخ به این سوال داشتهاند و هر یک دلایل گوناگونی از جمله میل به قدرت، وجود سیستمهای سرمایهداری، تامین نیازهای اولیه اساسی و… را علت ثروتطلبی بشر دانستهاند. هر چند لازمه پاسخ به این سوال، نیازمند بررسی و مکاشفه دقیق است اما آنچه به صورت حقیقتی غیر قابل انکار بین تمامی متفکران پذیرفته شده نیاز روزافزون بشر برای بهدستآوردن هر چه بیشتر منابع مالی است.
بدیهی است که با ایجاد هر سیستم مالی، بسیاری از افراد با کشف خلا امنیتی سیستم، سعی در کسب منابع مالی با کمترین زحمت را دارند. در زمینه مبارزه با تقلب، دو نگاه کلی وجود دارد: اجتناب از تقلب و شناسایی آن و طراحی سیستمهایی با امنیت بالا و برای مثال طراحی رمز دوم یا OTP که جزو طبقه اول این دستهبندی است. گاهی سیستم امنیتی بسیار دقیق طراحی شده است؛ در این موارد متقلبین سعی میکنند با فریب افراد به مقاصد خود نائل شوند. از اینجا به بعد، سیستمهای شناسایی تقلب برای جلوگیری از جابهجایی پول، کاربرد پیدا میکنند. یک موسسه تحقیقاتی در زمینه مالی میزان کلاه برداری از طریق دزدی مشخصات در سال 2020 را حدود 56 میلیون دلار تخمین زده است.
لازم به ذکر است که سیستمهای کشف تقلب باید بهطور مداوم، در طول زمان تکامل یابند، زیرا زمانی که دستهای از تقلبها کشف میشوند، استراتژیهای قدیمی کنار گذاشته و با استراتژیهای جدید تقلب جایگزین میشوند.
سیستمهای کشف تقلب از الگوریتمهای یادگیری ماشین، تحلیلهای سری زمانی، تحلیلهای آماری و ریاضیاتی و تحلیل گراف برای کشف تقلب استفاده میکنند. تقلب را میتوان نوعی ناهنجاری در دادهها به حساب آورد؛ بنابراین میتوان از این به بعد بهجای اصطلاح کشف تقلب، شناسایی نمونههای ناهنجار را به کار برد. ناهنجاریها در دادهها سه نوع مختلف دارند که لازم است در کشف هر تقلب دقت کنیم کدام یک از انواع ناهنجاری درحال رخدادن است؛ در این صورت احتمال شناسایی خطا پایین میآید. این ناهنجاریها عبارتند از:
دستهای از روشها تنها امتیاز یا احتمال ناهنجاری را به هر داده منتسب میکنند، درحالی که دستهای دیگر، یکی از دو برچسب هنجار یا ناهنجار را.
بهطور کلی الگوریتمهای یادگیری ماشین به سه دسته تقسیمبندی میشوند:
4- روش های مبتنیبرگراف: این روشها نیز براساس وجود یا عدم وجود برچسب برای دادهها، در سه دسته الگوریتمهای بدون ناظر، نیمه نظارتی و با ناظر جای میگیرند. با این حال به دلیل اهمیت این دسته از روشها به بررسی آنها بهصورت جداگانه میپردازیم. این دسته از الگوریتمها که از شبکههای ارتباطی برای شناسایی رفتارهای ناهنجار استفاده میکنند، پرکاربردترین روشها برای تشخیص ناهنجاری هستند. روشهای مبتنیبر گراف روی گرافهای ثابت یا پویا میتوانند راس، یال، زیرگراف یا واقعه ناهنجاری را شناسایی کنند.
منظور از راس ناهنجار، راسهایی هستند که در مقایسه با بقیه راسها، دارای ویژگی ناهنجاری هستنند. معمولا به هر راس، بر اساس ویژگیهای آن، امتیازی برابر با میزان ناهنجاری آن راس داده میشود. برای مثال براساس نرخ یالهای ورودی به خروجی. مانند راسها، یالهای ناهنجار نیز با استفاده از ویژگیهای غیرمعمول یالها، برای مثال امتیازی بالاتر از یک آستانه، یافت میشوند. به بیانی دیگر، بعد از امتیاز دهی به یال ها با استفاده از پارامتر های مختلف همچون فاصله یا هزینه و غیره، یال هایی که امتیازی بالاتر از حد معمول به دست آورند میتوانند بهعنوان یال های ناهنجار شناسایی شوند. بعد از شناسایی یالهای ناهنجار میتوان راسهای محتمل برای ناهنجاری را نیز یافت. برای یافتن زیرگرافهای ناهنجار، ابتدا زیرگرافها با الگوریتمهای تشخیص انجمن، شناسایی شده، سپس به هر یک امتیازی برای میزان ناهنجاری اختصاص داده میشود. دسته آخر این مجموعه که تنها در گرافهای پویا قابل اجراست، تشخیص بازه زمانی است که در آن تغییر چشمگیری در شبکه ایجاد شده است.
بسیاری از روشهای مبتنیبر گراف، همان روشهای یادگیری ماشین هستند که روی گراف پیادهسازی شدهاند. براساس دردسترسبودن برچسب دادهها، ماهیت شبکه و نوع ناهنجاری، روشهای مختلفی به کار برده میشود. برای مثال میتوان از روشهای ساختاری که بر اساس ویژگیهای توپولوژی، شبکه راسها و یالهای ناهنجار را شناسایی میکنند یا روشهای آماری که بر اساس تئوری احتمالات، توزیع احتمالات و… مدلی برای رفتار به هنجار میسازد و سپس هر انحرافی از این رفتار را به عنوان رفتار ناهنجار شناسایی میکنند، نام برد.
منابع: