تشخیص ناهنجاری های گراف بدون نظارت - شناسایی رفتارهای تقلبی جدید-8986

قبلا در این سری مقالات، اهمیت شبکه‌های گرافی، مفاهیم گراف، تجسم گراف و روش‌های شناسایی تقلب مبتنی بر گراف را پوشش دادیم. در این مقاله، در مورد شناسایی خودکار انواع جدید رفتارهای تقلبی و برخورد سریع با آنها صحبت خواهیم کرد.

یکی از چالش‌های شناسایی تقلب این است که کلاهبرداران حوزه تقلب را همواره به نوعی ابتکاری در راه‌های انجام تقلب‌ها (MO به اختصار) ارتقا می‌دهند، یعنی روش عملیات آنها. مدل‌های یادگیری ماشین که با استفاده از داده‌های تاریخی آموزش داده شده‌اند، ممکن است قادر به تشخیص MO جدید نباشند، زیرا این‌ها الگوهای جدیدی هستند که در داده‌های آموزش موجود موجود نیستند. برای بهبود دفاع‌های امنیتی موجود در Grab و محافظت از کاربران خود در برابر این MO‌های جدید، به یک مدل یادگیری ماشین نیاز داشتیم که بتواند به طور سریع آن‌ها را شناسایی کرده و بدون نیاز به هیچ نوع نظارت برچسبی عمل کند، یعنی یک مدل یادگیری بدون نظارت به جای مدل یادگیری با نظارت معمول.

برای مقابله با این موضوع، ما یک مدل یادگیری ماشین داخلی برای شناسایی الگوهای ناهنجار در گراف‌ها توسعه دادیم که منجر به کشف MO تقلبی جدید شده است. ابتدا تمرکز ما در GrabFood و GrabMart بود که در آنجا تعاملات بین مصرف‌کنندگان و تجار را نظارت می‌کردیم. این تعاملات را به عنوان یک گراف دو قسمتی (نوعی گراف برای مدل کردن تعاملات بین دو گروه) مدل کردیم و سپس شناسایی ناهنجاری را روی گراف انجام دادیم. مدل شناسایی ناهنجار داخلی خود را نیز در کنفرانس مشترک بین‌المللی شبکه‌های عصبی (IJCNN) 2023، یک کنفرانس علمی برجسته در حوزه شبکه‌های عصبی، یادگیری ماشین و هوش مصنوعی، ارائه دادیم.

در این وبلاگ، ما درباره مدل و کاربرد آن در Grab صحبت خواهیم کرد. برای مخاطبان علاقه‌مند که جزئیات مدل ما را بخوانند، می‌توانید به مقاله ما در زیر دسترسی پیدا کنید. توجه کنید که اگرچه ما مدل خود را برای شناسایی ناهنجاری در GrabFood و GrabMart پیاده‌سازی کرده‌ایم، اما این مدل برای اهداف عمومی طراحی شده است و قابل استفاده در گراف‌های تعامل بین هر دو گروه است.

شناسایی ناهنجاری متمرکز بر تعامل در گراف بی قسمتی و گره و لبه ویژگی داربه روش ریزال فتحونی، جن نگ و جیا چنارائه شده در کنفرانس مشترک بین‌المللی شبکه‌های عصبی (IJCNN) 2023DOI:10.1109/IJCNN54540.2023.10191331(citation)

قبل از ورود به نحوه کار کرد مدل ما، مهم است که فرآیند ساختار گراف در برنامه ما را دریابید، زیرا مدل فرض می‌کند گراف‌ها به صورت استاندارد در دسترس باشند.

ساخت گراف

ما تعاملات بین مصرف‌کنندگان و تجار در پلتفرم‌های GrabFood و GrabMart را به عنوان گراف‌های دو قسمتی (G) مدل کردیم، جایی که گروه اول گره‌ها (U) مصرف‌کنندگان را نشان می‌دهد، گروه دوم گره‌ها (V) تجار را نمایش می‌دهد و لبه‌ها (E) که آنها را به هم متصل می‌کند، بدین معنی است که مصرف‌کنندگان سفارش‌هایی از تجار قرار داده‌اند. گراف همچنین شامل اطلاعات معاملاتی جامع درباره مصرف‌کنندگان و تجار در قالب ویژگی‌های گره (Xu و Xv) و همچنین اطلاعات سفارش در قالب ویژگی لبه (Xe) است.

هدف مدل ناهنجاری ما شناسایی رفتارهای مشکوک در میان مصرف‌کنندگان یا تجار (شناسایی ناهنجاری سطح گره) و همچنین تعاملات سفارشات مشکوک (شناسایی ناهنجاری سطح لبه) است. همانطور که ذکر شد، این شناسایی بدون هیچ نوع نظارت برچسبی باید انجام شود.

معماری مدل

ما مدل ناهنجاری گراف خود را به عنوان یک نوع خودکدنده خودکار طراحی کردیم، با یک کدگذار و دو کدگشا - یک کدگشای ویژگی و یک کدگشای ساختار. ویژگی کلیدی مدل ما این است که یک گراف دو قسمتی با ویژگی‌های گره و لبه را به عنوان ورودی می‌پذیرد. این امر مهم است، زیرا هم ویژگی‌های گره و هم ویژگی‌های لبه اطلاعات مهمی را برای تعیین اینکه آیا برخی از رفتارها مشکوک هستند، رمز می‌کنند. بسیاری از کارهای قبلی در شناسایی ناهنجاری گراف فقط از ویژگی‌های گره پشتیبانی می‌کنند. علاوه بر این، مدل ما می‌تواند هم نمرات ناهنجاری سطح گره و هم نمرات ناهنجاری سطح لبه را تولید کند، در عوض بسیاری از کارهای قبلی فقط نمرات سطح گره را تولید می‌کنند. ما مدل خود را به نام GraphBEAN نامگذاری کرده‌ایم که مخفف شبکه‌های گراف بی قسمتی گره و لبه ویژگی دار است.

از ورودی، کدگذار سپس گراف دو قسمتی مشخصه دار را به سری از لایه‌های کانوولوشن گراف پردازش کرده و برای هر گروه گره به تصویرهای نهانی جدیدی منتج می‌شود. لایه‌های کانوولوشن گراف ما برای هر گره در هر دو گروه گره (UوV) ، و همچنین برای هر لبه در گراف، نمایش نهانی جدیدی ایجاد می‌کنند. توجه کنید که آخرین لایه کانوولوشن در کدگذار فقط نماینده‌های نهانی برای گره‌ها را تولید می‌کند، بدون تولید نماینده‌های لبه. دلیل این طراحی این است که فقط نماینده‌های نهانی برای عوامل فعال، گره‌های نماینده مصرف‌کنندگان و تجار را قرار می‌دهیم، اما نه تعامل آنها.

از نماینده‌های نهانی گره‌ها، کدگشای ویژگی مسئولیت دارد که گراف اصلی با ویژگی‌های گره و لبه را با استفاده از سری از لایه‌های کانوولوشن گراف بازسازی کند. همچنین بدین دلیل که کدگشای ساختار و پیش‌بینی شود که آیا یک لبه وجود دارد که دو گره را به هم متصل می‌کند، وظیفه ساختار رمزگشایی کردن گراف را بر عهده داشته باشد. این پیش‌بینی لبه، همچنین گراف بازسازی شده توسط کدگشای ویژگی، به مقایسه با گراف ورودی اصلی از طریق تابع خطای بازسازی منجر می‌شود.

سپس مدل با استفاده از گراف بی قسمتی ساخته شده از تراکنش‌های GrabFood و GrabMart آموزش داده می‌شود. ما از یک تابع خطای بازسازی به عنوان هدف آموزش مدل استفاده می‌کنیم. پس از اتمام آموزش، امتیاز ناهنجاری هر گره و لبه در گراف را با استفاده از مدل آموزش دیده محاسبه می‌کنیم.

محاسبه امتیاز ناهنجاری

امتیازهای ناهنجاری ما بر اساس بازسازی انجام می‌شود. طراحی امتیاز فرض می‌کند که رفتارهای طبیعی در مجموعه داده رایج هستند و بنابراین به راحتی توسط مدل قابل بازسازی هستند. از طرف دیگر، رفتارهای ناهنجار کمیاب هستند. بنابراین مدل سخت دارد آنها را بازسازی کند و بنابراین خطاهای بالایی تولید می‌کند.

مدل امتیازهای ناهنجاری را به دو نوع تولید می‌کند. اول، امتیازهای ناهنجاری سطح لبه که از خطای بازسازی لبه محاسبه می‌شوند. دوم، امتیازهای ناهنجاری سطح گره که از خطای بازسازی گره به علاوه یک تجمع بر روی امتیازهای لبه از طریق لبه‌های متصل به گره محاسبه می‌شوند. این تجمع می‌تواند یک تجمع میانگین یا حداکثر باشد.

سیستم اقدامات

در پیاده‌سازی GraphBEAN در Grab، ما یک لوله کامل از سیستم‌های شناسایی ناهنجاری و اقدامات طراحی کردیم. این یک سیستم کاملا اتوماتیک برای ساخت گراف دو قسمتی از تراکنش‌های GrabFood و GrabMart، آموزش مدل GraphBEAN با استفاده از گراف و محاسبه امتیازهای ناهنجاری است. پس از محاسبه امتیازهای ناهنجاری برای همه مصرف‌کنندگان و تجار (سطح گره)، و همچنین تمام تعاملات آنها (سطح لبه)، به طور خودکار به سیستم اقدامات ما منتقل می‌شود. اما قبل از آن، این امتیازها را از طریق یک سیستمی که زمینه مبتنی بر قاعده نظارتی است، ماfraud type taggerمی‌نامیم، منتقل می‌کند. هدف از این برچسب‌زنی، ارائه برخی از زمینه‌هاست، مانند انواع ناهنجاری‌های شناسایی شده. برخی از این برچسب‌ها، سوءاستفاده از پروموشن یا توطئه ممکن است.

هر دو امتیاز ناهنجاری و برچسب‌های نوع تقلب سپس به سیستم اقدامات ما منتقل می‌شوند. سیستم شامل دو زیرسیستم است:

سیستم اقدامات توسط کارشناسان اقدامی: کارشناسان تقلب ما ناهنجاری‌های شناسایی شده را تجزیه و تحلیل کرده و روی آنها اقدامات خاصی انجام می‌دهند، مانند تعلیق برخی از ویژگی‌های تراکنش از تجار مشکوک.سیستم اقدامات اتوماتیک: امتیازهای ناهنجاری و برچسب‌های نوع تقلب را با سیگنال‌های خارجی دیگر تلفیق کرده و به طور خودکار روی ناهنجاری‌های شناسایی شده اقداماتی انجام می‌دهد، مانند جلوگیری از استفاده از پروموشن توسط تقلبگران یا جلوگیری از وقوع تراکنش‌های تقلبی. این اقدامات بستگی به نوع تقلب و امتیازها دارند.

چه چیزی بعداز این؟

مدل GraphBEAN امکان شناسایی رفتارهای مشکوک در داده‌های گراف را بدون نیاز به نظارت برچسب فراهم می‌کند. با پیاده‌سازی مدل در پلتفرم‌های GrabFood و GrabMart، ما فهمیدیم که داشتن چنین سیستمی به ما امکان می‌دهد که به سرعت انواع جدیدی از رفتارهای تقلبی را شناسایی کرده و سپس به سرعت بر روی آنها اقدام کنیم. این همچنین به ما این امکان را می‌دهد که دفاعیه‌های Grab را در برابر فعالیت تقلبی بهبود داده و کاربران خود را فعالانه محافظت کنیم.

در حال حاضر در حال کار بر روی گسترش مدل به گراف‌های خاصیت متفاوت (چند موجودیت) هستیم. علاوه بر این، در حال کار بر روی پیاده‌سازی آن در موارد استفاده بیشتر در Grab هستیم.

اطلاعات ارجاع

(*) اگر از این مقاله برای اهداف علمی استفاده می‌کنید، لطفاً مطابق با مقاله زیر ارجاع دهید:

R. Fathony, J. Ng and J. Chen, “Interaction-Focused Anomaly Detection on Bipartite Node-and-Edge-Attributed Graphs,” 2023 International Joint Conference on Neural Networks (IJCNN), Gold Coast, Australia, 2023, pp. 1-10, doi: 10.1109/IJCNN54540.2023.10191331.

اطلاعیه کپی رایت IEEE:

Home