قبلا در این سری مقالات، اهمیت شبکههای گرافی، مفاهیم گراف، تجسم گراف و روشهای شناسایی تقلب مبتنی بر گراف را پوشش دادیم. در این مقاله، در مورد شناسایی خودکار انواع جدید رفتارهای تقلبی و برخورد سریع با آنها صحبت خواهیم کرد.
یکی از چالشهای شناسایی تقلب این است که کلاهبرداران حوزه تقلب را همواره به نوعی ابتکاری در راههای انجام تقلبها (MO به اختصار) ارتقا میدهند، یعنی روش عملیات آنها. مدلهای یادگیری ماشین که با استفاده از دادههای تاریخی آموزش داده شدهاند، ممکن است قادر به تشخیص MO جدید نباشند، زیرا اینها الگوهای جدیدی هستند که در دادههای آموزش موجود موجود نیستند. برای بهبود دفاعهای امنیتی موجود در Grab و محافظت از کاربران خود در برابر این MOهای جدید، به یک مدل یادگیری ماشین نیاز داشتیم که بتواند به طور سریع آنها را شناسایی کرده و بدون نیاز به هیچ نوع نظارت برچسبی عمل کند، یعنی یک مدل یادگیری بدون نظارت به جای مدل یادگیری با نظارت معمول.
برای مقابله با این موضوع، ما یک مدل یادگیری ماشین داخلی برای شناسایی الگوهای ناهنجار در گرافها توسعه دادیم که منجر به کشف MO تقلبی جدید شده است. ابتدا تمرکز ما در GrabFood و GrabMart بود که در آنجا تعاملات بین مصرفکنندگان و تجار را نظارت میکردیم. این تعاملات را به عنوان یک گراف دو قسمتی (نوعی گراف برای مدل کردن تعاملات بین دو گروه) مدل کردیم و سپس شناسایی ناهنجاری را روی گراف انجام دادیم. مدل شناسایی ناهنجار داخلی خود را نیز در کنفرانس مشترک بینالمللی شبکههای عصبی (IJCNN) 2023، یک کنفرانس علمی برجسته در حوزه شبکههای عصبی، یادگیری ماشین و هوش مصنوعی، ارائه دادیم.
در این وبلاگ، ما درباره مدل و کاربرد آن در Grab صحبت خواهیم کرد. برای مخاطبان علاقهمند که جزئیات مدل ما را بخوانند، میتوانید به مقاله ما در زیر دسترسی پیدا کنید. توجه کنید که اگرچه ما مدل خود را برای شناسایی ناهنجاری در GrabFood و GrabMart پیادهسازی کردهایم، اما این مدل برای اهداف عمومی طراحی شده است و قابل استفاده در گرافهای تعامل بین هر دو گروه است.
قبل از ورود به نحوه کار کرد مدل ما، مهم است که فرآیند ساختار گراف در برنامه ما را دریابید، زیرا مدل فرض میکند گرافها به صورت استاندارد در دسترس باشند.
ساخت گراف
ما تعاملات بین مصرفکنندگان و تجار در پلتفرمهای GrabFood و GrabMart را به عنوان گرافهای دو قسمتی (G) مدل کردیم، جایی که گروه اول گرهها (U) مصرفکنندگان را نشان میدهد، گروه دوم گرهها (V) تجار را نمایش میدهد و لبهها (E) که آنها را به هم متصل میکند، بدین معنی است که مصرفکنندگان سفارشهایی از تجار قرار دادهاند. گراف همچنین شامل اطلاعات معاملاتی جامع درباره مصرفکنندگان و تجار در قالب ویژگیهای گره (Xu و Xv) و همچنین اطلاعات سفارش در قالب ویژگی لبه (Xe) است.
هدف مدل ناهنجاری ما شناسایی رفتارهای مشکوک در میان مصرفکنندگان یا تجار (شناسایی ناهنجاری سطح گره) و همچنین تعاملات سفارشات مشکوک (شناسایی ناهنجاری سطح لبه) است. همانطور که ذکر شد، این شناسایی بدون هیچ نوع نظارت برچسبی باید انجام شود.
معماری مدل
ما مدل ناهنجاری گراف خود را به عنوان یک نوع خودکدنده خودکار طراحی کردیم، با یک کدگذار و دو کدگشا - یک کدگشای ویژگی و یک کدگشای ساختار. ویژگی کلیدی مدل ما این است که یک گراف دو قسمتی با ویژگیهای گره و لبه را به عنوان ورودی میپذیرد. این امر مهم است، زیرا هم ویژگیهای گره و هم ویژگیهای لبه اطلاعات مهمی را برای تعیین اینکه آیا برخی از رفتارها مشکوک هستند، رمز میکنند. بسیاری از کارهای قبلی در شناسایی ناهنجاری گراف فقط از ویژگیهای گره پشتیبانی میکنند. علاوه بر این، مدل ما میتواند هم نمرات ناهنجاری سطح گره و هم نمرات ناهنجاری سطح لبه را تولید کند، در عوض بسیاری از کارهای قبلی فقط نمرات سطح گره را تولید میکنند. ما مدل خود را به نام GraphBEAN نامگذاری کردهایم که مخفف شبکههای گراف بی قسمتی گره و لبه ویژگی دار است.
از ورودی، کدگذار سپس گراف دو قسمتی مشخصه دار را به سری از لایههای کانوولوشن گراف پردازش کرده و برای هر گروه گره به تصویرهای نهانی جدیدی منتج میشود. لایههای کانوولوشن گراف ما برای هر گره در هر دو گروه گره (UوV) ، و همچنین برای هر لبه در گراف، نمایش نهانی جدیدی ایجاد میکنند. توجه کنید که آخرین لایه کانوولوشن در کدگذار فقط نمایندههای نهانی برای گرهها را تولید میکند، بدون تولید نمایندههای لبه. دلیل این طراحی این است که فقط نمایندههای نهانی برای عوامل فعال، گرههای نماینده مصرفکنندگان و تجار را قرار میدهیم، اما نه تعامل آنها.
از نمایندههای نهانی گرهها، کدگشای ویژگی مسئولیت دارد که گراف اصلی با ویژگیهای گره و لبه را با استفاده از سری از لایههای کانوولوشن گراف بازسازی کند. همچنین بدین دلیل که کدگشای ساختار و پیشبینی شود که آیا یک لبه وجود دارد که دو گره را به هم متصل میکند، وظیفه ساختار رمزگشایی کردن گراف را بر عهده داشته باشد. این پیشبینی لبه، همچنین گراف بازسازی شده توسط کدگشای ویژگی، به مقایسه با گراف ورودی اصلی از طریق تابع خطای بازسازی منجر میشود.
سپس مدل با استفاده از گراف بی قسمتی ساخته شده از تراکنشهای GrabFood و GrabMart آموزش داده میشود. ما از یک تابع خطای بازسازی به عنوان هدف آموزش مدل استفاده میکنیم. پس از اتمام آموزش، امتیاز ناهنجاری هر گره و لبه در گراف را با استفاده از مدل آموزش دیده محاسبه میکنیم.
محاسبه امتیاز ناهنجاری
امتیازهای ناهنجاری ما بر اساس بازسازی انجام میشود. طراحی امتیاز فرض میکند که رفتارهای طبیعی در مجموعه داده رایج هستند و بنابراین به راحتی توسط مدل قابل بازسازی هستند. از طرف دیگر، رفتارهای ناهنجار کمیاب هستند. بنابراین مدل سخت دارد آنها را بازسازی کند و بنابراین خطاهای بالایی تولید میکند.
مدل امتیازهای ناهنجاری را به دو نوع تولید میکند. اول، امتیازهای ناهنجاری سطح لبه که از خطای بازسازی لبه محاسبه میشوند. دوم، امتیازهای ناهنجاری سطح گره که از خطای بازسازی گره به علاوه یک تجمع بر روی امتیازهای لبه از طریق لبههای متصل به گره محاسبه میشوند. این تجمع میتواند یک تجمع میانگین یا حداکثر باشد.
سیستم اقدامات
در پیادهسازی GraphBEAN در Grab، ما یک لوله کامل از سیستمهای شناسایی ناهنجاری و اقدامات طراحی کردیم. این یک سیستم کاملا اتوماتیک برای ساخت گراف دو قسمتی از تراکنشهای GrabFood و GrabMart، آموزش مدل GraphBEAN با استفاده از گراف و محاسبه امتیازهای ناهنجاری است. پس از محاسبه امتیازهای ناهنجاری برای همه مصرفکنندگان و تجار (سطح گره)، و همچنین تمام تعاملات آنها (سطح لبه)، به طور خودکار به سیستم اقدامات ما منتقل میشود. اما قبل از آن، این امتیازها را از طریق یک سیستمی که زمینه مبتنی بر قاعده نظارتی است، ماfraud type taggerمینامیم، منتقل میکند. هدف از این برچسبزنی، ارائه برخی از زمینههاست، مانند انواع ناهنجاریهای شناسایی شده. برخی از این برچسبها، سوءاستفاده از پروموشن یا توطئه ممکن است.
هر دو امتیاز ناهنجاری و برچسبهای نوع تقلب سپس به سیستم اقدامات ما منتقل میشوند. سیستم شامل دو زیرسیستم است:
- سیستم اقدامات توسط کارشناسان اقدامی: کارشناسان تقلب ما ناهنجاریهای شناسایی شده را تجزیه و تحلیل کرده و روی آنها اقدامات خاصی انجام میدهند، مانند تعلیق برخی از ویژگیهای تراکنش از تجار مشکوک.سیستم اقدامات اتوماتیک: امتیازهای ناهنجاری و برچسبهای نوع تقلب را با سیگنالهای خارجی دیگر تلفیق کرده و به طور خودکار روی ناهنجاریهای شناسایی شده اقداماتی انجام میدهد، مانند جلوگیری از استفاده از پروموشن توسط تقلبگران یا جلوگیری از وقوع تراکنشهای تقلبی. این اقدامات بستگی به نوع تقلب و امتیازها دارند.
چه چیزی بعداز این؟
مدل GraphBEAN امکان شناسایی رفتارهای مشکوک در دادههای گراف را بدون نیاز به نظارت برچسب فراهم میکند. با پیادهسازی مدل در پلتفرمهای GrabFood و GrabMart، ما فهمیدیم که داشتن چنین سیستمی به ما امکان میدهد که به سرعت انواع جدیدی از رفتارهای تقلبی را شناسایی کرده و سپس به سرعت بر روی آنها اقدام کنیم. این همچنین به ما این امکان را میدهد که دفاعیههای Grab را در برابر فعالیت تقلبی بهبود داده و کاربران خود را فعالانه محافظت کنیم.
در حال حاضر در حال کار بر روی گسترش مدل به گرافهای خاصیت متفاوت (چند موجودیت) هستیم. علاوه بر این، در حال کار بر روی پیادهسازی آن در موارد استفاده بیشتر در Grab هستیم.
اطلاعات ارجاع
(*) اگر از این مقاله برای اهداف علمی استفاده میکنید، لطفاً مطابق با مقاله زیر ارجاع دهید:
R. Fathony, J. Ng and J. Chen, “Interaction-Focused Anomaly Detection on Bipartite Node-and-Edge-Attributed Graphs,” 2023 International Joint Conference on Neural Networks (IJCNN), Gold Coast, Australia, 2023, pp. 1-10, doi: 10.1109/IJCNN54540.2023.10191331.
اطلاعیه کپی رایت IEEE:
© 2023 IEEE. استفاده شخصی از این ماده مجاز است. باید مجوز از IEEE دریافت شود.