12/27 2019

AWS re:Invent 技術專欄 – 如何用新型機器學習服務抓出詐騙事件

Nextlink AWS re:Invent 技術專欄

Nextlink 技術小編對於 re:Invent 2019 第二天 AWS CEO keynote 發布關於詐騙偵測的新功能 Amazon Fraud Detector 非常有興趣,所以找到相對應的分場技術議程,也是本周要分享給各位的主題:如何使用 ML 來做詐騙偵測。

在議程一開始就先請美國金融機構 Charles Schwab & Co 的詐騙與金融犯罪副總分享在他們在日常營運中如何抓出線上金融詐騙行為。他先列舉出常見的詐騙行為包含:新帳號(帶有可疑網域或是特定國家註冊的帳號)、線上帳號接管、付款詐騙、訪客身分購買(未註冊帳號並進行購買行為)以及社交工程詐騙等。因為詐騙的模式是一直不斷在變化的,所以 Charles Schwab 內部透過演算法以及自行研發的監控系統找出詐騙案件相似的因素,提升詐騙案件偵測的準確性。最後,他提出了整體詐騙預防的策略,從最一開始的預防,日常的偵測、修復到最後的遏止。

「ML 能夠針對上述四個步驟的前兩個:預防及偵測做出貢獻」AWS 詐騙預防總經理說到,因為 ML 模型透過收集大量的資料來學習更多的常規模式並發現交易事件的風險。當詐欺犯進行細微詐騙手法調整時,ML 模型仍然認為它們是可疑的,因為他們與合法客戶所表現出的行為不一樣。

ML 的模型要訓練需要三個要素:

  1. 資料

要訓練模型需要非常”大量”的樣本資料,最少要10000筆,當然,越多越好,包含預測值、獨立變項,類型包含類別變數跟數值變數

  1. 標記

每個樣本需要依照你想預測的結果去下tag、分類,數值變數做迴歸、類別變數做分類法

  1. 演算法

包含從簡單線性迴歸到複雜的深度類神經網路

當然以上的方法屬於初期建置 ML 模型所需準備的工夫,後續還需要持續的記錄被標記為詐騙的事件、做模型的再訓練以及 ML 規則的優化。

在還沒有使用 ML 模型之前要做詐騙偵測其實是很困難的,因為需要花上很多的人力、詐欺犯常常改變手法且過去的演算法使用的是嵌入式的偵測邏輯使整體偵測效率無法有效提升。然而,使用 ML 來做詐騙偵測其實也沒那麼簡單,因為在事前必須投入大量的努力,包含:現行很難找到 ML 的專家且人事成本高昂、一般通用的模型無法用在特定用途、前期需要投入大量時間以及找出模型裡的錯誤有如大海撈針。

所以 AWS 推出了 Amazon Fraud Detector 詐騙偵測服務,可讓企業輕鬆使用機器學習來及時、大規模地檢測線上詐騙事件。它能做到更快地建立高品質的詐騙檢測 ML 模型、在一開始就阻止壞人、內建的線上詐騙專業知識並賦予詐騙防治團隊更多的控制權。您可以將過去的歷史資料儲存程 CSV 檔並上傳到 S3 裡面並串接到 Amazon Fraud Detector 建立偵測模板,模板可檢查並擴充資料、執行特別功能、選取演算法、訓練並優化模型、驗證效能及託管模型,最後會導出偵測邏輯的 API,這個 API 可根據設定的規則應用於線上交易偵測。Amazon Fraud Detector 實際的作法是將每筆客戶交易的資料依據 ML 模型的判斷給出分數,若分數過高,代表著此筆交易可能就是詐騙案件。

Amazon Fraud Detector 主要的功能包含它預先內建了詐騙偵測的模板並依照需求自動化生成詐騙偵測模型。您可以透過圖形化的介面可以看到過去偵測的評估、邏輯資料及結果。整合 Amazon SageMaker 來做不同用途的偵測案例,例如:Amazon Fraud Detector 用於客戶交易詐騙偵測,再使用 SageMaker 檢查帳戶資料外洩風險。

雖然 Amazon Fraud Detector 還在 Preview 的階段,不過未來可供使用時,能夠應用於各產業,幫忙抓出線上詐騙案件,使整體線上交易的環境更加安全。