01/06 2023

全球瘋世界盃足球賽 AWS 用大數據與機器學習服務預測比賽結果

Nextlink AWS 大數據 機器學習

2022年卡達世界盃足球賽受到各界矚目,經過一個多月的比賽,最後由阿根廷拿下冠軍。在運動賽事當中,無論是爭議球輔助判決,或是運動員的比賽影片分析,現在都可以透過機器學習與人工智能等相關雲端解決方案完成。本篇的博弘雲端架構師專欄,就要來帶您看如何運用AWS雲端大數據與機器學習服務,預測進球的機率以及球隊的勝率。

用AWS數據服務精準分析對戰數據

早從2020年開始,德國甲級足球聯賽 (Bundesliga) 就運用AWS人工智能和機器學習服務提供足球賽事的分析,增加球迷互動,提高比賽可看性。而這些AWS數據的分析與模型訓練,找出球員預期進球的得分機率,以及球員在進攻的衝刺速度,讓聯盟能夠去判斷在賽場上誰的表現可以幫助球隊贏得勝利。

不僅如此,運用AWS的服務,德國甲級足球聯賽還可以看出三項重要指標:

  • 最受壓迫的球員 (the Most Pressed Player): 球員在與特定的球隊比賽時,壓力數值為多少。若在機器學習模型下該名球員的壓力數值超過一定的標準,演算法就會自動判斷讓教練知道。
  • 進攻區域: 將球場上的進攻三分之一區域分成四等份,若球員在這區間嘗試射門,演算法就會記錄相對應區域的攻擊。後續用視覺化的方式呈現四個區域的攻擊機率為何,球隊更能夠了解位置布陣。
  • 平均位置: 平均位置將會顯示每個球員在場上的平均分配站位,教練就可針對不同比賽的球員佈陣去判斷「得分」、「阻止對方進球」、與「讓對手拿到紅牌」等因素是否會影響比賽的結果。

隨著科技與機器學習技術日趨成熟,對戰數據(Match Facts) 就能夠計算到更加精準,對位置數據做精準追蹤。在每個德國甲級足球聯賽的球場內皆配備了多達 20 個攝像頭,以每秒 25 次的速度自動光學追蹤球員、裁判和足球的位置。因此,負責營運和行銷的德意志足球聯賽 (DFL) 每場比賽可以收集大約 320 萬至 360 萬個位置,進而使用這些位置數據點來建構所有球員和足球在球場上的地圖。

圖片來源: engineering.com / 視覺化分析球場上球員的受迫位置與角度

AWS雲端機器學習服務 支援強大即時賽事數據分析

這些統計數據都是透過強大的AWS雲端基礎架構提供高效準確的數據處理,原始比賽數據被輸入 AWS 上的德甲足球聯賽對戰數據 (BMF) 系統,並且利用 Amazon SageMaker 創建演算法來訓練模型,提供「受壓迫球員」、「進攻區域」與「平均位置」這三項重要的數據。除此之外,AWS的多項數據分析服務,讓德國甲級足球聯盟能建立起自己的機器學習基礎架構,取得更多賽事上的洞察報告。

圖片來源: engineering.com / AWS 架構圖呈現如何即時處理數據源資料

首先,這套系統將從兩個地方抓出數據:AWS Fargate 用於接收位置和事件數據流,而Amazon API Gateway 則會用於接收額外的元資料 (Metadata),例如團隊組成和球員姓名。把數據導入後接著觸發 AWS Lambda 函數,負責各種短期的一次性任務,像是自動取消雲端環境內所配置的閒置資源、數據預處理以及每次使用新匹配數據時都會進行的多項數據質量測試。另外,數據將會被存放在兩個資料庫中,第一個是Amazon DynamoDB(NoSQL鍵值資料庫)和 Amazon DocumentDB(文件資料庫),同時在 Amazon S3 物件式儲存空間,把所有比賽的歷史數據都儲存起來,協助改善機器訓練模型。

至於如何判斷這個架構應用程式的效能呢? AWS Amplify 網站應用程式服務就在此時發揮功效。他的使用者介面可以提供營運團隊系統健康狀況和對戰數據計算狀態,以及雲端基礎設施的概覽。不僅如此,這個儀表板還能收集與持續監控相關的關鍵性能指標,像是整體系統負載和性能、端點延遲和其他非功能性要求。

架構師悄悄話

展望未來,人工智慧 (AI) 與機器學習 (ML) 不僅能夠預測未來的比賽和比賽結果,更希望能夠透過移動、流媒體和電視廣播為球迷推薦個性化的比賽畫面。目前德國甲級足球聯盟正在找增加與球迷的互動的方式。藉由AWS 媒體相關解決方案,讓球賽不僅能夠即時傳輸,更可以在能支持每個觀眾的 IP 設備上做事件流的時光平移,讓觀眾可以暫停和轉發,在收看比賽有更多的靈活性和互動性。