因應市場變化,各產業對機器學習、AI相關應用大增,又因疫情加速轉型,提高企業採用 AI 技術的比例,因此今年AWS re:Invent 首次舉辦 Machine Learining Keynote,並由 Amazon 機器學習副總裁 Dr.Swami Sivasubramanian 發表演說。Dr.Swami 首先提到 AWS 提供的機器學習開發架構,除從基礎層面提供 PyTorch、Mxnet、Tensorflow、GPU與推論晶片等外,AWS 也推出 SageMaker 讓業界進行機器學習模型的訓練,也有非常多的 AI 服務可供企業直接使用,例如今年發布的 DevOps Guru、Panaroma 等。
機器學習:提升 40% 訓練速度
AWS 在機器學習方面提供了一個完整的底層環境,有 92% 在雲端執行 TensorFlow 的使用者,以及 91% 在雲端執行 PyTorch 的使用者也都選擇AWS,一部份的原因是 AWS 提供不同系列的 EC2 晶片,讓 ML 使用者能依照功能別來選擇適合的基礎設備訓練模型,特別是 AWS Inferentia 晶片相較於其他 GPU-base ,能降低 45% 的成本。
Dr.Swami 進一步說明,現在機器學習的訓練方法都是要靠分散式的資料處理,以及模型訓練, AWS 新推出的 Managed Data Parallelism in Amazon SageMaker 服務則可提升 40% 的訓練速度。
然而,在發展進行機器學習時會遇到相當多挑戰,包含最一開始的資料收集、優化演算法、管理訓練環境、模型調校、實際上線佈署到模型的擴展等。 因此,AWS 在 2017 年發布了 Amazon SageMaker 這項機器學習服務,解決上述問題,也成為AWS有史以來成長最快的服務。
資料蒐集:檢測模型偏差
在資料蒐集方面,為避免使用者收集到含有偏誤的資料, AWS 新推出
Amazon SageMaker Clarify(Generally Available) 協助檢測 ML 模型中的偏差,並了解模型預測,透過檢查您指定的屬性來檢測資料準備期間、模型訓練之後,以及部署的模型中的潛在偏差。
模型訓練:
去年 AWS re:Invent 大會上公布 SageMaker Debugger 服務,能夠協助使用者自動辨識 ML 訓練工作中出現的複雜問題。今年 AWS 將其功能強化推出 Deep Profiling for SageMaker Debugger(Generally Available) 剖析類神經網路訓練的相關資訊,包含:CPU、GPU、網路等。
模型部署:
由於邊緣端裝置的佈署需要更強大的管理功能,因此 AWS 發布 Amazon SageMaker Edge Manager(Generally Available) 來管理大量裝置,讓您的裝置增加 25 倍效能,並透過儀表板看到現有裝置狀況。
Dr.Swami 也表示,過去要進入 ML 的領域是非常困難的,所以 AWS 提供簡單易用的服務,降低使用 ML 的門檻,讓更多人能進入 ML 的殿堂。秉持推廣機器學習的信念,去年 AWS 發布的 Amazon SageMaker Autopilot ,讓使用者可經由點擊在幾分鐘內建立第一個ML模型。今年 AWS 即宣布推出 Amazon Redshift ML(In Preview),透過 SQL 並結合 SageMaker Autopilot 快速建立 ML 模型,更打造 Amazon Neptune ML(Generally Available) 進行圖形類神經網路訓練,作為個人化推薦、詐欺偵測等功能。
「ML 要解決的是在收集的資料裡面找得到、足以影響業務但現階段無法有效解決的問題」Dr.Swami 說明。企業很常透過指標數據來監控業務狀況,電商就是最好的案例。AWS 特別推出 Amazon Lookout for Metric(In Preview) 來檢測指標異常的新服務,可助業者主動監控業務狀況,診斷問題並找出解決方案。
醫療產業的健康資料通常是不完整且非結構化,例如:臨床記錄、實驗室報告、保險索賠、醫療圖像,記錄的對話,以及時間序列數據中包含的資訊跨不同格式和系統。有鑑於此,AWS 推出 Amazon HealthLake(In Preview) ,可在數分鐘內儲存、轉換、查詢和分析健康數據。
Dr.Swami 也提到,ML 是個不斷更新且蓬勃發展的領域,持續學習是必然的過程,AWS 也基於這樣的精神,不斷推出許多實作項目,例如:Deepracer、Deep Composer 等,透過實際操作更完整發揮 ML 的優勢,應用在工作與生活中。
博弘也將持續為您提供 AWS re:Invent 2020 的技術重點,請持續鎖定博弘雲端官網,接收 AWS 最新消息!