【AWS數據戰情室】Day9 Glue Data Catalog 教學 – Part 6

上一篇有說明使用 Athena 前需要執行的設定，本篇要接著使用 Athena 進行查詢

5-2. 設定完成後，就可以開始查詢 order.csv 裡的資料，Athena 是使用標準 SQL 進行查詢，所以如果會使用SQL操作資料庫，再來是用 Athena 進行查詢分析幾乎是沒有門檻的，以這個訂單資料來說，可以使用 Athena 找出星期幾的訂單數量是比較多的
SELECT order_dow, count(*) count FROM "it_db"."order" group by order_dow order by order_dow

可以看出是星期日與星期一的訂單數量是最多的，透過 Athena 可以很快的察看任何維度，例如每個消費者的訂單數量、回購頻率的分布、等等，之後可以在匯入其他CSV資料，可以看到每個商品的購買數量，每個客戶喜歡的商品類型、等等

左邊的 Data source 的部分，當中的 Database 與 Table 和 Glue Data Catalog 的 Database 與 Table 是相通的，所以 Crawler 創建的 Table 都會顯示在 Athena 的 Data source 中，透過這個方式 Athena 可以不需要了解 Table 後面的資料實際所儲存的地方，統一透過 Crawler 產生的 Table，Athena 可以直接對這些資料源進行查詢甚至是 join，在不同的資料源之間進行查詢

例如資料源是 S3、MySQL、MongoDB，透過 Glue Data Catalog 的 Crawler 可以將這三個資料源轉換成三個 Database 與 Table，Athena 就可以很輕易的將這些資料進行 Join 與分析

請持續鎖定 Nextlink 架構師專欄，以獲得最新專業資訊喔!

若您有任何 AWS 需求，歡迎與我們聯繫!

聯絡我們

Previous 【AWS數據戰情室】Day8 Glue Data Catalog 教學 – Part 5

Next【AWS 數據戰情室】Day10 Glue Data Catelog 教學 – Part 7

AWS 數據解決方案

01/06 2023

全球瘋世界盃足球賽 AWS 用大數據與機器學習服務預測比賽結果

2022世界盃足球賽正式落幕，今年由阿根廷拿下冠軍。而在比賽過程當中，球員的一舉一動，也能夠透過AWS大數據與機器學習的服務，分析足球員的每個步伐與對戰過程，讓教練能夠從數據分析的結過替球隊做最好的安排。本篇的架構師專欄，將帶您看如何用AWS雲端服務分析世足賽事!

AWS 數據解決方案

10/06 2021

【博弘雲端數據戰情室】Day 30 Amazon QuickSight 功能介紹

在資料源設定完成後，接下來介紹如何繪製圖表，以資料源是每個 User 購買數量為例，來建立圖表看哪些商品的購買量最多。從建立 QuickSight 的 Filter及自建欄位，自訂自己的運算式，創建符合自己需求的圖表。

AWS 數據解決方案

09/29 2021

【AWS 數據戰情室】Day 29 QuickSight 連接 Redshift – Part 2

QuickSight 是 AWS 的 BI工具，在設定完相關的環境參數後，可以開始設定 Redshift 的連接。一樣先到 QuickSight 的主頁，點選 New analysis，繼續進行QuickSight連接 Redshift的設定。

AWS 數據解決方案

09/22 2021

【AWS 數據戰情室】Day 28 QuickSight 連接 Redshift – Part 1

QuickSight 是 AWS 的 BI工具，QuickSight 可以非常方便且簡單的串接 AWS 的資料庫或 S3，在 QuickSight 中可以 Join 多張 Table 或是多個資料源並進行視覺化分析產出視覺化的圖表，透過 UI 的方式可以更快速的進行分析。

AWS 數據解決方案

09/15 2021

【AWS 數據戰情室】Day 27 持續同步 S3 資料到 Redshift – Part 2

透過 Glue Job 將 S3 資料儲存到 Redshift之後，接下來我們要來測試是否可以每天進行 Redshift 的資料更新，並且不會產生重複的資料，修改完 ETL Job 的 Script 後就可以直接執行此 Job。