首頁 » 架構師專欄 » 【AWS數據戰情室】Day8 Glue Data Catalog 教學 – Part 5

03/17 2021

AWS 數據解決方案

【AWS數據戰情室】Day8 Glue Data Catalog 教學 – Part 5

延續昨天的步驟繼續將 Crawler 設定完成

4-6. IAM 的部分選擇我們在步驟 1-1 時創建的 IAM Role(ITGlue)

4-7. Schedul 可以設定 Crawler 是否要定期執行，通常這個會用在需要將新的 Partition 更新到 Table 中時所使用，Partition 之後會有比較詳細的說明，這邊我們先選擇 Run on demand

4-8. 點選 Add database 創建一個自己的 DB 這樣資料比較不會混亂，Prefix added to table 的內容會添加到之後創建出來的 Table Name 前面，Table Name 則會是 S3 的資料夾名稱，Prefix added to table 在這邊先維持空白就好，最後點選 Next 後再點選最下面的 Finish 就完成了

4-9. 回到 Crawlers 的頁面，勾選剛剛創建的 SimpleDataCrawler，再點選 Run crawler，當 Crawler 執行完成時，可以看到 Tables added 的欄位變成 1

4-10. 回到 Tables 的頁面可以看到 Crawler 所產生的 Table，勾選 order 這個 Table，並點選 Action 中的 View data，接下來要使用 Athena 進行查詢

Athena 查詢教學
5-1. 進到 Athena 後有可能無法查詢，會看到以下這個畫面，或是點選右上角的 Setting 進到這個頁面，請先回到 S3 創建一個 Bucket(可以參考步驟 2-1) 讓 Athena 可以存放查詢結果，再填入 S3 路徑時最後一個斜線(/)記得要補上不然無法設定成功

請持續鎖定 Nextlink 架構師專欄，以獲得最新專業資訊喔!

若您有任何 AWS 需求，歡迎與我們聯繫!

聯絡我們

Previous 【AWS數據戰情室】Day 7 Glue Data Catalog 教學 – Part 4

Next【AWS數據戰情室】Day9 Glue Data Catalog 教學 – Part 6

AWS 數據解決方案

01/06 2023

全球瘋世界盃足球賽 AWS 用大數據與機器學習服務預測比賽結果

2022世界盃足球賽正式落幕，今年由阿根廷拿下冠軍。而在比賽過程當中，球員的一舉一動，也能夠透過AWS大數據與機器學習的服務，分析足球員的每個步伐與對戰過程，讓教練能夠從數據分析的結過替球隊做最好的安排。本篇的架構師專欄，將帶您看如何用AWS雲端服務分析世足賽事!

AWS 數據解決方案

10/06 2021

【博弘雲端數據戰情室】Day 30 Amazon QuickSight 功能介紹

在資料源設定完成後，接下來介紹如何繪製圖表，以資料源是每個 User 購買數量為例，來建立圖表看哪些商品的購買量最多。從建立 QuickSight 的 Filter及自建欄位，自訂自己的運算式，創建符合自己需求的圖表。

AWS 數據解決方案

09/29 2021

【AWS 數據戰情室】Day 29 QuickSight 連接 Redshift – Part 2

QuickSight 是 AWS 的 BI工具，在設定完相關的環境參數後，可以開始設定 Redshift 的連接。一樣先到 QuickSight 的主頁，點選 New analysis，繼續進行QuickSight連接 Redshift的設定。

AWS 數據解決方案

09/22 2021

【AWS 數據戰情室】Day 28 QuickSight 連接 Redshift – Part 1

QuickSight 是 AWS 的 BI工具，QuickSight 可以非常方便且簡單的串接 AWS 的資料庫或 S3，在 QuickSight 中可以 Join 多張 Table 或是多個資料源並進行視覺化分析產出視覺化的圖表，透過 UI 的方式可以更快速的進行分析。

AWS 數據解決方案

09/15 2021

【AWS 數據戰情室】Day 27 持續同步 S3 資料到 Redshift – Part 2

透過 Glue Job 將 S3 資料儲存到 Redshift之後，接下來我們要來測試是否可以每天進行 Redshift 的資料更新，並且不會產生重複的資料，修改完 ETL Job 的 Script 後就可以直接執行此 Job。