Contact Us

首頁 » 架構師專欄 » 【AWS 數據戰情室】Day 16 Glue ETL Job 教學 – Part 3

06/16 2021

AWS 數據解決方案

【AWS 數據戰情室】Day 16 Glue ETL Job 教學 – Part 3

AWS數據分析 glue etl job

Job 的基礎設定完成後，接下來要設定資料源與輸出目標

這一步驟可以選擇要處理的資料源，選擇 Glue Data Catalog 中的 Table，這邊我們選擇 order_products_prior，就可以繼續往下

Glue Data Catalog 選擇資料源

4. 這個步驟我們選預設的 Change schema

選預設的 Change schema

5. 這個步驟就要選擇要寫入的目標，這邊請先選擇 Create tables in your data target，之後可以看到另一個設定頁面

Data store：這邊可以選擇 S3 與 JDBC，JDBC 可以連結 Redshift、RDS、DynamoDB、etc 的資料庫，但這次我們先選擇 S3
Format：資料儲存的格式選擇 CSV
Compression type：檔案壓縮的部分先不進行壓縮
Target path：這部分可以填入要寫入的 S3 路徑，記得要與資料源的資料夾分開

選擇 Create tables in your data target

欄位設定，這部分可以使用圖形化介面的方式設定儲存的欄位資訊，可以調整欄位順序、欄位的資料類型、增減欄位

Glue Data Catalog欄位設定

設定完成後 Glue 會產生出基本的 PySpark 程式碼，這個程式碼可以直接將資料從資料源按照所設定的內容搬遷到 S3 或是以 JDBC 連線的資料庫中

請持續鎖定 Nextlink 架構師專欄，以獲得最新專業資訊喔!

若您有任何 AWS 需求，歡迎與我們聯繫!

Previous 【AWS 數據戰情室】Day 15 Glue ETL Job 教學 – Part 2

Next【AWS 數據戰情室】Day 17 Glue ETL Job 教學 – Part 4

AWS 數據解決方案

01/06 2023

全球瘋世界盃足球賽 AWS 用大數據與機器學習服務預測比賽結果

2022世界盃足球賽正式落幕，今年由阿根廷拿下冠軍。而在比賽過程當中，球員的一舉一動，也能夠透過AWS大數據與機器學習的服務，分析足球員的每個步伐與對戰過程，讓教練能夠從數據分析的結過替球隊做最好的安排。本篇的架構師專欄，將帶您看如何用AWS雲端服務分析世足賽事!

Read More

AWS 數據解決方案

10/06 2021

【博弘雲端數據戰情室】Day 30 Amazon QuickSight 功能介紹

在資料源設定完成後，接下來介紹如何繪製圖表，以資料源是每個 User 購買數量為例，來建立圖表看哪些商品的購買量最多。從建立 QuickSight 的 Filter及自建欄位，自訂自己的運算式，創建符合自己需求的圖表。

Read More

AWS 數據解決方案

09/29 2021

【AWS 數據戰情室】Day 29 QuickSight 連接 Redshift – Part 2

QuickSight 是 AWS 的 BI工具，在設定完相關的環境參數後，可以開始設定 Redshift 的連接。一樣先到 QuickSight 的主頁，點選 New analysis，繼續進行QuickSight連接 Redshift的設定。

Read More

AWS 數據解決方案

09/22 2021

【AWS 數據戰情室】Day 28 QuickSight 連接 Redshift – Part 1

QuickSight 是 AWS 的 BI工具，QuickSight 可以非常方便且簡單的串接 AWS 的資料庫或 S3，在 QuickSight 中可以 Join 多張 Table 或是多個資料源並進行視覺化分析產出視覺化的圖表，透過 UI 的方式可以更快速的進行分析。

Read More

AWS 數據解決方案

09/15 2021

【AWS 數據戰情室】Day 27 持續同步 S3 資料到 Redshift – Part 2

透過 Glue Job 將 S3 資料儲存到 Redshift之後，接下來我們要來測試是否可以每天進行 Redshift 的資料更新，並且不會產生重複的資料，修改完 ETL Job 的 Script 後就可以直接執行此 Job。

Read More

You are using an outdated browser. Please upgrade your browser to improve your experience and security.

您正在使用 版本過舊 的瀏覽器。請更新您的瀏覽器以改善您的使用體驗及安全性。