如何使用AI處理機敏文件？借鏡美國聯邦政府的AI使用提升效率！

美國聯邦機構通常會收集、管理、使用並分發各種文件。然而，儲存與分發聯邦機構的文件往往是複雜的過程，這些文件的格式各異，從結構化格式到自由書寫的文件，都可能包含需要謹慎編輯的個人身份識別資訊（PII）。除此之外，在影像、手寫筆記和簽名等文件檔案中，包含的不同類型的個人資訊，更替聯邦人員在處理「識別個人信息及敏感資訊」的工作，添加了層層挑戰。因此，要針對文件處理開發一個適用於所有情況的解決方案，是相當有挑戰性的。

因此，今天博弘雲端要借鏡美國聯邦政府的案例，來看看如何使用AI來處理文件，並且在合理範圍與人為監督的情況下，提升資料處理的效率！

文件處理效率低落｜美聯邦政府遇到哪些挑戰？
如何設計AWS解決方案模組來處理敏感資料？
使用AI來進行敏感資料處理有哪些好處？

文件處理效率低落｜美聯邦政府遇到哪些挑戰？
如何設計AWS解決方案模組來處理敏感資料？
使用AI來進行敏感資料處理有哪些好處？

文件處理效率低落｜美聯邦政府遇到哪些挑戰？

如同一般企業，美國聯邦政府在處理相關文件的同時，也面臨了多種挑戰，主要原因為其工作流程中有大量且多樣化的文件需要處理，更因程序繁瑣，也讓資料處理的過程變得相當複雜：

文件量與處理速度：各機構接收的文件數量不一，文件的大小、接收時間、法規要求和行業標準等差異，增加了數據處理的複雜性。
選擇性遮蔽：機構對文件中的敏感資訊有特定的遮蔽需求和標準，使處理流程更為複雜。
成本效率與永續性：人工和計算資源的成本巨大，人工處理文件的成本成為重要限制。
適應性：此領域的技術發展迅速，機構需要靈活且可調整的方法來進行模型的訓練、調整和部署，以準確處理文件。

為了解決聯邦政府文件處理的挑戰，因此採用「人機協作」的方法，利用先進且可調適的人工智慧（AI）來識別、遮蔽並從人工審查中學習。這種靈活、高效且安全的文件處理方式大大減輕了聯邦機構的負擔。針對文件的複雜性，我們會分類為以下幾種類型，來應對不同文件類型處理的複雜性：

標準表單：對固定結構和欄位的文件進行自動化處理。
混合格式：針對包含固定欄位與更不結構化數據的文件進行高級解析。
手寫文件：使用專門的光學字元辨識（OCR）技術，識別並遮蔽手寫文本中的個人身份資訊（PII）。
綜合文件：對結合標準表單、混合格式和手寫元素的文件（如簽名的收據和報告）提供靈活的處理方法。

文件處理效率低落惹人怨 — 文件類別越多，處理的效率也越繁雜，所帶來的隱形成本無法預估。

如何設計AWS解決方案模組來處理敏感資料？

因此，我們就來看看，AWS有哪些 AI 的工具，可以用來設計相對應的解決方案模組，進而安全地處理敏感資料：

資料導入與提取

將輸入數據檔案導入雲端存儲解決方案，使用Amazon Textract具備AI功能的服務，將資料提取為純文本格式，並利用Amazon Comprehend或自訂訓練模型的智能服務，從原始文本中提取命名實體及其元數據。這些輸出內容儲存在JSON標準檔案格式中，並進入下一階段。部分處理過程中生成的數據可用於其他情境，例如幫助摘要、搜尋及更新問答文件，因此會與原始文件一同儲存。