Knowledge Center Monthly Newsletter - March 2025
Stay up to date with the latest from the Knowledge Center. See all new and updated Knowledge Center articles published in the last month and re:Post’s top contributors.
當我使用內建分類器解析固定寬度 .dat 檔案時,我的 AWS Glue 編目程式將該文件分類為 UNKNOWN (未知)。
內建分類器無法解析固定寬度資料檔案。改為使用 Grok 自訂分類器。
請完成下列步驟。
開啟 AWS Glue 主控台。
在瀏覽窗格中,選擇 Classifiers (分類器)。
選擇 Add classifier (新增分類器),然後輸入下列項目: 在 Classifier name (分類器名稱) 中,輸入唯一的名稱。 在 Classifier type (分類器類型) 中,選擇 Grok。 在 Classification (分類) 中,輸入您要分類的資料格式或類型描述。 在 Grok pattern (Grok 模式) 中,請輸入您希望 AWS Glue 用於尋找資料中相符項目的內建模式。若要解析 .dat 檔案,欄位之間不需要分隔符。因為每個欄位都有已知的長度,請使用 regex 模式來尋找相符項目。
範例:
(?<col0>.{7})(?<col1>.{8})(?<col2>.{14})(?<col3>.{52})
(選填) 在 Custom patterns (自訂模式) 中,輸入您要使用的任何自訂模式。分類資料的 Grok 模式會參考這些模式。每個自訂模式都必須位於單獨的列上。如需詳細資訊,請參閱撰寫 Grok 自訂分類器。
選擇 Create (建立)。
完成下列步驟:
使用 AWS Glue 主控台建立分類器
定義和管理分類器