Knowledge Center Monthly Newsletter - March 2025
Stay up to date with the latest from the Knowledge Center. See all new and updated Knowledge Center articles published in the last month and re:Post’s top contributors.
組み込み分類子を使用して固定幅の .dat ファイルを解析すると、AWS Glue クローラーはそのファイルを UNKNOWN として分類します。
組み込み分類子は固定幅のデータファイルを解析できません。代わりに grok カスタム分類子を使用してください。
次の手順を実行します。
AWS Glue コンソールを開きます。
ナビゲーションペインで、[分類子] を選択します。
[分類子を追加] を選択し、次の内容を入力します。 [分類子名] に、一意の名前を入力します。 [分類子の種類] で [Grok] を選択します。 [分類] に、分類するデータの形式や型の説明を入力します。 [Grok パターン] には、AWS Glue でデータ内の一致を検索するために使用する組み込みパターンを入力します。.dat ファイルの解析には、フィールド間の区切り文字は必要ありません。各フィールドの長さは既知であるため、正規表現パターンを使用して一致するものを検索してください。
例:
(?<col0>.{7})(?<col1>.{8})(?<col2>.{14})(?<col3>.{52})
(オプション) [カスタムパターン] に、使用するカスタムパターンを入力します。これらのパターンは、データを分類する grok パターンによって参照されます。各カスタムパターンは別々の行に入力する必要があります。詳細については、「grok カスタム分類子を作成する」を参照してください。
[作成] を選択します。
AWS Glue コンソールを使用して分類子を作成する
分類子の定義と管理