AWS re:Post Knowledge Center Feedback Survey
Help us improve the AWS re:Post Knowledge Center by sharing your feedback in a brief survey. Your input can influence how we create and update our content to better support your AWS journey.
組み込み分類子を使用して固定幅の .dat ファイルを解析すると、AWS Glue クローラーはそのファイルを UNKNOWN として分類します。
組み込み分類子は固定幅のデータファイルを解析できません。代わりに grok カスタム分類子を使用してください。
次の手順を実行します。
AWS Glue コンソールを開きます。
ナビゲーションペインで、[分類子] を選択します。
[分類子を追加] を選択し、次の内容を入力します。 [分類子名] に、一意の名前を入力します。 [分類子の種類] で [Grok] を選択します。 [分類] に、分類するデータの形式や型の説明を入力します。 [Grok パターン] には、AWS Glue でデータ内の一致を検索するために使用する組み込みパターンを入力します。.dat ファイルの解析には、フィールド間の区切り文字は必要ありません。各フィールドの長さは既知であるため、正規表現パターンを使用して一致するものを検索してください。
例:
(?<col0>.{7})(?<col1>.{8})(?<col2>.{14})(?<col3>.{52})
(オプション) [カスタムパターン] に、使用するカスタムパターンを入力します。これらのパターンは、データを分類する grok パターンによって参照されます。各カスタムパターンは別々の行に入力する必要があります。詳細については、「grok カスタム分類子を作成する」を参照してください。
[作成] を選択します。
AWS Glue コンソールを使用して分類子を作成する
分類子の定義と管理