1回答
- 新しい順
- 投票が多い順
- コメントが多い順
0
クエリ結果を出力するS3バケットとテーブルデータのあるバケットが同じになっていたりするとそのようなエラーが発生することがあるようです。
おそらく以下と同じような現象だと思います。
https://repost.aws/ja/questions/QUgn6HjubOSayMALR1sJwMmg/questions/QUgn6HjubOSayMALR1sJwMmg/athena-error-hive-bad-data-not-valid-parquet-file-s3-deng-utube-raw-us-east-1-dev-youtube-raw-stats-reference-data-fr-category-id-json-expected-magic-number-par1-got?sc_ichannel=ha&sc_ilang=en&sc_isite=repost&sc_iplace=hp&sc_icontent=QUgn6HjubOSayMALR1sJwMmg&sc_ipos=4
Athenaのクエリエディタからクエリ結果を保存するS3の設定でテーブルデータのあるバケットとは違うところを設定されているか確認してみてください。
関連するコンテンツ
- AWS公式更新しました 3年前
- AWS公式更新しました 1年前
ありがとうございます! 解決することができました。
一つの対応として、テーブルデータが保存されているbucketに別フォルダを作成して、そこに Athenaのクエリ結果を保存するようにしていました。 ですが、これでは解決しないで上記のエラーが発生していました。
今回はアテナのクエリ結果用のbucketを準備して、そこに結果が入るように設定をしました。 これをすることによって、問題は解消されました。
結果同じようなことをしているつもりでしたが、全く別の対応だということが理解できました。
数日悩んでいたことが、数分で解決しました。 助かりました。 改めて、ありがとうございました。