我想解決一個在 Amazon Athena 中執行過長時間或逾時的 MSCK REPAIR TABLE 命令。
當您執行 MSCK REPAIR TABLE 命令時,Athena 會列出 Amazon Simple Storage Service (Amazon S3) 中的前綴和物件。如果您的 Amazon S3 前綴或物件太多,則命令需要很長時間才能執行或逾時並出現錯誤。
若要解決此問題,請使用下列其中一種方法:
使用分區投影與 Athena 來生成記憶體內的分區。您不需要將分區新增至 AWS Glue Data Catalog,也不需要從 Data Catalog 中擷取分割。Athena 會計算資料表的值,而不是掃描大量分區清單。此外,分區投影會從組態而不是從儲存庫 (例如 AWS Glue Data Catalog),來計算值和位置。
若要使用 AWS Glue 編目程式將分區新增至 Athena 資料表,請完成下列步驟:
如需詳細資訊,請參閱編目程式如何運作和用於在 AWS Glue 中新增分區的增量爬取。
若要使用 Athena DDL 陳述式載入分區,請完成下列步驟:
為什麼我執行 Athena 查詢需要很長的時間?
透過 AWS Glue ETL 任務在 Data Catalog 中建立資料表、更新結構描述及新增分區
AWS Glue 定價