Je souhaite comprendre les avantages du paramètre VACUUM RECLUSTER dans Amazon Redshift.
Résolution
Avantages de VACUUM RECLUSTER
Contrairement à l'opération VACUUM SORT complète, le paramètre VACUUM RECLUSTER traite spécifiquement de la mise en cluster des données et améliore les performances des requêtes qui utilisent un tri spécifique basé sur des colonnes.
Le paramètre VACUUM RECLUSTER est utile pour les tables qui font l'objet d'insertions et de mises à jour fréquentes, ce qui entraîne une fragmentation des données. Lorsque vous insérez ou mettez à jour de grandes quantités de données, vous pouvez utiliser le paramètre pour effectuer des opérations d’extraction, transformation et chargement (ETL)
Remarque : Il est recommandé d'utiliser le paramètre VACUUM RECLUSTER pour les tables volumineuses dont l'ingestion est fréquente et pour les requêtes qui n'accèdent qu'aux données les plus récentes. Pour plus d’informations, consultez la section Paramètres.
Le paramètre VACUUM RECLUSTER réorganise uniquement les parties non triées d'une table et laisse intactes les parties déjà triées. Ce paramètre réduit le temps nécessaire à l'opération VACUUM car il n'effectue pas d'opération de fusion complète.
Pour trier uniquement les parties d'une table qui ne sont pas triées, exécutez la commande VACUUM RECLUSTER suivante :
VACUUM RECLUSTER <table_name>;
Remarque : Remplacez table_name par le nom de votre table.
Limites de VACUUM RECLUSTER
Vous ne pouvez pas utiliser le paramètre VACUUM RECLUSTER pour fusionner les données récemment triées avec la région AWS triée existante. Vous ne pouvez pas non plus utiliser le paramètre pour récupérer de l'espace pour les lignes marquées pour suppression.
VACUUM RECLUSTER ne fonctionne qu'au niveau de la table. Cependant, le paramètre VACUUM RECLUSTER ne prend pas en charge les tables avec des clés de tri entrelacées et ne prend pas en charge les tables avec le style de distribution ALL.
De plus, le paramètre VACUUM RECLUSTER ne prend pas en charge le seuil TO PERCENT.