Ich möchte mein Amazon-SageMaker-Studio-Notebook mit einem Amazon-Redshift-Cluster verbinden.
Lösung
Öffentlich zugänglicher Cluster
Wenn der Redshift-Cluster öffentlich zugänglich ist, können Sie über eine der folgenden Optionen auf den Cluster zugreifen:
- Eine SageMaker-Domäne, die nur mit öffentlichem Internet und ohne Zugriff auf Amazon Virtual Private Cloud (Amazon VPC) gestartet wurde
- Eine in einer Amazon VPC gestartete SageMaker-Studio-Domäne
Wenn sich der Redshift-Cluster in einer anderen VPC befindet, konfigurieren Sie eine VPC-Peering-Verbindung, um sicherzustellen, dass Studio auf den Cluster zugreifen kann.
Privater Cluster
Wenn der Redshift-Cluster privat ist, können Sie nur über eine in einer Amazon VPC gestartete SageMaker-Studio-Domäne auf den Cluster zugreifen. Wenn sich der Cluster in einer anderen VPC befindet, konfigurieren Sie eine VPC-Peering-Verbindung, um sicherzustellen, dass Studio auf den Cluster zugreifen kann.
Zusätzliche Anforderungen
Stellen Sie sicher, dass die folgenden Anforderungen für beide Clustertypen erfüllt sind:
- Die Sicherheitsgruppe, die an SageMaker Studio angeschlossen ist, ermöglicht ausgehenden Datenverkehr zu ephemeren Ports. Wenn ein Studio-Client eine Verbindung zu einem Redshift-Server herstellt, wird ein zufälliger Port aus dem Bereich der temporären Ports (1024-65535) zum Quellport des Clients.
- Die Sicherheitsgruppe, die an den Redshift-Cluster angeschlossen ist, ermöglicht eingehende Verbindungen von der Sicherheitsgruppe, die an die SageMaker-Studio-Domäne auf Port 5439 angeschlossen ist.
- Wenn Sie benutzerdefiniertes DNS konfiguriert haben, stellen Sie sicher, dass der von der Studio VPC verwendete DNS-Server den Hostnamen des Redshift-Clusters auflösen kann.
Ähnliche Informationen
Stellen Sie eine Verbindung zu einer externen Datenquelle her
Verwenden der Amazon-Redshift-Daten-API zur Interaktion von einem Amazon-SageMaker-Jupyter-Notebook aus
Lesen Sie die Docs-Dokumentation für die Datenerfassung mit Redshift