使用Step Functions编排Sqoop

0

【以下的问题经过翻译处理】 我们可以使用 Step Function 来编排Sqoop作业吗?目标是创建一个暂时的集群,先使用Sqoop加载数据,然后在Hive中进行转换,但看起来Command Runner没有这样的选项。

如果不行,有什么替代方案吗?

profile picture
EXPERTE
gefragt vor 6 Monaten14 Aufrufe
1 Antwort
0

【以下的回答经过翻译处理】 您可以在脚本运行模式下运行任何脚本。

基本上,从 Step Function 调用 Script Runner需要的语法,例如:


       "StartAt":"Step 1",
       "States":{ 
          "Step_1":{ 
             "Type":"Task",
             "Resource":"arn:aws:states:::elasticmapreduce:addStep.sync",
             "Parameters":{ 
                "ClusterId.$":"$.ClusterId",
                "Step":{ 
                   "Name":"1 - Step 1",
                   "ActionOnFailure":"CONTINUE",
                   "HadoopJarStep":{ 
                      "Jar":"s3://elasticmapreduce/libs/script-runner/script-runner.jar",
                      "Args":[ 
                         "s3://xxx/scripts/step1.sh"
                      ]
                   }
                }
             },
             "End":true
          }
       }
    }

将所有代码放入step1.sh脚本中,该脚本将在主节点上执行您想要执行的任何任务,包括Sqoop。

profile picture
EXPERTE
beantwortet vor 6 Monaten

Du bist nicht angemeldet. Anmelden um eine Antwort zu veröffentlichen.

Eine gute Antwort beantwortet die Frage klar, gibt konstruktives Feedback und fördert die berufliche Weiterentwicklung des Fragenstellers.

Richtlinien für die Beantwortung von Fragen