在AWS Glue DataBrew中,能否仅保留所需列并删除其余列?

0

【以下的问题经过翻译处理】 我在AWS Glue中有许多数据集,其中包含数百个列,但我只需要其中的几个列进行特征选择。我在AWS Glue DataBrew中并未找到保留所需列并删除其余列的选项。请问是否有办法实现这个功能

profile picture
專家
已提問 6 個月前檢視次數 24 次
1 個回答
0

【以下的回答经过翻译处理】 您可以在“列”选项卡中使用文本框在AWS Glue DataBrew控制台中查看所需的列。您可以搜索列、选择所需的列并取消选择其他的列。 要从最终数据集中删除某些列,您需要应用不含有全局过滤/搜索功能的删除列配方。 要删除多个列,您可以将配方下载为JSON文件,在删除步骤中添加您的列,然后再上传该配方。 示例:

{
"Action": {
  "Operation": "DELETE",
  "Parameters": {
    "sourceColumns": "[\"victory_status\",\"winner\",\"turns\"]"
  }
}

profile picture
專家
已回答 6 個月前

您尚未登入。 登入 去張貼答案。

一個好的回答可以清楚地回答問題並提供建設性的意見回饋,同時有助於提問者的專業成長。

回答問題指南