如何在Sagemaker XGBoost中指定目标功能?

0

【以下的问题经过翻译处理】 我在考虑将一个数据科学项目从Datarobot迁移到Sagemaker。我熟悉编写Python,已经在一个教程Jupyter笔记本上进行了一些学习,以了解如何探索数据、构建和部署估计器。但是,我看不到如何指定目标特征。我有一个完全数值化的csv文件中的数据,其中一个字段是估计的目标,其余的是用于进行估计的信息。

如何指定要估计的列?我期望的代码是这样的...

container = sm.image_uris.retrieve("xgboost", session.boto_region_name, "1.5-1")

xgb = sm.estimator.Estimator(
    container,
    role,
    instance_count=1,
    instance_type="ml.m4.xlarge",
    output_path="s3://xxxxxx001/",
    sagemaker_session=session,
)

xgb.set_hyperparameters(
    max_depth=5,
    eta=0.2,
    gamma=4,
    min_child_weight=6,
    subsample=0.8,
    verbosity=0,
    num_round=100,
)
s3_input_train = TrainingInput(
    s3_data="s3://xxxxxx001/data.csv", content_type="csv"
)
xgb.fit({"train": s3_input_train})


profile picture
专家
已提问 8 个月前30 查看次数
1 回答
0

【以下的回答经过翻译处理】 在AWS文档的一个格式错误的页面上,我发现一条声明 - CSV文件必须没有标题,目标字段必须是第一个字段。所以,显然无法指定目标。如此原始,是吗?

profile picture
专家
已回答 8 个月前

您未登录。 登录 发布回答。

一个好的回答可以清楚地解答问题和提供建设性反馈,并能促进提问者的职业发展。

回答问题的准则