如何在Sagemaker XGBoost中指定目标功能?
0
【以下的问题经过翻译处理】 我在考虑将一个数据科学项目从Datarobot迁移到Sagemaker。我熟悉编写Python,已经在一个教程Jupyter笔记本上进行了一些学习,以了解如何探索数据、构建和部署估计器。但是,我看不到如何指定目标特征。我有一个完全数值化的csv文件中的数据,其中一个字段是估计的目标,其余的是用于进行估计的信息。
如何指定要估计的列?我期望的代码是这样的...
container = sm.image_uris.retrieve("xgboost", session.boto_region_name, "1.5-1")
xgb = sm.estimator.Estimator(
container,
role,
instance_count=1,
instance_type="ml.m4.xlarge",
output_path="s3://xxxxxx001/",
sagemaker_session=session,
)
xgb.set_hyperparameters(
max_depth=5,
eta=0.2,
gamma=4,
min_child_weight=6,
subsample=0.8,
verbosity=0,
num_round=100,
)
s3_input_train = TrainingInput(
s3_data="s3://xxxxxx001/data.csv", content_type="csv"
)
xgb.fit({"train": s3_input_train})
1개 답변
- 최신
- 최다 투표
- 가장 많은 댓글
이 답변이 도움이 되었나요?커뮤니티가 여러분의 지식을 활용할 수 있도록 정답을 찬성하세요.
0
【以下的回答经过翻译处理】 在AWS文档的一个格式错误的页面上,我发现一条声明 - CSV文件必须没有标题,目标字段必须是第一个字段。所以,显然无法指定目标。如此原始,是吗?