如何在Sagemaker XGBoost中指定目标功能?

0

【以下的问题经过翻译处理】 我在考虑将一个数据科学项目从Datarobot迁移到Sagemaker。我熟悉编写Python,已经在一个教程Jupyter笔记本上进行了一些学习,以了解如何探索数据、构建和部署估计器。但是,我看不到如何指定目标特征。我有一个完全数值化的csv文件中的数据,其中一个字段是估计的目标,其余的是用于进行估计的信息。

如何指定要估计的列?我期望的代码是这样的...

container = sm.image_uris.retrieve("xgboost", session.boto_region_name, "1.5-1")

xgb = sm.estimator.Estimator(
    container,
    role,
    instance_count=1,
    instance_type="ml.m4.xlarge",
    output_path="s3://xxxxxx001/",
    sagemaker_session=session,
)

xgb.set_hyperparameters(
    max_depth=5,
    eta=0.2,
    gamma=4,
    min_child_weight=6,
    subsample=0.8,
    verbosity=0,
    num_round=100,
)
s3_input_train = TrainingInput(
    s3_data="s3://xxxxxx001/data.csv", content_type="csv"
)
xgb.fit({"train": s3_input_train})


profile picture
EXPERTE
gefragt vor 9 Monaten35 Aufrufe
1 Antwort
0

【以下的回答经过翻译处理】 在AWS文档的一个格式错误的页面上,我发现一条声明 - CSV文件必须没有标题,目标字段必须是第一个字段。所以,显然无法指定目标。如此原始,是吗?

profile picture
EXPERTE
beantwortet vor 9 Monaten

Du bist nicht angemeldet. Anmelden um eine Antwort zu veröffentlichen.

Eine gute Antwort beantwortet die Frage klar, gibt konstruktives Feedback und fördert die berufliche Weiterentwicklung des Fragenstellers.

Richtlinien für die Beantwortung von Fragen