如何在Sagemaker XGBoost中指定目标功能?

0

【以下的问题经过翻译处理】 我在考虑将一个数据科学项目从Datarobot迁移到Sagemaker。我熟悉编写Python,已经在一个教程Jupyter笔记本上进行了一些学习,以了解如何探索数据、构建和部署估计器。但是,我看不到如何指定目标特征。我有一个完全数值化的csv文件中的数据,其中一个字段是估计的目标,其余的是用于进行估计的信息。

如何指定要估计的列?我期望的代码是这样的...

container = sm.image_uris.retrieve("xgboost", session.boto_region_name, "1.5-1")

xgb = sm.estimator.Estimator(
    container,
    role,
    instance_count=1,
    instance_type="ml.m4.xlarge",
    output_path="s3://xxxxxx001/",
    sagemaker_session=session,
)

xgb.set_hyperparameters(
    max_depth=5,
    eta=0.2,
    gamma=4,
    min_child_weight=6,
    subsample=0.8,
    verbosity=0,
    num_round=100,
)
s3_input_train = TrainingInput(
    s3_data="s3://xxxxxx001/data.csv", content_type="csv"
)
xgb.fit({"train": s3_input_train})


profile picture
EXPERTO
preguntada hace 9 meses35 visualizaciones
1 Respuesta
0

【以下的回答经过翻译处理】 在AWS文档的一个格式错误的页面上,我发现一条声明 - CSV文件必须没有标题,目标字段必须是第一个字段。所以,显然无法指定目标。如此原始,是吗?

profile picture
EXPERTO
respondido hace 9 meses

No has iniciado sesión. Iniciar sesión para publicar una respuesta.

Una buena respuesta responde claramente a la pregunta, proporciona comentarios constructivos y fomenta el crecimiento profesional en la persona que hace la pregunta.

Pautas para responder preguntas