如何在Sagemaker XGBoost中指定目标功能?

0

【以下的问题经过翻译处理】 我在考虑将一个数据科学项目从Datarobot迁移到Sagemaker。我熟悉编写Python,已经在一个教程Jupyter笔记本上进行了一些学习,以了解如何探索数据、构建和部署估计器。但是,我看不到如何指定目标特征。我有一个完全数值化的csv文件中的数据,其中一个字段是估计的目标,其余的是用于进行估计的信息。

如何指定要估计的列?我期望的代码是这样的...

container = sm.image_uris.retrieve("xgboost", session.boto_region_name, "1.5-1")

xgb = sm.estimator.Estimator(
    container,
    role,
    instance_count=1,
    instance_type="ml.m4.xlarge",
    output_path="s3://xxxxxx001/",
    sagemaker_session=session,
)

xgb.set_hyperparameters(
    max_depth=5,
    eta=0.2,
    gamma=4,
    min_child_weight=6,
    subsample=0.8,
    verbosity=0,
    num_round=100,
)
s3_input_train = TrainingInput(
    s3_data="s3://xxxxxx001/data.csv", content_type="csv"
)
xgb.fit({"train": s3_input_train})


profile picture
전문가
질문됨 일 년 전38회 조회
1개 답변
0

【以下的回答经过翻译处理】 在AWS文档的一个格式错误的页面上,我发现一条声明 - CSV文件必须没有标题,目标字段必须是第一个字段。所以,显然无法指定目标。如此原始,是吗?

profile picture
전문가
답변함 일 년 전

로그인하지 않았습니다. 로그인해야 답변을 게시할 수 있습니다.

좋은 답변은 질문에 명확하게 답하고 건설적인 피드백을 제공하며 질문자의 전문적인 성장을 장려합니다.

질문 답변하기에 대한 가이드라인

관련 콘텐츠