SageMaker MXNet 本地模式无法工作。

0

【以下的问题经过翻译处理】 你好,我正在尝试在本地安装MXNet模型。 我正在参考这个网址https://aws.amazon.com/blogs/machine-learning/use-the-amazon-sagemaker-local-mode-to-train-on-your-notebook-instance/,并执行以下操作:

bucket = 'XXXXXXXXXXX'
prefix = 'sagemaker/cifar-bench/data'

inputs = sagemaker_session.upload_data(
    path='data',
    bucket=bucket, 
    key_prefix=prefix)

print('data sent to ' + inputs)


Inception = MXNet('gluon_cifar_net.py', 
          role=role, 
          train_instance_count=1, 
          train_instance_type='local_gpu',
          framework_version='1.2.1',
          base_job_name='cifar10-inception-',
          hyperparameters={'batch_size': 256, 
                           'optimizer': 'sgd',
                           'epochs': 100, 
                           'learning_rate': 0.1, 
                           'momentum': 0.9})


Inception.fit(inputs)

这报错 OSError: [Errno 2] No such file or directory

在错误日志中,我可以看到似乎在 self.latest_training_job = _TrainingJob.start_new(self,inputs)self.sagemaker_client.create_training_job(**train_request)处有错误。

我该如何使本地模式正常工作?

profile picture
전문가
질문됨 9달 전49회 조회
1개 답변
0

【以下的回答经过翻译处理】 很有可能你的设备中没有安装docker-compose(或docker),这就导致了出现“ No such file or directory”的错误。 如果您想使用本地GPU模式进行模型训练,我们建议您使用SageMaker笔记本实例。前往一个示例笔记本,例如:https://github.com/awslabs/amazon-sagemaker-examples/blob/master/sagemaker-python-sdk/mxnet_gluon_cifar10/mxnet_cifar10_local_mode.ipynb 并运行setup.sh脚本。这将正确安装和配置所有docker依赖项,之后您应该能够使用本地GPU模式使用MXNet。

profile picture
전문가
답변함 9달 전

로그인하지 않았습니다. 로그인해야 답변을 게시할 수 있습니다.

좋은 답변은 질문에 명확하게 답하고 건설적인 피드백을 제공하며 질문자의 전문적인 성장을 장려합니다.

질문 답변하기에 대한 가이드라인