- Newest
- Most votes
- Most comments
【以下的回答经过翻译处理】 如果你的Sagemaker笔记本实例运行时间较长,你可以通过监控CPU和内存使用情况来检查它是否卡住或仍在运行。 如果CPU使用率低或为零,则可能卡住。
如果CPU使用率高但内存使用率低,则可能需要更多的VCPUs;如果内存使用率高,则可能需要更多的内存。 你可以通过SageMaker Notebook Instance终端检查它: 为了详细查看内存和CPU信息,请按照下面的指示操作: [1] 启动你的笔记本实例 [2] 进入Jupyter主页 [3] 右侧,点击下拉选项“New” [4] 选择“Terminal” 在Jupyter终端中,运行以下命令查看内存和CPU的信息。
[+] 查看内存信息:
$ free -h => “free-h”的输出将以人类可读的形式提供总内存、已用内存、空闲内存、共享内存等信息。 [+] 若要查看CPU信息,则可以运行以下任何一个命令: $ mpstat -u => “mpstat -u”的输出包含不同的字段,如%guest、%gnice、%steal等。 此外,您还可以检查cloudwatch日志中是否存在任何可能表明问题原因的错误或警告。大多数时候,cloudwatch有助于找出问题的根本原因。
您可以在CloudWatch下找到CloudWatch日志→ 日志组→ aws/sagemaker/NotebookInstances -> Notebook 名称
根据分析,您可以选择不同的笔记本实例类型。 如果您有任何困难或遇到任何问题,请联系AWS支持[+]([+] Creating support cases and case management - https://docs.aws.amazon.com/awssupport/latest/user/case-management.html#creating-a-support-casehttps://docs.aws.amazon.com/awssupport/latest/user/case-management.html#creating-a-support-case),并附上您的问题/用例的详细信息,我们很乐意为您提供进一步的帮助。
Relevant content
- asked 2 years ago
- asked a year ago
- Accepted Answerasked a year ago
- AWS OFFICIALUpdated a year ago
- AWS OFFICIALUpdated 4 months ago
- AWS OFFICIALUpdated 4 months ago
- AWS OFFICIALUpdated 2 years ago