If the real time inference in sagemaker does not return output in 1 min , how many times does it retries? and how can we stop those retry ?

0

I hosted one large model in Sagemaker using real-time inference but it is not giving any error in case of timeout and retrying by itself after 1 min 2 times. Also how much size is considered to be too large for sagemaker models ?

sparsh
質問済み 8ヶ月前66ビュー
回答なし

ログインしていません。 ログイン 回答を投稿する。

優れた回答とは、質問に明確に答え、建設的なフィードバックを提供し、質問者の専門分野におけるスキルの向上を促すものです。

質問に答えるためのガイドライン

関連するコンテンツ