configuration file for a MME in aws sagemaker?


based on the example here ,, i am working on a configuration file for a multi model endpoint on a bert based model. which takes on a string and outputs a string. the max_batch_size and the dims:[1] parameters below are not very clear . Is there any more info on this . triton server documentation is not very clear as well, from what i saw.

name: "ensemble"
platform: "ensemble"
max_batch_size: 16
input [
    name: "INPUT0"
    data_type: TYPE_STRING
    dims: [ 1 ]
output [
    name: "finaloutput"
    data_type: TYPE_FP32
    dims: [384]

preguntada hace un año71 visualizaciones
No hay respuestas

No has iniciado sesión. Iniciar sesión para publicar una respuesta.

Una buena respuesta responde claramente a la pregunta, proporciona comentarios constructivos y fomenta el crecimiento profesional en la persona que hace la pregunta.

Pautas para responder preguntas