- 最新
- 投票最多
- 评论最多
Amazon Polly é um serviço de texto para fala que não gera legendas sincronizadas diretamente. No entanto, o Polly oferece uma funcionalidade que pode ajudar na sincronização de fala e texto.
O Polly fornece um fluxo de metadados adicional que inclui informações sobre quando frases, palavras e sons específicos estão sendo pronunciados. Essa funcionalidade permite que os desenvolvedores sincronizem a fala com elementos visuais, como animação facial ou destaque de palavras no estilo karaokê.
Para obter áudio e legendas sincronizadas, você pode usar essa funcionalidade de metadados do Polly em conjunto com outras ferramentas ou serviços da AWS. Por exemplo, você poderia:
- Usar o Amazon Polly para gerar o áudio e os metadados de tempo.
- Utilizar os metadados para criar legendas sincronizadas manualmente ou através de um script personalizado.
- Alternativamente, você poderia usar o Amazon Transcribe (serviço de fala para texto) para gerar uma transcrição do áudio com marcações de tempo, que poderia então ser usada como legenda.
Embora o Polly não gere legendas automaticamente, ele fornece as ferramentas necessárias para criar uma experiência sincronizada entre áudio e texto.
Sources
Amazon Polly Features
Community | All the things that Amazon Comprehend, Rekognition, Textract, Polly, Transcribe, and Others Do
