跳至内容

Text to speech - Amazon Polly

0

Text to speech - Amazon Polly - além do áudio, gera também de forma sincronizada, a legenda ? Se não, qual a melhor maneira de ter áudio e legendas sincronizadas ?

已提问 1 年前122 查看次数
1 回答
0

Amazon Polly é um serviço de texto para fala que não gera legendas sincronizadas diretamente. No entanto, o Polly oferece uma funcionalidade que pode ajudar na sincronização de fala e texto.

O Polly fornece um fluxo de metadados adicional que inclui informações sobre quando frases, palavras e sons específicos estão sendo pronunciados. Essa funcionalidade permite que os desenvolvedores sincronizem a fala com elementos visuais, como animação facial ou destaque de palavras no estilo karaokê.

Para obter áudio e legendas sincronizadas, você pode usar essa funcionalidade de metadados do Polly em conjunto com outras ferramentas ou serviços da AWS. Por exemplo, você poderia:

  1. Usar o Amazon Polly para gerar o áudio e os metadados de tempo.
  2. Utilizar os metadados para criar legendas sincronizadas manualmente ou através de um script personalizado.
  3. Alternativamente, você poderia usar o Amazon Transcribe (serviço de fala para texto) para gerar uma transcrição do áudio com marcações de tempo, que poderia então ser usada como legenda.

Embora o Polly não gere legendas automaticamente, ele fornece as ferramentas necessárias para criar uma experiência sincronizada entre áudio e texto.
Sources
Amazon Polly Features
Community | All the things that Amazon Comprehend, Rekognition, Textract, Polly, Transcribe, and Others Do

已回答 1 年前

您未登录。 登录 发布回答。

一个好的回答可以清楚地解答问题和提供建设性反馈,并能促进提问者的职业发展。