Amazon Transcribe自定义词典错误:无效字符或者格式不正确的术语

0

【以下的问题经过翻译处理】 源码链接:https://github.com/aws-samples/amazon-transcribe-comprehend-podcast

步骤:

  1. 使用源代码自述文件中的“创建堆栈”按钮部署堆栈。使用默认配置。
  2. 按照源代码中的README文件中的说明,使用样例JSON文件启动RSS Step Functions状态机进行执行。

错误:

  1. Step Function失败,显示消息“Fail state executed in step: Processing Error”。 当我进一步分析Amazon Transcribe时,发现“自定义词汇表”作业失败。 并且错误提示为“Failure reason The vocabulary that you’re trying to create contains invalid characters or incorrectly formatted terms. See the developer guide for more information.”

现在不太清楚该如何处理。想知道如何诊断转录作业中具体的问题。

profile picture
エキスパート
質問済み 9ヶ月前71ビュー
1回答
0

【以下的回答经过翻译处理】 你好! 看起来,在创建自定义词汇表时,传递给Transcribe的单词格式不正确。 我检查了负责创建词汇表的lambda函数,并在示例中使用了以下术语

["-Hawn", "Cloud", "A-W-S-A-I-Services", "Amazon", "Code-Whisperer", "Pillir", "A-W-S", "S-A-P", "U-K-T-V", "Media-two-Cloud", "Marketplace", "Mainframe-Modernization", "E-M-R-Serverless", "E-M-R", "Apache", "Spark", "Hive", "Hawn", "Amazon-Connect", "Local-Measure", "low", "Intelligent-Automation"]

当创建自定义词汇表“-word”(在本例中为-Hawn,引发了该问题)时,不被接受,因此需要检查负责进行预处理的lambda函数-> podcast-transcribe-index-createTranscribeVocabular ***

希望这能帮助!

profile picture
エキスパート
回答済み 9ヶ月前

ログインしていません。 ログイン 回答を投稿する。

優れた回答とは、質問に明確に答え、建設的なフィードバックを提供し、質問者の専門分野におけるスキルの向上を促すものです。

質問に答えるためのガイドライン

関連するコンテンツ