スキップしてコンテンツを表示

Amazon Transcribe カスタム語彙における複合語の認識・登録に関する問い合わせ

0

Amazon Transcribe サポートご担当者様

お世話になっております。 Amazon Transcribeのカスタム語彙機能について、解決困難な問題に直面しております。 詳細な仕様の確認と、公式な解決策についてご教示いただきたく、ご連絡いたしました。

  1. 結論 日本語文字起こしにおいて、複合語「EM工」がスペースを含むem こうと出力される問題をカスタム語彙で修正しようと試みています。しかし、解決が不可能な状況です。 認識エンジンが出力するスペースを含むem こうを、カスタム語彙のPhraseに登録しようとすると、バリデーションエラーで登録できません。 代替案であるIPAでの発音指定を試みましたが、日本語の基本的な母音である「ウ」の音に対応するはずの音素uが、『サポートされていない文字』としてバリデーションエラーになります。 このため、複合語の分割問題を解決するための、あらゆる標準的なアプローチが塞がれております。

  2. 発生している問題 サービス: Amazon Transcribe 言語: 日本語 (ja-JP) 実現したいこと: 音声「イーエムコウ」を、単一の文字列「EM工」として正しく出力させる。 問題: 文字起こし結果が、意図せずスペースで分割されたem こうとなる。

  3. これまでに試したこと(経緯と結果の要約)

試行1:SoundsLikeによる試行 イーエムコウおよびイーエムコーを指定しましたが、結果はem こうのままでした。 区切り文字・はバリデーションエラーとなりました。

試行2:国際標準IPAに近い表記での試行 国際標準IPAに近い表記は、すべて「サポートされていない文字」としてバリデーションエラーとなりました。

試行3:AWSの(推測される)公式音素セットでの試行 長音を母音の繰り返しで表現するi i e m u k o oという表記を試しました。 結果:IPA にサポートされていない文字 ("u") が含まれています。 というエラーが発生しました。日本語の「ウ」の母音(ku, su, tsu, mu 等)を表現するために不可欠なuがエラーとなるため、これ以上有効な音素列を組み立てることができません。

試行4:誤認識文字列em こうをPhraseに指定 スペースを含むem こうはバリデーションエラーで登録不可でした。 スペースを含まないemこうでは、実際に出力されるem こうと一致せず、変換は適用されませんでした。

  1. AWSサポートへの具体的な質問 以上の経緯を踏まえ、以下の点について公式な見解と解決策をご教示ください。 日本語モデルにおける音素uの仕様について: なぜ日本語の基本的な母音であるuが、IPAのバリデーションで「サポートされていない文字」として扱われるのでしょうか。日本語の「ウ」の段の音(ku, su, mu等)を表現するための、正式にサポートされている音素記号をご教示ください。 単語分割問題への公式な対処法: 本件のように、認識エンジンがスペース区切りで出力する文字列を、カスタム語彙で正しく一つの単語として扱うための、正式に推奨されている方法はありますでしょうか。

お忙しいところ大変恐縮ですが、詳細な調査の上、ご回答いただけますと幸いです。 何卒よろしくお願い申し上げます。

質問済み 6ヶ月前135ビュー
3回答
0
承認された回答

Amazon Transcribeのカスタム語彙機能における日本語の複合語認識に関する問題について、ご質問ありがとうございます。ご指摘の問題は複雑で、現在のシステムの制限に起因する可能性があります。

  1. 日本語モデルにおける音素「u」の仕様について: 日本語の基本的な母音である「ウ」に対応する音素「u」がサポートされていないというのは、システムの不具合か設定の誤りである可能性が高いです。日本語の音素セットには「u」が含まれるべきです。正式にサポートされている日本語の音素記号のリストを確認し、必要に応じてアップデートする必要があるかもしれません。

  2. 単語分割問題への対処法: 現在のシステムでは、スペースを含む複合語をカスタム語彙に直接登録することは難しいようです。この問題に対する推奨される方法としては、以下のアプローチが考えられます:

a) カスタム言語モデルの使用: カスタム語彙だけでなく、カスタム言語モデルを作成することで、より文脈に応じた認識が可能になる場合があります。大量のドメイン固有のテキストデータを用いてモデルを訓練することで、「EM工」のような複合語の認識精度が向上する可能性があります。

b) 代替表記の試行: 「EM工」の代わりに「イーエムコウ」や「イーエムコー」などの代替表記をカスタム語彙に登録し、出力時に置換する方法を検討してください。

c) 後処理の実装: Transcribeの出力結果に対して、独自の後処理スクリプトを実装し、「em こう」を「EM工」に置換する方法も考えられます。

これらの方法でも問題が解決しない場合は、Amazon Transcribeの開発チームに直接フィードバックを提供し、日本語モデルの改善要求を行うことをお勧めします。

なお、カスタム語彙の制限や仕様は更新される可能性があるため、最新のドキュメントを参照し、サポートチームに具体的な使用例と共に問い合わせることで、より詳細な情報と解決策が得られる可能性があります。
Sources
Improving transcription accuracy with custom vocabularies and custom language models - Amazon Transcribe
Using a custom vocabulary - Amazon Transcribe

回答済み 6ヶ月前
0

もしAWSサポートからの公式な回答を希望されている場合は対象のAWSアカウントにサインインの上、下記URLからサポートケースを起票してみてはいかがでしょうか?

https://support.console.aws.amazon.com/support

回答済み 6ヶ月前
0

ご回答ありがとうございます。 ここが公式の場と勘違いしていました。 その後改めて調べていると以下のサイトにサウンドライク、IPAはサポートしなくなっていることがわかりました。 https://docs.aws.amazon.com/transcribe/latest/dg/custom-vocabulary-create-table.html

AIの回答にもあるようにカスタム言語の登録をしてみたいと思います。

回答済み 6ヶ月前

ログインしていません。 ログイン 回答を投稿する。

優れた回答とは、質問に明確に答え、建設的なフィードバックを提供し、質問者の専門分野におけるスキルの向上を促すものです。