Web Crawler が Amazon Bedrock ナレッジベースのデータソースに追加した URL のリストを確認したいです。
Web Crawler がデータソースに追加する URL を確認するには、取り込みジョブのログを記録するログ配信オプションをナレッジベースに追加する必要があります。取り込みログには、Web Crawler がデータソースに追加する URL が記録されます。取り込みジョブの完了後、Amazon CloudWatch Logs Insights を使用してログデータを分析します。
次の手順を実行します。
fields event.document_location.web_location.url | filter @message like 'IngestionJobId' and event.status like 'INDEXED'