Passer au contenu

Comment améliorer les résultats de recherche et la précision de la récupération dans les bases de connaissances Amazon Bedrock ?

Lecture de 4 minute(s)
0

Je souhaite améliorer la précision des résultats de recherche dans mes bases de connaissances Amazon Bedrock.

Résolution

Utiliser des modèles de fondation pour analyser des documents

Lorsque les documents sont complexes, non structurés ou contiennent une terminologie spécifique à un domaine, il est recommandé d'utiliser des modèles de fondation pour analyser des documents. Les modèles de fondation améliorent la récupération de données complexes dans des documents tels que des tables imbriquées, du texte dans des images et des représentations graphiques du texte. Pour personnaliser la façon dont le modèle de fondation analyse vos documents, fournissez des instructions en fonction de la structure de votre document, de votre domaine ou de votre cas d'utilisation.

Utiliser des stratégies de découpage avancées

Utilisez le découpage sémantique ou le découpage hiérarchique pour améliorer les performances de la génération à enrichissement contextuel (RAG).

Utilisez le découpage sémantique pour les documents sans limites contextuelles claires, tels que les documents juridiques ou les manuels techniques. Le découpage sémantique permet une extraction et une manipulation plus précises des informations.

Remarque : L'utilisation du découpage sémantique entraîne des coûts supplémentaires. Le coût dépend de la quantité de données dont vous disposez. Pour plus d'informations sur la tarification, consultez la section Tarification d'Amazon Bedrock.

Utilisez le découpage hiérarchique pour les documents complexes dotés d'une structure imbriquée, tels que les documents techniques ou les articles académiques présentant une mise en forme complexe et des tables imbriquées. Le découpage hiérarchique vous permet de récupérer et de parcourir efficacement un document de grande taille. Utilisez des modèles de fondation pour analyser d'abord les données, puis utilisez le découpage hiérarchique pour améliorer la précision des réponses générées.

Pour personnaliser le processus de découpage en fonction des exigences de votre application RAG, utilisez une fonction AWS Lambda personnalisée.

Filtrer vos métadonnées

Utilisez des fichiers .csv pour inclure des métadonnées dans une source de données. Pour réduire le nombre de fichiers requis et améliorer la gestion de vos données, utilisez des colonnes pour désigner les champs de contenu et les champs de métadonnées. Il est recommandé d'utiliser cette fonctionnalité pour les jeux de données de fichiers .csv volumineux.

Ajoutez des filtres aux champs ou aux attributs du document pour améliorer la pertinence des réponses. Vos sources de données peuvent inclure des attributs de métadonnées de documents ou des champs pour filtrer et spécifier les champs à intégrer. Pour plus d'informations, consultez la section Les bases de connaissances Amazon Bedrock prennent désormais en charge le filtrage des métadonnées pour améliorer la précision de la récupération.

Personnaliser vos requêtes

Modifiez une requête complexe en sous-requêtes de plus petite taille et plus faciles à gérer. Lorsque vous utilisez la décomposition de requêtes, Amazon Bedrock exécute plusieurs requêtes dans votre base de connaissances. Pour modifier votre requête, consultez l'onglet Modifications de requêtes dans Configurer et personnaliser les requêtes et la génération de réponses.

Par défaut, Amazon Bedrock renvoie jusqu'à cinq résultats correspondant à un segment source lorsque vous interrogez une base de connaissances. Pour améliorer vos résultats de recherche, augmentez le nombre de segments source renvoyés par Amazon Bedrock. Pour augmenter le nombre de segments source, consultez l'onglet Nombre de segments source dans Configurer et personnaliser les requêtes et la génération de réponses.

Utiliser la recherche hybride

Pour bénéficier des fonctionnalités d'algorithme de recherche multiple, utilisez la recherche hybride. La recherche sémantique fournit des réponses en fonction de la signification du texte. Cependant, il ne peut pas capturer tous les mots-clés pertinents et repose sur la qualité des mots que vous intégrez pour représenter le sens du texte. La recherche hybride combine la recherche sémantique et la recherche par mot-clé pour améliorer les résultats de recherche.

Utiliser des modèles de reclassement

Utilisez des modèles de reclassement pour améliorer la pertinence des résultats récupérés par Amazon Bedrock.

AWS OFFICIELA mis à jour il y a 6 mois