Direkt zum Inhalt

Wie verbessere ich die Suchergebnisse und die Abrufgenauigkeit in den Amazon Bedrock-Wissensdatenbanken?

Lesedauer: 3 Minute
0

Ich möchte die Genauigkeit der Suchergebnisse in meinen Amazon Bedrock-Wissensdatenbanken verbessern.

Lösung

Verwenden der Basismodelle, um Dokumente zu parsen

Wenn die Dokumente komplex, unstrukturiert sind oder Domain-spezifische Terminologie enthalten, empfiehlt es sich, Basismodelle zum Analysieren von Dokumenten zu verwenden. Basismodelle verbessern das Abrufen komplexer Daten in Dokumenten wie verschachtelten Tabellen, Text in Bildern und grafischen Darstellungen von Text. Um anzupassen, wie das Basismodell die Dokumente parst, gib die Anweisungen an, die auf der Dokumentstruktur, Domain oder dem Anwendungsfall basieren.

Verwenden fortschrittlicher Chunking-Strategien

Verwende semantisches Chunking oder hierarchisches Chunking, um die Leistung von Retrieval Augmented Generation (RAG) zu verbessern.

Verwende semantisches Chunking für Dokumente ohne klare kontextuelle Abgrenzungen, wie z. B. juristische Dokumente oder technische Handbücher. Semantisches Chunking ermöglicht eine genauere Informationsextraktion und Manipulation.

Hinweis: Bei der Verwendung von semantischem Chunking fallen zusätzliche Kosten an. Die Kosten hängen davon ab, wie viele Daten du hast. Informationen zur Preisgestaltung findest du unter Amazon Bedrock-Preise.

Verwende hierarchisches Chunking für komplexe Dokumente mit einer verschachtelten Struktur, z. B. technische Dokumente oder wissenschaftliche Arbeiten mit komplexer Formatierung und verschachtelten Tabellen. Durch hierarchisches Chunking kannst du ein großes Dokument effektiv abrufen und darin navigieren. Verwende Basismodelle, um Daten zuerst zu analysieren, und verwende dann hierarchisches Chunking, um die Genauigkeit der generierten Antworten zu verbessern.

Verwende eine benutzerdefinierte AWS Lambda-Funktion, um den Chunking-Prozess an die RAG-Anwendungsanforderungen anzupassen.

Filtern der Metadaten

Verwende .csv-Dateien, um Metadaten in eine Datenquelle aufzunehmen. Verwende Spalten, um Inhaltsfelder und Metadatenfelder zu kennzeichnen, um die Anzahl der erforderlichen Dateien zu reduzieren und das Datenmanagement zu verbessern. Es hat sich bewährt, diese Funktion für große .csv-Dateidatensätze zu verwenden.

Füge Filter zu Dokumentfeldern oder -Attributen hinzu, um die Relevanz der Antworten zu verbessern. Die Datenquellen können Dokumentmetadatenattribute oder -Felder zum Filtern und Angeben der einzubettenden Felder enthalten. Weitere Informationen findest du unter Amazon Bedrock-Wissendatenbanken unterstützen jetzt die Metadatenfilterung, um die Abrufgenauigkeit zu verbessern.

Die Abfragen anpassen

Ändere eine komplexe Abfrage in kleinere, besser verwaltbare Unterabfragen. Wenn du die Abfrageanalyse verwendest, führt Amazon Bedrock mehrere Abfragen in der Wissensdatenbank aus. Informationen zum Ändern der Abfrage findest du auf der Registerkarte Query modifications (Abfrageänderungen) unter Configure and customize queries and response generation (Konfigurieren und Anpassen von Abfragen und Antwortgenerierung).

Standardmäßig gibt Amazon Bedrock bis zu fünf Ergebnisse zurück, die einem Quell-Chunk entsprechen, wenn du eine Wissensdatenbank abfragst. Um die Suchergebnisse zu verbessern, erhöhe die Anzahl der Quell-Chunks, die Amazon Bedrock zurückgibt. Informationen zum Erhöhen der Anzahl der Quell-Chunks findest du auf der Registerkarte Number of source chunks (Anzahl der Quell-Chunks) unter Configure and customize queries and response generation (Abfragen und Antwortgenerierung konfigurieren und anpassen).

Hybridsuche verwenden

Verwende die Hybridsuche für Funktionen mit mehreren Suchalgorithmen. Die semantische Suche liefert Antworten, die auf der Bedeutung des Textes basieren. Sie kann jedoch nicht alle relevanten Schlüsselwörter erfassen und hängt von der Qualität der Wörter ab, die du einbettest, um die Textbedeutung darzustellen. Die Hybridsuche kombiniert die semantische Suche mit der Stichwortsuche, um die Suchergebnisse zu verbessern.

Verwenden der Reranker-Modelle

Verwende Reranker-Modelle, um die Relevanz der von Amazon Bedrock abgerufenen Ergebnisse zu verbessern.

AWS OFFICIALAktualisiert vor 6 Monaten