如何使用AWS Kendra 搜索手写文本 PDF?

0

【以下的问题经过翻译处理】 我有一份手写文字的扫描PDF文件,尝试使用AWS Kendra搜索其中内容,但是Kendra无法搜索到手写文字。我尝试使用textract和comprehend,但是这两种服务似乎对PDF文件的大小和页面数量有限制。有没有办法使Kendra能够搜索这些手写文字呢?

profile picture
EXPERTE
gefragt vor 8 Monaten63 Aufrufe
1 Antwort
0

【以下的回答经过翻译处理】 如果要进行手写识别,Textract是你最好的选择 - 它专为手写识别设计(而不只是手写识别)。而Kendra则专为语言和含义识别而设计。简单来说,一个是用于图像的卷积神经网络,另一个是用于语言的递归神经网络; RNN对图像的识别效果较差,而CNN则对语言的识别效果较差。 Textract 也有限制 - 对于PDF文件限制为3000页/500MB,如果你超出了这些限制可以考虑先拆分PDF文档,然后再将识别后的内容放入Kendra供搜索使用。

profile picture
EXPERTE
beantwortet vor 8 Monaten

Du bist nicht angemeldet. Anmelden um eine Antwort zu veröffentlichen.

Eine gute Antwort beantwortet die Frage klar, gibt konstruktives Feedback und fördert die berufliche Weiterentwicklung des Fragenstellers.

Richtlinien für die Beantwortung von Fragen