Textract是如何识别PDF中的文本的?

0

【以下的问题经过翻译处理】 请问Textract是如何识别PDF中的文本的?就是那种可以直接贴到记事本中的纯文本。 Textract是直接使用PDF中包含的文本,还是先把PDF当成图片,然后通过OCR识别的?

profile picture
EXPERTE
gefragt vor 9 Monaten35 Aufrufe
1 Antwort
0

【以下的回答经过翻译处理】 后者。先当成图片,然后OCR识别。

profile picture
EXPERTE
beantwortet vor 9 Monaten

Du bist nicht angemeldet. Anmelden um eine Antwort zu veröffentlichen.

Eine gute Antwort beantwortet die Frage klar, gibt konstruktives Feedback und fördert die berufliche Weiterentwicklung des Fragenstellers.

Richtlinien für die Beantwortung von Fragen