Odczyt tekstu z dokumentu PDF

0

Witam,

Mam bardzo dużo drobnych pliczków w formacie PDF i chciałbym z nich wyciągnąć tekst, problem polega na tym, że nie wiem jak to zrobić. Znalazłem taką starą stronę http://www.delphi-zone.com/2010/02/how-to-read-text-from-a-pdf-doc-without-using-activex/ , zresztą na torry.net jest to samo, ale nigdzie NIE MA biblioteki acrobat.tbl, tak więc nie za bardzo wiem jak mam to zrobić, korzystam z delphi 7 i byłbym wdzięczny za wszelką pomoc.

0

Cześć,

Mam ten sam problem. Natomiast jeśli chodzi o twoje pytanie to:
Delphi: Component -> Import Component -> Import a Type Library -> Adobe Acrobat x Type Library

Natomiast! Nic ci po bibliotece, jeżeli nie masz zainstalowanego Adobe Acrobat (nie Reader).

Ja już pogodziłem się z tym faktem i szukam innego rozwiązania. Czy zna ktoś sposób na odkodowanie / odczytanie PDF'a z najzwyklejszego strumienia binarnego? W końcu jakoś musi iść te krzaki oczytać. Potrzebuje tylko literek, które występują w pliku. Muszę przeszukiwać pdf'y celem znalezienia odpowiednich słów. Tylko tyle. Nie potrzebuje znać innych detali, czy struktury dokumentu.

0

Co prawda wersja trial ale ogarnie wasze problemy http://www.foxitsoftware.com/pdf/sdk/activex/

0

Trial niestety nie ogarnie, ponieważ piszę "pełonosprawną" aplikację, która będzie wykorzystywana nie tylko przeze mnie. Wszystko musi działać jak najbardziej nie demo i nie trial.

0

PDF ze względu na swoją budowę niechętnie się dekompilują, nawet potężne narzędzia mają czasami z tym problem. A wy szukacie darmowego pod Delphi? No to odpowiedź jest prosta: NIE MA.

1 użytkowników online, w tym zalogowanych: 0, gości: 1