pdf-parsing

Ruby: czytanie plików PDF

Szukam szybkiego i niezawodnego sposobu na odczyt / parsowanie dużych plików PDF w Ruby (na Linuksie i OSX). Do tej pory zn ... rzeoczyłem? Czy istnieje narzędzie, które jest lepiej dostosowane (szybsze i bardziej niezawodne), aby rozwiązać mój problem?

Wyodrębnianie zawartości tabeli ze zbioru plików PDF [zamknięty]

Mam stos plików PDF-potencjalnie setki lub tysiące. Nie wszystkie są sformatowane tak samo, ale każda z nich może mieć jedną ... lepsze haki, teraz jest dobry czas, aby o tym wiedzieć. Ogólne wskaźniki dobre; zdecydowanie preferowany byłby kod startowy.