Ich habe viele PDFs die nur aus Bildern bestehen (gescannte Bücher). Kennt jemand von euch einen guten weg diese in Text&(Hintergrund-)Bild umzuwandeln? (Immer noch PDF)
1. Ausdrucken
2. Einscannen
3. OCR-isieren
4. Text in ein Textbearbeitungs-Programm kopieren
5. Daraus ein PDF machen
Have Lot of Fun!
Jezt mal im ernst: wenn du es günstig haben willst musst du das selber basteln. (Ehrlich gesagt habe ich auch nicht lange recherchiert) Dabei könnte dir folgendes helfen:
http://sourceforge.net/projects/oocr/ und
http://sourceforge.net/projects/itext/ oder als C/C++ - Alternative
http://sourceforge.net/projects/libharu/