dissabte, de març 23, 2019

Com extreure el text i les imatges d'un pdf

Entenem que el pdf ńo està protegit i que treballem amb Linux.

Primer treiem el text i les imatges del pdf

1. Text
pdftotext arxiu.pdf arxiu.txt

També podem seleccionar tot el text o copiar-ho amb Ctrl-C i enganxar-ho amb Contrl-V

2. Imatges
pdfimages -f 1 -l 999 -png arxiu.pdf prefix
  -f        : first page to convert
  -l        : last page to convert

3. Per fer una presentació podem fer un Impress enganxant el text a Esquema, el separem en diapositives i afegim les imatges O utilitzar Tiddlywiki

El desem

4. Opcionalment l'importem a google slides

Cap comentari:

Publica un comentari a l'entrada