Képek kivonatolása és mentése PDF fájlból Linux alatt

Képek kivonatolása és mentése PDF fájlból Linux alatt
Képek kivonatolása és mentése PDF fájlból Linux alatt

Videó: Képek kivonatolása és mentése PDF fájlból Linux alatt

Videó: Képek kivonatolása és mentése PDF fájlból Linux alatt
Videó: Meeting #5 - 4/29/2022 | ETF team meeting and dialogue - YouTube 2024, Lehet
Anonim
A PDF fájlokat egyszerűen szerkesztheti szerkeszthető szöveggé a Linux alatt a "pdftotext" parancssori eszköz használatával. Azonban, ha az eredeti PDF-fájlban bármilyen kép található, azok nem lesznek kibontva. A képek PDF fájlból történő kivételéhez használhat egy másik, a "pdfimages" nevű parancssori eszközt.
A PDF fájlokat egyszerűen szerkesztheti szerkeszthető szöveggé a Linux alatt a "pdftotext" parancssori eszköz használatával. Azonban, ha az eredeti PDF-fájlban bármilyen kép található, azok nem lesznek kibontva. A képek PDF fájlból történő kivételéhez használhat egy másik, a "pdfimages" nevű parancssori eszközt.

MEGJEGYZÉS: Ha azt mondjuk, hogy írunk valamit ebben a cikkben, és vannak idézőjelek a szöveg körül, NE írja be az idézőjeleket, hacsak másképp nem jelöljük.

A "pdfimages" eszköz a poppler-utils csomag része. Ellenőrizheti, hogy telepítve van-e a rendszerében, és ha szükséges, telepítse a cikkben ismertetett lépéseket.

A képek PDF-fájlból való kitöltéséhez pdfimages segítségével a "Ctrl + Alt + T" megnyomásával megnyithat egy terminál ablakot. Írja be a következő parancsot a parancssorba.

pdfimages /home/lori/Documents/SampleWithImages.pdf /home/lori/Documents/ExtractedImages/image

MEGJEGYZÉS: A cikkben ismertetett parancsok helyett a parancs első elérési útját és a PDF fájlnevet az eredeti PDF fájl elérési útjára és fájlnevére cserélje. A második elérési utat a gyökérkönyvtár elérési útvonalának kell lennie, amelybe a kivont képeket el kívánja menteni. A második kép végén a "kép" szó azt jelöli, amit a filenévvel előzetesen meg akarsz előterjeszteni. A képek fájlnevei automatikusan számozásra kerülnek (000, 001, 002, 003, stb.). Ha szöveget szeretne felvenni az egyes képek elejére, adja meg azt a szöveget a második elérési út végén. A példánkban minden képfájlnév "kép" -el kezdődik, például a 001.ppm, image-002.ppm stb. Segítségével. Egy kötőjelet ad meg a megadott szöveg és a szám között.

Az alapértelmezett képformátum PPM (hordozható pixmap) nem monokróm képekhez vagy PBM (hordozható bittérkép) a monokróm képekhez. Ezeket a formátumokat úgy tervezték, hogy könnyen cserélhetők a platformok között.
Az alapértelmezett képformátum PPM (hordozható pixmap) nem monokróm képekhez vagy PBM (hordozható bittérkép) a monokróm képekhez. Ezeket a formátumokat úgy tervezték, hogy könnyen cserélhetők a platformok között.

MEGJEGYZÉS: A PDF fájlban minden képhez két képfájlt kaphat. A második kép minden egyes kép esetében üres, ezért meg tudja adni, hogy a fájlok mely képeket tartalmazzák a fájlban a fájlkezelőben lévő fájl miniatűrje alapján.

A.jpg képfájlok létrehozásához add hozzá a "-j" opciót a parancshoz, az alábbiak szerint.
A.jpg képfájlok létrehozásához add hozzá a "-j" opciót a parancshoz, az alábbiak szerint.

pdfimages -j /home/lori/Documents/SampleWithImages.pdf /home/lori/Documents/ExtractedImages/image

MEGJEGYZÉS: Az alapértelmezett kimenetet PNG-vel is megváltoztathatja a "-png" vagy a TIFF használatával a "-tiff" opció használatával.

Az egyes képek fő képfájlja.jpg fájlként kerül mentésre. A második üres kép még mindig egy.ppm vagy.pbm fájl.
Az egyes képek fő képfájlja.jpg fájlként kerül mentésre. A második üres kép még mindig egy.ppm vagy.pbm fájl.
Ha csak egy bizonyos oldalra és egy bizonyos oldalra szeretné konvertálni a képeket, akkor használja a "-f" opciót egy számmal, hogy jelezze az első átváltandó oldalt, amint az az alábbi példában látható.
Ha csak egy bizonyos oldalra és egy bizonyos oldalra szeretné konvertálni a képeket, akkor használja a "-f" opciót egy számmal, hogy jelezze az első átváltandó oldalt, amint az az alábbi példában látható.

pdfimages -f 2 -j /home/lori/Documents/SampleWithImages.pdf /home/lori/Documents/ExtractedImages/image

MEGJEGYZÉS: A "-j" opciót a "-f" opcióval kombináltuk, így a.jpg képeket kaptuk, és ugyanezt tettük az alábbi "-l" opcióval is.

Az összes kép előtti és egy adott oldalra történő konvertálásához használja az "-l" (kisbetűs "L", nem az "1" szám) opciót egy számmal, hogy jelezze a legutóbb konvertált oldalt, az alábbiak szerint.
Az összes kép előtti és egy adott oldalra történő konvertálásához használja az "-l" (kisbetűs "L", nem az "1" szám) opciót egy számmal, hogy jelezze a legutóbb konvertált oldalt, az alábbiak szerint.

pdfimages -l 1 -j /home/lori/Documents/SampleWithImages.pdf /home/lori/Documents/ExtractedImages/image

MEGJEGYZÉS: Az "-f" és a "-l" opciókat együtt használhatja a képek közepén történő átszámításhoz.

Ha a tulajdonos jelszava a PDF-fájlban található, használja az "-opw" opciót és a jelszót egyes idézőjelekben, az alábbiak szerint. Ha a PDF-fájlban lévő jelszó egy felhasználói jelszó, használja a "-upw" opciót a jelszóval.
Ha a tulajdonos jelszava a PDF-fájlban található, használja az "-opw" opciót és a jelszót egyes idézőjelekben, az alábbiak szerint. Ha a PDF-fájlban lévő jelszó egy felhasználói jelszó, használja a "-upw" opciót a jelszóval.

MEGJEGYZÉS: Győződjön meg róla, hogy a parancsban vannak egyetlen idézetek a jelszó körül.

pdfimages -opw ‘password’ -j /home/lori/Documents/SampleWithImages.pdf /home/lori/Documents/ExtractedImages/image

Ajánlott: