linux下如何從pdf檔案中提取和儲存影象

在Linux中,您可以使用“pdftotext”命令列工具輕鬆地將PDF檔案轉換為可編輯文字。但是,如果原始PDF檔案中有任何影象,則不會提取這些影象。要從PDF檔案中提取影象,可以使用另一個名為“pdfimages”的命令列工具。...

linux下如何從pdf檔案中提取和儲存影象

在Linux中,您可以使用“pdftotext”命令列工具輕鬆地將PDF檔案轉換為可編輯文字。但是,如果原始PDF檔案中有任何影象,則不會提取這些影象。要從PDF檔案中提取影象,可以使用另一個名為“pdfimages”的命令列工具。

注意:當我們說要在本文中鍵入一些內容,並且文本週圍有引號時,不要鍵入引號,除非我們另有規定。

“pdfimages”工具是poppler utils包的一部分。您可以檢查它是否安裝在您的系統上,並在必要時使用本文中描述的步驟進行安裝。

要使用pdfimages從PDF檔案提取影象,請按“Ctrl+Alt+T”開啟終端視窗。在提示符處鍵入以下命令。

pdfimages /home/lori/Documents/SampleWithImages.pdf /home/lori/Documents/ExtractedImages/image

注意:對於本文中顯示的所有命令,請將命令中的第一個路徑和PDF檔名替換為原始PDF檔案的路徑和檔名。第二個路徑應該是要將提取的影象儲存到的根資料夾的路徑。第二條路徑末尾的單詞“image”表示您想在檔名前面加上的任何內容。影象的檔名會自動編號(000、001、002、003等)。如果要在每個影象的開頭新增文字,請在第二個路徑的末尾輸入該文字。在我們的示例中,每個影象檔名都將以“image”開頭,例如image-001.ppm、image-002.ppm等。在指定的文字和數字之間添加了一個破折號。

linux下如何從pdf檔案中提取和儲存影象

對於非單色影象,預設影象格式為PPM(行動式pixmap),對於單色影象,預設影象格式為PBM(行動式點陣圖)。這些格式被設計成可以在平臺之間輕鬆地交換。

注意:PDF檔案中的每個影象可能有兩個影象檔案。每個影象的第二個影象都是空白的,因此,您可以透過檔案管理器中檔案的縮圖來判斷哪些影象包含檔案中的影象。

linux下如何從pdf檔案中提取和儲存影象

要建立.jpg影象檔案,請將“-j”選項新增到命令中,如下所示。

pdfimages -j /home/lori/Documents/SampleWithImages.pdf /home/lori/Documents/ExtractedImages/image

注意:您還可以使用“-PNG”選項將預設輸出更改為PNG,或使用“-TIFF”選項將TIFF更改為PNG。

linux下如何從pdf檔案中提取和儲存影象

每個影象的主影象檔案儲存為.jpg檔案。第二個空白影象仍然是.ppm或.pbm檔案。

linux下如何從pdf檔案中提取和儲存影象

如果只想在某個頁面上和之後轉換影象,請使用“-f”選項和數字來指示要轉換的第一個頁面,如下面的命令示例所示。

pdfimages -f 2 -j /home/lori/Documents/SampleWithImages.pdf /home/lori/Documents/ExtractedImages/image

注意:我們將“-j”選項和“-f”選項組合在一起,這樣就可以得到.jpg影象,下面提到的“-l”選項也是這樣做的。

linux下如何從pdf檔案中提取和儲存影象

要轉換某一頁之前和上的所有影象,請使用“-l”(小寫字母“l”,而不是數字“1”)選項和數字來指示要轉換的最後一頁,如下所示。

pdfimages -l 1 -j /home/lori/Documents/SampleWithImages.pdf /home/lori/Documents/ExtractedImages/image

注意:您可以同時使用“-f”和“-l”選項來轉換文件中間特定頁面範圍中的影象。

linux下如何從pdf檔案中提取和儲存影象

如果PDF檔案上有所有者密碼,請使用“-opw”選項並將密碼用單引號括起來,如下所示。如果PDF檔案上的密碼是使用者密碼,請使用“-upw”選項代替密碼。

注意:確保命令中的密碼周圍有單引號。

pdfimages -opw ‘password’ -j /home/lori/Documents/SampleWithImages.pdf /home/lori/Documents/ExtractedImages/image

linux下如何從pdf檔案中提取和儲存影象

有關使用pdfimages命令的詳細資訊,請在終端視窗的提示下鍵入“pdfimages”,然後按“Enter”。將顯示命令用法,其中包含可在命令中使用的選項列表。

  • 發表於 2021-04-10 06:14
  • 閱讀 ( 41 )
  • 分類:網際網路

你可能感興趣的文章

如何透過5個簡單步驟突出顯示pdf檔案中的文字

... 相關:如何在Windows10中從PDF中提取頁面 ...

  • 發佈於 2021-03-11 02:40
  • 閲讀 ( 61 )

如何對mac上的檔案和資料夾進行密碼保護

... 今天我們將介紹如何在Mac上保護單個檔案和資料夾的密碼。 ...

  • 發佈於 2021-03-14 01:15
  • 閲讀 ( 51 )

使用camscanner for android掃描手機上的文件

...也是最著名的名字之一:CamScanner。在本文中,我將解釋如何使用這個應用程式,並向您介紹它的幾個鮮為人知的特性 ...

  • 發佈於 2021-03-14 06:03
  • 閲讀 ( 47 )

如何將多個iso檔案合併到一個可引導的iso映像中

... 現在,下面是如何將多個ISO影象合併為一個。 ...

  • 發佈於 2021-03-15 06:33
  • 閲讀 ( 107 )

如何從pdf中提取影象並在任何地方使用它們

... 有許多工具可以修補PDF文件。今天,我們就來看看如何像鎖匠一樣挑它,“偷”一個形象,出來不留痕跡。讓我們看看從PDF中提取影象的一些方法。 ...

  • 發佈於 2021-03-17 18:01
  • 閲讀 ( 45 )

什麼是人工智慧檔案?如何開啟它沒有adobe illustrator

... 如何在沒有illustrator的情況下開啟ai檔案 ...

  • 發佈於 2021-03-17 22:39
  • 閲讀 ( 54 )

如何建立自己的私有自託管ReadItLater應用程式

... 讓我們看看如何在計算機中建立Instapaper或Pocket的克隆,而不會丟失任何網頁資源。 ...

  • 發佈於 2021-03-19 09:29
  • 閲讀 ( 54 )

如何用wget將多個網頁轉換成pdf

...藉助於一些指令碼或應用程式和此工具,我們將向您演示如何將多個網頁儲存到PDF檔案中。 ...

  • 發佈於 2021-03-19 11:02
  • 閲讀 ( 51 )

10個提示,可以在google drive上使用pdf檔案

... 如果你想學習如何在谷歌驅動器中合併PDF檔案,PDF Mergy將得到所有的答案。它易於使用,並提供了優異的結果。 ...

  • 發佈於 2021-03-19 15:14
  • 閲讀 ( 53 )

如何在iphone和ipad上管理pdf檔案

... 因此,在使用iPhone或iPad時,瞭解如何管理pdf是非常必要的。無論您想儲存、共享、簽名、編輯或列印它們,這裡有一些簡單的方法來管理裝置上的PDF檔案。 ...

  • 發佈於 2021-03-24 07:40
  • 閲讀 ( 58 )