|
Publié le par Ernest RIBEIRO

PDFBox

Comment manipuler des fichiers PDF en Java avec la librairie Apache PDFBox ?

Qu'est-ce que c'est ?

PDFBox est une librairie développée par la fondation Apache, elle permet de manipuler, générer ou encore modifier le contenu d'un fichier PDF.

Dépendance Maven

Pour ce qui est de la dépendance, vous pouvez selectionner la version de votre choix parmi celles de cette liste (Les tutoriels du site se font sur la version 2.0.5).

Voici la dépendance à insérer dans votre fichier pom.xml.

<dependency>
    <groupId>org.apache.pdfbox</groupId>
    <artifactId>pdfbox</artifactId>
    <version>2.0.5</version>
</dependency>

Vous pouvez ensuite l'importer dans votre fichier grâce à celle ligne :

import org.apache.pdfbox.pdmodel.PDDocument;

Comment charger un PDF ?

Pour charger un fichier PDF existant, il vous suffit d'appeler la méthode static load de la classe PDDocument, ce qui donne :

PDDocument myDocument = PDDocument.load(new File("chemin/vers/mon/fichier.pdf"));

Apres avoir fait vos manipulations sur le fichier, vous pouvez le sauvegarder grâce à la méthode save, par exemple :

// Je charge mon fichier
PDDocument myDocument = PDDocument.load(new File("chemin/vers/mon/fichier.pdf")); 
// ... Quelques actions plus tard
// Je le sauvegarde
myDocument.save("fichier_généré_1.pdf");