juil 20

Il existe diverses outils pour générer ou travailler sur des fichiers PDF de nos jours.
Intéressons-nous plus particulièrement aux librairies Java permettant de générer ou de parser des PDF sans avoir besoin d’un quelconque outil d’Adobe.


Aspose

Aspose est une société commerciale proposant 2 solutions payantes gravitant autour des problématiques PDF.
La 1ère, Aspose.Pdf for Java, conviendra a la plus part des utilisateurs. Cette librairie permet de lire, écrire ou manipuler des documents PDF. Celle-ci est limitée a la création de documents PDF : l’édition de documents existants n’est pas possible.
La 2ième, Aspose.Pdf.Kit for Java, englobe les fonctionnalités de la précédente mais l’enrichit de fonctionnalités avancées : gestion des champs des formulaires embarqués dans des documents PDF, édition de documents existants, etc…

Ces 2 solutions s’inscrivent dans une gamme de produits plus larges (documents Word, documents Excel, etc ..).

Points positifs :

  • 2 produits à des tarifs différents pour des utilisations différentes.
  • Intégration à une gamme de produits variés (Word, Excel, Powerpoint, etc…).

Points négatifs :

  • Produits payants, surtout la version ‘basique’ qui ne nécessite pas forcément une solution commerciale.

iText

iText est une solution Open-Source par Bruno Lowagie. Cette solution offre toutes les fonctionnalités classiques de génération de documents PDF, ainsi que la possibilité d’éditer des documents existants. Elle permet aussi de remplir les formulaires intégrés aux PDFs.
Attention : la licence d’iText a changé depuis Décembre 2009 (version 5.0). Désormais iText est sous licence Affero General Public License (AGPL).

Points positifs :

  • Le produit permet de faire tout ce qu’on attend d’une API de gestion des documents PDF.
  • Produit ayant une grande expérience (1998).
  • iText est très bon pour la génération de documents.

Points négatifs :

  • Documentation difficile à trouver: les tutoriaux ont été supprimés, désormais il faut acheter le livre ‘iText in Action’.
  • L’extraction de données n’est pas le fort d’iText.

PDFBox

PDFBox est un projet de la fondation Apache. Il permet la création de nouveaux documents PDF, la manipulation de documents existants et la possibilité d’en extraire des données.
Il ne permet pas de modifier ou de remplir les formulaires des documents PDF.

Points positifs :

  • Très bon en extraction de données (avec notamment une intégration Lucene Search Engine).
  • License Apache License v2.0.
  • Documentation nettement plus fournie qu’iText.

Points négatifs :

  • Ne gère pas les formulaires PDF.

Conclusion

  • Si votre projet utilise déjà un produit Aspose, autant garder votre environnement technique homogène.
  • Si votre principale activité est l’extraction de données (par exemple extraire des données de documents pour un moteur de recherche), alors jetez vous sur PDFBox qui est fait pour vous.
  • Si vous voulez rester ouvert à toutes les possibilités, prenez iText qui résoudras 95% de vous contraintes.

One Response to “Comparatif des librairies PDF en Java”

Leave a Reply


Creative Commons License
Blog Infin-It par Infin-It est mis à disposition selon les termes de la licence Creative Commons Paternité-Pas d'Utilisation Commerciale 2.0 France.