Suite à la mise en place de Spring Batch 2.1 chez un client, voici quelques recommandations afin d’éviter une catastrophe technique.
- Est-ce que votre traitement est un Batch ?
- Avez-vous une gestion de la Persistance ‘Maison’ ?
- Envie de paralléliser des exécutions de requêtes SQL ?
Il faut savoir que Spring Batch a été développé dans la logique des Batchs tels qu’ils existaient dans les gros systèmes : un Batch est une répétition en très grand nombre d’opérations unitaires (work unit).
Le mode de fonctionnement de Spring Batch est très lié à ce modèle.
Il est donc complètement inutile de se lancer dans l’implémentation de ce framework si l’organisation de votre traitement ne suit pas ce modèle.
Je pense notamment à des traitements qui executeraient des updates SQL massifs : il ne sert à rien de construire une suite de Steps qui lanceront chacunes un update massif. Il faut construire une Step unique qui lancera un traitement complet sur un élément unitaire (appelé chunk dans le langage Spring Batch).
Pour bénéficier de la puissance de Spring Batch, il est important que votre couche de persistance soit homogène : elle doit être full Hibernate, full iBatis ou full Spring JDBC et ne pas comporter d’éléments ‘homemade’.
La gestion des transactions dans le batch est déléguée au TransactionManager, le développeur n’a plus la main dessus.
Attention !
Si vous souhaitez multithreader des requêtes potentiellement longues avec Spring Batch, il vous faudra mettre en place du JTA. En effet, votre TransactionManager va devoir gérer une transaction ‘chapeau’ qui gèrera elle-même une transaction par thread.
D’où JTA. Ceci est dû au fait qu’une connection à la base de données ne peut pas être accédée simultanément par plusieurs threads (l’objet Connection n’est pas thread-safe).



Bonjour,
je me permets de réagir à votre article très intéressant sur Spring Batch pour vous poser la question suivante :
- Je suis d’une application web dont certains actions (synchrones) peuvent entrainer des temps d’attente importante : je suis souhaiterai désynchronisé ce type de tâche pour permettre à l’utilisateur de reprendre la main et continuer à exécuter ce traitement lourd (ex : production de documents Xls ou Pdf en tâche de fond) => Spring Batch peut-il être le bon choix en considérant un nombre d’utilisateur important et une nécessaire de maitrisé le nombre de task en paralèlle ?
Merci de votre retour.
Bonjour,
je vous conseillle plutôt d’utiliser la combinaison Runnable / TaskExecutor (dispo depuis le jdk 1.5).
Mettez le lancement de votre code métier dans un Runnable, puis exécutez le par un taskExecutor (plusieurs au choix).
La config du TaskExecutor vous permet de gérer les threads dispos (même changeable à chaud par JMX), ainsi que le comportement de celui-ci : parallélisation, avec ou sans file d’attente, etc …
Interessant,
Merci pour ce partage