
Ce soir, mardi 6 décembre, aura lieu au Google Technology User Group de Nantes une soirée « BigTable et NoSQL » que j’aurai le plaisir d’animer.
La manipulation de volumes gigantesques de données est derrière toutes les innovations populaires du géant de Mountain View. Pour répondre à ses besoins hors normes, Google a rapidement pris le parti de développer ses propres outils puis d’en partager les principes publiquement. Ces idées ont depuis fait leur chemin, inspiré tout un mouvement technologique et créé une approche différente du traitement de données en masse.
Dès lors, quel est l’intérêt de ce nouveau mouvement pour les acteurs forcément plus modestes ? Comment ces technologies peuvent apporter innovation et renouveau au sein des applications traditionnelles ? Voilà autant de questions auxquelles la présentation de ce soir tentera de répondre après avoir fait un tour d’horizon de NoSQL et BigData tel qu’inspiré par Google.
Si vous êtes intéressés, n’hésitez pas à vous inscrire, des places sont encore disponibles !

Les applications d’entreprises sont en train de connaître une révolution. Alors qu’hier ces applications avaient pour but d’accompagner l’entreprise en améliorant sa productivité, elles deviennent aujourd’hui un moteur d’innovation et de croissance grâce à des comportements plus intelligents, plus connectés, plus mobiles. Les nouveaux cas d’usages fleurissent de toutes parts. Une telle audace est permise par un éco-système technique en pleine évolution : Cloud Computing, NoSQL/BigData, applications mobiles, géo-localisation, ou encore technologies temps réels.
J’aurai le plaisir, vendredi 16 septembre, de présenter au JUG Summer Camp à La Rochelle un tour d’horizon de ces nouvelles possibilités et de leur impact tant sur le métier que sur la technique.
Les inscriptions sont malheureusement closes, mais si vous n’avez pu obtenir une place ou que vous ne pouviez tout simplement pas être dans la région ce vendredi, vous pourrez tout de même profiter des vidéos de chacune des sessions qui devraient être diffusées rapidement après la conférence.

Demain 17 juin se tiendra à Rennes la première édition de la conférence BreizhCamp qui réunira plus de 200 personnes provenant de différentes communautés Java, .Net, Ruby, Python ou encore PHP.
J’aurai le plaisir d’y présenter une session titrée « Elasticité et haute disponibilité avec Cassandra », qui fera un tour d’horizon de cette base de données, des aspects théoriques à sa mise en œuvre.
Pour rappel, Cassandra est une base de données NoSQL initialement développée par Facebook qui brille par son architecture symétrique lui conférant une parfaite élasticité en accord avec les préceptes du Cloud Computing. Mais elle offre également d’autres propriétés particulièrement attirantes telles qu’une faible latence et une tolérance aux pannes d’une machine, d’un rack ou d’un Datacenter. Son modèle de données, certes moins riche que ce que le monde relationnel propose, s’avère tout à fait adapté à de nombreux cas d’utilisation dans le monde du Web.
Les inscriptions sont déjà closes mais je serai ravi de rencontrer ceux qui ont pu s’inscrire pour discuter de ce sujet et des bases de données distribuées de manière générale !


Vous trouverez ci dessous les slides de « NoSQL and In Memory Data Grids from a developer perspective », le sujet que nous avons présenté à GeeCon 2011.
Merci encore à tous ceux qui sont venus, merci aux organisateurs. Et pour tous ceux qui ne sont pas venus à Cracovie, nous vous recommandons cette très belle conférence !
Here is the « NoSQL and In Memory Data Grids from a developer perspective » presentation we made at GeeCon 2011.
Thanks to all the people who came to listen to us, thanks to the organization team and for those who didn’t come to Krakow, we recommend you this wonderful conference!
Lire la suite de cet article »

Le projet Lucene a été fondé il y a une dizaine d’années maintenant, pourtant son potentiel n’est pas toujours pleinement perçu.
Souhaitant montrer ce qu’il est possible de réaliser avec ce framework, je ferai une présentation jeudi 19 mai à 19h au Bordeaux JUG titrée « Les moteurs de recherche pour l’entreprise ».
Le but est d’y présenter quelques concepts théoriques suivi d’un tour d’horizon des possibilités offertes par Lucene et des indexes de recherche en général : gestion des fautes de frappe, moteurs de recherche conscients du métier, pondération statique et dynamique des résultats, faceted search, ou encore obtention des documents similaires. Le propos sera ensuite élargi vers les solutions disponibles pour mettre en oeuvre Lucene dans un environnement distribué : Solr, ElasticSearch, Hibernate Search, …
Des places sont encore disponibles, donc si vous êtes dans la région de Bordeaux ce jeudi, n’hésitez pas à nous rejoindre !

Les bases de données relationnelles constituent le stockage de facto pour les applications d’entreprises. Toutefois, pendant les années 2000, des solutions alternatives ont émergé.
Du coté des applications d’entreprises, les in-memory datagrids ont été développées pour offrir une très faible latence pour l’accès aux données, principalement pour satisfaire les besoins du marché de la finance.
Du coté du Web, des bases de données distribuées, plus tard baptisées NoSQL, ont été créées pour palier à des besoins extrêmes en termes de scalabilité et de disponibilité de quelques très grands sites. Ces deux familles de technologies méritent maintenant d’être prises en compte lors du design des applications d’entreprises.
A partir de mercredi prochain se déroulera à Cracovie en Pologne la conférence GeeCon qui s’affirme année après année comme un rendez-vous incontournable de la communauté Java en Europe de l’Est. Cyrille Le Clerc et Michaël Figuière y présenteront une session titrée « NoSQL & DataGrid from a Developer Perspective« , qui aura pour but d’offrir une vision claire des spécificités de ces deux technologies afin de faciliter leur choix et leur intégration au sein d’un projet.
Les bases de données NoSQL et les DataGrids sont encore rarement étudiées simultanément, aussi nous aurons très probablement l’occasion de vous reparler de ce sujet à l’avenir !

La semaine prochaine se tiendra la conférence Mix-IT (prononcez « mixité ») à Lyon. 25 speakers animeront la journée dans 5 salles en parallèle. Le but est de fournir des sujets variés et complémentaires, autour de 5 thèmes :
- Techy : Java et son écosystème
- Agility : L’agilité pour débutants et passionnés
- Trendy : Tendances novatrices et avant-gardistes
- Mixy : Le meilleur de l’agilité et des technologies Java
- Gamy : Jeux agiles et coding dojos
Cet évènement est organisé par le Lyon JUG et le Club Agile Rhône-Alpes.
En vrac, on y parlera de : Play!, Product Owner, Clojure, Coaching agile, Apache Mahout, BDD, Grails, DevOps, Spock, HTML5, Code retreat et bien d’autres sujets.
Vous pouvez découvrir le programme complet à cette adresse.
Xebia participe à cet évènement en animant 2 slots :
Les places sont comptées (200 spectateurs) donc dépêchez-vous de vous inscrire !

NoSQL s’est établi dans le paysage des technologies en vogue depuis de nombreux mois maintenant. Outil idéal pour les infrastructures de nombreux sites Web à fort trafic, son utilisation au sein des systèmes d’information des entreprises plus conventionnelles est dorénavant à l’ordre du jour.
Il ne s’agit pas ici de révolutionner l’existant, mais simplement d’apporter des technologies complémentaires aux bases de données relationnelles afin de permettre ou de faciliter certaines mises en œuvre. Quels sont donc les cas d’utilisation qui peuvent trouver dans NoSQL la solution idéale ? On associe souvent NoSQL au stockage de larges volumes de données et à la prise en charge de flux toujours plus importants de requêtes. Est-ce là son seul apport ? Comment ces nouvelles possibilités sont-elles atteintes ? Quels principes d’architecture sont-ils mis en œuvre ? Qu’en est-il de la modélisation des données dans un tel système de stockage ? Quelles sont les bases de données NoSQL les plus courantes ?
Voilà autant de questions qui formeront le fil conducteur de la soirée NoSQL que j’aurai le plaisir de co-animer avec Olivier Mallassi au BreizhJUG le lundi 14 mars à Rennes. Au-delà de la présentation théorique et pratique, nous nous efforcerons de montrer comment ce stockage distribué peut amener un souffle nouveau sur les applications d’entreprise, tant d’un point de vue technique que fonctionnel.
Si ce sujet vous intéresse, n’hésitez pas à vous joindre à cette soirée ! En attendant, vous pouvez également consulter les différents articles relatifs à NoSQL que nous avons postés ces derniers mois.

Ce week-end, à Bruxelles, se déroulera le FOSDEM (Free and Open Source Software Developers’ European Meeting). Cette conférence adresse les technologies Open Source dans leur ensemble avec des tracks diversifiées traitant de Linux, BSD, des systèmes embarqués, Mono (.Net), Java, ou encore de l’analyse de données (Data Analytics).
Pour ma part j’y présenterai une session sur le sujet émergeant que sont les moteurs de recherche temps réel. En effet depuis que Lucene s’est doté d’une capacité de recherche Near Real-Time, il y a un peu plus d’un an, il est maintenant possible d’effectuer des recherches sur du contenu au fur et à mesure de son apparition, là où auparavant un délai était nécessaire en raison d’une indexation en batch. Cette nouvelle capacité offre de nouveaux défis, puisque les différents traitements doivent également être assurés en temps réel. Pour répondre à cette problématique, je montrerai comment S4, le récent framework distribué de traitement de flux de Yahoo! peut rendre possible les analyses les plus audacieuses sur un flux de documents d’une taille quelconque.
L’abstract de cette présentation est le suivant :
Search engines have been around for a while, but only recently focus has been made on allowing search on real-time content. To enable such a thing, the whole indexing pipeline has to be made real-time : that is the data processing, and the insertion in the index itself. Lucene has been extended to allow the latter, but the former still has to be handled.
S4 is an emerging technology from Yahoo that simplifies real-time distributed data processing. The goal of this presentation is to show how S4 can be used to enable some expensive pre-processing on a stream of incoming data, right before its indexing, thus bringing a powerful real-time search capability.
Pour rappel, FOSDEM est une conférence gratuite et ouverte à tous, alors si Bruxelles vous est accessible, n’hésitez pas à vous y rendre !

Deux semaines après Devoxx et ses nombreuses sessions NoSQL, le Lorraine JUG organise le 8 décembre, à l’ESIAL à Nancy, une soirée dédiée à ces nouvelles technologies de stockage. J’aurai le plaisir d’y présenter une introduction à NoSQL sous-titrée « Des grands du Web aux entreprises ». Cette accroche constitue un juste résumé des connaissances et idées qui y seront abordées :
- Introduction générale à NoSQL en retraçant le cheminement de pensée qui a amené des entreprises comme Amazon ou Google à faire le choix improbable de développer leur propre solution de stockage
- Tour d’horizon des principales solutions du marché illustré d’exemples
- Réflexions autour de l’intérêt pour des entreprises, ayant un système d’information de taille forcément plus modeste que ces grands acteurs du Web, de considérer ces technologies.
- Présentation de cas d’utilisation de stockage polyglotte et de ses enjeux pour les entreprises
- Aperçu des problématiques d’exploitation en production de ces technologies
Si vous êtes intéressés, il est encore temps de vous inscrire !