Il y a 2 années · 5 minutes · Back

DotScale 2016 – Retours sur la conférence européenne sur la scalabilité

dotscale-xebia-blog

Le 25 Avril 2016 a eu lieu la 4ème édition de DotScale à Paris, l’une des plus grandes conférences sur la scalabilité en Europe (plus de 800 personnes). Au menu comme tous les ans: des speakers prestigieux (Eric Brewer, Ted Dunning,..), des conférences variées (Erlang, hardware, LHC) et un très beau lieu (le théâtre de Paris) en plein cœur de Paris.

Si vous voulez en savoir plus voici un compte-rendu de l’événement.

Cette année DotScale accueillait 12 speakers pour des présentations diverses et variées. Parmi celles-ci quatre ont particulièrement retenu notre attention:

  1. Juan Benet sur IPFS
  2. Gleb Budman à propos du nouveau Pod de BackBlaze
  3. Mickaël Rémond  à propos d’Erlang
  4. Ted Dunning dans une présentation intitulée « IT From first principles »

IPFS par Juan Benet

IPFS pour InterPlanetary File System, en plus d’un nom génial, est un projet extrêmement ambitieux initié par Juan Benet dont le but est de créer un système de fichiers distribués sur lequel il est possible de construire des sites Web permanents et des applications distribuées de type blockchain.

Le but ici est de fournir un protocole pour adresser des éléments aussi simplement que HTTP mais avec la permanence des données intégrées. Si par exemple un mainteneur d’un paquet NPM décide de retirer son code source (exemple choisit totalement au hasard) et bien avec un gestionnaire de paquets basé sur IPFS les multiples builds s’appuyant sur ce paquet n’auraient pas été cassés. Un gestionnaire de paquets pour Go basé sur IPFS existe également.

IPFS est encore au stade Alpha néanmoins si vous souhaitez en savoir plus, le site officiel est très bien fait et met à disposition un papier technique expliquant les mécanismes de fonctionnement.

Storage Pod 6.0 par Gleb Budman

Gleb Budman travaille chez BackBlaze une société offrant une solution de sauvegarde et d’hébergement de données dans le cloud. Il se distingue de ses concurrents par des tarifs extrêmement bas.

Comme toute entreprise de stockage de données, BackBlaze a besoin d’héberger une grande quantité d’informations et ils ont fait plusieurs constats:

  1. Vu le prix de vente de leur offre et la quantité de stockage nécessaire, Amazon S3 était hors de prix
  2. Les solutions de stockage conçues pour les datacenters sont très couteuses
  3. Les disques durs offrant le meilleur rapport qualité/prix sont les disques durs grands publics

Suite à ces observations, ils ont décidé de construire leur propre solution de stockage de données : les Pod. Et ils ont réussi à obtenir des prix presque aussi bas que pour les disques durs bruts:

Dans sa présentation Gleb Budman présente les étapes de construction d’un Pod conçu en mode Agile (oui ça marche même pour le hardware) et annonce la version 6.0 permettant de stocker 480TB sur un châssis 4U.

Comme toutes les versions du Pod, la dernière est également open-source (si vous voulez installer ça dans votre cave) et toutes les informations sont disponibles dans l’article de blog lié.

Erlang par Mickaël Rémond

Le programme de conférences a été ouvert par Mickaël Rémond, Founder & CEO de ProcessOne et Lead Developer de ejabberd. Il nous a parlé sur Erlang, un langage conçu fin des années 80, qui est encore une référence dans la construction des systèmes scalables.  Erlang gère la concurrence à travers le modèle d’acteurs et de messages. Il a été pensé pour éviter les locks et assurer la consistance des données. De nombreuses caractéristiques du langage (processus légers, modèle acteur, asynchronisme, …) ont inspiré d’autres langages comme go, scala ou akka.

IT From first principles par Ted Dunning

Ted Dunning, Committer de Apache Mahout, Drill & Zookeeper et Chief Application Architect chez MapR, nous a parlé des principes de l’IT, et comment la valeur de la data a évolué au cours du temps avec le développement des technologies permettant de traiter une grande quantité de données. Ainsi il y a quelques années il était facile de traiter le peu de données qui représentaient le plus de valeur. De nos jours il est même possible de traiter toutes les données car nous pouvons gérer le passage à l’échelle:

En plus de l’évolution de la valeur de la donnée d’autres sujets généraux ont été abordés: la taille idéale des équipes de développement afin de ne pas multiplier les canaux de communications et la migration nécessaire vers une architecture de type micro-services et basé sur un flux d’évènements (Event Stream).

Conclusion

En plus de ces slots le programme comprenait également les présentations de Vasiliki Kalavri, Apache Flink committer; Sandeepan Banerjee, SVP Engineering & Ops chez ClusterHQ et Ex Data Head chez Google; Oliver Keeble, du CERN (qui dispose d’une solution de CAAS avec le LHC : « Collisions as a Service »); Greg Lindahl, Fellow at the Internet Archive et Former CTO chez Blekko; Sean Owen, Director of Data Science at Cloudera et Apache Spark committer; Spencer Kimball Fondateur de CockroachDB et Co-author de GIMP, Google Colossus; Eliot Horowitz CTO & co-founder de MongoDB; et Eric brewer Vice President d’Infrastructure de Google et Inventeur du théorème de CAP.

Bref la cuvée 2016 était encore une fois de haut niveau et si l’on ajoute à cela une organisation impeccable (il y avait même assez à manger, et pas que des sandwichs!) DotScale est vraiment l’une des conférences incontournables du mois d’avril.

À l’année prochaine !

Matthieu Nantern
Matthieu est un consultant Java senior spécialisé en DevOps, Apache Cassandra et la performance des applications. Depuis plus de 8 ans il remplit des missions agiles de développement, d'architecture et de conseils pour diverses sociétés. Récemment il est devenu formateur sur Apache Cassandra. Il travaille actuellement sur un projet de développement d'une plateforme IoT pour un grand groupe français.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *